Javascriptで文字列を複数の区切り記号で分割する方法
JavaScriptで文字列を複数の区切り記号で分割する方法私はカンマとスペースの両方で分割しようとしています、しかし私の知る限り、JSのsplit関数は1つのセパレータしかサポートしていません。
パラメータとして正規表現を渡します。
js> "Hello awesome, world!".split(/[\s,]+/)
Hello,awesome,world!
追加するために編集された:
最後の要素を取得するには、配列の長さから1を引いた長さを選択します。
>>> bits = "Hello awesome, world!".split(/[\s,]+/)
["Hello", "awesome", "world!"]
>>> bit = bits[bits.length - 1]
"world!"
...そしてパターンが一致しない場合:
>>> bits = "Hello awesome, world!".split(/foo/)
["Hello awesome, world!"]
>>> bits[bits.length - 1]
"Hello awesome, world!"
Javascriptの分割演算子 に正規表現を渡すことができます。例えば:
"1,2 3".split(/,| /)
["1", "2", "3"]
あるいは、複数の区切り文字を1つのみとして機能させる場合は、次のようにします。
"1, 2, , 3".split(/(?:,| )+/)
["1", "2", "3"]
(そうでなければ結果に結合されてしまうので、キャプチャしない(?:)の親を使わなければなりません。あるいはAaronのように賢くて文字クラスを使うこともできます。)
(例はSafari + FFでテスト済み)
別の単純だが効果的な方法は分割+結合を繰り返し使用することです。
"a=b,c:d".split('=').join(',').split(':').join(',').split(',')
基本的に分割に続いて結合を行うことはグローバル置換のようなものであるため、これは各セパレータをコンマで置き換え、その後すべてが置き換えられると、最後の分割はコンマで行われます。
上記の式の結果は次のとおりです。
['a', 'b', 'c', 'd']
これを拡張して、関数に入れることもできます。
function splitMulti(str, tokens){
var tempChar = tokens[0]; // We can use the first token as a temporary join character
for(var i = 1; i < tokens.length; i++){
str = str.split(tokens[i]).join(tempChar);
}
str = str.split(tempChar);
return str;
}
使用法:
splitMulti('a=b,c:d', ['=', ',', ':']) // ["a", "b", "c", "d"]
この機能をよく使うのであれば、String.prototype.split
をラッピングすることを検討する価値があるかもしれません(私の関数はかなり安全だと思います - 唯一の考慮事項は条件付きの追加オーバーヘッド(マイナー)と制限の実装を欠くという事実です配列が渡された場合は引数。
以下の方法で単純にラップする場合は、必ずsplitMulti
関数を含めてください。 (多くの人が間違っていると衝突を起こす可能性があるので)ビルトインの拡張に眉をひそめている人もいるので、これを使用する前にもっと年上の人に話すかSO :)
var splitOrig = String.prototype.split; // Maintain a reference to inbuilt fn
String.prototype.split = function (){
if(arguments[0].length > 0){
if(Object.prototype.toString.call(arguments[0]) == "[object Array]" ) { // Check if our separator is an array
return splitMulti(this, arguments[0]); // Call splitMulti
}
}
return splitOrig.apply(this, arguments); // Call original split maintaining context
};
使用法:
var a = "a=b,c:d";
a.split(['=', ',', ':']); // ["a", "b", "c", "d"]
// Test to check that the built-in split still works (although our wrapper wouldn't work if it didn't as it depends on it :P)
a.split('='); // ["a", "b,c:d"]
楽しい!
簡単にしましょう: (あなたの正規表現に "[] +"を加えると "1以上"になります)
これは、 "+"と "{1、}"が同じであることを意味します。
var words = text.split(/[ .:;?!~,`"&|()<>{}\[\]\r\n/\\]+/); // note ' and - are kept
トリッキーな方法:
var s = "dasdnk asd, (naks) :d skldma";
var a = s.replace('(',' ').replace(')',' ').replace(',',' ').split(' ');
console.log(a);//["dasdnk", "asd", "naks", ":d", "skldma"]
分割機能をもっとカスタマイズしたい人のために、分割する文字のリストを使って与えられた文字列を分割する再帰的アルゴリズムを書いた。私は上記の記事を見る前にこれを書いた。私はそれが何人かのイライラしたプログラマーを助けることを願っています。
splitString = function(string, splitters) {
var list = [string];
for(var i=0, len=splitters.length; i<len; i++) {
traverseList(list, splitters[i], 0);
}
return flatten(list);
}
traverseList = function(list, splitter, index) {
if(list[index]) {
if((list.constructor !== String) && (list[index].constructor === String))
(list[index] != list[index].split(splitter)) ? list[index] = list[index].split(splitter) : null;
(list[index].constructor === Array) ? traverseList(list[index], splitter, 0) : null;
(list.constructor === Array) ? traverseList(list, splitter, index+1) : null;
}
}
flatten = function(arr) {
return arr.reduce(function(acc, val) {
return acc.concat(val.constructor === Array ? flatten(val) : val);
},[]);
}
var stringToSplit = "people and_other/things";
var splitList = [" ", "_", "/"];
splitString(stringToSplit, splitList);
上記の例が返します:["people", "and", "other", "things"]
注:flatten
関数は Rosetta Codeから取られました
あなたは、セパレータとして使用したいすべての文字を単独でまたはまとめて正規表現にまとめて、それらをsplit関数に渡すことができます。例えば、あなたは書くことができます:
console.log( "dasdnk asd, (naks) :d skldma".split(/[ \(,\)]+/) );
そして出力は次のようになります。
["dasdnk", "asd", "naks", ":d", "skldma"]
ある文字列を別の文字列に変換するためには、ある種の文字列置換をしなければならないでしょう。そうすれば、分割の中で処理できる文字列は1つだけになります。
こんにちは例えばあなたが分割して文字列で置き換える場合07:05:45 PM
var hour = time.replace("PM", "").split(":");
結果
[ '07', '05', '45' ]
a = "a=b,c:d"
array = ['=',',',':'];
for(i=0; i< array.length; i++){ a= a.split(array[i]).join(); }
これにより、特殊文字なしの文字列が返されます。
@ stephen-sweridukソリューション(これは私にとってよりおもしろかったです)から始めて、より一般的で再利用可能なものにするために少し修正しました。
/**
* Adapted from: http://stackoverflow.com/questions/650022/how-do-i-split-a-string-with-multiple-separators-in-javascript
*/
var StringUtils = {
/**
* Flatten a list of strings
* http://rosettacode.org/wiki/Flatten_a_list
*/
flatten : function(arr) {
var self=this;
return arr.reduce(function(acc, val) {
return acc.concat(val.constructor === Array ? self.flatten(val) : val);
},[]);
},
/**
* Recursively Traverse a list and apply a function to each item
* @param list array
* @param expression Expression to use in func
* @param func function of (item,expression) to apply expression to item
*
*/
traverseListFunc : function(list, expression, index, func) {
var self=this;
if(list[index]) {
if((list.constructor !== String) && (list[index].constructor === String))
(list[index] != func(list[index], expression)) ? list[index] = func(list[index], expression) : null;
(list[index].constructor === Array) ? self.traverseListFunc(list[index], expression, 0, func) : null;
(list.constructor === Array) ? self.traverseListFunc(list, expression, index+1, func) : null;
}
},
/**
* Recursively map function to string
* @param string
* @param expression Expression to apply to func
* @param function of (item, expressions[i])
*/
mapFuncToString : function(string, expressions, func) {
var self=this;
var list = [string];
for(var i=0, len=expressions.length; i<len; i++) {
self.traverseListFunc(list, expressions[i], 0, func);
}
return self.flatten(list);
},
/**
* Split a string
* @param splitters Array of characters to apply the split
*/
splitString : function(string, splitters) {
return this.mapFuncToString(string, splitters, function(item, expression) {
return item.split(expression);
})
},
}
その後
var stringToSplit = "people and_other/things";
var splitList = [" ", "_", "/"];
var splittedString=StringUtils.splitString(stringToSplit, splitList);
console.log(splitList, stringToSplit, splittedString);
これは元のものとして返されます。
[ ' ', '_', '/' ] 'people and_other/things' [ 'people', 'and', 'other', 'things' ]
これを行う簡単な方法は、文字列の各文字を各区切り文字で処理して、分割の配列を作成することです。
splix = function ()
{
u = [].slice.call(arguments); v = u.slice(1); u = u[0]; w = [u]; x = 0;
for (i = 0; i < u.length; ++i)
{
for (j = 0; j < v.length; ++j)
{
if (u.slice(i, i + v[j].length) == v[j])
{
y = w[x].split(v[j]); w[x] = y[0]; w[++x] = y[1];
};
};
};
return w;
};
console.logg = function ()
{
document.body.innerHTML += "<br>" + [].slice.call(arguments).join();
}
splix = function() {
u = [].slice.call(arguments);
v = u.slice(1);
u = u[0];
w = [u];
x = 0;
console.logg("Processing: <code>" + JSON.stringify(w) + "</code>");
for (i = 0; i < u.length; ++i) {
for (j = 0; j < v.length; ++j) {
console.logg("Processing: <code>[\x22" + u.slice(i, i + v[j].length) + "\x22, \x22" + v[j] + "\x22]</code>");
if (u.slice(i, i + v[j].length) == v[j]) {
y = w[x].split(v[j]);
w[x] = y[0];
w[++x] = y[1];
console.logg("Currently processed: " + JSON.stringify(w) + "\n");
};
};
};
console.logg("Return: <code>" + JSON.stringify(w) + "</code>");
};
setTimeout(function() {
console.clear();
splix("1.23--4", ".", "--");
}, 250);
@import url("http://fonts.googleapis.com/css?family=Roboto");
body {font: 20px Roboto;}
使い方:
splix(string, delimiters...)
例:
splix("1.23--4", ".", "--")
戻り値:
["1", "23", "4"]
これが必要な主な理由の1つは、ファイルパスを/
と\
の両方で分割することです。ちょっとトリッキーな正規表現なので、参考のためにここに投稿します。
var splitFilePath = filePath.split(/[\/\\]/);
ES6で同じことを達成する新しい方法を次に示します。
function SplitByString(source, splitBy) {
var splitter = splitBy.split('');
splitter.Push([source]); //Push initial value
return splitter.reduceRight(function(accumulator, curValue) {
var k = [];
accumulator.forEach(v => k = [...k, ...v.split(curValue)]);
return k;
});
}
var source = "abc,def#hijk*lmn,opq#rst*uvw,xyz";
var splitBy = ",*#";
console.log(SplitByString(source, splitBy));
この関数で注意してください:
- 関係する正規表現なし
source
に表示されるのと同じ順序で分割された値を返します
上記のコードの結果は次のようになります。
私はRegExのパフォーマンスを知りませんが、これはRegExがネイティブのHashSetを利用し、代わりにO(max(str.length、delimeter.length))の複雑さで動作するための別の方法です:
var multiSplit = function(str,delimiter){
if (!(delimiter instanceof Array))
return str.split(delimiter);
if (!delimiter || delimiter.length == 0)
return [str];
var hashSet = new Set(delimiter);
if (hashSet.has(""))
return str.split("");
var lastIndex = 0;
var result = [];
for(var i = 0;i<str.length;i++){
if (hashSet.has(str[i])){
result.Push(str.substring(lastIndex,i));
lastIndex = i+1;
}
}
result.Push(str.substring(lastIndex));
return result;
}
multiSplit('1,2,3.4.5.6 7 8 9',[',','.',' ']);
// Output: ["1", "2", "3", "4", "5", "6", "7", "8", "9"]
multiSplit('1,2,3.4.5.6 7 8 9',' ');
// Output: ["1,2,3.4.5.6", "7", "8", "9"]
最善の方法ではありませんが、複数および異なる区切り記号/区切り記号を使用して分割するのに役立ちます
html
<button onclick="myFunction()">Split with Multiple and Different seperators/delimiters</button>
<p id="demo"></p>
ジャバスクリプト
<script>
function myFunction() {
var str = "How : are | you doing : today?";
var res = str.split(' | ');
var str2 = '';
var i;
for (i = 0; i < res.length; i++) {
str2 += res[i];
if (i != res.length-1) {
str2 += ",";
}
}
var res2 = str2.split(' : ');
//you can add countless options (with or without space)
document.getElementById("demo").innerHTML = res2;
</script>
削除したいものではなく、残したいものを指定した方が簡単だと思います。
あなたが英語の単語だけを持ちたいのであれば、このようなものを使用することができます。
text.match(/[a-z'\-]+/gi);
例(run snippet):
var R=[/[a-z'\-]+/gi,/[a-z'\-\s]+/gi];
var s=document.getElementById('s');
for(var i=0;i<R.length;i++)
{
var o=document.createElement('option');
o.innerText=R[i]+'';
o.value=i;
s.appendChild(o);
}
var t=document.getElementById('t');
var r=document.getElementById('r');
s.onchange=function()
{
r.innerHTML='';
var x=s.value;
if((x>=0)&&(x<R.length))
x=t.value.match(R[x]);
for(i=0;i<x.length;i++)
{
var li=document.createElement('li');
li.innerText=x[i];
r.appendChild(li);
}
}
<textarea id="t" style="width:70%;height:12em">even, test; spider-man
But saying o'er what I have said before:
My child is yet a stranger in the world;
She hath not seen the change of fourteen years,
Let two more summers wither in their pride,
Ere we may think her ripe to be a bride.
—Shakespeare, William. The Tragedy of Romeo and Juliet</textarea>
<p><select id="s">
<option selected>Select a regular expression</option>
<!-- option value="1">/[a-z'\-]+/gi</option>
<option value="2">/[a-z'\-\s]+/gi</option -->
</select></p>
<ol id="r" style="display:block;width:auto;border:1px inner;overflow:scroll;height:8em;max-height:10em;"></ol>
</div>