コンマ区切りのstd :: stringの解析

Question

コンマ区切りの数値リストを含むstd :: stringがある場合、数値を解析して整数配列に入れる最も簡単な方法は何ですか？

私はこれを他のものの解析に一般化したくありません。「1,1,1,1,2,1,1,1,1,0」のような単純なカンマ区切りの整数の文字列。

user229321 · Accepted Answer

#include <vector> #include <string> #include <sstream> #include <iostream> int main() { std::string str = "1,2,3,4,5,6"; std::vector<int> vect; std::stringstream ss(str); int i; while (ss >> i) { vect.Push_back(i); if (ss.peek() == ',') ss.ignore(); } for (i=0; i< vect.size(); i++) std::cout << vect.at(i)<<std::endl; }

Zoomulator · Answer

冗長性が低く、stdで、コンマで区切られたものをすべて使用します。

stringstream ss( "1,1,1,1, or something else ,1,1,1,0" ); vector<string> result; while( ss.good() ) { string substr; getline( ss, substr, ',' ); result.Push_back( substr ); }

Jerry Coffin · Answer

さらに別の、かなり異なるアプローチ：カンマを空白として扱う特別なロケールを使用します。

#include <locale> #include <vector> struct csv_reader: std::ctype<char> { csv_reader(): std::ctype<char>(get_table()) {} static std::ctype_base::mask const* get_table() { static std::vector<std::ctype_base::mask> rc(table_size, std::ctype_base::mask()); rc[','] = std::ctype_base::space; rc['
'] = std::ctype_base::space; rc[' '] = std::ctype_base::space; return &rc[0]; } };

これを使用するには、このファセットを含むロケールでストリームをimbue()します。これを行うと、カンマがまったくないかのように数字を読むことができます。たとえば、入力からコンマ区切りの数値を読み取り、標準出力で1行に1つずつ書き込みます。

#include <algorithm> #include <iterator> #include <iostream> int main() { std::cin.imbue(std::locale(std::locale(), new csv_reader())); std::copy(std::istream_iterator<int>(std::cin), std::istream_iterator<int>(), std::ostream_iterator<int>(std::cout, "
")); return 0; }

Matthieu N. · Answer

C++ String Toolkit Library（Strtk）には、問題に対する次の解決策があります。

#include <string> #include <deque> #include <vector> #include "strtk.hpp" int main() { std::string int_string = "1,2,3,4,5,6,7,8,9,10,11,12,13,14,15"; std::vector<int> int_list; strtk::parse(int_string,",",int_list); std::string double_string = "123.456|789.012|345.678|901.234|567.890"; std::deque<double> double_list; strtk::parse(double_string,"|",double_list); return 0; }

より多くの例を見つけることができますここ

TC. · Answer

汎用アルゴリズムと Boost.Tokenizer を使用した代替ソリューション

struct ToInt { int operator()(string const &str) { return atoi(str.c_str()); } }; string values = "1,2,3,4,5,9,8,7,6"; vector<int> ints; tokenizer<> tok(values); transform(tok.begin(), tok.end(), back_inserter(ints), ToInt());

kiamlaluno · Answer

次の関数も使用できます。

void tokenize(const string& str, vector<string>& tokens, const string& delimiters = ",") { // Skip delimiters at beginning. string::size_type lastPos = str.find_first_not_of(delimiters, 0); // Find first non-delimiter. string::size_type pos = str.find_first_of(delimiters, lastPos); while (string::npos != pos || string::npos != lastPos) { // Found a token, add it to the vector. tokens.Push_back(str.substr(lastPos, pos - lastPos)); // Skip delimiters. lastPos = str.find_first_not_of(delimiters, pos); // Find next non-delimiter. pos = str.find_first_of(delimiters, lastPos); } }

Michael Krelin - hacker · Answer

std::string input="1,1,1,1,2,1,1,1,0"; std::vector<long> output; for(std::string::size_type p0=0,p1=input.find(','); p1!=std::string::npos || p0!=std::string::npos; (p0=(p1==std::string::npos)?p1:++p1),p1=input.find(',',p0) ) output.Push_back( strtol(input.c_str()+p0,NULL,0) );

もちろん、strtol()で変換エラーをチェックすることをお勧めします。コードは他のエラーチェックからも恩恵を受けるかもしれません。

Timmmm · Answer

ここにかなりひどい答えがたくさんあるので、私は私のものを追加します（テストプログラムを含む）：

#include <string> #include <iostream> #include <cstddef> template<typename StringFunction> void splitString(const std::string &str, char delimiter, StringFunction f) { std::size_t from = 0; for (std::size_t i = 0; i < str.size(); ++i) { if (str[i] == delimiter) { f(str, from, i); from = i + 1; } } if (from <= str.size()) f(str, from, str.size()); } int main(int argc, char* argv[]) { if (argc != 2) return 1; splitString(argv[1], ',', [](const std::string &s, std::size_t from, std::size_t to) { std::cout << "`" << s.substr(from, to - from) << "`
"; }); return 0; }

素敵なプロパティ：

依存関係なし（例：boost）
非常識なワンライナーではありません
わかりやすい（願っています）
スペースを完璧に処理
あなたがしたくない場合、分割を割り当てません。示されているように、ラムダでそれらを処理できます。
一度に1つずつ文字を追加しません-高速である必要があります。
C++ 17を使用している場合は、std::stringviewを使用するように変更できますが、割り当ては行われず、非常に高速です。

変更したいデザインの選択：

空のエントリは無視されません。
空の文字列は、f()を1回呼び出します。

入力と出力の例：

"" -> {""} "," -> {"", ""} "1," -> {"1", ""} "1" -> {"1"} " " -> {" "} "1, 2," -> {"1", " 2", ""} " ,, " -> {" ", "", " "}

Steve Jessop · Answer

#include <sstream> #include <vector> const char *input = "1,1,1,1,2,1,1,1,0"; int main() { std::stringstream ss(input); std::vector<int> output; int i; while (ss >> i) { output.Push_back(i); ss.ignore(1); } }

不正な入力（たとえば、連続した区切り文字）はこれを台無しにしますが、単純なことを言いました。

Sheljohn · Answer

std::regex を使用した解決策を誰も提案していないことに驚いています：

#include <string> #include <algorithm> #include <vector> #include <regex> void parse_csint( const std::string& str, std::vector<int>& result ) { typedef std::regex_iterator<std::string::const_iterator> re_iterator; typedef re_iterator::value_type re_iterated; std::regex re("(\d+)"); re_iterator rit( str.begin(), str.end(), re ); re_iterator rend; std::transform( rit, rend, std::back_inserter(result), []( const re_iterated& it ){ return std::stoi(it[1]); } ); }

この関数は、入力ベクトルの後ろにすべての整数を挿入します。正規表現を微調整して、負の整数や浮動小数点数などを含めることができます。

mementum · Answer

私はまだコメントすることはできませんが（サイトで始めましょう）、Jerry Coffinの素晴らしいctypeの派生クラスのより一般的なバージョンを彼の投稿に追加しました。

素晴らしいアイデアをくれたジェリーに感謝します。

（査読が必要なため、一時的にここに追加します）

struct SeparatorReader: std::ctype<char> { template<typename T> SeparatorReader(const T &seps): std::ctype<char>(get_table(seps), true) {} template<typename T> std::ctype_base::mask const *get_table(const T &seps) { auto &&rc = new std::ctype_base::mask[std::ctype<char>::table_size](); for(auto &&sep: seps) rc[static_cast<unsigned char>(sep)] = std::ctype_base::space; return &rc[0]; } };

knapcio · Answer

string exp = "token1 token2 token3"; char delimiter = ' '; vector<string> str; string acc = ""; for(int i = 0; i < exp.size(); i++) { if(exp[i] == delimiter) { str.Push_back(acc); acc = ""; } else acc += exp[i]; }

Daniel Eckert · Answer

boost tokenizer に基づく単純なコピー/貼り付け機能。

void strToIntArray(std::string string, int* array, int array_len) { boost::tokenizer<> tok(string); int i = 0; for(boost::tokenizer<>::iterator beg=tok.begin(); beg!=tok.end();++beg){ if(i < array_len) array[i] = atoi(beg->c_str()); i++; }

KeithB · Answer

bool GetList (const std::string& src, std::vector<int>& res) { using boost::lexical_cast; using boost::bad_lexical_cast; bool success = true; typedef boost::tokenizer<boost::char_separator<char> > tokenizer; boost::char_separator<char> sepa(","); tokenizer tokens(src, sepa); for (tokenizer::iterator tok_iter = tokens.begin(); tok_iter != tokens.end(); ++tok_iter) { try { res.Push_back(lexical_cast<int>(*tok_iter)); } catch (bad_lexical_cast &) { success = false; } } return success; }

tony gil · Answer

シンプルな構造、簡単に適応、簡単なメンテナンス。

std::string stringIn = "my,csv,,is 10233478,separated,by commas"; std::vector<std::string> commaSeparated(1); int commaCounter = 0; for (int i=0; i<stringIn.size(); i++) { if (stringIn[i] == ",") { commaSeparated.Push_back(""); commaCounter++; } else { commaSeparated.at(commaCounter) += stringIn[i]; } }

最終的には、文のすべての要素がスペースで区切られた文字列のベクトルになります。空の文字列は個別のアイテムとして保存されます。

Akhilesh Agrahari · Answer

これは最も簡単な方法で、私はよく使いました。任意の1文字の区切り文字に対して機能します。

#include<bits/stdc++.h> using namespace std; int main() { string str; cin >> str; int temp; vector<int> result; char ch; stringstream ss(str); do { ss>>temp; result.Push_back(temp); }while(ss>>ch); for(int i=0 ; i < result.size() ; i++) cout<<result[i]<<endl; return 0; }