*.csv
-ファイルを読み込もうとしています。
*.csv
-ファイルは、セミコロン( " ; ")で区切られた2つの列で構成されています。
StreamReaderを使用して*.csv
-ファイルを読み取ることができ、Split()
関数を使用して各行を区切ることができます。各列を別々の配列に格納してから表示します。
それは可能ですか?
あなたはこれのようにそれをすることができます:
using System.IO;
static void Main(string[] args)
{
using(var reader = new StreamReader(@"C:\test.csv"))
{
List<string> listA = new List<string>();
List<string> listB = new List<string>();
while (!reader.EndOfStream)
{
var line = reader.ReadLine();
var values = line.Split(';');
listA.Add(values[0]);
listB.Add(values[1]);
}
}
}
私のお気に入りのcsvパーサは、.netライブラリに組み込まれているものです。これはMicrosoft.VisualBasic名前空間内の隠された宝です。以下はサンプルコードです。
using Microsoft.VisualBasic.FileIO;
var path = @"C:\Person.csv"; // Habeeb, "Dubai Media City, Dubai"
using (TextFieldParser csvParser = new TextFieldParser(path))
{
csvParser.CommentTokens = new string[] { "#" };
csvParser.SetDelimiters(new string[] { "," });
csvParser.HasFieldsEnclosedInQuotes = true;
// Skip the row with the column names
csvParser.ReadLine();
while (!csvParser.EndOfData)
{
// Read current line fields, pointer moves to the next line.
string[] fields = csvParser.ReadFields();
string Name = fields[0];
string Address = fields[1];
}
}
Microsoft.VisualBasic
への参照を追加することを忘れないでください
パーサーについての詳細はここにあります: http://codeskaters.blogspot.ae/2015/11/c-easiest-csv-parser-built-in-net.html
LINQの方法:
var lines = File.ReadAllLines("test.txt").Select(a => a.Split(';'));
var csv = from line in lines
select (from piece in line
select piece);
間違った - Nickによる編集
元の回答者がcsv
に2次元配列(配列を含む配列)を入力しようとしていたようです。最初の配列の各項目には、その行番号を表す配列と、その特定の列のデータを含むネストした配列の各項目が含まれています。
var csv = from line in lines
select (line.Split(',')).ToArray();
私は通常、この codeproject のパーサ)を使います。なぜなら、たくさんの文字エスケープがあるからです。
これは私のトップ投票の答えのバリエーションです。
var contents = File.ReadAllText(filename).Split('\n');
var csv = from line in contents
select line.Split(',').ToArray();
次の例のようにcsv
変数を使用できます。
int headerRows = 5;
foreach (var row in csv.Skip(headerRows)
.TakeWhile(r => r.Length > 1 && r.Last().Trim().Length > 0))
{
String zerothColumnValue = row[0]; // leftmost column
var firstColumnValue = row[1];
}
ちょうどこのライブラリに遭遇しました: https://github.com/JoshClose/CsvHelper
非常に直感的で使いやすいです。実装が簡単なnugetパッケージもあります: http://nuget.org/packages/CsvHelper/1.17.0 。私が好きなことも積極的に維持されているようです。
セミコロンを使うように設定するのは簡単です: https://github.com/JoshClose/CsvHelper/wiki/Custom-Configurations
最初から行数を知る必要があるため、すぐに配列を作成することはできません(これにはcsvファイルを2回読み取る必要があります)。
値を2つのList<T>
に格納してから使用するか、List<T>.ToArray()
を使用して配列に変換することができます。
非常に簡単な例:
var column1 = new List<string>();
var column2 = new List<string>();
using (var rd = new StreamReader("filename.csv"))
{
while (!rd.EndOfStream)
{
var splits = rd.ReadLine().Split(';');
column1.Add(splits[0]);
column2.Add(splits[1]);
}
}
// print column1
Console.WriteLine("Column 1:");
foreach (var element in column1)
Console.WriteLine(element);
// print column2
Console.WriteLine("Column 2:");
foreach (var element in column2)
Console.WriteLine(element);
N.B.
これは単なる 非常に単純な例 です。 string.Split
を使用しても、レコード内にセパレータ;
が含まれている場合は考慮されません。
より安全なアプローチのために、nugetにCsvHelperのようないくつかのcsv特有のライブラリを使用することを検討してください。
(頭)行や列をスキップする必要がある場合は、これを使って2次元配列を作成できます。
var lines = File.ReadAllLines(path).Select(a => a.Split(';'));
var csv = (from line in lines
select (from col in line
select col).Skip(1).ToArray() // skip the first column
).Skip(2).ToArray(); // skip 2 headlines
さらに処理する前にデータを整形する必要がある場合、これは非常に役立ちます(最初の2行は見出しから成り、最初の列は行のタイトルです。データを考慮したい)。
N.B. 次のコードを使用して、見出しと1列目を簡単に取得できます。
var coltitle = (from line in lines
select line.Skip(1).ToArray() // skip 1st column
).Skip(1).Take(1).FirstOrDefault().ToArray(); // take the 2nd row
var rowtitle = (from line in lines select line[0] // take 1st column
).Skip(2).ToArray(); // skip 2 headlines
このコード例は、*.csv
ファイルの次の構造を想定しています。
注: /空の行をスキップする必要がある場合 - これは便利な場合がありますが、挿入することで実行できます。
where line.Any(a=>!string.IsNullOrWhiteSpace(a))
上記の _ linq _ コード例のfrom
ステートメントとselect
ステートメントの間。
あなたはより良いパフォーマンスのためにC#でMicrosoft.VisualBasic.FileIO.TextFieldParser dllを使うことができます
上記の記事から以下のコード例を取得
static void Main()
{
string csv_file_path=@"C:\Users\Administrator\Desktop\test.csv";
DataTable csvData = GetDataTabletFromCSVFile(csv_file_path);
Console.WriteLine("Rows count:" + csvData.Rows.Count);
Console.ReadLine();
}
private static DataTable GetDataTabletFromCSVFile(string csv_file_path)
{
DataTable csvData = new DataTable();
try
{
using(TextFieldParser csvReader = new TextFieldParser(csv_file_path))
{
csvReader.SetDelimiters(new string[] { "," });
csvReader.HasFieldsEnclosedInQuotes = true;
string[] colFields = csvReader.ReadFields();
foreach (string column in colFields)
{
DataColumn datecolumn = new DataColumn(column);
datecolumn.AllowDBNull = true;
csvData.Columns.Add(datecolumn);
}
while (!csvReader.EndOfData)
{
string[] fieldData = csvReader.ReadFields();
//Making empty value as null
for (int i = 0; i < fieldData.Length; i++)
{
if (fieldData[i] == "")
{
fieldData[i] = null;
}
}
csvData.Rows.Add(fieldData);
}
}
}
catch (Exception ex)
{
}
return csvData;
}
こんにちは、これを行うための静的クラスを作成しました。 +列チェック+クォータサインの削除
public static class CSV
{
public static List<string[]> Import(string file, char csvDelimiter, bool ignoreHeadline, bool removeQuoteSign)
{
return ReadCSVFile(file, csvDelimiter, ignoreHeadline, removeQuoteSign);
}
private static List<string[]> ReadCSVFile(string filename, char csvDelimiter, bool ignoreHeadline, bool removeQuoteSign)
{
string[] result = new string[0];
List<string[]> lst = new List<string[]>();
string line;
int currentLineNumner = 0;
int columnCount = 0;
// Read the file and display it line by line.
using (System.IO.StreamReader file = new System.IO.StreamReader(filename))
{
while ((line = file.ReadLine()) != null)
{
currentLineNumner++;
string[] strAr = line.Split(csvDelimiter);
// save column count of dirst line
if (currentLineNumner == 1)
{
columnCount = strAr.Count();
}
else
{
//Check column count of every other lines
if (strAr.Count() != columnCount)
{
throw new Exception(string.Format("CSV Import Exception: Wrong column count in line {0}", currentLineNumner));
}
}
if (removeQuoteSign) strAr = RemoveQouteSign(strAr);
if (ignoreHeadline)
{
if(currentLineNumner !=1) lst.Add(strAr);
}
else
{
lst.Add(strAr);
}
}
}
return lst;
}
private static string[] RemoveQouteSign(string[] ar)
{
for (int i = 0;i< ar.Count() ; i++)
{
if (ar[i].StartsWith("\"") || ar[i].StartsWith("'")) ar[i] = ar[i].Substring(1);
if (ar[i].EndsWith("\"") || ar[i].EndsWith("'")) ar[i] = ar[i].Substring(0,ar[i].Length-1);
}
return ar;
}
}
var firstColumn = new List<string>();
var lastColumn = new List<string>();
// your code for reading CSV file
foreach(var line in file)
{
var array = line.Split(';');
firstColumn.Add(array[0]);
lastColumn.Add(array[1]);
}
var firstArray = firstColumn.ToArray();
var lastArray = lastColumn.ToArray();
これはデータフィールドの1つがそのデータの一部としてセミコロン( ";")を持つ特別な場合です。その場合、上記の答えのほとんどは失敗するでしょう。
その場合の解決策
string[] csvRows = System.IO.File.ReadAllLines(FullyQaulifiedFileName);
string[] fields = null;
List<string> lstFields;
string field;
bool quoteStarted = false;
foreach (string csvRow in csvRows)
{
lstFields = new List<string>();
field = "";
for (int i = 0; i < csvRow.Length; i++)
{
string tmp = csvRow.ElementAt(i).ToString();
if(String.Compare(tmp,"\"")==0)
{
quoteStarted = !quoteStarted;
}
if (String.Compare(tmp, ";") == 0 && !quoteStarted)
{
lstFields.Add(field);
field = "";
}
else if (String.Compare(tmp, "\"") != 0)
{
field += tmp;
}
}
if(!string.IsNullOrEmpty(field))
{
lstFields.Add(field);
field = "";
}
// This will hold values for each column for current row under processing
fields = lstFields.ToArray();
}
オープンソースの Angara.Table ライブラリでは、型指定された列にCSVを読み込むことができるので、列から配列を取得できます。各列は、名前またはインデックスの両方でインデックスを付けることができます。 http://predictionmachines.github.io/Angara.Table/saveload.html を参照してください。
ライブラリはCSVのRFC4180に従っています。型推論と複数行の文字列を有効にします。
例:
using System.Collections.Immutable;
using Angara.Data;
using Angara.Data.DelimitedFile;
...
ReadSettings settings = new ReadSettings(Delimiter.Semicolon, false, true, null, null);
Table table = Table.Load("data.csv", settings);
ImmutableArray<double> a = table["double-column-name"].Rows.AsReal;
for(int i = 0; i < a.Length; i++)
{
Console.WriteLine("{0}: {1}", i, a[i]);
}
Column型を使って列型を見ることができます。
Column c = table["double-column-name"];
Console.WriteLine("Column {0} is double: {1}", c.Name, c.Rows.IsRealColumn);
ライブラリはF#に焦点を当てているので、FSharp.Core 4.4アセンブリへの参照を追加する必要があるかもしれません。プロジェクトの[参照の追加]をクリックし、[アセンブリ] - > [拡張機能]の下でFSharp.Core 4.4を選択します。
私は修士論文に取り組んでいるただの学生ですが、これは私がそれを解決した方法であり、それは私のためにうまくいきました。最初にディレクトリからファイルを選択し(csv形式のみ)、次にデータをリストに入れます。
List<float> t = new List<float>();
List<float> SensorI = new List<float>();
List<float> SensorII = new List<float>();
List<float> SensorIII = new List<float>();
using (OpenFileDialog dialog = new OpenFileDialog())
{
try
{
dialog.Filter = "csv files (*.csv)|*.csv";
dialog.Multiselect = false;
dialog.InitialDirectory = ".";
dialog.Title = "Select file (only in csv format)";
if (dialog.ShowDialog() == DialogResult.OK)
{
var fs = File.ReadAllLines(dialog.FileName).Select(a => a.Split(';'));
int counter = 0;
foreach (var line in fs)
{
counter++;
if (counter > 2) // Skip first two headder lines
{
this.t.Add(float.Parse(line[0]));
this.SensorI.Add(float.Parse(line[1]));
this.SensorII.Add(float.Parse(line[2]));
this.SensorIII.Add(float.Parse(line[3]));
}
}
}
}
catch (Exception exc)
{
MessageBox.Show(
"Error while opening the file.\n" + exc.Message,
this.Text,
MessageBoxButtons.OK,
MessageBoxIcon.Error
);
}
}
私は何年もcsvreader.com(有料コンポーネント)を使ってきました、そして私は問題を抱えたことがありません。それはしっかりしていて、小さくて速いです、しかし、あなたはそれの代金を払わなければなりません。あなたが好きなものに区切り文字を設定することができます。
using (CsvReader reader = new CsvReader(s) {
reader.Settings.Delimiter = ';';
reader.ReadHeaders(); // if headers on a line by themselves. Makes reader.Headers[] available
while (reader.ReadRecord())
... use reader.Values[col_i] ...
}
まだ間違っています。引用符で ""を補う必要があります。これが私の解決策Microsoftスタイルのcsvです。
/// <summary>
/// Microsoft style csv file. " is the quote character, "" is an escaped quote.
/// </summary>
/// <param name="fileName"></param>
/// <param name="sepChar"></param>
/// <param name="quoteChar"></param>
/// <param name="escChar"></param>
/// <returns></returns>
public static List<string[]> ReadCSVFileMSStyle(string fileName, char sepChar = ',', char quoteChar = '"')
{
List<string[]> ret = new List<string[]>();
string[] csvRows = System.IO.File.ReadAllLines(fileName);
foreach (string csvRow in csvRows)
{
bool inQuotes = false;
List<string> fields = new List<string>();
string field = "";
for (int i = 0; i < csvRow.Length; i++)
{
if (inQuotes)
{
// Is it a "" inside quoted area? (escaped litteral quote)
if(i < csvRow.Length - 1 && csvRow[i] == quoteChar && csvRow[i+1] == quoteChar)
{
i++;
field += quoteChar;
}
else if(csvRow[i] == quoteChar)
{
inQuotes = false;
}
else
{
field += csvRow[i];
}
}
else // Not in quoted region
{
if (csvRow[i] == quoteChar)
{
inQuotes = true;
}
if (csvRow[i] == sepChar)
{
fields.Add(field);
field = "";
}
else
{
field += csvRow[i];
}
}
}
if (!string.IsNullOrEmpty(field))
{
fields.Add(field);
field = "";
}
ret.Add(fields.ToArray());
}
return ret;
}
}
私は数時間かけて正しいライブラリを探しましたが、やっと私自身のコードを書きました:)あなたが望むどんなツールでもファイル(あるいはデータベース)を読み、それから各行に次のルーチンを適用することができます:
private static string[] SmartSplit(string line, char separator = ',')
{
var inQuotes = false;
var token = "";
var lines = new List<string>();
for (var i = 0; i < line.Length; i++) {
var ch = line[i];
if (inQuotes) // process string in quotes,
{
if (ch == '"') {
if (i<line.Length-1 && line[i + 1] == '"') {
i++;
token += '"';
}
else inQuotes = false;
} else token += ch;
} else {
if (ch == '"') inQuotes = true;
else if (ch == separator) {
lines.Add(token);
token = "";
} else token += ch;
}
}
lines.Add(token);
return lines.ToArray();
}
私はちょうどあなたが必要としているライブラリを持っています。
少し前に、私はCSVファイルを扱うためのシンプルで十分に速いライブラリを書きました。あなたは次のリンクでそれを見つけることができます: https://github.com/ukushu/DataExporter
2次元配列のようにCSVで動作します。まさにあなたが必要としているように。
例として、3行目のすべての値が必要な場合は、次のように書くだけです。
Csv csv = new Csv();
csv.FileOpen("c:\\file1.csv");
var allValuesOf3rdRow = csv.Rows[2];
またはの2番目のセルを読むために
var value = csv.Rows[2][1];