web-dev-qa-db-ja.com

Excelファイルでnullおよび空のデータを表す最良の方法

ユーザーが独自のフォームをデザインし、データをExcelにエクスポートできるアプリケーションがあります。 1つの問題は、nullまたは空のデータの表現です。サポートする必要がある2つのシナリオがあります。

  1. データはまったく存在しませんでした(質問はスキップされました)
  2. データは空でした(質問は空白のままにされました)

Excel/csvでこれの最も良いデフォルトの表現は何ですか?現在、シナリオ1のセルは空のままにしています。シナリオ2の適切な表現を見つけるのに苦労しています。このための要件は次のとおりです。

  • 特定の言語に縛られるべきではない(したがって、「データがない」のは良くない)
  • 統計プログラムでニースをプレイする必要があります(彼らが何が嫌いかわからないが、「---」は悪い)
  • 互いに区別できる必要があります
  • 特別なフォーマットに依存してはいけません(例:csvを取得しても区別できるはずです)

考え?

15
Cory

データエンジニアとして、次の2つの理由が考えられるため、空のデータセルに「NA」または「NAN」を使用できることをお勧めします。

  1. データ業界ではnullデータの標準的な用語です
  2. そしてもちろん、それはデータエンジニアの生活を楽にします
6
Ankit

存在しないデータへのアプローチは問題ないようです。 NULLエントリの場合、∅( Null sign )もあり、これは何かが空であることを正確に表します。

数学的記号を少なくしたい場合は、—( em-dash 、 "extra-wide" dash)は、省略されたもの(例:345ユーロ)の代わりによく使用される活版印刷の良い選択です。 €345,00)

どちらもユニコード文字であり、csvデータでは問題ありません。どちらも通常の入力よりも目立ちますが、個人的には、選択されていないラジオの選択でも機能するため、ヌル記号の方が適切だと感じています。

7
kontur

それを簡単に目立たせたい場合は、誰かが最初にテキストを処理する必要のない何か明らかに視覚的を使用する必要があります。そこには次のオプションがあります。境界線の色と太さの変更。背景色;とコンテンツ。

以下に3つの例を示します。 4番目は、スキャンするのが難しいため、使用が非常に遅い一般的なソリューションを示しています。これの使用はお勧めしません。

enter image description here

3
JohnGB

あなたは2つの異なる理由のためにデータが欠落している可能性がある状況にあります。他の人が示唆したように、欠落データを表す方法はたくさんあります:(空白)、N/ANaN---など。したがって、任意の2つ(たとえば、最初の2つ)を選択して完了できます。ただし、ここに問題があります。エンドユーザーは、どれがどれであるかをどのように覚えているのでしょうか。論理的な理由がない、または少なくともニーモニックがないと、ユーザーは永遠に混乱します。

これは、人間が正確に1ビットの情報を記憶することで悪名高いことで有名です を参照)。その理由は、いったん何かについて混乱していて、答えを見つけた場合、次回は、その答えが非常に短くて目立たないため、混乱をはるかに鮮明に覚えることになります。

とにかく、私はExcel/CSVでこの状況から標準的な方法があるとは思いません。しかし、スタタ(統計分析ソフトウェア)についてお話ししましょう。 Stataでは、最大27の異なる欠損値タイプを使用できます。 「標準」欠損値.、および「拡張」欠損値.a.b、...、.z。したがって、たとえばあなたのケースでは、最初の欠落している答えを.aとして、2番目のケースを.bとして示します。これをどのように記憶することができますか?さて、あなたは欠けている答えを得る2つのチャンスがあります:最初に、質問が欠けている可能性があります。第二に、質問は存在した可能性がありますが、ユーザーは答えませんでした。シチュエーションには明確な論理的順序があり、それらのエンコードには明確なアルファベット順があります。明確です。

1
Pasha

回答のデータを2列でエクスポートします

  1. 値(設定されていない場合はnull)
  2. 値のステータスを示す値正しい、ユーザーが答えなかった、質問がスキップされた、など。

この理由には、

データが失われた方法をユーザーが正確に確認できる情報は失われません。

値の列は1つのタイプであり、平均、合計などが可能です。

計算を除外する必要がある場合は、割引の対象を示すフラグがあります

0
user151019