web-dev-qa-db-ja.com

主キーの選択:種の学名またはシステムが割り当てた数値識別子?

学名は、広く受け入れられている種の一意の識別子です。ただし、学名にはスペースやドットなどの特殊文字が含まれています。それはデータベースに適した一意の識別子になることができますか、それとも一意の数値識別子を割り当て/実装する必要がありますか?

後者の場合、世界的に知られている数値識別子はありますか?または、行に独自の識別子を割り当てる必要がありますか?

「バグとバニー」の背景(特に魚と反転)の背景を持つ元環境科学者として、私はあなた自身の識別子を使用することをお勧めします。

あなたはデータベース管理者として、「種の問題」と呼ばれるものに偶然遭遇しました。種の概念は、経験的なものというよりは哲学的であると主張されている(Pigliucci 2003)。分類学者が種を取り除くために公開されないことも考慮してください(Jones 2017)。したがって、インセンティブは常に既存の種から新しい種を作成することになります。データベースインフラストラクチャはそれを考慮する必要があります。

@gbnを基にして、種の概念にきちんと適合しないいくつかの生物があり、これらの種のデータモデリングは複雑になる可能性があります。 Ambystomid Salamanders(Wikipedia 2018)のすべての女性のハイブリッド集団の場合を考えてみましょう。獣医は、動物のDNAの染色体成分を使用してこれらの動物を参照します。したがって、これらの動物で起こっていることは単純な単為生殖(女性のクローニング)よりもはるかに複雑であるため、リンネ種のアプローチは機能しません。

キリンとサンショウウオの例に基づいて、彼らの分野での慣習についてエンドユーザーと相談することが適切でしょう。たとえば、菌学者には独自の取り決めがあります。上に提示されたサンショウウオの問題についての爬虫類学者は、独自の特定の慣習を持っています(Wikipedia 2018).

出典:

Pigliucci、M.(2003)。種類似の概念としての種:種問題の(dis-)解? BioEssays、25(6)、596-602

ほくろサラマンダー-Hybrid_all-female_populations。ウィキペディアで。 2018年2月10日取得

ジョーンズ、B(2017)。分類学を倒すことを脅かしている悪い科学者はほとんどいない命名種は生物学の基礎を形成していますが、これらの悪質な研究者はシステムの欠陥を露呈しています。スミソニアン誌。

10
Zerodf

私は自分の識別子を使用します。

種の名前は一意である可能性がありますが、長すぎます-文字列です

たとえば、SQL Serverでは、クラスター化された主キーとして使用される場合、非クラスター化インデックスで使用されるため、長い文字列が繰り返されます。そして、通常、子テーブルの外部キーは主キーに移動するため、これを繰り返します

文字列として、ソートと比較(大文字小文字、アクセントなど)のオーバーヘッドがあります。

サロゲート数値キーを使用すると、これらの問題を回避できます。ただし、種名に一意の非クラスター化インデックスを作成する必要があります。

種の名前も長期的な良い識別子ですか?私の専門分野ではありませんが、多くの種に別の名前や論争がある、または再分類される、または「この種」かもしれませんか?

例: キリン種はいくつありますか?9?2?6?8?4?

12
gbn

割り当てられた後に科学コミュニティが種名を変更するかどうかはわかりません。

これが発生する場合、それを主キーとして使用しないようにするもう1つの理由です。名前が変更されるたびに、それへのすべての参照を変更する必要があります。カスケード更新は、宣言されたFKに役立ちます。 FKとして宣言されていない参照には役立ちません。

データベース外の種名への参照は、どの選択をしても問題になります。

3
Walter Mitty