Guid
をDictionary
のインデックスとして使用する場合、Guid
オブジェクトまたはGuidの文字列表現を使用する方が良いですか?
new Guid()
呼び出しがいたるところにあったため、文字列を使用してオブジェクトを使用するコードをリファクタリングしただけです。しかし、それでは、パフォーマンスの問題が何であるのか疑問に思いました。 (コレクションはかなり小さいですが、何度も繰り返されます。)
比較はより単純なので、Guid
の方が高速です。文字列には間接参照が含まれ、さらに多くの作業が必要です。
もちろん-あなたはプロファイリングできます;-p
証拠:
Searching for 7f9b349f-f36f-94de-ad96-04279ddf6ecf
As guid: 466; -1018643328
As string: 512; -1018643328
Searching for 870ba465-08f2-c872-cfc9-b3cc1ffa09de
As guid: 470; 1047183104
As string: 589; 1047183104
Searching for d2376f8a-b8c9-4633-ee8e-9679bb30f918
As guid: 423; 1841649088
As string: 493; 1841649088
Searching for 599889e8-d5fd-3618-4c4f-cb620e6f81bb
As guid: 488; -589561792
As string: 493; -589561792
Searching for fb64821e-c541-45f4-0fd6-1c772189dadf
As guid: 450; 1389733504
As string: 511; 1389733504
Searching for 798b9fe5-ba15-2753-357a-7637161ee48a
As guid: 415; 779298176
As string: 504; 779298176
Searching for 12ba292e-8e59-e5d0-7d04-e811a237dc21
As guid: 457; 558250944
As string: 564; 558250944
Searching for 05b3ce14-dfbf-4d3a-1503-ced515decb81
As guid: 413; 1658205056
As string: 504; 1658205056
Searching for 8db4a556-0a65-d8cb-4d0d-0104245d18b8
As guid: 415; 696231936
As string: 506; 696231936
Searching for c49cf80c-5537-fba5-eebd-8ad21bba09c4
As guid: 459; 2100976384
As string: 557; 2100976384
に基づく:
using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
static class Program
{
static void Main()
{
Random Rand = new Random(123456);
int COUNT = 1000;
Dictionary<Guid, int> guids = new Dictionary<Guid, int>(COUNT);
Dictionary<string, int> strings = new Dictionary<string, int>(
COUNT, StringComparer.Ordinal);
byte[] buffer = new byte[16];
for (int i = 0; i < COUNT; i++)
{
Rand.NextBytes(buffer);
Guid guid = new Guid(buffer);
int val = Rand.Next();
guids.Add(guid, val);
strings.Add(guid.ToString(), val);
}
for(int i = 0 ; i < 10 ; i++) {
int index = Rand.Next(COUNT);
Guid guid = guids.Keys.Skip(index).First();
Console.WriteLine("Searching for " + guid);
int chk = 0;
const int LOOP = 5000000;
Stopwatch watch = Stopwatch.StartNew();
for (int j = 0; j < LOOP; j++)
{
chk += guids[guid];
}
watch.Stop();
Console.WriteLine("As guid: " + watch.ElapsedMilliseconds
+ "; " + chk);
string key = guid.ToString();
chk = 0;
watch = Stopwatch.StartNew();
for (int j = 0; j < LOOP; j++)
{
chk += strings[key];
}
watch.Stop();
Console.WriteLine("As string: " + watch.ElapsedMilliseconds
+ "; " + chk);
}
Console.ReadLine();
}
}
コレクションはかなり小さいですが、何度も繰り返されます
反復する場合、キー比較のキーはありません。キーで追加/変更または検索する場合、キーがハッシュされ、ハッシュが比較されます。ハッシュが等しい場合のみ、キーが比較されます。
したがって、ハッシュの衝突が多い巨大なディクショナリで多くのキーベースの操作を実行している場合を除き、キーとキーの比較の速度は大きな要因にはなりません。
私の最初の考えは、Guid
オブジェクトの方が速いということでしたが、入力を文字列として取得し、GUIDの小さなコレクション(ハッシュセット)(頻繁に変更されない)で検索する必要がある場合は、それらを文字列として保存する方が高速かもしれません。
GUID-Dictionaryで文字列を検索するには、文字列を解析し(エラーチェックなどを含む)、Guid
構造を作成し、ハッシュコードを取得し、ハッシュルックアップと=の最後の1つの比較を行う必要がありますGUIDバイト。
String-Dictionaryで文字列を検索するには、文字列のハッシュを作成し(Guid
構造体を作成するよりも高速である可能性があります)、ハッシュを検索して1つの文字列比較を行う必要があります。たとえば、多くのGUIDがコレクションに含まれないことが予想される場合、ハッシュ比較は失敗することが多く、文字列比較を行う必要すらありません(上記の1のGUID比較よりも少し時間がかかります)。
入力としてすでにGuid構造がある場合(たとえば、入力文字列に対していくつかの妥当性チェックを行ったため)、もちろんそれらを辞書のインデックスとして再利用する方がはるかに優れています。
[〜#〜] but [〜#〜]:設計の明快さの観点から(これはすべてのコードの99%のパフォーマンスよりもはるかに重要です)、Guid
を使用する必要があります実際にパフォーマンスの問題が発生した場合にのみ構造を変更します(そして、プロファイリングで文字列ソリューションの利点が得られることがわかります)。