web-dev-qa-db-ja.com

Javaのint [large] [small]とint [small] [large]の間に低レベルの違いはありますか?

この質問には、答えるためにおそらくコンパイラの知識が必要になります。現在、次のいずれかのアレイを作成するプロジェクトに取り組んでいます

int[2][veryLargeNumber]

または

int [veryLargeNumber][2]

論理的には違いはありませんが、メモリ内の形式(したがってサイズ)が異なる可能性があると考えていました(おそらく問題は、コンパイラが配列をそれらに合うように再配置するのに十分賢いかどうかです)。

62
John Paul

Javaは実際には1次元配列のみを実装します。これは多次元型ですが、2次元配列は実際には配列の配列として実装されます。各アレイには約16バイトのオーバーヘッドがあります。オーバーヘッドを最小限に抑えるには、int[2][x]を使用するほうがよいでしょう。

ヘルパーメソッドを使用すると、この問題を完全に回避できます。

final int[] array = new int[2 * veryLargeNumber];

public int get(int x, int y) {
    return array[idx(x, y)];
}

public void set(int x, int y, int val) {
    array[idx(x, y)] = val;
}

private int idx(int x, int y) {
    return x * 2 + y; // or x * veryLargeNumber + y;
}

これを自分に提供するために、各オブジェクトは一意にハッシュし、そのObjectヘッダーに格納されているhashCodeを生成します。

http://ideone.com/oGbDJ から、ネストされた各配列はそれ自体がオブジェクトであることがわかります。

int[][] array = new int[20][2];
for (int[] arr : array) {
    System.out.println(arr);
}

int[]の内部表現を表示します。これは、[Iの後に@が続き、その後にヘッダーに格納されているhashCode()が続きます。これは、一部の人が信じているように、オブジェクトのアドレスではありません。オブジェクトはGCによっていつでも移動できるため、アドレスをhashCodeとして使用することはできません(オブジェクトを決して移動しないJVMがない限り)

[I@106d69c
[I@52e922
[I@25154f
[I@10dea4e
[I@647e05
[I@1909752
[I@1f96302
[I@14eac69
[I@a57993
[I@1b84c92
[I@1c7c054
[I@12204a1
[I@a298b7
[I@14991ad
[I@d93b30
[I@16d3586
[I@154617c
[I@a14482
[I@140e19d
[I@17327b6

-XX:-UseTLABhttps://github.com/peter-lawrey/Performance-Examples/blob/master/src/main/Java/を使用してTLABをオフにすると、メモリの使用量を確認できますVanilla/Java/memory/ArrayAllocationMain.Java

public static void main(String[] args) {

    long used1 = memoryUsed();
    int[][] array = new int[200][2];

    long used2 = memoryUsed();
    int[][] array2 = new int[2][200];

    long used3 = memoryUsed();
    if (used1 == used2) {
        System.err.println("You need to turn off the TLAB with -XX:-UseTLAB");
    } else {
        System.out.printf("Space used by int[200][2] is " + (used2 - used1) + " bytes%n");
        System.out.printf("Space used by int[2][200] is " + (used3 - used2) + " bytes%n");
    }
}

public static long memoryUsed() {
    Runtime rt = Runtime.getRuntime();
    return rt.totalMemory() - rt.freeMemory();
}

プリント

Space used by int[200][2] is 5720 bytes
Space used by int[2][200] is 1656 bytes
53
Peter Lawrey

興味深い質問です。簡単なプログラムを実行しました

int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[2][N];
System.out.println(System.currentTimeMillis() - start + " ms");

その結果、160 ms。次に、他のバリアントを実行しました

int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[N][2];
System.out.println(System.currentTimeMillis() - start + " ms");

その結果、30897 ms。実際、最初のオプションはmuchのようです。

23
radoh
 int[2][veryLargeNumber] 

verlarnumberの項目を持つ2つの配列を作成します
ながら

 int[veryLargeNumber][2] 

2つの項目を持つ非常に多数の配列を作成します。

注:配列の作成にはオーバーヘッドがあります。最初のものをとても好んだ

11
Sher Alam

要するに、_int[2][veryLargeNumber]_がより良いアプローチです。

Peterが提案したもの(_int[] array = new int[2 * veryLargeNumber];_)はさらに優れています。または、メモリに問題がある場合は、整数(_long[] array = new long[veryLargeNumber];_)およびビット単位の演算子の代わりにlongを使用できます。 。

注意してください!ほとんどのJDK/JREディストリビューション(SunおよびOracle)での_[I@106d69c_の表記はSystem.identityHashCode()で与えられ、オブジェクトごとに一意であることは保証されているではありません。したがって、配列オブジェクトの一意性をチェックするためにSystem.out.println(array);に依存することはできません。

1
Bogdan B