私はこのコードに興味があります:
cout << 'test'; // Note the single quotes.
1952805748
の出力を提供します。
私の質問:出力はメモリ内のアドレスか何かですか?
これは複数文字のリテラルです。 1952805748
は0x74657374
、次のように分解されます
0x74 -> 't'
0x65 -> 'e'
0x73 -> 's'
0x74 -> 't'
編集:
C++標準、§2.14.3/ 1-文字リテラル
(...)複数のc-charを含む通常の文字リテラルは、複数文字リテラルです。複数文字リテラルには、int型と実装定義値があります。
いいえ、住所ではありません。いわゆるマルチバイト文字です。
通常、ASCII 4つの文字を組み合わせた値です。
't' == 0x74; 'e' == 0x65; 's' == 0x73; 't' == 0x74;
0x74657374は1952805748です。
ただし、他のコンパイラでは0x74736574になることもあります。 C標準とC++標準はどちらも、マルチバイト文字の値が実装定義であると述べています。そのため、一般的にその使用は強く推奨されていません。
本当にint
sです。これらは、Core Audio API列挙型(たとえば、CoreAudioTypes.h
ヘッダーファイル、
enum
{
kAudioFormatLinearPCM = 'lpcm',
kAudioFormatAC3 = 'ac-3',
kAudioFormat60958AC3 = 'cac3',
kAudioFormatAppleIMA4 = 'ima4',
kAudioFormatMPEG4AAC = 'aac ',
kAudioFormatMPEG4CELP = 'celp',
} ;
これは「プラットフォームに依存しない」わけではないが、移植性を重視する特定のプラットフォームであるmade forのapiを使用している場合、多くのおしゃべりがあります。同じプラットフォームで平等を確認しても失敗することはありません。これらのenum
'dの値は読みやすく、実際にはその値のアイデンティティを含んでいます。これはかなりいいです。
以下でやろうとしたことは、マルチバイト文字リテラルをラップして印刷できるようにすることです(Macではこれが機能します)。奇妙なことは、4文字すべてを使い切っていない場合、結果は以下のようになります。
#include <stdio.h>
#define MASK(x,BYTEX) ((x&(0xff<<8*BYTEX))>>(8*BYTEX))
struct Multibyte
{
union{
int val ;
char vals[4];
};
Multibyte() : val(0) { }
Multibyte( int in )
{
vals[0] = MASK(in,3);
vals[1] = MASK(in,2);
vals[2] = MASK(in,1);
vals[3] = MASK(in,0);
}
char operator[]( int i ) {
return val >> (3-i)*8 ; // works on mac
//return val>>i*8 ; // might work on other systems
}
void println()
{
for( int i = 0 ; i < 4 ; i++ )
putc( vals[i], stdout ) ;
puts( "" ) ;
}
} ;
int main(int argc, const char * argv[])
{
Multibyte( 'abcd' ).println() ;
Multibyte( 'x097' ).println() ;
Multibyte( '\"\\\'\'' ).println() ;
Multibyte( '/*|' ).println() ;
Multibyte( 'd' ).println() ;
return 0;
}
この種の機能は、パーサーを構築するときに非常に便利です。このことを考慮:
byte* buffer = ...;
if(*(int*)buffer == 'GET ')
invoke_get_method(buffer+4);
このコードは、特定のエンディアンでのみ動作する可能性が高く、異なるコンパイラ間で破損する可能性があります