CおよびC++でchar
をint
に変換する方法
あなたがやりたいことによります:
値をASCIIコードとして読み取るには、次のように書くことができます。
char a = 'a';
int ia = (int)a;
/* note that the int cast is not necessary -- int ia = a would suffice */
文字'0' -> 0
、'1' -> 1
などを変換するために、あなたは書くことができます
char a = '4';
int ia = a - '0';
/* check here if ia is bounded by 0 and 9 */
さて、ASCIIコードでは、数字(数字)は 48 から始まります。あなたがする必要があるのは、
int x = (int)character - 48;
CとC++は常に型を少なくともint
にプロモートします。さらに、文字リテラルは、Cではint
型、C++ではchar
型です。
char
に代入するだけでint
型を変換できます。
char c = 'a'; // narrowing on C
int a = c;
charは1バイトの整数です。 char型には魔法のようなものは何もありません。 intにshort、またはlongにintを割り当てることができるのと同じように、intにcharを割り当てることができます。
はい、プリミティブデータ型の名前はたまたま「char」であり、それは文字だけを含むべきであることを暗示しています。しかし、実際には、「char」は、その言語を学ぶことを試みるすべての人を混乱させるための単なるかわいそうな名前の選択です。よりよい名前はint8_tです。コンパイラが最新のC標準に準拠している場合は、代わりにその名前を使用できます。
もちろん文字列処理を行うときはshouldをchar型として使います。これは、古典的なASCIIテーブルのインデックスが1バイトに収まるからです。あなたがcouldしかし、通常のintでも同様に文字列処理を行います。たとえば、次のコードは完璧に機能します。
int str[] = {'h', 'e', 'l', 'l', 'o', '\0' };
for(i=0; i<6; i++)
{
printf("%c", str[i]);
}
あなたは、文字と文字列が単なる数字であることを理解しなければなりません。あなたがソースコードに 'a'を書くと、それは整数定数である数97に前処理されます。
あなたがのような表現を書くならば
char ch = '5';
ch = ch - '0';
これは実際に等価です
char ch = (int)53;
ch = ch - (int)48;
これは、C言語の整数プロモーションを通過しています
ch = (int)ch - (int)48;
その後、結果の型に合わせてcharに切り捨てられます
ch = (char)( (int)ch - (int)48 );
このように微妙なことがたくさんあります。charは暗黙のうちにintとして扱われます。
(この答えはC++側の問題に対処しますが、符号拡張問題はCにも存在します。)
3つのchar
型(signed
、unsigned
、およびchar
)をすべて扱うことは、最初に現れるよりもデリケートです。 0からSCHAR_MAX
の範囲の値(8ビットのchar
の場合は127)は簡単です。
char c = somevalue;
signed char sc = c;
unsigned char uc = c;
int n = c;
しかし、somevalue
がその範囲外の場合は、unsigned char
を通過するだけで、3つすべてのタイプの「同じ」char
値に対して一貫した結果が得られます。
char c = somevalue;
signed char sc = c;
unsigned char uc = c;
// Might not be true: int(c) == int(sc) and int(c) == int(uc).
int nc = (unsigned char)c;
int nsc = (unsigned char)sc;
int nuc = (unsigned char)uc;
// Always true: nc == nsc and nc == nuc.
符号拡張のため、isupper
やtoupper
などのctype.hの関数を使用する場合、これは重要です。
char c = negative_char; // Assuming CHAR_MIN < 0.
int n = c;
bool b = isupper(n); // Undefined behavior.
Intによる変換は暗黙のうちに行われることに注意してください。これは同じUBを持ちます。
char c = negative_char;
bool b = isupper(c);
これを修正するには、ctype.h関数を safe_ctype にラップすることで簡単にできるunsigned char
を実行します。
template<int (&F)(int)>
int safe_ctype(unsigned char c) { return F(c); }
//...
char c = CHAR_MIN;
bool b = safe_ctype<isupper>(c); // No UB.
std::string s = "value that may contain negative chars; e.g. user input";
std::transform(s.begin(), s.end(), s.begin(), &safe_ctype<toupper>);
// Must wrap toupper to eliminate UB in this case, you can't cast
// to unsigned char because the function is called inside transform.
3つのchar型のいずれかを取る関数は他の2つのchar型も取ることができるので、これはうまくいきます。それは2つの関数を導きます。そして、それはタイプのどれでも扱うことができます:
int ord(char c) { return (unsigned char)c; }
char chr(int n) {
assert(0 <= n); // Or other error-/sanity-checking.
assert(n <= UCHAR_MAX);
return (unsigned char)n;
}
// Ord and chr are named to match similar functions in other languages
// and libraries.
負のchar
または負のsigned char
が渡された場合でも、ord(c)
は常に負ではない値を返します。また、chr
はord
が生成してまったく同じchar
を返す値です。
実際には、これらを使用せずにunsigned char
をキャストするだけですが、キャストを簡潔にラップし、int
-から-char
のエラーチェックを追加するのに便利な場所を提供します。それらは非常に近接して数回。
static_cast<int>
を使用してください。
int num = static_cast<int>(letter); // if letter='a', num=97
編集: あなたはおそらく使用しないように試みるべきです (int)
int num =(int)レター。
チェックアウト (int)xの代わりにstatic_cast <int>(x)を使うのはなぜですか? 詳細について.
それはあなたが "convert"によって何を意味するかに依存します。
"123456"のように整数を表す一連の文字がある場合、Cでそれを行うには2つの典型的な方法があります。 atoi() または strtolのような特殊目的変換を使用する() 、または汎用の sscanf() 。 C++(これは実際にはアップグレードとして見せかけている別の言語です)は、3番目の文字列ストリームを追加します。
int
変数の1つの中の正確なビットパターンをchar
として扱うことを望むなら、それはより簡単です。 Cでは、異なる整数型は実際の別々の「型」よりも実際にはもっと気の利いた状態です。 char
sが要求されているところでそれを使い始めるだけでOKです。コンパイラが時々泣き言を言うのをやめるためには明示的な変換が必要かもしれませんが、すべきことは256を超えた余分なビットをすべて落とすことです。
私はCで絶対にnull
のスキルを持っていますが、単純な構文解析のために:
char* something = "123456";
int number = parseInt(something);
...これは私のために働いた:
int parseInt(char* chars)
{
int sum = 0;
int len = strlen(chars);
for (int x = 0; x < len; x++)
{
int n = chars[len - (x + 1)] - '0';
sum = sum + powInt(n, x);
}
return sum;
}
int powInt(int x, int y)
{
for (int i = 0; i < y; i++)
{
x *= 10;
}
return x;
}
おそらくあなたは、C標準ライブラリからの関数を使うためにこの変換が欲しいでしょう。
その場合は、(C++構文)をしてください。
typedef unsigned char UChar;
char myCppFunc( char c )
{
return char( someCFunc( UChar( c ) ) );
}
式UChar( c )
は、負の値を取り除くためにunsigned char
に変換します。負の値は、EOFを除いて、C関数ではサポートされていません。
それから、その式の結果はint
仮引数の実引数として使用されます。 int
への自動昇格がある場所。 int( UChar( c ) )
のように、最後のステップを明示的に書くこともできますが、個人的には冗長すぎると思います。
歓声と、
Charまたはintの短縮形の場合は、値を代入するだけです。
char ch = 16;
int in = ch;
Int64と同じです。
long long lo = ch;
すべての値は16になります。
"7c7c7d7d7d7d7c7c7c7d7d7d7d7c7c7c7c7c7c7d7d7c7c7c7c7d7c7d7d7d7c7c2e2e2e"
のようなchar配列を実際の整数値に変換するのに問題がありました。これは `7C 'で1つの16進値として表現することができます。それで、助けを求めてクルージングした後、私はこれを作成しました、そして、それを共有するのはクールだと思いました。
これはchar文字列を正しい整数に分離します、そして私よりも多くの人にとって役に立つかもしれません;)
unsigned int* char2int(char *a, int len)
{
int i,u;
unsigned int *val = malloc(len*sizeof(unsigned long));
for(i=0,u=0;i<len;i++){
if(i%2==0){
if(a[i] <= 57)
val[u] = (a[i]-50)<<4;
else
val[u] = (a[i]-55)<<4;
}
else{
if(a[i] <= 57)
val[u] += (a[i]-50);
else
val[u] += (a[i]-55);
u++;
}
}
return val;
}
それが役に立てば幸い!