web-dev-qa-db-ja.com

なぜPHP json_encode関数はUTF-8文字列を16進数のエンティティに変換するのですか?

さまざまな言語を扱うPHPスクリプトがあります。残念ながら、json_encodeを使用しようとすると、Unicode出力は16進数のエンティティに変換されます。これは予想される動作ですか?出力をUTF-8文字に変換する方法はありますか?

ここに私が見ているものの例があります:

入力

echo $text;

出力

База данни грешка.

入力

json_encode($text);

出力

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
118
David Jones

PHP/5.4.0以降、"JSON_UNESCAPED_UNICODE"というオプションがあります。見てみな:

http://se2.php.net/json_encode

したがって、試してください:

json_encode( $text, JSON_UNESCAPED_UNICODE );
273
John Severinson

JSON_UNESCAPED_UNICODEは、PHPバージョン5.4以降で使用できます。
次のコードはバージョン5.3用です。

更新

  • html_entity_decodeは、pack + mb_convert_encodingよりも少し効率的です。
  • (*SKIP)(*FAIL)は、バックスラッシュ自体と、JSON_HEX_*フラグによって指定された文字をスキップします。

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}
54
mpyw

1つの解決策は、最初にデータをエンコードしてから、同じファイルでデコードすることです。

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );
2
Steffo Dimfelt

これは、さまざまなPHPバージョン用の統合ソリューションです。

私の会社では、さまざまなPHPバージョンの異なるサーバーを使用しているため、すべてのサーバーで機能するソリューションを見つける必要がありました。

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

クレジットは Marco Gasiab に移動する必要があります。 PHP> = 5.4のソリューションは、json_encodeドキュメントで提供されています。

1
gaba

文字セットとエスケープなしのユニコードを設定したい

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);
1
Adrian Romero

Raw_json_encode()関数 上記 は問題を解決しませんでした(何らかの理由で、コールバック関数がPHP 5.2.5サーバーでエラーを発生させました)。

しかし、この他のソリューションは実際に機能しました。

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

クレジットは Marco Gasi に移動する必要があります。 json_encode()を呼び出す代わりに、彼の関数を呼び出すだけです。

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}
0
abu
json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);
0
Hoàng Vũ Tgtt