web-dev-qa-db-ja.com

文字列をBase36にエンコードする

現在、可能な各文字を含む通常の文字列をBase36文字列にエンコードするアルゴリズムに取り組んでいます。

以下を試しましたが、うまくいきません。

public static String encode(String str) {
    return new BigInteger(str, 16).toString(36);
}

文字列が単なる16進文字列ではないからだと思います。文字列「Hello22334!」を使用するとBase36では、NumberFormatExceptionを取得します。

私のアプローチは、各文字を数字に変換することです。数値を16進表現に変換してから、16進文字列をBase36に変換します。

私のアプローチは大丈夫ですか、それとももっと簡単で良い方法がありますか?

8
Patrick Vogt

まず、文字列をバイトのセットで表される数値に変換する必要があります。これは、エンコーディングを使用する目的です。 UTF-8を強くお勧めします。

次に、その数、バイトのセットをベース36の文字列に変換する必要があります。

byte[] bytes = string.getBytes(StandardCharsets.UTF_8); 
String base36 = new BigInteger(1, bytes).toString(36);

デコードするには:

byte[] bytes = new Biginteger(base36, 36).toByteArray();
// Thanks to @Alok for pointing out the need to remove leading zeroes.
int zeroPrefixLength = zeroPrefixLength(bytes);
String string = new String(bytes, zeroPrefixLength, bytes.length-zeroPrefixLength, StandardCharsets.UTF_8));

private int zeroPrefixLength(final byte[] bytes) {
    for (int i = 0; i < bytes.length; i++) {
        if (bytes[i] != 0) {
            return i;
        }
    }
    return bytes.length;
}