web-dev-qa-db-ja.com

すべての非英数字を空の文字列で置き換える

これを使ってみましたが、うまくいきませんでした-

return value.replaceAll("/[^A-Za-z0-9 ]/", "");
177
Alex Gomes

[^A-Za-z0-9]を使用します。

注:スペースは通常英数字と見なされないため、削除しました。

224
Mirek Pluta

試して

return value.replaceAll("[^A-Za-z0-9]", "");

または

return value.replaceAll("[\\W]|_", "");
118
Andrew Duffy

[^a-zA-Z]は、それ自体が文字範囲A-Z/a-zにない文字を置き換えることに注意してください。つまり、éßなどの特殊文字、またはキリル文字などは削除されます。

これらの文字の置換が不要な場合は、代わりに事前定義された文字クラスを使用します。

 someString.replaceAll("[^\\p{IsAlphabetic}^\\p{IsDigit}]", "");

PS:\p{Alnum}はこの効果を達成しません。[A-Za-z0-9]と同じ働きをします。

52
return value.replaceAll("[^A-Za-z0-9 ]", "");

これにより、leaveスペースはそのままになります。それがあなたの望むものだと思います。それ以外の場合は、正規表現からスペースを削除します。

48
erickson

この単純な正規表現を試すこともできます:

 str = str.replaceAll("\\P{Alnum}", "");
21
saurav

Javaの正規表現では、たとえばPerlなどの他の言語とは対照的に、正規表現の前後にスラッシュ(/)またはその他の区切り文字を配置する必要はありません。

10
abyx

ファイル名を作成するためにこのメソッドを作成しました。

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}
8
zneo

溶液:

value.replaceAll("[^A-Za-z0-9]", "")

説明:

[^abc]キャレット^が角括弧内の最初の文字として表示される場合、パターンを否定します。このパターンは、aまたはbまたはcを除くすべての文字に一致します。

キーワードを2つの関数として見る:

  • [(Pattern)] = match(Pattern)
  • [^(Pattern)] = notMatch(Pattern)

さらにパターンに関して:

  • A-Z = all characters included from A to Z

  • a-z = all characters included from a to z

  • 0=9 = all characters included from 0 to 9

したがって、パターンに含まれていないすべての文字を置換します

3
GalloCedrone

Guavaを使用すると、さまざまなタイプの基準を簡単に組み合わせることができます。特定のソリューションに使用できるもの:

value = CharMatcher.inRange('0', '9')
        .or(CharMatcher.inRange('a', 'z')
        .or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)
1
Debmalya Biswas

たとえばドイツ語のウムラウトのように、ASCII文字セットに属さない英数字も許可する場合は、次の解決策の使用を検討できます。

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

UNICODE_CHARACTER_CLASSフラグを使用すると、パフォーマンスが低下する可能性があることに注意してください(このフラグのjavadocを参照)

1
snap

簡単な方法:

public boolean isBlank(String value) {
    return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}

public String normalizeOnlyLettersNumbers(String str) {
    if (!isBlank(str)) {
        return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
    } else {
        return "";
    }
}
1
public static void main(String[] args) {
    String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";

    System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));

}

出力:ChlamydiasppIgGIgMIgAAbs8006

Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.Java

1
Albin