Javaでは、次のような文字列があります。
" content ".
String.trim()
は、これらの側のすべてのスペースを削除しますか、それともそれぞれのスペースを1つだけ削除しますか?
すべて 。
Returns:先頭と末尾の空白を削除したこの文字列のコピー、または先頭または末尾の空白がない場合はこの文字列。
〜Java 1.5.0ドキュメントから引用
(しかし、なぜあなたはそれを試してみて、自分で見なかったのですか?)
ソースコードから(逆コンパイル):
public String trim()
{
int i = this.count;
int j = 0;
int k = this.offset;
char[] arrayOfChar = this.value;
while ((j < i) && (arrayOfChar[(k + j)] <= ' '))
++j;
while ((j < i) && (arrayOfChar[(k + i - 1)] <= ' '))
--i;
return (((j > 0) || (i < this.count)) ? substring(j, i) : this);
}
表示される2つのwhile
は、ユニコードがスペース文字の先頭と末尾より下にあるすべての文字が削除されることを意味します。
疑わしい場合は、単体テストを作成します。
@Test
public void trimRemoveAllBlanks(){
assertThat(" content ".trim(), is("content"));
}
NB:もちろん(JUnit + Hamcrestの)テストは失敗しません
ただし、String.trimには "whitespace"の固有の定義があることを指摘する必要があります。ユニコードの空白は削除されませんが、空白とは見なされないASCII制御文字も削除されます。
このメソッドは、文字列の先頭と末尾から空白を削除するために使用できます。実際、ASCII制御文字もすべてトリミングします。
可能であれば、Unicodeの空白も処理するCommons LangのStringUtils.strip()を使用することもできます(また、nullセーフです)。
Stringクラスについては API をご覧ください:
文字列のコピーを返します。先頭と末尾の空白は省略されます。
両側の空白が削除されます。
trim()
はStringインスタンスを変更せず、新しいオブジェクトを返すことに注意してください。
String original = " content ";
String withoutWhitespace = original.trim();
// original still refers to " content "
// and withoutWhitespace refers to "content"
Java docs here に基づいて、.trim()
は、一般に空白として知られている '\ u0020'を置き換えます。
ただし、「\ u00A0」( nicode NO-BREAK SPACE
)も空白と見なされ、.trim()
はこれを削除しません。これは特にHTMLで一般的です。
削除するには、次を使用します。
tmpTrimStr = tmpTrimStr.replaceAll("\\u00A0", "");
この問題の例は here で議論されました。
Java trim()
の例:スペースの削除:
public class Test
{
public static void main(String[] args)
{
String str = "\n\t This is be trimmed.\n\n";
String newStr = str.trim(); //removes newlines, tabs and spaces.
System.out.println("old = " + str);
System.out.println("new = " + newStr);
}
}
出力
old =
This is a String.
new = This is a String.
Java docs(String class source)から、
/**
* Returns a copy of the string, with leading and trailing whitespace
* omitted.
* <p>
* If this <code>String</code> object represents an empty character
* sequence, or the first and last characters of character sequence
* represented by this <code>String</code> object both have codes
* greater than <code>'\u0020'</code> (the space character), then a
* reference to this <code>String</code> object is returned.
* <p>
* Otherwise, if there is no character with a code greater than
* <code>'\u0020'</code> in the string, then a new
* <code>String</code> object representing an empty string is created
* and returned.
* <p>
* Otherwise, let <i>k</i> be the index of the first character in the
* string whose code is greater than <code>'\u0020'</code>, and let
* <i>m</i> be the index of the last character in the string whose code
* is greater than <code>'\u0020'</code>. A new <code>String</code>
* object is created, representing the substring of this string that
* begins with the character at index <i>k</i> and ends with the
* character at index <i>m</i>-that is, the result of
* <code>this.substring(<i>k</i>, <i>m</i>+1)</code>.
* <p>
* This method may be used to trim whitespace (as defined above) from
* the beginning and end of a string.
*
* @return A copy of this string with leading and trailing white
* space removed, or this string if it has no leading or
* trailing white space.
*/
public String trim() {
int len = count;
int st = 0;
int off = offset; /* avoid getfield opcode */
char[] val = value; /* avoid getfield opcode */
while ((st < len) && (val[off + st] <= ' ')) {
st++;
}
while ((st < len) && (val[off + len - 1] <= ' ')) {
len--;
}
return ((st > 0) || (len < count)) ? substring(st, len) : this;
}
Startとlengthを取得した後、Stringクラスのsubstringメソッドを呼び出すことに注意してください。
文字列入力が次の場合:
String a = " abc ";
System.out.println(a);
はい、出力は「abc」になります。ただし、文字列入力が次の場合:
String b = " This is a test "
System.out.println(b);
出力はThis is a test
になります。したがって、trimは文字列の最初の文字の前と最後の文字の後にあるスペースのみを削除し、内部のスペースを無視します。これは、内部のスペースを削除する組み込みString
trimメソッドをわずかに最適化し、文字列の最初と最後の文字の前後にスペースを削除する私のコードの一部です。それが役に立てば幸い。
public static String trim(char [] input){
char [] output = new char [input.length];
int j=0;
int jj=0;
if(input[0] == ' ' ) {
while(input[jj] == ' ')
jj++;
}
for(int i=jj; i<input.length; i++){
if(input[i] !=' ' || ( i==(input.length-1) && input[input.length-1] == ' ')){
output[j]=input[i];
j++;
}
else if (input[i+1]!=' '){
output[j]=' ';
j++;
}
}
char [] m = new char [j];
int a=0;
for(int i=0; i<m.length; i++){
m[i]=output[a];
a++;
}
return new String (m);
}
trim()
は、先頭および末尾の空白をすべて削除します。ただし、注意してください:文字列は変更されません。 trim()
は、代わりに新しい文字列インスタンスを返します。
非常に重要なことの1つは、完全に「空白」で構成された文字列が空の文字列を返すことです。
x
が空白を表すstring sSomething = "xxxxx"
の場合、sSomething.trim()
は空の文字列を返します。
x
が空白を表すstring sSomething = "xxAxx"
の場合、sSomething.trim()
はA
を返します。
sSomething ="xxSomethingxxxxAndSomethingxElsexxx"
、sSomething.trim()
がSomethingxxxxAndSomethingxElse
を返す場合、ワード間のx
の数は変更されないことに注意してください。
パケットをきちんとした文字列にしたい場合は、この投稿に示すようにtrim()
と正規表現を組み合わせてください: Javaを使用して文字列の重複する空白を削除する方法 。
結果の順序は意味がありませんが、最初にtrim()
を使用する方が効率的です。それが役に立てば幸い。
両側のすべてのスペースが削除されます。
Stringのインスタンスを1つだけ保持するには、次を使用できます。
str = " Hello ";
または
str = str.trim();
その後、str
文字列の値はstr = "Hello"
になります
Trim()は両側で機能します。
Javadoc Stringにはすべての詳細が含まれています。空白(スペース、タブなど)を両端から削除し、新しい文字列を返します。
String formattedStr=unformattedStr;
formattedStr=formattedStr.trim().replaceAll("\\s+", " ");
何らかの方法で何が行われるかを確認したい場合は、 BeanShell を使用できます。これは、Javaにできるだけ近づけるように設計されたスクリプト言語です。一般的に言って、それはJavaと解釈され、いくつかの緩和があります。この種類の別のオプションは、 Groovy 言語です。これらのスクリプト言語は両方とも、インタープリター言語から知っている便利なRead-Eval-Printループを提供します。したがって、コンソールを実行して、次のように入力するだけです。
" content ".trim();
Enter
(またはGroovyコンソールの"content"
)を押すと、結果としてCtrl+R
が表示されます。