2つの長い文字列があるとします。それらはほとんど同じです。
String a = "this is a example"
String b = "this is a examp"
上記のコードは一例です。実際の文字列は非常に長いです。
問題は、1つの文字列が2文字以上を持つことです。
これらの2つのキャラクターのどちらを確認できますか?
StringUtils.difference(String first、String second) を使用できます。
これが彼らの実装方法です。
public static String difference(String str1, String str2) {
if (str1 == null) {
return str2;
}
if (str2 == null) {
return str1;
}
int at = indexOfDifference(str1, str2);
if (at == INDEX_NOT_FOUND) {
return EMPTY;
}
return str2.substring(at);
}
public static int indexOfDifference(CharSequence cs1, CharSequence cs2) {
if (cs1 == cs2) {
return INDEX_NOT_FOUND;
}
if (cs1 == null || cs2 == null) {
return 0;
}
int i;
for (i = 0; i < cs1.length() && i < cs2.length(); ++i) {
if (cs1.charAt(i) != cs2.charAt(i)) {
break;
}
}
if (i < cs2.length() || i < cs1.length()) {
return i;
}
return INDEX_NOT_FOUND;
}
2つの文字列の違いを見つけるには、StringUtilsクラスとdifferenceメソッド。 2つの文字列を比較し、それらが異なる部分を返します。
StringUtils.difference(null, null) = null
StringUtils.difference("", "") = ""
StringUtils.difference("", "abc") = "abc"
StringUtils.difference("abc", "") = ""
StringUtils.difference("abc", "abc") = ""
StringUtils.difference("ab", "abxyz") = "xyz"
StringUtils.difference("abcde", "abxyz") = "xyz"
StringUtils.difference("abcde", "xyz") = "xyz"
文字列を反復処理しないと、thatが異なることがわかります-where-ではなく、長さが異なる場合のみです。異なる文字が何であるかを本当に知る必要がある場合は、両方の文字列をタンデムで調べて、対応する場所の文字を比較する必要があります。
以下のJavaスニペットは、文字列を等しくするためにそれぞれの文字列から削除(または追加)する必要のある最小限の文字セットを効率的に計算します。動的プログラミングの例です。
import Java.util.HashMap;
import Java.util.Map;
public class StringUtils {
/**
* Examples
*/
public static void main(String[] args) {
System.out.println(diff("this is a example", "this is a examp")); // prints (le,)
System.out.println(diff("Honda", "Hyundai")); // prints (o,yui)
System.out.println(diff("Toyota", "Coyote")); // prints (Ta,Ce)
System.out.println(diff("Flomax", "Volmax")); // prints (Fo,Vo)
}
/**
* Returns a minimal set of characters that have to be removed from (or added to) the respective
* strings to make the strings equal.
*/
public static Pair<String> diff(String a, String b) {
return diffHelper(a, b, new HashMap<>());
}
/**
* Recursively compute a minimal set of characters while remembering already computed substrings.
* Runs in O(n^2).
*/
private static Pair<String> diffHelper(String a, String b, Map<Long, Pair<String>> lookup) {
long key = ((long) a.length()) << 32 | b.length();
if (!lookup.containsKey(key)) {
Pair<String> value;
if (a.isEmpty() || b.isEmpty()) {
value = new Pair<>(a, b);
} else if (a.charAt(0) == b.charAt(0)) {
value = diffHelper(a.substring(1), b.substring(1), lookup);
} else {
Pair<String> aa = diffHelper(a.substring(1), b, lookup);
Pair<String> bb = diffHelper(a, b.substring(1), lookup);
if (aa.first.length() + aa.second.length() < bb.first.length() + bb.second.length()) {
value = new Pair<>(a.charAt(0) + aa.first, aa.second);
} else {
value = new Pair<>(bb.first, b.charAt(0) + bb.second);
}
}
lookup.put(key, value);
}
return lookup.get(key);
}
public static class Pair<T> {
public Pair(T first, T second) {
this.first = first;
this.second = second;
}
public final T first, second;
public String toString() {
return "(" + first + "," + second + ")";
}
}
}
String strDiffChop(String s1, String s2) {
if (s1.length > s2.length) {
return s1.substring(s2.length - 1);
} else if (s2.length > s1.length) {
return s2.substring(s1.length - 1);
} else {
return null;
}
}
2行で異なる単語を見つけるには、次のコードを使用できます。
String[] strList1 = str1.split(" ");
String[] strList2 = str2.split(" ");
List<String> list1 = Arrays.asList(strList1);
List<String> list2 = Arrays.asList(strList2);
// Prepare a union
List<String> union = new ArrayList<>(list1);
union.addAll(list2);
// Prepare an intersection
List<String> intersection = new ArrayList<>(list1);
intersection.retainAll(list2);
// Subtract the intersection from the union
union.removeAll(intersection);
for (String s : union) {
System.out.println(s);
}
最後に、両方のリストで異なる単語のリストがあります。簡単に変更して、異なる単語を最初のリストまたは2番目のリストに同時に持つことができます。これは、共用体の代わりにlist1またはlist2からのみ交差点を削除することで実行できます。
正確な位置の計算は、分割リスト内の各Wordの長さを(分割正規表現とともに)加算するか、単にString.indexOf( "subStr")を実行することで実行できます。
最後だけでなく、変更されたセクションのみを直接取得するには、Googleの Diff Match Patch を使用できます。
List<Diff> diffs = new DiffMatchPatch().diffMain("stringend", "stringdiffend");
for (Diff diff : diffs) {
if (diff.operation == Operation.INSERT) {
return diff.text; // Return only single diff, can also find multiple based on use case
}
}
}
Androidに追加するには:implementation 'org.bitbucket.cowwoc:diff-match-patch:1.2'
このパッケージはこの機能よりもはるかに強力で、主にdiff関連のツールを作成するために使用されます。