web-dev-qa-db-ja.com

Pythonで2つの文字列を比較するにはどうすればいいですか?

私は2つの文字列があります

string1="abc def ghi"

そして

string2="def ghi abc"

この2つの文字列が単語を壊すことなく同じであることをどのように取得するのですか?

71
user3064366

質問は文字列の等価性ではなく、集合の等価性についてのようです。文字列を分割してそれらを集合に変換することで、この方法のみで比較できます。

s1 = 'abc def ghi'
s2 = 'def ghi abc'
set1 = set(s1.split(' '))
set2 = set(s2.split(' '))
print set1 == set2

結果は

True
58
oxfn

両方の文字列が等しいかどうかを知りたい場合は、単純に実行できます。

print string1 == string2

しかし、両者が同じ文字セットを持ち、同じ回数出現するかどうかを知りたい場合は、 collections.Counter を使用します

>>> string1, string2 = "abc def ghi", "def ghi abc"
>>> from collections import Counter
>>> Counter(string1) == Counter(string2)
True
43
thefourtheye
>>> s1="abc def ghi"
>>> s2="def ghi abc"
>>> s1 == s2  # For string comparison 
False
>>> sorted(list(s1)) == sorted(list(s2)) # For comparing if they have same characters. 
True
>>> sorted(list(s1))
[' ', ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']
>>> sorted(list(s2))
[' ', ' ', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']
10
Tanveer Alam

このようなもの:

if string1 == string2:
    print 'they are the same'

update:各部分文字列が他の部分文字列に存在するかどうかを確認したい場合は、

elem1 = [x for x in string1.split()]
elem2 = [x for x in string2.split()]

for item in elem1:
    if item in elem2:
        print item
7
philshem

私はいくつかの解決策を提供するつもりです、そしてあなたはあなたのニーズを満たすものを選ぶことができます:

1)文字だけ、つまり同じ文字で、両方の文字列でそれぞれの出現頻度が等しい場合は、次のようにします。

''.join(sorted(string1)).strip() == ''.join(sorted(string2)).strip()

2)両方の文字列のスペース(空白文字)の数にも関心がある場合は、単に次のスニペットを使用してください。

sorted(string1) == sorted(string2)

3)単語を考慮しているが単語の順序を考慮しておらず、両方の文字列が単語の出現頻度や出現頻度に関係なく等しい頻度を持つかどうかを確認する場合は、次のように使用できます。

sorted(string1.split()) == sorted(string2.split())

4)頻度のカウントを気にする必要がなく、両方の文字列に同じset/が含まれていることを確認する必要がある場合は上記を拡張します。単語の、そして、あなたは以下を使うことができます:

set(string1.split()) == set(string2.split())
5
Archit Kapoor

直接比較における等式

string1 = "sample"
string2 = "sample"

if string1 == string2 :
    print("Strings are equal with text : ", string1," & " ,string2)
else :
    print ("Strings are not equal")

文字セットの等価性

string1 = 'abc def ghi'
string2 = 'def ghi abc'

set1 = set(string1.split(' '))
set2 = set(string2.split(' '))

print set1 == set2

if string1 == string2 :
    print("Strings are equal with text : ", string1," & " ,string2)
else :
    print ("Strings are not equal")
5
A.G

そのためには、pythonでデフォルトのdifflibを使うことができます。

from difflib import SequenceMatcher

def similar(a, b):
    return SequenceMatcher(None, a, b).ratio()

その後、similar()を

similar(string1, string2)

それはcompare as、ratio> = thresholdをマッチ結果を得るために返します

3
Basil Jose

両方のファイルを開き、Wordの内容を分割して比較します。

log_file_A='file_A.txt'

log_file_B='file_B.txt'

read_A=open(log_file_A,'r')
read_A=read_A.read()
print read_A

read_B=open(log_file_B,'r')
read_B=read_B.read()
print read_B

File_A_set = set(read_A.split(' '))
File_A_set = set(read_B.split(' '))
print File_A_set == File_B_set
1
Anum Sheraz

Difflibはこの仕事をするのに良いライブラリだと思います

   >>>import difflib 
   >>> diff = difflib.Differ()
   >>> a='he is going home'
   >>> b='he is goes home'
   >>> list(diff.compare(a,b))
     ['  h', '  e', '   ', '  i', '  s', '   ', '  g', '  o', '+ e', '+ s', '- i', '- n', '- g', '   ', '  h', '  o', '  m', '  e']
    >>> list(diff.compare(a.split(),b.split()))
      ['  he', '  is', '- going', '+ goes', '  home']
1
Asad

これはかなり基本的な例ですが、論理的な比較(==)やstring1.lower() == string2.lower()の後に、2つの文字列間の距離の基本的なメトリックを試すのに役立つかもしれません。

あなたはこれらのまたは他のいくつかの測定基準に関連する例をどこでも見つけることができます、またfuzzywuzzyパッケージ( https://github.com/seatgeek/fuzzywuzzy )を試してください。

import Levenshtein
import difflib

print(Levenshtein.ratio('String1', 'String2'))
print(difflib.SequenceMatcher(None, 'String1', 'String2').ratio())
0
Joe9008

両方の文字列を大文字または小文字に変換してみてください。それから==比較演算子を使うことができます。

0

本当に簡単な答えが必要な場合:

s_1 = "abc def ghi"
s_2 = "def ghi abc"
flag = 0
for i in s_1:
    if i not in s_2:
        flag = 1
if flag == 0:
    print("a == b")
else:
    print("a != b")
0