web-dev-qa-db-ja.com

文字列中の文字の出現回数を数える

文字列内の文字の出現回数を数えるための最も簡単な方法は何ですか?

例えば'a''Mary had a little lamb'が出現した回数を数える

809
Mat

str.count(sub [、start [、end]])

部分文字列subの重複しない出現回数を範囲[start, end]で返します。オプションの引数startendはスライス表記と同じように解釈されます。

>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4
1151
Ogre Codes

count() を使用できます。

>>> 'Mary had a little lamb'.count('a')
4
126
eduffy

他の答えが言ったように、文字列メソッドcount()を使うのがおそらく最も簡単です、しかし、あなたがこれを頻繁にしているならば、 collections.Counter をチェックしてください:

from collections import Counter
str = "Mary had a little lamb"
counter = Counter(str)
print counter['a']
89
Brenden Brown

正規表現かも

import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))
46
Sinan Taifour
myString.count('a');

より多くの情報 ここ

23
Finer Recliner
"aabc".count("a")
14
Aaron Fi

str.count(a)は、文字列内の1文字を数えるための最善の解決策です。しかし、もっと文字数を数える必要がある場合は、文字列全体を数えたい文字数だけ読む必要があります。

この仕事のためのより良いアプローチは次のようになります。

from collections import defaultdict

text = 'Mary had a little lamb'
chars = defaultdict(int)

for char in text:
    chars[char] += 1

そのため、文字列内のすべての文字の出現回数と存在しない場合は0を返す辞書があります。

>>>chars['a']
4
>>>chars['x']
0

大文字と小文字を区別しないカウンタの場合は、defaultdictをサブクラス化することでmutatorメソッドとaccessorメソッドをオーバーライドできます(基本クラスのものは読み取り専用です)。

class CICounter(defaultdict):
    def __getitem__(self, k):
        return super().__getitem__(k.lower())

    def __setitem__(self, k, v):
        super().__setitem__(k.lower(), v)


chars = CICounter(int)

for char in text:
    chars[char] += 1

>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0
10
Nuno André

正規表現は、大文字と小文字を区別しない(そしてもちろん正規表現のすべての能力)が必要な場合に非常に便利です。

my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m")   # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))

正規表現バージョンの実行には10倍程度の時間がかかることに注意してください。これは、my_stringが非常に長い場合、またはコードが深いループ内にある場合にのみ問題になる可能性があります。

8
jafelds

この簡単で直接的な機能は、次のように役立ちます。

def check_freq(str):
    freq = {}
    for c in str:
       freq[c] = str.count(c)
    return freq

check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}
6
Erick Mwazonga
a = 'have a Nice day'
symbol = 'abcdefghijklmnopqrstuvwxyz'
for key in symbol:
    print key, a.count(key)
5
rookie

countは、文字列中の文字の出現を数える最も簡潔で効率的な方法ですが、lambdaを使った解決策を思いついたのです。

sentence = 'Mary had a little lamb'
sum(map(lambda x : 1 if 'a' in x else 0, sentence))

これは次のようになります。

4

また、これにはもう1つの利点があります。文が上記と同じ文字を含む部分文字列のリストである場合、これもinの使用により正しい結果が得られます。見てください:

sentence = ['M', 'ar', 'y', 'had', 'a', 'little', 'l', 'am', 'b']
sum(map(lambda x : 1 if 'a' in x else 0, sentence))

これも結果として生じます:

4

しかしもちろんこれは、この特定のケースで'a'のような単一文字の出現をチェックするときにのみ機能します。

2
Satish Garg
str = "count a character occurance"

List = list(str)
print (List)
Uniq = set(List)
print (Uniq)

for key in Uniq:
    print (key, str.count(key))
2
Thiru

「countを使わずに文字列に文字が欲しい」という方法。

import re

def count(s, ch):

   pass

def main():

   s = raw_input ("Enter strings what you like, for example, 'welcome': ")  

   ch = raw_input ("Enter you want count characters, but best result to find one character: " )

   print ( len (re.findall ( ch, s ) ) )

main()
1
B-Y
spam = 'have a Nice day'
var = 'd'


def count(spam, var):
    found = 0
    for key in spam:
        if key == var:
            found += 1
    return found
count(spam, var)
print 'count %s is: %s ' %(var, count(spam, var))
0
rookie

Counter()count、およびregexを使用せずにすべての文字数を取得する別の方法

counts_dict = {}
for c in list(sentence):
  if c not in counts_dict:
    counts_dict[c] = 0
  counts_dict[c] += 1

for key, value in counts_dict.items():
    print(key, value)

Countを使う 

string = "count the number of counts in string to count from."
x = string.count("count")

x = 3。

0
Carlson Bimbuh

この私見を超えない - あなたは上限または下限のメソッドを追加することができます

def count_letter_in_str(string,letter):
    return string.count(letter)
0
Tim Seed