web-dev-qa-db-ja.com

フィールドに文字列が含まれているかどうかの確認

フィールドの値に特定の文字列が含まれているかどうかを確認できる演算子を探しています。

何かのようなもの:

db.users.findOne({$contains:{"username":"son"}})

それは可能ですか?

344
johnny

次のコードでそれをすることができます。

db.users.findOne({"username" : {$regex : ".*son.*"}});
540

Mongo Shellが正規表現をサポートしているので、それは完全に可能です。

db.users.findOne({"username" : /.*son.*/});

クエリで大文字と小文字を区別しない場合は、次のように "i"オプションを使用できます。

db.users.findOne({"username" : /.*son.*/i});

参照してください: http://www.mongodb.org/display/DOCS/Advanced+Queries#AdvancedQueries-RegularExpressions

154
James Gan

https://docs.mongodb.com/manual/reference/sql-comparison/

http://php.net/manual/en/mongo.sqltomongo.php

MySQL

SELECT * FROM users WHERE username LIKE "%Son%"

MongoDB

db.users.find({username:/Son/})
110
Zheng Kai

バージョン2.4以降では、フィールドに テキストインデックス を作成して検索し、 $ text 演算子を使用してクエリを実行できます。

まず、インデックスを作成します。

db.users.createIndex( { "username": "text" } )

次に、検索します。

db.users.find( { $text: { $search: "son" } } )

ベンチマーク(〜15万文書):

  • 正規表現(その他の答え)=> 5.6-6.9秒
  • テキスト検索=> .164 - .201秒

ノート:

  • コレクションにはテキストインデックスを1つだけ含めることができます。 any stringフィールドを検索する場合は、ワイルドカードテキストインデックスを使用できます。db.collection.createIndex( { "$**": "text" } )
  • テキストインデックスは大きい場合があります。挿入された各ドキュメントの各インデックス付きフィールドに、一意のポストステムワードごとに1つのインデックスエントリが含まれています。
  • テキストインデックスは、通常のインデックスよりも構築に時間がかかります。
  • テキスト索引には、文書内の語句の近さに関するフレーズや情報は格納されません。その結果、コレクション全体がRAMに収まる場合、フレーズクエリははるかに効果的に実行されます。
62
okoboko

これは検索エンジンにおける最初のヒットの1つであり、上記のどれもMongoDB 3.xでは機能しないようであるため、ここで機能する正規表現検索が1つあります。

db.users.find( { 'name' : { '$regex' : yourvalue, '$options' : 'i' } } )

追加のインデックスを作成する必要はありません。

21
Nitai

PythonでMongoDBを接続している場合は、次のようにします。

db.users.find({"username": {'$regex' : '.*' + 'Son' + '.*'}})

'Son'の代わりに変数名を使用することもでき、したがって文字列の連結も可能です。

16
Patthebug

このタスクを達成するための最も簡単な方法

クエリを 大文字と小文字を区別する にしたい場合

db.getCollection("users").find({'username':/Son/})

クエリに 大文字と小文字を区別しない にしたい場合

db.getCollection("users").find({'username':/Son/i})
12
Anurag Misra

理想的な答えは、その使用インデックスicase-insensitiveのオプション

db.users.findOne({"username" : new RegExp(search_value, 'i') });
0
Hisham

正規表現の一致でHTMLタグを無視する方法:

var text = '<p>The <b>tiger</b> (<i>Panthera tigris</i>) is the largest <a href="/wiki/Felidae" title="Felidae">cat</a> <a href="/wiki/Species" title="Species">species</a>, most recognizable for its pattern of dark vertical stripes on reddish-orange fur with a lighter underside. The species is classified in the genus <i><a href="/wiki/Panthera" title="Panthera">Panthera</a></i> with the <a href="/wiki/Lion" title="Lion">lion</a>, <a href="/wiki/Leopard" title="Leopard">leopard</a>, <a href="/wiki/Jaguar" title="Jaguar">jaguar</a>, and <a href="/wiki/Snow_leopard" title="Snow leopard">snow leopard</a>. It is an <a href="/wiki/Apex_predator" title="Apex predator">apex predator</a>, primarily preying on <a href="/wiki/Ungulate" title="Ungulate">ungulates</a> such as <a href="/wiki/Deer" title="Deer">deer</a> and <a href="/wiki/Bovid" class="mw-redirect" title="Bovid">bovids</a>.</p>';
var searchString = 'largest cat species';

var rx = '';
searchString.split(' ').forEach(e => {
  rx += '('+e+')((?:\\s*(?:<\/?\\w[^<>]*>)?\\s*)*)';
});

rx = new RegExp(rx, 'igm');

console.log(text.match(rx));

これはおそらくMongoDBの集計フィルタに変換するのは非常に簡単です。

0
Tamás Polgár