web-dev-qa-db-ja.com

正規表現検索をサポートする検索エンジンはありますか?

最初に、これを確認しました question ですが answer は古いサービスを参照しています。

それでは、インターネットコンテンツの検索に正規表現を提供するWebベース(またはソフトウェア、私は気にしない)はありますか?

46
ilyes kooli

ここで、superuser.comからの回答を書いてみましょう question 著者との完全な連帯のため:

Ask Metafilter からの引用:

キーワード検索を数百テラバイト(または最近のインデックスが何であれ)で効率的にする唯一の可能な方法は、単語のインデックスを事前計算することです。

実際、完全な正規表現エンジンはチューリング完全であり、CPU時間とメモリの量が無限に近くなる任意の正規表現を書くことができます。これらすべての理由から、一般の人々に正規表現検索を提供することは技術的な狂気になります。

Update:正しく指摘したように、正規表現はチューリング完了ではありません。より詳細な答えをお楽しみに:

未定...

16
gahcep

正規表現エンジンによるインスタント検索はありません。これは、ページのインデックス方法が原因である可能性があります。 Webのgrepを許可すると、多くの計算能力が必要になります。

2
dayyan

dayyanは正しい、それは検索エンジンを高速にする逆インデックスです。フラッシュディスクが100テラバイトしかない場合、ペタバイトのコンテンツに対する正規表現検索を高速化する方法はありません。キーワード検索、逆インデックス、問題なし。

blekkoのWeb grep(https://blekko.com/ws/+/webgrep)は正規表現をサポートしていますが、取得する検索のほとんどは、通常はHTML内にある定数文字列を対象にしています。 ?さまざまなjavascriptライブラリを使用しているのは誰ですか?さまざまなコメントシステムを使用しているのは誰ですか?などなど。

正規表現をお送りいただいた場合は、喜んで実行させていただきます。

これらの検索の実行は、クロール内のすべてのhtmlで実行されるMapReduceジョブで構成されます。それが答えを得るのにしばらく(1、2日)かかる理由です。

1
Greg Lindahl

完全な正規表現検索を使用するサイトを見つける可能性は低いですが、Googleにはマッチングを行う機能があります。これを達成しようとしているものに応じて、十分かもしれません。

GoogleGuide は、いくつかのオプションが利用可能で、かなり奥深く見えます。おそらく、検索したい種類のクエリの例を挙げれば、解決策を見つけることができますか?

0
MutterMumble

正規表現であることが必要な場合、あなたは台無しになっていると思います。ただし、より多くの検索機能を探している場合は、 http://www.googleguide.com/advanced_operators_reference.html