ユーザーエージェント文字列をどのように解析しますか?私は入手したい:
ユーザーエージェント文字列から。私のアプリはPerlで書かれており、以前は HTTP :: BrowserDetect を使用していました。少し古く、メンテナンスされていません。 (編集:更新されました。)実際の検索にPerlを使用することに縛られません。
自動マジック解析は失われた原因であるという結論に達しました。未分類のUAのリストを表示し、それらを手動で最新の状態に保つために、クラッドタイプのアプリを作成することを考えていました。
活用できるリソースはすでに存在しますか?ユーザーエージェント情報を検索するためにHTTP呼び出しを行うことができたら素晴らしいでしょう。
ありがとう!
seragentstring.com には、ユーザーエージェント文字列のブラウザーおよびOS情報があります。独自の文字列を送信するための「分析」ボックスもあります。自動的に接続するのがどれほど簡単かはわかりませんが、必要な情報があるようです。
元の投稿からの更新(アップ投票を盗みたくない):
http://useragentstring.com/ の作者からこれを受け取った:
シンプルなAPIを使用していますが、サイトの多くを再コーディングしようとしているため、近い将来に変更される可能性があります。私のサイトにリンクする場合、フォームフィールドまたは「uas」という名前のクエリ文字列でuseragentstringを送信できます。
http://www.useragentstring.com/?uas=Opera/9.70%20(Linux%20i686%20;%20U;%20en-us)%20Presto/2.2.
これにより、文字列が自動的に解析されます。 &getText = allを追加した場合
agent_type = Browser; agent_name = Opera; agent_version = 9.70 ...のようなキーと値のペアを含むテキストファイルを取得します。
Browscap.iniファイルは、名前、バージョン、Javascriptサポートなど、ブラウザーとその機能に関する多くの詳細を提供するデータベースです。
ブラウザ、および名前、バージョン、Javascriptサポートなどの機能に関する多くの詳細を提供するbrowscap.ini。
PHPのネイティブget_browser()関数は、このファイルを解析し、すべてのブラウザーの詳細に関する完全な情報セットを提供しますが、browscap.iniファイルへのパスを、PHP_INI_SYSTEMとしてフラグが付けられたphp.ini browscapディレクティブで指定する必要があります。
このスレッドは数年前ですが、ユーザーエージェントを検索するための新しいリソースがあります。 a.theafh.net 540万人のエージェント。たとえば、ブラウザ用のフィルターを使用し、ワイルドカード検索を使用できます。 http://ua.theafh.net/list.php?s=%22%2A%22&include=yes&class=abr&do=desc -あり検索結果をCSVとしてダウンロードする可能性
検索可能なUAのリストを探していました。 user-agents.orgは検索可能ですが、ほとんど十分なデータがありませんでした。 http://www.botsvsbrowsers.com/ が見つかりました。それは広告で雑然としているが、まさに私が探していた右側に検索バーがあります。
このJSONエンコードされたスパイダー/ボットのリストが見つかりました https://github.com/monperrus/crawler-user-agents は2017年の時点で定期的に更新されているようです。
2017年に最も更新されたリソース:
https://techblog.willshouse.com/2012/01/03/most-common-user-agents/
また、TXT形式でリストを提供します。
ソフトウェア、オペレーティングシステム、プラットフォーム、ハードウェアタイプ、ソフトウェアタイプ、およびレンダリングエンジンごとに編成されたユーザーエージェントの巨大なデータベースがあります。
https://developers.whatismybrowser.com/useragents/explore/
他のすべてのユーザーエージェントリストは、関連するユーザーエージェントを簡単に参照できるようにするという平均的な仕事をしているので、このリストを作成したとき、ユーザーにとってこのリストを作成することは、デザインの背後にある主要な優先事項の1つでした。
無料のAPIにサインアップして、ユーザーエージェントパーサーにアクセスすることもできます。
質問を投稿してから、 HTTP :: BrowserDetect が更新されました。インストールした後、ユーザーエージェント文字列のテキストファイルを解析する方法を次に示します。
cat user_agent_strings.txt | Perl -nE 'use HTTP::BrowserDetect; $ua = HTTP::BrowserDetect->new($_); say $ua->browser_string || "unknown";'
http://botopedia.org を使用できます。また、なりすましの防止に役立つIP検証も提供します。