私は長年ログファイルを処理するためにAwstatsを使用してきました。しかし、多くの可能性(クロスドメインレポートなど)が欠けているため、数年前に作成した余分なフィールドで立ち往生するのは嫌です。とにかく、私はこのスクリプトを使い続けるつもりはありません。
NoSQLのような最新のストレージテクノロジーに基づく最新のApacheログ分析ソリューション、または少なくとも何らかの形で大規模なデータセットに効率的に対処する準備ができているものはありますか?
私は、独自のフロントエンドを作成する前に、主にWeb分析に焦点を合わせたニースのソートおよび検索可能な出力を生成するものを探しています。 (つまりgraylog2はオプションではありません)
この質問は、純粋にログファイルベースのソリューションに関するものです。
SplunkはApacheログをインポートできます http://docs.splunk.com/Documentation/Splunk/4.3.2/Data/Apachelogslocal
または、この回答を確認してください Stack Overflow
比較的最近のオプションは、 Flumeを使用してログを収集する および FlumeのMongoDBシンクプラグインを使用する で、MongoDBにイベントを書き込みます。
他の誰かがこの問題に遭遇した場合:当面の私のソリューションは、ログファイルまたはcat
およびgrep
を使用するサブセットで Goaccess を使用することでした。 awstatsや何らかの結果ストレージを備えたソフトウェアと比較すると、退行のように見えるかもしれませんが、そのパフォーマンスはアドホックログファイル分析に最適です。