読者です 読者をやめる 読者になる 読者になる

Visitorsを使ってApacheのログを分析する

Apacheのログをレポート化するのにVisitorsを使う。

売りとしてはこんな感じ。現時点で最新バージョンは0.7、最終更新日は2006年3月30日と全くメンテナンスされていないのだけどざっと使う分には特に不都合はない

  • インストールは必要ありません。高速なコンピュータでは毎秒最大150,000行のログエントリ(作者自身のログファイルの平均では毎秒20MB)を処理します。
  • コマンドラインで実行するように設計されており、html とテキストでレポートを出力します。 テキストのレポートを less にパイプすることで ssh を通じてウェブ統計をチェックすることができます。
  • バージョン 0.3 で導入された Visitors ストリームモードによってリアルタイム統計をサポートしています。
  • ログの書式を指定する必要はまるでありません。apache はもちろん、標準的なログフォーマット(このフォーマットの詳細については ドキュメント を見てください)を採用している他のほとんどのウェブサーバでそのまま動作します。
  • ポータブルな C のプログラムであり、多くの異なるシステムでコンパイルできます。Windows システム向けのバイナリはこのページのダウンロードセクションにあります。
  • 生成された html レポートは画像や外部 CSS を含んでおらず、すべて内部に含んでいます。それをユーザにメールで送ることができます。
  • GPL ライセンスの表現の意味でフリーソフトウェア(かつもちろん フリーウェア)です。利用に際して支払いは必要ありません。Visitors は適切な価格での作者による直接のカスタム版のサポートも行っています: お求めの場合は、antirez (at) invece.org 宛で私に連絡してください。 ISP は大きな処理速度という利益を得るでしょう。

see. Visitors

自分的な利点としてはこんな感じ

  • 導入が簡単
  • 扱いが簡単
  • 解析が早い
  • 結果が1ファイル(html)で楽

とりあえず配布されているWindows版の実行ファイルのダウンロードは有料なので、手元のCygwinでサクッとコンパイルする。できたexeは適当なパスの通った場所にでもコピーしておく。解析結果にグラフの画像がほしい場合は別途 graphviz が必要になるのだけど、今回はパス。

$ wget http://www.hping.org/visitors/visitors-0.7.tar.gz
$ tar zxvfp visitors-0.7.tar.gz
$ cd visitors_0.7/
$ make
$ ls visitors.exe

visitors.exe

で、実行する。ログファイルは予め手元に置いておいて以下のように実行

$ visitors access_log -A -m 100 -o html --trails --prefix http://www.atyks.org > report.html

できたreport.htmlでは、Google Keyphrasesの部分が文字化けしている。原因はブラウザの文字コードの判定が失敗しているため。文字コードをUTF8に切り替えるか、HTMLに手を入れて文字コードをの指定を追加してやればよい

<meta http-equiv="content-type" content="text/html; charset=UTF-8">

参考