アルス文庫の評価:アクセスログ解析 

アルス・フォーラム  アルスの広場  アルス論壇  アルス討論会  アルス文庫  [トップページ] 


アクセスログの解析      中井浩二

アルス文庫の評価

 アルスの会の活動の中で「アルス文庫」は、大きなウエイトを持つようになった。 これは、当初予想していなかったことである。エッセイや論文を個々に収録して「アルス論壇」や「アルス討論」における議論の補助としその参考資料にするつもりであったが、はじめて見ると「アルス文庫」のエッセイや論文へのアクセスが多いので驚いた。「アルスの会」の活動の重点の一つは、会員や会友、さらにその外の人達に世直しを訴えることにあるが、「アルス文庫」に掲載された論文やエッセイが多くの方の注目を集め意見や主張を伝えることができれば,これほど結構なことはない。
 そう考えてくると、アクセスの中身を解析する必要があると思うようになった。

 アクセスに関するデータの統計は、YAHOOのウエブホスティングによって見ることができる。そのデータに関する統計を用いて、各エッセイ・論文へのアクセス件数を数えることができる。そこで、毎月始めに過去2ヶ月間のベストアクセスを「アルスの広場」に掲載して来た。2ヶ月間のリクエスト数が50を超える論文が毎月20件以上ある。多いものはリクエスト数が500を超えている。(例えば:   (12/2-1/31)、   (11/1-12/31) など のベストアクセス)  しかし、ただリクエスト数が多いというだけで喜んでいるわけにはいかない。検索などの目的で機械的にアクセスする場合も一緒に計数されている。「ロボットアクセス」と呼んでいる。また、事務局で編集のためにアクセスする場合も計数される。これらの機械的なアクセスがどのくらいあるか調べる必要があると考え、昨年の夏から始めて半年余りにわたり、アクセスログの解析を進めて来た。これは「アルス文庫」の評価作業である。ここにその中間報告を記す。このような作業に不慣れで常識にも欠けている者の作業なので,不完全であるが、是非諸兄姉のご批判をいただきたい。この作業は、「アルス文庫」の評価に関わることであり、今後の活動の方向づけにも大きく関わる要素である。

「ロボットアクセス」と「ネットアクセス」

 まず、「ロボットアクセス」を見つけることから始めた。最も簡便な方法は、アクセスログの中の'remote host'と'useragent' とを対象に、 Robotのうちの3文字「bot」を検索することであった。これで「ロボットアクセス」件数の半数近くを見つけることができた。『search』という語も検索に用いたが、これは機械的なアクセスと断定できないものもあり、その数も少なかった。もう一つの方法は、アクセスが大量に行われているケースを探す方法であった。この探索法で中国の検索エンジンBaiduspiderを見つけることができた。2006年7月から2007年1月までのロボットアクセス件数の一覧を表に示す。これで全てであるとは言えないが、大半を拾い上げることができた。残りはあるとしても少数であると考えている。

Robot検索



 このような探索作業を進めていた中で、もう一つ機械的なアクセスがあることに気づいた。アルス文庫に新しいエッセイ・論文を掲載する時、事務局が頻繁にアクセスを繰り返す。これを「Editorial access」(編集アクセス)と呼んで「Net access」(純アクセス)、「Robot access」(ロボットアクセス)と区別し、アクセス解析の対象からはずすことにした。

 次に、3つのタイプのアクセスの比率を図に示す。

ENRアクセス



「純アクセス」と「ロボットアクセス」

 「ロボットアクセス」を判定する方法を確立したところで、それを差し引いた「純アクセス」との比率を調べた。
  次の2つの図は、2006年9月と12月に掲載されたそれぞれの月の全論文のアクセス件数を示す。「純アクセス(Net access)」と「ロボットアクセス(Robot access + Editorial access)」を色を変えて示してある。当然のことであるが「ロボットアクセス+」は、論文によることなく一定の数になる。平均するとおよそ20件であることが分かる。

 

論文アクセス


 この解析によって、これまで「アルスの広場」に紹介していたアクセスログ統計の意義が分かって来た。図らずもリクエスト数50以上の論文を紹介していたが、この統計は過去2ヶ月をまとめたものであり、上記の解析によれば機械的なアクセスがおよそ月間20件とすると2ヶ月で40になる。リクエスト数がそれより少し上のところに 選択の限界を置いていたのは、深い考えがあったわけでもないのに、まことに適切であったと言える。
 個々の論文に対する反応の大小を見るという観点では、機械的なアクセスの件数を差し引いて考えるべきであろうが、機械的であってもロボット検索によって論文が広く紹介されることも大変好ましいことである。折角、書いたエッセイや論文が限られた範囲にしか届いていないのは残念である。例えば退職記念誌・研究会報告書など特定の誌書に書かれたエッセイや論文が、もっと広く、異なった世界に紹介されることは喜ぶ人があっても厭がる人は少ないであろう。
 しかし、事務局が編集などの作業のために開かれるケース「Editorial access」は話が違う。アクセスログを使う際この分は差し引いて考える必要があろう。「Robot access」「Net access」「Editorial access」の件数を各月毎に数えた結果は次の図のようになった。

論文・エッセイのアクセス ベスト15

 毎月始めに「アルスの広場」に論文・エッセイのベストアクセスを掲載しているが、この詳しい解析によっても大きく異なることはないと結論できる。ここでは、しかし、折角詳しい解析をしたので改めてベスト15の論文・エッセイを次に示す。ここでは、2006年7月から12月までの毎月のアクセス件数の変動をグラフにした。

アクセスベスト10