半自動的な索引の付け方

索引は重要だということ

最近のBlogやWikiの流行のせいで、Webサイト全体では無く個々のWebページに焦点が集まる機会が増えたような気がする。Blogは1エントリーごとに独立している(はずだ)し、Wikiもとりあえずページ単位で修正することが多い。って話
その中で、ページ間の繋がりを示す方法が色々と重要視されているよってことで、例えば、パン屑リストやカテゴリーなんてのが重要視されてるし、Wikiなんかも存在するWebページの一覧ってのがある。
まぁ、これも一方法ではあるんだけど、本なんかで使われている索引って仕組みをもっと積極的にWebに持ち込んでも良いんじゃないかなぁってお話で。元々index.htmlなんかのindexってのは索引のことのはずで、当初はやる気満々だったのだろうと推測してみる。で、翻って今を見ると殆ど使われていないような気がする。

索引の問題点

本なんかでも索引は作るのは面倒なのは同じことで、全体の中で重要な索引語の決定やら、ページの割り振りやら大変なことになるわけです。
一方でWebの場合、自然言語処理的なアプローチで索引(もうちょっと言うとキーワード)を作りましょうってのはそう珍しい話じゃない。ただ、出現頻度や形態素解析で出てくるキーワードってのは本当に索引なのかなぁっと思うわけです。

じゃぁ、どうするかって言うと人間様が索引語を決定していく(もしくは自動的に生成された索引語をメンテナンスしていく)ってのが重要になるわけです。
が、そんな面倒くさいことはやりたくも無いってのが人情であってどうにか面倒くさくない方法を考えると。

面倒くさくないアプローチ

そもそも索引を作るのが面倒くさいのは、全体をみて一気につけようとしたり、自動処理で出来たものをメンテナンスするっていうのが大きいと思いますさ。
じゃぁ、どうするかって言うとBlogやWikiのページを作成しているときに索引語になりそうな語をマークアップするっていう至極真っ当な方法が出るわけです。
そうすることで自分の意志を索引にお手軽に反映させることが出来るって寸法で。

とあるデジャブー

で、この方法ってどっかで見たことがあるというと、はてなダイアリーなんかでやってるキーワードのオートリンクなんかですね。
これの問題点は、自分のWebサイト全体で付けられたキーワードを一覧できないことと、自分の好みで作ることができないってことなんだろうなぁ。

で、どうするかってこと

要は、索引語らしきものを書く度にマークアップしましょうってはなしで。一旦索引語認定すると後は全体に反映される。
で、索引語の一覧と語が含まれるページへのリンクを生成するって方針は如何でしょうかっていうか昔からみんなやってるとは思うんだけどね。

HTMLとBlogとWikiなんかでのCMS

HTMLにはdfnとかabbrなんて索引生成に使えそうな要素が普通に存在するわけですが、今まで今一使い出が無いせいか軽視されてます。
それを反映してBlogやWikiなんかのHTML略記法を採用しているものではそんな略記はなかなかないなぁってこと。もったいない

作ったよってお話

そんな感じのサイトの索引を生成するためのBloxomプラグインを作ってみたって話はまた別のところで