全文検索の終焉?

終焉と言うのは大げさだけど,全文検索は時代遅れじゃないかと思わせる出来事があった.
うちのサイトにgoogleから"teikade 公開を終了"で検索がかけられたのだけど,ちょっとまずい事態が生じたようだ.

うちのサイトでは以下の3件が引っかかった.


はてなダイアリー - Moleskin Diary
... 2004-02-03. ■ [Contents]2004-02-03. [news]MS、IE脆弱性に対応の臨時パッチ; [blog]Weblog
クリッポ0203; [blog]Bulkfeeds: Similarity Search リリース; [java]Teikade公開終了; ... [permalink][contents][page
top]. ■ [java]Teikade公開終了. http://www.pfu.co.jp/teikade/index_ja.html. ...
d.hatena.ne.jp/moleskin/20040203 - 36k - キャッシュ - 関連ページ

はてなダイアリー - Moleskin Diary
... 記憶させたパスワードが表示されなくなる 個人データ引き出す 京大の研
究員を逮捕 Blogpedia 2004-02-03 MS、IE脆弱性に対応の臨時パッチ Weblogクリッ
ポ0203 Bulkfeeds: Similarity Search リリース Teikade公開終了 hatena VS ココログ 仙台 ...
d.hatena.ne.jp/moleskin/20031110 - 25k - キャッシュ - 関連ページ

はてなダイアリー - Moleskin Diary
... 記憶させたパスワードが表示されなくなる 個人データ引き出す 京大の
研究員を逮捕 ■ 2004-02-03 MS、IE脆弱性に対応の臨時パッチ Weblogクリッ
ポ0203 Bulkfeeds: Similarity Search リリース Teikade公開終了 hatena VS ココログ
台 ...
d.hatena.ne.jp/moleskin/20040105 - 29k - キャッシュ - 関連ページ

teikade公開終了のエントリが書かれたのは2004/02/03である.2003/11/10や2004/01/05に書かれているはずがない.
にもかかわらずgoogleはこれらの日にもTeikade公開終了の記事が書かれているとして検索結果に表示している.
こんなことが起きた原因はサイド-バーの最新記事表示機能にある.

これはgoogleのキャッシュの画面をキャプチャーしたもので,確かに2003/11/10の日記の脇にteikade公開終了と言う文字が表示されている.じつはこのキャッシュは2004/02/05にgoogleがgetしたもので,確かにこの日であればサイドバーにteikade公開終了の記事へのリンクが表示される.しかし肝心の記事自体は2004/02/03のものであるから検索結果としては妥当ではない.
さらにまずいことに今現在2003/11/10の記事を読みにいっても,2004/02/03の記事へのリンクはサイドバーには表示されない.2週間以上も過去の記事なのでサイドバーの表示対象外なのだ.かくして「Teikade公開終了」を読みに2003/11/10の記事を読みにいった人間は完全に空振りを喫する事になる.
かなりまずくありませんか?これは.
最近うちのページをキャッシュから見に来た奴が居たが,原因はこれかね?
対策としては,読み手としてはblogあるいは日記などをgoogle経由で読みに行く場合は,本体でなくまずキャッシュを読むくらいしか思いつかない.
書き手としての対策はサイドバーのあたりに注意書きでも書いておくか.
とにかくNet上Webのページの大半が,かつてのようなHTMLの静的ファイルではなく,BlogやCMSのように動的に生成されるページで占められようとしている今日,Webの検索技術もひとつの曲がり角を迎えつつあるのは確かなようだ.


[permalink][contents][page top]