オートカテゴライズとスケールフリーネットワーク

僕が昼休みにぼっけと考えることは既に世の中にあるに決まっているな.
キーワードのオートカテゴライズみたいな機構を考えた.

  1. まずドキュメントから適当にキーワードを抽出する.やりかたはどうでもよい.
  2. 抽出されたキーワードは相互に関連性があるとみなし,相互にリンク(WWWのリンクじゃないよ)を張る.
  3. こういった作業を続けていけば,キーワードによるネットワーク空間ができる.
  4. 後付けの言葉を使えばハブになっているようなキーワードを引っ張り上げてカテゴリーキーワードとする.

こういうハブ(僕は単にリンクがいっぱいあるキーワードなんて考えてた.言葉は大事だね)を持つネットワークをスケールフリーネットワークというのだそうだ.詳しい解説ははてなキーワードスケールフリーネットワークの項を参照のこと.
問題は1.2.のやり方で構築されたネットワークがスケールフリーネットワークになるかどうかで,むしろ相互に密接なつながりを持ち,お仲間のキーワード以外には接点を持たないみたいなネットワーク空間がいくつも構築されるんじゃないかという気がする.
それはそれでカテゴライズの参考にはなるが,そういう空間を探索するのは大変そう.ネットワーク処理なんて分野はあるんだろうか?
たぶん先行事例もあるだろうし,自分で実験する手もあるな.問題は技術的な方面で遊ぶ余力が現状ないところにあるけど.

追記
リンク数は単純に数にしないほうがいいか.log?
追記
キーワード抽出はBulkfeedsをお借りして,対象はこの日記にして<-何を考えている?
追記
ネットワークで検索するからわからないんやん.グラフ理論か.ページランクなんかと根っこは同じか.
追記
都会人の特権を生かして明日は神保町だね.

[permalink][contents][page top]