bloglinesの怪

しかしいつのまにかBloglinesRSSフィードがない普通のWebサイトでも登録できるようになっているので、そっちに登録してみる。

この件についてid:otsuneさんから「MyRSS.jpとかbulknews.netのsyndicateみたいな変換ゲートウェイRSSを生成したものを誰かが登録していると、そのurlをAddするときに認識してbloglinesでも巡回できるようです」というコメントを頂いたのであるが、実は本当にFeedとしてhtmlが登録されてしまったのである。
Edit Subscriptionのところで確認してみたが、Feed URLがXXXXXX/diary.htmlとなっているのだ。
ソースを確認してみたが、XMLですらないHTML 4.01 Transitionalなので、これがなんでRSS Feedとして認識されたのかは謎である。
試しに他の純粋HTMLなWebサイトを登録してみようとしたが登録できなかった。でもこのサイトだけは一回RemoveしてからAddしてもちゃんと登録されるのだ。
で、当該サイトの日記が土曜日更新されたけれどBloglines上では、何の変化も起きなかった。というわけで本件はBloglinesの完全なBugということらしい。
しかし困ったな。で<meta name="ROBOTS" content="NOINDEX">が宣言されているのでI-know.jpのボットが見に行かないのだろうが、こういうところは検索エンジンのボットを拒否しているだけで、アンテナ型の巡回までは拒否しているわけではないだろうに。ここまで律儀なのはI-know.jpくらいじゃないかね。
有史以前(笑)から存在しているテキスト系の日記なのだが、こういうところはRSSも吐いてくれないし、I-Know.jpのアンテナが登録してくれないとなるとはてなを使い続ける理由が一つ増えたか。

追記

2 http://i-know.jp/system

壁に耳あり、障子に目あり、噂は千里を走る。あとなんかあった?

追記の追記

しかしBloglinesの件といい、あたしが読むサイトは地雷にはまるのかね。

追記の追記の追記

I Konw側の見解

追記
http://blog.i-know.jp/archives/2004/11/08/crawler/

別にうちが律義なわけでなくて、ロボット拒否のページをロボットが巡回しないことは当たり前だと思っていたのですが。ロボット拒否のページを取得しないようにがんばってきたのに、ロボット拒否のページが取れないからがんばれといわれるのはかなり複雑です。