2003年12月11日

毎日のニュースチェックツールに求めるものこのエントリーを含むはてなブックマークこのエントリーをはてなブックマークに追加


スポンサード リンク

■Bulknewsと私

Bulknewsの宮川さんと初めてお話した。日本のRSS技術実用化の第一人者の人である。宮川さん自身は上場ベンチャーの技術担当役員で、表の顔ではPerl言語使いとして有名である。世界のPerlモジュールレジストリCPANへも多数のコード(世界一という説あり)を登録されていて、XML+Perl分野では国際的にも名前が知られている。そもそも、宮川さんが始められた頃というのは、まだWebサイトのメタデータに注目する人は少なかったし、国内に情報はほとんど皆無だった。先見の明と実装技術ありまくりである。

・Bulknews
http://bulknews.net/
・Perlユーザコミュニティ
http://shibuya.pm.org/

ご存知でない方に説明すると、Bulknewsはニュースポータルである。外部のたくさんのニュースサイトをロボット巡回してHTMLを取得し、そこから記事の見出しやURL情報をXML形式に変換してデータベース化している。

私はBulknewsが開始された頃から知っていた。で、宮川さんには内緒で2001年ごろ、Bulknews専用RSSリーダーを自作し、未来のWebはこうなるのだ!とか、人に見せてはプレゼンしていた。アプリケーションは私の作でも、元のデータは宮川さんが作っていたわけで、とりあえず、今回、謝った(笑)。

宮川さんの正式な許可を頂いたので当時作ったアプリケーションを公開してしまう。2年前のコードを引っ張り出してきたのでサポートは一切できない。

・DS_News.exe For Windows(画面例のレイアウトはマニュアル操作。後で解説)
dsnewssmall02.JPG
ここをクリックするとダウンロード file

使い方は起動してスタートボタンを押すと最近のITニュース一覧が表示される。気になるタイトルをクリックすると右側に内部ウィンドウとしてWebが表示される。

基本機能は今では当たり前のRSSリーダーと同じだが、少し違うのは、

・閲覧中のWebページを整列させて比較できる
・メモ欄がついていてユーザがコメントを書くことができ、
・メモつきでURLとタイトル情報をボタン一つで誰かにメール転送できる

という程度だろうか。一応ニュースチェックには今でも使えると思う。技術的には陳腐だが、これでも2001年ごろは情報が少なくてがんばって作ったのだ。

現在の代表的なRSSリーダーをふたつ紹介。

・Glucose
http://glucose.dip.jp/Zope
日本発の高機能RSSリーダー。トラックバック情報まで表示できる。P2Pを使った情報交換機能も実験的に搭載されている。

・Sharpreader
http://www.sharpreader.com/
米国製だが日本語も表示可能な代表的ニュースチェッカー。

そもそもRSSリーダーなんぞや?という方はこちら。ツール大紹介。
・blogを始めよう!!現在流行しているblogの魅力に迫る!
http://www.forest.impress.co.jp/article/2003/12/11/blog.html

■現在のRSSリーダーに欠けているもの

一応便利なRSSリーダーだが、個人的には不満も多い。登録するニュースサイトの数が増えて数万件もデータベース化してしまうと、情報洪水で、どれを読んでよいのか分からなくなるのだ。

これは私の例だけれどニュースサイトを登録しすぎてこんなことになってしまう。もう読めない。


sharpr02.JPGクリックで拡大

1 情報の意味のあるレイアウト表示

現状のRSSリーダーの一般的な表示はこんなかんじである。

これでは正直、大量のニュースを一覧できても、気になるニュースを見つけることができない。登録キーワードにマッチしたものだけを表示させる機能があるが、これでは新しい発見をすることが難しい。

紙の新聞は重要度に応じて記事の占める面積や配置、見出し修飾を慎重に選んで決めている。もしすべての記事が同列に並んでいたら、新聞も読む気がしないはずである。理想的なのは米国のGoogleNewsのように、言語処理のAIを使って、自動的に最適なレイアウトとデザインを作ることだ。

・GoogleNews
http://news.google.com/

2 オーバービュー&フォーカス(全体俯瞰と部分注視)機能

現状のRSSリーダーは、詳細な情報を見ようとするとBlogサイトを表示するしかない。これではウィンドウをいくつも立ち上げてWebを見るのと大差がなくなる。RSSリーダー内で見出しの発見から詳細記事の確認までを簡単に出来て欲しいと、感じる。大量の情報の全体と部分を見るインタフェースのことである。

上記2点に関係する研究を2つ紹介する。

■毎日のニュースチェックの効率化の研究

米国マイクロソフトリサーチは、巡回ニュースチェックの効率化について興味深い研究をしている。複数のニュースサイトから記事を1ページに集約したスタートページを数種類つくり、ユーザの使い勝手を評価した。

・Web Montage: A Dynamic Personalized Start Page
 Webモンタージュ:ダイナミックで個人最適化したスタートページ
http://research.microsoft.com/~horvitz/montage/montage-www.htm

本論分では、3つの仮説を検証している。

仮説1:ユーザは1クリックで巡回チェックしたい目的ページへ到達することを望んでいる。(コンテンツを発見する努力を最小化したい)

仮説2:情報を探す文脈に基づいたリンク情報とコンテンツ表示によって、巡回チェックを便利にすることができる。

仮説3:過去のアクセスのパターンから、以後のWeb閲覧行動を予測できる。
ユーザはランダムにページにアクセスしているわけではなく、一度見た信頼できるページを繰り返し訪問する傾向があると考えられる。

意外にもユーザに選ばれたのは、見出しリンクのみの最もシンプルなデザインだった。リッチすぎるスタートページは人気がない。また昼間はビジネス、夜はスポーツ記事を多めにするなど時間帯や、デスクトップ作業状態などに応じて内容が変わっても良いのでは?といった示唆がある。

■オーバービュー&フォーカス

・Detecting Web Page Structure for Adaptive Viewing on Small Form Factor Devices
http://www2003.org/cdrom/papers/refereed/p297/p297-chen.htm
p297-chen-01.jpg

RSSによるニュースサイトからの収集は基本的にページが単位である。しかし、ユーザは必ずしも1ページのすべてを必要としているわけではない。ここでは、PDAの小さな画面で、PC用のニュースサイトを手早くチェックするためのコンテンツ抽出技術が研究されている。このインタフェースはいいなと思った。情報全体と部分をいったりきたりできる。

私が欲しいニュースチェッカーはつまり、

1 複数のニュースサイトからニュースが集約されて
2 新聞のような意味のあるレイアウトと修飾が施されて
3 全体を眺めたり、個別記事を読んだりが容易にできる

というもの。早く誰か作ってくれないかな。皆さんはどんなニュースチェッカーを使いたいですか?。

■XMLビジネス白書をよろしく、Perlデータマンジングいいです。

ところで、この記事において頻繁にでてきたRSSというキーワード。私は先日発売されたばかりのXMLビジネス白書において、その技術の最新事情(ブログ利用)と歴史、統計、今後の展望について4ページの要約記事を書いている。興味のある方はぜひ読んでいただきたい。

・XML MAGAZINE Special Issue XMLビジネス白書 2004(翔泳社)

12章 WeblogにみるRSS/RDFの活用動向/橋本大也

それから宮川さんは、こんな書籍を翻訳されている。

・Perlデータマンジング―データ加工のテクニック集
4894715589.09.MZZZZZZZ.jpg

「データマンジング」とは、本書によると「あるフォーマットのデータを受け取り、その他のフォーマットに変換することすべて」を表す。例えばテキスト、CSV、HTML、XMLなどの相互変換の話である。私は発売日に買って以来、自宅のマシンの横に置いて参考にしている。多様な形式変換のバリエーションが、ここまでまとまって読める本は他に知らない。Perlで文書処理を行う人、Perl+XMLシステムの設計者必携。


スポンサード リンク

Posted by daiya at 2003年12月11日 23:59 | TrackBack このエントリーを含むはてなブックマークこのエントリーをはてなブックマークに追加
Daiya Hashimoto. Get yours at bighugelabs.com/flickr
Comments

「情報洪水で、どれを読んでよいか分からなくなる」については、ReadOneというRSSリーダの技術に期待してます。 http://www.readone.net/ 作ってるの大学生です(すごいなあ)。ツールバーじゃなくてエクスプローラバーっていうところに、光るセンスを感じます。
このソフトは、ユーザが「どれを読んだか(クリック履歴)」によって学習してくれるらしいです。推薦機能があるらしい。
(試したけどすぐにアンインストールしたので学習の効果は不明)
、、、て書いてから思ったんですけど、まさにデータセクション社の得意領域でしたね。失礼しましたー

Posted by: zerobase at 2003年12月12日 07:05

Glucoseを作っているのも学生です。僕と同じ大学・学科の後輩が、たしか1年生のころから作っていたものだったと思います。

Posted by: shima at 2003年12月13日 00:43

zerobaseさん、こんにちは。

実はReadoneの作者さんとは来週会うんですよ。面白いソフトですよね。やはりユーザの履歴から関心を読み取るっていうのがいいのかも。

shimaさん、まいど。

Glucoseの開発チームとはよく会っています。たぶん、忘年会議にも出席するとのことです。

Posted by: daiya at 2003年12月13日 18:51

どうもです。
今日(金曜)の夜、たまたま、glucoseの大向さんと初めて会いました。べつにネット業界とは関係ないい業種交流会です。世の中せまいなあ。だって、おとといの忘年会議2次会にて、隣のテーブルにいた人です。出会うべくして会ったのかなとw

Posted by: zerobase at 2003年12月20日 06:35