2008/12/29(月)「この人も好きかも」の今後の予定

2008/12/29 19:39 開発日誌
この人も好きかも!」が思ったより好評で嬉しい限りです。ありがとうございます。

あちこちの感想などでも指摘されていますが、「メジャーな人の名前ばかり出やすい」という側面はどうしてもあります。作家さんの名前で調査すると明らかに村上春樹さんや宮部みゆきさんが出すぎな感がありますし。
ただ、リストマニアを使っている以上、この点は機械的にはあまり改善できないかなと思っているので、結果に対してユーザが投票できるようなしくみも考えています。リストマニアによる機械的な調査に加えてユーザからのフィードバックがあれば面白いつながりも見えてくるのではないかと。

ほんとはユーザ投票まで実装して出すつもりだったのですが、途中でモチベーションが下がってしまってダラダラな開発状態になってしまったので公開しちゃいました。よく言われることですがネットサービスは公開までに時間をかけすぎると効率が下がってしまいますね…。

<今後の予定>
・ユーザ投票
・ケータイ版
・API(いるかな…?)

あと、入力する人名は俳優でも政治家でも何でもいいのですが(というかamazonを検索しているだけなので別に人名ですらなくても構わないのですが)、あまりいい結果にはなりませんのでご了承ください。

2008/12/24(水)好きな人から人を探す人物レコメンドサービス「この人も好きかも!」を公開しました。

2008/12/24 13:53 開発日誌
こちらを公開しました。
この人も好きかも!
この人も好きかも! ~ 「好きな人」から人を探す人物レコメンドサービス


好きな作家、漫画家、ミュージシャンなど、クリエーターの名前を入力すると、その人と作品の傾向が近い人物を「好きになれそうな人」としてランキング形式で紹介するサービスです。

例えば、私は漫画だと岡崎二郎さんが好きなのですが、「岡崎二郎」を入力するとこんな感じのランキングになります。↓


(画像クリックでジャンプ)

ランキングを見ると読んだことのない漫画家さんも多いですが、2位のご存じ藤子不二雄さんと7位の芦奈野さんのヨコハマ買い出し紀行は好きなのでなかなか的確なのではないかと。
1位の幸村さんは知らなかったのですが、作品の解説など見るとなるほど岡崎さんに近そうですね。今度ちょっと読んでみようかな・・・
とまあこんな具合で、自分の「好きな人」を起点に他の人の作品へと手を広げるのに役立つのではないか、というわけです。

仕組みとしてはamazonのリストマニアを利用しています。入力された人名の商品をリストしている人たちが他にどんな人物の商品をリストしているか?を調査して点数付けを行っています。

で、ちょっとうまくいってない部分もあるのでベータ版としました。
今わかっている問題点として、「日本名と英語名を別人物として扱ってしまう」というのがあります。例えば「ニコラコンテ」で調査すると「Nicola Conte」がランキングに出てきてしまいます。amazonの人名データに表記のゆれがあるためなのですが、人名のデータベースをちゃんと自前で持たないと解決しないかな~と思ってます。他にも同姓同名を区別できないなどいろいろあるのですが、すぐには対処できないのでそのまま公開しちゃいました。この辺はお見逃しください。

なるべく多くのデータをキャッシュとして取っていますが、キャッシュのない人名については表示までに時間がかかりますのでその点はご了承ください。一度表示すればそのあとはスムーズにアクセスできるはずです。

ではでは、どうぞご利用ください。
この人も好きかも!

2008/11/29(土)「好みの近いはてなブックマーカーを探そう」をリニューアル。

2008/11/29 18:08 開発日誌
はてブのリニューアルを記念して「好みの近いはてなブックマーカーを探そう」もリニューアルいたしました!
URLも変更になっています。

好みの近いはてなブックマーカーを探そう!
http://chikab.k52.org/
好みの近いはてなブックマーカーを探そう!


自分のid「nihonyamori」でやった結果がこちら↓



主なリニューアルポイントは下記の通りです。

■RSSの配信
結果をRSSで受信できるようにしました。RSSリーダーに登録しておくとだいたい2日に一度配信されます。

■単純な重複率ではなく、「2人きり度」を加味してランキング
ブックマークの傾向が近いと言っても、1000userをあつめた記事と10userしかブクマされてない記事とではブックマークが重複したことの重大さが異なりますので、少ないブクマ数の記事で重複した場合により強く評価する「2人きり度」という指数を導入しました。

■重複したブックマークと、それに対するコメントを掲載
どの記事でブックマークが重複したのかを一覧表示しました。あわせてそのブックマーカーのコメントも表示されるので、だいたいどんな人柄かを知るための目安になると思います。

■軽量化
キャッシュの多用の他、人気エントリーのようにブクマ数が多いものはあらかじめクロールしておくなど、頻繁にアクセスされても問題ないようになるべく軽量化に努めました。なので結果ページに直接リンクを貼ったりしてもらっても大丈夫です。その分最新の情報が反映されていないこともありますがご了承ください。(とはいっても相変わらず重たいことがありますのでその際はまったりお待ちください…)

ちなみに以前のバージョンでもそうでしたが、タグで絞り込んだ方がより興味の近いユーザがみつかると思いますのでお試しください。

実は私も今までお気に入り機能は全く使っていませんでした。
さっそく何名か入れてみてお気に入りページをチェックしているのですがやはり嗜好が合うのか、人気エントリーを見ているより面白いですね。

あと、しなもん描いてみました。…結構難しい。rikuoさんの方がうまいなあ。

ではでははてブお気に入りライフをお楽しみください!

好みの近いはてなブックマーカーを探そう!


20:02 追記)
ブックマーク、スター等ありがとうございます!
アクセスが集中するとたまに「xx件の情報が取得できませんでした」と出る場合があります。
その場合は「やり直す」をクリックしていただくと取得できなかった分だけ再調査します。
何度やっても「取得できません」が出る場合ははてなのサーバが混雑している場合がありますのでしばらくたってからまた「やり直す」をクリックしてみてください。

20:42 追記)
よかったら自分の結果をブックマークしてみてください。
ここに表示されます。

30日 9:21 追記)
現在はてなのRSSサーバが混雑しているのか、うまくデータを取得できずに止まってます。ご迷惑をおかけしております。しばらくしてから再度お試しください。
あと、id:morzさんのコメントを受けてボタンをクリックしたら不活性になるようにしました。アドバイスありがとうございます。

30日 13:12 追記)
11時ごろより停止中です。
レンタルサーバやさんのSQLサーバに負荷がかかりすぎてしまいました。
キャッシュをたくさん取った方が快適にアクセスできるだろうと思ってDBにキャッシュを詰め込みすぎてしまったのが原因です。本末転倒…。現在サーバやさんに問い合わせ中です。
せっかくアクセスしていただいたのに申し訳ないですがいましばらくお待ち下さい。

30日 17:24 追記)
復旧しました。
また重たくなることはあるかもしれませんが、一応稼働しています。

30日 20:01 追記)
19:00前後にまたエラーが頻発していたので若干CGIを書き換えました。
若干遅くなりますがエラーではじかれることは少なくなったはずです。

30日 22:58 追記)
安定して稼働しています。

1日 9:22 追記)
大文字小文字が区別できていませんでした。修正しました。id:coinlockerさんご指摘ありがとうございます。

3日 追記)
これが解消されてタグでの絞り込み機能が復活しました。

2008/11/27(木)はてブリニューアル後

2008/11/27 14:21 開発日誌
はてブがリニューアルしましたけど、まだいろいろ不安定なようです。特にレスポンスが異様に遅くてスクリプトがタイムアウトしてしまうことが多々あり、「じわじわ」とか「好みの近い~」とかまともに動いてません。仕様上は問題ないはずなのではてブが安定してくれば大丈夫なはず・・・。

あと、お気に入り機能が強化されたことでお気に入りを探すニーズが増えるかなーと思い「好みの近いはてなブックマーカーを探そう」もちょっとしたリニューアルを予定しています。もう作ってあるんですけど、新はてブが重くてあんまりちゃんと結果が帰ってこないのでしばらく様子見です・・・。

2008/11/05(水)はてなブックマーク2 公開後のサービス継続について

2008/11/05 21:57 開発日誌
早速随所ではてなブックマーク新バージョンの報告がされていますね。
私としてははてブの使い勝手そのもの以外に「じわじわ来てるエントリー」とか「好みの近いはてなブックマーカーを探そう」が今の仕様のまま継続できるかどうかが主な関心事だったりするのですが、IDEA*IDEAさんのところの報告によると「API、RSSの仕様変更はなし。いままでそれを使ってサービスを作った人に特に影響はないだろう、とのこと。」ということでAPI、RSSまわりは今まで通り使えそうです。
スクレイピングで処理している部分もあるので、デザイン変更によってその辺の調整が必要になるかもしれません。25日のリニューアル後、上記2つのサービスの動作に支障が出る可能性もありますがあらかじめご了承ください。なるべく早く調整いたします。

ちなみに、本家で似たような機能が実装されてお役ご免になるかも…!なんて可能性も考えていたのですが、いまのところそれは無いようなので継続して提供してまいります。

2008/11/02(日)Firefoxでソースが表示されてしまう

2008/11/02 16:17 覚え書き
Firefoxで一望amazonを見るとHTMLソースが表示されてしまっている、との指摘がユーザーの方からありました。
HTTPヘッダの記述が間違っていたのが原因で、至急修正しました。
10/12に30件表示に対応した際のミスです。

前にも一度遭遇した現象なのでメモ。

下記の通り、Set-CookieをContent-typeの前に書いていたのが原因でした。
正しくはContent-typeを出してからSet-Cookie。
print "Set-Cookie: ~~\n\n";
print "Content-type: text/html; charset=UTF-8\n";
最近Firefoxでの確認を怠っていてSleipnirでだけ見ていたので全然気づいていませんでした。
教えていただいた方に感謝です。
アクセスログを見る限り、SafariやOperaでも同じ状態だった模様。
IE以外でアクセスしていた方、申し訳ありませんでした…。

#というかIE以外ってみんなきっちりヘッダ通りに動作するんですね…。IEが適当過ぎなのか…。

ちなみに一望amazonではクッキーは10件表示か30件表示かを保持するために使っています。
一度30件表示を設定すると、再度アクセスした場合も30件で表示されます。

2008/10/27(月)amazonの「注目商品」と「炎上商品」

2008/10/27 19:13 開発日誌
一望amazonで「注目商品」と「炎上商品」を見られるようにしました。

総評点300以上の注目商品総評点-200以下の炎上商品

一望amazonでは、レビューとレビューに対する「参考になった」票の数から「総評点」という独自の指標を算出して掲載しているのですが、その総評点が300点以上のものを「注目商品」、マイナス200点以下のものを「炎上商品」と命名してまとめて見られるようにしました。
良くも悪くもレビューがにぎわっている商品がよくわかります。

総評点300点以上の「注目商品」
総評点マイナス200点以下の「炎上商品」

本当なら総評点で商品をソートできるのが一番便利なのでしょうけど、仕様上難しいため、代わりにこのような形で実装した次第です。

それぞれの商品数はこんな感じ。

洋書の注目商品が結構あるのが驚きでした。国際的な方多いんですね…。

ちなみに、一望amazonでチェックされた商品の中で300以上or-200以下のものがあったらストックしていく、という形で情報を収集していますので、amazon全商品を網羅できているわけではありません。あしからず。

なにげなく眺めているだけでも面白いのでぜひご活用ください。
総評点300点以上の「注目商品」
総評点マイナス200点以下の「炎上商品」