2008/11/29(土)「好みの近いはてなブックマーカーを探そう」をリニューアル。

2008/11/29 18:08 開発日誌
はてブのリニューアルを記念して「好みの近いはてなブックマーカーを探そう」もリニューアルいたしました!
URLも変更になっています。

好みの近いはてなブックマーカーを探そう!
http://chikab.k52.org/
好みの近いはてなブックマーカーを探そう!


自分のid「nihonyamori」でやった結果がこちら↓



主なリニューアルポイントは下記の通りです。

■RSSの配信
結果をRSSで受信できるようにしました。RSSリーダーに登録しておくとだいたい2日に一度配信されます。

■単純な重複率ではなく、「2人きり度」を加味してランキング
ブックマークの傾向が近いと言っても、1000userをあつめた記事と10userしかブクマされてない記事とではブックマークが重複したことの重大さが異なりますので、少ないブクマ数の記事で重複した場合により強く評価する「2人きり度」という指数を導入しました。

■重複したブックマークと、それに対するコメントを掲載
どの記事でブックマークが重複したのかを一覧表示しました。あわせてそのブックマーカーのコメントも表示されるので、だいたいどんな人柄かを知るための目安になると思います。

■軽量化
キャッシュの多用の他、人気エントリーのようにブクマ数が多いものはあらかじめクロールしておくなど、頻繁にアクセスされても問題ないようになるべく軽量化に努めました。なので結果ページに直接リンクを貼ったりしてもらっても大丈夫です。その分最新の情報が反映されていないこともありますがご了承ください。(とはいっても相変わらず重たいことがありますのでその際はまったりお待ちください…)

ちなみに以前のバージョンでもそうでしたが、タグで絞り込んだ方がより興味の近いユーザがみつかると思いますのでお試しください。

実は私も今までお気に入り機能は全く使っていませんでした。
さっそく何名か入れてみてお気に入りページをチェックしているのですがやはり嗜好が合うのか、人気エントリーを見ているより面白いですね。

あと、しなもん描いてみました。…結構難しい。rikuoさんの方がうまいなあ。

ではでははてブお気に入りライフをお楽しみください!

好みの近いはてなブックマーカーを探そう!


20:02 追記)
ブックマーク、スター等ありがとうございます!
アクセスが集中するとたまに「xx件の情報が取得できませんでした」と出る場合があります。
その場合は「やり直す」をクリックしていただくと取得できなかった分だけ再調査します。
何度やっても「取得できません」が出る場合ははてなのサーバが混雑している場合がありますのでしばらくたってからまた「やり直す」をクリックしてみてください。

20:42 追記)
よかったら自分の結果をブックマークしてみてください。
ここに表示されます。

30日 9:21 追記)
現在はてなのRSSサーバが混雑しているのか、うまくデータを取得できずに止まってます。ご迷惑をおかけしております。しばらくしてから再度お試しください。
あと、id:morzさんのコメントを受けてボタンをクリックしたら不活性になるようにしました。アドバイスありがとうございます。

30日 13:12 追記)
11時ごろより停止中です。
レンタルサーバやさんのSQLサーバに負荷がかかりすぎてしまいました。
キャッシュをたくさん取った方が快適にアクセスできるだろうと思ってDBにキャッシュを詰め込みすぎてしまったのが原因です。本末転倒…。現在サーバやさんに問い合わせ中です。
せっかくアクセスしていただいたのに申し訳ないですがいましばらくお待ち下さい。

30日 17:24 追記)
復旧しました。
また重たくなることはあるかもしれませんが、一応稼働しています。

30日 20:01 追記)
19:00前後にまたエラーが頻発していたので若干CGIを書き換えました。
若干遅くなりますがエラーではじかれることは少なくなったはずです。

30日 22:58 追記)
安定して稼働しています。

1日 9:22 追記)
大文字小文字が区別できていませんでした。修正しました。id:coinlockerさんご指摘ありがとうございます。

3日 追記)
これが解消されてタグでの絞り込み機能が復活しました。

2008/11/27(木)はてブリニューアル後

2008/11/27 14:21 開発日誌
はてブがリニューアルしましたけど、まだいろいろ不安定なようです。特にレスポンスが異様に遅くてスクリプトがタイムアウトしてしまうことが多々あり、「じわじわ」とか「好みの近い~」とかまともに動いてません。仕様上は問題ないはずなのではてブが安定してくれば大丈夫なはず・・・。

あと、お気に入り機能が強化されたことでお気に入りを探すニーズが増えるかなーと思い「好みの近いはてなブックマーカーを探そう」もちょっとしたリニューアルを予定しています。もう作ってあるんですけど、新はてブが重くてあんまりちゃんと結果が帰ってこないのでしばらく様子見です・・・。

2008/11/05(水)はてなブックマーク2 公開後のサービス継続について

2008/11/05 21:57 開発日誌
早速随所ではてなブックマーク新バージョンの報告がされていますね。
私としてははてブの使い勝手そのもの以外に「じわじわ来てるエントリー」とか「好みの近いはてなブックマーカーを探そう」が今の仕様のまま継続できるかどうかが主な関心事だったりするのですが、IDEA*IDEAさんのところの報告によると「API、RSSの仕様変更はなし。いままでそれを使ってサービスを作った人に特に影響はないだろう、とのこと。」ということでAPI、RSSまわりは今まで通り使えそうです。
スクレイピングで処理している部分もあるので、デザイン変更によってその辺の調整が必要になるかもしれません。25日のリニューアル後、上記2つのサービスの動作に支障が出る可能性もありますがあらかじめご了承ください。なるべく早く調整いたします。

ちなみに、本家で似たような機能が実装されてお役ご免になるかも…!なんて可能性も考えていたのですが、いまのところそれは無いようなので継続して提供してまいります。

2008/11/02(日)Firefoxでソースが表示されてしまう

2008/11/02 16:17 覚え書き
Firefoxで一望amazonを見るとHTMLソースが表示されてしまっている、との指摘がユーザーの方からありました。
HTTPヘッダの記述が間違っていたのが原因で、至急修正しました。
10/12に30件表示に対応した際のミスです。

前にも一度遭遇した現象なのでメモ。

下記の通り、Set-CookieをContent-typeの前に書いていたのが原因でした。
正しくはContent-typeを出してからSet-Cookie。
print "Set-Cookie: ~~\n\n";
print "Content-type: text/html; charset=UTF-8\n";
最近Firefoxでの確認を怠っていてSleipnirでだけ見ていたので全然気づいていませんでした。
教えていただいた方に感謝です。
アクセスログを見る限り、SafariやOperaでも同じ状態だった模様。
IE以外でアクセスしていた方、申し訳ありませんでした…。

#というかIE以外ってみんなきっちりヘッダ通りに動作するんですね…。IEが適当過ぎなのか…。

ちなみに一望amazonではクッキーは10件表示か30件表示かを保持するために使っています。
一度30件表示を設定すると、再度アクセスした場合も30件で表示されます。

2008/10/27(月)amazonの「注目商品」と「炎上商品」

2008/10/27 19:13 開発日誌
一望amazonで「注目商品」と「炎上商品」を見られるようにしました。

総評点300以上の注目商品総評点-200以下の炎上商品

一望amazonでは、レビューとレビューに対する「参考になった」票の数から「総評点」という独自の指標を算出して掲載しているのですが、その総評点が300点以上のものを「注目商品」、マイナス200点以下のものを「炎上商品」と命名してまとめて見られるようにしました。
良くも悪くもレビューがにぎわっている商品がよくわかります。

総評点300点以上の「注目商品」
総評点マイナス200点以下の「炎上商品」

本当なら総評点で商品をソートできるのが一番便利なのでしょうけど、仕様上難しいため、代わりにこのような形で実装した次第です。

それぞれの商品数はこんな感じ。

洋書の注目商品が結構あるのが驚きでした。国際的な方多いんですね…。

ちなみに、一望amazonでチェックされた商品の中で300以上or-200以下のものがあったらストックしていく、という形で情報を収集していますので、amazon全商品を網羅できているわけではありません。あしからず。

なにげなく眺めているだけでも面白いのでぜひご活用ください。
総評点300点以上の「注目商品」
総評点マイナス200点以下の「炎上商品」

2008/10/14(火)一望amazonでまとめて30件表示できるようになりました。

2008/10/14 14:24 開発日誌
一望amazonで1ページに30件表示できるようになりました。

amazon Webサービスでは1回のリクエストで10件までしか取得できず、かつ1秒以内に連続アクセスしないように、という規約があるので、これまで表示件数は10件に固定していました。
以前、メールで「1回の表示件数を増やしてほしい」と要望をいただいたこともあり、多少表示が遅くてもまとめて見られるメリットはあるだろうということで、1ページに30件表示できるようにいたしました。
上記規約の通り、amazonへのリクエストには最低1秒間の間隔をあけていますので、30件表示の場合は時間がかかることをご了承ください。
なお、10件/30件の選択はcookieで保存されますので、再度一望amazonにアクセスした場合でも選択し直す必要はありません。

あと、これまでレビューには最近の15件を表示していましたが、「最も有効と判断された」順で15件まで、に変更しました。なので総評点など、若干変わっていると思います。
「最も有効と判断された」順というのは、「このレビューが参考になった票数」-「参考にならなかった票数」の値でソートした順です。amazon Webサービスの仕様で言うとReviewSortに-Rankを指定した結果です。ちなみにReviewSortにHelpfulVoteを指定した場合は単純に「参考になった票数」が多い順になる模様です。

10/15追記
違った。「最も有効と判断された」順というのは「このレビューが参考になった票数」-「参考にならなかった票数」ではない模様。ちょっと基準がはっきりしませんが、amazonのページで「有用性の高い順」で並べたときと同じ順番です。

2008/10/06(月)amazon Webサービスでsortを指定しないとキーワード関連順になる?

2008/10/06 13:36 覚え書き
前エントリで修正した件について。
amazon Webサービスでsortを指定しない場合のデフォルト動作は「売り上げ順」だと思っていたのですが、検索キーワードがある場合のデフォルトは「キーワード関連順」になる模様。
しかし明示的に「キーワード関連順」にしたい場合、&Sort=xxxに指定すべき値が見あたらない。
要はリクエストに&Sort=xxxの指定がなければ「キーワード関連順」、指定があればその指定に沿ってソート、という仕様らしい。じゃあ、「キーワード関連順」にしたい場合は「&Sort=」と空にしておけばいいのかというと、Sortは空だとエラーになってしまうのでだめ。Sortパラメータそのものを書いてはいけないらしい。

いまいちはっきりしないですが、いろいろ試した感じではそんなところでした。

まとめ
・Sortパラメータが空 → エラー!
・Sortパラメータを指定しない
  →検索キーワードあり → キーワード関連順(Sortに対する値は用意されていない)
  →検索キーワードなし → 売り上げ順(Sort=salesrank)
OK キャンセル 確認 その他