「面白いけれど、常時巡回するほどじゃないかな」というページは、ソーシャルブックマークの「del.icio.us」に登録していますの部分がピンとこねぇー、という人が居たので解説してみたり。
要するにPlaggerのexamples/atode.yamlという「あとで読む」レシピからタグ指定部分を外して応用しただけ。
global:
# Set timezone to Tokyo
timezone: Asia/Tokyo
plugins:
- module: Subscription::Config
config:
feed:
- http://del.icio.us/rss/otsune
- module: Filter::ResolveRelativeLink
- module: Filter::Rule
rule:
module: Deduped
- module: Filter::EntryFullText
config:
store_html_on_failure: 1
- module: Filter::BreakEntriesToFeeds
- module: Publish::Gmail
config:
mailto: otsune+delicious@example.com
mailfrom: otsune@example.com
これが何をやっているのかというと。まずhttp://del.icio.us/rss/otsuneというオレのブックマークのRSSを巡回して、Filter::RuleのDedupeで同じurlは除外して、EntryFullTextでブックマークしたWebサイトを取得する(store_html_on_failureで、切り出しに失敗してもWebページ全体を強引に取ってくる)。それをBreakEntriesToFeedsで1サイト1メールにして、Gmailに送るようにしている。もしはてなブックマークを巡回元にしたいのであれば
global:
# Set timezone to Tokyo
timezone: Asia/Tokyo
plugins:
- module: Subscription::Config
config:
feed:
- http://b.hatena.ne.jp/otsune/atomfeed
- module: Filter::AtomLinkRelated
- module: Filter::Rule
rule:
module: Deduped
- module: Filter::EntryFullText
config:
store_html_on_failure: 1
- module: Filter::BreakEntriesToFeeds
- module: Publish::Gmail
config:
mailto: otsune+hateb@example.com
mailfrom: otsune@example.com
という感じかな。これを定期的に自動実行させておけば、ブックマークしたWebサイトの文章をメールにして集めておける。つまりGmailに送っておけば「自分が巡回したWebサイトだけを全文検索したい」という検索ができる。
+hatebで拡張メールアドレスにしているのは、Gmail側でフィルター振り分けしやすいようにするため。Skip Inboxすれば通常利用のメールとも混在しない。
(あとPublish::Gmailはネーミングのせいで誤解されているかもしれないが、Gmail以外のどんなメールに送ってもかまわない。ついでに、自分でサーバーを持っている人は、Search::Estraierなどを使えばGmailに頼らずに自力で全文検索環境が構築出来る。社内サイトやプライベートな文章を検索するときはそれを使っている)

[ コメントする ]