hns - 日記自動生成システム - Version 2.19.7

void GraphicWizardsLair( void ); //

otsune GWL
FreeBSD, AfterEffects, RETAS, animo, DigitalAnime, Linux, Mac OS, Win2k

[Who is otsune?] [title] [message] [Policy] [注目エントリー] [top]
Twitter Status :


Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい

検索式:

先月 2006年08月 来月
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31


2006年08月11日(金) [長年日記]

#2 [plagger] 「あとで読む」じゃなくて「あとで読んだところ全部から探す」をPlaggerでやる方法

「とりあえずググる」を卒業!TOPエンジニアの検索術/Tech総研_ の反応が各地で見られたけど
「面白いけれど、常時巡回するほどじゃないかな」というページは、ソーシャルブックマークの「del.icio.us」に登録しています
の部分がピンとこねぇー、という人が居たので解説してみたり。
要するにPlaggerのexamples/atode.yamlという「あとで読む」レシピからタグ指定部分を外して応用しただけ。
global:
  # Set timezone to Tokyo
  timezone: Asia/Tokyo

plugins:
  - module: Subscription::Config
    config:
      feed:
        - http://del.icio.us/rss/otsune

  - module: Filter::ResolveRelativeLink
  - module: Filter::Rule
    rule:
      module: Deduped

  - module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

  - module: Filter::BreakEntriesToFeeds
  
  - module: Publish::Gmail
    config:
      mailto: otsune+delicious@example.com
      mailfrom: otsune@example.com
これが何をやっているのかというと。まずhttp://del.icio.us/rss/otsuneというオレのブックマークのRSSを巡回して、Filter::RuleのDedupeで同じurlは除外して、EntryFullTextでブックマークしたWebサイトを取得する(store_html_on_failureで、切り出しに失敗してもWebページ全体を強引に取ってくる)。それをBreakEntriesToFeedsで1サイト1メールにして、Gmailに送るようにしている。
もしはてなブックマークを巡回元にしたいのであれば
global:
  # Set timezone to Tokyo
  timezone: Asia/Tokyo

plugins:
  - module: Subscription::Config
    config:
      feed:
        - http://b.hatena.ne.jp/otsune/atomfeed

  - module: Filter::AtomLinkRelated
  - module: Filter::Rule
    rule:
      module: Deduped

  - module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

  - module: Filter::BreakEntriesToFeeds
  
  - module: Publish::Gmail
    config:
      mailto: otsune+hateb@example.com
      mailfrom: otsune@example.com
という感じかな。
これを定期的に自動実行させておけば、ブックマークしたWebサイトの文章をメールにして集めておける。つまりGmailに送っておけば「自分が巡回したWebサイトだけを全文検索したい」という検索ができる。
+hatebで拡張メールアドレスにしているのは、Gmail側でフィルター振り分けしやすいようにするため。Skip Inboxすれば通常利用のメールとも混在しない。
(あとPublish::Gmailはネーミングのせいで誤解されているかもしれないが、Gmail以外のどんなメールに送ってもかまわない。ついでに、自分でサーバーを持っている人は、Search::Estraierなどを使えばGmailに頼らずに自力で全文検索環境が構築出来る。社内サイトやプライベートな文章を検索するときはそれを使っている)
Permalink: http://www.otsune.com/diary/2006/08/11/2.html#200608112
trackback
このエントリーを含むはてなブックマーク del.icio.us livedoor Clip View blog reactions
Last Updated 2006-08-11 00:00:00 By otsune