Trekシリーズの画像を持ってくるEFT
世界の風景画像などの投稿サイトTrekシリーズ(TrekEarth、TrekNature、TrekLens)から画像を抽出するEFT。これどのくらいニーズあるんだろ?
author: Toshi custom_feed_handle: http://www\.trek[a-z]+\.com/gallery/* custom_feed_follow_link: /gallery/[A-Za-z_\-]+?/[A-Za-z_\-]+?/photo handle: http://www\.trek[a-z]+\.com/gallery/[A-Za-z_\-]+?/[A-Za-z_\-]+?/photo extract: <h1>(.*?)</h1></td></tr>.*?<tr><td colspan="2" align="center">(<img src="[^"]+?" [^>]+?>) extract_capture: body1 body2 extract_after_hook: $data->{body} = $data->{body1} . $data->{body2};
config.yaml
plugins: - module: Subscription::Config config: feed: - http://www.trekearth.com/gallery/page1.htm - http://www.treklens.com/gallery/page1.htm - http://www.treknature.com/gallery/page1.htm - module: Filter::Rule rule: module: Deduped path: /PATH/dedupe-trek.db - module: Filter::EntryFullText # - module: Filter::FindEnclosures # - module: Filter::FetchEnclosure # config: # dir: /home/toshi/plagger/tmp/images/ # fake_referer: 1 - module: Publish::Gmail config: # attach_enclosures: 1 mailto: xxx@gmail.com mailfrom: xxx+trek@gmail.com
URLに関しては「page1.htm」が最新のサムネイル、2番目が「page2.htm」ってな具合になってるので、適当に読み込みを考えると良いと思います。
コメントアウトしてるところ(行頭に#のとこ)は画像を添付ファイルにするための部分。画像の読み込みが遅くていらいらしたりしたら添付してみると良いと思います。すぐに容量がすごいことになりそうだけど。画像をどっかにため込んでおいてそれを自分で見るようにした方が良いのかな? さすがに見られる状態にしておくのはまずいしなー。