読者です 読者をやめる 読者になる 読者になる

Trekシリーズの画像を持ってくるEFT

Plagger

世界の風景画像などの投稿サイトTrekシリーズ(TrekEarthTrekNatureTrekLens)から画像を抽出するEFT。これどのくらいニーズあるんだろ?

trek.yaml

author: Toshi
custom_feed_handle: http://www\.trek[a-z]+\.com/gallery/*
custom_feed_follow_link: /gallery/[A-Za-z_\-]+?/[A-Za-z_\-]+?/photo
handle: http://www\.trek[a-z]+\.com/gallery/[A-Za-z_\-]+?/[A-Za-z_\-]+?/photo
extract: <h1>(.*?)</h1></td></tr>.*?<tr><td  colspan="2" align="center">(<img src="[^"]+?" [^>]+?>)
extract_capture: body1 body2
extract_after_hook: $data->{body} = $data->{body1} . $data->{body2};

config.yaml

plugins:
  - module: Subscription::Config
    config:
      feed:
        - http://www.trekearth.com/gallery/page1.htm
        - http://www.treklens.com/gallery/page1.htm
        - http://www.treknature.com/gallery/page1.htm

  - module: Filter::Rule
    rule:
      module: Deduped
      path: /PATH/dedupe-trek.db

  - module: Filter::EntryFullText

#  - module: Filter::FindEnclosures
#  - module: Filter::FetchEnclosure
#    config:
#      dir: /home/toshi/plagger/tmp/images/
#      fake_referer: 1

  - module: Publish::Gmail
    config:
#      attach_enclosures: 1
      mailto:   xxx@gmail.com
      mailfrom: xxx+trek@gmail.com

URLに関しては「page1.htm」が最新のサムネイル、2番目が「page2.htm」ってな具合になってるので、適当に読み込みを考えると良いと思います。
コメントアウトしてるところ(行頭に#のとこ)は画像を添付ファイルにするための部分。画像の読み込みが遅くていらいらしたりしたら添付してみると良いと思います。すぐに容量がすごいことになりそうだけど。画像をどっかにため込んでおいてそれを自分で見るようにした方が良いのかな? さすがに見られる状態にしておくのはまずいしなー。