Yahoo! Pipes 実践編

まずは必要なパーツを作成
とりあえず、書籍どおりに
Fetch Site Feed を選んで
URlに
http://www.jiji.com/rss/ranking.rdf
を記述
これは時事ドットコムのRSSになる
--------------------------------------------------
次はRSS非対応のものを取り扱う
今回使用するのは 47NEWS
まず
Fecth Page を選び
http://www.47news.jp/AccessAnal/index.html
をURLに記述
ページ内の取得開始位置を
Cut content from のところへ記述
ランキング1位を示す 1: が始まりなので
今回は 1:
to のところへ
終了タグである

を記述
Split using delimiter には区切り文字を意味するので
<BR>タグを書きます
--------------------------------------------------
次に表示するアイテムを切り詰めたいので
Operators > Tuncale を選択して
10を入力することで、10ずつの表示になります
Screenshot-Ubuntu 64-bit - VMware Player-10
---------------------------------------------
このままだとアイテムの中身が
HTMLタグ と テキストが乱雑になっているので
記事タイトルとリンクを特定します
まず、
Operators > Regex

Options > Rename
で部品を追加します
Screenshot-Ubuntu 64-bit - VMware Player
Rename には
アイテムを別名でコピーできます
Mappings
のところをクリックすると、項目が増えます
項目には item.content として
Rename を Copy As へ変更 右側には title と入力します
もひとつ追加して
項目には item.content として
Rename を Copy As へ変更 右側には link と入力します
これで、title と link 以外の要素が排除できます
------------------------------------------------------------–
Rename モジュールの結果を受け取る Regex モジュールの設定
をします
regex モジュールは、正規表現による文字列の置換、検索ができます
今回は、タイトルの文字列の前後を取り除いた文字列に変換
これで RSS の最低限の要素であるタイトルとリンクをもつ
アイテムができあがりです
Screenshot-Ubuntu 64-bit - VMware Player-1
------------------------------—-
これをUnion モジュールで追加します
書籍には載っていないのですが
Source > Fetch Feed で fetch Feed を作成し
http://www.jiji.com/rss/ranking.rdf
をURLに入力します
Screenshot-Ubuntu 64-bit - VMware Player-2
Union モジュールは
Operators > Union で追加できます
Union.png
これを Fetch Feed とRegex をくっつけると、下のほうに表示されるようになります
Screenshot-Ubuntu 64-bit - VMware Player-3
----------------------------------------–
ここからさらに、情報をフィルタリングします
Operation > Filter でパーツを追加します
初期設定だと、条件式ですべてブロックしていますので
all のところを any に変更して
item.title Contain PR とすると
PRという文字列を含むものが排除されます
Screenshot-Ubuntu 64-bit - VMware Player-4
--------------------------------------------------
最後に Pipe Output にくっつけて完了です
全体図は、以下のようになります
Screenshot-Ubuntu 64-bit - VMware Player-5
いちおう、できたのですが、47news 関連の記事にアクセスできませんでした
もう少しいろいろと勉強する必要がありそうです

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です