地獄のRuby札幌の「女に惚れさす逆引きレシピ集」

2010-12-17

Ruby 逆引きレシピすぐに美味しいサンプル&テクニック 232 (PROGRAMMER’S RECIPE)

島田浩二設樂洋爾村田賢太前田智樹谷口文威
翔泳社 2009-07-25

これは Ruby逆引きレシピAdvent Calendar の参加エントリです。12月17日を担当します。前日の担当は @y_ogagaga さんで iCalendar形式のデータを読み書きしたいでした。

職場とか学校で、Rubyに詳しい頼りになる先輩がいるっていうのは、こんな感じなんじゃなかろーかと想像する。「こういうことしたいんですけど？」と聞いてみると「ああ、これでできるよ」と一瞬で返ってくるような。

レシピ先輩（仮称）はいろいろなライブラリを知ってる。だから第1章の1.1に書いてあるのはRubyのコードの書き方じゃあなくて、有無をいわさずrubygemsをインストールして使う、ということだ。レシピ先輩はIRCをばりばり使う。だから第6章ネットワーク処理のはじめは、ウェブじゃなくってIRC BOTのつくりかただ。レシピ先輩はいろいろなコミュニティに参加している。だから最後の第24章で伝えるのはコミュニティに参加する方法だ。

2つの逆引き本「Ruby逆引きレシピ」「Ruby逆引きハンドブック」 – きりかノート 2冊め

レシピ先輩の魂のライムに酔いしれろー！！

俺より強い奴に会いに行くって言ってる先輩知ってるよ

Web ページを取得して解析したい / Web サイトから情報を抽出したい

今回は、惚れさすレシピ124「Web ページを取得して解析したい」と、惚れさすレシピ152「Web サイトから情報を抽出したい」を参考にして、お手軽な画像ダウンローダを作ってみます。正義の味方たこ焼き仮面が作ってくれた Nokogiri を使えば、とっても簡単に Web から情報を抜き出せちゃいます。

Web Scraping

Web Scraping、つまり「Web ページからの情報抽出」の手順は、ざっと以下の通りです。これは、Web API などの正面玄関がない場合を想定しています。玄関がある場合は、お行儀よく玄関から入りましょう。その方が楽ですし、Web ページの中の人にも迷惑を掛けません。

ターゲットを決める
所望の情報が記載されている Web ページを探す
対象の Web サイトのソースを見て、HTML 構造とにらめっこする
対象の Web サイトにアクセスして、所望の情報を抜き出すプログラムを書く
ページングやエラー処理等の処理を追加し、プログラムを仕上げる
プログラムを動かす

惚れさせ画像ダウンローダ

(ッターン！)

地獄のミサワの「女に惚れさす名言集」のすべての惚れさせ画像をダウンロードするプログラムを書きました。

horesasu の each で meigen を新しいものから順番に渡してくれるので、それに対する処理をブロックで与えてやるとよいです。今回はダウンローダなので、ファイルとして保存する処理を書きました。

えっ、なんか今日のエントリはいつもと違うって？ふふふ… 今までタイピングしていた手は、利き腕ではない。

今まで痴漢していた手は利き腕ではない

惚れさせを、いつも側に

すべての惚れさせ名言が、あなたの手元に届きました。

Meigen images in local directory

jigokuno in iPhone

ファイル名にタイトルとキャラクター名を含めてあるので、検索できて便利です。

jigokuno search

おおっと… コードとブログを書いているとすぐに時間が過ぎちゃうな。僕が今シャブやってるからっていうのもあるけどね。

君と居るとすぐに時間が過ぎちゃうな僕が今シャブやってるからっていうのもあるけどね

わかってんのかよ

さて！「500枚近くの画像をダウンロードしたいんだけど、とても手作業じゃあ無理だなあ。どうすれば…」そんな日常のちょっと困った場面で、惚れさすレシピ集はとっても心強い1冊です。まるで、身近にいる頼りになる先輩みたいに、あなたを助けてくれることでしょう。試しにRuby逆引きレシピレシピ一覧をご覧なさいな。お品書きの充実っぷりに驚くこと間違いなしです。