正規表現でHTMLリンク抽出
- 2009.11.25
- お役立ち
どうも久しぶりに投稿します。Izumiです。
最近、Steam版Left4Dead2をはじめまして、Steamコミュのアイコンとゲーム中のスプレーの画像を変えようと思いました。
そのための画像を探すためにネットサーフィン(死語?w)をしていましたら、スレまとめ系に大量にまとめられてることがわかりました。
別に気に入ったのだけ落とせばいいのですが、手元に置きたくなりました。たまに静止画もいい(*´∀`)
チャチャっとリンク抽出して落としてしまおうと思いました。昔使っていたIrvineを思い出したのですが、インストールするのが面倒いなあとおもいまして、正規表現をつかってみようとうことを思いついつきました。
Perlで実装、一連の操作をまとめたら以外と思った以上に時間がかかりました。できたのをここにおきます。
これのすばらしいところは、URLを指定するだけで、そのHTMLのタイトル名のディレクトリを作ってそこにダウンロードするところです。整理しなくていいのが楽。
基本Google先生に聞きながらコピペなんで、Perlの細かいところはわかりませんが、コメント入れてるんで、よかったら自分にあわせて使ってください。
動かすにはPerlとwgetが必要です。文字コードはUTF-8になってます。
-
前の記事
Left4Dead2サーバー稼動中 2009.11.23
-
次の記事
Left4Dead2サーバー構築メモ 2009.11.29