urllib を用いた簡単なデータ取得
ponsuke
ponsuke
ATOMRSS
  • ソースコードID: 608
  • 登録日時: 2008/08/19 21:49
  • 最終更新日時: 2008/08/19 21:49
  • アクセス数: 317
  • タグ:  python spidering
  • codeなにがしブックマークに追加する 0 users
  • このページを del.icio.us に追加
  • このページをはてなブックマークに追加
  • GoodJob
  • 4

GJGJGJGJ

説明

オライリィから出ている SPIDERING HACKS を Python 
書き直して見る。

1回目は、
「SPIDERING HACKS Hack09 LWP::Simpleを用いて簡単なデータ取得」
を参考に書いてみた。

Perl の LWP::Simpleの様にWWWを介してWebからデータを取得する
モジュールがPythonにも用意されている。

それが、urllibモジュール。

提示したソースコードでは、urllibモジュールを用いて、
外務省海外安全ホームページにアクセスして、指定した国の
危険情報を取得してくるものだ。

国の指定は、数値を引数としてプログラムに渡す。
引数がない場合は、074が使用される。
074は、ニュージーランドを示すIDだ。

結果は、以下のように表示される。

ニュージーランド
危険情報は出ていません。
詳細は http://www.anzen.mofa.go.jp/ を見てください

ソースコード

コメント

前へ 1 次へ

コメントする

[block]から[/block]までの範囲はブロック表示されます。
部分的に目立たせたい時や、引用などにお使いください。

[code]から[/code]までの範囲は等幅表示されます。
ソースコードや設定ファイルの記述などにお使いください。

ゲスト投稿者:ゲスト:

PDFLib | A library for processing PDF on the fly プレゼン公開・共有サイト handsOut.jp オープンタイプ株式会社 チーム・マイナス6% - みんなで止めよう温暖化

ソースコードのブログパーツ

デフォルトのフォントサイズ
修飾
表示サイズ
px px
プレビュー (表示する)
下のプレビュー領域をクリックすると、ポップアップで全体を見ることができます。
パラメータが不正です

    GoodJobしたユーザ

    • 台北猫々

    ブックマークコメント

    関連するなにがし

    前へ 1 次へ

    タグ

    dyndnsbytearrayinputstreamobjectinputstreambytearrayoutputstreamobjectoutputstreamディープコピーdeepcopyarraylistiteratorチェックボックス複数multibytexencentos文字エンコーディングinit_connectcharacter-set-servercollation-serverdefault-character-setf:label動的メソッド呼び出しヘルパーメソッドwsse2重登録防止prototype.js位置positionpositionedoffsetscrolltoスクロールlink_tocyclecheck_box_tagチュートリアルactive_formerror_messages_forハイライトバリデーションvalidate便利リストデコレーションメールデコメ非対応機種tilestext_field_tag一括複数情報etherealrtphexテキストデータ抽出validwhenリセット一括更新plop置換replacepcoslogmixisregソケットnet::telnetfopenmutexサンプルcalendar[linux][bash][シェルスクリプト][大容量]mobilerorrails2.1clipboardクリップボード横向きピラミッドs2jdbc-genjsonicお絵かきフルパス名抽出サブドメインサブドメイン名s2jdbc自動生成エンティティドコモxhtmlrestdoltengspidering背景変更グラデーションiso一括登録xトークンチェックevalmonitorslavereplication画像処理

    前へ 1 2 3 ... 8 次へ