Python 基本講座

Webサーバと通信してHTMLを処理する

全333コースを10日間無料で

ぜひご覧ください。

無料で視聴する すべての加入プランを見る
または
PythonでWebサーバと通信して、HTMLを処理するプログラムを作ってみます。
講師:
05:50

字幕

このレッスンでは Pythonで Webサーバと通信して返ってくる HTMLを処理する プログラムを作ってみます Pythonの標準ライブラリには Webサーバと通信して HTMLを処理するための 豊富な機能が含まれています 少し長くなるので まず HTMLを処理するプログラムの部分だけ コードを用意してみました 「HTMLParser」と 呼ばれるクラスを 「html.parser」モジュールから読み込みます 自分独自のパーサ パースするとは ちなみに 分析するの意味ですが 自分独自のパーサを作るためには HTMLParser を継承して 新しいクラスを定義します 今は HTMLの タイトルの部分だけに 反応して そのデータを画面に表示する パーサを作ってみました まず このコードを実行して クラスTitleParserが 使えるようにしておきます まず Webサーバに接続するための モジュールを読み込みます 「urllib.request」 というのが Webサーバに接続して データをとってくるための モジュールです 少し長いので 「ur」とでもしておきましょう インターネットに接続してる コンピュータで この「urllib.request」モジュールから 「urlopen」というメソッドを 呼び出します 引数に接続するWebサーバの アドレスを入力します 少し間があった後 コードが返ってくれば HTTP通信で Webサーバとのやり取りが完了しています 戻ってきたオブジェクトの 「readall」というメソッドを呼び出すと 通常 Webブラウザに表示される HTMLがバイト列で返ってきます バイト列で返ってきてるので 1度ここで 文字列型に変更する必要があります 返ってきたバイト列を 「utf-8」で文字列に変化するコードは このようになります 1度 画面に出力してみましょう このように 長いHTMLが Webサーバから 返ってきたのがわかります 通常これが Webブラウザに表示されて Webページ上見られるわけですが これを Pythonで処理してみましょう 先ほど用意しておいた 「TitleParser」を使って パーサのインスタンスを作ります HTMLParserには いくつかのメソッドがありますが 継承して作っているので それらの多くを使えます 「feed」というメソッドを呼び出して 引数に この長い HTMLを渡すと タイトルの部分だけを 切り出してくれるはずです やってみましょう このように タイトルの部分だけが パーサによって解析されて 画面に表示されています このレッスンでは Pythonを使って Webサーバと通信し 戻ってきたHTMLを処理する プログラムを書く方法を 紹介しました

Python 基本講座

Pythonはシンプルな文法や豊富な標準ライブラリが特徴なので、誰でも手軽にプログラミングを始められます。このコースはでPythonの説明からプログラミングのための基本的な事柄などについて説明します。Pythonにはライブラリと呼ばれるプログラムを作るときに使える便利な部品もたくさん含まれているので、これらの使い方も具体例を挙げながら紹介します。

5時間04分 (62 ビデオ)
現在、カスタマーレビューはありません…
 
ソフトウェア・トピック
価格: 3,990
発売日:2015年08月11日

このコースは、「オンデマンド」でご利用可能であり、ダウンロードすることもオンラインで見ることもできます。

ダウンロードすると、オフラインでコースを使用し、豊富なインターフェースをフルに活用できます。複数のデバイスを使用したり、 一度に全コースをダウンロードしたくない場合は、アカントにログインして、ストリーミング・ビデオとしてコースのレッスンを視聴してください。

ビデオトレーニングをお楽しみいただけますように! お問い合わせは、cs-jp@lynda.com宛までご連絡ください。