Python3.5+Selenium+PhantomJSでサーバサイドでスクレイピング①

Python3.5、Selenium、PhantomJSのインストール編

Javascriptがガシガシ動いているWebページだったり、
ログインが必要なサイトを
サーバサイドからスクレイピングをしたいときってありますよね!?

そんなの思ったこともないあなた!!
スクレイピングで、データを引っ張ってきてほしいというようなニーズは
意外と結構あるので、のぞくだけのぞいていってくださいm(_ _)m

Python3.5+Selenium+PhantomJSの組み合わせの特徴

スクレイピングにあたり、Node.jsを使ったり、
PhantomJSじゃなくてFireFoxでとかあると思うのですが、
以下の組み合わせをオススメします!
・Python3.5
・Selenium
・PhantomJS

理由としては・・・
①インストールが簡単
②当然、データベースへも接続できる
③ヘッドレスブラウザのPhantomJSを使うため、バックグラウンドで動作させられる
④Javascriptを記述して実行できる

などなど、他と比較したときに良いなっと思ったところになります

Python3.5、Selenium、PhantomJSのインストール方法

1、Python3.5

本体のダウンロード

事前に必要となるパッケージをインストール

本体のインストール

シンボリックリンクを作成

パッケージのアップグレード等

インストールされているかチェック

2、Selenium

これだけ

3、PhantomJS

本体のダウンロード

本体のインストール

パスの設定

インストールされているかチェック

最後に

サーバサイドからのスクレイピングの第一回目として、
Python3.5、Selenium、PhantomJSのインストール方法をご紹介しました。

色々な組み合わせを試してきたのですが、
これが一番楽にできたという印象です。

次回は、コードの例をあげて、スクレイピングしてみます!

関連記事

コメントは利用できません。

ピックアップ記事

  1. 2015/1/3

    福袋戦争2015
  2. フィレンツェの町並み

ピックアップ記事

  1. 2016-7-8

    【朗報】コーヒー嫌いでもおいしく飲める!苦くないコーヒー3選!

    紅茶派のガンボです。コーヒーは苦いし、後味が気持ち悪くてすきではありません、 が!たま〜〜〜〜に飲み…

ピックアップ記事

  1. 2018-7-2

    【Report1】IMフォーラム★ゴールドスポンサーとして協賛&登壇

    IMフォーラム★ゴールドスポンサーとして協賛&登壇広報宣伝部のエバンジェリスト 黒田美穂 こと “く…

ピックアップ記事

  1. 2016-8-3

    納豆が似合う!?芸能人ランキングベスト3

    先日、納豆3パック1セット売りの納豆を僅か4分で完食しました。 ところで、皆さんはもちろん納豆を食…
ページ上部へ戻る
Top