1. Webスクレイピングとは
WebスクレイピングとはWebブラウザの情報を取得する技術。
Webブラウザの情報というのは、例えば
1. この記事のタイトル
1. この記事の本文
のようなブラウザに表示されているモノを指す。
要はブラウザで表示されていれば基本的には取得することができる
2. Webスクレイピングにおすすめの言語は??
個人的にはタイトルにある通り、Python。
理由は以下。
1. Webスクレイピングのライブラリが豊富
2. ドキュメントが多い
3. Pythonで開発をしてみたかった
1以外はWebスクレイピングにあまり関係ないな...
2.1. Webスクレイピングのライブラリが豊富
代表的なところだと
+ Selenium
+ BeautifulSoup
がある。2つともとても使いやすい。
また、Webスクレイピングに限らずWebサイトから取得したデータを
編集・解析したり、出力するようなライブラリも揃っているため
Python1つで完結する。(ホントすごい)
2.2. ドキュメントが多い
初めての技術を使用すると必ず検索すると思う。
その際に日本語ドキュメントや先人の方々の虎の巻があるだけでコーディング難易度は大幅に下がる。 現にGoogleで「python スクレイピング」 「python selenium」のように検索するだけで
数多の経験記やチートシートなどヒットするため、そのままコピペするだけである程度動くものが作れる
2.3. Pythonで開発をしてみたかった
昨今Python案件をよく聞くようになったので開発してみたくなった。
自分の幅も広がるし、やりたいという気持ちはモチベーションにも繋がる。
なんだかんだで一番大事かも。
3. まとめ
WebスクレイピングはWebブラウザの情報を取得する技術。
Pythonを勧める理由はWebスクレイピング以外のライブラリも揃っていてドキュメントも豊富だから