zone-h scraper uses makaboro
ORANGMILITER
- Apa itu scraper atau web scraping ?
Kutipan dari dewaweb.com menjelaskan bahwa web scraping adalah proses ektraksi data dari sebuah website. Dari hasil ektraksi tadi dipilih bagian - bagian tertentu untuk di ambil datanya sehingga bisa dimanfaatkan sebagaimana rupanya.
- Parsing HTML dengan bantuan Python BeautifulSoup.Ada beberapa cara untuk memilah data untuk diambil pada suatu website menggunakan python, kita bisa menggunakan library re (regular expression) atau menggunakan library BeautifulSoup. saya memilih menggunakan BeautifulSoup karena lebih mudah saya pahami disini atau sesuai kondisi data yang ingin kita ambil. untuk cara atau dokumentasi tentang dua (dua) lib di atas bisa baca di re (regular expression) dan BeautifulSoup.
- Makaboro alat bantu scraping website zone-h.org
- Memasang dan menjalankan makaboro
$ git clone https://github.com/orangmiliter/makaboro.git
$ cd makaboro
$ pip install -r requirement.txt
$ python makaboro.py -h - Video