ANALISIS WEB SCRAPING UNTUK DATA BENCANA ALAM DENGAN MENGGUNAKAN TEKNIK BREADTH-FIRST SEARCH TERHADAP 3 MEDIA ONLINE

Izatul Putri Sonya, Prihandoko Prihandoko

Abstract


Teknologi yang ada saat ini memungkinkan seseorang untuk bekerja dengan mudah dan
cepat. Salah satunya dalam hal memperoleh informasi dari web. Proses pengambilan
informasi dari situs-situs web disebut dengan web scraping. Pada penelitian ini dilakukan
analisis web scraping terkait bencana alam dari 3 situs media online, yaitu Detikcom,
Liputan6, dan VivaNews. Fokus web scraping lebih kepada data yang tidak terstruktur pada
web, menjadi sebuah data yang dapat di analisis dan disimpan. Data yang diambil dari media
online berupa teks artikel dengan keyword yang diinput sebagai parameternya, kemudian di
ekstrak ke dalam format Excel (.CSV) yang dilakukan dengan bantuan tool Web Content
Extractor (WCE) dengan menggunakan teknik B r e a d t h-First Search. Hasil yang didapat
adalah data yang terstruktur berupa tabel dengan beberapa field yaitu no, hari/tanggal, waktu
posting, judul, deskripsi, gambar, dan link halaman artikel. Berdasarkan analisis yang telah
dilakukan, media online Detikcom lebih banyak menghasilkan data yang relevan
dibandingkan dengan Liputan6 dan VivaNews, dan teknik B r e a d t h-First Search sangat
membantu dalam hal pencarian record dengan menelusuri URL utama hingga ke bagian
terdalam link.

Kata kunci: Web Scraping, Web Mining, Media Online, Breadth-First Search


Full Text:

PDF


Copyright ©2009 Universitas Gunadarma