Senjata untuk grabbing halaman web
Banyak sekali yang menanyakan perihal grabbing halaman website untuk ditampilkan di situs kita. Dan kebanyakan menanyakan script siap jadi. Duh!
Begini ya mas-mas, mbak-mbak, pakdhe, om dan tante. Teknik grabbing akan berbeda-beda untuk tiap-tiap website. Tapi intinya sama. Baca HTML dari suatu halaman, lalu pilih mana yang akan diambil. Mari kita lihat script andalan saya untuk melakukan grabbing.
Fungsi pertama, membaca halaman website dan masukkan ke dalam string:[code]
[/code]
Nah, fungsi ini akan menghasilkan tag-tag HTML yang harus kita analisa untuk menentukan batas mulai pemotongan dan batas akhir.
Lalu fungsi kedua, adalah sebuah regex sederhana untuk mengambil teks yang diapit suatu tag tertentu.[code]
[/code]
Di fungsi yang kedua, parameter pertama tidak harus suatu tag HTML, tapi bisa juga suatu string. Happy grabbing!
You may also like
13 comments
Leave a ReplyCancel reply
Archives
- April 2025
- March 2025
- February 2025
- November 2023
- January 2023
- October 2022
- August 2022
- April 2022
- March 2022
- January 2022
- July 2021
- October 2020
- August 2020
- June 2020
- January 2020
- November 2019
- July 2019
- December 2018
- October 2018
- September 2018
- August 2018
- May 2018
- March 2018
- February 2018
- December 2017
- September 2017
- June 2017
- March 2017
- February 2017
- January 2017
- December 2016
- November 2016
- October 2016
- August 2016
- July 2016
- June 2016
- May 2016
- April 2016
- March 2016
- February 2016
- January 2016
- December 2015
- November 2015
- October 2015
- September 2015
- August 2015
- July 2015
- June 2015
- April 2015
- March 2015
- February 2015
- January 2015
- December 2014
- November 2014
- October 2014
- September 2014
- August 2014
- July 2014
- May 2014
- April 2014
- March 2014
- February 2014
- November 2013
- October 2013
- September 2013
- July 2013
- June 2013
- January 2013
- December 2012
- June 2012
- May 2012
- April 2012
- March 2012
- February 2012
- January 2012
- December 2011
- November 2011
- October 2011
- September 2011
- August 2011
- July 2011
- June 2011
- May 2011
- April 2011
- March 2011
- February 2011
- January 2011
- December 2010
- November 2010
- October 2010
- September 2010
- August 2010
- July 2010
- June 2010
- May 2010
- April 2010
- March 2010
- February 2010
- January 2010
- December 2009
- November 2009
- October 2009
- September 2009
- August 2009
- July 2009
- June 2009
- May 2009
- April 2009
- March 2009
- February 2009
- January 2009
- December 2008
- November 2008
- October 2008
- September 2008
- August 2008
- July 2008
- June 2008
- May 2008
- April 2008
- March 2008
- February 2008
- January 2008
- December 2007
- November 2007
- October 2007
- September 2007
- August 2007
- July 2007
- June 2007
- May 2007
- March 2007
- February 2007
- January 2007
- December 2006
- November 2006
- October 2006
- June 2006
- March 2006
Calendar
| M | T | W | T | F | S | S |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | |||||
senjata sayah bambu runcing kok
kk yeniiiiii >_*
halah, dasar mbah darmo ndeso!
tak bilangin kk rey lho :p
Mau nanya mas sandal. Kok di grab? Nggak di wrap saja?
Kalau di wrap kan kesannya lebih sopan, menghargai yang buat.. gitu.
Hehehe.
Mungkin saya yang ndak mengerti mas/mbak Sandal. Sebab pengetahuan saya masih dangkal. Jadi mungkin ada kesalahpahaman dalam memahami teknik grabbing anda.
Setau saya (*yang ternyata sok tahu padahal ga tau apa-apa ini, hehe). Teknik grab itu pengambilan mentah-mentah source kodenya. Entah dilakukan secara legal… ataupun tidak. Yang pasti, intinya, semuanya diambil. Mulai dari tampilan, hingga kode-kodenya.
Contoh teknik grab, yang paling populer (*waktu jaman saya dulu, maap jadul contohnya, hehe*) adalah SWFDecompiler. Dimana SWF di grab kemudian di decompile menjadi *.Fla. Dalam proses decompilenya, semua source muncul. Diantaranya adalah munculnya instance, _mc, bahkan hingga actionscriptnya (*kalau ndak salah, AS2.0 masih bisa di grab deh*).
Sementara teknik wrap, setahu saya, sudah diimplementasikan sebagai bagian wajib di beberapa CMS-CMS (contohnya Joomla dengan wrap page-nya). Intinya. menampilkan source/tampilan tanpa menghilangkan, menambah atau memodifikasi. Selain Joomla, contoh lainnya adalah pemakaian I FRAME SRC= pada google calendar (dan juga fasilitas umum lainnya) sebagai metode wrap. Selain itu, beberapa widget di WP (kalau ndak salah, sonific) juga mengimplementasikan teknik wrap.
Jadi setau saya, grab itu mengambil langsung matang/mentah semua source (kasus disini HTML yaa). Entah sumbernya itu dilindungi, atau bebas. Yang pasti, diambil. Sementara, wrap menampilkan apa adanya source.
Mas/Mbak Sandal, mungkin akibat pengetahuan saya yang dangkal, saya jadi missunderstood dan nanya begini. Sebab saya ini masih belajar looh. Jadi mohon pencerahannya gitu… 😀
Terimakasih yoo
saya liat di aw stats ada grabing, disini juga, emang grabing apaan dan buat apa ya?
gak perlu dijelaskan kalo saya pemula kan? buktinya masih nanya nih…….
eh iya sekalian nanya, saya pake mambo, gimana caranya biar orang tulis komen pake karekter seperti di bawah ini? (kayak punya sandal gitu…)
@bangaiptop
grab vs wrap, mungkin sebenernya miss-persepsi mas. grabbing dalam dunia web, menurut definisi yang saya pahami adalah mengambil data dari suatu situs untuk ditampilkan di situ yang lain.
tekniknya tentu saja macem-macem. klo ada xml/rss/rdf/atom, puenak banget. tapi kalo ndak ada, terpaksa ya parsing data per karakter agar ketemu data yang diinginkan.
@klepon
grabbing itu ngambil data dari situs lain untuk ditampilkan/dimasukkan ke situs lainnya/database mas.
soal mambo, maaf banget saya tidak menguasainya.
Mas, gimana teknik wrap, misalnya buku tamu dari shoutmix yg ukuran karakternya pendek bisa jadi lebih lebar seperti yg ada disini. Sy sudah membuat kolom yg lebar, tp karakter penulisannya tdk mengikuti lebar ruangan ! Mkasih pencerahannya !
wah, jelek banget, gambarnya ayam ! 🙂
Mas, kok aku error PHP Notice: Undefined variable: url2 di line 40 ? Kenapa yah?
seep thanks bro buat inponya \:D/
seep dapat referensi laen soal grabing
wah bisa langsung di coba nih …
bisa juga tuk grab tracking DHL gan?