Scraped Content – Konten yang “Dicolong” dan Tidak Sekedar Plagiat
Pernahkah kamu melihat konten atau tulisan buatanmu di-post di situs lain tanpa izin? Kelihatan cuma mencuri konten? Konsep ini bernama scraped content atau secara kata kerja, ada orang yang melakukan content scraping terhadap kontenmu.
Apakah scraped content ini berbahaya untuk SEO? Bukan sekedar “plagiat” biasa?
Apa itu Scraped Content?
Scraped content adalah konten yang dicuri dan digunakan tanpa izin oleh pemilik website yang merupakan pembuat konten originalnya. Teknik ini termasuk black hat SEO.
Praktek mencuri konten ini disebut sebagai content scraping.
Mengapa Scraped Content Berbahaya untuk SEO?
Scraped content berbahaya bagi SEO situs karena potensi konten duplikat, namun kasusnya ada di dua situs yang berbeda. Jika Google salah, mereka malah akan ranking situs yang mencuri konten situs yang melakukan pencurian.
Lebih parah lagi, bisa saja sebuah situs yang buat konten original mendapatkan penalti karena metode kotor ini.
Mengapa Ada yang Melakukan Content Scraping?
Alasan yang mudahnya adalah karena “mencolong” konten lebih mudah dan hemat berbagai aspek daripada membuat konten original. Tentu butuh waktu dan tenaga untuk membuat konten yang bersifat orisinil.
Meski demikian, tindakan content scraping adalah hal yang tidak terpuji dan tidak beradab.
Tipe Konten yang Ditarget oleh Content Scraper
Menurut Radware, beberapa tipe konten ini biasanya ditaregt oleh content scrapper:
- Artikel dan blog dari top of mind industri tertentu
- Ulasan produk yang lengkap
- Berita baru yang masih hangat
- Publikasi ilmiah
- Katalog produk dan harga di situs e-commerce
Kunci rawan “dicuri” ini adalah: top of mind dan masih “baru”. Karena itu, situs berita paling rawan untuk kena content scraping, meskipun mereka memblokir crawler dari AI sekalipun.
Bagaimana Proses Content Scraping?
Proses content scraping bisa dilakukan dengan dua hal. Manual atau otomatis.
Untuk manual, content scraper melakukan copy paste konten yang ingin mereka curi, lalu ditempel mentah-mentah di situs lain (tentunya tanpa izin pemilik konten original).
Untuk otomatis, mereka menggunakan bot. Jika dipikir-pikir, konten buatan generative AI tanpa adanya campur tangan manusia jelas merupakan content scraping. Bedanya, mengambil dari banyak sumber dan tanpa izin dari pemilik website (tidak memberi royalti juga).
Cara Mengecek Apakah Ada Konten yang Di-Scrap
a. SERP dari Mesin Pencari
Cara paling mudah adalah dengan mengecek manual di SERP mesin pencari. Apakah ada kontenmu yang sama persis di situs lain atau tidak. Pakai beberapa kalimat atau satu paragraf agar bisa terlihat lebih jelas.
b. Alat Pendeteksi Plagiarisme
Alat pendeteksi plagiarisme secara online biasanya memberikan sumber tempat di mana ada tulisan yang mirip atau sama persis, sehingga bisa mendeteksi apakah terjadi content scraping.
c. Tools SEO
Pengalaman pemilik blog ini, pernah ada pelaku content scraping yang memberikan backlink ke pemilik blog ini. Tulisan sama persis, hanya saja orangnya memberikan backlink. Hal ini bisa dideteksi dengan tools SEO.
d. Google Alerts
Cara ekstrim, coba set Google Alerts, terutama dari kalimat panjang di kontenmu. Jangan hanya judul saja.
Cara Mencegah Content Scraping
Risiko pembuat konten adalah mengalami “pencurian”. Sejatinya tidak ada cara pencegahan untuk content scraping yang dilakukan secara manual, apalagi jika situsmu punya ranking bagus di SERP. Namun, kita bisa memakai alat seperti reCaptcha untuk memblokir bot.
Sayangnya, pemasangan hal ini berpotensi membuat situs kehilangan traffic karena mengganggu user experience. Silahkan ditakar kelebihan dan kekurangannya.
Apa yang harus Dilakukan jika Ada yang “Mencuri” Konten?
Langkah legal seharusnya ada. Namun pastinya memakan waktu dan tenaga, sehingga banyak orang yang akhirnya tidak melanjutkan proses ini.
Kamu bisa ambil langkah secara frontal seperti menjapri pemilik situs yang scrap kontenmu tanpa izin. Jika mengelak, bisa dicek di WhoIs untuk melihat mana yang merupakan konten original. Post date itu bisa dimanipulasi, jadi kurang pas sebagai alat untuk perbandingan.
Scraped Content itu Merugikan Banyak Pihak
Baik itu yang scraped atau pun scraping, scraped content merugikan kedua belah pihak. Menang jadi abu, kalah jadi arang. Yang di-scrap berpotensi performa SEO-nya turun, sementara yang scraping juga rugi karena nama baiknya rusak, serta branding mereka tidak jelas karena hanya colong saja dari orang lain.
Yuk tinggalkan praktek kotor seperti content scraping!