Duplicate Content: Panduan Lengkap & Cara Mengatasinya

Apa itu Duplicate Content?

Duplicate Content adalah konten yang sama atau hampir sama yang muncul di lebih dari satu tempat secara online.

Oleh karena itu, konten dapat dianggap sebagai duplikat jika cukup mirip dengan halaman lain. Ini berlaku bahkan jika konten tersebut tidak benar-benar salinan dari halaman lain.

Mungkin ada duplicate content yang muncul di berbagai halaman di website Anda atau di website yang berbeda.

Untuk dianggap sebagai duplikat, konten harus memenuhi kriteria berikut:

Kemiripan yang terlihat antara kata-kata, struktur, dan format dengan konten lain
Sedikit atau tidak ada informasi asli
Dibandingkan dengan halaman serupa, tidak ada manfaat tambahan bagi pembaca.

Artikel ini akan menjelaskan bagaimana duplicate content memengaruhi SEO dan 5 penyebab umum duplicate content. Kami juga akan menunjukkan cara menghindari dan menyelesaikan masalah ini.

Bagaimana Duplicate Content Mempengaruhi SEO?

Secara umum, Google tidak ingin memberikan peringkat pada halaman yang memiliki konten yang sama.

Table of Content Duplicate Content

Sebenarnya, Google menyatakan:

“Google berusaha keras untuk mengindeks dan menampilkan halaman dengan berbagai informasi.”

Oleh karena itu, memiliki halaman website tanpa informasi dapat memengaruhi peringkat search engine.

Secara khusus, tiga masalah utama yang dihadapi situs web yang memiliki banyak duplicate content adalah sebagai berikut:

Lebih Sedikit Traffic Organic

Tujuan Google adalah menyajikan halaman yang mengandung informasi original (baru) dan bermanfaat kepada pencari. Bukan halaman yang hanya mengulang konten yang sudah ada di tempat lain (termasuk konten di dalam website Anda sendiri).

Itulah mengapa mereka memiliki search ranking systems yang dimaksudkan untuk memprioritaskan konten original (asli) saat memberikan peringkat kepada search result.

Oleh karena itu, Google akan berusaha menentukan halaman mana yang orginal jika Anda memiliki sejumlah halaman yang serupa.

Namun, jika Google tidak dapat mengidentifikasi halaman yang original, peringkat Anda dapat terpengaruh, dan halaman tersebut mungkin tidak akan muncul dalam peringkat sama sekali.

Selain itu, bahkan dalam kasus konten Anda muncul di peringkat, versi yang dipilih oleh Google mungkin tidak sesuai dengan yang Anda harapkan muncul di search engine result page (SERP).

Mendistribusikan Backlink yang Tidak Diperlukan

Backlink adalah tautan di website lain yang mengarah ke website Anda.

Setiap backlink seperti bukti kepercayaan dari website tersebut, memberi tahu Google bahwa konten Anda mungkin akurat dan bermanfaat.

Memiliki lebih dari satu salinannya dari satu konten dapat mengurangi kekuatan link, reputasi dan authority yang ditransfer melalui backlink dari satu halaman ke halaman lain yang dimiliki oleh konten tersebut.

Berikut Alasannya:

Misalkan Anda memiliki dua halaman yang sama yang dihubungkan ke URL berikut:

https://www.floristweb.com/gardening/planting-flowers
https://www.floristweb.com/flowers/planting-flowers.

Jika Anda memiliki 50 backlink di antara dua halaman tersebut, 30 di antaranya mungkin mengarah ke URL pertama, sementara 20 sisanya mengarah ke URL kedua.

Daripada memiliki satu halaman yang diperkuat dengan 50 backlink, Anda mendapatkan dua halaman dengan masing-masing backlink lebih sedikit.

Distribusi ini berpotensi menyebabkan peringkat mesin pencari lebih rendah karena tidak ada satu halaman pun yang memperoleh otoritas sebanyak yang diperoleh satu halaman.

Merusak Crawlability Website Anda

Agar konten Anda muncul dalam search result, search engine seperti Google harus merayapi (crawl) dan mengindeksnya (index) (atau menemukan dan menyimpannya).

Halaman duplikat membuang-buang crawl bduget Anda (jumlah waktu dan sumber daya yang didedikasikan oleh search engine crawlers untuk merayapi website Anda sebelum melanjutkan). Karena perayap dapat berakhir dengan meninjau beberapa versi dari konten yang sama.

Ini mengurangi jumlah halaman yang dapat dirayapi, yang dapat berdampak pada posisi website Anda di hasil pencarian.

5 Faktor Umum Mengapa Konten Terduplicate

Ada banyak alasan mengapa konten dapat diduplikasi secara tidak sengaja. Masalah struktural seperti variasi URL dan konten yang disalin .

Berikut lima alasan umum:

1. Mengelola Variasi WWW dan Non-WWW dengan Tidak Tepat

Pengguna sering kali dapat mengakses situs web melalui URL yang menyertakan “www” di awal dan URL tanpa itu.

Jika website Anda dapat diakses dengan kedua cara tersebut dan Anda tidak mengelola variasi ini dengan benar, hal ini dapat menyebabkan masalah duplicate content.

Bayangkan website Anda seperti rumah dengan banyak pintu. Seseorang dapat masuk melalui pintu depan dengan menggunakan “www.contoh.com”, dan orang lain dapat masuk melalui pintu belakang dengan menggunakan “contoh.com”.

Variasi URL dapat membuatnya terlihat seperti dua rumah yang berbeda bagi search engine, meskipun sebenarnya itu adalah rumah yang sama.

2. Memberikan Akses dengan HTTP dan HTTPS

Website Anda dapat diakses melalui keduamelalui protokol HTTP dan HTTPS juga dapat menyebabkan duplicate content.

Ini mirip dengan memiliki beberapa pengunjung yang memiliki pintu biasa dengan URL “http://contoh.com” dan yang lain memiliki pintu yang sangat aman dengan URL “https://contoh.com”.

Jika Anda tidak memberi tahu mereka pintu mana yang merupakan pintu utama, bot pencari akan menganggap ini sebagai pintu ke rumah lain.

3. Menggunakan Slash dan Tanpa Slash di Akhir

Google melihat variasi URL yang memiliki slash di akhir (“/”) dan tanpa slash sebagai duplicate content.

Misalnya, 2 URL berikut dianggap unik oleh mesin pencari:

contoh.com/page
contoh.com/page/

Untuk menghindari duplikat, pilih metode untuk menambahkan slash di akhir URL halaman Anda dan kemudian simpan.

4. Melakukan Scraped atau Copied Content

Content Scraping terjadi ketika seseorang menyalin konten dari sebuah website dan menerbitkannya di situs lain tanpa izin atau atribut yang tepat.

Namun, Google biasanya sangat baik dalam membedakan antara konten yang disalin dan sumber asli. Sebelum ini, Mereka sebelumnya telah menulis tentang bagaimana mereka menangani konten yang di-scrape, mengatakan:

Jika Anda melihat seseorang menyalin konten Anda di website Anda, Anda tidak perlu khawatir tentang dampak negatif yang dapat ditimbulkan website Anda di Google.

5. Menggunakan Versi Terpisah untuk Mobile dan Desktop

Salah satu cara Anda dapat menyusun website Anda agar mobile-friendly adalah dengan menggunakan URL terpisah untuk versi desktop dan seluler.

Misalnya, Anda dapat menggunakan domain desktop “contoh.com” dan domain mobile “m.contoh.com”.

Pendekatan ini memungkinkan Anda menyesuaikan konten dan desain khusus untuk perangkat seluler, untuk memastikan pengalaman pengguna yang lebih baik.

Namun, menggunakan URL yang berbeda untuk versi desktop dan mobile dapat menyebabkan masalah duplicate content jika tidak diterapkan dengan benar.

Cara Menemukan Duplicate Content

Langkah pertama dalam mengatasi duplicate content dalam SEO adalah mengidentifikasi di mana konten tersebut terjadi di situs Anda (jika ada).

Pantau Halaman yang Di-Indeks di Google Search Console

Google Search Console (GSC) adalah alat gratis yang dapat Anda gunakan untuk melihat apakah semua halaman website Anda diindeks atau tidak.

Selain itu, alat ini menunjukkan alasan mengapa halaman tidak diindeks. Salah satu alasannya adalah duplicaet content.

Untuk memulai, atur GSC. Jika Anda tidak yakin bagaimana caranya, lihat panduan Dailys Swift tentang Google Search Console untuk panduan langkah demi langkah.

Di menu sebelah kiri, pilih bagian “Indexing” dan klik tab “Page“.

Anda akan melihat grafik yang menunjukkan jumlah halaman yang diindeks dan tidak diindeks.

Gulir ke bawah untuk melihat mengapa halaman Anda tidak diindeks.

Jika halaman duplikat Anda ada, klik kesalahan “Duplicate, Google chose different canonical than user” untuk mendapatkan daftarnya.

Dengan melakukan ini, laporan akan dibuka. Ini akan menampilkan grafik yang menunjukkan jumlah halaman yang terpengaruh selama ini serta daftar halaman dengan duplikat.

Anda dapat memperbaiki masalah tersebut dengan menggunakan salah satu metode. Selain itu, untuk meminta Google memeriksa situs Anda, klik “Validate Fix“.

Bagaimana Cara Memperbaiki Masalah Duplicate Content

Sekarang, saatnya untuk membahas apa yang bisa Anda lakukan untuk menghindari masalah terkait duplicate content. Atau memperbaiki masalah yang ada saat ini.

1. Implementasikan Redirect 301 Saat Diperlukan

Redirect 301 adalah cara terbaik untuk mengarahkan search engine dan pengguna dari satu URL ke URL lainnya secara permanen. Ini sangat efektif untuk duplikat yang tidak perlu Anda pertahankan, seperti ketika Anda mengubah protokol HTTP menjadi HTTPS atau memindahkan halaman ke URL baru.

Misalnya, jika Anda mengubah URL halaman “About Us” website Anda dari “www.your-domain.com/about-company” menjadi “https://url.com/about-us”.

Untuk memastikan bahwa pengguna dan search engine berada di halaman yang benar, Anda harus mengubah URL lama Anda ke URL baru Anda.

Saat Anda mengubah URL halaman Anda, beberapa penyedia hosting secara otomatis menerapkan redirect 301. Namun, prosedur khusus untuk menerapkan redirect 301 berbeda-beda tergantung pada server dan sistem manajemen konten (CMS) yang Anda gunakan.

2. Implementasikan Canonical Tag

Canonical Tag (juga dikenal sebagai tag rel=”canonical”) adalah bagian kode HTML yang menunjukkan URL yang diprioritaskan untuk konten yang mirip atau duplikat.

Search engien mengetahui versi halaman mana yang ingin Anda indeks dan tampilkan dalam hasil pencarian dengan tag kanonis.

Tag ini terletak di bagian “head” kode HTML situs web.

Canonical Tag yang mengacu pada diri sendiri (artinya tag pada halaman yang menunjuk ke dirinya sendiri) juga dapat melindungi konten Anda dari scraper. Ini karena tag tersebut memberi tahu search engine bahwa halaman yang mereka kunjungi adalah sumber asli dan berwenang.

Jika scraper menyalin konten Anda dan tidak menyertakan tag ini dengan benar, search engine akan lebih mungkin menganggap halaman Anda sebagai yang asli.

Google menyatakan bahwa canonical tag lebih efektif daripada memblokir halaman yang mengandung informasi yang tidak asli.

(Sebagai contoh, blokir Googlebot dengan file robots.txt atau dengan tag noindex pada halaman HTML Anda)

Jadi, jika Anda menemukan bahwa banyak halaman website Anda mengandung konten yang tidak asli, apa yang Anda inginkan?

Menghapusnya
Redirect
Menggunakan Canonical Tag

3. Konsolidasi Halaman

Jika Anda memiliki banyak halaman dengan konten yang benar-benar duplikat, Anda mungkin ingin menggabungkannya menjadi satu halaman saja, seperti yang saya katakan sebelumnya.

(atau dengan menggunakan canonical tag)

Namun, bagaimana jika Anda memiliki halaman yang memiliki konten yang mirip?

Anda dapat membuat konten yang berbeda untuk setiap halaman atau menggabungkannya menjadi satu halaman besar.

Misalnya, anggaplah Anda memiliki tiga posting blog yang terletak di webstie yang berbeda secara teknis, tetapi kontennya hampir sama.

Dengan menggabungkan ketiga posting ini, Anda dapat membuat posting blog yang luar biasa dan unik.

Karena konten yang duplikat telah dihapus dari website Anda, halaman tersebut seharusnya memiliki peringkat yang lebih baik daripada gabungan dari tiga halaman sebelumnya.

4. Noindex Halaman Tag atau Kategori di WordPress

Jika Anda menggunakan WordPress, Anda mungkin telah memperhatikan bahwa WordPress secara otomatis menghasilkan halaman tag dan kategori.

Halaman-halaman ini mungkin memiliki banyak duplicate content.

Meskipun halaman ini bermanfaat bagi pengguna, saya menyarankan Anda untuk menambahkan tag “no index” pada halaman tersebut. Dengan cara ini, halaman-halaman tersebut dapat ada tanpa diindeks oleh search engine.

Selain itu, Anda dapat mengatur WordPress agar halaman ini tidak dibuat sama sekali.

Duplicate Content

Apa itu Duplicate Content?