Karena sesuatu hal terkadang kita ingin agar website kita tidak terindex oleh google atau mesin pencari lainnya yaitu dengan membuat file robots.txt. Hal ini diperlukan misalnya ketika kita sedang dalam proses pembuatan website, atau karena ingin menyembunyikan folder/file tertentu agar orang lain tidak bisa menemukannya melalui mesin pencari.

Caranya anda buat file robots.txt di root folder website anda dan isi dengan command sesuai keinginan anda, sebagai contoh:
1. Command ini berfungsi untuk mencegah semua jenis bot (program) dari mesin pencari untuk mengindex semua file anda (root dan turunannya).

User-agent: *
Disallow: /

2. Command ini berarti mencegah semua jenis bot mesin pencari untuk mengindex semua file yang berada di folder administration

User-agent: *
Disallow: /administration/

3. Command ini berarti mencegah bot dari google ntuk mengindex semua file anda (root dan turunannya).

User-Agent: googlebot
Disallow: /

4. Command ini berarti mencegah bot dari google ntuk mengindex semua file gambar anda (root dan turunannya).

User-agent: Googlebot-Image
Disallow: /

5. Command ini berarti mencegah semua jenis bot mesin pencari kecuali google untuk mengindex semua file yang berada di folder root dan turunannya, bot dari google boleh mengindex kecuali untuk folder cgi-bin dan privatedir

User-agent: *
Disallow: /
User-agent: Googlebot
Disallow: /cgi-bin/
Disallow: /privatedir/

6. Command ini berarti mencegah semua jenis bot mesin pencari untuk mengindex semua file yang berada di folder root dan turunannya, tetapi utk bot alexa (ia_archiver) diperbolehkan, karena disallow nya dikosongkan yang fungsinya spt tombol on/off

User-agent: *
Disallow: /
User-agent: ia_archiver
Disallow:

Sebagai tambahan informasi, kita bisa menggunakan syntax allow untuk mengijinkan indexing, tapi tidak semua mesin pencari mengenali command tersebut, jadi sebaiknya gunakan disalow yang dikosongkan saja seperti contoh terakhir.

Dan ini ada contoh robots.txt untuk wordpress (copas dari diskusi di situs wordpress di sini)

User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-includes/js
Disallow: /trackback
Disallow: /category/*/*
Disallow: */trackback
Disallow: /*?*
Disallow: /*?
Disallow: /*~*
Disallow: /*~

Semoga bermanfaat.

work as freelancer, web developer, tourism support, organizer, etc - i’m a humanize human, a son, a father, a husband, who love coffee and cigarette, lazy and moody, entrepreneur, very easy to sleep, internet addict, bad designer, humorious, playing guitar, can’t singing & cooking, thin body, brown skin, smily, travelling & hiking, art & culture related, etc………

12 Thoughts on “Mencegah website anda terindex google atau mesin pencari lainnya dengan robots.txt”

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses.