Webmaster Forumu

Geri git   Webmaster Forumu > Webmaster Genel > Webmaster Genel Konular

Webmaster Genel Konular Webmaster Genel Konular

Cevapla
 
LinkBack Seçenekler Stil
  #1 (permalink)   eTicaret 
Alt 2008-04-21, 09:38
The RuHSuZ - ait Kullanıcı Resmi (Avatar)
Member
 
Üyelik tarihi: Mar 2008
Mesajlar: 124
Tecrübe Puanı: 1
eTicaret: %0/0
The RuHSuZ is an unknown quantity at this point
Standart Robots.txt Oluşturma

Robots.txt Dosyası Kullanım Robotları Yölendirme Kontrol



Robots.txt dosyası arama motorları ve örümceklere sitenizdeki dosya ve klasörleri gezip kayıt etmeleri için izin veren ya da engelleyen dosyadır. Dosya kendi başına normal bir text dosyasından farksızdır ve basit şekilde Notepad ile hazırlanabilir. Anasayfanızın ya da sitenizin bulunduğu ana klasöre koyulmalıdır.


Neden robots.txt dosyasına ihtiyacım var?

Tüm önemli arama motorları, sitenize girer girmez öncelikli olarak bir robots.txt dosyası arar. Sitenizin herhangi bir bölümüne, örümceklerin girmesini istemiyorsanız ya da girmelerini engellemek istemiyorsanız bile bir robots.txt dosyası bulundurmak her zaman için yararlıdır. Çünkü bu dosya örümcekler için bir karşılama dosyası, menü gibi görev yapar.
Neden örümcekleri engellemek isteyebilirim?

Site henüz tamamlanmamış olabilir. Ya da henüz tam oalrak bitmemiş sayfalar içeriyor olabilir. Ve bu durumda sitenizin ya da sayfalarınızın yarım yamalak kayıt edilmesini istemeyebilirsiniz.
Şifrelemeye gerek duymadığınız ama yine de sizin için özel olan bir içeriğe ya da sitenizde bir bölüme sahip olabilirsiniz ve bunun arama motorları tarafından kayıt edilmesini ve aramalarda çıkmasını istemeyebilirsiniz.
Hata sayfalarının, cgi-bin gibi klasörlerin ya da teşekkür ettiğiniz, içinde sadece "tamam" gibi kısa mesajlar bulundurduğunuz dosya ve klasörlerinizin kayıt edilmesi kimsenin işine yaramayacaktır.
Birbirine benzeyen, geçişli sayfalarınız varsa bütün robotların aynı şeyi kaydetmesini istemeyebilirsiniz. Bu spam riski doğurabilir.
Yer almak istemediğiniz arama motorlarından ya da e-mail toplayan zararlı örümceklerden robots.txt dosyası aracılığıyla kurtulabilirsiniz.
Robots.txt dosyası oluşturmak

Robots.txt dosyasını herhangi bir text editor ya da notepad ile oluşturabilirsiniz. Temelde içeriği şu şekildedir :
User-Agent: [Örümcek ya da Bot ismi]
Disallow: [Klasör ya da Dosya ismi]

Robots.txt ile belirli bir dosyayı belirli bir bottan korumak

Mesela "Haberler" diye bir bölüm oluşturuyorsunuz ve henüz tamamlanmadan robotların gelip kayıt etmesini istemiyorsunuz. Bu durumda, hedef tüm robotlar olduğu için özellikle robot ismi belirtmek yerine yıldız işareti "*" kullanmalısınız. Bu tüm robotları kapsayacaktır.
User-Agent: *
Disallow: /haberler/

Koruduğunuz bölüm isminin başına ve sonuna slah işareti "/" koymanız o klasördeki tüm dosyaları kapsayacaktır.

Tüm robotlara kayıt izmi vermek

Hedefimiz yine tüm robotlar olduğu için yıldız "*" işareti kullanarak Disallow bölümünü boş bırakıyoruz.
User-agent: *
Disallow:

Tüm robotları dosya ve klasörlerinizden uzak tutmak

Yukarıdaki koda çok benzeyen ama ufak bir değişikliği olan bir kod ile tüm robotları dosya ve kalsörlerinizden uzak tutabilir, kayıt etmelerini engelleyebilirsiniz.
User-agent: *
Disallow: /

Robots.txt ile birden fazla klasör engellemek

Ayarları dikkatli bir şekilde yapmalısınız. Yoksa istemediğiniz dosya ve klasörleri kayıt ettirebilir, istediklerinizi engelleyebilirsiniz. Diyelim ki "cgi-bin" klasörünüzün içindeki bazı dosyaların kayıt edilmesini istemiyorsunuz.
User-agent: *
Disallow: /cgi-bin/
Disallow: /_borders/
Disallow: /_derived/
Disallow: /_fpclass/
Disallow: /_overlay/
Disallow: /_private/
Disallow: /_themes/
Disallow: /_vti_bin/
Disallow: /_vti_cnf/
Disallow: /_vti_log/
Disallow: /_vti_map/
Disallow: /_vti_pvt/
Disallow: /_vti_txt/

Her klasör için ayrı bir komut yazmak en verimlisidir.

Sadece Altavista örümceğinin girmesini istemediğimiz klasörümüze, Altavista robotunun ismi olan Scooter ı ekliyoruz.

User-Agent: Scooter
Disallow: /

Google'ın resim dosyalarımızdan uzak durmasını istiyorsak :

User-Agent: Googlebot-Image
Disallow: /images/

Eğer dosyalarınız "images" klasöründe değil ve dağınık olarak değişik yerlerdeyse o zaman :

User-Agent: Googlebot-Image
Disallow: /

Ve arkadaşlar sizlere robots.txt oluşturabileceğiniz bir site.arama motorlarının yanındaki kutuda allowed seçin sonra gerekli yerleri doldurun create deyin yeter.

http://mcanerin.com/EN/search-engine/robots-txt.asp
Kod:
Alıntıdır
Alıntı ile Cevapla

  #2 (permalink)   eTicaret 
Alt 2008-04-21, 09:54
yagmayok - ait Kullanıcı Resmi (Avatar)
Ödüllü Roman Kahramanı
 
Üyelik tarihi: Jan 2005
Mesajlar: 2.138
Blog Entries: 3
Tecrübe Puanı: 5
eTicaret: %100/5
yagmayok has a spectacular aura aboutyagmayok has a spectacular aura about
Standart

yeri gelmişken bir uyarı yapim.

Diyelim Robots.txt ile kimsenin bilmesini istemediğiniz yani indexlenmesini istemediğiniz bir klasörü yasakladınız. Eğer amatör birisi iseniz bu uygulamanın işe yaradığını düşüneceksiniz. Ama şunu unutmayın ki Robots.txt herkes taradından görülebilir.
__________________
Satılık Domainler: isbulun.com
Bir yerlerde hergün, bir daha yanmamak üzere ışıklar sönüyor !
Alıntı ile Cevapla

Cevapla

Seçenekler
Stil


Benzer Konular
Konu Konuyu Başlatan Forum Cevaplar Son Mesaj
Robots.txt marquis Google Optimizasyon ve Sandbox 21 2007-11-07 21:34
robots.txt ve .htaccess Private Apache Htaccess Mod_rewrite 7 2006-11-07 14:03
Robots.txt dosyası? hedefturan Google Arama 2 2006-05-25 20:44
robots.txt WebTicaret.Org Webmaster Genel Konular 9 2005-05-17 21:11
robots.txt korsan_cd Webmaster Genel Konular 2 2004-12-03 23:00


Bütün Zaman Ayarları WEZ +2 olarak düzenlenmiştir. Şu Anki Saat: 00:41 .


Powered by vBulletin® Version 3.7.3
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Content Relevant URLs by vBSEO 3.2.0

Firefox