Dev Kapı Bekçisi: robots.txt Dosyası Nedir, Neden Arama Motoru Optimizasyonunun (SEO) Kalbidir?
Google’ın Hız ve Verimlilik Odaklı Yeni Algoritmaları Karşısında robots.txt Kullanımının Detaylı Rehberi
Sivas Postası Teknoloji – Bir web sitesinin görünmez kahramanı, ancak doğru kullanılmadığında SEO’nun en büyük düşmanı: robots.txt dosyası. Çoğu zaman bir metin belgesinden ibaret sanılan bu basit dosya, aslında arama motoru botlarının sitenizle kurduğu ilişkinin anayasasıdır. Özellikle Google’ın güncel algoritma güncellemelerinde Tarama Bütçesi (Crawl Budget) ve site hızı (Core Web Vitals) gibi metriklerin önem kazanmasıyla birlikte, robots.txt’nin stratejik kullanımı, artık sadece bir tavsiye değil, bir zorunluluk haline geldi.
Robots.txt Nedir ve Temel Amacı Ne Olmalıdır?
robots.txt dosyası, web sitenizin kök dizinine yerleştirilen basit bir metin dosyasıdır. Temel görevi, Google, Yandex, Bing gibi arama motoru örümceklerine (User-Agent’lara) sitenizin hangi bölümlerini tarayabileceklerini (crawl edebileceklerini) ve hangi bölümlerini tarayamayacaklarını (dizine ekleyebileceklerini) söylemektir.
robots.txt’nin en temel amacı şudur: Arama motorlarının değerli zamanını (Crawl Budget) önemsiz veya yinelenen sayfalara harcamasını önlemek ve bu bütçeyi, sitenizdeki en değerli, kaliteli ve taze içeriklere yönlendirmektir.
Güncel Algoritmalarda Neden Kritik Bir Öneme Sahiptir?
Geçmişte robots.txt, genellikle sitenin özel panellerini veya test sayfalarını engellemek için kullanılırdı. Ancak günümüzde iki temel Google metriği nedeniyle stratejik bir SEO aracı haline gelmiştir:
1. Tarama Bütçesi Yönetimi (Crawl Budget Optimization)
Google’ın bir web sitesine ayırdığı tarama kapasitesi sınırlıdır. Bu kapasiteye Tarama Bütçesi denir. Sivas Postası gibi günlük ve sık içerik üreten bir haber sitesinde, Tarama Bütçesi hayati önem taşır. Eğer botlar bütçelerinin büyük bir kısmını değersiz veya kopya içerikleri taramakla harcarsa, yayınladığınız Sivas Son Dakika Haberleri yeterince hızlı keşfedilemeyebilir.
Stratejik Kullanım:
- Zararlı Parametreler: URL’lerin sonunda oluşan
?orderby=price,?sessionid=gibi gereksiz parametreler içeren URL’leri engelleyerek binlerce değersiz sayfanın taranmasını önleyin. - Yinelenen İçerikler: WordPress’in dahili arama sonuç sayfaları (
/search/) veya etiket sayfaları (/tag/) gibi düşük değerli, tekrarlayan içerik sayfalarını engelleyerek bütçeyi koruyun. - Yönetim ve Eklenti Alanları:
/wp-admin/,/wp-includes/ve eklentilerin oluşturduğu gereksiz dosyaları (ki bu dosyaların dizine eklenmesi zaten istenmez) engelleyerek botun enerjisini ana haber içeriğinize saklayın.
2. Site Hızı (Core Web Vitals) İlişkisi
robots.txt, direkt olarak sayfa yükleme hızınızı etkilemez. Ancak dolaylı olarak sitenizin genel sağlığına katkıda bulunur. Engellediğiniz gereksiz sayfalar, Google’ın Search Console raporlarında hata olarak görünme potansiyelini azaltır. Hata sayısının azalması, Google’ın sitenize olan güvenini artırır ve sitenizin genel performans skorunu yükseltir. Unutmayın, Google hızlı ve hatasız siteleri ödüllendirir.
robots.txt Komutlarının Detaylı Anatomisi
robots.txt dosyasında kullanılan temel komutlar ve anlamları aşağıdadır. Bu komutların doğru kullanımı, Rank Math gibi eklentilerin de sitenizi doğru analiz etmesi için önemlidir:
| Komut | Anlamı ve İşlevi | Örnek Kullanım |
| User-Agent | Hangi arama motoru botuna hitap edildiğini belirtir. | User-agent: * (Tüm botlar için) veya User-agent: Googlebot (Sadece Google botu için) |
| Disallow | Botun taramasını (crawl) kesinlikle durdurur. | Disallow: /ozel/ (Bu klasördeki hiçbir şeyi tarama) |
| Allow | Bir Disallow kuralının istisnasını oluşturur. | Disallow: /haberler/ altında, Allow: /haberler/son-dakika.html |
| Sitemap | Site haritasının (sitemap) URL’ini belirtir. Bu, hayati önem taşır. | Sitemap: https://www.sivaspostasi.com/sitemap_index.xml |
Engelleme Tuzağı: robots.txt ve noindex Farkı
robots.txt’nin en çok karıştırıldığı konu, engelleme (Disallow) ile dizine eklememe (noindex) arasındaki farktır. Bu ayrımı yapmak, SEO başarınız için kritiktir:
| Özellik | robots.txt (Disallow) | Meta Etiket (Noindex) |
| Amacı | Botun sayfaya girişini ve taramasını engeller. | Botun sayfayı taramasına izin verir, ancak dizine eklemesini (aramada göstermesini) engeller. |
| Tarama Bütçesi | Korur. Bot zaman harcamaz. | Harcar. Bot sayfayı tarar, ancak etiketi görür ve dizine eklemez. |
| Ne Zaman Kullanılır? | Sunucuda yük oluşturan, gereksiz dosyalar (CSS, JS, eklenti dosyaları) veya Tarama Bütçesi’ni boşa harcayan binlerce parametreli URL’ler için. | Sayfanın mutlaka taranması, ancak kesinlikle arama sonuçlarında gösterilmemesi gerektiği durumlarda (Örn: Teşekkür sayfası, kişisel verilerin olduğu sayfalar). |
Kritik Hata Uyarısı: Eğer bir sayfayı robots.txt ile engellerseniz ve o sayfada noindex etiketi varsa, Google bu noindex etiketini asla göremez ve sayfa dizinde kalmaya devam edebilir! Bu nedenle, dizinde görünmesini istemediğiniz sayfalar için her zaman noindex kullanın, robots.txt’yi ise sadece Tarama Bütçesi yönetimi için kullanın.
Sivas Postası İçin İdeal robots.txt Yapısı
Bir haber sitesi için, temel odak nokta hızlı keşif ve en güncel içeriğin önceliklendirilmesidir. Örnek ve sade bir robots.txt yapısı şu şekilde olmalıdır:
# TÜM ARAMA MOTORU BOTLARI İÇİN TALİMATLAR
User-agent: *
# TARAMA BÜTÇESİNİ KORUMA AMAÇLI KISITLAMALAR
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /search/
Disallow: /tag/
Disallow: /feed/
Disallow: /comments/
Disallow: /*?s=*
Disallow: /author/ # Tek yazarlı bir site değilse yazar arşivlerini engellemek faydalıdır.
# GOOGLE NEWS BOTU İÇİN ÖZEL TALİMAT
User-agent: Googlebot-News
Allow: / # Tüm Haberleri Taramasına İzin Ver
# SİTE HARİTASI TANIMI (EN ÖNEMLİ KOMUT)
Sitemap: https://www.siteadi.com/sitemap_index.xml
Bu yapı, Google News botuna sınırsız erişim sağlarken, diğer botların gereksiz arşiv ve yönetim paneli sayfalarını taramasını engelleyerek sunucu yükünü ve Tarama Bütçesini optimize eder.
robots.txt Testi ve Doğrulama
Dosyanızı oluşturduktan sonra en önemli adım, hatasız çalıştığını doğrulamaktır.
- Erişim Kontrolü: Tarayıcınıza
https://www.siteadi.com/robots.txtyazarak dosyanın erişilebilir olduğunu kontrol edin. - Google Search Console: Mutlaka Google Search Console’daki Ayarlar -> Tarama -> robots.txt test aracı kısmını kullanarak yazdığınız tüm kuralların Googlebot tarafından doğru anlaşıldığından emin olun.
Sonuç olarak, robots.txt basit bir metin dosyası olsa da, özellikle yüksek içerik akışına sahip Sivas Haberleri sitesi olan Sivas Postası için doğru yönetilmesi gereken stratejik bir araçtır. Doğru kullanım, hem sitenizin hızını dolaylı olarak destekler hem de Sivas Son Dakika gelişmeleri gibi kritik içeriklerinizin Google tarafından anında dizine eklenmesini garanti eder.




