Robotům stačí jediná chyba a web přestane existovat

Proč technická chyba dokáže web prakticky vymazat z vyhledávání

Vyhledávače dnes nečtou web jako člověk. Procházejí ho roboty, které sledují odkazy, respektují pravidla v souborech a rozhodují, co zařadí do indexu. Pokud se v technickém nastavení objeví jediná chyba, dopad může být okamžitý: stránka se přestane indexovat, část webu se vyřadí z výsledků nebo se vyhledávač začne soustředit na špatné URL verze.

V praxi nejde jen o Google. Stejné signály využívají i AI nástroje typu ChatGPT s webovým přístupem, Perplexity nebo Google AI Overviews. Když robot nenajde správný obsah, nepochopí strukturu webu nebo narazí na blokaci, obsah se jednoduše nepoužije. To je zásadní rozdíl oproti klasickému SEO před několika lety: web už nehodnotí jen jeden vyhledávač, ale celý ekosystém automatizovaných systémů.

Nejčastější chyby, které zastaví indexaci

Největší riziko představují chyby, které se na první pohled tváří nenápadně. Typický příklad je robots.txt. Jediný řádek Disallow: / dokáže zablokovat celý web. Stejně nebezpečný je omylem nasazený noindex na šablonu, který se dostane na všechny produktové stránky, články nebo kategorie. V e-commerce projektech to bývá častější, než by se zdálo.

Další problém jsou kanonické adresy. Pokud stránka A odkazuje canonicalem na neexistující nebo nesouvisející stránku B, robot často přestane považovat A za hlavní verzi. Výsledek? Duplicitní obsah, rozmělněné signály a ztráta viditelnosti. Podobně nebezpečné jsou řetězce přesměrování, například z HTTP na HTTPS, pak z newww na www a ještě přes další mezikrok. Každý přesměrovací krok zpomaluje crawl a zvyšuje riziko chyby.

robots.txt – zkontrolujte, zda neblokuje důležité sekce webu.
meta robots noindex – ověřte, že není nasazen globálně omylem.
canonical – musí ukazovat na správnou, dostupnou a indexovatelnou URL.
redirect chain – ideálně maximálně 1 přesměrování, ne více kroků.
404/5xx chyby – hromadné výskyty snižují důvěru i crawl budget.

Jak robot čte web: crawl budget, renderování a signály kvality

Google i další systémy mají omezený čas a kapacitu, kterou věnují jednomu webu. Tomu se říká crawl budget. U malého webu to obvykle není kritické, ale u e-shopu s tisíci URL, filtrováním a parametry se každý zbytečný krok počítá. Pokud robot tráví čas na duplicitních stránkách, parametrech nebo chybových URL, nemusí se dostat k důležitým stránkám včas.

Moderní weby navíc často spoléhají na JavaScript. To je z pohledu SEO citlivé místo. Pokud se obsah vykresluje až po načtení skriptu a renderování selže nebo je pomalé, robot vidí prázdnou nebo neúplnou stránku. U Next.js, Reactu nebo jiných SPA frameworků je proto zásadní kontrola server-side rendering, správné předávání metadat a test v nástrojích jako Google Search Console, URL Inspection, Lighthouse nebo Screaming Frog s JavaScript renderingem.

Význam mají i signály kvality webu. Nejde jen o obsah, ale i o technickou stabilitu. Dlouhé načítání, rozpadlé layouty a chyby v mobilní verzi zhoršují uživatelský signál. Core Web Vitals dnes sledují tři metriky: LCP by ideálně měl být pod 2,5 s, INP pod 200 ms a CLS pod 0,1. Když web selhává v těchto bodech, neohrožuje jen UX, ale i šanci na dobrou viditelnost.

Co kontrolovat každý týden: praktický audit pro správce webu

Technické SEO není jednorázová úprava, ale provozní disciplína. Každý týden by měl někdo z týmu projít základní kontrolu, která zachytí problémy dřív, než se rozšíří. U menších webů stačí 20 až 30 minut, u větších projektů je vhodné mít automatizovaný monitoring.

Začněte v Google Search Console. Sledujte pokrytí indexu, počet vyloučených stránek, chyby 404, problémy s canonicalem a ruční zásahy. Pokud se počet vyloučených URL náhle zvýší o desítky procent, jde téměř vždy o technickou změnu nebo chybu v šabloně. V log analýze pak zjistíte, zda robot obchází správné stránky, nebo se ztrácí na parametrech, stránkování či přesměrováních.

Google Search Console – indexace, pokrytí, sitemap, ruční akce.
Screaming Frog – kontrola status kódů, canonicalů, meta robotů a interních odkazů.
PageSpeed Insights / Lighthouse – výkon, CLS, LCP, INP.
Ahrefs / Semrush – audit technických chyb a ztracených stránek.
Server logy – reálné chování robotů, frekvence crawl a chybové odpovědi.

V praxi se vyplatí nastavit i jednoduchý alerting. Když web vrátí více než 5 % chybových odpovědí 5xx za den, když se zvedne počet noindex stránek nebo když sitemap obsahuje URL s přesměrováním, měl by přijít automatický e-mail. U větších webů je to často rozdíl mezi drobnou opravou a týdny ztracené návštěvnosti.

Jak opravit největší pasti na webu bez zbytečných zásahů

Opravy by měly být cílené a měřitelné. Pokud je problém v robots.txt, upravte pravidla co nejpřesněji. Nezakazujte celé sekce, pokud stačí blokovat jen parametry nebo interní vyhledávání. U noindexu vždy ověřte, zda není vložen v šabloně, pluginu nebo globálním nastavení CMS. Ve WordPressu se tato chyba objevuje například po migraci nebo po aktivaci SEO pluginu, který přebírá výchozí nastavení z testovacího prostředí.

U kanonických URL platí jednoduché pravidlo: jedna stránka, jedna hlavní verze. Canonical musí ukazovat na stránku, která vrací stavový kód 200, je indexovatelná a obsahově odpovídá. U produktových filtrů je vhodné rozhodnout, které kombinace mají vlastní SEO hodnotu a které budou jen interní navigací. V e-commerce může správné omezení parametrů snížit počet zbytečných URL i o tisíce.

U přesměrování je nejlepší držet se přímočaré logiky: stará URL → nová URL. Bez mezikroků, bez řetězení, bez masových 302 tam, kde má být 301. Přesměrování testujte po nasazení pomocí crawl nástroje i přes příkazovou řádku. Pokud se objeví smyčka nebo víc než jeden skok, robot ztrácí čas a někdy URL úplně opustí.

U JS webů se vyplatí ověřit, že důležitý obsah, nadpisy, odkazy i metadata jsou dostupné v HTML hned při načtení. Čistě klientské renderování je z pohledu SEO rizikové. Pokud je to možné, použijte server-side rendering, statický export nebo hybridní přístup. U nových projektů je to často levnější než pozdější záchrana špatně indexovaného webu.

Proč se technické SEO vyplatí i kvůli AI vyhledávání

Velká změna posledních let je v tom, že vyhledávání už nekončí kliknutím na klasický modrý odkaz. AI systémy vybírají odpovědi z webů, které umí dobře přečíst, pochopit a strukturovat. To znamená, že technická čistota je dnes vstupní podmínka i pro viditelnost v AI přehledech. Pokud je web pomalý, blokovaný nebo chaotický, snižuje se šance, že se jeho obsah dostane do odpovědi.

Pomáhá strukturovaná data, jasná hierarchie nadpisů, interní prolinkování a stabilní URL. U článků, produktů, FAQ i místních firem je vhodné používat schema markup, protože usnadňuje strojové pochopení obsahu. Současně platí, že žádné schema nezachrání web, který vrací chyby, má blokovaný crawl nebo rozbité canonicaly. Technické SEO je tedy základní infrastruktura. Bez ní nefunguje obsah, link building ani AI distribuce informací.

Kdo chce mít web viditelný i za rok, neměl by sledovat jen pozice. Měl by hlídat, jestli robot vůbec dokáže stránku najít, načíst, pochopit a zařadit. V tom je rozdíl mezi webem, který roste, a webem, který stačí jediná chyba vymazat z mapy vyhledávání.