Hledání se zálohou

Fulltext hledá od minulého týdne v obou serverovnách.

Seznam.cz již před časem vybudoval záložní serverovnu s krycím jménem NAGANO, ve které jsme měli připravené stroje pro případ výpadku primární serverovny TTC. Protože by bylo škoda nechat tam tu spoustu drahého železa zahálet čekáním na výpadek, rozhodli jsme se zprovoznit hledání online v obou serverovnách zároveň.

serverovna TTC (v záložní serverovně se nesmí fotit)

V praxi to funguje tak, že hledací data se synchronizují silnou linkou s primární serverovnou, při požadavku na hledání DNS server vrací střídavě adresu buď TTC (primární serverovna) nebo NAGANA (záložní serverovna). Uživatel nic nepozná, tedy kromě toho, že mu vracíme výsledky o něco rychleji a pochopitelně spolehlivěji. Případný výpadek by měl trvat maximálně 5 minut, což je doba potřebná k přesměrování celého provozu do správné serverovny.

  • [1]Znamená to tedy, že by (čistš teoreticky) už nemělo docházet k již i tak výjimečným situacím, kdy Seznam vracel výsledky z Google místo vlastních výsledků?

  • [2]Doktore, výsledky z Google se AFAIK vracejí v okamžiku, kdy se v samotném Seznamáckém indexu nenajde dostatek relevantních výsledků. Což nastává typicky v případě hledání cizojazyčných výrazů a takové chování dává smysl, s ohledem na to, že Seznam indexuje jen české stránky. Nemyslím si tedy, že by vracení Googlovských výsledků jakkoliv souviselo s výkonem Seznamáckého fulltextu.

  • [3]Honzo, to já samozřejmě vím, ale sporadicky se mi i stalo, že mi vyskočily výsledky Google a po refreshi mi naskočily klasické výsledky Seznamu. Samozřejmě, bavím se o takových frázích, kde je výsledků dost a dost. A samozřejmě, jsem rád, že se Seznam tak v kritické době nějakého podivného výpadku zachoval. Pořád lepší nějaký byť i méně očekávaný výsledek, než nějaká chybová stránka. Svým dotazem jsem se chtěl jen zeptat, zda by se tyto sporadické výpadky zprovozněním NAGANO měly ještě více eliminovat…

  • [4]Rád bych se zeptal, co to znamená „silnou linkou“. Jaká je její kapacita?

  • [5]Jak to teď vlastně vypadá s robotem? Měl by už jet naplný výkon, že? Jen mě překvapilo, že Google stále indexuje můj web daleko rychleji…

  • Scheni

    [6]Proč se nesmí v záložní serverovně fotit? 🙂

  • G.M.Kenny

    [7]No povšiml jsem si poslední dobou, že seznam vyhledává lépe a hlavně pracuje velice rychle oproti např. centrum.

  • [8]Hlavní cíl hledání přes Google jsou skutečně cizojazyčné výsledky, nicméně tento fallback se používá i jako backup v případě problémů. Doufáme, že druhá serverovna by měla právě tyto stavy řešit. Každá serverovna je připojená přes jiného operátora. Spojení mezi serverovnami je tuším 10Gbit optika. Nějaké info je na http://seznam.sblog.cz/2007/10/23/17 .

  • David

    [9]Vim, ze fulltext je velmi slozita vec, ale od dob noveho hledani jsem zaznamenal jednu pro me neradostnou zmenu. Vlastnim web, dejme tomu domena.cz, znami cesky server s navstevnosti skoro 200tisic/den. Pokud dam hledat domena.cz, jsme na 3. miste, dosud jsme byli prvni. Ted mame nad sebou 2 pornostranky typu domena.pornostranka.cz. Na vsech ostatnich vyhledavacich jsme prirozene 1.. Timto prispevkem si nechci stezovat, nicmene me to trochu prekvapilo :-). Preju Vam, at se vyvoj dari lepe nez dosud.

  • Martym

    [10]Zaznamenal jsem nové obrázky ve fulltextu s nějakým obrázkem fotáku či-co? Alespoň jsou mnohem menší než původní obrázek, který sděloval že obrázek není(z 2,77k na 674b). Uvažujete o nějaké kvalitnější komprimaci u náhledů? Určitě by se to dalo tak o třetinu až polovinu zmenšit, nebo zvětšit rozměry náhledů při součastné bitové velikosti.

  • EJDO

    [11]Pouze kopíruji dotaz z přechozí doby ponechaný bez odpovědi. Doplňuji jen, že jyxo i google stránky indexuje a listuje. A můžete mi někdo pomoci a sdělit, proč nefungují operátory site, list a domain? 12.11.07 19:35:00 EJDO Zdravím, zcela mi zmizela zaindexovaná stránka, o sranku ani nemluvě. Stalo se to cca před týdnem až čtrnácti dny. Co se stalo? Byla sice někde na druhé straně, ale teď tam není vůbec. Díky za odpověď.

  • [12]„krycí jméno“, hmm válka vyhledávačů přisotřuje 🙂

  • Sten

    [13]Martym: můžeme to zkusit, ale vyšší komprimace u JPEG dost razantně snižuje kvalitu (a u tak malých obrázků už moc velkou úsporu nepřinese). Větší náhledy asi také nebudou, už teď jsou větší než snippety. EJDO: Nevím, pravděpodobně došlo k vyřazení stránky kvůli nějaké chybě (u nás nebo u vás – možná detekce češtiny). Operátory list ani domain nemáme (alespoň o nich nevím), operátor site ji nenajde, pokud byla stránka smazána z indexu (což vysvětluje i nulový rank).

  • [14]kolik by asi stalo to železo z té záložní serverovny… :“)

  • [15]Proč se tam nesmí fotit? :-)))