Změny ve výsledcích hledání

Nově nasazená funkčnost v hledání a přidružených službách.

Od 1. ledna došlo k několika úpravám v ergonomii vyhledávání na search.seznam.cz a několika dalších službách, které s fulltextovým vyhledáváním souvisí. Jde především o stránkování, označování nalezených dokumentů PDF, rozšíření přidávacího formuláře a nápovědy pro hledání. V neposlední řadě i ochrana proti DoS útokům.

Nová podoba stránkování má za úkol zjednodušit pohyb po stránkách s výsledky hledání. Týká se stránek výsledku hledání s pořadovým číslem 6 – 100. Původní podoba stránkování byla přeci jen poněkud zastaralá.

Označení nalezených dokumentů PDF, tak aby bylo jejich rozpoznání jednodušší a přehlednější.


příklad nalezeného dokumentu PDF

Přidání nových URL přes přidávací formulář je nově obohaceno o funkci, která informuje, zda se založení URL zdařilo. Další 2 funkce, tedy přidání do fronty pro obnovení stránky a obnovení náhledu stránky byly zachovány.

Rozšíření nápovědy pro fulltextové vyhledávání na Seznam nápovědě resp. přímo sekce nápovědy pro hledání v Internetu, která by nyní měla sloužit nejen běžnému uživateli, ale dokáže poskytnout informace jak webmásterům tak i SEO optimalizátorům.

Dále byla přidána ochrana proti DoS útokům vedeným přímo proti hledání. Důvodem je jejich nezanedbatelné rozšíření v poslední době. Tedy, pokud bude zaznamenán zvýšený počet dotazů z jedné IP adresy za určitý časový úsek, pak bude zobrazena CAPTCHA, kterou je třeba pro další hledání opsat. Pak může uživatel v prohlížeči, ve kterém obrázek psal opět normálně hledat. Plná funkčnost zatím není nasazena – stanovujeme ty správné limity a rozhodujeme se, jak přísní budeme.

  • [1]Při přidávání změněné stránky přes přidávací formulář se mi objevila hláška – PŘIDÁNÍ SE NEZDAŘILO – co z toho pro mě vyplývá? – zkusit později – použít kontrolní formulář Jinak změny vítám, hlavně možnost vyhledávání ve výsledcích fulltextu nad 10. stránku, díky.

  • [2]Pokud se přidávání nezdařilo, pak je vhodné použít kontrolní formulář. Je to nejsnazší cesta k nápravě tedy zařazení URL do hledání.

  • BoB

    [3]Martym: Hledání nad 10 stránkou výsledků fungovalo už dříve, jen se na tyto stránky se starým stránkováním poněkud hůře dostávalo a špatně orientovalo.

  • Martym

    [4]Přidávání url: Nakonec se přidání url zdařilo ale stránka je asi dost vytížená, z 10 pokusů se přidání vydařilo 2 krát, takže asi to chce chvilku počkat a zkusit znovu.

  • insekticid
  • [6]Také se mi nepodařilo stránku přidat. Ani na 20. pokus.

  • [7]vyborne, po vypadavani fulltextu, xss, nefunkcnich sitemapach tu mame dalsi skvele vyladenou sluzbu, vivala fulltext team

  • [8]Bude seznam umět hledat i v jiných typech dokumentů než html a PDF?

  • Ivo

    [9]Těmi DoS útoky myslíte dotazy z nástrojů pro pozice ve vyhledávačích?

  • pikachu

    [10]tak vám nevím… poslední dobou je to horší a horší… nový web se nezaindexuje ani po třech týdnech, naopak u starého webu se počet zaindexovaných stránek snižuje (ikdyž přibývají odkazy a roste Srank), přidání přes formulář nejde, ve vyhledávání se na prvních místech zobrazují různé paskvily…

  • petrox

    [11]Ivo: ano, přesně tak. Sledování pozic ještě v hledání sneseme, ale něco jiného je, když z jednoho IP chodí řádově desítky či stovky dotazů za vteřinu.

  • petrox

    [12]Jakub: ano, plánujeme i další typy. V blízké době přijde DOC.

  • [13]Po těchto vašich změnách Vám z vyhledávání zmizela naše stránka: http://www.in-pocasi.eu (úvodní strana a některé podstránky). Při dotazu “In-počasí” vyhledá pouze subweb snih.in-pocasi.eu a úvodní stránku nenajde (ani při dotazu site). Můžete mi poradit co udělat pro opětovné zařazení (přidávací formulář jsem zkoušel i zaslání dotazu)?

  • [14]Dobrý den,stále se mi nedaří dostat starnu http://www.braganca.cz a její podstránky typu (http://www.braganca.cz/braganca-kontakt.htm atd.)odkazy jsou v pořádku google je indexuje bez problému ale na Seznam.cz jsou stále staré s adresama typu (www.braganca.cz/index_soubory/Page385.htm ) a hlavně tam není ani hlavní strana http://www.braganca.cz Už nevím co s tím,mužete mi poradit.

  • dsm

    [15]David: Mám stejný problém u jednoho webu. Zřejmě to je zas nějaký generální bug ;-).

  • robroy

    [16]Janer: stránka neobsahuje indexovatelný text, pouze obrázky. Stránky bez textu Seznam neindexuje – nedokáže rozhodnout o jazyce stránky.

  • Web

    [17]Janer: Proboha a co Vám má Seznam indexovat? Vždyť to máte všecko jako obrázky, to si představujete, že tam má Seznam OCRko a bude hádat, co že na těch obrázcích je napsáno? Myslím že tady se chová FT Seznamu maximálně korektně – nevím proč by měl vyhledávat stránky bez textu. U těch starých doporučuju přesměrování přes kód 301, nicméně pokud to budou nadále stránky bez textu…

  • Web

    [18]Bude se v pdfkách dělat citační analýza?

  • Renaj

    [19]Janer: Zda se, ze kvalita vaseho webu zcela koresponduje s kvalitou vaseho “podnikani”. Tachyony a podobne nesmysly pri cenach okolo 500-1000Kc/hod, je ryzi sarlatanstvi. Je jenom dobre, ze vam Seznam podobne nesmysly neindexuje, aspon bude mene lidi, kteri vam naleti.

  • [20]To Renaj: Sice máte pravdu (min. v první části příspěvku), ale vzhledem k tématu diskuze je to irelevantní. To Janer: Doporučuji zvážit následující kroky: 1) Vyhnat toho, kdo Vám ten web dělal 2) Kompletně smazat stávající prezentaci 3) Nechat si od někoho nainstalovat libovolný redakční systém – např. wordPress 4) Veškerá data vložit jako text 5) Zapracovat na zpětných odkazech

  • BoB

    [21]Ad Braganca.cz: Evidentně se na to všichni koukáte něčím jiným, než IE – tam jsou totiž texty skutečnými texty a nikoliv obrázky. Ale nehodlám tu spekulovat nad důvody takovéhoto šíleného řešení…

  • [22]To TonyK: Téma zdejší diskuze, pokud mě neklame, je: Nově nasazená funkčnost v hledání a přidružených službách Seznamu. Takže nejspíš spamer Janer (http://www.jagg.cz/bookmarks.php/janer) by ve zdejším prostředí nemusel dostávat bližších pozorností. Ale abych se vrátil k tématu diskuze. Zdá se, že v Seznam se chopili vývoje správný lidi, čím dál víc mě Seznam začíná zajímat i nejenom z profesního hlediska ale i z pohledu uživatele.

  • Martym

    [23]V poslední době se velice rozšířil tento nešvar: Nezanedbatelná část uživatelů fulltextového vyhledávání seznamu vepisuje adresu svých oblíbených stránek do vyhledávacího políčka v plném tvaru (www.example.cz). Výpis výsledků vyhledávání však nabídne uživateli pouze spoustu PARAZITNÍCH stránek, vetšinou přeplněných reklamami a odkaz na hledanou stránku najdeme pouze v nevýrazném řádečku TIP:http://www.example.cz kde je velice snadno přehlédnutelný. Výrazně to také snižuje důvěryhodnost výsledků fulltextového vyhledávání. Omlouvám se za příspěvek mimo téma této diskuze.

  • [24]To Martym: Ono to není ani tak nešvar uživatelů, je to spíš neznalost či nepozornost uživatelů, kteří si pustí internet (takové to éčko na ploše) 🙂 a zadají adresu webu, kam chtějí jít. Jenomže Seznam vezme fokus do vyhledávacího políčka a tak píší vlastně tam, anžto nekoukají na monitor ale na klávesnici. To, že Seznam vyhodí “TIP” je od něj naopak velmi pěkné, nedokážu si představit, co by to bylo za pakárnu, kdyby Seznam například na takovouto stránku přímo přesměroval. Mnohdy totiž je více relevantní obsah jiné stránky, než samotná “hledaná” doména. Mrkněte se třeba na výsledek u Google na frázi http://www.example.com – tipický příklad relevantností. A zvýraznění v podobě jaké je vidět například u S-kliku nad výsledky vyhledávání by zřejmě mnoho uživatelů přeskočilo. Možná by stálo za to, abyste se koukl pod ruku na práci “uživatelům internetu”, kteří nejsou zrovna moc sběhlí. Možná byste pak svůj postoj trochu přehodnotil – toť můj názor na vámi popisovaný nešvar…

  • Web

    [25]Nejde o focus 🙂 Spousta uživatelů (já náhodou jednoho takového mám doma 🙂 ) má synonymum internet=Seznam. Oni nevědí na co je to horní políčko v Internet Exploreru. Když se upgradovalo na IE7 a ztratilo se nastavení homepage na Seznam, tak bezradně koukají, že jim někdo “ukradl internet”… Oni zkrátka chtějí zadat do políčka seznamu http://www.sblog.cz a jít na sblog 🙂 Na druhou stranu (viz prednáška 🙂 ), http://www.dovolenavchorvatsku2008.cz nemusí být nejlepší stránka na vyhledávání dovolená v chorvatsku 2008. Takže je podle mě správně, aby to nemělo mimořádný vliv na fulltext a bylo to obstaráno samostatnou fcí…

  • Martym

    [26]Proti chování uživatelů nic nemám ale zaráží mě množství stránek které toho zneužívaji a staví si na tom dokonce živnost. Ten “TIP” bych si představoval mnohem výraznější. Tady je příklad: http://search.seznam.cz/?q=www.nova.cz&mod=f&sId=eXCFjNqxo7mT&sug=1

  • [27]To Martym: Tak zrovna tento typ parazitování není (dle mého názoru) zas tak moc velký – jsou tam jen tři parazitující stránky:-) Dokážu si ale představit, že by byla plná stránka parazitních výsledků:-) Ale je fakt, že by Seznam mohl “poznat”, že “hledám” konkrétní doménu a mohl by třeba i nechat ten “TIP” a k tomu jako první výsledek přidat odkaz na onu doménu. Myslím, že by mu to nemuselo činit problém:-)

  • Martym

    [28]To Pavel K.: Já bych byl pro radikálnější řešení. Pokud dotaz začíná na “www.” odmazal bych to a nechal jen následující text, předpokládám že výhody by mnohonásobně převážily nevýhody nebo se mýlím? Většina stránek přece nepíše do “title” před popis obsahu stránek “www(tečka) a ani nikam dál do textu. Snad jenom ty weby u kteých název domény vystihuje zaměření a obsah webu ale zase to nemusí být nerelevantnější stránka na požadovaný dotaz.

  • Sten

    [29]David: vaše úvodní stránka v hledání je, ostatní stránky byly robotem omylem vyřazeny, na nápravě se pracuje Janer: bohužel vaše stránka je složená pouze z obrázků (tedy nějaký text tam je, ale podle HTML standardu je umístěn v komentářích, které nesmíme používat), se kterými si náš robot neporadí, a tak ji odmítá jako nečeskou. Doporučuji autorovi „Krutej SEO“ vynadat, protože kvalitní webové stránky se nedělají ve Wordu. Pavel Kodýtek: dobrý nápad, mohli bychom to vyzkoušet Martym: dotaz se rozloží na jednotlivá slova, v současnosti se www do relevance započítává, v budoucnu by jako nerelevantní mělo dost snížit váhu

  • yayks

    [30]je to bída, pánové… seznambot zavedené stránky vyřazuje a nové neindexuje, pozoruju to už přes týden ;-/

  • [31]Sten: před tím tam nebyla ani ta úvodní. Kdy myslíte, že se opět objeví stránky ve vyhledávači? Děkuji.

  • Martin

    [32]je to sice OT, ale funguje vam u tohoto blogu RSS ? Pouzivam jako ctecku IE 7 a ten mi vypise: Aplikace Internet Explorer nemůže zobrazit tento informační kanál. Aplikace Internet Explorer nepodporuje informační kanály s definicemi DTD. Stejny problem mam i u IL BLogu a patrne je to tedy problem celeho sblog.cz.

  • Sten

    [33]David: už by to mělo být v pořádku Martin: ve Firefoxu i Akregatoru funguje (jiné čtečky jsem nezkoušel). Použitý formát RSS 0.91 je zastaralý a Internet Explorer jej asi nepodporuje.

  • [34]Sten: ty stránky tam ovšem stále nejsou. Např. stránka http://www.in-pocasi.eu/pocasi-svet/ se neobjevuje ani na dotaz site:www.in-pocasi.eu počasí ve světě. Místo toho je tam nesmyslně stránka http://www.in-pocasi.eu/pocasi-svet/?misto=afrika. Takhle je to i u několika dalších stránek.

  • petrox

    [35]David: url http://www.in-pocasi.eu/pocasi-svet/ je na dotaz “počasí ve světě” v současné chvíli na 3. pozici

  • [36]petrox: Jo teď už je to v pořádku (snad to tak i zůstane). Děkuji.

  • Janíček

    [37]Je to pravda nebo ne? Šlo by to udělat? http://snadhledem.cz/42-kocici-seznam-cz.html

  • [38]Konečně jsou při výsledcích vyhledávání vyznačeny PDFka, což ušetří spoustu “backspaceů” Co se týče stránkování, nějak si nemůžu zvyknout na zarovnani vlevo – celou dobu bylo stránkování centrováno, jako je tomu u googlu a teď najednou to musím hledat… ale asi si zvyknu, jako na spoustu dalších nových věcí na seznamu.

  • houstik

    [39]Co se to stalo s fulltextem přes víkend? Výsledky jsou úplně rozházené proti minulému týdnu a v mnoha případech nerelevantní. Např. na slovo “paříž” jsou na prvních dvou místech články deníku Super a Novinky.cz a s Paříží téměř nesouvisí…

  • [40]S tou nerelevantností souhlasím. Například na slova Praha 1,2,3,4,10 vrací seznam výsledky, které neodpovídají dané části. Kdežto např. pro MČ P6 je vše již v pořádku a seznam vrací poměrně přesné výsledky.

  • Sten

    [41]Janíček: šlo by to udělat, ale zatím naše hledání nic takového neumožňuje.

  • [42]Zdravím, nejde mi do fulltextu přidat web s koncovkou .to – píše to neplatná URL… mám čekat až se web přidá sám nebo se mi do fulltextu sám ani nikdy nepřidá?

  • Scheni

    [43]To jsou mi zase nějaké psí kusy. Ve fulltextu se z ničeho nic objevila stránka, která byla cca před 2 měsíci nahrazena, přitom její aktuální podobu již seznam docela dlouho ukazoval 🙂 Ne že by to bylo v tomto případě nějak extrémně důležité, nicméně by mě docela zajímalo co se stalo.

  • Krajan

    [44]Výsledky vyhledávání jsou od soboty dost nerelevatní jedná se o chybu….? Koukal jsem taky, že robot chodí z jiné IP, mohli by jste mi o te zmene neco napsat.

  • [45]Jiná IP robota – robot byl teď dočasně puštěný na více počítačích, proto chodil i z jiných IP adres. Asi to ještě nějakou dobu potrvá, ale časem by se to mělo zase vrátit zpět.

  • [46]Poslední týden také pozoruji, že se výsledky moc nehýbou asi nějaký výpadek. Neví někdo jak dlouho tů může ještě trvat ?

  • [47]Velmi vítam výrazné označení, že nalezený výsledek je ve formátu PDF. Možná by stálo za úvahu dát uživateli možnost PDF dokumenty ve výsledcích nezobrazovat vůbec.

  • petr

    [48]Když přidám stránku přes kontrolní formulář, stránka stejně není do vyhledávání zapsána. A to jsem ji tam dával před 10ti dny… tak nevím co s tím. Dřív jsem přidal stránku a do cca2 dní se objevila ve vyhledávání a ted nic 🙁

  • [49]Dobrý den, rád bych se zeptal, zda byly mé stránky z nějakého důvodu penalizovány. Pohyboval jsem se na předních pozicích a nyní bohužel ani v první stovce. O této penalizaci bych rád věděl a rád bych jí odstranil. Děkuji, p.s.

  • Dana

    [50]Dobrý den, musím naprosto souhlasit s tím, že výsledky vyhledávání jsou v posledních třech týdnech katastrofální a absolutně nerelavantní. Pokud chce seznam uvolnit pozice jiným vyhledavačům jen tak dál. Z hlediska uživatele je to hrůza. Doufám, že jde jen o dočasný problém či chybu a úroveň fulltextového vyhledávání se vrátí do normálu. Mohl by to někdo ze Seznamu okomentovat? Děkuji velice

  • [51]Dobrý den. Jsem zvědavý co povíte na tento článek 😉 http://www.hrajese.cz/clanky/clanek/seznamcz-vs-hrajesecz-10_73/