Nová verzia snippetov

Na searchtest sme nasadili novú verziu vyhľadávania, ktorej hlavnou zmenou sú nové snippety.

Čo sú a na čo slúžia snippety

Vo fulltexte pod pojmom snippet rozumieme úryvok, ktorý zobrazujeme pre výsledok vyhľadávania. Snippety majú za účel poskytnúť užívateľom predstavu o obsahu stránky a ich voľba ovplyvňuje užívateľský zážitok pri vyhľadávaní a vplyv má aj na preklikovosť výsledkov.

Aké snippety sa snažíme tvoriť

Snažíme sa na malom priestore poskytnúť užívateľom čo najviac informácií, a preto zobrazujeme aj  snímky stránok. Teraz sme sa sústredili na tvorbu úryvku zo stránky. Veríme, že tento úryvok by mal súvisieť s dotazom, ktorý užívateľ zadal a mal by byť prehľadný.
Po novom vyberáme súvislejšie úryvky týkajúce sa hľadanej fráze a obsahujúce hľadané slová. Preferujeme prirodzený text, z ktorého vyberáme celé vety. V prípade, že na stránke takýto text nenájdeme, zobrazujeme okolia hľadaných slov. Texty, ktoré na stránke viditeľné nie sú, napríklad meta popis, momentálne nezobrazujeme.
Evidentným rozdielom oproti starým úryvkom je ich predĺženie najmä pri dlhých dotazoch. Taktiež sme pristúpili z nahradzovaniu vybraných nie alfa-numerických znakov, napríklad nahradzujeme ‚ | ‚ za   ‚, ‚, aby sme zjednotili vzhľad výsledkov.

Informácie k výsledkom

Nasadili sme aj nový algoritmus výpočtu relevancie, kde však nastali len drobné zmeny.
Zaujímajú nás najmä vaše postrehy a pripomienky k novým snippetom, za ktoré budeme vďačný. V prípade nájdených chýb nám najviac pomôžu konkrétne príklady.

  • mato

    [1]no to se toho teda dovím http://searchtest.seznam.cz/?q=chorvatsko+ubytov%C3%A1n%C3%AD&sId=K6k0E63HwzDu34V32RZy&source=web asi se budu muset naučit maďarsky apod

  • [2]Nasadili jsme aj nový algoritmus, kde však nastali len drobné zmeny? No ta drobná změna můj web ani nezaindexuje. http://searchtest.seznam.cz/?q=Horoskopy+na+m%C3%ADru V první fázi se nejprve můj web propadl na druhou stranu kw: „horoskopy“, uživatelé tedy začali hledat kw: „horoskopy na míru“ a teď již teda musejí použít google? Mám to našim návštěvníkům někam napsat? Nebo proč náš web není indexován? Díky za odpověď http://www.horoskopnamiru.cz

  • [3]Prohlédl jsem v rychlosti výsledky u top kw youtube.com, facebook, google.com, tn.cz a z mého pohledu nic moc relevantního v textu u popisku webů nacházející se na 1. mistě nenacházím. (snippet)

  • [4][1] Přidat do algoritmu kontrolu jazyka je výborný nápad, díky za něj! [2] Searchtest nám běží v kanclu a nejsem si jistý, že se opírá do produkčních dat. Horoskopnamiru.cz opravdu zmizel ze searchtestu, ale je možné, že na ostrém bude (teď tam je). Ostatně můžete si na to zpracovat horoskop. Pokud vyjde, že zmizíte z výsledků, tak to je skutečně chyba v indexu. Pokud vám v horoskopu vyjde, že ve výsledcích zůstanete, tak je to tím rozdílem searchtestu a ostrého hledání. [3] Hm, na navigační dotazy jsme se tentokrát nesoustředili. Díky za upozornění na slabinu. Tady asi fakt budeme muset použít nějaká metadata.

  • [5]hledám li sídlo společnosti, patrně nehledám sídlo microsotftu nebo dalších několika konkrétních firem::: http://searchtest.seznam.cz/?q=s%C3%ADdlo+spole%C4%8Dnosti&sId=QHSRDboWwTuGK4ZZx1HP&source=web

  • [6]Z meho pohledu prinasi novy algoritmus hlavne delsi snippety u nekterych vysledku, kde byly vetsinou jen 2-3 slova. Nyni je to mnohem lepsi…

  • Tom

    [7]Chtěl bych se zeptat, proč vypadly nějaké fráze z našeptávače a zůstávají tam nesmysly. Jako příklad uvádím velmi hledanou frázi: spodní prádlo – toto zde chybí a místo toho se nabízí spodní kalhotky a spodní košilka. Děkuji za vysvětlení situace.

  • [8][5] A jaké tedy hledáte sídlo společnosti? Není to spíš tím, že se neumíte správně zeptat?

  • mic362

    [9]Snippety dobrý. Jen dotaz k té upravě algoritmu. Na slovo autobazar už není server tipcars.com ani v první 30, a při současném vyhledavání je na 3 místě? Proč? http://search.seznam.cz/?q=autobazar&mod=f http://searchtest.seznam.cz/?q=autobazar

  • [10]Moje stránky vypadly z indexu, snad to v tomhle stavu nepůjde do ostrého provozu… Snippety se povedly, to jo, je to určitě změna k lepšímu.

  • Tim

    [11]Muzete prosim zareagovat na dotazy tykajici se indexace? Je jiz vse v poradku? Diky.

  • OESTS

    [12][11] V pořádku je dost relativní pojem. Jednou za měsíc ti nestačí?

  • [13]Proboha lidi, přestaňte ty hysterické reakce na téma „nejsem ve výsledcích“. Testovací prostředí mělo odtestovat zejména snippety, nikoliv relevanci ani úplnost indexu.

  • radofan

    [14][9],[10],[11],[12] Index v produkcii a na searchtest.seznam.cz nie je rovnaký a ani nebude. Momentálne sú rozdiely minimálne. [7] Do našeptávača nedávame všetky časté dotazy kvôli pornu. Niektoré prípady sú naozaj sporné. Cieľom tejto bety bolo otestovanie snippetov. Boli by sme teda vďačný za návrhy a pripomienky ohľadom tejto témy.

  • phantom

    [15]Snipetty vypadají hezky, pokud se jedná o věty. Pokud jsou místo snippetů jen nadpisy nebo to zmíněné okolí hledaného textu, už mi to tak hezké nepříjde.

  • Tim

    [16][12],[13],[14] Slo mi o to, jestli je jiz funkcni parametr index v realu (ne searchtestu). Kamarad dela novy eshop a po vice nez mesici se mu ukazuje na seznamu zaindexovanych asi 14 stranek:-(

  • NMVLG

    [17]Koukám, že se mění velikost náhledu stránky. Nebylo by lepší nechat všechny náhledy stejně velký/vysoký?

  • [18][16] Pokud dělá kamarád eshop s nějakým unikátním zbožím, tak by se měl nabírat rychleji než 14 stránek za měsíc. Jestli ale prodává jenom to, co tisíce dalších shopů, pak není důvod, aby byl v indexu nějak extra rychle, protože uživatelům to nic zásadního nepřinese. Pošlete mi případně prosím odkaz, zkontroluju to. [17] Zkoušíme obrázek se screenshotem snižovat, pokud je malý popisek. Cílem je dostat na stránku co nejvíc výsledků. [15] Když jsou ve snippetech jenom nadpisy, tak to opravdu není hezké. Ale snad to není horší, než bylo. Pokud najdete příklad, který má výrazně horší snippet než stará verze, budu za něj rád.

  • [19]nebolo by dobre, ak by ste spravili nijaky Flash, alebo JS, ked prejdem mysou na obrazok stranky, zobrazi sa mi väcsi obrazok? Tie terajsie mi nic nedaju, mozno zistim, ci ma stranka pekny design ale vobec netusim, co tam je. Inak popis je podla mna uzasny.

  • [20][17][18]Taky bych se přimlouvala za stejnou velikost screenshotů, připadá mi to tak přehlednější. Ony vůbec ty screenshoty jsou myslím největší konkurenční výhodou Seznamu proti Googlu. Uživatelům to umožní přeskočit ty případné omyly na prvních místech, nic ve zlém 🙂

  • [21][2] Děkujeme za report, že zmizely některé weby. Searchtest se sice opírá do ostrých indexů, ale měl špatně nastavené cesty ke dvěma z osmnácti svazků. Na svazky dělíme URL podle domény, takže když vypadne celý svazek, vypadne i celá doména. Teď už je to i na testu v pořádku. V ostrém hledání na to máme monitoring, takže tam se to stát nemůže. [20] My si taky myslíme, že screenshoty jsou naší velkou výhodou, proto se je snažíme dělat pořádně. Různě vysoké je navrhli naši návrháři rozhraní, kterým v tomhle důvěřujeme. [19] Objevení většího screenshotu je hezký nápad, akorát je to datově náročnější. Museli bychom buďto uživatelům stahovat data, která se jim nezobrazí (spodek vyššího screenshotu), nebo načítat asynchronně jiný obrázek s velmi podobným obsahem. Taky bychom museli přefotit celý web ještě na jinou velikost screenshotu. Teoreticky to ale někdy udělat můžeme, dík za tip.

  • [22][21] No nevim jak je to opraveno, ale nas e-shop je na slovo sexshop na normalnim vyhledavani na prvni strance, ale v searchtestu jsem jej na prvnich trech nenasel. Jinak co se tyce te velikosti screenshotu tak to pro me jako uzivatele je horsi – hur se v tom orientuje, kdo ma vysoky baner tak jde pak na nem videt jen on a uz nevim co je nastrankach – tak tam musim najet , abych zjistil ze tam je neco co jsem nehledal – osobni nazor. Jinak se omlouvam za diakritiku, jsem na Nemeckem PC.

  • Michal

    [23]Navrhuji do snippet vkládat obsah description, pokud je ve shodě s dotazem. Náhledy by pak nebyly zavádějící a byly podkontrolou vlastníka webu. Také jsem pro stejné rozměry screenshotu.

  • MBAYL

    [24]Seznam používám jenom pro kontrolování pozic, ale že stvávající vzhled – screenshoty celý dost znepřehledňujou. Na druhou stranu se asi vytratej debaty o nerelavních výsledcích, zvětší se proklik na weby a změnší čas strávený na stránkách. Neděláte to jen pro zvýšení MP skliku? Z mojeho pohledu jsou neprávem znevýhodněný stránky s malým popiskem. A celý to vypadá dost neprofesionálně.

  • radofan

    [25][23] Vďaka za tip. [24] Kontrolovanie pozícií užívatelia bežne nerobia takže to nie je naša priorita. Screenshoty u výsledkov nezvyšujú zisky zo skliku.

  • dev

    [26]Ty různě vysoké screeny nejsou dobrý nápad, ono pak odkazy s menším screenem vypadají méně důležité.

  • [27]A nebylo by smysluplnější přizpůsobovat velikost snippetů velikosti obrázků a ne obráceně? Osobně mě různé velikosti obrázků v SERPu moc nenadchly. Dokonce mě ani nenapadá žádná jiná aplikace, která by zobrazovala výpis výsledků s různou velikostí.

  • Honza

    [28]Ahoj. Připojuji se k výtce na různé velikosti screenshotů. Je mi jasné, že je asi snahou nacpat všech 10 vysledků do oblasti, která se nemusí scrollovat, ale zdá se mi, že weby s menším screenem jsou znevyhodněné.

  • Danka

    [29]Ahoj kluci, tak jsem tu našla další problemek v našeptávači. testnula jsem to v IE a FF. Pokud zadám na http://www.seznam.cz do hledání lib. slovo např „trezory“ a vyběhnou mi výsledky(http://search.seznam.cz/?q=trezory&mod=f). a potom za to slovo dám třeba mezeru tak vyběhne našeptávač, ale nedá se kliknout myší. klavesnicí to jde. Tak zatim

  • me

    [30]Potvrzuju předchozí bug. Na našeptávané řadky jde kliknout myší, ale našeptávač zmizí a nic se nestane. Firefox 3.0.15.

  • me

    [31]Také si na různou velikost náhledů nemůžu zvyknout. Vytváří to dojem chaosu, popisky mi připadají hůře čitelné, protože je obrázek dominantou pozice (na rozdíl od Google, kde je hlavní nadpis) a přitom je každý jinak vysoký. Je to jakoby měli v novinách každý řádek jinak velký. O zvýhodňování webů s delším popiskem ani nemluvě. Špatné.

  • Maulwurf

    [32]http://searchtest.seznam.cz/?q=the+grand+makadi&sId=wlzpSsA7w9bk7Uz2rccO&source=top – 4.nemecke-ck.invia.cz a 10.zajezdy.orbion.cz – šíleně dlouhý (a myslím že nesmyslný) popis – výpis hotelů. Navíc duplicitní stránky.

  • radofan

    [33][29],[32] Vďaka za info.

  • Martin

    [34]Tak toto fakt odpovídá té přehlednosti, celým větám, atd. Když zadáte koupelnové doplňky, tak na 1. straně máte: Keramika Předstěnové Instalace Koupelnový Nábytek Koupelnové Doplňky Obklady A Dlažby Kuchyňské Dřezy Másážní Sprchové Panely Akční Zboží Sifony, Výpustě A Odtokové Žlaby … to jsou krásné české věty. Fakt je, že slováci asi nemohou rozumět tomu, co je to česká věta, proto to takto dopadá!

  • radofan

    [35][34] Ak nájdete na tej stránke celú vetu, ktorá by sa hodila do snippetu máte u mňa pivo.

  • [36]21: teoreticky by ste to mohli vyriesit tak, ze by si prihlaseny user vybral, ci chce mat male alebo velke obrazky alebo ci chce prisposobit obrazok popisku, no a casom by ste defaultne mohli nastavit vyhladavanie nastavit bez obrazkov, respektive s miniaturnymi. No a ak by ste mi napisali na mail, napada ma este jedna funkcia, ktora by zabezpecila mnoho uzivatelov a este nikde som ju nevidel, len ju nechcem davat takto verejne a myslim, ze do 1000 znakov by som ju ani nepopisal a ak ano, tak nie detailne 🙂

  • [37]Znovu se vratim k te velikosti nahledu. Kdyz je nejaka domena co ma v nazvu pismeno y a je zmenseny nahled tak to y vypada jako pismeno v . Coz me neprijde dost profesionalni. priklad si muzeme dat treba na slove darky : http://search.seznam.cz/?q=darky&sId=ewdLCWb7OkEKszXhojfs&source=top ( na prvni strance je to 9 a 10 pozice a na druhe strance jich je spousty ) jeste dodam ze jsem to zkousel jen na IE.

  • Jan

    [38]chtelo by to se podivat na frazy tapety na zed 2. strana des a hruza, 1. prvni strane 3xMFA, na 2. 9/10 linkove farmy a mfa, a pritom za nimy kvalitni weby

  • xxx

    [39]Pánové v seznamu, přestaňte se plácat po ramenou a věřit, že vše je v pohodě. MFA a další šílenosti se vám zase derou do popředí.

  • [40]Nevím, čím to je. Ale nějak nám to nebere metadescription, ač je korektně vyplněn a raději si to vybere neoptimalizovanou větu z textu.

  • mic362

    [41]Otárka na hledaní dotazu czech sudoku http://search.seznam.cz/?q=czech+sudoku&mod=f Tam neni zadny snippet ? ( 2 slova nepovažuju za popis stránky)

  • abrak

    [42]Pokud se na „prvním“ místě objeví výpis z firmy.cz je normální že jeho popisek zabírá 9 řádek + titulek + adresa provozovny + odkaz další informace = celkem 12 řádků? viz. http://search.seznam.cz/?q=parfemy-vune.cz&sId=ZlXyyGKHCVKDJWeFlVwt&source=top

  • mic362

    [43][42] to je pekne, ale proc u tohoto hledání je výpis z firem až uplně na konci http://search.seznam.cz/?q=tipcars.com&sId=vAkUPtJtwVZwEz-n5Q2p&source=top

  • OZRMQ

    [44]kuci, dyt je to uplne hotovy. sledujete vubec co vytvarite v tom serpu?

  • Lucky

    [45]Čím víc se to snažíte vylepšit, tak o to je to horší koukám, nevadí mi to už si pomalu začínám zvykat na Google, jen je mi to líto..

  • [46]fulltext.sblog.cz indexovaných stránek také, díky 😉

  • [47]Myslím, že snippet by neměl obsahovat informace z drobečkové navigace – není to souvislý text. Např. http://search.seznam.cz/?sourceid=szn-HP&thru=&q=ch%C5%99ipka+u+d%C4%9Bt%C3%AD

  • Pavlovsky

    [48]Nasel jsem tehle web a pripojuji svuj dotaz z helpedesku . Muzete mi nekdo odpovedet : Nyní s Vámi hovoří Jakub Jareš (Fulltext) Pavlovsky: Dobry den Jakub Jareš: Dobrý den, jak Vám mohu pomoci ? Pavlovsky: mam takovy zdvorily dotaz Pavlovsky: mam tady firmu resp. jejich nabidku na Pavlovsky: tzv seo-listu do paticky stranek Pavlovsky: kde mi nabizeji ze kdyz si ji u nich koupim Pavlovsky: tak mi to pomuze ve vyhledavani je to pravda Pavlovsky: neco jsem si o tom cetl Pavlovsky: i na vasich strankach Pavlovsky: ze to nedoporucujete Pavlovsky: ale presto podle vysledku ktere mi firma uvadi jako reference jsou ty stranky na prvnich mistech Pavlovsky: muzete mi poradit Pavlovsky: jedna se web http://www.krby-kozak.cz/ Jakub Jareš: Vteřinku vydržte hledám Vám požadovaný článek v naší nápovědě. Pavlovsky: aha dekuji cist umim take Pavlovsky: ale i na svych strankach pisete ze to nedoporucujete Jakub Jareš: Manipulace s Rankem – snaha o manipulaci s jeho přirozeným rozdělěním. Tímto je m

  • [49]No pěkný dotaz, škoda, že není celý, nebot je pěkně na tvrdo…

  • [50]Píšu ohledně těch snippetu, ale nevím zda sem to dobře, pochopil,tak se omlouvám, pokud píšu blbost. Jde mi o to, že sem si vyzkoušel jak přesně seznam zaindexoval můj nový článek na webu a dal tam jeho nadpis: „FM Group nabízí unikátní školící systém“ zadal do seznamu a sami se můžete podívat co mi vyjelo http://search.seznam.cz/searchScreen?w=FM+Group+nab%C3%ADz%C3%AD+unik%C3%A1tn%C3%AD+%C5%A1kol%C3%ADc%C3%AD+syst%C3%A9m&mod=f Proč není zvýrazněná celá ta věta hkedaného sousloví a jsou zvýrazněná slova v jejím okolí, když vyhledávaná slova jsou hned vedle sebe? Ono i relevantnost na slovo FM Group, snažím se psát pro lidi, informace, unikátní texty,ale je mi to k ničemu…Ale to už sem asi nepatří.

  • [51]Vyhledávání na KW „ratanový nábytek“ ukáže snippet tvořený jen krátkým nadpisem a tím i opticky zmenší snippet oproti okolním zápisům. Bylo by dobré, aby počet znaků byl stanoven tak, aby byl popis vždy na 2 řádky.

  • [52]Podle mě je nová verze snipettů vyhovující. Nikdy se nelze zavděčit všem.