Zařazení upoutávek na relevantní pozice

V současné době jsou pro upoutávky vyčleněny na stránce s vyhledáváním dvě pozice – horní a spodní pozice pro upoutávky.

Horní pozice je umístěna nad výsledky vyhledávání a je obsazena pouze tehdy, pokud víme, že upoutávka je pro uživatele přínosná. Spodní pozice pro upoutávky je umístěna pod výsledky vyhledávání a její význam spočívá zejména k doplnění výsledků o potenciálně zajímanou informaci a k zobrazování méně zajímavých upoutávek.

Způsob rozmístění upoutávek byl navržen před několika lety. V době návrhu se počítalo s řádově několika druhy upoutávek. V současné době se počet vydávaných upoutávek rozrostl na několik desítek. Se zvýšeným počtem upoutávek se čím dál více začaly projevovat negativní vlastnosti původního návrhu:

  1. Nestálost upoutávky na horní pozici
    Pro dotaz může existovat více upoutávek, o kterých víme, že jsou vhodné k zobrazení na horní pozici. V takovém případě se náhodně volí jedna z nich. Z uživatelského hlediska to znamená, že pro stejný dotaz dostává uživatel různé upoutávky. Nemůže se tak spolehnout, že na daný dotaz se upoutávka daného typu zobrazí. Má také pocit, že se stránka s vyhledáváním často mění. Dlouhodobě se ukazuje, že stabilita je pro velkou část uživatelů důležitá.
  2. Předbíhání relevantních fulltextových výsledků
    Pro určité dotazy se stává, že upoutávka „předběhne“ relevantnější výsledek vyhledávání. V současném návrhu nejsme schopni zařadit upoutávku „trochu níže“, neexistuje žádná „trochu nižší pozice“. Uživatelům tak odsuneme očekávaný výsledek níže a před něj předřadíme méně relevantní upoutávku.

Z uvedených důvodů jsme se rozhodli přepracovat způsob vydávání upoutávek, a to tak, abychom odstranili výše uvedené neduhy. Hlavní myšlenkou změny je zařadit upoutávku na takovou pozici, na kterou má z hlediska relevance výsledků vyhledávání nárok. Upoutávky se mohou nově zařadit i mezi výsledky vyhledávání.

Výše uvedené změny vedou k větší stabilitě výsledného obsahu a k relevantnějšímu zařazení upoutávek. Změny neovlivňují způsob řazení samotných výsledků vyhledávání ani počet zobrazovaných výsledků.

Změnu zaznamenaly také samotné upoutávky. Provedli jsme menší redesign grafických šablon, kvalitativně jsme vylepšili některé stávající upoutávky.

O tom, jak jsme se s touto technologickou výzvou vypořádali, vám v některém z příštích článků popíší vývojáři a výzkumníci fulltextu, kteří se danou problematikou přímo zabývají. Bude to například statistická metoda LDALatent Dirichlet Allocation, kterou využíváme pro korektní zařazení upoutávek u longtailových dotazů nebo metoda SVMSupport Vector Machine, která slouží k analýze dat a rozpoznávání vzorů.

Změnu je možné otestovat na http://searchtest.seznam.cz.

Budeme rádi za váš feedback.

Update 2.9.2011 10:00

Na searchtestu je nasazena produkční verze hledání, takže výsledky jsou shodné s výsledky ostrého hledání. Sklik se vydává z testovacího rozhraní Skliku (viz příspěvek [2]).

  • nikdo

    [1]to je hrůza – jen by mě zajímalo jak je možné že do testu pouštíte reklamu skliku, která je vypnutá.

  • [2]Pokud jde o reklamu Sklik na testu, tak je také z testovacího rozhraní Skliku, podobně jako výsledky vyhledávání. Zobrazované inzeráty už dávno nemusí být platné a aktivní, inzerent už nemusí mít nabitou Peněženku atd. Inzeráty také klikají na zvenku neexistující vývojovou doménu .dev.

  • Marty

    [3]Mě se z celého článku nejvíce líbí tahle věta “Dlouhodobě se ukazuje, že stabilita je pro velkou část uživatelů důležitá.” to je zjištění po 8 měsících že byste si zasloužili extra premie. Rovnou se omlouvám za tohle rýpání, protže vím, že to není uplně easy, ale znovu položím stejný dotaz jako již několikrát a bez odpovědi, proč napřed nedoladíte to co nefunguje ( rychlá indexace, výpočet ze všech indexovaných stránek, postupné změny výsledků oporti skokovým atd.. ) a pak vymýšlíte další věci. Stabilita se zlepší tím, že předsunete před přirozené výsledky nějaké, které uznáte manuálně jako lepší ? To je min. divné a nefer. Jinak ano index testu je nějaká stará datbáze soudě i dle titulků apod. Jak můžete chtít feedback z něčeho co není aktuální ? Například podívejte se například na kw kočárky výsledek, zboží.cz, tři výsledky, firmy.cz a pak další výsledky. Takhle to pro laika vypadá jako že to nahoře je obyčejná reklama.

  • [4][3] Díky za upozornění. Měli jsme testovací verzi rozběhlou nad testovací verzí hledání. Nyní je to již napraveno a výsledky na testu jsou shodné s výsledky v produkci.

  • Bose

    [5]Taky moc nesouhlasím s tím co teĎ děláte. Je za tím cítit jen posílení obchodní části Seznamu, tak aby vyhledávání generovalo větší zisk. Zbytečně v tom děláte zmatek a to co dříve působilo stabilně je teď takové chaotické. Stejně tak jako rozhození fulltextu tak aby firmám které chtějí být vidět na rozumné pozici nezbylo nic jiného než si platit Sklik. Je šílené že jednou je firma na 1.místě a o pár dní později na 10. Z mého pohledu s tím akorát utrpíte a Vaše vyhledávání bude používat stále méně lidí protože v tom děláte chaos. Tím že budete prohazovat informace na stránce nic nového nepřinášíte.

  • Radim

    [6][5] Souhlasím. Děláte teď hodně změn najednou, né vždy pozitivních změn. Pro vyhledávač by mělo být prioritní relevantní výsledky, né komeční reklama, kterou teď opravdu viditelně stále víc a víc prosazujete.

  • [7]Text článku byl nejspíš SEO optimalizován na slovo *upoutávka*, v průměru obsahuje jedna věta 0,98 krát slovo “upoutávka”.

  • kýbl

    [8][3][5][6] Důvodem není posílení obchodní části Seznamu, ale zlepšení vyhledávání tak, aby upoutávka nebyla tam, kde si nezaslouží být, a naopak byla tam, kde si být zaslouží (tj. všechny další přirozené výsledky jsou méně relevantní než tato upoutávka). Výsledek je ten, že první odkaz je téměř vždy přirozený (protože je pro dané KW nejlepší), na rozdíl od současného stavu, kdy pro provařená KW je na první pozici nějaká upoutávka, která je často méně relevantní než další (první) přirozený odkaz. Člověk tedy nyní může „jet“ od začátku do konce stránky a má výsledky řazeny podle relevantnosti, ne tak, že určité druhy odpovědí se dávají pouze na určité pozice. Upoutávky také nemají vliv na pořadí přirozených výsledků – ty jsou umístěny stejně jako doposud. A v žádném případě nejsou upoutávky umísťovány manuálně (!), to by bylo při takovém počtu zcela nemožné, naopak se to vše statisticky vyhodnocuje a ten algoritmus na správné umístění je právě nejtěžší částí toho vylepšení.

  • [9]Ten obrázek u postu mi připadá jako pořádná narážka na Hejla a jeho Hejhulátor (hlodač). Jste vtipní, to se mi líbí! 😀