Nové související dotazy

V poslední době jste mohli pozorovat postupné zvýšení počtu a zlepšení kvality souvisejících dotazů. Výrazně jsme také rozšířili počet souvislostí pro hledaný dotaz. Nejpoužívanější návrhy nyní zobrazujeme nad výsledky hledání.

První verzi souvisejících dotazů jsme spustili na začátku září 2011. Pod Výsledky hledání se zobrazovalo pouze osm návrhů odvozených z uživatelského hledání.

V nové verzi, kterou jsme do provozu nasazovali během listopadu, jsem se zaměřili na zlepšení relevance a zvýšení počtu souvislostí. U odkazů, u kterých máme souvislosti s vysokou mírou relevance, zobrazujeme tyto návrhy na první straně výsledků. Na dalších stranách zobrazujeme postupně návrhy s nižší relevancí. Pokud míra relevance žádného návrhu nepřekročí určitý práh, pak související dotazy zobrazujeme až od druhé strany výsledků vyhledávání.

Nově využíváme souvislosti ze služeb Seznam.cz a také je sbíráme z dat dostupných na českém internetu. Díky tomu zvládáme vydávat související dotazy s vysokou mírou relevance pro čtvrtinu všech hledání směřujících na fulltext. Zaměřili jsem se také na strukturu souvisejících dotazů, aby vyváženě nabízeli jak alternativy (pražský hrad – karlův most), tak specifikující (sjezdové lyže – dětské sjezdové lyže) i generalizující (sjezdové lyže – lyže).

Nově některé související dotazy zobrazujeme nad výsledky hledání (Horní související dotazy). Děje se tak v případech, kdy se domníváme, že daná souvislost má pro uživatele vysokou přidanou hodnotu. Vydávání horních souvisejících dotazů je zatím v testovacím režimu, takže je zahlédnete pouze v ojedinělých případech. Do konce roku počítáme s postupným nárůstem. Pokud si chcete horní související dotazy vyzkoušet, hledejte: zabijačka, tvoření z papíru, destilační přístroj na pálení slivovice.

  • To vypadá, jako by lidé na Seznamu neuměli hledat, vždyť už související nabídky na KW nabízíte při zadání do vyhledávače, proč zaplňujete stránku, na které můžete být relevantnější odkaz na informaci.

  • Já to docela vítám. Je to trošku kopie google, ale proč nepoužívat to, co již funguje dobře jinde.

  • Tomáš

    Pánové, kdy si přestanete hrát a začnete pracovat? Ten důraz na KW v doméně a ne na obsah je strašnej, seznam je nepoužitelnej. Tohle dělal Google před 10(?) lety …
    Aneb kdo nechápe, ať se podívá, proč je např:
    deratizace.net na 4. pozici … http://search.seznam.cz/?q=deratizace
    elektrokola-jelinek.cz na 2. pozici … http://search.seznam.cz/?q=elektrokola
    a tak by se dalo pokračovat. Těch webů v TOP5 s nulovým obsahem a velkými body za KW v doméně je halda.

  • Martin

    Tomáši díky za ten web deratizace.net na dotazu http://search.seznam.cz/?q=deratizace . myslel jsem, že tohle se už opravdu stát nemůže. Ta stránka neobsahuje řádný text, totéž na framech. Nechápu, jak je tohle možné. Proč se více nepoužívá testovací rozhraní ?

    • Podobná situlace jako u deratizace.net je i u RC modelů, TOP3 je tam právě díky 100%shodě KW v doméně.

      http://search.seznam.cz/?q=rc+modely&aq=-1&oq=r&sourceid=szn-HP&thru=

      aktuálně:
      1. = rcmodely.sk … ala deratizace – 100% KW v doméně, 0% v obsahu (frameset) a téměř 0% v obsahu framů. Navíc SK WEB!!! Nejspíš kvůli tomu, že tam enní obsah není možné identifikovat slovenský jazyk (??)
      2. == rcmodely.cz …. opět 100% KW v doméně, pak teda mají ještě H1 s textem „Báječný svět RC modelů“ …
      3. == rcmodely.com … opět největší váha KW v doméně, pak H1, ale tenhle web má oproti dvou výše uvedeným tedy i obsah. nemá však takovou kvalitu, aby byl v TOP3

      U těchto 3 příkladů je bohužel patrné, že .CZ nemá větší váhu než zbytek TLD a co hůře, že obsah webům ubírá!! Aneb první je zcela bez obsahu, druhý má pouze H1 a obrázek a třetí má obsah.

      Uděláte s tím prosím něco, vývojáři Seznamu? 🙁

  • Další krok Seznamu bude omezení KW v doméně, to je obr fail, který už Google řeší.

  • To Tomáš:
    To je hrozný, to jsem netušil, že to to až takhle, myslel jsem, že seznam má sofistikovanější algoritmus, díky za odkazy.

    • Radek

      Nemá. Vidět to lze i na http://search.seznam.cz/?q=last+minute&aq=-1&oq=last+minute&sourceid=szn-HP&thru=

      1. místo, zahraniční web, chce Čech tohle skutečně na první pozici výsledků?
      2. místo, česká doména s textem: obsah se připravuje
      3. místo, zahraniční web, skutečně tohle chce Čech vidět ve výsledcích?
      4. místo, konečně relevantní obsah

      • Alfréed

        Solidní marnost

  • Alfréed

    Tlačíte slovenské weby na některé fráze, které rádoby připomínají cizojazyčná slova. Např název filmu + online. Víte o tom seznamáci?

  • Tomáš

    Katastrofa! Celý vyhledávání od Seznamu! Síla klíčových slov v doméně nebo zobrazování zahraničních webů když mám zapnuto „ČESKY“ (!!!!!!) je vážně mimo… Debilita toto.

  • SE-Xpert

    Vy jste se úplně zbláznili!!! Kromě toho, že výsledky jsou čím dál horší (jak pro koho, že?) tak Vám blbnou i náhledy stránek.

    • kýbl

      Mohl byste uvést nějaký příklad?

  • Fanda Fulltextu

    Nevím, asi jsem divnej, ale porovnání není přeci to samé co srovnání?

    http://search.seznam.cz/searchScreen?q=povinn%C3%A9+ru%C4%8Den%C3%AD+srovn%C3%A1n%C3%AD

  • Tomáš

    Je až trapné jak místní bloggeři naše reakce ignorují…!

  • Nenašel jsem tady příhodnou rubriku/článek, kam by to spadalo přesně. Chtěl bych se zeptat, jak je na tom v současnosti vyhledávání s výsledky.
    V minulosti Seznam nadhodnocoval počet vyhledávacích dotazů …Pokud vím, fungovalo tak, že se zadaný dotaz počítal dodruhé, pokud uživatel přešel na další stránku vyhledávání (a potřetí, počtvrté… – takže jeden zadaný dotaz mohl být klidně započítán jako 8)

    Díky za odpověď

  • Radim

    Můžete prosím ověřit relevanci výsledků na „dětský nábytek“? Nerozumím co dělá web jako http://www.meblik.cz/ na 6 straně výsledků, přestože je optimalizován…
    Taktéž „dětské pokoje“ je někde 20.strana