Automatická oprava překlepů

Je libo feceblok, zoutube nebo překaldač? Na search.seznam.cz jsme spustili automatickou opravu překlepů pro nejčastěji chybně zadávané dotazy. Nalezneme hned, co skutečně hledáte.

Seznam.cz umí opravovat překlepy již dlouho. Nyní ale na jisté překlepy zareagujeme okamžitě. Komponenta Automatická oprava překlepů dokáže známý překlep v dotazu sama opravit a takto opravený dotaz ihned vyhledat.

Jak to funguje? Pro dotazy, u kterých je jistá šance, že obsahují překlep, zobrazíme „Návrh opravy“ (např. domcí pekárny). Současně udržujeme statistiku různých ukazatelů, včetně zpětnovazebních signálů (např. jak moc je úspěšný návrh opravy dotazů z pohledu uživatele). Minimálně jednou denně jsou návrhy oprav zpětně vyhodnocovány. Parametry výběru dvojic překlep x oprava jsou nastaveny tak, aby se do seznamu automatických oprav dostaly pouze ty, u kterých jsme si opravou zcela jistí. Správnou podobu dotazu pak přímo vyhledáváme. Pokud si přesto přeje uživatel hledat původní dotaz, stačí jen kliknout na původní dotaz pod hledacím polem.

Vyzkoušejte hledat straem, wolcvagen, protřeno nebo huindai.

Budeme rádi, pokud novou vychytávku sami vyzkoušíte. Naleznete-li chybnou opravu, která by neměla být automaticky opravena a vyhledána, napište to prosím do komentářů pod článkem. Budeme rádi za Vaši zpětnou vazbu.

  • Koukám že se někdo hrabal ve fulltextu

  • Obcas je to tezke rozhodnout. Napriklad u dotazu “batle” se nabidne “battle” i kdyz jsem se zrovna preklepl ve slove “batole”.

    • VM

      Přesně jak píšete, občas je skutečně těžké rozhodnout, zda jde o překlep a která případná oprava je správná. U jednoslovných dotazů je to mnohdy problém a při výběru kandidátů převládají spíše statistické signály. U víceslovných dotazů je rozpoznání správné opravy lepší, můžeme využít kontext. Proto se do komponenty automatických oprav dostanou pouze ty dvojice, u kterých jsme si opravou jistí.

  • Podle mého je někdy lepší nechat uživatele ať si to opraví sám, na Seznamu je to ale možná pro některé slova dobré protože uživatelé do seznamu stále ještě píší URL adresy jako by Seznam byl internet.

    • VM

      Ano s tím souhlasíme. Proto většinu překlepů hned neopravujeme a uživateli opravu pouze nabídneme “Nechtěli jste hledat …”. Do Automatických oprav se dostanou pouze opravdu ty TOP případy překlepů. V poměru k celkovému množství jich je relativně málo.

  • Jolián Androskotak van Butthan III. z Vilémova u Všechovic nad Olomoucí

    Musím se smát, jak jsou některé moje weby zatlačeny hluboko dolů. To, že jsou hnusné jako mfa, je tam hodně reklam jako mfa, neznamená, že se tam nenachází kvalita :-). Play hard, earn hard.

    Dostatek prostoru na longtaily mají agregátory, duplicitní texty :-((

  • Vyhledávače jsou tak TOP, že leckterý agregátor je před Tebou. Je pravdou, že už jsem je poslední dobou umlčel. O Heuréce nemluvím.

  • Zkuste prosím taky občas projet data v našeptávači. Sice opravujete překlepy ve vyhledávání, ale v našeptávači ty chyby uživatelům sami předhazujete. Například “kapsle ta” na 3. místě v našeptávači je Tasimo s jednim S což je chyba na kterou po potvrzení a vyhledání sami upozorňujete…

    • VM

      Našeptávač pracuje se svým lokálním seznamem hledaných dotazů zadaných uživateli (vč. chybně napsaných slov). Naším cílem je nové opravy překlepů aplikovat také na ostatní komponenty fulltextu, našeptávače nevyjímaje. Na tomto řešení se nyní již pracuje.

  • Jolián Androskotak van Butthan III. z Vilémova u Všechovic nad Olomoucí

    Ještě ke změna algoritmu
    http://search.seznam.cz/?q=%C3%BA%C4%8Desy+pro+polodlouh%C3%A9+vlasy&sId=N4BGmyHHwLTkMQNe6oPV&aq=0&oq=%C3%BA%C4%8Desy+pro+polodl&sourceid=top&thru=sug

    Tahle hrůza je pravdu ten nejlepší výcuc z internetu na daný dotaz?

  • Jolián Androskotak van Butthan III. z Vilémova u Všechovic nad Olomoucí

    Proč se tak “moc” liší výsledky vyhledávání s Interpunkcí ía bez ní. Například legíny vs leginy

  • Feese

    Mám skromný dotaz, opravdu je tak nutné potlačovat malé weby s rozsahem do 5 stran, i když nejde o MFA?

    • VM

      Proč si myslíte, že Seznam znevýhodňuje malé weby? O jaké stránky se jedná konkrétně a pod jakým dotazem je vyhledáváte?

      • feese

        Protože všechny malé, které spravuju jdou dolů, zatímco velké na stejná slova jsou na tom plus minus stejně nebo lépe. Určitě podporuji boj proti MFA, ale nejsem si jist, že váš algoritmus je dokáže bezpečně poznat. Dnes šly dolů další dva, nejde o MFA, linkfarmu, rádoby PR články ani nic podobného. Všechny mají kvalitní obsah, vznikaly ve spolupráci s lidmi z příslušných oborů, mají přiměřeně odladěné on-page, aby se v nich roboti i lidi vyznali (= nejsou přeoptimalizované). Prostě kvalitně udělaný web, soudě podle umístění na Google a podle reakcí lidí, kteří na ně rádi chodí. Příklady pošlu rád na mail.

        • VM

          Opět jste nenapsal konkrétní URL svých stránek. Nemůžeme tedy konkrétně reagovat. Nicméně relevance závisí na mnoha faktorech.

          • feese

            Nabízel jsem zaslání na mail, omlouvám se, pokud jsem jej někde přehlédl. Pokud vám chci poskytnout nějakou souvislejší informaci k úspěšným a neúspěšným webům, určitě to nebudu dělat před diskuzi, to je snad pochopitelné. Děkuji, opravdu vám příklady rád pošlu, i když je mi jasné, že žádnou konkrétní odpověď na svůj problém nedostanu.

          • Petr Stránkovač

            Taky jsem v posledním týdnu zaznamenal propad některých obsahových minisite. Bezcené dropshipping eshopy s menším množstvím externích a větším množstvím interních odkazů (podstránek) se z uspokojivých pozic ani nehnuly. Odkazy bohužel nemohu z osobních důvodů poskytnout (mám příjem z těch které drží pozice a ne z těch které přináší informace). Tak jenom přidávám hint k zamyšlení při úpravách algoritmu (je možné že moje weby jsou pouze vijímka která potvrzuje pravidlo/kvalitu algoritmu).

  • Janča

    Nová verze fulltextu je konečná ? Pokud ano, proklamované potlačení duplicit s moc nedaří – viz např.
    http://search.seznam.cz/?q=d%C4%9Btsk%C3%A9+p%C3%ADskovi%C5%A1t%C4%9B&sId=LBfW2vfbwApYOtfmH-L9&aq=2&oq=d%C4%9Btsk%C3%A9+p%C3%AD&sourceid=top&thru=sug
    dva tytéž weby, od stejné firny, každá na jiné doméně.

    • VM

      Zdravím, nevím, co myslíte “novou verzí fulltextu”, nicméně Internet se neustále vyvíjí a tedy i fulltextové vyhledávání na Seznamu. Váš odkaz bohužel nefunguje. Pokud objevíte nějakou nekalou praktiku nebo spam, oznamte to prosím na http://search.seznam.cz/nahlasit-spam?type=search. Díky

  • Jolián Androskotak van Butthan III. z Vilémova u Všechovic nad Olomoucí

    Vliv IP na vzájemné prolinkování webů je na svém maximu :D. To po mě vážně chcete, abych si pořídil seo hosting?