Našeptavač: plná podpora diakritiky

Nasadili jsme novou verzi našeptavače. Ten je nově rozšířen o automatické doplňování diakritiky dotazů tam, kde je to potřeba. Nadále platí, že navrhované dotazy s diakritikou jsou nabízeny i pro dotazy, které jsou zadávány bez háčků a čárek.

Tato úprava není pouhou kosmetickou záležitostí, ale má přímý vliv na snížení nejednoznačnosti dotazu. Příkladem může být dotaz „liska obecna“, který je možné interpretovat jako „liška obecná“ nebo „líska obecná“. Výběrem požadované interpretace dotazu získá uživatel přesnější výsledky.

Kromě podpory diakritiky a opravení několika nahlášených chyb byla dále vylepšena práce s dotazy, jejichž slova je možné smysluplně zapsat v různém pořadí. Například dotaz „olympia brno“ je možné zapsat také jako „brno olympia“. Dříve jsme podporovali pouze nejčastěji zadávanou variantu, nově podporujeme více smysluplných variant.

Pokud v našeptavači naleznete nějaké chyby, budeme rádi, když nás na ně upozorníte v diskusi tohoto článku.

  • Michal

    Dobrý den,

    super za update. Ještě bych měl např. Ferratum pujcka (stále je tam s i bez). Jen teď trochu pozoruji (cca 4 týdny) velice pomalou indexaci českého obsahu, spíše prakticky nulovou. Má to nějaký důvod?

  • JA
  • Luboš Hart

    Dobrý den,
    při vyhledávání jednonápravového vozíku za auto, je nabídnuta možnost „bržděný“ což není gramaticky správně. Pokud zadám jednonápravový vozík za auto brzděný (tak jak to má být),, tak jsou výsledky vyhledávání jiné, možná by to chtělo návštěvníky také „přinutit ke správnému pravopisu“.
    Hezký den,

    L.H.

    • Roman

      Poznámky k heslu „brzdit“: podoby brždění, bržděn nejsou dosud kodifikovány, ale v praxi jsou natolik rozšířené, že je už nelze hodnotit jako chybné“

      zdroj: http://prirucka.ujc.cas.cz/?slovo=brzdit&Hledej=Hledej

      • Videl jsem, mel jsem nekolik dni monozst si s tim nepretrzite hrat. Dekuji, nechci. Tot muj verdikt Za tu cenu je to hodne predrazena (doslova) hracka, ktera by mi byla na nic.Odpovědět

  • Roman

    Děkuji za příklady chybného oháčkování, předám je výzkumnému týmu.

    Roman

  • Stanislav Pluháček

    Dobrý den,
    jednomu z našich klientů začalo v našeptávači vyskakovat při zadání jeho brandu slova „podvod“ apod. Výsledky vyhledávání jsou přitom naprosto irelevantní. Při analýze hledanosti KW se slovo objevuje, ale jeho hledanost je 0. Podle nás se jedná o podvodné ovlivňování našeptávače z řad konkurence klienta. Můj dotaz je, jak je toto možné udělat a jak těmto technikám předejít?

    Stanislav Pluháček

  • Luboš Hart

    Děkuji Vám za odpověď k vyhledávání slova brzdit. Myslím si, když jsou oba tvary správné, nemělo by fulltextové vyhledávání dělat rozdíl ve vyhledávání jestli to bude brzděný, nebo bržděný…

    L.H.

  • Podle mého názoru velmi užitečná novinka. Myslím, že to pomůže všem pohybovat v síti.

  • Michal

    Dobrý den,

    stále jsou případy, kdy jsou slova bez diakritiky. Budete ještě dělat nějakou další revizi a nasazovat update?

    Díky

    • Roman Dušek

      Ano, naším cílem je mít našeptávané dotazy oháčkované. Je ale možné, že ne všechny tvary dokážeme nyní oháčkovat a bude potřeba další iterace při vývoji oháčkovače.