Přesměrování a upravené adresy výsledků

U nalezených dokumentů jsme dosud zobrazovali jen jejich skutečnou URL adresu, tedy tu, na niž přejde prohlížeč po prokliknutí výsledku. Nyní jsme zavedli změnu a zobrazenou adresu vybíráme z těch nejlepších, které dokument získává díky přesměrování.

V soutěži možných adres daného dokumentu vítězí zpravidla ta nejvěrohodnější. Výběr nicméně závisí i na délce zvažované adresy nebo na její podobnosti k dotazu. Chceme tím podpořit dobrý uživatelský dojem z relevantních výsledků a přitom neumožnit zneužití alternativních adres.

První výsledek na dotaz justice nyní zobrazíme s adresou portal.justice.cz/. Dříve jsme místo ní uváděli jeho cílovou adresu portal.justice.cz/Justice2/Uvod/uvod.aspx.

Na dotaz vyprávěj vyhraje vypravej.cz/. Jeho skutečná adresa www.ceskatelevize.cz/porady/10195164142-vypravej/ ovšem není zdaleka tak kůl a ani citovaná není často, proto se do zobrazení nedostane.

Neplatí ale, že bychom cílové adresy dokumentů přestali zobrazovat, vede-li na ně nějaké přesměrování. Naopak. Abychom na přesměrování začali brát ohled, musí být jak přesměrování, tak cílová adresa stránky dostatečně významná a populární.

Mimo to omezujeme i zobrazení index.html, default.aspx a podobně na konci adres.

Upravené zobrazování adres se projeví například u výsledků na dotazy wikipedia, email, hypoteční centrum, centrum chodov, fajn radio nebo šťastné ženy.

  • Je to taková úprava pro potěchu oka, něco ve stylu sKliku.
    Mnohem zajímavější by mi přišlo, kdyby se více hrálo na kvalitu webu a ne shodu klíčového slova s názvem domény.

  • Právě, že na kvalitu webu a věrohodnost jeho možných adres se při výběru té nejlepší z nich hraje velmi. Pokusil jsem se to ukázat i na příkladech. Nový přístup k zobrazování adres ovšem nijak neovlivňuje pořadí výsledků.

  • Jaké typy přesměrování berete v tomto případě v úvahu? Všiml jsem si zatím http 302 a 301. Znamená to, že vnímáte 302 stejně jako 301? Tedy “přenos veškeré síly stránky na tu přesměrovanou”?

    Díky.

  • Pamatuju, jak jsem tohle programoval jako jednu z prvních věcí do Jyxo fulltextu, tedy asi v roce 2002 🙂
    Budiž mu země lehká…

  • Někdy je takováto shoda zapotřebí, nicméně v ostatních případech jen nahrává MFA webům.

  • Jan

    Nejsem si jistý, jestli je přímá souvislost mezi popisovaným důrazem na doménové jméno ( př. jízdní řády), ale pokud se při dotazu http://search.seznam.cz/?q=emirates.cz na druhé pozici zobrazí “Doména emirates.cz je registrovaná na CZECHIA.COM”, je to informace užitečná pro domainera, ale zřejmě ne pro standardního návštěvníka. V takovém případě bych se připojil k poznámce Honza [1] .

    • U výsledku ’emirates.cz’ je zobrazena jeho cílová adresa. To, že doména existuje, ale nemá vlastní obsah, není problém vyhledávače. Dotaz [emirates.cz] se po té doméně ptá, proč bychom ji neměli ve výsledcích nabídnout jako jednu z odpovědí?

      • Jan

        Pokud je Seznam vyhledávačem domén, pak je to v pořádku. Pokud má být vyhledávačem relevantního obsahu, pak je něco asi špatně.

        • kýbl

          A jaký relevantní výsledek byste si na dotaz „emirates.cz“ představoval? Já teda bych mezi výsledky tu doménu očekával, ať už je na ní sebenesmyslnější obsah. Vůbec nevím, proč jinak bych něco takového vyhledával.

  • Jan

    V tom bude ten problém. Otázkou není, co vyhledávám já, ale co a jak vyhledávají uživatelé.

    Vycházím z konkurenční výhody Seznamu, kde pro konzervativní část návštěvníků (např. většinu seniorů) Internet=Seznam. Když sleduji své klienty z různých oborů, kteří denně s Internetem pracují, jakým způsobem jsou schopni vyhledávat, jsem také překvapený.
    V daném případě většina z nich by do vyhledávacího pole napsala emirates, a protože chtějí českou verzi, nebo adresu na českou pobočku, přidali koncovku .cz. Očekávají, že dostanou informace pro svou dovolenou.

    Výsledek, který vrací doménu zaregistrovanou spekulantem s duplicitní defaultní stránkou webhostingu není relevantním výsledkem. Pro uživatele je pouze komplikací.

    Pokud má někdo zájem zkoumat určitou doménu, bude zřejmě schopný použít adresní řádek. V případě, že nemá k dispozici adresní řádek, může použít uvozovky pro vyjádření požadavku přesné shody. V tom případě je zobrazení domény relevantní, i když má nerelevantní obsah.

    Současný stav skutečně nahrává MFA s klíčovým slovem v doméně.

    • Jak už tu zaznělo, výsledek ’emirates.cz’ je jen jeden z mnoha, druhý v prvních deseti, a existují dobré důvody, proč ho mezi výsledky zařadit. To, že při vyhodnocování relevance dáváme příliš velkou váhu hledaným slovům v adrese, může být správný dojem. Nicméně o dokonalejší určování vah relevance se snažíme neustále. A výběr zobrazených adres na relevanci nemá vliv.

      • Jan

        Mohu se zeptat, co je těmi “dobrými důvody”? Domníval jsem se, že ‘content is king’, ale v tomto případě opravdu nejsem shopen jakýkoli relevantní obsah odhalit. Děkuji.

        • Na dotaz [emirates.cz] je dobré nabídnout i stránku ’emirates.cz’, protože lépe se na ni zeptat nedá. Nemá obsah, který by něčemu vadil, obsahuje informaci o doméně samotné. Ostatní výsledky odpovídají na dotaz volněji. Připadá mi ale, že se diskuze točí dokola. Pojďme se věnovat tématu, pokud chcete.

  • Nevím jestli to s tím nějak přímo souvisí ale ve výsledku hledání se nám slovo matrace zobrazuje url http:// http://www.molitan-matrace.cz/198-matrace která je už ale víc než měsíc změněná na http://www.molitan-matrace.cz/198-nabidka-matraci. Co mě příjde divné je že se zobrazuje URL která už měsíc neexistuje.

  • Vítek

    A není nahodou zrovna ve vašm příkladu – idos.cz a jizdnirady.cz duplicita? Když zobrazuj stejný obsah jen na jiné doméně?

    • Duplicity je žádoucí odstraňovat v rámci jednoho dotazu. Nic ale nebrání tomu prezentovat daný obsah pro různé dotazy pod různým jménem, vybírat z něj různé úryvky a podobně, pokud to má smysl.

  • Zdenec

    Tak jsem si zkusil ty šťastné ženy hodit do vyhledávače a na pátém místě tato URL:
    http://obchod.stastnezeny.cz/index.asp?menu=3
    V textu ani v kódu stránky není jediný výskyt slova “šťastný” ani “ženy”. Pouze v názvu domény. Bylo by možné nějaké vysvětlení?

  • Vizte prosím mou dřívější odpověď k relevanci. Existují zřejmě relevantnější výsledky, než je tento.

  • Martin

    K té relevanci – na dotaz http://search.seznam.cz/?q=landrover+defender vyhodíte jako první výsledek http://www.landrover.com/cz/cs/lr/ . Opravdu myslíte, že tato stránka je vůči dotazu ta nejlepší možná ?

  • Radim

    Na slovní spojení “dřevěné hračky” jsou v určitých případech podstránky eshopů před eshopy specializující se jen na dřevěné hračky, i poměrně dobře optimalizované.
    Spojení “obchodní zástupce” – web http://www.obchodnizastoupeni.cz/ který byl nedávno mezi prvními pozicemi je na třetí straně výsledků. Přitom se na něm nic podstratného nezměnilo…

  • Já jsem s výsledky docela spokojený, podle mě je to změna k lepšímu. Ač ne nijak zásadní, to souhlasím.

  • Jedná se převážně o kosmetickou změnu. Je ale pravda, že nějaké uživatele by mohla adresa jako portal.justice.cz/Justice2/Uvod/uvod.aspx když zadají dotaz justice odradit. Mohli by si myslet, že se jedná o nerelevantní doménu. Docela by měla zajímala změna CTR u takových adres po tomto updateu.

    • Tak to by mě také zajímalo

  • Já jsem tuto změnu přivítal s povděkem. Zejména u té justice mi to vždycky tak nějak “kosmeticky” vadilo a pro běžné uživatele přišlo docela matoucí.