Zpravodajské upoutávky

Nasadili jsme podporu pro zpravodajské články. Mezi výsledky vyhledávání se nově zobrazují upoutávky, které informují o nově publikovaných článcích.

Upoutávka obsahuje několik vybraných článků, které jsou setříděny podle data vydání. Vybíráme je na základě relevance vůči zadanému dotazu a na základě data vydání. Kromě nejčerstvějších článků se snažíme vybírat také články o pár dní starší, aby měl uživatel historický přehled o sledovaném tématu. U jednotlivých odkazů na články zobrazujeme rovněž náhledy hlavních obrázků z článků.

Ve zpravodajských upoutávkách se zobrazují články všech zpravodajských webů, které máme zaindexované. Pokud se nezobrazují, je problém s vysokou pravděpodobností v RSS – může být nedostupné, obsahuje špatné escapování speciálních znaků, chybí (nebo je nekorektně vyplněn) element pubDate.

Doporučujeme ověřit titulky článků. Titulek by měl popisovat článek, neměl by nést pouze název daného média (např. http://www.halonoviny.cz/articles/view/486586). Výhodné je rovněž vkládat do článků reportážní fotografii či obrázek. Pokud se nám nedaří automatizovaně vybírat správný obrázek, můžete nám jej napovědět prostřednictvím speciálního tagu (viz článek Focení hlavních obrázků stránky).

V následujících týdnech budeme komponentu dále ladit. Pokud narazíte na chybné či nestandardní chování zpravodajských upoutávek či chybné zpracování zpravodajských webů, dejte nám vědět v diskusi pod článkem.

  • Plážovál

    Hezka featura i zajimavy vyvoj vyhledavani. Timhle stylem vlastne zkvalitnite vysledky vyhledavani pro nektere casto hledane dotazy bez zasahu do algoritmu pro razeni stranek (zkvalitnite vysledky tou snadnejsi cestou).

  • Díky za pěkné shrnutí. Rád bych se zeptal na podrobnosti, na základě čeho Seznam tuto upoutávku zařadí do výsledků vyhledávání. Viz např.: http://search.seznam.cz/?q=jan+fi%C5%A1er&sId=qqsOUkyLwEXQ17hSd8JT&aq=-1&oq=jan+fi%C5%A1e&sourceid=top&thru= Vyhledávacím dotazem je jméno kandidáta na prezidenta – něco o něm (tu a tam) zpravodajské portály píší, upoutávka zde ale nyní není. Co tedy musí dotaz splnit?

    Budu rád za podrobnosti.

    • Roman Dušek

      Prozkoumal jsem, proč se nám upoutávka na dotaz „jan fišer“ nezobrazuje. Jedním důvodem je chybný dotaz – správně by mělo být „jan fischer“. Ale ani pro tento dotaz upoutávku nevracíme (vracíme pouze pro dotaz „fischer“, a to se upoutávka zobrazí na další (myslím třetí) stránce). Tento týden ještě zpravodajské upoutávky ladíme, ke konci týdne by měly být upoutávky ještě o trošku lepší, než nyní.

      • Díky za parádně otevřenou zpětnou vazbu!

        Nu a když píši, tak bych se rád zeptal, zda by skutečně nebylo možno poodhalit signály, podle kterých Seznam generuje pro vybrané dotazy zpravodajské upoutávky. Koukám, že dle Téma.Novinky.cz to nebude :o)

        • Roman Dušek

          O zveřejnění signálů pro výdej zpravodajských upoutávek neuvažujeme.

  • Dal bych vám +1 ale není tu… 🙂

  • Ruda

    Dnes jsem se dočetl o vašich zpravodajských upoutávkách moc se mi to líbí doufám že to bude super díky Ruda

  • Petr

    Zdravim. Myslim, ze v clanku je chyba. Pisete: „… chybí (nebo je nekorektně vyplněn) atribut pubDate.“ Nicmene jestli se nemylim, tak v xml se jedna o „element“, nikoliv „atribut“.

    • Roman Dušek

      díky za info, opravil jsem to ve článku

  • Dobrý den, na „denik.cz“ je doplněn previewimage.
    Jinak se mi vaše zpravodajské upoutávky líbí a je to určitě pěkně zpracovaný formát.

    • Roman Dušek

      Díky za přidání previewimage tagu

  • Dobrý den, máte někde popis v jakém formátu musí být RSS pro magazín, aby ho seznam bral jako magazín? Děkuji.

    • Roman Dušek

      Pro zpravodajské upoutávky využíváme standardní formát RSS. Když tak zpřesněte, o jaký magazín se jedná.

      • Neporadíte mi, tedy co v našem RSS kanálu zlepšit, aby se mohl dostat obsah mezi aktuality?

        Děkuji.

        • Roman Dušek

          Nyní ladíme upoutávky zejména pro zobrazování zpravodajství. Každopádně – prohlížel jsem si RSS (www.hodinky.cz/rss) a všiml jsem si chybné reprezentace data v tagu pudDate. Uvádíte datum ve tvaru „2012-06-20“, správně má být tento formát „Thu, 23 Aug 2012 12:01:00 GMT“ (viz specifikace http://cyber.law.harvard.edu/rss/rss.html).

  • Jedná se mi např. o tento: http://www.hodinky.cz/magazin/ odkaz na RSS je dole v liště.