Nasazení Freshbota Mach II

Fulltextový robot má komponentu zvanou Freshbot, která stahuje čerstvý obsah jak z RSS, tak z jiných zdrojů nových odkazů. O změně Freshbota jsme psali již před časem na blogu. Mach II, výkonnější a rychlejší verze Freshbota, je teď nasazena v plném provozu.

Mach II obsluhuje nyní dvakrát více zdrojů než původní Freshbot, přesněji jich aktuálně máme sedm tisíc. Do indexu sviští v řádu desítek vteřin nejen zprávy, ale i odkazy z Twitteru a webové stránky běžné nebo i ty obsahující videa. Každou hodinu objevíme v průměru kolem tisíc pěti set nových dokumentů.

Mach II je až šestkrát rychlejší než byl starý Freshbot. Pro příklad, článek z aktuálně.cz jsme schopni dostat do indexu za minutu a to znamená, že v hledání se objeví do pěti minut.

Fulltextové hledání Seznamu má tedy nově dvakrát více zdrojů čerstvých odkazů a stahuje šestkrát rychleji. V podstatě je Freshbot Mach II tak rychlý, že než dočtete tento článek, tak již bude v indexu:

info:fulltext.sblog.cz/2016/04/04/nasazeni-freshbota-mach-ii