• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Proč Seznam dokázal vzdorovat Googlu?

Pavel Houser
18. 8. 2012
| Články

Fulltextové vyhledávání je celá věda. Jak se dnes liší přístup obou hlavních hráčů na českém trhu? Seznam v roce 1996 začínal jako katalog a i když později přidal fulltextové vyhledávání (Kompas), dlouho pro firmu nebylo prioritou. Fulltext se například zapínal až v případě, že odpověď nebyla nalezena v katalogu.

Později Seznam používal pro fulltext cizí technologie (včetně Googlu) a prezentoval se spíše jako médium/portál než vyhledávač (tedy s důrazem na homepage a další služby/vlastní obsah). Situace se nicméně postupně měnila a dnes je Česko jednou z pouhých čtyř zemí, kde domácí hráč nepřenechal hlavní podíl na vyhledávání Googlu. (Další jsou Rusko, Čína a Jižní Korea – ČR je tedy jedinou z těchto zemí, kde se používá latinka.) Konkurenční boj mezi Googlem a Seznamem vede k tomu, že vyhledávací služby pro české dokumenty jsou dnes zřejmě jedny z nejkvalitnějších na světě.

Pár čísel...

Pár čísel…

Hlavní roli převzalo fulltextové vyhledávání na Seznamu v roce 2005. Od té doby firma masivně investuje do této technologie – jak do hardwaru, tak do vývojářů. V roce 2005 pracovali na vyhledávání 4 lidé, letos už 67. Počet indexovaných dokumentů stoupl ve stejném období z 30 milionů na 650. Pro obsluhu vyhledávání je dnes vyhrazeno 250 strojů, robot jich využívá 150. Obvyklou konfigurací těchto systémů je 24 jader a 350 GB RAM. Databázovým řešením je Hadoop (noSQL databáze) – s tím mj. do programovacích jazyků a platforem používaných v Seznamu vstoupila i Java.

Současná čísla: Za jednu vteřinu odpoví fulltext Seznam 350 dotazů, ve špičce je to více než 500. Databáze robota zabírá 35 TB, jeho rychlost se pohybuje mezi 500 a 5 000 URL za vteřinu.
Na tiskové konferenci Seznamu se diskutovalo i o tom, proč v okolních evropských zemích místní dominantní hráči nástupu Googlu nedokázali odolat. Asi hlavní příčinou podle představitelů Seznamu byl fakt, že většina z těchto firem byla koupena telekomunikačními operátory. Svoji uživatelskou základnu se pak snažili co nejrychleji monetizovat, namísto investic do technologií se změnili na „prodeje ADSL“. Seznam nebyl k takové politice nikdy nucen.

seznamácké železo

seznamácké železo

Co se týče budoucnosti a přístupů k hledání: Seznam nechce nasazovat personalizaci, kdy by třeba načtení hlavní stránky map vycházelo z polohy uživatele. Uživatelé přijímají takový přístup spíše záporně. Různí uživatelé (nebo stejní uživatelé z různých počítačů) by při hledání měli dostávat stejné výsledky, nezohledňuje se historie hledání ani se neprohledává pošta uživatelů přihlášených k e-mailu Seznamu. Seznam proto mj. nemusí dnes řešit spory týkající se ochrany soukromí. Personalizaci jako takovou ovšem Seznam neodmítá, tyto techniky však hodlá nasazovat pouze pro mobilní telefony.

Rozdíly mezi přístupem hledání Seznamu a Googlu si může každý hračička zkoušet sám. Obě technologie trochu jinak pracují s víceslovnými dotazy, se synonymy, s ohýbáním češtiny (Seznam používá lemmatizační techniky od roku 2005) nebo i s tím, nakolik se snaží „myslet za uživatele“ (asi ve smyslu, že při hledání jahodového piva je možno do výsledků zamíchat i weby o pivu malinovém). Liší se také přístup k tomu, jak do výsledků vyhledávání zařazovat zpravodajské zdroje/často aktualizovaná obsah.

Do budoucna by Seznam mj. chtěl při vyhledávání více využívat specializované databáze.

Rubriky: ByznysČeské ITInternet

Související příspěvky

Zprávičky

OpenAI uzavřela dohodu s Pentagonem poté, co se rozešel s Anthropikem

1. 3. 2026
Zprávičky

Pentagon označil Anthropic za bezpečnostní riziko, firma se obrátí na soud

1. 3. 2026
Zprávičky

Samsung oznámil, že uzavře závod na výrobu televizorů na Slovensku

1. 3. 2026
Zprávičky

IDC: Trh se smartphony letos kvůli drahým pamětem zažije rekordní pokles

1. 3. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

OpenAI uzavřela dohodu s Pentagonem poté, co se rozešel s Anthropikem

ČTK
1. 3. 2026

San Francisco 1. března (ČTK) - Americká technologická společnost OpenAI uzavřela dohodu s americkým

Pentagon označil Anthropic za bezpečnostní riziko, firma se obrátí na soud

ČTK
1. 3. 2026

Technologická společnost Anthropic v noci na dnešek oznámila, že se obrátí na soud kvůli

Samsung oznámil, že uzavře závod na výrobu televizorů na Slovensku

ČTK
1. 3. 2026

Jihokorejský elektrotechnický koncern Samsung do letošního května postupně ukončí výrobu televizorů ve své továrně

IDC: Trh se smartphony letos kvůli drahým pamětem zažije rekordní pokles

ČTK
1. 3. 2026

Celosvětový trh s chytrými telefony v letošním roce vykáže nejprudší pokles v historii, a

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Netflix ustoupil v bitvě o Warner Bros, slavná studia tak může převzít Paramount

ČTK
27. 2. 2026

Americký provozovatel streamovací platformy Netflix odmítl zvýšit nabídku na převzetí filmových studií a streamovací

Ruské úřady se rozhodly Telegram zablokovat na začátku dubna

ČTK
27. 2. 2026

Ruské úřady rozhodly, že začátkem dubna zablokují komunikační platformu Telegram, uvádí ruský server RBC

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

GFI Software ustanovila Zebra Systems výhradním distribučním partnerem pro Severní Ameriku

itbiz
26. 2. 2026

Společnost GFI Software oznámila konsolidaci své severoamerické distribuce pod Zebra Systems LLC, která je

Huawei AI ilustracni

Výsledky a výhled Nvidie překonaly odhady, vzrostly příjmy z datových center

ČTK
26. 2. 2026

Americký výrobce čipů Nvidia zvýšil ve čtvrtém čtvrtletí tržby meziročně o 73 procent na

Tiskové zprávy

Společnost Epson představila speciální edici Lifestudio Flex Lux

AI pomáhá odhalit vzácná onemocnění včas. Vývoj podporuje AWS

T-Mobile v roce 2025 – hospodářské výsledky

Operátoři zachytí 3 miliony podvržených hovorů každý měsíc

Mobilní svět a rostoucí náklady kyberútoků

Česká obchodní inspekce uskutečnila v minulém roce 751 kontrol internetových obchodů, porušení předpisů zjistila v 639 kontrolách

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Bře 12
Celý den

IT Security Worshop

Dub 15
Celý den

Energy Vision

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Branding

Makléř

Downlink

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.