Google se mění směrem k sémantickému vyhledávači

Petr Vokněr, 22. květen 2012 08:00 7 komentářů
Rubriky: Technologie, Internet
Google se mění směrem k sémantickému vyhledávači

Hlavní produkt společnosti Google se neustále nenápadně posouvá směrem k tomu, co bývá někdy označováno bombastický názvem Web 3.0, tedy sémantické vyhledávání. Dalším krokem v tomto směru je právě nasazovaný Knowledge Graph, neboli graf vědomostí. Ten je postupně (zatím jen v anglicky hovořících zemích) nasazován od středy.

V čem hlavní změna s grafem znalostí spočívá? Google začal doplňovat výsledky hledání o fakta a souvislosti, které jsou získávány ze znalostní databáze (jde právě o onen Graf znalostí). Ten pak přímo odpovídá na část otázek uživatelů a zároveň je naviguje na související dotazy.

Celé to trochu připomíná encyklopedii. Samotné vyhledávání se ale tak mění na expertní systém. Dnes něco podobného nabízí vyhledávač Wolfram Alpha, který je na trhu již dlouho, jeho slabinou oproti Google je ale velmi malá databáze. Oproti tomu Google má ve své databázi asi 500 milionů objektů a 3,5 miliardy souvisejících faktů a vztahů mezi nimi.

Některé změny Google představil již v březnu

ukázka
ukázka

To, že je čas na další posun dal Google na vědomí v březnuu, kdy Amit Singhal, senior viceprezident společnosti Google, v rozhovoru pro televizní stanici Bloomberg upozornil na postupné změny ve stylu vyhledávání. Před jedenácti lety vyhledávač fungoval hlavně na principu zadaných klíčových slov a fulltextového vyhledávání. Dnes se snaží pochopit význam. Například při zadání klíčového slova International Business Machines Corporation nebo Big Blue pozná, že uživatel ve skutečnosti hledá firmu IBM.

Podle Singhala je dalším krokem přenesení znalostí do vyhledávání. V současnosti vrací Google výsledky hledání podle existujících webových stránek. Jestliže například hledáte nejhlubší jezera na světě, vyhledávač složí výsledky na základě existujících webových stránek. "Hledáte-li nejhlubší jezera v Africe, tak to tak dobře neumíme. Nikdo to ještě nenapsal," prohlásil v rozhovoru. Google to chce změnit a přinést získané poznatky svým uživatelům.

Firma toho chce docílit vybudováním opravdu masivní databáze slov, která budou spojena s jejich skutečným významem. Vyhledávaný dotaz bude spojen s významy a metaforami. Google na základě získaných informací a s využitím umělé inteligence odpoví sám na dotaz uživatele. Google už s budováním databáze začal, když v roce 2010 koupil Freebase, komunitní databázi s 12 miliony záznamů. Nyní počet záznamů dosáhl přes 200 milionů.

Zárodek umělé ineligence?

Graf Google vybudoval celkem ze tří zdrojů, tím prvním je otevřená Wikipedia, druhým již zmiňovaná Freebase a třetím CIA World Factbook databáze. Vztahy mezi fakty jsou potom doplněny z indexu vyhledávaní Google. společnost po nasazení zlepšení prostřednictvím grafu znalostí zobrazuje na pravé straně webu vedle výsledků právě související informace o nalezeném objektu. Zobrazené informace se na rozdíl od odkazů v encyklopediích mění podle samotného hledání uživatelů. Zobrazují se prioritně ty informace, které v souvislosti s daným předmětem hledá uživatel nejčastěji.

To pochopitelně přináší i jistá rizika, jedním z nich je syndrom kolektivní slepoty. Funkce pravděpodobně nepotěší experty, kteří hledají ve velmi specifické oblasti. Již fulltextové vyhledávání s našeptávači přinášelo této skupině občas ne úplně uspokojivé výsledky, pokud například hledáte geofyzikální seismický vibrátor a vyhledávač vám pořád vnucuje odkazy na sexshopy a pornostránky, asi vás to po chvíli otráví. Že by nás čekala éra povrchního „casual vyhledávání“? Třeba si s tím ale Google poradí, nechme se (doufám, že příjemně) překvapit.

Zatím největší otázkou zůstává dostupnost služby. Přeci jenom se na jazykové úrovni nejedná o úplně triviální záležitost. Bude trvale pouze pro angličtinu, nebo přijdou i další jazykové mutace? Dá se podobný graf znalostí naroubovat do jiných prostředí? Nevíme a Google nám k tomu asi zatím moc neprozradí, budeme se muset nechat překvapit. Služba grafu znalostí je v zjednodušené verzi dostupná také formou aplikace pro Android ( 2.2 a výše a iOS 4 a výše).


Komentáře

Migilenik #1
Migilenik 22. květen 2012 09:31

Jaksi se dycky leknu, kdyz nejaka prozatim funkcni sluzba chce byt "semanticka". .......... because of nepomuk ....

amigapower #2
amigapower 22. květen 2012 10:59

...přesně, stačilo to hledání obrázků, nedovedu si to představit na netbooku s widlema...

lambada #3
lambada 25. květen 2012 11:19

Tak ryze semanticke weby, ktere to opravdu delaji poctive, jsou celkem vyjimkou. Ale cest kazde vyjimce.

VM #4
VM 04. červen 2012 23:08

Bohužel původní hledání funguje čím dál méně. Současná verze často vrací stránky, kde část zadaných klíčových slov prostě chybí a které vůbec nechci. Cache už nefunguje vůbec. Google maps je javascriptový bastl, který zatíží procesor na 100% a který je neúnosně pomalý, nevypadá že by to někdo řešil, hlavně že je kód obfuskovaný; používám jen tam kde nelze použít podstatně svižnější mapy.cz .

Me #6
Me 08. červen 2012 15:09

neobfuskovaný (nekomprimovaný) kód by se načítal ještě pomaleji. Jinak nepozoruji nějaké pomalé chování, co máte za procesor?

x #5
x 07. červen 2012 00:27

ja chci obycejnej fulltext...

maxmagor #7
maxmagor 20. červen 2012 18:44

Sémantické? Muhehehe, naopak. Prostě jen bude víc kontextové reklamy okolo, typu "lidé také hledají..., lidé také nakoupili..." ;] Firmy už si ji zaplatí :)

RSS 

Komentujeme

Agilita a devops, přepracování a vyhoření

Pavel Houser , 12. červenec 2018 12:30
Pavel Houser

Michael Cote na The Register upozorňuje na častý problém: nové „agilní“ metody vývoje, všechny příst...

Více







RSS 

Zprávičky

50 let Intelu

ČTK , 16. červenec 2018 09:06

Intel nejprve produkoval paměti typu RAM, ale na počátku sedmdesátých let se firma rozhodla rozšířit...

Více 0 komentářů

USA zrušily zákaz dodávek amerického zboží čínské ZTE

ČTK , 14. červenec 2018 08:00

Firma již v rámci urovnání sporu s americkou vládou souhlasila, že zaplatí pokutu miliardy dolarů....

Více 0 komentářů

Trh PC ve 2. čtvrtletí rostl, tvrdí Gartner i IDC

ČTK , 13. červenec 2018 16:35

Růst odbytu táhla zejména poptávka firemního segmentu podpořená operačním systémem Windows 10....

Více 0 komentářů

Kalendář

04. 08.

09. 08.
Black Hat USA 2018
09. 08.

12. 08.
DEF CON 26
06. 09.

07. 09.
Humusoft Technical Computing Camp 2018

Starší zprávičky

Polovina kryptoměnových firem zanikne během čtyř měsíců od ICO

ČTK , 13. červenec 2018 10:09

Nejlepší strategií je prý mince v primární nabídce koupit a hned první den obchodů na otevřeném trhu...

Více 0 komentářů

Americká vláda se odvolává proti fúzi AT&T a Time Warner

ČTK , 13. červenec 2018 10:07

Ministerstvo se odvolalo proti červnovému rozhodnutí soudu, který spojení posvětil přes dřívější nám...

Více 0 komentářů

Německý soud: Rodiče mají mít přístup k facebooku mrtvé dcery

ČTK , 13. červenec 2018 09:00

Facebook nechtěl obsah účtu dívky otevřít, protože i její přátelé údajně spoléhali na to, že jejich ...

Více 1 komentářů

Broadcom koupí za 18,9 miliard dolarů CA Technologies

ČTK , 12. červenec 2018 13:01

Akvizice jsou důležité pro expanzi Broadcomu. Výběr firmy CA je však pro analytiky překvapením....

Více 0 komentářů