Android

Google Researcher målretter webens strukturerede data

Ralph Langner: Cracking Stuxnet, a 21st-century cyber weapon

Ralph Langner: Cracking Stuxnet, a 21st-century cyber weapon
Anonim

Internet søgemaskiner har fokuseret stort set på gennemsøgningstekst på websider, men Google er i dybden for at undersøge, hvordan man analyserer og organiserer strukturerede data, sagde en virksomhedsforsker fredag.

"Der er mange strukturerede data ud på nettet, og vi er ikke gør et godt stykke arbejde med at præsentere det for vores brugere, "sagde Alon Halevy under en samtale på New England Database Day konferencen ved Massachusetts Institute of Technology,

Halevy henviste delvis til såkaldte" deep web "kilder, som de databaser, der sidder bag formidlede websteder som Cars.com eller Realtor.com. Google har indgivet forespørgsler til forskellige former i et stykke tid, hentet de resulterende websider og inkluderet dem i sit søgeindeks, hvis oplysningerne ser nyttige ud.

[Yderligere læsning: De bedste tv-streamingtjenester]

Men virksomheden også ønsker at analysere de data, der findes i strukturerede tabeller på mange hjemmesider, sagde Halevy og tilbyder som eksempel et bord på en webside, der viser de amerikanske præsidenter.

Og der er reams af disse tabeller - Googles indeks kom op 14 milliarder af dem, ifølge Halevy. Han realiserede meget hurtigt, at over 98 procent af disse ikke er så interessante ", men selv efter signifikant filtrering forbliver der omkring 154 millioner tabeller værd indeksering, sagde han.

Et af Googles ultimative mål er at give resultater, der organiserer" aspekter "af en søgning, især en udforskende en, såsom" Vietnam rejse ", i modsætning til en forespørgsel efter en bestemt kendsgerning som" Vietnam befolkning ", sagde Halevy. Den tidligere forespørgsel ville give oplysninger om visumkrav, f.eks. Vejr og turpakker.

Idéen har ekko af søgetjenesten, der tilbydes af Kosmix, men Google ønsker at gå videre, ifølge Halevy. "Kosmix vil give dig et" aspekt ", men det er knyttet til en informationskilde," sagde han.

Søgning efter "Vietnamrejser" på Kosmix giver et organiseret sæt af resultater, herunder restaurantanmeldelser fra New York Times, billeder fra Yahoo og Flickr, shoppingoplysninger fra Shopping.com og generelle webresultater fra Google.

"I vores tilfælde kan alle aspekter kun være websøgningsresultater, men vi ville organisere dem anderledes," sagde Halevy.