Ralph Langner: Cracking Stuxnet, a 21st-century cyber weapon
Internet søgemaskiner har fokuseret stort set på gennemsøgningstekst på websider, men Google er i dybden for at undersøge, hvordan man analyserer og organiserer strukturerede data, sagde en virksomhedsforsker fredag.
"Der er mange strukturerede data ud på nettet, og vi er ikke gør et godt stykke arbejde med at præsentere det for vores brugere, "sagde Alon Halevy under en samtale på New England Database Day konferencen ved Massachusetts Institute of Technology,
Halevy henviste delvis til såkaldte" deep web "kilder, som de databaser, der sidder bag formidlede websteder som Cars.com eller Realtor.com. Google har indgivet forespørgsler til forskellige former i et stykke tid, hentet de resulterende websider og inkluderet dem i sit søgeindeks, hvis oplysningerne ser nyttige ud.
[Yderligere læsning: De bedste tv-streamingtjenester]Men virksomheden også ønsker at analysere de data, der findes i strukturerede tabeller på mange hjemmesider, sagde Halevy og tilbyder som eksempel et bord på en webside, der viser de amerikanske præsidenter.
Og der er reams af disse tabeller - Googles indeks kom op 14 milliarder af dem, ifølge Halevy. Han realiserede meget hurtigt, at over 98 procent af disse ikke er så interessante ", men selv efter signifikant filtrering forbliver der omkring 154 millioner tabeller værd indeksering, sagde han.
Et af Googles ultimative mål er at give resultater, der organiserer" aspekter "af en søgning, især en udforskende en, såsom" Vietnam rejse ", i modsætning til en forespørgsel efter en bestemt kendsgerning som" Vietnam befolkning ", sagde Halevy. Den tidligere forespørgsel ville give oplysninger om visumkrav, f.eks. Vejr og turpakker.
Idéen har ekko af søgetjenesten, der tilbydes af Kosmix, men Google ønsker at gå videre, ifølge Halevy. "Kosmix vil give dig et" aspekt ", men det er knyttet til en informationskilde," sagde han.
Søgning efter "Vietnamrejser" på Kosmix giver et organiseret sæt af resultater, herunder restaurantanmeldelser fra New York Times, billeder fra Yahoo og Flickr, shoppingoplysninger fra Shopping.com og generelle webresultater fra Google.
"I vores tilfælde kan alle aspekter kun være websøgningsresultater, men vi ville organisere dem anderledes," sagde Halevy.
Mozilla inviterer folk til at designe webens fremtid
Mozilla inviterer folk til at deltage i en ny konceptuel serie, der sigter mod at forestille fremtidens design af Web ...
Den nederste 10: Webens mest utilgængelige websteder
Det er nemt at finde gode websteder på nettet. Men det kræver hårdt arbejde og dedikation at finde de virkelig irriterende og blændende ubrugelige. Selvfølgelig skrumpede vi ikke fra opgaven.
Flere huller findes i webens SSL-sikkerhedsprotokol
Forskere har fundet flere fejl i programmer, der bruger SSL-protokollen.