Hjemmesider

Google VP Mayer beskriver den perfekte søgemaskine

Marissa Mayer, VP Search Products and User Experience, Google

Marissa Mayer, VP Search Products and User Experience, Google
Anonim

I sidste måned sagde Google-administrerende direktør Eric Schmidt under selskabets indtjeningsopkald, at Google havde implementeret omkring 120 søgekvalitetsforbedringer i løbet af tredje kvartal, da det bevæger sig mod sit ultimative mål: "Vi ønsker at komme til den perfekte søgemaskine. "

Ingen bad ham om at uddybe det høje mål, så da IDG News Service for nylig havde en chance for at interviewe Marissa Mayer, Googles vicepræsident for Search Products & User Experience, bad vi straks hende om at forklare, hvad Schmidt mente. Hun talte også om, hvad der holder Google i gang med at søge, hvordan virksomheden ser semantisk teknologi og hvad der er næste i sin Universal Search-indsats for at kombinere links til en lang række filtyper - nyhedsartikler, billeder, videoer, bøger, kort - i en

[Yderligere læsning: De bedste tv-streamingtjenester]

IDG News Service: Hvad er den perfekte søgemaskine? Hvis du havde en tryllestav og kunne skabe den, hvordan ville det se ud? Hvad ville det gøre?

Marissa Mayer: Det ville være en maskine, der virkelig kunne svare på det spørgsmål. Det ville være en, der kunne forstå tale, spørgsmål, sætninger, hvilke enheder du taler om, begreber. Det ville være i stand til at søge alle verdens oplysninger, finde forskellige ideer og begreber og bringe dem tilbage til dig i en præsentation, der var meget informativ og sammenhængende.

Der er mange forskellige aspekter af forskning, der har brug for at gå i at bygge den søgemaskine. Du skal forstå tale. Du skal forstå billeder. Du har brug for oversættelse, så du kan finde svaret, uanset hvilket sprog det er skrevet i. Du har brug for en masse kunstig intelligens for at kunne analysere, hvilke oplysninger der er relevante og syntetisere det. Du har brug for en god brugergrænseflade og brugeroplevelse til at sætte den i kontekst. Og du har sikkert brug for en vis personlig tilpasning, så søgemaskinen er relateret til personen til deres baggrund, hvad de allerede ved om, hvad de søgte i sidste uge.

IDGNS: På brugergrænsefladen bliver Google kritiseret af konkurrenterne konstant for, hvad de foragtede foragt som Googles "10 blå links" resultatside. De siger, at Google er old school, at dets paradigme med søgning er ineffektivt og ubelejligt. Hvordan reagerer du på den slags kritik?

Mayer: Jeg vil pege på, at Universal Search virkelig var et vandkreds-øjeblik i dette. Du får diagrammer, billeder, blogs, lokale oplysninger, bøger, nyheder, alle syet i din søgemaskine. Mens mange af vores konkurrenter stadig har travlt med at opbygge små vertikale søgemaskiner, hvor du skal huske, at de har dem, har vi travlt med at lave et meget vanskeligt computervidenskabsproblem: Hvordan stikker du alle disse uensartede medier sammen i et sammenhængende sæt af svar, og hvordan syntetiserer du alt det? Vi gør alt det, fordi det er bedre for brugerne: Her er værktøjet, og det giver mig det, jeg vil have, uanset hvilket format det kom ind.

Vi har to, tre og fem ændringer hver uge, der er synlige for slutbruger i brugergrænsefladen. Vi offentliggør ikke placeringsændringer. Vi foretager ændringer til vores rankingalgoritme med en pris på to pr. Dag. Interessant nok har nogle af vores konkurrenter ikke foretaget nogen ændringer i deres rankingfunktion i nogen tid. Søgningen skal udvikle sig: brugergrænsefladen, rankingsfunktionen. Det er en proces at lave mange små ændringer hele tiden og konstant gøre tingene bedre.

IDGNS: Hvad er status for semantisk søgning på Google? Du har tidligere sagt, at gennem "brute force" - analysere massive mængder af forespørgsler og webindhold - Googles motor kan levere resultater, der gør det til at virke som om det forstod ting semantisk, når det virkelig fungerer ved hjælp af andre algoritmiske tilgange. Er det stadig den foretrukne tilgang?

Mayer: Vi tror på at opbygge intelligente systemer, der lærer ud af data på en automatisk måde, [og derefter] indstiller og raffinerer dem. Når folk taler om semantisk søgning og semantisk web, betyder de normalt noget, der er meget manuel, med kort over forskellige foreninger mellem ord og ting som det. Vi tror, ​​du kan få et meget bedre niveau af forståelse gennem mønster-matchende data, opbygning af store systemer. Sådan fungerer hjernen. Derfor har du alle disse fuzzy forbindelser, fordi hjernen hele tiden behandler masser og masser af data.

IDGNS: For nogle år siden eller så foreslog nogle eksperter, at semantisk teknologi ville revolutionere søgning og blindside Google, men det er ikke sket. Det ser ud til, at semantiske søgeindsatser har ramt en mur, især fordi semantiske motorer er svære at skalere.

Mayer: Problemet er, at sprogændringer. Websider ændres. Hvordan folk udtrykker sig forandringer. Og alle disse ting betyder noget med hensyn til, hvor godt semantisk søgning finder anvendelse. Derfor er det bedre at have en tilgang, der er baseret på maskinindlæring, og som ændrer, gentager og reagerer på dataene. Det er en mere robust tilgang. Det er ikke at sige, at semantisk søgning ikke har nogen rolle i søgning. Det er bare det for os, vi foretrækker virkelig at fokusere på ting, der kan skaleres. Hvis vi kunne komme op med en semantisk søgeløsning, der kunne skala, ville vi være meget glade for det. For nu er det, vi ser, at mange af vores metoder tilnærmes intelligensen af ​​semantisk søgning, men gør det på anden vis.

IDGNS: Universal Search blev annonceret i maj 2007. Er det betragtes som afsluttet nu? Er det noget der altid vil være et igangværende arbejde?

Mayer: Det er stadig en meget levende og vejrtrækning ting. Nu har vi flere hold: Vi har et lokalt [søgning] universelt hold, et billede [søgning] universelt hold, produkt [søgning] universelt hold. De ser alle på, hvordan kan vi gøre en endnu bedre jobrangering og udløse dette indhold. Da vi lancerede det, blev det vist i omkring en ud af 25 forespørgsler. I dag viser det sig i omkring 25 procent af forespørgsler. Og vi tror, ​​at der sandsynligvis er tidspunkter, hvor disse hjælpefiler [fil] formater virkelig kunne hjælpe, og vi udløser dem ikke på vores resultatside. Det er noget, vi skal fortsætte med at stræbe efter.