Komponenter

Velkommen til Web 3.0: Semantiske søgninger

Computational Thinking - Computer Science for Business Leaders 2016

Computational Thinking - Computer Science for Business Leaders 2016
Anonim

Mens søgeordssøgning forbliver den mest populære metode, er det normalt ikke korrekt, med brugere får nogle gange op til 30.000 hits på en søgning, og derefter skal man sejle gennem en liste over løst relaterede søgeordresultater for at finde relevante dokumenter.

"Dette her hvor en ny race af såkaldte semantiske teknologier kommer ind i rammen. rankingalgoritmer som Googles PageRank for at forudsige relevans, semantisk søgning dips ind i betydningen på sprog for at producere yderst relevante søgeresultater ", ifølge en rapport udgivet af Ovum-analytikerne Mike Davis og Madan Sheina.

Bemærkelsesværdig semanti c web udbydere udpeget af analytikerne omfatter Expert System, Powerset, Yedda, Trovix og Hakia. Ifølge forfatterne steg bevidstheden om semantisk søgning, da Microsoft opsog to semantiske søgeselskaber Powerset og Zoomix.

I tilfælde af Expert System er dets ansøgning, kaldet Cogito, designet ud fra principperne om menneskelig forståelse for at give indhold til forstås på den måde, som forfatteren havde til hensigt at være. Dette er noget, som søgeordssøgningen ignorerer.

"En Google-søgning efter ordet 'jaguar' ville trække indhold op omkring dyret og bilen. Semantisk søgning ville se ikke kun på søgeordet, men også andre ord omkring det som" jungle 'eller' saloon 'for at adskille de to betydninger, siger forfatterne.

Dybere analyse

Udover semantisk søgning findes der andre former, herunder heuristik og ontologi, lingvistik og tekstmining og statistisk. Ekspert System hævder dog, at disse tilgange er kortfattede, idet de kun omhandler de morfologiske og grammatiske aspekter af analysen.

Andre søgemaskiner rammer ofte en mursten, når det kommer til dyb analyse. For eksempel når en heuristisk drevet søgemaskine ser to adjektiver i en sætning, vasker den sædvanligvis dem ud og sætter sætningen som neutral, fordi den ikke har nogen forståelse for, hvor de to separate adjektiver peger.

Til sammenligning ses semantisk søgning i begge sætningslogik - hvordan ord i en sætning vedrører hinanden - og semantisk analyse - forståelse af søgeordets sammenhæng.

Når et udtryk er tvetydigt, hvilket betyder at det kan have flere betydninger, for eksempel bark, er der brug for semantisk analyse med andre ord, der omgiver det for at give det sin sande betydning og kontekst.

En leksikalsk database

Ingeniørerne hos Expert Systems siger, at Cogito kan gå den ekstra mile fordi den har et semantisk netværk - en leksikalsk database der giver en vidensrepræsentation af orddefinitioner og deres forhold. Det hældte Webster's ordbog i en in-memory database - omfattende 350.000 ord og 2.8 millioner relationer.

"Expert Systemets semantiske netværk fokuserer også på fælles ord. Det adskiller sig fra de fleste ontologiske tilgange, der vedrører indpakning af mening og kontekst omkring specialiserede indhold, som videnskabelige udtryk, og spring over almindelige ord, der udgør 90 procent af alt indhold, "siger Ovum-forfatterne.

Men semantisk søgning er stadig riddled med" meget teoretisk hype men lille virkeligt stof eller bevis på, at det fungerer bedre end den nuværende søgteknologi.

"Semantiske netværk er vanskelige at bygge og ikke alle er ens. Det er usandsynligt, at semantiske teknologier nogensinde vil kunne give 100 procent præcision i deres analyse og resultater. Derudover er der stadig spørgsmålstegn ved potentielle klæbende præstationsproblemer med semantiske søgninger, der spiser mere behandlingscykler. "