Komponenter

Microsoft Research udvikler kort Søg efter ustrukturerede data

Modular Data Center Supports Ground Breaking Genome Research Analytics | Schneider Electric

Modular Data Center Supports Ground Breaking Genome Research Analytics | Schneider Electric
Anonim

Microsoft Research Indien har udviklet teknologi, der gør det muligt for brugerne at søge kort, selv i lande som Indien, hvor adresserne ofte ikke er struktureret.

Forskningsprojektet kaldes Robust Location Search, og en prototype af teknologien er allerede klar, sagde B. Ashok, direktør for avanceret udvikling og prototyper hos Microsoft Research India, onsdag. Selvom den er udviklet i Indien, er teknologien generisk og designet til at blive implementeret i ethvert land, der har ustrukturerede adresser, tilføjede han.

Algoritmen bruger snarere end at søge regler i adressen, og bruger underliggende geospatiale data til at finde ud af, hvilken placering Vilkårene i adressestrengen stemmer overens med, siger Ashok.

[Yderligere læsning: Din nye pc har brug for disse 15 gratis, fremragende programmer]

I lande som Indien beskrives en placering ofte i en adresse af dets rumlige forhold f.eks. nær eller modsat et vartegn, snarere end en formel, hierarkisk adressestruktur bestående af et gadenummer, gadenavn, by, stat og postnummer.

Meget ofte kan samme sted have en anden adresse eller en henvisning til et andet vartegn, sagde Ashok. Den lokale postman ved, hvordan man leverer breve baseret på disse ustrukturerede adresser, men sådanne ustrukturerede data udgør en udfordring for software, der bruges til kortsøgning, tilføjede han.

Kommercielle kortlægningstjenester, herunder de af Google, Yahoo og Microsoft, blev oprindeligt designet til lande som USA, som har strukturerede adresser, men de kan måske ikke være så gode, når de arbejder på ustrukturerede adresser, siger Ashok.

Forskningslaboratoriet i Bangalore er i drøftelser for at indarbejde den nye algoritme i Microsofts Windows Live Local. > Microsoft Research India bruger en teknologi, kaldet rumlig skæringspunkt, til at analysere forskellige udtryk i adressestrengen for at finde ud af placeringen for en ustruktureret adresse som "2. Kors, 10. Main, Sadashivnagar, Bangalore."

Softwaren starter med Begreber som "2nd Cross" og "10th Main" bruger derefter gadekrydsningsoplysningerne, at 2. kryds krydser med 10. hoved for at identificere alle forekomster på kortet, hvor 2. kors int ersects med 10th Main, sagde Ashok. Næste term, Sadashivnagar, skærer med de oplysninger, der er indsamlet på krydsninger af 2. Kors og 10. Hoved for at nå frem til den adresse, adressen refererer til, tilføjede han.

Softwaren vil ankomme til stedet uanset rækkefølgen, hvor Vilkår er præsenteret i adressen, og også når samme sted har en række aliasadresser, sagde Ashok. Det kan også bruges af brugere på flere sprog. En forespørgsel på hindi, et indisk sprog, ville for eksempel blive transliteret til sproget på kortet, og søgningen gjort ud fra disse udtryk, ifølge Ashok.

Vilkår i adressen som "nær", der ikke overensstemmelse med data på kortet er også kasseret, sagde Ashok.