Hjemmesider

Google køber ReCAPTCHA for at øge bogsøgningsindsatsen

How Machines Learn

How Machines Learn
Anonim

Google planlægger at fremskynde sin massive indsats for at scanne titusindvis af bøger og tidsskrifter med købet onsdag af et firma kaldet reCAPTCHA.

ReCAPTCHA er en velkendt udbyder af CAPTCHA-teknologi, som bruges til at forhindre spammere fra ved hjælp af computere til automatisk registrering af onlinetjenester, såsom webmailkonti og webstedsregistreringer.

CAPTCHA, som står for "Helt automatiseret public turing-test til at fortælle computere og mennesker adskilt", kræver, at brugerne indtaster tilfældigt udvalgte ord, der vises som billeder, en proces, der er let for mennesker, men det er svært for computere at gøre det rigtigt.

[Yderligere læsning: De bedste tv-streamingtjenester]

Hvad tiltrak Google til ReCAPTCHA er, at virksomheden har knyttet sin core authentication service med indsats for at digitalisere printbøger og tidsskrifter. Søgegiganten har en massiv indsats på dette område for sine Google Bøger og Google Nyhedsarkiv-tjenester.

ReCAPTCHA tager sit ordbillede fra scannede udskriftsmaterialer. Hver gang folk løser en CAPTCHA fra firmaet, er de også som et biprodukt, der hjælper med at skanne scannede ord til almindelig tekst, der kan indekseres og gøres søgbare af søgemaskiner.

"Så vi anvender teknologien indenfor Google ikke blot for at øge svindel og spambeskyttelse for Google-produkter, men også for at forbedre vores bøger og avisscanningsproces ", læser et indlæg i Googles officielle blog, der er skrevet af Luis von Ahn, medstifter af reCAPTCHA og Will Cathcart, en Google-produktleder.

ReCAPTCHA-tjenesten bruges af ca. 100.000 websteder, og det hjælper med at digitalisere gamle udgaver af The New York Times.