Whatsapp

gImageReader – Udtræk tekst fra billeder og PDF'er i Linux

Anonim

gImageReader er en gratis og open source PDF-læser med mulighed for at udtrække tekst fra billeder og PDF'er. Den er bygget som en simpel Gtk/Qt-frontend til Tesseract-OCR, en open source OCR-motor til genkendelse af tekster og mønstre i dokumenter og billeder ved hjælp afKunstig intelligens

Tesseract er alene et kommandolinjeværktøj, der er begrænset til brug af Linux-brugere, der er fortrolige nok med deres terminaler. Takket være gImageReader kan alle nu drage fordel af motorens OCR-effektivitet.

gImageReader fungerer ved at scanne tekster fra PDF- eller billedfiler på et af de flere sprog, som det understøtter takket være eksistensen af ​​Unicode-tegn . Den har en enkel, velorganiseret brugergrænseflade, der kan tilpasses, hvorigennem du kan udføre stavekontrol og oversættelsesopgaver.

Funktioner i gImageReader

gImageReader er nem at bruge og understøtter arbejde med soft copy-dokumenter samt snapshots af uploadede medier, f.eks. skærmbilleder. Du har endda mulighed for at vælge det tekstområde, du er interesseret i, og kun tilføje den tekst, du har brug for. I sidste ende fungerer gImagereader både som en PDF-læser og et tekstudtræksværktøj. Fjol ting.

Installer gImageReader på Linux

For at bruge gImageReader fuldt ud, skal du manuelt installere Tesseract sprogpakker, så du kan analysere billeder og filer korrekt.Pakken hedder 'Tesseract-ocr-eng' og den er tilgængelig fra softwareadministratoren i Debianog Fedora distros.

Hvis du kører Ubuntu, kan du blot tilføje PPAog kør installationskommandoen ved hjælp af kommandoerne nedenfor:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt opdatering
$ sudo apt installer gimagereader

On Debian, Fedora og OpenSUSE installer det fra pakkehåndteringen.

$ sudo apt installer gimagereader
$ sudo dnf installer gimagereader
$ sudo zypper installer gimagereader

Føl dig ikke udenfor, hvis du kører Arch Linux eller nogen af ​​dets derivater. AUR har dig dækket. Og hvis du hellere vil genopbygge appen fra kilden, findes instruktionerne i dens GitHub-lager Wiki-link.

Er du en til at udtrække trykt tekst fra billeder? Du kan endda tage snapshots af udvalgte områder med din telefon og uploade dem til din bærbare computer. Hvad der er endnu sejere, er dens flersprogede support – som selvom den ikke er perfekt, allerede er en af ​​de bedste muligheder i fællesskabet lige nu.

gImageReader er blandt de bedste PDF-læsere i open source-verdenen, især med sin OCR-funktion, så prøv det og se lige hvordan du kan lide det.

Som sædvanligt er du velkommen til at dele dine oplevelser med appen med os, hvis du har nogle. Og for at tilføje andre forslag i kommentarfeltet nedenfor.