Whatsapp

gImageReader – Extrahera text från bilder och PDF-filer i Linux

Anonim

gImageReader är en gratis PDF-läsare med öppen källkod med möjlighet att extrahera text från bilder och PDF-filer. Den är byggd som ett enkelt Gtk/Qt-gränssnitt till Tesseract-OCR, en OCR-motor med öppen källkod för att känna igen texter och mönster i dokument och bilder medArtificiell intelligens

Tesseract är i sig själv ett kommandoradsverktyg som är begränsat till användning av Linux-användare som är tillräckligt bekanta med sina terminaler. Tack vare gImageReader kan alla nu dra nytta av motorns OCR-effektivitet.

gImageReader fungerar genom att skanna texter från PDF- eller bildfiler på något av de flera språk som den stöder tack vare existensen av Unicode-tecken . Den har ett enkelt, välorganiserat anpassningsbart användargränssnitt genom vilket du kan utföra stavningskontroll och översättningsuppgifter.

Funktioner i gImageReader

… skärmdumpar. Du har till och med möjlighet att välja det textområde som du är intresserad av och bara lägga till den text du behöver. I slutändan fungerar

gImagereader både som en PDF-läsare och ett textextraktionsverktyg. Jävla grejer.

Installera gImageReader på Linux

För att kunna använda gImageReader till fullo måste du installera Tesseract manuellt språkpaket så att du kan analysera bilder och filer korrekt.Paketet heter 'Tesseract-ocr-eng' och det är tillgängligt från programvaruhanteraren i Debianoch Fedora distros.

Om du kör Ubuntu, kan du helt enkelt lägga till PPAoch kör installationskommandot med kommandona nedan:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt uppdatering
$ sudo apt installera gimagereader

On Debian, Fedora och OpenSUSE installera det från pakethanteraren.

$ sudo apt installera gimagereader
$ sudo dnf installera gimagereader
$ sudo zypper installera gimagereader

Känn dig inte utanför om du kör Arch Linux eller någon av dess derivator. AUR har du täckt. Och om du hellre vill bygga om appen från källan finns instruktioner i dess GitHub-repository Wiki-länk.

Är du en som extraherar tryckt text från bilder? Du kan till och med ta ögonblicksbilder av utvalda områden med din telefon och ladda upp dem till din bärbara dator. Vad som är ännu coolare är stödet för flera språk – som även om det inte är perfekt, redan är ett av de bästa alternativen i samhället just nu.

gImageReader är bland de bästa PDF-läsarna i världen med öppen källkod, särskilt med sin OCR-funktion, så prova och se bara hur gillar du det.

Som vanligt är du välkommen att dela dina erfarenheter av appen med oss ​​om du har några. Och för att lägga till andra förslag i kommentarsfältet nedan.