Beste OCR -Apps für Linux

Jean Dengler

In diesem Artikel wird eine Liste der nützlichen Software „Optical Character Recognition“ für Linux behandelt. Eine Software (optische Charaktererkennung) versucht, Textinhalte von Nicht-Textdateien zu erkennen, deren Inhalt nicht ausgewählt oder kopiert werden kann, sondern kann angezeigt oder gelesen werden. Beispielsweise kann eine OCR -Software Text aus Bildern, PDF oder anderen gescannten Dokumenten in digitalen Dateiformaten anhand verschiedener Algorithmen und AI -basierter Lösungen identifizieren.

Diese OCR -Software sind besonders nützlich, um alte Dokumente zu konvertieren und zu erhalten, da sie verwendet werden können, um Text zu identifizieren und digitale Kopien zu erstellen. Manchmal ist der identifizierte Text möglicherweise nicht 100% genau, aber die OCR. Manuelle Änderungen können später vorgenommen werden, um die Genauigkeit weiter zu verbessern und eins-zu-eins-Replikate zu erstellen. Die meisten OCR -Software können Text in separate Dateien extrahieren, einige unterstützen jedoch auch die Überlagern einer versteckten Textebene in Originaldateien. Mit überlagertem Text können Sie Inhalte in Originaldruck und Format lesen, aber auch Text auswählen und kopieren. Diese Technik wird speziell verwendet, um alte Dokumente in das PDF -Format zu digitalisieren.

Tesseract OCR

Tesseract OCR ist eine kostenlose und Open -Source -OCR -Software für Linux. Von Google gesponsert und von vielen Freiwilligen gepflegt, ist es wahrscheinlich die umfassendste OCR -Suite, die es dort draußen erhält, die sogar einige bezahlte, proprietäre Lösungen übertreffen kann. Es bietet Befehlszeilen -Tools sowie eine API, die Sie in Ihre eigenen Programme integrieren können. Es kann Text in vielen Sprachen mit guter Genauigkeit erkennen. Es wird mit einer Reihe von vorgebildeten Daten geliefert, mit denen Text identifiziert und extrahiert werden können. Sie können auch Ihre eigenen geschulten Daten verwenden, wenn Sie eine benutzerdefinierte Lösung benötigen oder mehr Modelle von Dritten erhalten können. Die Tesseract -OCR verfügt über mehrere Erkennungsmotoren und Sie können sie je nach Installationsmethode entsprechend Ihren Anforderungen verwenden.

Verwenden Sie zum Installieren von Tesseract OCR in Ubuntu den unten angegebenen Befehl:

$ sudo apt installieren Tesseract-OCR

Sie können es in anderen Linux -Verteilungen aus Standard -Repositories über den Paketmanager installieren. Eine universelle Appimage -Datei und weitere Installationsanweisungen finden Sie hier.

Tesseract OCR wird standardmäßig unterstützt, um englischsprachige Inhalte zu erkennen. Wenn Sie zusätzliche Sprachen aktivieren möchten, müssen Sie möglicherweise mehr Sprachpakete herunterladen. Der oben angegebene Link enthält Anweisungen zur Installation zusätzlicher Sprachpakete. In Ubuntu können Sie Sprachpakete direkt finden, indem Sie den folgenden Befehl ausführen:

$ apt-cache-Suche Tesseract-Ocr-

Der obige Befehl gibt Paketnamen für verschiedene Sprachpakete aus. Installieren Sie sie einfach, indem Sie einen Befehl im folgenden Format ausführen:

$ sudo apt installieren

Sie können eine Liste aller installierten Sprachpakete erhalten, indem Sie den folgenden Befehl ausführen:

$ tesseract-Listlänge

Sobald das Haupt -Tesseract -OCR -Paket und zusätzliche Sprachpakete installiert wurden, können Sie mit dem Erkennen von Text aus Bildern und PDF -Dateien beginnen. Verwenden Sie zum Extrahieren von Text Befehle in folgenden Formaten:

$ tesseract Bild.PNG Output -l Eng
$ tesseract Bild.PNG Output -l Eng+Spa
$ tesseract Bild.PNG Output -l Eng PDF

Der erste Befehl extrahiert Text aus „Bild.PNG ”-Datei in der Sprache„ Eng “und speichern Sie sie in einer Datei namens" Ausgabe ". Der zweite Befehl analysiert das Bild mit mehreren Sprachpaketen. Der dritte Befehl kann verwendet werden, um eine PDF -Datei mit einer in der Bilddatei überlagerten Textebene zu erstellen.

Weitere Informationen zur Befehlszeilenverbrauch von Tesseract OCR verwenden Sie die folgenden zwei Befehle:

$ tesseract -HELP
$ MAN Tesseract

Gimagereader

Gimagereader ist ein grafischer Kunde für die oben erwähnte Tesseract OCR -Engine. Sie können damit die meisten von Tesseract OCR unterstützten Befehlszeilenoptionen und -aktionen ausführen.

Verwenden Sie den unten angegebenen Befehl, um Gimagereader in Ubuntu zu installieren:

$ sudo APT Installieren Sie Gimagereader

Sie können es in anderen Linux -Verteilungen aus Standard -Repositories über den Paketmanager installieren. Weitere verteilungsspezifische Pakete sind hier verfügbar.

Papierkram

Papierkram ist ein kostenloser und Open -Source -Dokumentenmanager. Sie können es verwenden, um Ihre Dokumentenbibliothek effizient zu verwalten, insbesondere wenn Sie eine große Sammlung haben. Es wird außerdem mit einem integrierten OCR-Modus ausgestattet, der „Pyocr“ verwendet, ein Python-Modul, das auf Tesseract- und Keilschrift-OCR-Motoren basiert. Weitere Hauptmerkmale von Papierkram sind die Fähigkeit, gescannte Dokumente zu bearbeiten, eine Suchleiste zur Suchdokumentbibliothek, die Möglichkeit, Dokumente, Scannerunterstützung usw. zu sortieren.

Verwenden Sie zum Installieren von Papierkram in Ubuntu den unten angegebenen Befehl:

$ sudo APT Installieren Sie Papierkram-GTK

Sie können es in anderen Linux -Verteilungen aus Standard -Repositories über den Paketmanager installieren. Ein universelles Flatpak -Paket ist auch hier erhältlich.

Ocrfeeder

OCRFeeder ist eine kostenlose und open -Source -grafische OCR -Software, die vom GNOME -Team gepflegt wird. Es unterstützt das Erkennen von Text in zahlreichen Sprachen und kann Inhalte in zahlreichen Dateiformaten exportieren. Es unterstützt viele OCR -Motoren, einschließlich Tesseract OCR, GoCR, Ocrade und Keilschrift. Es ermöglicht Ihnen auch eine Nachbearbeitung, um die Formatierung und Layout des extrahierten Textinhalts zu verbessern.

Verwenden Sie zum Installieren von OCRFeeder in Ubuntu den unten angegebenen Befehl:

$ sudo apt installieren ocrfeeder

Sie können es in anderen Linux -Verteilungen aus Standard -Repositories über den Paketmanager installieren. Ein universelles Flatpak -Paket ist auch hier erhältlich.

Beachten Sie, dass Ocrfeeder bei meinen Tests, die von Ubuntu -Repositories installiert wurden. Der Flatpak -Build wurde jedoch mit allen vier unterstützten OCR. Das im Ubuntu -Repository enthaltene Paket war viel kleinerer Größe.

GSCAN2PDF

GSCAN2PDF ist ein kostenloses und open -Source -Dienstprogramm, mit dem Text aus einer Vielzahl von Dateiformaten identifiziert und extrahiert werden kann. Es kann direkt mit Scannern funktionieren, um Papiere zu scannen und dann den OCR -Erkenntnis von Textinhalten in PDF -Dateien zu exportieren. Es unterstützt auch mehrere OCR. Abgesehen von dem direkten Scannen von Papieren können Sie auch Bilddateien importieren und Text aus ihnen extrahieren.

Um GSCAN2PDF in Ubuntu zu installieren, verwenden Sie den unten angegebenen Befehl:

$ sudo apt installieren GSCAN2PDF Gocr Cuneform Tesseract-Ocr

Sie können es in anderen Linux -Verteilungen aus Standard -Repositories über den Paketmanager installieren. Quellcode und ausführbare Binärdateien sind auch hier verfügbar.

Abschluss

Dies sind einige der nützlichsten Befehlszeile und grafischen OCR -Motoren und -software für Linux verfügbar. Tesseract OCR ist das aktiv entwickelte und umfassendste Instrument zum Erkennen von Text und sollte für die meisten Ihrer Bedürfnisse ausreichen. Sie können jedoch auch andere in diesem Artikel genannte Apps ausprobieren, wenn Sie mit den Ergebnissen von Tesseract OCR nicht zufrieden sind.

Python

Konvertieren Sie eine Schnur in JSON Python

Das JSON -Modulfunktion, die Funktion „AST“ -Modul oder die Funktion „eval ()“ wird verwendet, um ei...

Frederik Rodehau

Docker

Was ist Docker -Bindungshalterungen?

Ein Docker Bind -Mount ist eine Art von Mount, mit der Benutzer ein Verzeichnis oder eine Datei im H...

Christopher Lammert

Linux -Befehle

So lassen Sie die Version von CUDA unter Linux installiert

Umfassendes Tutorial, wie Sie die Versionen von CUDA herausfinden, die von den derzeit installierten...

Fr. Chris Frisch