Discussion:
OCR GUI
(zu alt für eine Antwort)
Alexander Goetzenstein
2023-12-25 11:50:54 UTC
Permalink
Hallo,
ich suche eine GUI für OCR (Tesseract ist installiert) unter tumbleweed,
die auch vorhandene PDFs (gescannte Dokumente) verarbeiten kann. Bei
meiner Suche bin ich auf cuneiform gestoßen, doch das verlangt uralte
libs, die nicht mehr aufzufinden sind (vermutlich zurecht, denn es wird
mehrfach von Memory leaks berichtet). Für gimagereader bin ich auch
nicht fündig geworden.

Ist tumbleweed da außen vor, oder gibt es da etwas?

Alternativ: wie kann ich auf der Kommandozeile tesseract dazu bewegen,
(auch mehrseitige) PDFs zu verarbeiten?
--
Gruß
Alex
Bernd Mayer
2023-12-25 12:09:45 UTC
Permalink
Post by Alexander Goetzenstein
Hallo,
ich suche eine GUI für OCR (Tesseract ist installiert) unter tumbleweed,
die auch vorhandene PDFs (gescannte Dokumente) verarbeiten kann. Bei
meiner Suche bin ich auf cuneiform gestoßen, doch das verlangt uralte
libs, die nicht mehr aufzufinden sind (vermutlich zurecht, denn es wird
mehrfach von Memory leaks berichtet). Für gimagereader bin ich auch
nicht fündig geworden.
Ist tumbleweed da außen vor, oder gibt es da etwas?
Alternativ: wie kann ich auf der Kommandozeile tesseract dazu bewegen,
(auch mehrseitige) PDFs zu verarbeiten?
Hallo,

ich verwende gscan2pdf zusammen mit Tesseract.

Das kann auch Images einlesen statt der Ausgabe vom Scanner.

https://gscan2pdf.sourceforge.net/

Ich verwende das unter Ubuntu, weil die Installation unter OpenSUSE-Leap
recht fummelig war.
Der letzte Installationsversuch ist allerdings schon länger her.
Ich muss das bei Gelegenheit doch noch mal versuchen.

https://duckduckgo.com/?t=ftsa&q=gscan2pdf+OpenSUSUE+Tumbleweed


Bernd Mayer
Bernd Mayer
2023-12-25 12:14:42 UTC
Permalink
Post by Bernd Mayer
Post by Alexander Goetzenstein
Hallo,
ich suche eine GUI für OCR (Tesseract ist installiert) unter tumbleweed,
die auch vorhandene PDFs (gescannte Dokumente) verarbeiten kann. Bei
meiner Suche bin ich auf cuneiform gestoßen, doch das verlangt uralte
libs, die nicht mehr aufzufinden sind (vermutlich zurecht, denn es wird
mehrfach von Memory leaks berichtet). Für gimagereader bin ich auch
nicht fündig geworden.
Ist tumbleweed da außen vor, oder gibt es da etwas?
ich verwende gscan2pdf zusammen mit Tesseract.
Das kann auch Images einlesen statt der Ausgabe vom Scanner.
https://gscan2pdf.sourceforge.net/
Nachtrag, ungetestet:

"GUIs and Other Projects using Tesseract OCR":

https://tesseract-ocr.github.io/tessdoc/User-Projects-%E2%80%93-3rdParty.html


Bernd Mayer

Lesen Sie weiter auf narkive:
Loading...