Skip to content
Snippets Groups Projects
Commit 568fa914 authored by Jan Wille's avatar Jan Wille
Browse files

quelle: tesseract

parent 5473bac4
Branches
No related tags found
No related merge requests found
...@@ -35,3 +35,4 @@ ...@@ -35,3 +35,4 @@
{"rule":"UPPERCASE_SENTENCE_START","sentence":"^\\Qpytest Python Unittest Framework.\\E$"} {"rule":"UPPERCASE_SENTENCE_START","sentence":"^\\Qpytest Python Unittest Framework.\\E$"}
{"rule":"DE_CASE","sentence":"^\\QPakete für die Entwicklung: pyinstaller \\E(?:Dummy|Ina|Jimmy-)[0-9]+\\Q Eine Bibliothek zum Verpacken eines Pythonprogrammes in ein alleinstehendes Programm.\\E$"} {"rule":"DE_CASE","sentence":"^\\QPakete für die Entwicklung: pyinstaller \\E(?:Dummy|Ina|Jimmy-)[0-9]+\\Q Eine Bibliothek zum Verpacken eines Pythonprogrammes in ein alleinstehendes Programm.\\E$"}
{"rule":"DE_COMPOUND_COHERENCY","sentence":"^\\QDie Kommandozeilen Parameter werden direkt an die Funktion main() übergeben, die alternativ zu Nutzung über die Kommandozeile von anderen Python-Programmen importiert und aufgerufen werden kann.\\E$"} {"rule":"DE_COMPOUND_COHERENCY","sentence":"^\\QDie Kommandozeilen Parameter werden direkt an die Funktion main() übergeben, die alternativ zu Nutzung über die Kommandozeile von anderen Python-Programmen importiert und aufgerufen werden kann.\\E$"}
{"rule":"GERMAN_SPELLER_RULE","sentence":"^\\QFür das Beispiel aus \\E(?:Dummy|Ina|Jimmy-)[0-9]+\\Q wird das erwartete Ergebnis FAT3264128 auch geliefert.\\E$"}
No preview for this file type
...@@ -339,14 +339,18 @@ ...@@ -339,14 +339,18 @@
\end{figure} \end{figure}
\pagebreak
\subsection{Übergabe an Tesseract} \label{sub: call tesseract} \subsection{Übergabe an Tesseract} \label{sub: call tesseract}
Für die eigentliche Texterkennung wird eine weite Software namens \emph{Tesseract} verwendet. Für diese gibt es eine Für die eigentliche Texterkennung wird eine weite Software namens \emph{Tesseract} verwendet. Für diese gibt es eine
Python-Wrapper-Bibliothek namens \lstinline{pytesseract}, welche die Verwendung stark vereinfacht. Python-Wrapper-Bibliothek namens \lstinline{pytesseract}, welche die Verwendung stark vereinfacht. \cite{tesseract,pypi:pytesseract}
Die Kommunikation mit der Bibliothek ist in die Datei \lstinline{src/tesseract.py} ausgelagert. Dort steht die Funktion Die Kommunikation mit der Bibliothek ist in die Datei \lstinline{src/tesseract.py} ausgelagert. Dort steht die Funktion
\lstinline{tesseract.read_text_in_image()} zur Verfügung, die ein Bild akzeptiert und den gefundenen Text zurückgibt. Diese wird für \lstinline{tesseract.read_text_in_image()} zur Verfügung, die ein Bild akzeptiert und den gefundenen Text zurückgibt. Diese wird für
jeden Bildausschnitt aufgerufen. jeden Bildausschnitt aufgerufen.
\medskip
Für das Beispiel aus \autoref{fig: textbox} wird das erwartete Ergebnis \lstinline{FAT3264128} auch geliefert.
\subsection{Textanalyse des Ergebnisses} \label{sub: textanalyse} \subsection{Textanalyse des Ergebnisses} \label{sub: textanalyse}
Der von Tesseract gefundene Text wird zum Abschluss analysiert und mit der Liste an gültigen Codes verglichen. Dadurch werden Der von Tesseract gefundene Text wird zum Abschluss analysiert und mit der Liste an gültigen Codes verglichen. Dadurch werden
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment