OCR für Bilder

Ideen und Vorschläge sind willkommen.

OCR für Bilder

Beitragvon Lotus » Mo Nov 26, 2012 8:27 pm

Es wäre ja ziemlich cool, wenn Bilder durch eine OCR Software analysiert werden, und diese dann beispielsweise bei der Bildersuche gefunden werden, wenn der Text darin vorkommt.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: OCR für Bilder

Beitragvon Orbiter » Mi Dez 12, 2012 11:21 pm

gibts denn ein freies OCR? Das wäre tatsächlich ziemlich cool!
Orbiter
 
Beiträge: 5786
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: OCR für Bilder

Beitragvon Lotus » So Dez 16, 2012 1:28 pm

Ah, gute Frage. Ich hatte die Idee hier eigentlich nur mal weggeschrieben. ;-)
Ich hatte mal vor, privat ein kleines OCR Tool zu schreiben, bin aber aus zeitlichen Gründen nie dazu gekommen.
Meine Recherche hat "Java OCR" als geeignet identifiziert: vollständig in Java, ohne externe Abhängigkeiten.
http://roncemer.com/software-development/java-ocr/
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: OCR für Bilder

Beitragvon Orbiter » So Dez 16, 2012 4:12 pm

sieht gut aus, nur habe ich das so verstanden dass diese Lib ohne weiteres keine Dokumente erkennen kann sondern erst trainiert werden muss.
Das sieht nach richtig viel Arbeit aus, da müsste erst jemand das Training durchführen und das Ergebnis als freie Daten veröffentlichen. Hat da jemand lust zu?
Orbiter
 
Beiträge: 5786
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: OCR für Bilder

Beitragvon bbtuxi » Fr Dez 21, 2012 6:28 pm

Ich habe mir gerade einen Scanner zugelegt und Archiviere alte Rechnungen usw. jetzt wäre eine Lokale Suchmaschine mit OCR sehr praktisch:) Ich speichere die Dokumente als PDF 1.4 ab.

grüße
bbtuxi
 
Beiträge: 50
Registriert: Fr Jan 16, 2009 10:28 pm

Re: OCR für Bilder

Beitragvon Lotus » Fr Mai 17, 2013 8:32 pm

Ich habe mich nun einmal genauer mit dem Java OCR beschäftigt, und finde die Resultate unbefriedigend. Wenn nicht exakt die genutzte Schrift trainiert ist, dann gibt es viele Fehlerkennungen. Das habe ich mit Screenshots aus der Textverarbeitung getestet. Für den Anwendungsfall für den es entwickelt wurde ist das sicher ausreichend (Bücher mit bekannter Schrift digitalisieren).
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 1 Gast

cron