php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 1 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 13-09-2011, 17:15
alexander_fire
 Registrierter Benutzer
Links : Onlinestatus : alexander_fire ist offline
Registriert seit: Sep 2011
Beiträge: 5
alexander_fire befindet sich auf einem aufstrebenden Ast
Standard Mit PHP: OCR Erkenung

Hallo,

Ich habe mit PHP noch nicht soviel programmiert, bin aber Programmierer.
Also kein blutiger Anfänger.

Meine Aufgabenstellung: OCR Erkennung bei einem Bild (jpeg)
Dies soll in einer Web Anwendung funktionieren.
Nun bin ich durch vieles suchen darauf gestoßen das PHP hierbei eventuell der richtige Ansatz wäre.

Und auf das bin ich auch gestoßen:
PHP: GD - Manual

Ist mein Vorhaben möglich? Mit PHP ein Bild einzulesen die einzelnen Buchstaben zu erkennen, sie zu vergleichen mit bestehenden Buchstaben und so eine OCR Erkennung zu programmieren?

lg. Danke für eure Antworten.
Mit Zitat antworten
  #2 (permalink)  
Alt 13-09-2011, 17:20
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Vielleicht ist das hier was für dich?

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 13-09-2011, 17:40
alexander_fire
 Registrierter Benutzer
Links : Onlinestatus : alexander_fire ist offline
Registriert seit: Sep 2011
Beiträge: 5
alexander_fire befindet sich auf einem aufstrebenden Ast
Standard

Hallo,

danke für die Antwort.

Ähhmmm.... wenn ich diese Example_01.php ausführe (was ja ein Beispiel sein sollte)
zeigt es bei allen beispielbildern "not recognised yet" an. Also funktioniert dies nicht wirklich oder mache ich etwas falsch?

lg.
Mit Zitat antworten
  #4 (permalink)  
Alt 13-09-2011, 17:50
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
This class provides a base implementation for an OCR tool. It can be trained to learn how to recognize each letter drawn in an image. Then it can be used to recognize longer texts in real documents.
Ansonsten hilft nur weitersuchen.

Peter

EDIT:
Warum gehst du eigentlich nicht anders vor? Du generierst per PHP ein paar Buchstaben, jagst die durch die Gdlib und dann hast du ein Captcha und du kennst schon die Buchstabenkombination.
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (13-09-2011 um 17:52 Uhr)
Mit Zitat antworten
  #5 (permalink)  
Alt 13-09-2011, 17:56
alexander_fire
 Registrierter Benutzer
Links : Onlinestatus : alexander_fire ist offline
Registriert seit: Sep 2011
Beiträge: 5
alexander_fire befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von Kropff Beitrag anzeigen

EDIT:
Warum gehst du eigentlich nicht anders vor? Du generierst per PHP ein paar Buchstaben, jagst die durch die Gdlib und dann hast du ein Captcha und du kennst schon die Buchstabenkombination.
Ähhmmm.....
Da komm ich gerade nicht mit?

buchstaben erzeugen per PHP: Okey... werd ich schon irgendwie lernen, bzw. googeln.

durch Gdlib jagen?
Was habe ich? Captcha?

Kannste mir das nochmal genauer erklären? gg

lg.
Mit Zitat antworten
  #6 (permalink)  
Alt 13-09-2011, 18:07
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Da erzeugst mit rand ein paar Zahlen. Und wandelst die mit chr in Buchstaben um (Dec-Zahl aus der ASCII-Tabelle). Und den Rest bastelst du mit der Gdlib zusammen. Bei Letzterer kann ich dir aber nicht weiterhelfen, da ich damit kaum gearbeitet habe.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #7 (permalink)  
Alt 13-09-2011, 18:20
Benutzerbild von ApoY2k ApoY2k
 Registrierter Benutzer
Links : Onlinestatus : ApoY2k ist offline
Registriert seit: Nov 2006
Beiträge: 359
ApoY2k befindet sich auf einem aufstrebenden Ast
ApoY2k eine Nachricht über ICQ schicken ApoY2k eine Nachricht über Skype™ schicken
Standard

Versteh nicht wie ihm das helfen soll... er will doch Buchstaben erkennen und nicht erzeugen?
__________________
This is what happens when an unstoppable force meets an immovable object.
Mit Zitat antworten
  #8 (permalink)  
Alt 13-09-2011, 18:21
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von ApoY2k Beitrag anzeigen
Versteh nicht wie ihm das helfen soll... er will doch Buchstaben erkennen und nicht erzeugen?
Upsi, hab mich zu sehr auf das Captcha konzentriert.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #9 (permalink)  
Alt 13-09-2011, 18:55
alexander_fire
 Registrierter Benutzer
Links : Onlinestatus : alexander_fire ist offline
Registriert seit: Sep 2011
Beiträge: 5
alexander_fire befindet sich auf einem aufstrebenden Ast
Standard

also ich bin noch immer nicht schlauer...
hat mir in der tat nicht wirklich geholfen.

wäre für mehr vorschläge sehr dankbar.

Bzw. grundsätzlich ist es möglich eine halbwegs gute OCR-Erkennung selber mit PHP zu programmieren. Wird natürlich eine Weile dauern schätzi ich. aber das ist okey....
Mit Zitat antworten
  #10 (permalink)  
Alt 13-09-2011, 21:51
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Also eine reine OCR-Erkennung ist wohl ziemlich heftig. Frag am Besten mal all die Spammer, die so was knacken. Und tierisch viel Arbeit sowie Geld darin investieren.

Peter

PS. Was genau hast du eigentlich vor?
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #11 (permalink)  
Alt 14-09-2011, 01:36
hostbar_danny
 Registrierter Benutzer
Links : Onlinestatus : hostbar_danny ist offline
Registriert seit: Feb 2011
Beiträge: 66
hostbar_danny befindet sich auf einem aufstrebenden Ast
Standard

Was sind das denn für Grafiken? Sind das große Dokumente die du zu Text konvertieren möchtest oder nur einzelne Buchstaben / Captcha ? OCR ist grundsätzlich recht ressourcenintensiv, macht es da nicht vielleicht Sinn das ganze nicht per PHP zu lösen, sondern mit bewährter Software die auf dem Server läuft ?

Alternative wäre da vielleicht auch ein Webservice. Google Docs bietet OCR aus Grafiken und PDF an. Ich kenn die GoogleDocs API nicht wirklich gut und hab nur mal einen kurzen Blick darauf geworden, aber so wie ich es verstehe lädt er das konvertierte Dokument in dein Google Docs Account... Aber ich vermute da gibt es auch eine genau so einfach Möglichkeit das konvertierte Dokument wieder auszulesen.

Protocol Guide (v3.0) - Google Documents List Data API v3.0 - Google Code

Oder ein anderer OCR Web Service, von denen es einige zu geben scheint. Nun weiß ich nicht ob wieviele Requests du hast, ob du dafür Geld ausgeben möchtest, etc... Ohne zu wissen ob der Dienst gut oder schlecht ist, vielleicht ist das ja was für dich Ocr Api Service - Iphone - Android - Blackberry - Windows Phone - Web apps

Gruß Danny

P.S. Falls es zum Knacken von Captchas ist, dafür gibt es ebenfalls ein paar "gute" Web-Services

Geändert von hostbar_danny (14-09-2011 um 01:41 Uhr)
Mit Zitat antworten
  #12 (permalink)  
Alt 14-09-2011, 08:10
alexander_fire
 Registrierter Benutzer
Links : Onlinestatus : alexander_fire ist offline
Registriert seit: Sep 2011
Beiträge: 5
alexander_fire befindet sich auf einem aufstrebenden Ast
Standard

danke für die vielen Tipps.

Ich werde mir das ganze gleich genauer ansehen.

Es geht darum:
Der Benutzer fotografiert mit der Handykamera einen Beleg (z.B. Bahnticket) und das Programm soll eben den Text davon erkennen und im Anschluss die wichtigsten Daten daraus herauslesen und verbuchen.

Handykameras haben mittlerweile schon hohe Auflösungen. Würde das mit PHP nicht mehr funktionieren? (zu Ressourcen intensiv?)

lg.
Mit Zitat antworten
  #13 (permalink)  
Alt 14-09-2011, 11:15
hostbar_danny
 Registrierter Benutzer
Links : Onlinestatus : hostbar_danny ist offline
Registriert seit: Feb 2011
Beiträge: 66
hostbar_danny befindet sich auf einem aufstrebenden Ast
Standard

Hallo,

sicherlich mag das auch mit PHP gehen. Ich bin jetzt nicht so fit in der Theorie hinter Texterkennung, aber soweit ich mich noch an meine Bildinformatik Vorlesung erinnere läuft Mustererkennung wie folgt ab:

Du hast dein Ausgangsbild, entfernst unwichtige Bildinformationen (z.B. Nicht-Text/Linien/etc.), erkennst Merkmale in dem Bild und Klassifizierst diese.

Und hier liegt der Punkt, die Merkmale musst du dem System erst einmal beibringen. So musst du in deinem Fall alle bei dir möglicherweise vorkommenden Zeichen in Merkmalen ausdrucken. Bei der Analyse erkennst du im Eingabebild ebenfalls Merkmale und durch die Klassifikation kommst du dann zum Schluss, dass z.B. die gefundenen Merkmale am besten auf den Buchstaben A passen.

Und deshab hat phpOCR wahrscheinlich bei dir nicht funktioniert. Ich hab mir das Paket mal heruntergeladen, in der char_inc_6.php ist die Merkmalsdatenbank für die Zahlen 0-9. Für andere Zeichen, bzw. Fonts muss das System trainiert werden (wie steht in der readme).

Schau dir mal Google an, die nutzen den reCaptcha Dienst genau für diesen Zweck. Ein Captcha mit zwei Wörtern, eins ist bekannt und bei dem anderen ist man sich nicht "sicher". Gibt der Benutzer nun das bekannte richtig ein und beim unsicheren auch nicht Murks ein, dann gehen Sie davon aus, dass der Besucher auch das zweite Wort richtig eingegeben hat und Sie haben ein neues Wort gelernt. Damit wird das OCR System von Google Books (evt. Docs) trainiert.

Bei dir kommt ja noch ein Punkt dazu. Aufnahmen mit der Handy Cam sind selten senkrecht von oben. Dein Text ist also zusätzlich je nach Winkel verzerrt.

Nummernschilder in Deutschland z.B. haben deshalb ein speziellen Font der für die einzelnen Zeichen, sehr unterschiedliche Merkmale liefert und deshalb die Erkennung des Nummerschild bei Blitzern (leider ) sehr gut funktioniert.

Es ist also sicherlich möglich, aber je nach dem wie unterschiedlich deine Eingabebilder sind, sicherlich nicht einfach

Gruß Danny
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
ocr, php


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 11:07 Uhr.