komprimierte PDF Files Parsen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • komprimierte PDF Files Parsen

    Gibt es die möglichkeit komprimierte PDF Files mit PHP zu parsen
    um dann einzelne Informationen heraus zu filtern?

    Habe das Netz schon abgesucht und habe nur Lösungen gefunden mit
    denen man nur unkomprimierte PDF Files parsen kann.

    Danke für eure Hilfe.

  • #2
    Was sind komprimierte PDFs? Nach welcher Methode sollen die komprimiert sein?

    Kommentar


    • #3
      Zitat von pekka Beitrag anzeigen
      Nach welcher Methode sollen die komprimiert sein?
      Es gibt PDF Dateien die man mit einem Editor öffnet und man sieht XML
      Code und es gibt Dateien da is nur Zeichensalat drin.
      Scheint ja komprimiert oder codiert zu sein.
      Meine frage ist halt gibt es wie bei XML Dateien einen Parser das man
      es mit PHP lesen und verarbeiten kann oder muß man da extra
      Programme installieren die das machen?

      Kommentar


      • #4
        PDFs? XML?
        Nicht, daß ich wüßte. Seit wann?
        Zeichensalat ist die Norm.
        Zeig mal so ein komprimiertes und ein unkomprimiertes.
        Und woraus schließt Du, daß die Lösungen im Netz nur mit einer Art Datei umgehen können?

        Kommentar


        • #5
          Zitat von pekka Beitrag anzeigen
          PDFs? XML?
          Nicht, daß ich wüßte. Seit wann?
          Zeichensalat ist die Norm.
          Developer Resources
          gruss Chris

          [color=blue]Derjenige, der sagt: "Es geht nicht", soll den nicht stoeren, der's gerade tut."[/color]

          Kommentar


          • #6
            Zitat von MTCook Beitrag anzeigen
            Es gibt PDF Dateien die man mit einem Editor öffnet und man sieht XML Code und es gibt Dateien da is nur Zeichensalat drin.
            Scheint ja komprimiert oder codiert zu sein.
            Das hängt einzig un alleine davon ab, womit die PDFs erstellt wurden. XML wird erst seit Acrobat 6 (?) in die Dateien geschrieben. Aber auch da ist noch Zeichensalat drin.

            Peter
            Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
            Meine Seite

            Kommentar


            • #7
              .. und alle mir bekannten Libraries für PHP schreiben und lesen "komprimierten" Zeichensalat. Es dürfte eher Probleme geben, mit den XML-Basierten Formaten umzugehen.

              Kommentar


              • #8
                Zitat von pekka Beitrag anzeigen
                .. und alle mir bekannten Libraries für PHP schreiben und lesen "komprimierten" Zeichensalat. Es dürfte eher Probleme geben, mit den XML-Basierten Formaten umzugehen.
                kannst du mir ein paar Dir bekannte Libraries für PHP nennen?

                Danke

                Kommentar


                • #9
                  Open Source: FPDF
                  fpdf.de - Herzlich willkommen

                  Kommerziell: PDFLib
                  PDFlib GmbH

                  Zum Auslesen bzw. Text extrahieren (Kommandozeilen-Tool):
                  Xpdf

                  Was willst du denn machen?

                  Kommentar


                  • #10
                    Zitat von pekka Beitrag anzeigen
                    Was willst du denn machen?
                    Ich will Aufträge die immer im selben Format per Mail kommen
                    auslesen und aufarbeiten!

                    Kommentar


                    • #11
                      Zitat von MTCook Beitrag anzeigen
                      Ich will Aufträge die immer im selben Format per Mail kommen
                      auslesen und aufarbeiten!
                      Was heißt das genau? In welcher Form kommen Aufträge?

                      Kommentar


                      • #12
                        Ich füge mal noch das Zend_Pdf-Paket mit in die Liste ein.

                        Kommentar


                        • #13
                          Zitat von pekka Beitrag anzeigen
                          Was heißt das genau? In welcher Form kommen Aufträge?
                          Als PDF. Mit der Form meine ich das immer da steht z.B.
                          Name: Müller
                          Vorname: Hans
                          usw...

                          Kommentar

                          Lädt...
                          X