Wüste Textformatierung oder: "Word Datei-Inhalt in MySQL"

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Wüste Textformatierung oder: "Word Datei-Inhalt in MySQL"

    Ich grüße Alle die diesen Beitrag lesen.

    Ich habe folgendes Szenario:

    Ich bekomme täglich eine in Word erstellte .doc Datei, welche mit vielen vielen Tabellenspalten formatiert ist. Erst habe ich eine Möglichkeit gesucht die Datei "überhaupt" auszulesen -- Antiword.

    Soweit so gut. Ich jage die Datei also durch Antiword und bekomme eine mehr oder minder "wüst" formatierte txt Datei heraus.

    Wüst: -----------------------------------------

    Queue: Partner

    Enginee55528 DeliveryLoca
    r: tion:

    oder

    Adress: AUF DER LAGE 2 ProductDescriptLAT2*Precision M70,NBK,PMD,760,15.4
    ion:

    --------------------------------------------------

    (Ausschnitt - man beachte die "sinnlosen" Umbrüche)

    Auf diese Art setzt sich der Inhalt der Datei dann fort. In der Word Datei wiederholt sich der Inhalt von der Formatierung her dann auch alle 2 Seiten.

    Call 1 - 2 Seiten
    Call 2 - 2 Seiten

    usw. usw.

    Nun möchte ich jeden Call mit "sotiertem" Inhalt in eine MySQL DB packen. Oder zumindest ausgewählte Teile davon.

    Im Moment hängt mein ganzes Vorhaben am auslesen und geordeten verpacken der Daten aus der Word Datei in die DB.

    Was ich mir hier erhoffe sind vielleicht ein paar Denkanstöße in die richtige Richtung. Evtl. hat jemand auch eine ganz andere Idee sowas zu realisieren?

    Überrascht mich ;-)

    Vielen Dank!

  • #2
    Wenn du einen Export nach PDF schaffst würde ich in diese Richtung denken.
    Die Regeln | rtfm | register_globals | strings | SQL-Injections | [COLOR=silver][[/COLOR][COLOR=royalblue]–[/COLOR][COLOR=silver]][/COLOR]

    Kommentar


    • #3
      Auf einer Windowsbox mit installiertem Word kannst du dieses aus PHP heraus via COM ansprechen und die Datei z.B. als Plain Text speichern.
      PHP-Code:
      $word = new COM('Word.Application');
      $word->visible 0;
      $word->Documents->Open($filename);
      $word->ActiveDocument->SaveAs($filename.'.txt'2); 
      $word->quit(0); 
      Schau dir unbedingt mal http://msdn2.microsoft.com/en-us/library/aa662158(office.10).aspx an!

      Alternativ - und plattformunabhängig - könntest du die Tatsache nutzen, dass OpenOffice alle MS Office Formate lesen kann. Mit Puno soll man die OOo-API aus PHP heraus nutzen können.

      Kommentar


      • #4
        Original geschrieben von onemorenerd
        Mit Puno soll man die OOo-API aus PHP heraus nutzen können.
        Ui, interessant! Danke für den Tipp.

        Kommentar


        • #5
          OffTopic:
          *grab*
          [FONT="Helvetica"]twitter.com/unset[/FONT]

          Shitstorm Podcast – Wöchentliches Auskotzen

          Kommentar


          • #6
            Gut, erst mal danke für die ersten Antworten. Office klappt leider nicht, da Debian Etch, aber ich schau mir mal diese OOo Variante an.

            Kommentar


            • #7
              Etwas spät. Aber hat es geklappt mit der OOo Variante? Habe grad ein ähnliches Problem und bin bei Puno nun schon soweit, dass ich versuche ein vorhandes Dokument einzulesen, um dieses zu bearbeiten. Allerdings bringt mich das noch zur Verzweiflung
              Hast du eventuell eine Doku oder ähnliches zu Puno gefunden?

              Kommentar

              Lädt...
              X