exec macht bei chinesischen Zeichen Probleme

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • exec macht bei chinesischen Zeichen Probleme

    Hallo,

    Habe folgendes Problem: Ich will mit php und dem Befehl exec das Programm catdoc aufrufen (Indizieren von Word-Dokumenten):

    Wenn ich folgenden PHP-Code aufrufe
    PHP-Code:
    exec("'/var/www/html/kt3/catdoc/src/catdoc' '-w' '-d' 'utf8' '/tmp/book01.doc' >> '/tmp/kt.catdocrbUIo5'");
    echo 
    exec("'/var/www/html/kt3/catdoc/src/catdoc' '-w' '-d' 'utf8' '/tmp/book01.doc'"); 
    erhalte ich als Ausgabe ? book in der Datei /tmp/kt.catdocrbUIo5. Hingegen wenn ich den Code
    PHP-Code:
    '/var/www/html/kt3/catdoc/src/catdoc' '-w' '-d' 'utf8' '/tmp/book01.doc' >> '/tmp/kt.catdocrbUIo5' 
    von der Kommandozeile aufrufe, erhalte ich die korrekte Ausgabe 六 book (was auch in dem indizierten Word-Dokument steht!). Hier mal ein paar Samplefiles zum Nachvollziehen der ganzen Sache (catdoc wird dann noch benötigt!): DOWNLOAD

    Ich vermute dass es an irgendwelchen Rechten der Installation von Apache und PHP liegt. Leider weiss ich gerade auch nicht mehr wo ich da anfangen soll...

    Hier mal meine Serverkonfiguration:
    RHEL 4
    APACHE 2
    PHP 4.3.9 (neuere Version nicht möglich !)
    '--enable-mbstring=shared' '--enable-mbstr-enc-trans' '--enable-mbregex'
    MySQL 5.0.20


    ThX,
    Tobias
    Zuletzt geändert von Tobias1979; 24.04.2006, 10:10.

  • #2
    Ist denn das PHP-Skript bzw. sein HTML-Gerüst, mit dem Du das ganze ausgibst, ebenfalls auf UTF-8 eingestellt? Nicht daß es daran liegt.

    Kommentar


    • #3
      Genau das ist eben auch meine Vermutung dass da was nicht passt. Ich weiss jedoch nicht mehr woran ich da rumschrauben soll, damit es klappt.

      Das was ich bisher gemacht habe, waren einige Parameter in der php.ini unter der mbstring konfiguration verändert. Also wäre ich um jeden Ansatzpunkt zu der Serverkonfiguration von PHP dankbar damit das Word-File korrekt in eine Textdatei mit UTF8 Encoding geparst wird.

      Danke

      Tobias

      Kommentar


      • #4
        damit das Word-File korrekt in eine Textdatei mit UTF8 Encoding geparst wird.
        das ist nicht der Punkt, den ich meine. Ich gehe davon aus, daß das Zeichen korrekt geparst wird, dann aber im Browser nicht richtig angezeigt.
        Dazu:
        http://www.w3.org/International/O-HTTP-charset

        Kommentar


        • #5
          Ich jage die ganze Geschichte zu Testzwecken einfach nur in ein Textfile und lasse dies dann mit Firefox anzeigen, benutze also gar keine Headerbeschreibung.

          Das DMS-System für das ich dieses PHP-Konstrukt geschrieben habe, macht das gleiche auch für PDF-Files, nur hierbei wird ein anderer Code benutzt, aber letztendlich landet hierbei der Code korrekt in einer Textdatei. Daher eben die Aussage dass es eigentlich nicht an der Headerbeschreibung liegen kann.

          Also ist irgendwo bei dem Parsen und dem Zusammenspiel mit PHP das Problem.

          Was ich auch noch vermuten könnte ist, dass es irgendwelche Rechteprobleme bei der PHP-Umgebung und dem APACHE gibt. Da aber eigentlich das ganze auf RPM-Basis installiert wurde schliesse ich das mehr oder weniger aus.

          Tobias
          Zuletzt geändert von Tobias1979; 24.04.2006, 11:50.

          Kommentar


          • #6
            Etwas Bockmist gerade gebaut... einfach dieses Posting ignorieren
            Zuletzt geändert von Tobias1979; 24.04.2006, 11:51.

            Kommentar

            Lädt...
            X