PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr

PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr (https://www.php-resource.de/forum/)
-   PHP Developer Forum (https://www.php-resource.de/forum/php-developer-forum/)
-   -   Excel Export CSV - Umlaute - PHP Verarbeitung (https://www.php-resource.de/forum/php-developer-forum/104914-excel-export-csv-umlaute-php-verarbeitung.html)

Magic11 23-01-2015 16:53

Excel Export CSV - Umlaute - PHP Verarbeitung
 
Hallo zusammen,

ich habe zwar per Suche schon ein paar Sachen gefunden zum Thema Excel, CSC und Umlaute allerdings werde ich leider noch nicht ganz schlau aus dem ganzen.

Ich habe eine CSV Datei die von Excel als CSV gespeichert wurde. Die Excel Datei enthält Namen mit Umlauten.
Die Umlaute werden in der CSV-Datei nicht angezeigt oder eben "falsch" dargestellt z.B.: Mller, G”tze.

Jetzt stellt sich für mich die Frage wie ich hier die Umlaute in PHP wieder anzeigen kann.
Die Daten sollen in eine XML-Datei gespeichert werden mit UTF-8 Codierung.
(Das ist schon realisiert)

Ich weiß halt jetzt nicht wie ich das mit den Umlauten richtig hinbekomme?
Kann ich die CSV Datei so verwenden wie Sie aus Excel exportiert wurde und kann die Daten "richtig" in der XML-Datei darstellen?

Danke im Voraus für eure Hilfe bzw. Anregungen.

Kropff 23-01-2015 19:14

Excel und Sonderzeichen. Die alte Geschichte. Welches Zeichenformat hat den die csv-Datei?

Peter

PS: mach das besser mit OpenOffice und UTF-8, dann hast du keine Probleme.

Magic11 25-01-2015 23:53

Hallo Kropff,

also wenn ich es richtig herausgefunden habe mit notepad++ dann müsste die Datei in "Mitteleuropäisch" und "OEM 852" codiert sein, kann das sein?
Zumindest wenn ich diesen Zeichensatz im notepad++ einstelle dann werden die Umlaute auch angezeigt in der Datei?!

Wenn ich die CSV Datei dann eben weiterverarbeite in eine XML-Datei dann wird dort natürlich nur mist angezeigt (siehe anhang)

Danke für den Tipp mit OpenOffice, wäre halt schön wenn ich es ohne den Umweg über OpenOffice hinbekommen könnte, stellt sich eben die Frage ob das überhaupt möglich ist?!

http://img3.fotos-hochladen.net/thum...rz8y_thumb.jpg

h3ll 26-01-2015 00:00

Die Frage ist, kommt die CSV-Datei immer von dir oder von anderen? Denn wenn sie von dir kommt, kannst du ja problemlos die Daten in eine andere Kodierung konvertieren. Wenn sie allerdings von einer fremden Person stammt, dann muss diese beim Upload angeben, in welcher Kodierung die CSV-Datei verfasst wurde. Ist die Kodierung nicht bekannt, wird daraus mehr oder weniger ein Glücksspiel. Man kann die richtige Kodierung erraten oder auch nicht.

Magic11 26-01-2015 10:05

@h3ll: Danke für den Tipp mit der Konvertierung, da habe ich jetzt gar nicht dran gedacht dass mir Notepad++ ja die Möglichkeit dazu gibt die Daten zu konvertieren.

Das Endresultat sollte eigentlich schon so werden dass die Datei von X-beliebigen Leuten kommen bzw. unter Umständen auch hochgeladen werden kann. Aber ok das wäre Zukunftsmusik.
Wenn man es User-unfreundlich machen will dann könnte man vor dem Upload darauf hinweisen dass die csv-Datei keine Umlaute enthalten darf, da diese nicht korrekt weiterverarbeitet werden können.

Da die User, die eine solche CSV-Datei erstellen, wohl nicht wissen wie das ganze codiert ist, wird wohl nur die User-unfreundliche Version bleiben dass man darauf hinweist dass keine Umlaute vorhanden sein dürfen.
Mir bleibt wohl keine andere Wahl oder?

Ich schätze bzw. gehe davon aus dass 90% der User die Daten in Excel aufbereiten und anschließend einfach nur als CSV-Datei abspeichern und hochladen würden.

h3ll 26-01-2015 21:18

Zitat:

Zitat von Magic11 (Beitrag 670372)
Das Endresultat sollte eigentlich schon so werden dass die Datei von X-beliebigen Leuten kommen bzw. unter Umständen auch hochgeladen werden kann. Aber ok das wäre Zukunftsmusik.
Wenn man es User-unfreundlich machen will dann könnte man vor dem Upload darauf hinweisen dass die csv-Datei keine Umlaute enthalten darf, da diese nicht korrekt weiterverarbeitet werden können.

Wenn die Leute Excel verwenden, wäre es user-freundlich, wenn du auch Excel-Dateien einlesen würdest statt (bzw. zusätzlich zu) CSV-Dateien.

SysOp 27-01-2015 10:36

Auch in Excel kann man definieren, welche Kodierung man einsetzen möchte.
Die Daten also gleich richtig Kodiert (UTF-8) exportieren könnte folglich helfen.

h3ll 27-01-2015 11:06

Zitat:

Zitat von SysOp (Beitrag 670376)
Auch in Excel kann man definieren, welche Kodierung man einsetzen möchte.

Nein. Zumindest nicht in Excel 2013.

SysOp 27-01-2015 13:44

Hahaha, stimmt, das zeigt mir nur, wie defekt Office 2013 eigentlich ist.

https://help.salesforce.com/apex/HTV...language=en_US :goth:
Na der Weg ist ja mal einen Link wert.

Magic11 27-01-2015 17:07

@h3ll: ok jetzt hast mich erwischt, ist natürlich richtig. dann müsste ich gleich nur excel dateien annehmen ;-)

@SysOp: Das mit der Einstellung für die Codierung hatte ich auch schon mal gefunden aber das ganze interessiert anscheinend Excel nicht was man dort einstellt :motz:

Wenn ich jetzt davon ausgehen würde dass die CSV immer mit Excel erstellt wurde, wäre es dann möglich die CSV-Daten in UTF-8 zu codieren damit die Umlaute in der XML-Datei richtig dargestellt bzw. eingetragen werden können?

SysOp 27-01-2015 17:18

Was ich so (beim Blättern im Netz) zu Excel gefunden habe, macht Excel XML-Dateien immer UTF-8 Kodiert, vielleicht hilft das ja.
Excel to XML - Easy Excel Tutorial

Mit PHP helfen vielleicht
http://us1.php.net/manual/de/function.utf8-encode.php und ansdersrum
http://us1.php.net/manual/de/function.utf8-decode.php

Dazu muss aber sicher sein, dass die Daten ISO8859-1 codiert sind.

Magic11 27-01-2015 17:25

@SysOp: Danke für den Link.

Ist leider nicht so einfach.
Die Daten die in der Excel Datei gespeichert sind, sollen für eine SEPA-Lastschrift XML-Datei verwendet werden und die Excel hat ja leider einen anderen Aufbau als die XML-Datei benötigt bzw. braucht.

h3ll 27-01-2015 17:36

Zitat:

Zitat von Magic11 (Beitrag 670380)
Wenn ich jetzt davon ausgehen würde dass die CSV immer mit Excel erstellt wurde, wäre es dann möglich die CSV-Daten in UTF-8 zu codieren damit die Umlaute in der XML-Datei richtig dargestellt bzw. eingetragen werden können?

Nur wenn du weißt, welche Kodierung für die CSV-Datei verwendet wurde. Je nach Sprache der Windows-Installation kann es eine andere Kodierung sein. Dann kannst du die Daten mit iconv() in UTF-8 konvertieren.

Zitat:

Zitat von SysOp (Beitrag 670381)
Mit PHP helfen vielleicht
PHP: utf8_encode - Manual und ansdersrum
PHP: utf8_decode - Manual

Dazu muss aber sicher sein, dass die Daten ISO8859-1 codiert sind.

Nachdem Windows bzw. Excel nicht mit ISO-8859-1 arbeiten, kannst du das abhaken.

Magic11 28-01-2015 10:36

Danke für die Info und Hilfe an alle.

Ich hab das ganze jetzt mal so getestet/umgesetzt:

PHP-Code:

$temp iconv("CP852""UTF-8"$zeile[$i][0])." ".iconv("CP852""UTF-8"$zeile[$i][1]); 

Funktionierte in meinem Testversuchen jetzt auch ohne Probleme.

Ich gehe halt hier davon aus dass ein deutsches Windows vorliegt und die Daten mit Excel exportiert wurden.
Auch wenn hier noch viele Fehler passieren können/werden, so ist es wohl zumindest mal ein Anfang.

Ich schätze mal dass 90% der angesprochenen User ein deutsches Windows haben die eine solche CSV Datei mit Excel erstellen würden.
(Wahrscheinlich auch ziemlich blauäugig von mir ;-) )

h3ll 28-01-2015 12:04

Was spricht jetzt eigentlich gegen eine Excel-Datei? Warum muss es CSV sein?


Alle Zeitangaben in WEZ +2. Es ist jetzt 21:25 Uhr.

Powered by vBulletin® Version 3.8.2 (Deutsch)
Copyright ©2000 - 2022, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.3.0
[c] ebiz-consult GmbH & Co. KG