php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 30-03-2016, 20:24
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard ISO-8859-1 zu UTF-8 konvertieren

Hallo zusammen:

Ich habe einen String der in ISO-8859-1 (LATIN-1) codiert ist und möchte diesen umwandeln UTF-8.

Leider scheint das nicht zu klappen:

Hier der Ausgangsstring:
4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86


Hier das Ergebnis:
4055765204275;261270001; ;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61% Baumwolle 39% Polyamid;100% Acetat; ; ;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE; ;0,6;Black;Jacken & M�ntel;Stepp & Daune; ;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;86

Hier der Code:
$content = "4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86 ";
echo $content;

$str = utf8_encode($content);

echo "<hr>" . $str . "<hr>";


Sieht ganz einfach aus, aber leider werden die Rauten/Fragezeichen nicht in Umlaut ä konvertiert sondern in �

Ich habe auch mb_convert_encoding() getestet mit dem gleichem inkorrektem Ergebnis...

Was mache ich falsch?
Mit Zitat antworten
  #2 (permalink)  
Alt 30-03-2016, 20:38
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.788
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes. Tippe mal auf eine MS-Office Kodierung.

Gruß
Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 30-03-2016, 20:40
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 452
mermshaus wird schon bald berühmt werden
Standard

Edit: Ne, sorry, der Rest dieses Posts stimmt nicht, aber kann dennoch nicht schaden, mal zu gucken, ob der Header passt.

Hier fehlt sicherlich erst mal nur der passende Content-Type-Header. Der Browser weiß nicht, dass er da UTF-8 rendern soll.

PHP-Code:
header('Content-Type: text/html; charset=UTF-8'); 

Geändert von mermshaus (30-03-2016 um 20:43 Uhr)
Mit Zitat antworten
  #4 (permalink)  
Alt 30-03-2016, 20:41
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard

Das wäre möglich. Ich habe https://nlp.fi.muni.cz/projects/chared/ detekten des Encodings benutzt.

Falls es ein MS-Office Encoding wäre, wie könnte Ich das feststellen und korrekt konvertieren?
Mit Zitat antworten
  #5 (permalink)  
Alt 30-03-2016, 20:50
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 452
mermshaus wird schon bald berühmt werden
Standard

Ich denke, ich habs.

Zitat:
Zitat von Kropff
Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes.
Ja. Der Original-String ist schon UTF-8. Das � steht nicht für ein Zeichen, das der Editor nicht anzeigen kann, das � ist tatsächlich der Replacement Character (U+FFFD).

Da das schon UTF-8 ist, kodierst du den mit utf8_encode dann doppelt.

Dein String mit den Daten aus deiner Testdatei ist also schon im Eimer. Der enthält keine Informationen mehr, an die Umlaute zu kommen. Hast du die Daten noch anders vorliegen?

Demo:

PHP-Code:
<?php

header
('Content-Type: text/html; charset=UTF-8');

$replacementCharacterInUtf8 "\xEF\xBF\xBD";

var_dump(
    
$replacementCharacterInUtf8,                  // string(3) "�"
    
utf8_encode($replacementCharacterInUtf8)      // string(6) "�"
);
Edit:

Wenn du die Daten eigentlich in einer eigenen Datei liegen hast, kann es gut sein, dass dir nur dein Quellcode-Editor die Zeichen falsch ersetzt hat, weil er sauberes UTF-8 generieren wollte. In dem Fall probier es mal mit:

PHP-Code:
$content file_get_contents(__DIR__ '/the-file.dat');
$contentUtf8 utf8_encode($content);

header('Content-Type: text/html; charset=UTF-8');
echo 
$contentUtf8

Geändert von mermshaus (30-03-2016 um 21:08 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
character encoding, iso-8859-1, utf-8


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Server von iso-8859-1 auf utf-8 umgestellt jo73 PHP Developer Forum 16 09-11-2010 22:55
ISO-8859-1 nach UTF-8 und die Sonderzeichen martinm79 PHP Developer Forum 13 22-09-2009 01:41
cp850/cp437 nach iso-8859-x oder utf-8? CharActeR PHP Developer Forum 2 31-08-2006 17:33
iconv UTF-8 ISO-8859-7 ISO-8859-1 Orestes PHP Developer Forum 16 26-07-2006 12:12
utf-8 / iso-8859-1 Daniel1975 PHP Developer Forum 0 29-01-2005 20:20

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Vorteile eines flexiblen ERP Systems
Vorteile eines flexiblen ERP SystemsEin flexibles ERP System bietet in allen Unternehmensbereichen die Grundlage für eine erfolgreiche Verwaltung, Organisation und Planung aller Prozesse.

01.12.2021 | Berni

Software für alle Arten von digitalen Marktplätzen
Software für alle Arten von digitalen MarktplätzenDigitale Marktplätze sind nicht nur im B2C Geschäft seit Jahren etabliert, sondern erfreuen sich mit Kleinanzeigen-Märkten auf lokaler und regionaler Ebene auch im privaten Bereich wachsender Beliebtheit.

09.11.2021 | Berni


 

Aktuelle PHP Scripte

kostenloser PHP-Editor Codelobster ansehen kostenloser PHP-Editor Codelobster

Kostenloser PHP, HTML, CSS, JavaScript editor (IDE) - Codelobster PHP Edition

06.12.2021 Berni | Kategorie: PHP ENTWICKLUNGSUMGEBUNG
ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script ansehen ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script

Mit unserer Lösungen können Sie nahezu jeden B2B / B2C Marktplatz betreiben den Sie sich vorstellen können. Ganz egal ob Sie einen Automarktplatz, Immobilenportal oder einfach einen Anzeigenmarkt betreiben möchten. Mit ebiz-trader können Sie Ihre Anforder

09.11.2021 Berni | Kategorie: PHP/ Anzeigenmarkt
PHP Newsletter Script SuperWebMailer ansehen PHP Newsletter Script SuperWebMailer

Die webbasierte PHP Newsletter Software SuperWebMailer ist die optimale Lösung zur Durchführung eines erfolgreichen E-Mail-Marketings. Zur Nutzung des PHP Script-Pakets ist eine eigene Webpräsenz/Server mit PHP 5 oder neuer, MySQL 4 oder neuer und die

28.10.2021 mirko_swm | Kategorie: PHP/ Mail
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 15:09 Uhr.