php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 30-03-2016, 19:24
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard ISO-8859-1 zu UTF-8 konvertieren

Hallo zusammen:

Ich habe einen String der in ISO-8859-1 (LATIN-1) codiert ist und möchte diesen umwandeln UTF-8.

Leider scheint das nicht zu klappen:

Hier der Ausgangsstring:
4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86


Hier das Ergebnis:
4055765204275;261270001; ;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61% Baumwolle 39% Polyamid;100% Acetat; ; ;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE; ;0,6;Black;Jacken & M�ntel;Stepp & Daune; ;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;86

Hier der Code:
$content = "4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86 ";
echo $content;

$str = utf8_encode($content);

echo "<hr>" . $str . "<hr>";


Sieht ganz einfach aus, aber leider werden die Rauten/Fragezeichen nicht in Umlaut ä konvertiert sondern in �

Ich habe auch mb_convert_encoding() getestet mit dem gleichem inkorrektem Ergebnis...

Was mache ich falsch?
Mit Zitat antworten
  #2 (permalink)  
Alt 30-03-2016, 19:38
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes. Tippe mal auf eine MS-Office Kodierung.

Gruß
Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 30-03-2016, 19:40
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 451
mermshaus wird schon bald berühmt werden
Standard

Edit: Ne, sorry, der Rest dieses Posts stimmt nicht, aber kann dennoch nicht schaden, mal zu gucken, ob der Header passt.

Hier fehlt sicherlich erst mal nur der passende Content-Type-Header. Der Browser weiß nicht, dass er da UTF-8 rendern soll.

PHP-Code:
header('Content-Type: text/html; charset=UTF-8'); 

Geändert von mermshaus (30-03-2016 um 19:43 Uhr)
Mit Zitat antworten
  #4 (permalink)  
Alt 30-03-2016, 19:41
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard

Das wäre möglich. Ich habe https://nlp.fi.muni.cz/projects/chared/ detekten des Encodings benutzt.

Falls es ein MS-Office Encoding wäre, wie könnte Ich das feststellen und korrekt konvertieren?
Mit Zitat antworten
  #5 (permalink)  
Alt 30-03-2016, 19:50
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 451
mermshaus wird schon bald berühmt werden
Standard

Ich denke, ich habs.

Zitat:
Zitat von Kropff
Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes.
Ja. Der Original-String ist schon UTF-8. Das � steht nicht für ein Zeichen, das der Editor nicht anzeigen kann, das � ist tatsächlich der Replacement Character (U+FFFD).

Da das schon UTF-8 ist, kodierst du den mit utf8_encode dann doppelt.

Dein String mit den Daten aus deiner Testdatei ist also schon im Eimer. Der enthält keine Informationen mehr, an die Umlaute zu kommen. Hast du die Daten noch anders vorliegen?

Demo:

PHP-Code:
<?php

header
('Content-Type: text/html; charset=UTF-8');

$replacementCharacterInUtf8 "\xEF\xBF\xBD";

var_dump(
    
$replacementCharacterInUtf8,                  // string(3) "�"
    
utf8_encode($replacementCharacterInUtf8)      // string(6) "�"
);
Edit:

Wenn du die Daten eigentlich in einer eigenen Datei liegen hast, kann es gut sein, dass dir nur dein Quellcode-Editor die Zeichen falsch ersetzt hat, weil er sauberes UTF-8 generieren wollte. In dem Fall probier es mal mit:

PHP-Code:
$content file_get_contents(__DIR__ '/the-file.dat');
$contentUtf8 utf8_encode($content);

header('Content-Type: text/html; charset=UTF-8');
echo 
$contentUtf8

Geändert von mermshaus (30-03-2016 um 20:08 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
character encoding, iso-8859-1, utf-8


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Server von iso-8859-1 auf utf-8 umgestellt jo73 PHP Developer Forum 16 09-11-2010 21:55
ISO-8859-1 nach UTF-8 und die Sonderzeichen martinm79 PHP Developer Forum 13 22-09-2009 00:41
cp850/cp437 nach iso-8859-x oder utf-8? CharActeR PHP Developer Forum 2 31-08-2006 16:33
iconv UTF-8 ISO-8859-7 ISO-8859-1 Orestes PHP Developer Forum 16 26-07-2006 11:12
utf-8 / iso-8859-1 Daniel1975 PHP Developer Forum 0 29-01-2005 19:20

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 02:40 Uhr.