php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 30-03-2016, 20:24
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard ISO-8859-1 zu UTF-8 konvertieren

Hallo zusammen:

Ich habe einen String der in ISO-8859-1 (LATIN-1) codiert ist und möchte diesen umwandeln UTF-8.

Leider scheint das nicht zu klappen:

Hier der Ausgangsstring:
4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86


Hier das Ergebnis:
4055765204275;261270001; ;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61% Baumwolle 39% Polyamid;100% Acetat; ; ;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE; ;0,6;Black;Jacken & M�ntel;Stepp & Daune; ;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;86

Hier der Code:
$content = "4055765204275;261270001;
;Cannes;6138;Beige;38;261270001-6138-38;199,9;199,9;80;61%
Baumwolle 39% Polyamid;100% Acetat; ;
;FS16;70;116;FS16Jacken & M�ntel;1;EUR;DE;
;0,6;Black;Jacken & M�ntel;Stepp & Daune;
;0010001001001001;261270001; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;
; ; ;86 ";
echo $content;

$str = utf8_encode($content);

echo "<hr>" . $str . "<hr>";


Sieht ganz einfach aus, aber leider werden die Rauten/Fragezeichen nicht in Umlaut ä konvertiert sondern in �

Ich habe auch mb_convert_encoding() getestet mit dem gleichem inkorrektem Ergebnis...

Was mache ich falsch?
Mit Zitat antworten
  #2 (permalink)  
Alt 30-03-2016, 20:38
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes. Tippe mal auf eine MS-Office Kodierung.

Gruß
Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 30-03-2016, 20:40
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 451
mermshaus wird schon bald berühmt werden
Standard

Edit: Ne, sorry, der Rest dieses Posts stimmt nicht, aber kann dennoch nicht schaden, mal zu gucken, ob der Header passt.

Hier fehlt sicherlich erst mal nur der passende Content-Type-Header. Der Browser weiß nicht, dass er da UTF-8 rendern soll.

PHP-Code:
header('Content-Type: text/html; charset=UTF-8'); 

Geändert von mermshaus (30-03-2016 um 20:43 Uhr)
Mit Zitat antworten
  #4 (permalink)  
Alt 30-03-2016, 20:41
micrad
 Registrierter Benutzer
Links : Onlinestatus : micrad ist offline
Registriert seit: Mar 2016
Beiträge: 2
micrad befindet sich auf einem aufstrebenden Ast
Standard

Das wäre möglich. Ich habe https://nlp.fi.muni.cz/projects/chared/ detekten des Encodings benutzt.

Falls es ein MS-Office Encoding wäre, wie könnte Ich das feststellen und korrekt konvertieren?
Mit Zitat antworten
  #5 (permalink)  
Alt 30-03-2016, 20:50
Benutzerbild von mermshaus mermshaus
 Registrierter Benutzer
Links : Onlinestatus : mermshaus ist offline
Registriert seit: Jun 2009
Beiträge: 451
mermshaus wird schon bald berühmt werden
Standard

Ich denke, ich habs.

Zitat:
Zitat von Kropff
Offenbar ist der Original-String wegen der Fehler kein ISO-8859-1 sondern etwas anderes.
Ja. Der Original-String ist schon UTF-8. Das � steht nicht für ein Zeichen, das der Editor nicht anzeigen kann, das � ist tatsächlich der Replacement Character (U+FFFD).

Da das schon UTF-8 ist, kodierst du den mit utf8_encode dann doppelt.

Dein String mit den Daten aus deiner Testdatei ist also schon im Eimer. Der enthält keine Informationen mehr, an die Umlaute zu kommen. Hast du die Daten noch anders vorliegen?

Demo:

PHP-Code:
<?php

header
('Content-Type: text/html; charset=UTF-8');

$replacementCharacterInUtf8 "\xEF\xBF\xBD";

var_dump(
    
$replacementCharacterInUtf8,                  // string(3) "�"
    
utf8_encode($replacementCharacterInUtf8)      // string(6) "�"
);
Edit:

Wenn du die Daten eigentlich in einer eigenen Datei liegen hast, kann es gut sein, dass dir nur dein Quellcode-Editor die Zeichen falsch ersetzt hat, weil er sauberes UTF-8 generieren wollte. In dem Fall probier es mal mit:

PHP-Code:
$content file_get_contents(__DIR__ '/the-file.dat');
$contentUtf8 utf8_encode($content);

header('Content-Type: text/html; charset=UTF-8');
echo 
$contentUtf8

Geändert von mermshaus (30-03-2016 um 21:08 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
character encoding, iso-8859-1, utf-8


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Server von iso-8859-1 auf utf-8 umgestellt jo73 PHP Developer Forum 16 09-11-2010 22:55
ISO-8859-1 nach UTF-8 und die Sonderzeichen martinm79 PHP Developer Forum 13 22-09-2009 01:41
cp850/cp437 nach iso-8859-x oder utf-8? CharActeR PHP Developer Forum 2 31-08-2006 17:33
iconv UTF-8 ISO-8859-7 ISO-8859-1 Orestes PHP Developer Forum 16 26-07-2006 12:12
utf-8 / iso-8859-1 Daniel1975 PHP Developer Forum 0 29-01-2005 20:20

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 20:45 Uhr.