php-resource




Archiv verlassen und diese Seite im Standarddesign anzeigen :
Zeichensatz-Problem


 
syco23
20-03-2005, 23:32 
 
Hallo,

Ich mache folgendes: Ich schicke über ein Formlar Text aus einer doc-Datei an ein php-Script. Dieses erstellt mir eine html-Seite, in der ich den üblichen Zeichensatz angebe:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

Wenn ich das ganze nun validiere (validator.w3.org), bekomme ich bei diversen normalen Buchstaben Fehlermeldungen wie diese:

non SGML character number 146

so what?

Gruß,
Syco

 
wahsaga
21-03-2005, 10:11 
 
Original geschrieben von syco23
so what?
wenn dir das problem egal ist, warum fragst du dann ...?


das zeichen ist halt einfach nicht unkodiert erlaubt an der stelle, wo es bei dir auftaucht.

 
syco23
22-03-2005, 01:34 
 
wenn dir das problem egal ist, warum fragst du dann ...?
wie du dir sicher vorstellen kanst, war's nicht so gemeint;)

Es handelt sich um Buchstaben wie z.B. l mitten in Worten ohne Sonderzeichen. Ich kann mir also nicht vorstellen, was daran nicht passt.

Mein einziger Erklärungsansatz: Ein l aus einem Worddokument kann unter Umständen anders kodiert sein, als das regläre ASCII-l. Aber dazu kenne ich mich mit Zeichensätzen leider zu wenig aus.

 
wahsaga
22-03-2005, 09:41 
 
Original geschrieben von syco23
wie du dir sicher vorstellen kanst, war's nicht so gemeint;)
*g* hatte mich nur leicht gewundert - weil "so what?" im englischen das pendant eines schulterzuckend vorgebrachten "na und, was soll's ..." ist.

Es handelt sich um Buchstaben wie z.B. l mitten in Worten ohne Sonderzeichen. Ich kann mir also nicht vorstellen, was daran nicht passt.

Mein einziger Erklärungsansatz: Ein l aus einem Worddokument kann unter Umständen anders kodiert sein, als das regläre ASCII-l. Aber dazu kenne ich mich mit Zeichensätzen leider zu wenig aus.
also beispielsweise das oben genannte zeichen mit der nummer 146 wäre wohl das ’
das liegt aber nicht innerhalb von iso-8859-1, wäre also entweder als entity zu schreiben - oder ein anderes charset zu verwenden, bspw. unicode.

 
Abraxax
30-03-2005, 19:33 
 
@wahsaga
kennst du spontan eine php fkt welche mir die tollen word-copy&paste-fehler in saubere zeichen umwandeln kann?

 
wahsaga
30-03-2005, 21:35 
 
nö.
aber wenn sowas öfter vorkommt würde ich überlegen, gleich auf utf-8 umzusteigen ...

 
Abraxax
30-03-2005, 22:13 
 
ja. an der überlegung war ich auch schon.

hatte vorhin schon mal ein paar threads gelesen und muss jetzt wohl mein framework etwas modifizieren, damit das problemlos klappt.

auch die daten in der db muss ich noch umwandeln. :(

naja. mal sehen, oder ich mache einfach einen würgarround. ;)


Alle Zeitangaben in WEZ +2. Es ist jetzt 19:35 Uhr.