php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > SQL / Datenbanken
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


SQL / Datenbanken Probleme mit SQL? Hier könnt ihr eure Fragen zu SQL (MySQL, PostgreSQL, MS-SQL und andere ANSI-SQL Server) los werden.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 19-10-2009, 14:24
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Lightbulb [gelöst] Sonderzeichen aus Word - Problem nur beim Auslesen

Hab hier eine Tabelle in der hauptsächlich über ein Webformular Texte per Copy&Paste aus Word übernommen werden.

Problem:
Die Texte landen laut phpMyAdmin korrekt in der DB, wenn ich allerdings dann per Script eine Ausgabe machen will, werden Sonderzeichen wie z.B. das "Anführungszeichen unten" oder der verlängerte Gedankenstrich (wie sie Word eben oft automatisch setzt) nicht mehr korrekt dargestellt. Umlaute "ÖÄÜöäü" usw. werden dagegen korrekt dargestellt.

Es ist komplett von vorn bis hinten alles in UTF8 gehalten:
- Zeichensatz der Seite mit dem Eingabefeld
- Zeichensatz des verarbeitetenden Scripts
- Zeichensatz der MySql-Verbindung
- Zeichensatz der DB/Tabelle
- Zeichensatz des auslesenden Scripts
- Zeichensatz der ausgebenden html-Seite

Warum zum Henker (sorry) kann phpMyAdmin diese Zeichen korrekt darstellen und mein Ausgabescript nicht?

Ich hab auch schon beim Ausgabescript nach der Verbindung zu mySql alles nochmal explizit auf UTF8 gesetzt:
PHP-Code:
$query "SET character_set_connection = 'utf8'";
$query "SET character_set_client = 'utf8'";
$query "SET collation_connection = 'utf8_general_ci'";
$query "SET character_set_results = 'utf8'"
Was überseh ich noch?
Mit Zitat antworten
  #2 (permalink)  
Alt 19-10-2009, 14:37
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

ich hab zwar im Moment auch keine Idee, aber wenn du den Firefox benutzt, lohnt es sich, das Firebug Add-On zu installieren. Damit kannst du dir z. B. auch ansehen, wie die Formulardaten zum Server übertragen werden, welchen Response Content-Type der Server mitschickt und sowas alles. Vielleicht kommst du so dem Übeltäter auf die Schliche.

Für gespeicherte Dateien nehm ich nen HEX-Editor (oder den Lister von Total Commander, geht auch über FTP) um sicher zu gehen, dass die in UTF-8 vorliegen.

Gruß,

Amica
Mit Zitat antworten
  #3 (permalink)  
Alt 19-10-2009, 14:49
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

Die HTTP-Header hab ich schon angeschaut - wie gesagt, es läuft von vorn bis hinten in UTF8.

Ein Problem bei der Übertragung der Formulardaten würd auch ned erklären, warum phpMyAdmin die Datensätze richtig darstellen kann, nur meine Ausgabe nicht - ich muss ein Problem beim ausgebenden Script oder html haben.
Mit Zitat antworten
  #4 (permalink)  
Alt 19-10-2009, 14:56
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Ich will dir ja glauben, dass alles auf UTF-8 läuft, aber die Tatsachen sprechen leider dagegen. Wenn deutsche Umlaute korrekt sind, typografische Sonderzeichen aber nicht, sieht es für mich verdammt nach ISO Latin-1 aus.
Mit Zitat antworten
  #5 (permalink)  
Alt 19-10-2009, 14:59
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Ich sehe das Problem eher bei Word. Musste mich vor drei Jahren auch mit dem Problem herumschlagen und habe dafür keine Lösung gefunden. Lag imho daran, dass Word diese speziellen Zeichen nicht standardkonform ausgibt. Das hängt, glaube ich sogar, von der Word-Version ab. Wenn die schon ein wenig älter ist, dann wird's das wohl sein.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #6 (permalink)  
Alt 19-10-2009, 15:06
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

Ich hab jetzt mal das html weggelassen und lasse nur den Inhalt der Textspalte ausgeben. Vor der Ausgabe schicke ich noch den entsprechenden Header vorab
PHP-Code:
header("Content-Type: text/plain; charset=utf-8"); 
bzw. wenn ich es in html einbinde
PHP-Code:
header("Content-Type: text/html; charset=utf-8"); 
Witzig - wenn ich im Browser den Zeichensatz auf ISO-8859-1 stelle, wird der Text korrekt angezeigt.

Ich raff jetzt gar nichts mehr - was bedeutet das nun? Das der Text aus der DB gar nicht in UTF8 kommt?
Mit Zitat antworten
  #7 (permalink)  
Alt 19-10-2009, 15:07
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von Quetschi Beitrag anzeigen
was bedeutet das nun? Das der Text aus der DB gar nicht in UTF8 kommt?
Dass er doppelt UTF-8-codiert ist?
Edit: Ach nee, das ist es nicht.

Geändert von AmicaNoctis (19-10-2009 um 15:09 Uhr) Grund: hab mich geirrt
Mit Zitat antworten
  #8 (permalink)  
Alt 19-10-2009, 15:33
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

Ich würde mal drauf tippen, daß die Sonderzeichen aus Word in ISO oder einer ähnlichen Kodierung geliefert werden?

Eventuell sind die Mechanismen anguckenswert, die die großen Rich-Text-Javascript-Editoren fürs Copy&Paste von Word-Inhalten einsetzen. Das sind normalerweise Funktionen nach dem Muster cleanupWordHTML(). Ob die auch Zeichensätze konvertieren weiß ich nicht, es kann aber gut sein.
Mit Zitat antworten
  #9 (permalink)  
Alt 19-10-2009, 15:34
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

@Kropff (hab dein Post vorhin ned gesehen)
IMHO sind diese Zeichen in UTF8 drin - phpMyAdmin ist ja auch zur korrekten Darstellung imstande - die Frage kann eigentlich nur lauten: Was mach ich bei der Ausgabe falsch??

@AmicaNoctis
Ich konvertier in dem Fall auch nichts hin- und her - darum ja auch durchgehend utf8 um das eben nicht machen zu müssen.

Hat noch jemand eine Eingebung?

Langsam krieg ich Kopfweh davon
Mit Zitat antworten
  #10 (permalink)  
Alt 19-10-2009, 15:42
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

@pekka
Die Editoren machen in der Regel numerische Entities draus.
Mit Zitat antworten
  #11 (permalink)  
Alt 19-10-2009, 15:45
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von Quetschi Beitrag anzeigen
@pekka
Die Editoren machen in der Regel numerische Entities draus.
Was gar nicht der dümmste Umweg wäre, oder? Aus den Entities kriegst Du beim Speicherzeitpunkt ja ohne weiteres wieder normale Zeichen gemacht.
Mit Zitat antworten
  #12 (permalink)  
Alt 19-10-2009, 15:53
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

Das kann irgendwie nicht Sinn der Sache sein - was mir primär einfach nicht aus dem Kopf geht ist ja:

1. phpMyAdmin kann die Zeichen darstellen
2. Ich bzw. mein Ausgabescript kann es nicht

„Umwege“ möcht ich irgendwie nicht gehen müssen, wenn ich sehe, dass es offensichtlich (siehe Satzanfang) auch anders geht.

Edit:
Die numerischen Entities sind ja IMHO dafür da, Zeichen aus eben z.B. UTF8 in einer simplen ANSI-kodierten Datei zu speichern.

Geändert von Quetschi (19-10-2009 um 15:55 Uhr)
Mit Zitat antworten
  #13 (permalink)  
Alt 19-10-2009, 15:55
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

In welcher Kodierung zeigt phpMyAdmin die Zeichen denn an?
Mit Zitat antworten
  #14 (permalink)  
Alt 19-10-2009, 15:56
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Fragen dazu:

Welchen Response Content-Type hat denn die PMA-Seite?
Hattest du mysql_set_charset() schon benutzt? Du warst nur auf die Queries von Hand eingegangen, daher bin ich mir grad nicht sicher.
Mit Zitat antworten
  #15 (permalink)  
Alt 19-10-2009, 15:59
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

@pekka

phpMyAdmin hat im Quelltext
PHP-Code:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 
Ebenso liefert der Server die Daten auch mit
Code:
Content-Type: text/html; charset=utf-8
aus.

Ein Blick unter Ansicht->Zeichenkodierung sagt ebenfalls, dass der Browser in UTF-8 geschaltet hat.

Geändert von Quetschi (19-10-2009 um 16:05 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Sonderzeichen aus Word ersetzen bmoebis PHP Developer Forum 4 14-03-2008 18:47
Word auslesen ohne Word... cytrics Apps und PHP Script Gesuche 3 13-02-2007 14:30
Word Sonderzeichen in-power PHP Developer Forum 8 24-07-2004 14:59
[MSHTML] ([PHP]) Problem beim Einfügen eines Word-Dokuments Jenoptik HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 4 01-05-2004 09:53
Problem mit Sonderzeichen beim Bild einbinden de_Hannes PHP Developer Forum 7 21-10-2003 17:53

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script ansehen ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script

Mit unserer Lösungen können Sie nahezu jeden B2B / B2C Marktplatz betreiben den Sie sich vorstellen können. Ganz egal ob Sie einen Automarktplatz, Immobilenportal oder einfach einen Anzeigenmarkt betreiben möchten. Mit ebiz-trader können Sie Ihre Anforder

11.10.2018 Berni | Kategorie: PHP/ Anzeigenmarkt
PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 11:53 Uhr.