php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 08-11-2009, 17:43
MasterOfFreaks
 Registrierter Benutzer
Links : Onlinestatus : MasterOfFreaks ist offline
Registriert seit: Nov 2009
Beiträge: 7
MasterOfFreaks befindet sich auf einem aufstrebenden Ast
Standard [gelöst] preg_replace erzeugt Sonderzeichen

Hallo,

habe ein kleines Skript welches einen UTF-8 String aus einer MySQL Datenbank ausliest.

Mit folgendem Code-Schnippsel möchte ich alle Sonderzeichen entfernen:

PHP-Code:
$pattern "/[^a-zA-Z0-9äöüÄÖÜß]/";
$text preg_replace($pattern," ",$text); 
Das Problem ist nachher nur, das es in dem Text anscheinend "besondere" Anführungszeichen gibt. Das letzte von beiden wird bei der Ausgabe als "Weißes Fragezeichen auf schwarzem Grund" ausgegeben. Aber auch nur, wenn ich das Ü im Pattern verwende.

Entfernen der Anführungszeichen mittels:
PHP-Code:
$text str_replace('"'""$text); 
brachte auch nicht den gewünschten Erfolg.

Bis auf diese Fehlinterpretation, funktioniert das Ganze einwandfrei. Natürlich ist das immer so eine Sache mit den Umlauten über SSH in VIM zu arbeiten, deshalb probierte ich auch noch ein anderes Pattern

PHP-Code:
$text preg_replace('/[^<>&!-%x27-;=?-~ ]/e',"",$text); 
Ich habe ehrlich gesagt keine Ahnung wie es funktioniert. Es ersetzt jedoch auch alle Sonderzeichen einschließlich den Umlauten. Um noch mehr Fehlerquellen auszuschließen wäre es vielleicht einfach das Pattern entsprechend zu erweitern das die Umlaute nicht entfernt werden.

Ansonsten sind bereits folgende Fehlerquellen ausgeschlossen: Putty ist auf UTF-8 getrimmt. Die Konsole kann UTF-8 und die Datei so wie VIM sind auch mit
:set encoding=utf-8
:set fileencoding=utf-8

bearbeitet.

Ich wäre auch dankbar für einen ganz anderen Lösungsweg. Ziel ist es einfach nur alle Sonderzeichen aus einem UTF-8 String zu entfernen. Die Lösung soll dabei dem Whitelist Ansatz folgen und nicht dem Blacklist Ansatz. Ich will also sagen können, welche Zeichen erlaubt sind und nicht alle Möglichkeiten auflisten, die nicht erlaubt sind.

Bei der PHP Version handelt es sich um: PHP 5.2.4-2ubuntu5.5

Vielen Dank für deine Mühe.

Viele Grüße
Master.of.Freaks

Geändert von MasterOfFreaks (09-11-2009 um 12:58 Uhr) Grund: PHP Version vergessen
Mit Zitat antworten
  #2 (permalink)  
Alt 08-11-2009, 17:55
combie
 PHP Expert
Links : Onlinestatus : combie ist offline
Registriert seit: May 2006
Beiträge: 3.296
combie wird schon bald berühmt werden
Standard

preg_replace arbeitet wie (fast) alle PHP Funktionen von Hause aus nur mit iso-8859-1
preg_replace kennt allerdings auch einen Unicode Modifikator


Alternativ:
1. die mb_*() Funktionen
2. auf PHP6 warten
__________________
Wir werden alle sterben
Mit Zitat antworten
  #3 (permalink)  
Alt 09-11-2009, 12:38
MasterOfFreaks
 Registrierter Benutzer
Links : Onlinestatus : MasterOfFreaks ist offline
Registriert seit: Nov 2009
Beiträge: 7
MasterOfFreaks befindet sich auf einem aufstrebenden Ast
Standard

Den Unicode Modifikator habe ich nicht gefunden. Vielleicht könntest du zu diesem nochmal kurz etwas sagen. Ansonsten habe ich mir jetzt erstmal damit beholfen:

PHP-Code:
        $text utf8_decode($text);
        
$text preg_replace("/[^A-Za-z0-9äöüÄÖÜß]/"," "$text);
        
$text utf8_encode($text); 
Elegant ist zwar etwas anderes, aber was soll man machen.
Mit Zitat antworten
  #4 (permalink)  
Alt 09-11-2009, 12:44
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

Zitat:
Zitat von MasterOfFreaks Beitrag anzeigen
Den Unicode Modifikator habe ich nicht gefunden. Vielleicht könntest du zu diesem nochmal kurz etwas sagen.
Guckst du hier (in der Box ganz unten).

Gruß,

Amica
Mit Zitat antworten
  #5 (permalink)  
Alt 09-11-2009, 12:50
MasterOfFreaks
 Registrierter Benutzer
Links : Onlinestatus : MasterOfFreaks ist offline
Registriert seit: Nov 2009
Beiträge: 7
MasterOfFreaks befindet sich auf einem aufstrebenden Ast
Standard

Okay, irgendwie stehe ich auf dem Schlauch:

PHP-Code:
//      $text = utf8_decode($text);
        
$text preg_replace("/[^A-Za-z0-9äöüÄÖÜß]/u"," "$text);
//      $text = utf8_encode($text); 
Auf jeden Fall bekomme ich folgende Meldung:
Code:
Warning: preg_replace() [function.preg-replace]: Compilation failed: invalid UTF-8 string at offset 12 in /words.php on line 28
Mit Zitat antworten
  #6 (permalink)  
Alt 09-11-2009, 12:51
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Dann ist dein Skript selbst nicht UTF-8 und daher die Umlaute keine gültigen UTF-8-Sequenzen.

Edit: nimm doch gleich "/\\PL/u", dann matcht du alles, was kein Buchstabe ist - egal ob Latein, Kyrillisch oder sonstwas. Wer anfängt, einzelne Umlaute zu behandeln, kommt ganz schnell in Schwierigkeiten, wenn mal jemand André oder René heißt oder jemand 20 Stück à 2,-€ bestellen will.

Geändert von AmicaNoctis (09-11-2009 um 12:59 Uhr)
Mit Zitat antworten
  #7 (permalink)  
Alt 09-11-2009, 12:57
MasterOfFreaks
 Registrierter Benutzer
Links : Onlinestatus : MasterOfFreaks ist offline
Registriert seit: Nov 2009
Beiträge: 7
MasterOfFreaks befindet sich auf einem aufstrebenden Ast
Standard

Danke für den Hinweis, wir werden sofort eine neue Kasse eröffnen

Hatte es zwischenzeitlich mal mit Latin-1 probiert aber nachdem ich jetzt wieder

Code:
:set encoding=utf-8
:set fileencoding=utf-8
gesetzt habe in VIM klappt es auch mit dem Nachbar.

Also nochmal im ganzen Satz:
PHP-Code:
$text preg_replace("/[^A-Za-z0-9äöüÄÖÜß]/u"," "$text); 
Vielen Dank !!!

Master.of.Freaks
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
preg_replace, sonderzeichen, umlaute


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
PHP erzeugt komische Zeichen simond PHP Developer Forum 6 22-12-2008 21:57
[REGEX] utf8 - preg_replace - umlaute - sonderzeichen waYan PHP Developer Forum 11 01-05-2008 13:19
preg_replace mit sonderzeichen iderise PHP Developer Forum 3 29-04-2007 16:56
[CSS] IE erzeugt Umbruch bei Liste Benny-one HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 6 23-04-2007 11:11
download erzeugt 403 frank7l7 PHP Developer Forum 6 07-12-2003 21:36

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 09:55 Uhr.