php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 22-11-2008, 17:11
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard Simpler Reg Expr -> UTF8 Problem

Folgender Code:

PHP-Code:
$str "horstöäü";
$res preg_replace("/[^a-z]/ui","_",$str); 
Sollte mir eigentlich "horst___" liefern, denn der Code wurde in einer UTF8 kodierten PHP Datei geschrieben.

Liefert mir aber $res == null.
Nehme ich den u-Modifier weg, so bekomme ich
horst______, da wird jedes char des multibyte utf strings einzeln betrachtet, richtig?

Wie krieg ich dann den Code vernünftig zum laufen?
__________________
SQL Injection kitteh is...
Mit Zitat antworten
  #2 (permalink)  
Alt 22-11-2008, 17:21
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.471
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Bei mir funktioniert es mit /u. Aber so sollte es auch gehen:
PHP-Code:
$res preg_replace("/[^a-z]/i""_"utf8_decode($str)); 
Mit Zitat antworten
  #3 (permalink)  
Alt 23-11-2008, 11:19
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Original geschrieben von onemorenerd
Bei mir funktioniert es mit /u. Aber so sollte es auch gehen:
PHP-Code:
$res preg_replace("/[^a-z]/i""_"utf8_decode($str)); 
Das liefert aber fehlerhafte Ergebnisse, wenn andere (nicht dekodierbare) UTF-8-Zeichen in dem String enthalten sind als die, die ersetzt werden, oder?
Mit Zitat antworten
  #4 (permalink)  
Alt 23-11-2008, 11:32
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Die Frage ist, diese Daten, wie "Horstöäü"
kommen sonst von einer UTF8-Form vom User in eine UTF-8 Datenbank.

Und im Endeffekt will ich diese Daten escapen, da frage ich mich, wie diese sich in dem Reg Expr verhalten, es macht da kein sinn, irgendwas zu dekodieren, oder? Vor allem, weil pekkas Behauptung zutreffen wird, es werden auch mehr Zeichen auftauchen, die nicht mit decode abgedeckt werden
__________________
SQL Injection kitteh is...
Mit Zitat antworten
  #5 (permalink)  
Alt 23-11-2008, 11:44
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

Dann wirst du wahrscheinlich nicht um die Multibyte-Stringfunktionen drumrumkommen:
http://de.php.net/manual/en/function...eg-replace.php
Mit Zitat antworten
  #6 (permalink)  
Alt 23-11-2008, 12:17
ezkimo
 Registrierter Benutzer
Links : Onlinestatus : ezkimo ist offline
Registriert seit: Apr 2005
Ort: Beckum / Westf.
Beiträge: 279
ezkimo befindet sich auf einem aufstrebenden Ast
ezkimo eine Nachricht über ICQ schicken
Standard

Da würde ich aber eher mit str_replace arbeiten, bevor ich mir so 'ne langsame Funktion ins Script hole. Die Funktion arbeitet auch mit multibyte Zeichen und ist um einiges schneller als mb_ereg_replace.
__________________
MM Newmedia | MeinBlog
Mit Zitat antworten
  #7 (permalink)  
Alt 23-11-2008, 12:24
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Also mb_ereg macht auch nicht das, was ich brauche, es ersetzt mir Umlaute, die ich im UTF-8 output problemlos sehe zu �

str_replace wird ein wenig schwierig. So ein Array mit allen möglichen UTF-8 Zeichen ist schon recht groß...
__________________
SQL Injection kitteh is...
Mit Zitat antworten
  #8 (permalink)  
Alt 23-11-2008, 12:26
pekka
 PHP Master
Links : Onlinestatus : pekka ist offline
Registriert seit: Jun 2001
Ort: Köln
Beiträge: 6.608
pekka befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Original geschrieben von Seikilos
Also mb_ereg macht auch nicht das, was ich brauche, es ersetzt mir Umlaute, die ich im UTF-8 output problemlos sehe zu �
Hast Du den Multibyte-Zeichensatz auch auf UTF-8 gesetzt?
Komisch....
Mit Zitat antworten
  #9 (permalink)  
Alt 23-11-2008, 12:28
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Note: The internal encoding or the character encoding specified by mb_regex_encoding() will be used as the character encoding for this function.
mb_detect_encoding ist UTF-8, also sollte es utf-8 sein, oder sehe ich das falsch?

Verwirrendes Problem.
__________________
SQL Injection kitteh is...
Mit Zitat antworten
  #10 (permalink)  
Alt 23-11-2008, 12:42
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hier der Code ausschnitt:

PHP-Code:
mb_internal_encoding("UTF-8");
        
$newStr mb_ereg_replace("/[^a-z]/","_",$str); 
Er matcht so etwas wie "Mäyer", aber er ersetzt es mit "M�yer"

Was höcht merkwürdig ist!

preg_match liefer hier immer bei preg_last_error() : PREG_BAD_UTF8_ERROR
__________________
SQL Injection kitteh is...

Geändert von Seikilos (23-11-2008 um 12:58 Uhr)
Mit Zitat antworten
  #11 (permalink)  
Alt 23-11-2008, 13:25
Seikilos
 Registrierter Benutzer
Links : Onlinestatus : Seikilos ist offline
Registriert seit: May 2003
Ort: Vor meinem Computer
Beiträge: 498
Seikilos ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Ich scheine den Fehler gefunden zu haben.
Ich hatte vorher ein strtolower, was mir degenerierte utf8 kodierung erzeugt hat, was den stillen tod der PCRE zur Folge hatte.

Zitat:
UTF-8 allows for 5 and 6 byte character sequences but these have no meaning in Unicode (ie. there are displayable characters for these sequences). This might lead to “junk” in a web page (browsers would display a ?). See this PHP manual comment - you should filter for 5/6 byte sequences
gut zu wissen, verdammte axt
http://www.phpwact.org/php/i18n/utf-8

So klappt nun auch preg_match
__________________
SQL Injection kitteh is...
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 18:16 Uhr.