php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > SQL / Datenbanken
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


SQL / Datenbanken Probleme mit SQL? Hier könnt ihr eure Fragen zu SQL (MySQL, PostgreSQL, MS-SQL und andere ANSI-SQL Server) los werden.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 27-08-2008, 13:20
plastikbaum
 Registrierter Benutzer
Links : Onlinestatus : plastikbaum ist offline
Registriert seit: Aug 2005
Beiträge: 66
plastikbaum ist zur Zeit noch ein unbeschriebenes Blatt
Standard REGEXP und diakritische / Multibytezeichen oder: Suche mit Wortgrenzen

Hallo,

da REGEXP nicht multibytesicher ist, stoße ich bei meiner Suchfunktion auf Schwierigkeiten.

Ich will eine Tabelle nach einem beliebigen String an beliebiger Stelle durchsuchen. Mit LIKE komme ich nicht weiter, da ich es hier nicht geschafft habe, die Wortgrenzen richtig zu erkennen. Gefunden werden soll z. B. der String

"und"

in Textpassagen wie

"Und gestern ...", "Heute und gestern", "Gestern und.", "Und?" etc.

nicht jedoch in Textpassagen wie

"Hund", "Undefinierbar" usw.

Mit REGEXP und der Beachtung von Wortgrenzen funktioniert das natürlich einwandfrei - so lange keine diakritischen Zeichen im Suchbegriff enthalten sind.

Etwas wie
PHP-Code:
WHERE einetextspalte REGEXP '[[:<:]]grün[[:>:]]' 
Liefert natürlich keine Treffer, obgleich etwas wie "Elefanten sind grün." im Text vorkommt.

Gibt es hier irgendwelche Tricks, Erfahrungen usw., wie sich dieses Problem bewerkstelligen lässt? Selbstverständlich lasse ich mich auch eines besseren belehren und greife gerne auf LIKE zurück, wenn ein Wort richtig und sinnig (s. o.) getroffen wird.

Mit CONVERT und COLLATE hatte ich es bereits versucht, jedoch ohne Erfolg. Der genutze Zeichensatz ist UTF-8, die Kollation utf8_unicode_ci.

Ach ja, ich kann vorab Umlaute nicht einfach auf beiden Seiten durch "ae", "ue" usw. ersetzen, da die Inhalte in 16 Sprachen angelegt sind und hier eine entsprechend große Menge an diakritischen Zeichen anfällt. Die Problematik bezieht sich also nicht nur auf deutsche Umlaute.

Eine meiner Ideen war, grundsätzlich alle Zeichen, die nicht a-Z sowie 0-9 und _ sind, auf beiden Seiten zu entfernen (Blähfásêl => blhfsl), jedoch ist mir das SQL-seitig mit REGEXP nicht gelungen.

Irgendwelche Ideen?

pb
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 04:57 Uhr.