php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 1 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 28-10-2008, 23:35
PHP-Desaster
 PHP Expert
Links : Onlinestatus : PHP-Desaster ist offline
Registriert seit: Mar 2006
Beiträge: 3.105
PHP-Desaster befindet sich auf einem aufstrebenden Ast
Standard Regex negieren?

Ich bastle gerade an einem Skript zum Zippen eines Verzeichnisses und nutze dazu die SPL-Klassen. Jetzt will ich aber nicht alle Dateien/Verzeichnisse aus einem Quellverzeichnis übernehmen, sondern Elemente die einem regulären Ausdruck entsprechend ignorieren. So frühstücke ich dann zum Beispiel die ".svn" oder "CVS"-Verzeichnisse ab.
Der reguläre Ausdruck hat zum Beispiel die Form:
Code:
~[/\\]\.svn|CVS[/\\]~i
Nun ist es nicht einfach möglich, einen regulären Ausdruck zu negieren, also bleibt nichts anderes übrig, als das Ergebnis des match-Vorganges zu negieren.
Das rekursive Verzeichnis parsen mache ich mit folgender Objektverschachtelung:
PHP-Code:
$iterator=
    new 
RecursiveIteratorIterator(
        new 
RecursiveDirectoryIterator(
            
$basepath.$package
        
),
        
RecursiveIteratorIterator::SELF_FIRST
    
); 
Um den Regex da noch direkt vor zu bekommen, schalte ich vor den RII noch eine RegexIterator-Instanz. Allerdings ist jetzt das Problem, dass der Regex ja genau auf die Elemente zutrifft, die ich ausschließen möchte.
Darum ist meine Lösung momentan, dass ich eine Unterklasse erstellt habe, die das Ergebnis der accept-Methode negiert zurückgibt.
PHP-Code:
class NegateRegexIterator extends RegexIterator {
    public function 
accept() {
        return(!
parent::accept());
    }

Das funktioniert auch wunderbar. Und nun die eigentliche Frage: Geht die Negation des regulären Ausdrucks auch einfacher? Auf die SPL-Klassen will ich eigentlich nicht verzichten, sondern ich Ziele viel mehr darauf, ob nicht jemand eine Lösung kennt, bei der ich keine eigene Unterklassen erstellen muss. Irgendwelche Flags, die ich setzen kann? Oder eine andere Nutzung der Iteratoren? Wäre für jeden Ratschlag sehr dankbar.

Geändert von PHP-Desaster (28-10-2008 um 23:45 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 29-10-2008, 12:25
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard Re: Regex negieren?

Zitat:
Original geschrieben von PHP-Desaster
...
Der reguläre Ausdruck hat zum Beispiel die Form:
Code:
~[/\\]\.svn|CVS[/\\]~i
Und der matcht worauf? Wahrscheinlich auf gar nichts -- bei mir gabs 'nen PCRE-Syntax-Fehler. Irgendwie hast du die runden Klammern fürs Subpattern vergessen, und deine Backslashes sind nicht richtig escaped.

Zitat:
Nun ist es nicht einfach möglich, einen regulären Ausdruck zu negieren, also bleibt nichts anderes übrig, als das Ergebnis des match-Vorganges zu negieren.
Ich verstehe nicht, wo bei dieser Vorgehensweise das Problem ist. Wenn du nur ein Ausschluss-Muster angeben kannst, musst du eben das Ergebnis der RegEx-Auswertung negieren.

Es ist allerdings ohne große Probleme möglich, einen PCRE zu bauen, der obiges Muster ausschließt[1], wie das folgende (provisorische) Test-Script beweist:
PHP-Code:
$pcre '/([\/\x5c])(?!\.(svn|cvs)\\1)(?=.)/i';
$haystack = array (
   
'/.cvs/'// sollte nicht passen
   
'/.svn/'// sollte nicht passen
   
'/.c/',   // sollte passen
   
'/.cvs',  // sollte passen
   
'/svn/',  // sollte passen
);
foreach (
$haystack as $val) {
  
debug_writefln('"%s" -- passt? %s'$valpreg_match($pcre$val));

*nachschieb*
Offensichtlich verschluckt dieses Board[2] Backslashes. Mein Script ist unter diesem Aspekt zu betrachten. Beim Kopiereren also besser über die "Zitieren"-Funktion gehen. :-/

--
[1] Vorausgesetzt, ich habe dein RegEx-Pattern richtig interpretiert.
[2] Hochwertige Qualitätssoftware eben ... ;-)

Geändert von fireweasel (29-10-2008 um 12:33 Uhr)
Mit Zitat antworten
  #3 (permalink)  
Alt 29-10-2008, 12:59
PHP-Desaster
 PHP Expert
Links : Onlinestatus : PHP-Desaster ist offline
Registriert seit: Mar 2006
Beiträge: 3.105
PHP-Desaster befindet sich auf einem aufstrebenden Ast
Standard Re: Re: Regex negieren?

Zitat:
Und der matcht worauf? Wahrscheinlich auf gar nichts -- bei mir gabs 'nen PCRE-Syntax-Fehler. Irgendwie hast du die runden Klammern fürs Subpattern vergessen, und deine Backslashes sind nicht richtig escaped.
Die runden Klammern sind nicht nötig, ich meine durchaus ".svn" und "CVS", nicht wie du ".svn" und ".cvs". Und wenn du den Regex so direkt ins PHP-Skript übernimmst, muss du die Backslashs natürlich escapen. Dann matcht mein Ausdruck auch: http://regexp-evaluator.de/evaluator...2725/#ergebnis.

Zitat:
Ich verstehe nicht, wo bei dieser Vorgehensweise das Problem ist. Wenn du nur ein Ausschluss-Muster angeben kannst, musst du eben das Ergebnis der RegEx-Auswertung negieren.
Richtig, habe ich momentan auch getan. Die RegexIterator-Klasse erlaubt dies allerdings nicht direkt, so dass ich diese erst erweitern musste.

Zitat:
Es ist allerdings ohne große Probleme möglich, einen PCRE zu bauen, der obiges Muster ausschließt[1], wie das folgende (provisorische) Test-Script beweist
Das sieht ziemlich gut aus. Ich habe mir schon gedacht, dass ich mit einem Lookaround ans Ziel komme, allerdings habe ich das gestern nicht mehr gebacken bekommen.
Vielen Dank schon mal, ich werde mir das mal näher ansehen.
Mit Zitat antworten
  #4 (permalink)  
Alt 29-10-2008, 13:52
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard Re: Re: Re: Regex negieren?

Zitat:
Original geschrieben von PHP-Desaster
Die runden Klammern sind nicht nötig, ich meine durchaus ".svn" und "CVS", nicht wie du ".svn" und ".cvs".
Ähemm, *hüstel* ...
Ich hab ja auch geschrieben: "Vorausgesetzt, ich habe dein RegEx-Pattern richtig interpretiert."

Aber:

'\.svn|CVS' würde ohne Klammern auf einen String wie '/bla/.svn|CVS' matchen.
... sagt übrigens auch dein interaktives RegExp-Spielzeug:
http://regexp-evaluator.de/evaluator...a0b2/#ergebnis

Und das kleine 'i' am Ende deines RegEx sagt mir (und den meisten RegEx-Engines, die ich kenne), dass Groß- und Kleinschreibung ignoriert wird. Ob du dann im RegEx-Pattern selbst 'CVS' oder 'cvs' schreibst, ist der RegEx-Engine egal. Mir sparte es einen Tastendruck (auf die Shift-Taste) ... :-)

Zitat:
Und wenn du den Regex so direkt ins PHP-Skript übernimmst, muss du die Backslashs natürlich escapen.
Naja, irgendwann wolltest du das auch sicher tun, oder? ;-)

Aufs Backslash-Escaping muss man nicht nur bei Regulären Ausdrücken achten, auch wenn man einen gewöhnlichen String in ein PHP-String-Literal mit einfachen Hochkommas einbaut, also sowas:
'bla\\blubb'. Schon da muss der Backslash escaped werden. Für PCRE muss das dann (meistens) noch mal gemacht werden. Weil das oft zu Verwirrungen führt, hab ich mir für Backslashes die PCRE-Hex-Notation angewöhnt.

Zitat:
Dann matcht mein Ausdruck auch: http://regexp-evaluator.de/evaluator...2725/#ergebnis.
Darauf und auch auf viele andere Strings. Du solltes aber vor allem "Gegenproben" machen um zu prüfen, ob dein RegEx was taugt.

Zitat:
Das sieht ziemlich gut aus. Ich habe mir schon gedacht, dass ich mit einem Lookaround ans Ziel komme, allerdings habe ich das gestern nicht mehr gebacken bekommen.
Vielen Dank schon mal, ich werde mir das mal näher ansehen. [/B]
Die in meinem Beispiel verwendeten
Lookahead-Assertions handelt der RegExp-Evaluator auf seinen Tutorial-Seiten auch (kurz und knapp) ab.

Was das SPL-Gewurstel angeht: Wäre es nicht (einfacher|sinnvoller) eine Klasse abzuleiten und mit einer zusätzlichen Methode ::reject() auszurüsten, die einfach das Ergebnis von ::accept() negiert zurückgibt?

Geändert von fireweasel (29-10-2008 um 14:04 Uhr)
Mit Zitat antworten
  #5 (permalink)  
Alt 29-10-2008, 14:50
PHP-Desaster
 PHP Expert
Links : Onlinestatus : PHP-Desaster ist offline
Registriert seit: Mar 2006
Beiträge: 3.105
PHP-Desaster befindet sich auf einem aufstrebenden Ast
Standard Re: Re: Re: Re: Regex negieren?

Ok ok, der Regex scheint echt noch Käse zu sein ^^

Das ich Backslashe zu escapen habe ist mir klar. Beim Eröffnen des Threads fand ich aber übersichtlicher nur den Regex an sich zu posten, um Verwirrung zu vermeiden. Ist wohl in die Hose gegangen...

Zitat:
Was das SPL-Gewurstel angeht: Wäre es nicht (einfacher|sinnvoller) eine Klasse abzuleiten und mit einer zusätzlichen Methode ::reject() auszurüsten, die einfach das Ergebnis von ::accept() negiert zurückgibt?
Ja klar kann ich das. Das bringt mir aber herzlich wenig, wenn die accept-Methode aufgerufen wird
Mit Zitat antworten
  #6 (permalink)  
Alt 29-10-2008, 19:19
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Hab ich in der Zwischenzeit schon mitbekommen. ;-)

Eine Methode, die bestimmte Suchmuster "abweist", ::accept() zu nennen, finde ich aber schlechten Stil. Das kann bei der Benutzung der Klasse zu Verwirrungen führen, auch wenn die Klasse selbst das Wort "Negate" im Namen führt. An der konkreten Stelle im Quellcode, wo die ::accept()-Methode aufgerufen wird, sieht man das dann nicht.

Bei den "üblichen" Anwendungen über foreach oder der Art "Iterator-of-Iterator" (wie du sie hier gebaut hast) kann man natürlich nicht auf eine "angebaute" Methode zugreifen. Das ist einer der Gründe, weswegen ich mir meine Klassen lieber selber baue. ;-)

Ich hab mal ein bisschen in der SPL-Doku gestöbert: Offensichtlich bietet RegexIterator selbst keinerlei Möglichkeit (Einstellungen oder Methoden), um die "Filterung umzukehren".

Aber RegexIterator ist doch eine Art Filter, abgeleitet von einer generischen Filter-Klasse. Möglicherweise hat eine übergeordnete Klasse von RegexIterator die Fähigkeit, "invertiert" zu filtern. Sollte das nicht der Fall sein (ich hab jetzt auf die Schnelle nichts Brauchbares gefunden), wäre das ein Armutszeugnis (aber bei PHP wundert mich mittlerweile gar nichts mehr).

Geändert von fireweasel (29-10-2008 um 19:21 Uhr)
Mit Zitat antworten
  #7 (permalink)  
Alt 29-10-2008, 20:37
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.471
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Die übergeordneten Klassen bieten keine Möglichkeit zur sauberen Negation. Die Ebene, wo man irgendwas negieren könnte, besteht nur aus FilterIterator und da wird eben der Name accept() schon vorgegeben.

Wenn man den hier zur Diskussion stehenden Filter für sich allein betrachtet, ist er ein Filter wie jeder andere. Er akzeptiert oder eben nicht, genauso wie der Filter, der zufällig die Negation von ihm darstellt.

Eine Methode reject() würde man nur aufrufen, wenn man das bekommen möchte, was der Filter gerade nicht durchläßt. Der Code würde sich dann ungefähr so lesen: "Wenn es rausgefiltert wird, ist es valide und ich kann damit weiterarbeiten."
Das widerspricht in meinen Augen dem Sinn eines Filters, der da wäre "alles was nicht rausgefiltert wird ist valide" oder speziell für Regex-Filter "alles was matcht ist valide.
Kurzum: Die Negation in den Regex einzubauen, erscheint mir viel sinnvoller, als eine Antifilter-Klasse.
Mit Zitat antworten
  #8 (permalink)  
Alt 29-10-2008, 22:32
PHP-Desaster
 PHP Expert
Links : Onlinestatus : PHP-Desaster ist offline
Registriert seit: Mar 2006
Beiträge: 3.105
PHP-Desaster befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Kurzum: Die Negation in den Regex einzubauen, erscheint mir viel sinnvoller, als eine Antifilter-Klasse.
Da bin ich genau deiner Meinung. Und wenn ich etwas mehr Zeit habe, werde ich auch versuchen das Beispiel von fireweasel entsprechend zu verwenden. Wenn das klappt, fällt die NegateRegexIterator-Klasse wieder weg.
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 13:35 Uhr.