php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 1 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 20-04-2011, 18:15
einermeiner
 Registrierter Benutzer
Links : Onlinestatus : einermeiner ist offline
Registriert seit: Jun 2009
Beiträge: 132
einermeiner befindet sich auf einem aufstrebenden Ast
Standard Reguläre Ausdrücke - Zeichenkette ausschließen - preg_match

Ich möchte eine Zeichenkette aussschließen:

PHP-Code:
    preg_match('/(.*)\<div id="top"\>([^(<\/div)]*)\<\/div\>(.*)/'$str$treffer ); 
Nach dem div id="top"\> soll jedes beliebige Zeichen in beliebiger Häufigkei vorkommen dürfen, außer die Zeichenkette "<\/div>".
Wie muss ich den Code ändern, möchte nachher die beliebigen Zeichen in dem Array haben.
Mit Zitat antworten
  #2 (permalink)  
Alt 20-04-2011, 18:22
h3ll
 Registrierter Benutzer
Links : Onlinestatus : h3ll ist offline
Registriert seit: Mar 2008
Beiträge: 3.578
h3ll befindet sich auf einem aufstrebenden Ast
Standard

Warum verwendest du nicht einen HTML-Parser dafür? Sowas ist doch besser geeignet als eine Regex.
Mit Zitat antworten
  #3 (permalink)  
Alt 20-04-2011, 19:01
TobiaZ
  Moderator
Links : Onlinestatus : TobiaZ ist offline
Registriert seit: Jan 2001
Ort: MUC und MGL, Germany
Beiträge: 34.421
Blog-Einträge: 1
TobiaZ befindet sich auf einem aufstrebenden Ast
Standard

Prüf doch einfach, ob '<div id="top"></div>' enthalten ist. Dafür braucht man weder preg noch irgendwelche parser zu bemühen.
__________________
ERST LESEN: Unsere Regeln. | Ich hab schon Pferde kotzen sehn!

READ THIS: Strings richtig trennen/verbinden | JOINs, das leidige Thema | Wegwerf E-Mail Adressen

Ich werde keinen privaten 1:1 Support leisten, außer ich biete ihn ausdrücklich an.

Wenn man sich selbst als "Noob" bezeichnet, sollte man die Finger davon lassen.
Wenn man gewillt ist daran etwas zu ändern, lernt man Grundlagen!
Mit Zitat antworten
  #4 (permalink)  
Alt 21-04-2011, 09:28
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von einermeiner Beitrag anzeigen
Ich möchte eine Zeichenkette aussschließen:

PHP-Code:
    preg_match('/(.*)\<div id="top"\>([^(<\/div)]*)\<\/div\>(.*)/'$str$treffer ); 
Nach dem div id="top"\> soll jedes beliebige Zeichen in beliebiger Häufigkei vorkommen dürfen, außer die Zeichenkette "<\/div>".
Wie muss ich den Code ändern, möchte nachher die beliebigen Zeichen in dem Array haben.
Du hast die Beschreibung selbst geliefert. So wird sie umgesetzt:

Code:
.*?(?=<\/div>)/s
.* ein beliebiges Zeichen, beliebig oft
? aber bitte nur die kürzestmögliche Version
(?=<\/div>) direkt gefolgt von '<\/div>'
/s sorgt dafür, dass '.' auf ein beliebiges Zeichen passt

Google-Stichwort: "lookahead assertion"
Mit Zitat antworten
  #5 (permalink)  
Alt 21-04-2011, 10:09
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

das Problem dabei ist, dass in dem div#top kein weiteres div sein darf, sonst wird dessen schließendes Tag gematcht:

Code:
<div id="top">...<div>...</div>...</div>
\_____________________________/
Es geht zwar mit Regulären Ausdrücken trotzdem, aber es ist einfacher, es als DomDocument zu laden und mit XPath zu suchen.

Wenn es trotzdem unbedingt sein muss, kommt man bei sowas raus:

PHP-Code:
$name "[\\w:\\-]+";
$atts "(?:\\s+" $name "=(?:'[^']*'|\"[^\"]*\"|" $name "))*";
$begin "<div\\s+id=\"top\"\\s*>";
$end "</div>";
$startTag "<(" $name ")" $atts "\\s*>";
$emptyTag "<" $name $atts "\\s*/>";
$regex "!" $begin "([^<>]+|" $emptyTag "|" $startTag "(?1)</\\2>)*" $end "!"
Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #6 (permalink)  
Alt 21-04-2011, 14:34
einermeiner
 Registrierter Benutzer
Links : Onlinestatus : einermeiner ist offline
Registriert seit: Jun 2009
Beiträge: 132
einermeiner befindet sich auf einem aufstrebenden Ast
Standard

Danke, funktioniert soweit auch, ich verstehe es zwar nicht mehr aber egal.

Wo müssen Klammern gesetze werden, damit ich die verschiedenen Teile jeweils in das Array bekomme?
Also das vor dem <div id=..., das dazwischen ist ja schon im Array und alles was danach steht, damit ich es dann wieder zusammensetzen kann?
Mit Zitat antworten
  #7 (permalink)  
Alt 21-04-2011, 14:40
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Vergiss es. Wenn du den Regex schon nicht verstehst, solltest du ihn nicht in deinen Code einbauen. Du wirst das später nicht mehr warten, nachvollziehen, debuggen, ändern, erweitern können und damit sollte an dieser Stelle Schluss sein mit Regex. Um XML zu verarbeiten, gibt es entsprechende eingebaute Klassen. Diese dafür nicht zu nützen wäre schlichtweg bescheuert.

Sieh dir im Handbuch DOMDocument und DOMXPath an und nimm bitte bitte diese beiden dafür.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #8 (permalink)  
Alt 21-04-2011, 14:49
einermeiner
 Registrierter Benutzer
Links : Onlinestatus : einermeiner ist offline
Registriert seit: Jun 2009
Beiträge: 132
einermeiner befindet sich auf einem aufstrebenden Ast
Standard

Der Code wird nur einmal gebraucht.
Es soll in einem Dokument mit vielen div id=top
danach gesucht werden und ein bestimmtes Wort, das sich in diesem div befindet, soll ersetzt werden.

Jetzt weiß ich jedenfalls, was ich lernen muss --> reguläre Ausdrücke.
Dieses DOMDocument kenne ich überhaupt nicht.
Mit Zitat antworten
  #9 (permalink)  
Alt 21-04-2011, 14:53
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Ein Dokument mit vielen <div id="top"> darf es gar nicht geben. In HTML muss das id-Attribut eindeutig sein.

Wenn dazwischen nur ein Wort steht und definitiv keine Tags mehr, sollte auch '!<div\\s+id="top">([^<]*)</div>!' ausreichen, aber trotzdem würde ich nicht mit Regex arbeiten, wenn es um XML/HTML geht (und ich halte mich für ziemlich erfahren was Regex angeht).
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #10 (permalink)  
Alt 21-04-2011, 14:58
einermeiner
 Registrierter Benutzer
Links : Onlinestatus : einermeiner ist offline
Registriert seit: Jun 2009
Beiträge: 132
einermeiner befindet sich auf einem aufstrebenden Ast
Standard

OK
Ist jetzt auch nicht so wichtig, dieses Skript.

Kannst du mir eine deutsche Seite empfehlen, mit der ich Reguläre Ausdrücke lernen kann?
Die sind in allen Sprachen weitgehend gleich aufgebaut oder?
Mit Zitat antworten
  #11 (permalink)  
Alt 21-04-2011, 15:03
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von einermeiner Beitrag anzeigen
Kannst du mir eine deutsche Seite empfehlen, mit der ich Reguläre Ausdrücke lernen kann?
regenechsen.de

Zitat:
Zitat von einermeiner Beitrag anzeigen
Die sind in allen Sprachen weitgehend gleich aufgebaut oder?
So ziemlich. Nicht überall sind alle Features verfügbar, aber die Grundlagen bleiben gleich. In PHP sind sie aber noch etwas mächtiger (da Perl-kompatibel) als z. B. in JavaScript. Daher gibt es im PHP-Bereich durchaus schon mal etwas komplexere Sachen zu finden, wo man dann als Einsteiger doch nochmal das PHP-Handbuch konsultieren sollte, auch wenn der Teil auf englisch ist.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #12 (permalink)  
Alt 21-04-2011, 15:08
einermeiner
 Registrierter Benutzer
Links : Onlinestatus : einermeiner ist offline
Registriert seit: Jun 2009
Beiträge: 132
einermeiner befindet sich auf einem aufstrebenden Ast
Standard

Den Kurs werde ich durchgehen, da ich in PHP wohl noch öfters RexEx benötige.
Mit Zitat antworten
  #13 (permalink)  
Alt 22-04-2011, 13:15
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von AmicaNoctis Beitrag anzeigen
Hallo,

das Problem dabei ist, dass in dem div#top kein weiteres div sein darf, sonst wird dessen schließendes Tag gematcht:

Code:
<div id="top">...<div>...</div>...</div>
\_____________________________/
Klar. Möglicherweise könnte man hier mit Rekursion was machen. Ich wollte das Ganze aber nicht weiter verkomplizieren.

Zitat:
Es geht zwar mit Regulären Ausdrücken trotzdem, aber es ist einfacher, es als DomDocument zu laden und mit XPath zu suchen.
Zitat:
Zitat von AmicaNoctis Beitrag anzeigen
Ein Dokument mit vielen <div id="top"> darf es gar nicht geben. In HTML muss das id-Attribut eindeutig sein.
Hier stellt sich mir die Frage: Wie baut ein (X)(HT)ML-Parser (regelwidrige) multiple IDs in seinen DOM-Baum ein und komme ich einfach an sie ran?
(Ich hatte den Fall noch nicht und war zu faul es auszuprobieren)
Mit Zitat antworten
  #14 (permalink)  
Alt 22-04-2011, 13:58
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von fireweasel Beitrag anzeigen
Hier stellt sich mir die Frage: Wie baut ein (X)(HT)ML-Parser (regelwidrige) multiple IDs in seinen DOM-Baum ein und komme ich einfach an sie ran?
Solange du es nicht gegen die DTD validierst und keine mehrdeutigen Attribute mit dem Namen xml:id gibt, weiß der Parser nicht, dass das id-Attribut eindeutig sein muss und wird nichts zu meckern haben (solange es sonst wohlgeformt ist).
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!

Geändert von AmicaNoctis (22-04-2011 um 14:06 Uhr)
Mit Zitat antworten
  #15 (permalink)  
Alt 22-04-2011, 14:00
wahsaga
  Moderator
Links : Onlinestatus : wahsaga ist offline
Registriert seit: Sep 2001
Beiträge: 25.236
wahsaga befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von fireweasel Beitrag anzeigen
Hier stellt sich mir die Frage: Wie baut ein (X)(HT)ML-Parser (regelwidrige) multiple IDs in seinen DOM-Baum ein
Hier wären zwei Fälle zu unterscheiden:
Ein XML-Parser hat nicht nur das Recht, sondern die Pflicht, dir dafür beim Parsen einen Fehler um die Ohren zu hauen und das Erstellen eines DOM-Baumes zu verweigern - sofern das id-Attribut auch in der DTD bzw. dem Schema als vom Typ ID deklariert ist; ohne das wäre es nämlich nur ein Attribut wie jedes andere.
Ein HTML-Tag-Soup-Parser hingegen wird das idR. einfach ignorieren, und erst mal alle Elemente unter Verwendung dieser ID ins DOM einbauen.

HTML5 fängt an, das Verhalten dieser Tag-Soup-Parser im Fehlerfalle zu spezifizieren (um den Wildwuchs aus der Praxis etwas unter Kontrolle zu kriegen) - aber in Bezug auf speziell dieses Szenario konnte ich darin auf die Schnelle keine Aussage finden.

Zitat:
und komme ich einfach an sie ran?
In meinem Test mit drei DIV-Elementen mit gleicher id="test" wenden alle meine Testbrowser eine simple Formatierung über
#test { background:red; }
auf alle drei DIV-Elemente an.

Bei komplexeren Selektoren mag das aber u.U. anders aussehen (Kombinationen mit :first-child oder was weiß ich).

Beim Zugriff über JavaScript bekomme ich das Verhalten, das zu erwarten wäre - da liefert mir
document.getElementById("test").innerHTML
jeweils nur den Inhalt des ersten dieser DIVs (ebenfalls übergreifend). Der Test auf eine .length-Eigenschaft der Rückgabe von getElementById verlief in allen Browsern negativ - dass da irgendeiner eine NodeList o.ä. draus zusammenstellt, scheint also auch nicht der Fall zu sein.

Sogar gegenüber DOM-Manipulationen verhält es sich relativ „robust“ in der Hinsicht, dass das Verhalten konsistent bleibt - erzeuge ich ein weiteres DIV-Element mit der gleichen ID und hänge es per insertBefore als neues erstes Kindelement in body ein, erhalte ich anschließend beim Zugriff über die ID wie oben dessen innerHTML-Inhalt.
Auch das Clonen dieser DIV-Elemente behält die gesetzte ID bei, und Zugriff auf „weiter hinten“ im DOM liegende Elemente über getElementsByTagName o.ä. gibt den Inhalt von deren ID-Attributen immer noch als "test" aus.

Zugriff auf die „weiteren“ Elemente ist aber verständlicher weise nicht über getElementById möglich.


Von dem ganzen abgesehen ist und bleibt es in der Praxis aber natürlich eine dumme Idee, diesen Fehler mutwillig zu produzieren.
__________________
I don't believe in rebirth. Actually, I never did in my whole lives.
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
preg_match / reguläre Ausdrücke hydrococcus PHP Developer Forum 1 03-04-2004 10:04
reguläre ausdrücke? malibubu Fragen zu Installation & Konfiguration (LAMP, WAMP & Co.) 0 20-02-2004 22:46
reguläre ausdrücke keen PHP Developer Forum 5 08-03-2003 12:34
Reguläre Ausdrücke kubaa PHP Developer Forum 2 11-01-2003 14:26
C++ und reguläre Ausdrücke TBT ASP, PERL, CGI, C und alles andere 0 30-12-2002 22:18

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 05:52 Uhr.