Regex: eregi -> alles außer bestimmte zeichenkette

**Kropff** · 06.10.2010, 18:18

Vorher brichts du aber mal deinen Quellcode so um, dass man nicht kilometerweit nach rechts scrollen muss.

Danke
Peter

**h3ll** · 06.10.2010, 18:42

eregi() ist veraltet und sollte nicht mehr verwendet werden.

**davie2000** · 06.10.2010, 19:00

@Kropff:
sorry, dachte das code-tag sorgt für den umbruch -> umbrüche manuell hinzugefügt (kommen aber im original-quellcode nicht vor!)

@h3ll:
ich weiss, dass eregi() veraltet und deprecated ist, aber es handelt sich um ein bestehendes skript, das ich erweitern/nutzen möchte und für alle bisherigen adaptionen hat eregi (immer noch) wunderbar funktioniert.

danke für eure hilfe ...

**Kropff** · 06.10.2010, 19:37

Oh Mann, der Code ist ja uralt. Mittleres Paläolithikum vermute ich mal. Also zunächst mal vergisst du eregi ganz schnell. Wenn der Code sauber ist, so geht das mit einen regulären Ausdruck:

PHP-Code:


preg_match_all('/productinfo.asp\?pid=([0-9]{1,})&amp;style=ice">(.*)<font class=gridtitle>(.*)<\/font>/Usi',

                $str, $hit, PREG_SET_ORDER);

for ($i = 0; $i < count($hit); $i++)

{

  echo $hit[$i][1].'-'.$hit[$i][3].'<br>';

}

Allerdings empfehle ich dir, doch lieber auf DOM XML zurückzugreifen. Ich weiß allerdings nicht, wie das auf die fehlenden Gänsefüßchen bei den Attributen reagiert. Möglicherweise knallt es da gewaltig. Hatte in dem Zusammenhang noch nie mit so einem Schrottcode zu tun.

Peter

PS: $str steht für den Grottencode.

**davie2000** · 06.10.2010, 20:02

Danke für deine Antwort, aber wie ich schon in meiner Antwort an h3ll geschrieben habe, handelt es sich um ein (viell. schon älteres *g*) coding einer bestehenden und ansonsten voll funktionierenden Datenbankapplikation.

Der "Grottencode" stammt von mir, wenn du damit den regex meinst - ich sagte ja bereits, dass regex absolut nicht meine Stärke ist.

Wenn du eregi() meinst, dann betrachte das einfach als Vorgabe "von oben"; ich muss eregi (weiter)verwenden und möchte die bestehenden Klassen auch nicht auf pregmatch umbauen, weil dann wieder alle anderen Fälle getestet und evtl. umgebaut werden müssen. Und wie gesagt für diese anderen/bisherigen Fälle funktioniert der "Grottencode" ja einwandfrei.

Der Tipp mit dem DOM-Parser nützt mir hier leider auch nichts; bei _meinen_ eigenen (fetch-)Skripten nutze ich natürlich diese sehr komfortable Möglichkeit ;-)

Wäre also sehr dankbar für einen reg. Ausdruck, der für obiges Problem auch mit eregi() funktioniert.

TIA

**Kropff** · 06.10.2010, 20:25

Ob du nun eregi oder preg_match_all nutzt, ist eigentlich lattens. Du musst nur die Schleifenverarbeitung umschreiben.

Wenn du eregi() meinst, dann betrachte das einfach als Vorgabe "von oben"

Dann sag denen "da oben", dass ereg Müll ist. Und bei weitem nicht so flexibel ist wie preg_match.

Wäre also sehr dankbar für einen reg. Ausdruck, der für obiges Problem auch mit eregi() funktioniert.

Sorry, damit habe ich zum letzten Mal vor etwa 7 Jahren gearbeitet. Außerdem denke ich, dass die Applikation mal ein Refactoring notwendig hat. Man kann nicht mit uraltem Code immer so weiter machen.

Peter

Der "Grottencode" stammt von mir, wenn du damit den regex meinst

Ich meinte den HTML-Code

**davie2000** · 06.10.2010, 21:31

so ... jetzt habe ich mich doch breitschlagen lassen *g* und für diesen speziellen Fall auf preg_match_all() umgestellt und siehe da: es funktioniert (wie erwartet)

Dann werde ich jetzt wohl doch versuchen ganz auf preg_match_all umzusteigen und die "alten Fälle" austesten müssen.

Danke nochmals für deine Hilfe!!!

PS: der HTML-Code ist wirklich äußerst unansehlich ... wird aber von einer (sehr großen) site bis heute so ausgegeben.
PPS: mein Problem wurde gelöst - thread kann von mir aus geschlossen werden - danke

**h3ll** · 06.10.2010, 21:42

Zitat von davie2000 Beitrag anzeigen

der HTML-Code ist wirklich äußerst unansehlich ...

Nicht nur das. Er ist auch fehlerhaft. Pro Zeile HTML-Code komm ich locker auf über 5 Fehler.

**davie2000** · 06.10.2010, 21:56

ja, du hast recht ... und das waren nur zwei beliebige Zeilen aus dem Dokument ... einen w3c-Validator überlebt die Seite sicherlich nicht, aber ist ja nicht meine ;-)
ich greif nur die Daten ab und das funktioniert jetzt - dank deiner Hilfe - auch für diese pfui-Seite einwandfrei

Regex: eregi -> alles außer bestimmte zeichenkette