php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 19 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 06-10-2010, 19:08
davie2000
 Registrierter Benutzer
Links : Onlinestatus : davie2000 ist offline
Registriert seit: Oct 2010
Beiträge: 5
davie2000 befindet sich auf einem aufstrebenden Ast
Standard Regex: eregi -> alles außer bestimmte zeichenkette

Hallo!

Ich gebe es gleich zu: dieser regex übersteigt meinen Horizont! Ich bräuchte deshalb bitte eure Hilfe bei folgendem Regex-Problem:

Ich habe zB folgenden Text:
Code:
<div class=griddiv><br><a  href="/productinfo.asp?pid=6427821&amp;style=ice"><img style="margin-top:4px;"
 src="http://cover6.xxxxxxxx.com/CDUCoverxxx/Xxxxxx/Medium/Front/6427821.jpg" width=118 height=176 border=0 
alt="Sylvia DVD"></a><center><font class=gridtitle>Sylvia</font><br><img src="/images/stars-4.gif" alt="4 stars">
<br><a class=GridPriceLink rel="nofollow"  href="/checkout/cart.asp?PID=6427821&amp;style=ice">$13.75</a>
</center></div>
<div class=griddiv><font class=gridheading>Top Match</font><br><a  href="/productinfo.asp?pid=1596793&
amp;style=ice"><img style="margin-top:4px;" src="http://cover6.xxxxxxxxxxx.com/CDUCoverxxx/Xxxxxxx/Medium/Front
/62663302115.jpg" width=118 height=176 border=0 alt="Face DVD"></a><center><font class=gridtitle>Face</font>
<br><img src="/images/stars-3-half.gif" alt="3.5 stars"><br><a class=GridPriceLink rel="nofollow"  href="/checkout
/cart.asp?PID=1596793&amp;style=ice">$11.49</a></center></div>
und möchte daraus die Nummer (PID) und den Titel (gridtitle) extrahieren, also für die obigen beiden Zeilen, hätte ich gerne
1. id=6427821 und title=Sylvia
2. id=1596793 und title=Face

Leider muss ich dafür eregi verwenden; der bisherige Code (der nicht funktioniert) sieht so aus:
Code:
$regx = 'href="/productinfo.asp\?pid=([^<]*)&amp;style=ice">(.*)<font class=gridtitle>([^<]*)</font><br>';
...
while(eregi($regx, $contents, $arrRoller)) {
  array_push($retval, $arrRoller);
}
...
blöderweise ist das Ergebnis dann nur ein Treffer und zwar mit
id=6427821 (von der ersten Zeile) und
title=Face (von der letzten Zeile)

Ich müsste also statt dem (.*) (in der Mitte) irgendwie sagen "alles außer <font ...", damit mir zwei Treffer generiert werden.


Ich krieg das aber irgendwie nicht hin - bitte helft mir!

Geändert von davie2000 (06-10-2010 um 19:57 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 06-10-2010, 19:18
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.721
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Vorher brichts du aber mal deinen Quellcode so um, dass man nicht kilometerweit nach rechts scrollen muss.

Danke
Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 06-10-2010, 19:42
h3ll
 Registrierter Benutzer
Links : Onlinestatus : h3ll ist offline
Registriert seit: Mar 2008
Beiträge: 3.576
h3ll befindet sich auf einem aufstrebenden Ast
Standard

eregi() ist veraltet und sollte nicht mehr verwendet werden.
Mit Zitat antworten
  #4 (permalink)  
Alt 06-10-2010, 20:00
davie2000
 Registrierter Benutzer
Links : Onlinestatus : davie2000 ist offline
Registriert seit: Oct 2010
Beiträge: 5
davie2000 befindet sich auf einem aufstrebenden Ast
Standard

@Kropff:
sorry, dachte das code-tag sorgt für den umbruch -> umbrüche manuell hinzugefügt (kommen aber im original-quellcode nicht vor!)

@h3ll:
ich weiss, dass eregi() veraltet und deprecated ist, aber es handelt sich um ein bestehendes skript, das ich erweitern/nutzen möchte und für alle bisherigen adaptionen hat eregi (immer noch) wunderbar funktioniert.

danke für eure hilfe ...
Mit Zitat antworten
  #5 (permalink)  
Alt 06-10-2010, 20:37
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.721
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Oh Mann, der Code ist ja uralt. Mittleres Paläolithikum vermute ich mal. Also zunächst mal vergisst du eregi ganz schnell. Wenn der Code sauber ist, so geht das mit einen regulären Ausdruck:
PHP-Code:
preg_match_all('/productinfo.asp\?pid=([0-9]{1,})&amp;style=ice">(.*)<font class=gridtitle>(.*)<\/font>/Usi',
                
$str$hitPREG_SET_ORDER);
for (
$i 0$i count($hit); $i++)
{
  echo 
$hit[$i][1].'-'.$hit[$i][3].'<br>';

Allerdings empfehle ich dir, doch lieber auf DOM XML zurückzugreifen. Ich weiß allerdings nicht, wie das auf die fehlenden Gänsefüßchen bei den Attributen reagiert. Möglicherweise knallt es da gewaltig. Hatte in dem Zusammenhang noch nie mit so einem Schrottcode zu tun.

Peter

PS: $str steht für den Grottencode.
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (06-10-2010 um 20:40 Uhr)
Mit Zitat antworten
  #6 (permalink)  
Alt 06-10-2010, 21:02
davie2000
 Registrierter Benutzer
Links : Onlinestatus : davie2000 ist offline
Registriert seit: Oct 2010
Beiträge: 5
davie2000 befindet sich auf einem aufstrebenden Ast
Standard

Danke für deine Antwort, aber wie ich schon in meiner Antwort an h3ll geschrieben habe, handelt es sich um ein (viell. schon älteres *g*) coding einer bestehenden und ansonsten voll funktionierenden Datenbankapplikation.

Der "Grottencode" stammt von mir, wenn du damit den regex meinst - ich sagte ja bereits, dass regex absolut nicht meine Stärke ist.

Wenn du eregi() meinst, dann betrachte das einfach als Vorgabe "von oben"; ich muss eregi (weiter)verwenden und möchte die bestehenden Klassen auch nicht auf pregmatch umbauen, weil dann wieder alle anderen Fälle getestet und evtl. umgebaut werden müssen. Und wie gesagt für diese anderen/bisherigen Fälle funktioniert der "Grottencode" ja einwandfrei.

Der Tipp mit dem DOM-Parser nützt mir hier leider auch nichts; bei _meinen_ eigenen (fetch-)Skripten nutze ich natürlich diese sehr komfortable Möglichkeit ;-)

Wäre also sehr dankbar für einen reg. Ausdruck, der für obiges Problem auch mit eregi() funktioniert.

TIA
Mit Zitat antworten
  #7 (permalink)  
Alt 06-10-2010, 21:25
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.721
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Ob du nun eregi oder preg_match_all nutzt, ist eigentlich lattens. Du musst nur die Schleifenverarbeitung umschreiben.
Zitat:
Wenn du eregi() meinst, dann betrachte das einfach als Vorgabe "von oben"
Dann sag denen "da oben", dass ereg Müll ist. Und bei weitem nicht so flexibel ist wie preg_match.
Zitat:
Wäre also sehr dankbar für einen reg. Ausdruck, der für obiges Problem auch mit eregi() funktioniert.
Sorry, damit habe ich zum letzten Mal vor etwa 7 Jahren gearbeitet. Außerdem denke ich, dass die Applikation mal ein Refactoring notwendig hat. Man kann nicht mit uraltem Code immer so weiter machen.

Peter

Zitat:
Der "Grottencode" stammt von mir, wenn du damit den regex meinst
Ich meinte den HTML-Code
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (06-10-2010 um 21:32 Uhr)
Mit Zitat antworten
  #8 (permalink)  
Alt 06-10-2010, 22:31
davie2000
 Registrierter Benutzer
Links : Onlinestatus : davie2000 ist offline
Registriert seit: Oct 2010
Beiträge: 5
davie2000 befindet sich auf einem aufstrebenden Ast
Standard

so ... jetzt habe ich mich doch breitschlagen lassen *g* und für diesen speziellen Fall auf preg_match_all() umgestellt und siehe da: es funktioniert (wie erwartet)

Dann werde ich jetzt wohl doch versuchen ganz auf preg_match_all umzusteigen und die "alten Fälle" austesten müssen.

Danke nochmals für deine Hilfe!!!

PS: der HTML-Code ist wirklich äußerst unansehlich ... wird aber von einer (sehr großen) site bis heute so ausgegeben.
PPS: mein Problem wurde gelöst - thread kann von mir aus geschlossen werden - danke

Geändert von davie2000 (06-10-2010 um 22:38 Uhr)
Mit Zitat antworten
  #9 (permalink)  
Alt 06-10-2010, 22:42
h3ll
 Registrierter Benutzer
Links : Onlinestatus : h3ll ist offline
Registriert seit: Mar 2008
Beiträge: 3.576
h3ll befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von davie2000 Beitrag anzeigen
der HTML-Code ist wirklich äußerst unansehlich ...
Nicht nur das. Er ist auch fehlerhaft. Pro Zeile HTML-Code komm ich locker auf über 5 Fehler.
Mit Zitat antworten
  #10 (permalink)  
Alt 06-10-2010, 22:56
davie2000
 Registrierter Benutzer
Links : Onlinestatus : davie2000 ist offline
Registriert seit: Oct 2010
Beiträge: 5
davie2000 befindet sich auf einem aufstrebenden Ast
Standard

ja, du hast recht ... und das waren nur zwei beliebige Zeilen aus dem Dokument ... einen w3c-Validator überlebt die Seite sicherlich nicht, aber ist ja nicht meine ;-)
ich greif nur die Daten ab und das funktioniert jetzt - dank deiner Hilfe - auch für diese pfui-Seite einwandfrei
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[REGEX] bestimmte zeichenkette auslesen roNn PHP Developer Forum 8 26-11-2008 15:49
Alles ausgeben außer Regex, nur wie ??? Trompetenkäfer PHP Developer Forum 4 01-02-2006 00:35
Anfängerfrage: Alles außer bestimmte Zeichen aus einem String entfernen Red_Wraith PHP Developer Forum 7 28-01-2006 20:16
[REGEX] Alle Zeichen außer Leerzeichen, außer vor dem Leerzeichen ist ein anderes Zeichen Benny-one PHP Developer Forum 3 13-09-2005 18:54
Zeichenkette in Zeichenkette mit eregi(); finden MaxPayne PHP Developer Forum 14 18-01-2003 14:13

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 03:06 Uhr.