php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 24-03-2012, 17:42
Truncate
 Registrierter Benutzer
Links : Onlinestatus : Truncate ist offline
Registriert seit: Nov 2005
Beiträge: 419
Truncate kann nur auf Besserung hoffen
Standard Bestimmte Links mit preg_match_all() sammeln

Hallo,

ich will aus einer Webseite bestimmte Links sammeln.

Der Aufbau ist immer gleich:

<a href="1494761,anzeige-mercedes-gebraucht.html">

Der Teil nach "anzeige" variiert je nach gesuchten Auto.

Das liefert mir zwar alle Links aber eben ohne den hinteren Teil:

Code:
preg_match_all('/((\d{7}),anzeige\-)/s',$inhalt,$results);
Theoretisch müßte doch das hier funktioneren, tut es aber nicht?

Code:
preg_match_all('/((\d{7}).*html)/s',$inhalt,$results);
Irgendwelche Tipps? Bin langsam ratlos

Bei dem Tester von regexe.de funktionert es, allerdings verwende ich ja preg_match_all() und nicht preg_match().

Danke,
NBG
Mit Zitat antworten
  #2 (permalink)  
Alt 24-03-2012, 19:28
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Meine besten regexp-Zeiten habe ich mangels Möglichkeiten zwar hinter mir, das hier funktioniert.
PHP-Code:
preg_match_all('/((\d{7}),anzeige\-)([a-z]{1,})\-([a-z]{1,})/s',$inhalt,$results); 
Oder
PHP-Code:
preg_match_all('/(([0-9]{7}).*?html)/s',$str,$results); 
Ob beide Lösungen performant sind, kann ich leider nicht sagen. Dazu habe ich zu lange nicht mehr mit regexps zu tun gehabt.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 25-03-2012, 22:41
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Truncate Beitrag anzeigen
Hallo,

ich will aus einer Webseite bestimmte Links sammeln.

Der Aufbau ist immer gleich:

<a href="1494761,anzeige-mercedes-gebraucht.html">

Der Teil nach "anzeige" variiert je nach gesuchten Auto.

Das liefert mir zwar alle Links aber eben ohne den hinteren Teil:

Code:
preg_match_all('/((\d{7}),anzeige\-)/s',$inhalt,$results);
Theoretisch müßte doch das hier funktioneren, tut es aber nicht?

Code:
preg_match_all('/((\d{7}).*html)/s',$inhalt,$results);
Irgendwelche Tipps? Bin langsam ratlos
"..., tut es aber nicht" ist keine vernünftige Fehlerbeschreibung.

Vermutlich bist du der Gier (des RegEx') zum Opfer gefallen. ".*html" findet den längstmöglichen String, der auf das Muster Beliebiges-Zeichen-beliebig-oft-mit-html-am-Ende passt. Ein einfaches Fragezeichen nach dem Quantifizierer (hier das "*"), kehrt den Effekt um und macht den Regex "faul" und für deine Aufgabe geeigneter:

PHP-Code:
'/.*?html/' 
Zitat:
Bei dem Tester von regexe.de funktionert es, ...
Das tut es mit großer Wahrscheinlichkeit nicht. Vermutlich hast du andere Test-Daten verfüttert, also keine mehrfach vorkommenden Links.

Zitat:
... allerdings verwende ich ja preg_match_all() und nicht preg_match().
Preg_match_all() unterscheidet sich in seiner grundlegenden Arbeitsweise nicht von preg_match(), welches man in einer Schleife mehrfach aufruft.
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Links von Homepages sammeln mariogalaxy2 Projekthilfe 1 09-06-2011 18:44
preg_match_all() links identifizieren tomtherock PHP Developer Forum 3 18-01-2008 14:04
Mit ereg_replace bestimmte Teile in Links ersetzen meisterjoda PHP Developer Forum 3 13-06-2006 15:36
Problem mit preg_match_all() bweichel PHP Developer Forum 12 29-03-2006 11:53
Hat schon jemand Erfahrungen sammeln können mit Prelaunch ?? Else User pages 4 08-07-2004 13:41

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 11:25 Uhr.