php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack (2) Themen-Optionen Bewertung: Bewertung: 4 Stimmen, 5,00 durchschnittlich.
  2 links from elsewhere to this Post. Click to view. #1 (permalink)  
Alt 09-01-2015, 14:21
Peh4pe
 Registrierter Benutzer
Links : Onlinestatus : Peh4pe ist offline
Registriert seit: Nov 2011
Beiträge: 41
Peh4pe befindet sich auf einem aufstrebenden Ast
Standard Preg match all für Links

Hey,

da ich mit den ganzen Preg Match Generatoren und Erklärungen nicht wirklich weiter komme, frage ich euch nun um Rat..

Nach dem Parsen einer URL (CURL) erhalte ich den content der Seite in einer Variablen. Dort sind mehrere Links nach dem gleichen Schema enthalten. Nun möchte ich alle Links in einem Array speichern.

Preg_match_all wird da der richtige Weg sein denke ich.

Ein Link sieht folgendermaßen aus:

HTML-Code:
<a href="seite.de/details.do;jsessionid=123?identifier=123"  target="_self"  class="class" >
lediglich die jsessionid und identifier ändern sich in den Links.

Kann mir da jemand weiter helfen?
Vielen Dank im Vorraus!
Mit Zitat antworten
  #2 (permalink)  
Alt 09-01-2015, 14:48
Peh4pe
 Registrierter Benutzer
Links : Onlinestatus : Peh4pe ist offline
Registriert seit: Nov 2011
Beiträge: 41
Peh4pe befindet sich auf einem aufstrebenden Ast
Standard

Wäre das so eine option?

Pattern:
Code:
#<a href="seite.de/details.do;jsessionid=[A-Z0-9]{0,40}\?identifier=[A-Z0-9]{0,40}"  target="_self"  class="class" >#
Mit Zitat antworten
  #3 (permalink)  
Alt 09-01-2015, 18:58
h3ll
 Registrierter Benutzer
Links : Onlinestatus : h3ll ist offline
Registriert seit: Mar 2008
Beiträge: 3.826
h3ll befindet sich auf einem aufstrebenden Ast
Standard

preg_match() eignet sich nicht zum Auslesen von HTML-Code. Verwende besser einen HTML-Parser wie DOMDocument dafür.
Mit Zitat antworten
  #4 (permalink)  
Alt 11-01-2015, 22:44
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Peh4pe Beitrag anzeigen
Hey,

da ich mit den ganzen Preg Match Generatoren und Erklärungen nicht wirklich weiter komme, frage ich euch nun um Rat..

...

Preg_match_all wird da der richtige Weg sein denke ich.
Anders gesagt: Du verstehst also die Funktionsweise eines Werkzeuges nicht, hältst es aber für geeignet, um damit dein spezielles Problem zu lösen?

Zitat:
Nach dem Parsen einer URL (CURL) erhalte ich den content der Seite in einer Variablen. Dort sind mehrere Links nach dem gleichen Schema enthalten. Nun möchte ich alle Links in einem Array speichern.

...

Ein Link sieht folgendermaßen aus:

HTML-Code:
<a href="seite.de/details.do;jsessionid=123?identifier=123"  target="_self"  class="class" >
lediglich die jsessionid und identifier ändern sich in den Links.
Okay ...

Zitat:
Zitat von Peh4pe Beitrag anzeigen
Wäre das so eine option?

Pattern:
Code:
#<a href="seite.de/details.do;jsessionid=[A-Z0-9]{0,40}\?identifier=[A-Z0-9]{0,40}"  target="_self"  class="class" >#
Wo ist jetzt dein Problem? Lass preg_match_all() über den Inhalt der String-Variablen laufen und dir anschließend mit var_dump() das Ergebnis anzeigen.

Außerdem würde ich noch ein paar Plausibilitätsprüfungen machen. Sind die Zeichensätze von "jsessionid" und "identifier" wirklich auf [A-Z0-9] beschränkt? Manchmal findest du da modifizierte base64-Encodings (wie bspw. [a-zA-Z0-9=_]). Und ist 40 Bytes wirklich die maximale Länge?

Wenn du nur an die URLs willst, dürfte auch ein kürzerer Regex reichen:

PHP-Code:
preg_match_all(
    
'/href="(seite\.de\/details\.do;jsessionid=[A-Z0-9]{0,40}\?identifier=[A-Z0-9]{0,40})"/',
   
$src,
   
$found
);
var_dump($found); 

Geändert von fireweasel (11-01-2015 um 22:46 Uhr) Grund: typo
Mit Zitat antworten
  #5 (permalink)  
Alt 12-01-2015, 11:43
Peh4pe
 Registrierter Benutzer
Links : Onlinestatus : Peh4pe ist offline
Registriert seit: Nov 2011
Beiträge: 41
Peh4pe befindet sich auf einem aufstrebenden Ast
Standard

Danke fireweasel,

habe es gelöst und deine Erläuterung war sehr hilfreich!

Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
preg match all php array


LinkBacks (?)
LinkBack to this Thread: https://www.php-resource.de/forum/php-developer-forum/104896-preg-match-all-fuer-links.html
Erstellt von For Type Datum
php Preg match all für Links This thread Refback 13-01-2015 08:39
- RSS Feed URL - Blog RSS Feed This thread Refback 11-01-2015 03:25

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
preg_match() [function.preg-match]: Unknown modifier Gamer20 PHP Developer Forum 3 23-12-2010 19:41
preg-match für einzelne wörter im Satz Jeremy PHP Developer Forum 7 25-06-2010 21:29
Preg Match Fehler chrisphp PHP Developer Forum 12 08-04-2005 21:10
[REGEX] preg match problem Seikilos PHP Developer Forum 17 06-07-2003 20:28

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Software für alle Arten von digitalen Marktplätzen
Software für alle Arten von digitalen MarktplätzenDigitale Marktplätze sind nicht nur im B2C Geschäft seit Jahren etabliert, sondern erfreuen sich mit Kleinanzeigen-Märkten auf lokaler und regionaler Ebene auch im privaten Bereich wachsender Beliebtheit.

09.11.2021 | Berni

Von 0 auf über 2 Mio € Umsatz in weniger als 12 Monaten – wie die Pixelwerker das nur durch SEO geschafft haben
Von 0 auf über 2 Mio € Umsatz in weniger als 12 Monaten – wie die Pixelwerker das nur durch SEO geschafft habenSEO oder SEA? Warum SEO die besserer Methode ist.

01.10.2021 | Berni


 

Aktuelle PHP Scripte

ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script ansehen ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script

Mit unserer Lösungen können Sie nahezu jeden B2B / B2C Marktplatz betreiben den Sie sich vorstellen können. Ganz egal ob Sie einen Automarktplatz, Immobilenportal oder einfach einen Anzeigenmarkt betreiben möchten. Mit ebiz-trader können Sie Ihre Anforder

09.11.2021 Berni | Kategorie: PHP/ Anzeigenmarkt
PHP Newsletter Script SuperWebMailer ansehen PHP Newsletter Script SuperWebMailer

Die webbasierte PHP Newsletter Software SuperWebMailer ist die optimale Lösung zur Durchführung eines erfolgreichen E-Mail-Marketings. Zur Nutzung des PHP Script-Pakets ist eine eigene Webpräsenz/Server mit PHP 5 oder neuer, MySQL 4 oder neuer und die

28.10.2021 mirko_swm | Kategorie: PHP/ Mail
Guestbook Light ansehen Guestbook Light

Das Guestbook Light (kurz: "Gblight") ist ein kinderleichtes Gästebuch in PHP. Durch den Einsatz einer SQLite Datenbank ist es einfach, leicht portabel und schnell. Aufgrund moderner Techniken erfüllt Gblight auch die neuesten Webstandards.

28.10.2021 scripthostingnet | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 20:27 Uhr.