php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 02-12-2014, 15:32
joern
 Registrierter Benutzer
Links : Onlinestatus : joern ist offline
Registriert seit: Jul 2003
Ort: FC Bayern :-)
Beiträge: 57
joern ist zur Zeit noch ein unbeschriebenes Blatt
Standard URL extrahieren

Hi,

vielleicht kann mir ja hier jemand helfen.
Ich würde gerne aus diesem Bannercode nur die URL extrahieren. Alles andere kann weg. Wie kann ich das realsieren?

Mit str_replace oder muss ich eine Funktion schreiben?

HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Mit Zitat antworten
  #2 (permalink)  
Alt 02-12-2014, 16:45
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Was meinst du? http://www1.belboon.de/adtracking/xxxxxx.html oder xxxxxx

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (02-12-2014 um 16:49 Uhr)
Mit Zitat antworten
  #3 (permalink)  
Alt 06-12-2014, 17:29
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von joern Beitrag anzeigen
Ich würde gerne aus diesem Bannercode nur die URL extrahieren.
Dein Beispiel-HTML-Ausschnitt enthält zwei URLs. Ich nehme mal an, du meinst die erste.

Zitat:
Alles andere kann weg. Wie kann ich das realsieren?
Am einfachsten mit preg_match().

Zitat:
Mit str_replace oder muss ich eine Funktion schreiben?
Str_replace() würde hier nicht helfen. Es auch oft nicht das, was der Anwender eigentlich wollte.

Eine eigene Funktion kannst du schreiben, wenn das deinen Quellcode übersichtlicher macht.

Zitat:
HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Ich hoffe, das HTML bekommst du nicht so geliefert. Das href-Attribut, dessen Inhalt wir extrahieren wollen, spart sich am Anfang die Hochkommas, hat aber am Ende welche. Das verkompliziert das Suchmuster:

href=: Wir suchen zuerst nach "href=".
"?: Dann überspringen wir ein eventuell vorhandenes '"'.
(\S+?): Danach wird alles eingesammelt, was kein Leerzeichen ist.
(?=[\s>]): Die Suche bricht ab, wenn ein Leerzeichen oder ein ">" auftaucht.
"?: Dabei überspringen wir wieder ein eventuell auftauchendes '"'.

PHP-Code:
function url_extract(
    
$htmlsoup,
    
$decode_entities true
) {
    
$url preg_match('/href="?(\S+?)"?(?=[\s>])/'$htmlsoup$h) ? $h[1] : null;
    return 
$decode_entities
        
htmlspecialchars_decode($urlENT_QUOTES)
        : 
$url;

In HTML eingebettete URLs enthalten manchmal speziell kodierte Zeichen. Htmlspecialchars_decode() sorgt dafür, dass die entsprechend dekodiert werden.

Ein einfacher Test zeigt die Funktionstüchtigkeit:
PHP-Code:
$tests = array (
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href="http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html?query&a&amp;b>',
);

foreach (
$tests as $htmlsoup) {
    
$url url_extract($htmlsoup);
    
var_dump($url);

... und für komplexeres (X)HTML gibts übrigens Parser.

Geändert von fireweasel (06-12-2014 um 17:32 Uhr) Grund: typos
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
extrahieren, herausfiltern, url


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Variablen aus URL extrahieren RamonaS PHP Developer Forum 14 30-07-2010 22:58
Zeichenkette extrahieren TKlath PHP Developer Forum 5 12-03-2004 22:58
[URL] einfügen und [URL] bzw. [URL=xxx] ersetzen graf PHP Developer Forum 2 30-08-2003 10:22
Pfad extrahieren? TriphunEM PHP Developer Forum 4 11-06-2003 17:08
Lexikon extrahieren Honny PHP Developer Forum 4 21-02-2003 14:02

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 15:43 Uhr.