php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 02-12-2014, 16:32
joern
 Registrierter Benutzer
Links : Onlinestatus : joern ist offline
Registriert seit: Jul 2003
Ort: FC Bayern :-)
Beiträge: 57
joern ist zur Zeit noch ein unbeschriebenes Blatt
Standard URL extrahieren

Hi,

vielleicht kann mir ja hier jemand helfen.
Ich würde gerne aus diesem Bannercode nur die URL extrahieren. Alles andere kann weg. Wie kann ich das realsieren?

Mit str_replace oder muss ich eine Funktion schreiben?

HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Mit Zitat antworten
  #2 (permalink)  
Alt 02-12-2014, 17:45
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Was meinst du? http://www1.belboon.de/adtracking/xxxxxx.html oder xxxxxx

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (02-12-2014 um 17:49 Uhr)
Mit Zitat antworten
  #3 (permalink)  
Alt 06-12-2014, 18:29
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von joern Beitrag anzeigen
Ich würde gerne aus diesem Bannercode nur die URL extrahieren.
Dein Beispiel-HTML-Ausschnitt enthält zwei URLs. Ich nehme mal an, du meinst die erste.

Zitat:
Alles andere kann weg. Wie kann ich das realsieren?
Am einfachsten mit preg_match().

Zitat:
Mit str_replace oder muss ich eine Funktion schreiben?
Str_replace() würde hier nicht helfen. Es auch oft nicht das, was der Anwender eigentlich wollte.

Eine eigene Funktion kannst du schreiben, wenn das deinen Quellcode übersichtlicher macht.

Zitat:
HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Ich hoffe, das HTML bekommst du nicht so geliefert. Das href-Attribut, dessen Inhalt wir extrahieren wollen, spart sich am Anfang die Hochkommas, hat aber am Ende welche. Das verkompliziert das Suchmuster:

href=: Wir suchen zuerst nach "href=".
"?: Dann überspringen wir ein eventuell vorhandenes '"'.
(\S+?): Danach wird alles eingesammelt, was kein Leerzeichen ist.
(?=[\s>]): Die Suche bricht ab, wenn ein Leerzeichen oder ein ">" auftaucht.
"?: Dabei überspringen wir wieder ein eventuell auftauchendes '"'.

PHP-Code:
function url_extract(
    
$htmlsoup,
    
$decode_entities true
) {
    
$url preg_match('/href="?(\S+?)"?(?=[\s>])/'$htmlsoup$h) ? $h[1] : null;
    return 
$decode_entities
        
htmlspecialchars_decode($urlENT_QUOTES)
        : 
$url;

In HTML eingebettete URLs enthalten manchmal speziell kodierte Zeichen. Htmlspecialchars_decode() sorgt dafür, dass die entsprechend dekodiert werden.

Ein einfacher Test zeigt die Funktionstüchtigkeit:
PHP-Code:
$tests = array (
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href="http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html?query&a&amp;b>',
);

foreach (
$tests as $htmlsoup) {
    
$url url_extract($htmlsoup);
    
var_dump($url);

... und für komplexeres (X)HTML gibts übrigens Parser.

Geändert von fireweasel (06-12-2014 um 18:32 Uhr) Grund: typos
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
extrahieren, herausfiltern, url


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Variablen aus URL extrahieren RamonaS PHP Developer Forum 14 30-07-2010 23:58
Zeichenkette extrahieren TKlath PHP Developer Forum 5 12-03-2004 23:58
[URL] einfügen und [URL] bzw. [URL=xxx] ersetzen graf PHP Developer Forum 2 30-08-2003 11:22
Pfad extrahieren? TriphunEM PHP Developer Forum 4 11-06-2003 18:08
Lexikon extrahieren Honny PHP Developer Forum 4 21-02-2003 15:02

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 02:48 Uhr.