php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 02-12-2014, 15:32
joern
 Registrierter Benutzer
Links : Onlinestatus : joern ist offline
Registriert seit: Jul 2003
Ort: FC Bayern :-)
Beiträge: 57
joern ist zur Zeit noch ein unbeschriebenes Blatt
Standard URL extrahieren

Hi,

vielleicht kann mir ja hier jemand helfen.
Ich würde gerne aus diesem Bannercode nur die URL extrahieren. Alles andere kann weg. Wie kann ich das realsieren?

Mit str_replace oder muss ich eine Funktion schreiben?

HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Mit Zitat antworten
  #2 (permalink)  
Alt 02-12-2014, 16:45
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.736
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Was meinst du? http://www1.belboon.de/adtracking/xxxxxx.html oder xxxxxx

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite

Geändert von Kropff (02-12-2014 um 16:49 Uhr)
Mit Zitat antworten
  #3 (permalink)  
Alt 06-12-2014, 17:29
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von joern Beitrag anzeigen
Ich würde gerne aus diesem Bannercode nur die URL extrahieren.
Dein Beispiel-HTML-Ausschnitt enthält zwei URLs. Ich nehme mal an, du meinst die erste.

Zitat:
Alles andere kann weg. Wie kann ich das realsieren?
Am einfachsten mit preg_match().

Zitat:
Mit str_replace oder muss ich eine Funktion schreiben?
Str_replace() würde hier nicht helfen. Es auch oft nicht das, was der Anwender eigentlich wollte.

Eine eigene Funktion kannst du schreiben, wenn das deinen Quellcode übersichtlicher macht.

Zitat:
HTML-Code:
<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a><img src="http://www1.belboon.de/adtracking/xxxxxx.img" border="0" width="1" height="1" />"
Ich hoffe, das HTML bekommst du nicht so geliefert. Das href-Attribut, dessen Inhalt wir extrahieren wollen, spart sich am Anfang die Hochkommas, hat aber am Ende welche. Das verkompliziert das Suchmuster:

href=: Wir suchen zuerst nach "href=".
"?: Dann überspringen wir ein eventuell vorhandenes '"'.
(\S+?): Danach wird alles eingesammelt, was kein Leerzeichen ist.
(?=[\s>]): Die Suche bricht ab, wenn ein Leerzeichen oder ein ">" auftaucht.
"?: Dabei überspringen wir wieder ein eventuell auftauchendes '"'.

PHP-Code:
function url_extract(
    
$htmlsoup,
    
$decode_entities true
) {
    
$url preg_match('/href="?(\S+?)"?(?=[\s>])/'$htmlsoup$h) ? $h[1] : null;
    return 
$decode_entities
        
htmlspecialchars_decode($urlENT_QUOTES)
        : 
$url;

In HTML eingebettete URLs enthalten manchmal speziell kodierte Zeichen. Htmlspecialchars_decode() sorgt dafür, dass die entsprechend dekodiert werden.

Ein einfacher Test zeigt die Funktionstüchtigkeit:
PHP-Code:
$tests = array (
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href="http://www1.belboon.de/adtracking/xxxxxx.html" target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html target="_blank">xxxxxx</a>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html>',
    
'<a href=http://www1.belboon.de/adtracking/xxxxxx.html?query&a&amp;b>',
);

foreach (
$tests as $htmlsoup) {
    
$url url_extract($htmlsoup);
    
var_dump($url);

... und für komplexeres (X)HTML gibts übrigens Parser.

Geändert von fireweasel (06-12-2014 um 17:32 Uhr) Grund: typos
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
extrahieren, herausfiltern, url


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Variablen aus URL extrahieren RamonaS PHP Developer Forum 14 30-07-2010 22:58
Zeichenkette extrahieren TKlath PHP Developer Forum 5 12-03-2004 22:58
[URL] einfügen und [URL] bzw. [URL=xxx] ersetzen graf PHP Developer Forum 2 30-08-2003 10:22
Pfad extrahieren? TriphunEM PHP Developer Forum 4 11-06-2003 17:08
Lexikon extrahieren Honny PHP Developer Forum 4 21-02-2003 14:02

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Die RIGID-FLEX-Technologie
Die RIGID-FLEX-TechnologieDie sogenannte "Flexible Elektronik" , oftmals auch als "Flexible Schaltungen" bezeichnet, ist eine zeitgemäße Technologie zum Montieren von elektronischen Schaltungen.

06.12.2018 | Berni

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni


 

Aktuelle PHP Scripte

Newsmanager

Der Newsmanager ist ein Newssystem und Newsletter in einem. Mit WYSIWYG Editor und E-Mail import aus einer bestehenden MySql Datenbank sowie dynamische Kategorien / Themen Filter.

11.09.2019 Stephan_1972 | Kategorie: PHP/ News
Modelmanager

Der Modelmanager ist ein Webtool für Fotografen, kann als komplette Homepage oder als Webtool installiert werden.

11.09.2019 Stephan_1972 | Kategorie: PHP/ Webservice
ContentLion - Open Source CMS ansehen ContentLion - Open Source CMS

ContentLion ist ein in PHP geschriebenes CMS, bei dem man Seiten, Einstellungen usw. in Ordnern lagern kann

22.08.2019 stevieswebsite2 | Kategorie: PHP/ CMS
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 21:02 Uhr.