php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 27-04-2013, 22:12
newbie1955
 Registrierter Benutzer
Links : Onlinestatus : newbie1955 ist offline
Registriert seit: Dec 2012
Beiträge: 241
newbie1955 befindet sich auf einem aufstrebenden Ast
Standard xpath-Abfrage wirkt nicht

Hallo, habe mal wieder eine Frage zum xpath-Gebrauch. Ich suche mit Xpath href und title auf folgender Seite (QUelltext):
Code:
<div class="mitte_folgeseiten"><ul><li><imgsrc="/sronline/images/element_mitte_archiv_thispage.gif" height="9" width="22" alt="Link" /><ahref="/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100~_seite-1.html"><!--27.04.2013 2000-->Berlin: Grüne ziehen mit Steuerrefom in Wahlkampf</a></li><li><imgsrc="/sronline/images/element_mitte_link_intern.gif" height="9" width="22" alt="Link" /><ahref="/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100~_seite-2.html"><!--27.04.2013 2000-->Rom: Neue italienische Regierung steht</a></li><li><imgsrc="/sronline/images/element_mitte_link_intern.gif" height="9" width="22" alt="Link" /><ahref="/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100~_seite-3.html"><!--27.04.2013 2001-->Berlin: Berichte über Nebentätigkeiten von Soldaten und Polizisten</a></li><li><imgsrc="/sronline/images/element_mitte_link_intern.gif" height="9" width="22" alt="Link" /><ahref="/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100~_seite-4.html"><!--27.04.2013 2001-->Washington : Neue Verhaftung im Giftbriefe-Fall</a></li><li><imgsrc="/sronline/images/element_mitte_link_intern.gif" height="9" width="22" alt="Link" /><ahref="/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100~_seite-5.html"><!--27.04.2013 2002-->Fußball: Hoffenheim und Augsburg mit Siegen</a></li></ul></div>
Habe es so versucht:

PHP-Code:
<?php
/*error_reporting( -1 );
ini_set('display_errors', TRUE);
*/
$data file_get_contents('http://www.sr-online.de/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100.html');
$zaehler 0;
 
$doc = new DOMDocument(); 
$doc->loadHTML($data); 
 
$xPath = new DOMXPath($doc);
 
foreach (
$xPath->query('//div[@class="mitte_folgeseiten"]/a') as $element) {
if (
$zaehler <= 13)
{
$hreft $element->getAttribute('href');
$title $element->getAttribute('title');
 
$href "http://www.testseite.de/" $hreft
         echo 
"<li><a href=$href target='_blank'>" 
                   
$title '</a></li>';
$zaehler++;
}
}
?>
Klappt aber nicht, habt Ihr einen Tipp?

Gruß und Dank newbie1955

Geändert von newbie1955 (27-04-2013 um 22:24 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 27-04-2013, 22:48
h3ll
 Registrierter Benutzer
Links : Onlinestatus : h3ll ist offline
Registriert seit: Mar 2008
Beiträge: 3.593
h3ll befindet sich auf einem aufstrebenden Ast
Standard

Der HTML-Code ist Kaputt. Es müsste <a href=""> heißen und nicht <ahref="">.
Mit Zitat antworten
  #3 (permalink)  
Alt 27-04-2013, 23:16
newbie1955
 Registrierter Benutzer
Links : Onlinestatus : newbie1955 ist offline
Registriert seit: Dec 2012
Beiträge: 241
newbie1955 befindet sich auf einem aufstrebenden Ast
Standard Wirklich?

Also, wenn ich mir den Quelltext auf der Seite anzeigen lassen, sehe ich einen Leerraum zwische a und href, wenn ich es hierher kopiere nicht.
Mit Zitat antworten
  #4 (permalink)  
Alt 28-04-2013, 08:31
Melewo
 Registrierter Benutzer
Links : Onlinestatus : Melewo ist offline
Registriert seit: Jan 2013
Beiträge: 365
Melewo befindet sich auf einem aufstrebenden Ast
Standard

Bei mir funktioniert es, wenn ich die Reihenfolge von Knoten und Kindern einhalte /ul/li/a und berücksichtige, dass der Linktitel nicht als Attribut enthalten ist, getAttribute('title') deshalb leer bleibt, sondern nur als Inhalt von Node.

PHP-Code:
<?php
error_reporting
( -);
ini_set('display_errors'true);
libxml_use_internal_errors(true);

$data file_get_contents('http://www.sr-online.de/sronline/nachrichten/hoerfunknachrichten/hoerfunknachrichten_aktuell100.html');

$zaehler 0;

$doc = new DOMDocument();
$doc->loadHTML($data);

$xPath = new DOMXPath($doc);

foreach (
$xPath->query("//div[@class=\"mitte_folgeseiten\"]/ul/li/a") as $element) {

    if (
$zaehler <= 13)
    {
        
$hreft $element->getAttribute("href");
        
$title $element->nodeValue;
        
$href  "http://www.testseite.de".$hreft;

        echo 
"<li><a href=\"".htmlspecialchars($hreftENT_QUOTES)."\" target=\"_blank\">".htmlspecialchars($titleENT_QUOTES)."</a></li>";
        
$zaehler++;
    }
}
?>
Mit Zitat antworten
  #5 (permalink)  
Alt 28-04-2013, 21:45
newbie1955
 Registrierter Benutzer
Links : Onlinestatus : newbie1955 ist offline
Registriert seit: Dec 2012
Beiträge: 241
newbie1955 befindet sich auf einem aufstrebenden Ast
Standard Dankedankedanke

Vielen Dank, ich musste bei mir aus unerfindlichen Gründen wieder ein utf8_decode einschieben, aber dann klappte es! Die ul/li-Angaben hatte ich komplett übersehen, oha! Super

Gruß newbie1955
Mit Zitat antworten
  #6 (permalink)  
Alt 29-04-2013, 10:29
litterauspirna
 Registrierter Benutzer
Links : Onlinestatus : litterauspirna ist offline
Registriert seit: Nov 2007
Beiträge: 364
litterauspirna ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Zitat von newbie1955 Beitrag anzeigen
Vielen Dank, ich musste bei mir aus unerfindlichen Gründen wieder ein utf8_decode einschieben, aber dann klappte es! Die ul/li-Angaben hatte ich komplett übersehen, oha! Super

Gruß newbie1955
Hallo,

wenn du bei deinem DIV einsteigst und irgendwo dort in der Hierarchie zu einem a Tag willst, musst du natürlich auch den Hierarchie Pfad bis dahin angeben, wie soll denn das a Tag sonst gefunden werden?

Desweiteren kann ich dir noch empfehlen PHP: Tidy - Manual zu nutzen, dass bereinigt dir den Großteil von kaputten HTML. Auf doppelte ID Vergaben im HTML kann leider auch tidy nicht reagieren, da gibts dann spätesten von DOM ne PHP Fehlermeldung das da was nicht stimmt.
__________________
Aus dem Dynamo Lande kommen wir. Trinken immer reichlich kühles Bier. Und dann sind wir alle voll, die Stimmung ist so toll. Aus dem Dynamo Lande kommen wir.
http://www.lit-web.de
Mit Zitat antworten
  #7 (permalink)  
Alt 29-04-2013, 12:49
Melewo
 Registrierter Benutzer
Links : Onlinestatus : Melewo ist offline
Registriert seit: Jan 2013
Beiträge: 365
Melewo befindet sich auf einem aufstrebenden Ast
Standard

@ litterauspirn,

da steht aber bei jeder zweiten Funktion, dass die nur von der Zend Engine unterstützt wird. Zumindest bei tidy::html, tidy::head und tidy::body sah ich gerade diesen Hinweis:

Zitat:
Hinweis: Diese Funktion wird nur von der Zend Engine 2 (PHP >= 5.0.0) unterstützt.
PHP: tidy::html - Manual

Edit: Und wenn da nichts steht, wie bei parseString, ich aber das Beispiel von der Seite mit tidy_parse_string verwende, so erhalte ich dennoch zur Antwort:

Zitat:
Fatal error: Call to undefined function tidy_parse_string()

Geändert von Melewo (29-04-2013 um 13:23 Uhr)
Mit Zitat antworten
  #8 (permalink)  
Alt 30-04-2013, 13:26
Quetschi
 PHP Expert
Links : Onlinestatus : Quetschi ist offline
Registriert seit: Dec 2004
Beiträge: 3.134
Quetschi wird schon bald berühmt werden
Standard

@Melewo

Jetzt liest du schon im Manual - warum dann nicht auch die entsprechenden Abschnitte bzgl. Anforderungen/Installation?

PHP: Installation/Konfiguration - Manual
__________________
Ihr habt ein Torturial durchgearbeitet, das auf den mysql_-Funktionen aufbaut?
Schön - etwas Geschichte kann ja nicht schaden.
Aber jetzt seht euch bitte php.net/pdo oder php.net/mysqli bevor ihr beginnt!
Mit Zitat antworten
  #9 (permalink)  
Alt 30-04-2013, 14:44
Melewo
 Registrierter Benutzer
Links : Onlinestatus : Melewo ist offline
Registriert seit: Jan 2013
Beiträge: 365
Melewo befindet sich auf einem aufstrebenden Ast
Standard

@Quetschi,

weil es nicht weiter interessierte, newbie1955 könnte es aber mal testen.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
xpath


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
CSS wirkt auf einige Dateien nicht! Sonork HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 1 27-05-2010 01:20
Transparenz wirkt sich auf Kind-Elemente aus pascaluhlmann HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 9 17-09-2009 20:15
Css wirkt nur auf halbes Formularfeld tim185 PHP Developer Forum 6 01-05-2009 15:57
[HTML] Border nötig damit margin-top wirkt im FF - wieso? Benny-one HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 4 29-10-2007 13:14
Wie wirkt sich häufiges Aktualisieren auf den Pagerank aus? Meillo SEO - Suchmaschinen Tricks und Tipps 4 14-01-2005 10:34

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 00:35 Uhr.