Links und Text aus Website auslesen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • #16
    regex sind frickelei.
    Mag sein, aber ich kriege diese Fricklerei auf eine Zeile Quellcode. Ihr Eurer Ge-DOMSE auch ? ***duckundrenn**

    Gruss

    tobi
    Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

    [color=red]"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."[/color]
    Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)

    Kommentar


    • #17
      Original geschrieben von jahlives
      Mag sein, aber ich kriege diese Fricklerei auf eine Zeile Quellcode. Ihr Eurer Ge-DOMSE auch ? ***duckundrenn**
      Gruss
      tobi
      genau! ein preg_match_all, ohne case-sensitive, und ich habe alles was ich brauche.

      peter
      Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
      Meine Seite

      Kommentar


      • #18
        vorweg, ich meine Document Object Model , dom xml ist ja das veraltete für php4.

        so, jetzt zu euch spezialisten
        hier ist meine dom-variante:

        PHP-Code:
        $doc = new DOMDocument();
        $doc->loadHTMLFile('http://php-resource.de');

        foreach (
        $doc->getElementsByTagName('a') as $element)
        {
            echo 
        $element->getAttribute('href').' | '.$element->nodeValue.'<br />';

        und nun zeigt her, eure regex-varianten, damit wir beurteilen können, was frickelei ist und was nicht

        Kommentar


        • #19
          Du kannst das sogar noch kürzen:
          PHP-Code:
          foreach( DOMDocument::loadHTMLFile('http://php-resource.de')->getElementsByTagName('a') as $element ) { 
          ^^

          EDIT:
          Ich wusste ja gar nicht, wie tolerant die loadHTML*-Methoden sind, super cool!
          Zuletzt geändert von PHP-Desaster; 31.07.2008, 08:11.

          Kommentar


          • #20
            Code:
            $regExp = '/<a.*?href=[\\'|"](.*?)[\\'|"].*?>(.*?)<\/a>/is';
            Okay ich muss zugeben, dass die DOM Variante echt nett und kurz ist. Habe mir das aufwändiger vorgestellt
            Ich werden niemals mehr an eurem Ge-DOMSE zweifeln, versprochen

            Gruss

            tobi
            Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

            [color=red]"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."[/color]
            Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)

            Kommentar

            Lädt...
            X