[REGEX] Inhalt zwischen <body> und </body>

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [REGEX] Inhalt zwischen <body> und </body>

    Hallöchen Leute.

    Ich soll für meine Firma einen Spider schreiben, der Werbemittel auf ihre Einbindung bei den Kunden prüfen soll. Dazu brauche ich den HTML-Code zwischen den Body-Tags.

    Wie bekomme ich den mit nem RegEx aus? Ich habe da schon etwas probiert, aber irgendwie klappts net. Ich arbeite mit der Funktion preg_match().

    Hier mal so die beiden Dinge, die ich versucht habe.

    PHP-Code:
    preg_match"/<body.*>(.*)<\/body>/im"$content$reg ); 
    und

    PHP-Code:
    preg_match"/<body[^>]*>(.*)<\/body>/im"$content$reg ); 
    Bekomme aber immer ein leeres Array zurück (siehe Variable $reg).

    Woran liegts? Was ist falsch an den RexEx'

    Danke schonmal im Vorraus!

  • #2
    Schau dir mal die Modifikatoren für RegExp im Manual an. V.a. der Greedy/Ungreedy Mod löst dein Problem.

    Gruss

    tobi
    Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

    [color=red]"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."[/color]
    Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)

    Kommentar


    • #3
      Slash escapen, s-Modifier benutzen.
      [FONT="Helvetica"]twitter.com/unset[/FONT]

      Shitstorm Podcast – Wöchentliches Auskotzen

      Kommentar

      Lädt...
      X