Mit CURL HTML Header auslesen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Mit CURL HTML Header auslesen

    Hallo

    Seit ein paar Tagen habe ich mir ein kleines Projekt zum (Fern-)ziel gesetzt. Hier im Forum und auch im Netz bin ich aber nicht schlau geworden. Vieleicht könnt Ihr mir behilflich sein?
    Ich möchte eine Liste von Url's abarbeiten und dabei die Header der Index-Seiten auswerten. Dabei reicht mir aus dem HTML Header die Zeilen....

    <title>Seitentitel</title>
    <meta name="Keywords" content="Keywords">
    <meta name="Description" content="Description">

    ...in Variablen zu haben, damit ich die in eine SQL-Datenbank wegschreiben kann.

    Auf der Suche bin ich zu [COLOR=blue]curl[/COLOR] gekommen und habe damit auch schon ein bischen experimentiert. Aber die o.g. Zeilen bekomme ich nicht!?

    [COLOR=green]Meine Frage ist jetzt:
    ist curl dafür geeignet?
    oder gibt es vieleicht sogar schon einen codeschnipsel für so einen, sagen wir mal, [/COLOR] [COLOR=green]Mini-Web-Robot ? [/COLOR]


    Zur Info:
    Ich benutze SuSe 8.2 mit curl 7.10.2


    Wäre nett wenn Ihr mal einem Newbie zur Initialzündung verhelft


    Danke!

    Grüße,
    Andreas

  • #2
    get_meta_tags + die standard datei-funktionen mit einem preg_match() reichen in der regel.
    Kissolino.com

    Kommentar


    • #3
      meta tags

      Hi Wurzel

      Ja prima, das funzt! Danach habe ich schon den ganzen Tag gesucht
      Dann habe ich erstmal morgen was zum spielen...

      Ein Tip für den [COLOR=blue]<titel>[/COLOR] wäre noch schön


      Vielen Dank Wurzel!

      Bye, Andreas

      Kommentar


      • #4
        schau dir mal preg_match() und reguläre ausdrücke an. dazu gibts im forum
        auch jede menge beispiele => suche => regex oder preg_*, usw. dazu
        hats hier auch noch ein tutorial.
        Kissolino.com

        Kommentar


        • #5
          Ja, das mache ich... besten Dank nochmal!

          N8, Andreas

          Kommentar

          Lädt...
          X