Content Grabber

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Content Grabber

    Hallo Leute,

    ich möchte gerne bzl. unserer Webseite einen Grabber per PHP programmieren der den Inhalt einer Fremden Seite "klaut" bzw. ausließt und dann uns in einer Tabelle wiedergibt.

    Mit welchen Befehlen kann ich das am besten machen? Gibt es bereits ein paar Scripts die man sich ansehen könnte?

    lg
    Gruß , Ag3nt

  • #2
    file
    file_get_contents
    fsockopen

    Kommentar


    • #3
      Also ich hab nun folgendes Programmiert:

      PHP-Code:
      <?
      $handle = fopen('http://www.praktikum.info/content/stellenangebote/stellenangebot_anschauen_main.php', 'r'); 
      //$handle = fopen('http://www.', 'r'); 

      while (!feof($handle)) 

      $html .= fread($handle, 4096); 



      $begin = '<table width="580"  cellpadding="1" cellspacing="0" border="0" bgcolor="#FFFFFD" borderspacing="0">'; 
      $end = '</table>'; 

      $beginloc = strpos($html, $begin) + strlen($begin); 
      $endloc = strpos($html, $end); 

      $html = substr($html, $beginloc, $endloc - $beginloc); 
      echo "<table width=100%>";
      $html = str_replace("</tr>", "</tr>\n", $html);
      $html = str_replace("</td>", "</td>\n", $html);
      $html = str_replace("<td width", "<td nowrap ", $html);
      $html = str_replace("onMouseOver=\"this.style.cursor='hand'; window.status='Näheres zu dieser Stellenangebot'; return true;\" onMouseOut='window.status=\" \" ; return true;'","",$html);


      echo $html;
      echo "</table>";
      ?>
      Wie kann ich den Inhalt $html in mehrere Variablen speichern oder arrays speichern?

      bzw. den Inhalt der <TD>....</TD> den will ich einzelnd haben. Gibt es dort eine möglichkeit? Kann auch ruhig eine schleife sein? Ich will die Daten in unsere Datenbank übernehmen. Daher benötige ich das einzelnd.

      Vielen Dank für die Antworten.
      Gruß , Ag3nt

      Kommentar


      • #4
        verwende doch reguläre ausdrücke. dann kannst du den text formal beschreiben und ihn auch gleich aufteilen. ein weiterer vorteil ist eben, daß du bei regexp nicht jedes einzelne zeichen angeben mußt, sondern ...
        OffTopic:
        ich habe gerade bei praktikum.info nachgefragt, wegens content-klau. der meinte, er würde das wohl auch bei euch machen, und du wolltest wohl nur kontrollieren, was geklaut wurde (er meinte: ach, der einzelnd-typ ...). er würde dir das script zum auslesen für einen fairen preis zur verfügung stellen. sprich ihn doch einfach mal an. einfacher wäre es, so meinte er, wenn ihr eure datenbanken verbinden würdet oder sonstwie (xml, ...) daten austauschen würdet.
        Zuletzt geändert von derHund; 20.04.2005, 08:40.
        Die Zeit hat ihre Kinder längst gefressen

        Kommentar

        Lädt...
        X