Warnung: file_put_contents(/home/www/web1/html/php_dev/test.txt) [function.file-put-contents]: failed to open stream: Permission denied in /home/www/web1/html/php_dev/sys/lib.activity.php (Zeile 58)
Grabb-Script geuscht [Archiv] - PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr

- Ad -
php-resource




Archiv verlassen und diese Seite im Standarddesign anzeigen :
Grabb-Script geuscht


 
df6ar
29-04-2003, 20:35 
 
Suche Script was folgendes macht:

- eine andere Internetseite aufrufen
- Text ausfiltern und zurückgeben

In der aufgerufenen Seite sind die Textteile
<!-- Start des Redaktionsbereiches -->
und
<!-- Ende des Redaktionsbereiches -->
enhalten.

Die ganze Seite sieht praktisch so aus:

...Text..blablabla
<!-- Start des Redaktionsbereiches -->
...Text der dargestellt werdeen soll.....
<!-- Ende des Redaktionsbereiches -->
Text...blablabla


Das Script soll alles zwischen diesen beiden Textteilen
als Ausgabe zurückgeben.

Kann mir jemand helfen?

Gruß Michael

 
Abraxax
29-04-2003, 20:37 
 
datei einlesen. -> fopen()
daten filtern. -> regex


suche im forum und du wirst fündig werden.

 
df6ar
29-04-2003, 20:57 
 
Sri,

vielleicht bin ich blind :-)
hab zwar was zum Theme fopen gefunden (das parsen einer anderen Seite krieg ich auch noch hin) aber nix zum Ausfiltern wie von mir beschrieben.

Gruß Michael

 
df6ar
29-04-2003, 21:19 
 
Hallo allerseits,
ich habe im Internet was gefunden!

wens interessiert, hier der Quellcode:

----schnipp---

<?php

// Global Variables
$filename = "http://www.darc.de"; // Location of the News Source
$start = "<!-- Start des Redaktionsbereiches -->"; // Start Grabbing Code
$stop = "<!-- Ende des Redaktionsbereiches -->"; // Stop Grabbing Code
$page = "wtowatch.txt"; //name of first cache file


// Get contents of the specified URL and writes it into a string
$fd = fopen( $filename, "r" );
$contents = fread( $fd, 20000 );
fclose( $fd );

// Isolates desired section.
if(eregi("$start(.*)$stop", $contents, $printing)) {
$substring=$printing[1];


// while is added as there are multiple instances of the </table> string & eregi
// searches to include the most that matches, not the next.
while(eregi("(.*)$stop", $substring, $printing)) {
$substring=$printing[1];
};

} else {
echo "Didn't find Daily summary";
}

// Replaces specific HTML tags and text
$printing[1] = eregi_replace( "- .* records</b>", "", $printing[1] ); // Text
$printing[1] = eregi_replace( "<IMG SRC=[^>]*>", "", $printing[1] ); // Images
$printing[1] = eregi_replace( "<font[^>]*>", "", $printing[1] ); // Fonts
$printing[1] = eregi_replace( "</font>", "", $printing[1] );
$printing[1] = eregi_replace( "<tr[^>]*>", "<li>", $printing[1] ); // Table Codes
$printing[1] = eregi_replace( "<td[^>]*>", "", $printing[1] );
$printing[1] = eregi_replace( "</tr>", "", $printing[1] );
$printing[1] = eregi_replace( "</td>", "", $printing[1] );

// Adds Absolute URL
$printing[1] = eregi_replace( "href=\"", "href=\"http://www.darc.de", $printing[1]);

// Saves output to include file
$cartFile = fopen("$page","w");
fwrite($cartFile,$printing[1]);
fclose($cartFile);

include ("$page");

?>

---schnipp---

Gruß Michael


php-tags eingefügt.
Abraxax

 
df6ar
29-04-2003, 21:36 
 
Danke fürs ändern.

Wer wissen will, wie es funtioniert, der schaut auf meine Seite

www.a-funk.net

und ruft mal die DARC-Headlines auf!

Gruß aus Aschaffenburg

 
Mysti
29-04-2003, 21:48 
 
das scriptelchen ist ja cool.
kann doch hier und da recht nützlich sein

lg
jens

- -

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:23 Uhr.