html seiten aufarbeiten und in db schreiben

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • html seiten aufarbeiten und in db schreiben

    Guten tag community!

    ich trete mit einer doch sehr gewagten und großen bitte an euch heran: ich kämpfe jetzt seit ein paar stunden mit einem problem herum, und komm eifnach nicht auf deren lösung...

    die aufgabenstellung: ein kunde hat eine statischen webseite- 400 inhaltsseiten die alle gleich aufgebaut sind:

    PHP-Code:
    ...
    <
    title>titel text</title>
    ...
    <
    script language="JavaScript"><!--
    ...
        
    top.banner.location.href="../ba-grabsteinservice.htm";
        }
    }
    // --></script>
    ...
    <
    p><b><font face="Arial" size="6" color="#CC0000">titel</font></b></p>

    <
    p><font face="Arial">text<br>
    text</font><p>
    <
    b><font face="Arial" color="#CC0000">titel</font></b><p>
    <
    font face="Arial">text</font><p>

    <
    b><font face="Arial" size="2" color="#CC0000">Siehe auch</font></b><ul>
      <
    li><b><font face="Arial" size="2"><a href="2m1friedhoefe-wien.htm">link beschirftung</a></font></b></li>
      ...

    </
    body>
    </
    html
    jetzt muss ich den relevanten content herausfiltern-
    wie kann ich nach "<title>"%"</title>" suchen und den inhalt heraus filtern? Kenn mich leider nicht mit regulären ausdrücken aus... kann mir jemand eine derartige preg_match_all- abfrage formulieren- ich hoffe ich bekomm es dann hin diese für die anderen abfragen umzuformulieren...

    vielen dank im voraus, wenn sich jemand die arbeit für mich antut...
    lg igor

  • #2
    mann, da sucht man stundenlang- findet nichts, dann schreibt man nen forumsbeitrag und findet natürlich sofort etwas...

    PHP-Code:

    ereg
    ("<title>(.*)<\/title>" $inhalt $titel); 
    aber ich komm sicher nochmla mit ner frage...
    guten morgen.

    Kommentar


    • #3
      okay- erste frage- wie geh ich hier mit umlauten um?

      //edit: fehler gefunden, warum htmlspecialchars() nicht gefunkt hat: die ursprungsdateien sind schon fehler haft


      frage. habe ich eine möglichkeit per >ereg<, dass er mir zum beispiel bei

      PHP-Code:
      ereg("<p><b><font face=\"Arial\" size=\"6\" color=\"\#CC0000\">(.*)<\/font><\/b><\/p>"$lines $ueberschrift); 
      beim ersten mal wo "<\/font><\/b><\/p>" vorkommt die kette abschneidet oder muss ich den string dann nochmal extra nacharbeiten?
      Zuletzt geändert von regart; 22.08.2007, 04:00.

      Kommentar


      • #4
        Modifier U, nachzulesen auf http://www.php.net/manual/en/referen....modifiers.php

        Du solltest statt eregi() lieber preg_match_all() verwenden.

        Kommentar

        Lädt...
        X