html datei auslesen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • html datei auslesen

    Hallo,

    ich habe eine von word erzeugte html datei mit verschiedenen berichten(besteht aus überschrift und text ,getrennt mit einer leerzeile) und bildern. ich will diese berichte auslesen und die dann in meine db schreiben.
    (ueberschrift, text). wie kann ich diese html datei säubern ?? und dann auslesen ????

    gruß

    christof
    Gruß Smudl

  • #2
    Ich würde mal sagen du speicherst diese html Seite auf ne Diskete gehst du zu jemanden der Dreamweaver hat und mit dem dreamweaver entfernst du alle unnötige Word daten aus dem HTML File

    Kommentar


    • #3
      Code:
      <?$htmfile = "test.htm";
      @$fp = fopen($htmfile,"r");
      if (!$fp) {
          print "File $htmfile doesn't exist<br>\n";
      } else {
          $fileok = "ok";
          while (!feof($fp)) { 
              $check .= fgets($fp, 4096);
          }
      }
      @fclose($fp);
      // jetzt hast Du den Inhalt in der Variable $check
      ?>
      Es gibt noch viele andere Möglichkeiten ein File einzulesen:

      Jetzt kommt es auf den Aufbau der HTML-Files drauf an.
      Du kannst über strpos() eindeutige Zeichenfolgen die in der Variable vorkommwen ermitteln, die auf den Beginn der Überschrift, Ende der Überschrift, Beginn des Textes, Ende des Textes schließen lassen. Mit diesen Positionen kannst Du in der Folge über substr() die gewünschten Textteile ausschneiden und in die DB schreiben.

      http://www.php.net/manual/de/function.strpos.php
      http://www.php.net/manual/de/function.substr.php

      Kommentar


      • #4
        Siehe auch http://www.php-resource.de/forum/sho...?threadid=4419

        Kommentar

        Lädt...
        X