HTML-Seiten auslesen und in Excel o. DB speichern

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • HTML-Seiten auslesen und in Excel o. DB speichern

    Hallo,

    ich habe in der Struktur gleichmäßig, wiederkehrende HTML-Seiten aus einem Bücher-Shop und möchte die Produkt-Daten, statt abzuschreiben, aus den HTML-Seiten auslesen, um diese dann in Excel oder einer DB zu speichern. Erlaubnis liegt natürlich vor - ist also kein Datenklau.

    Wer kann mir helfen?

    mfg
    Annalena

  • #2
    Sieht ja nicht so aus als ob du schon einen Ansatz hast - ist eher ne Script Suche.....
    da müßte man mehr einzelheiten Wissen:
    willst du die Seiten über das Internet auslesen, hast du (FTP-) Zugriff auf die Seiten, etc...
    Mein erster Ansatz wäre:
    - die Dateien mit PHP einlesen
    - auf die relevanten Bereiche hin parsen
    - diese in ein (mehrdimensionales) Array packen
    - das dann in die DB speichern
    "I don't want to belong to any club that would accept me as a member."

    Groucho Marx

    Kommentar


    • #3
      Hallo mcmurphy,

      ja - das ist schon richtig, ich habe nur eine kleine Vorstellung wie es überhaupt möglich wäre, so etwas zu lösen.

      Die komplette Seite mit PHP einlesen und dann erst eine Auswertung vornehmen hatte ich mir auch überlegt, da man einen so abgelegten Text viel besser bearbeiten kann.

      Die HTML-Daten siehe Link unten, die Speicherung könnte in einer noch zu erstellenden MySQL erfolgen.

      Wichtig ist, es ist immer eine gleichbleibende HTML-Struktur, nur die Inhalte ändern sich. FTP- oder SQL-Zugang habe ich nicht, dort sind noch andere Dinge abgelegt, leider.

      Hättest du ein Beispiel wie ich da vorgehen könnte?

      mfg
      Annalena

      http://cms68.r3-server.net/j068da
      Zuletzt geändert von annalena49; 28.09.2008, 21:04.

      Kommentar


      • #4
        Na, aber ein bißchen googlen kannste doch?
        Hier, der 3te Treffer haben wir doch schon mal nen Ansatz.

        Von der Idee her dann hier
        http://cms68.r3-server.net/j068da/in...alog&Itemid=34
        starten.
        <div id="content_inner"> den würde ich als Startknoten nehmen, mich per DOM zu der Tabelle mit den Links hangeln und diese in ein Array schreiben, dann hättest du Schritt 1 schon mal (fast) geschafft.

        Für jedes Feld im Array müßtest du das dann natürlich auch wieder machen.

        Mach doch mal nen Ansatz, dann helfe ich (nach möglichkeit) auch gerne weiter......
        "I don't want to belong to any club that would accept me as a member."

        Groucho Marx

        Kommentar


        • #5
          klar - wer kann nicht mit Google umgehen, ist halt nur die Sache mit den richtigen Suchbegriffen und da war ich noch nicht so erfolgreich.

          Aber ein gutes Beispiel hast Du da gefunden.
          Da werde ich mich erstmal mit auseinandersetzen.

          Vielen Dank auf alle Fälle für Deine Hilfe, hat mich ein großes Stück weitergebracht.

          Gruß
          Annalena

          Kommentar


          • #6
            Hallo,

            also nach zweitem und drittem Durcharbeiten ist das doch eine (oder zwei) Nummer(n) zu schwierig für mich.
            Könntest Du mir, oder jemand anders hier im Forum, 'gegen Androhung von Geld' diesen Weg in php umsetzen?

            Gruß
            Annalena

            Kommentar


            • #7
              Schick mir doch mal ne Email mit den genauen Anforderungen...
              Wann werden denn Daten auf der Seite stehen, bisher ist da noch nix...
              Zuletzt geändert von mcmurphy; 29.09.2008, 16:08.
              "I don't want to belong to any club that would accept me as a member."

              Groucho Marx

              Kommentar

              Lädt...
              X