html 2 txt

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • html 2 txt

    Ich möchte ein HMTL-Dokument als Text speichern. Dabei ist mir aber die Einrückung wichtig. Bei Copy-Paste geht diese ja bekanntlich verloren.

    Also habe ich mir zu diesem Zwecke ein paar Tools aus dem Netz gesaugt, leider allesamt mit sehr ernüchternden Ergebnissen. Da kam meist so ein Kuddelmuddel bei raus, dass es einfacher war, per Copy-Paste den Text zu exportieren und manuell einzurücken.

    Kurz und gut, habt Ihr eine Idee? Die Einrückungen sind komplett über den HTML-Tag
    Code:
    <div style="margin-left:15px">
    realisiert worden.

    Vielleicht einen separaten Parser schreiben? Andere Vorschläge?

  • #2
    Moin,

    Ich glaube, da gibt es kaum eine direkte Möglichkeit. Denn margin-left ist ja kein Zeichen sondern eine grafische Formatierung via CSS. Im Textformat können grafische Einstellungen aber nicht übernommen werden.

    Wenn es aber auch ein PDF- oder OpenOffice.org-/StarOffice-Dokument sein darf, dann bieten OpenOffice und StarOffice die Möglichkeit, ein HTML Dokument als PDF zu exportieren oder als .sxw-Dokument (StarOffice- und OpenOffice-Pendant zu Microsofts .doc-Dokument) zu speichern. OpenOffice.org ist übrigens kostenlos und legal aus dem Internet runterzuladen unter http://de.openoffice.org.

    Eine weitere, allerdings weniger komfortable Möglichkeit wäre, einen Screenshot zu erstellen, und den durch ein OCR- (Texterkennungs-) Programm laufen zu lassen.

    Hendrik
    Zuletzt geändert von Hendrik2; 14.04.2005, 01:38.

    Kommentar


    • #3
      OpenOffice habe ich auf meiner Linux-Live-CD drauf, ich werde das mal ausprobieren.

      Andererseits war ich auf der Suche nach einem Tool, womit ich den Nutzerkomfort erhöhe. Falls das mit OpenOffice funktioniert, wird dem Anwender viel Arbeitsaufwand abverlangt.

      Und wenn ich die Einrückung durch einen anderen Tag vornehme?

      Kommentar


      • #4
        Wenn du die Einrückung schon in HTML mit Leerzeichen vornimmst, werden die natürlich auch bei Copy'n'Paste in das Textdokument mit übernommen.

        Wenn nur die erste Zeile eines Absatzes eingerückt werden soll, kannst du ja mal das csss-attribut text-ident ausprobieren, vielleicht wird das bei Copy'n'Paste berücksichtigt, ich weiss es nicht.

        Hendrik

        Kommentar


        • #5
          Eben diese Einrücken durch Leerzeichen funktionieren leider nicht.

          Ich hab nun überlegt, man könnte ja neben der Interpretation der XML-Datei als HMTL file auch eine Interpretation als TXT file vornehmen. Nur weiß ich dort nicht, wie ich Zeilenumbrüche und Einrückungen anweisen kann.

          Kommentar


          • #6
            Original geschrieben von SLieske
            Eben diese Einrücken durch Leerzeichen funktionieren leider nicht.
            [ ] du kennts <pre>
            [ ] du kennst &amp;nbsp;
            I don't believe in rebirth. Actually, I never did in my whole lives.

            Kommentar

            Lädt...
            X