strip_tags - geht nichtmit word html

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • strip_tags - geht nichtmit word html

    aus einem kleinen wysswig-system versende ich einen newsletter

    -> html version funktioniert...

    -> damit sich das ganze auch als plain text versenden lässt, nehme ich all die html tags raus, die mir vom textfeld in die db übergeben werden um dann versandt zu werden.

    -> das funktioniert auch soweit gut und das ganze kommt in schönem plain an.

    nun wird der user aber gerne seine word-doc direkt reinkopieren und hier beginnt das problem:

    beim ersten zeilenumbruch kommt im code folgendes
    [COLOR=orangered]<xml:namespace prefix = o ns = "urn:schemas-microsoft-comfficeffice"/>[/COLOR]

    danach wird nicht mehr angezeigt, weil so nehme ich an, der rest des inhaltt als teil der tags angezeigt und so gestript wird. entferne ich diesen teil manuell aus der db funktioniert es auch, aber das wäre ja nicht der sinn der sache.

    nun habe ich versucht das rauszunehmen, aber irgendwie geht das nicht:


    PHP-Code:
    $bad_pl=array("!&nbsp;!m","!<BR>!m","!<xml:namespace prefix = o ns = \"urn:schemas-microsoft-com:office:office\"/>!m");
    $good_pl=array("","\n","");
    $textfelda_pl preg_replace($bad_pl,$good_pl,$textfelda_pl);
    $textfelda_pl strip_tags($textfelda_pl); 
    vielleicht kann mir da jemand einen gedankenanstoss geben, wofüt ich mich schon im voraus bedanken möchte.
    Zuletzt geändert von bobby; 11.12.2003, 20:48.
    http://www.radiocity.ch

  • #2
    was ist denn das für eine das für eine word-datei?
    wenns dir nichts ausmacht, stell die dochmal online oder häng sie an.

    btw: wenn deine regex so ^^ aussieht, musst du imho noch einiges escapen.
    Kissolino.com

    Kommentar


    • #3
      auf die word datei direkt kommts glaub ich nicht an... es ist einfach ein tag der erzeugt wird, wenn ein office/word dokument in html umgewandelt wird.

      wer jemals in word eine html seite erzeugt hat, weiss ja was für ein
      schrecklicher code erzeugt wird. u.a. eben auch die oben geschriebene code element, welches anscheinend resisten gegen den strip_tag befehl ist, bzw diesen zur fehlausgabe zwingt.

      hab jetzt noch mehr teile escaped ... irgendwie schluckt er das nicht
      http://www.radiocity.ch

      Kommentar


      • #4
        ohne code & beispiel wird das nichts ... für regex nutzt du besser die [ CODE] [ /CODE] tags (ohne leerzeichen), sonst fressen forum "\" auf
        Kissolino.com

        Kommentar


        • #5
          habs jetzt irgendwie geschafft - falls das jemanden interessiert

          Code:
          $bad_pl=array("!/>!m","!<\?xml:namespace prefix = o ns = \"urn:schemas-microsoft-com:office:office\"!m");
          $good_pl=array("","");
          $textfelda_pl = preg_replace($bad_pl,$good_pl,$textfelda_pl);

          der ganze befehl auf einmal zu streichen hat irgendwie nicht geklappt ...

          gibts irgeneinen befehl
          [COLOR=red]strip_xmltags[/COLOR] ??

          jav vermutlich nicht
          http://www.radiocity.ch

          Kommentar

          Lädt...
          X