Asci, Ansi, wtf?!

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Asci, Ansi, wtf?!

    Hoi,

    es gibt ja viele Arten von GB Einträgen, so posten manche Text, andere Ascii Bilder, wieder andere Texte auf arabsich.
    Nun hat es mich interessiert, wie bestimmte Seiten diese konvertieren und habe mittels LiveHTTPHeaders alles abgefangen und mir angeschaut.


    Ich hab dann selber mal gesucht und bin auf utf8_encode gestoßen.
    Ziel war es letzendlich, solche Daten per post2host an eine externe Seite zu schicken. Allerdings scheinen sich die Kodierungen minimal zu unterscheiden, so sieht mittels livehttpheaders abgefangener text so aus:

    --..%2C%C2%B8.
    Wobei der von mir und utf8_encode geschickte text so aussieht:


    --..%2C%B8.

    Ist nur ein kleiner Ausschnitt, der nicht viel aussagt, aber kann mir jmd sagen woran das liegt, oder gar eine andere Funktion nennen? Ich hab nun 6St rumprobiert, ohne Erfolg. :/

  • #2
    Welchen Text hast du denn wie umgewandelt?

    Kommentar


    • #3
      das kommt z.b. auf die kodierung an, die innerhalb einer html seite eingestellt ist (s. content-type).

      Kommentar


      • #4
        Die Zeichenkoodierung steht auf beiden Seiten auf UTF8.
        Den text den ich zu koodieren versuche ist zb folgender:

        (¨ˆ`'°²~•-.,¸_¸,.-•~²°'´ˆ¨)
        .) ╠╗╚╝╠╗╚╝ (.
        (¸,.-•~²°'´ˆ¨¯¨ˆ`'°²~•-.,¸)

        (¨^^ˆ`'°²~•-.,¸_¸,.-•~²°'´ˆ^^¨)
        .) HF&GL (.
        (.¸,..--•~²°'´ˆ¨¯¨ˆ`'°²~•--..,¸.)
        *´¨ )
        ¸.•´¸.•´¨) ¸.•*¨)
        (¸.•´ (¸.•´ (¸.•*´¯`*•> Mr.

        Re wär n1 ;-)
        Originalkoodierung der Website sieht so aus:


        %28%C2%A8%CB%86%60%27%C2%B0%C2%B2%7E%E2%80%
        A2-.%2C%C2%B8_%C2%B8%2C.-%E2%80%A2%7E%C2%B2%C2
        %B0%27%C2%B4%CB%86%C2%A8%29%0D%0A.%29+%E2%95
        %A0%E2%95%97%E2%95%9A%E2%95%9D%E2%95%A0%E2%
        95%97%E2%95%9A%E2%95%9D+%28.%0D%0A%28%C2%B8%
        2C.-%E2%80%A2%7E%C2%B2%C2%B0%27%C2%B4%CB%86%
        C2%A8%C2%AF%C2%A8%CB%86%60%27%C2%B0%C2%B2%7E
        %E2%80%A2-.%2C%C2%B8%29%0D%0A%0D%0A%28%C2%A8
        %5E%5E%CB%86%60%27%C2%B0%C2%B2%7E%E2%80%A2-.
        %2C%C2%B8_%C2%B8%2C.-%E2%80%A2%7E%C2%B2%C2%B0
        %27%C2%B4%CB%86%5E%5E%C2%A8%29%0D%0A.%29+HF
        %26GL++%28.%0D%0A%28.%C2%B8%2C..--%E2%80%A2%7E
        %C2%B2%C2%B0%27%C2%B4%CB%86%C2%A8%C2%AF%C2
        %A8%CB%86%60%27%C2%B0%C2%B2%7E%E2%80%A2--..%2C
        %C2%B8.%29%0D%0A*%C2%B4%C2%A8+%29%0D%0A%C2
        %B8.%E2%80%A2%C2%B4%C2%B8.%E2%80%A2%C2%B4%C2
        %A8%29+%C2%B8.%E2%80%A2*%C2%A8%29%0D%0A%28%C2
        %B8.%E2%80%A2%C2%B4+%28%C2%B8.%E2%80%A2%C2
        %B4+%28%C2%B8.%E2%80%A2*%C2%B4%C2%AF%60*%E2
        %80%A2%3E+Mr.%0D%0A%0D%0ARe+w%C3%A4r+n1+%3B-%29
        Meine utf8_encode so:


        %28%A8%88%60%5C%27%B0%B2%7E%95-.%2C%B8_%B8
        %2C.-%95%7E%B2%B0%5C%27%B4%88%A8%29%0D%0A.%29+
        %26%239568%3B%26%239559%3B%26%239562%3B%26
        %239565%3B%26%239568%3B%26%239559%3B%26%239562
        %3B%26%239565%3B+%28.%0D%0A%28%B8%2C.-%95%7E%B2
        %B0%5C%27%B4%88%A8%AF%A8%88%60%5C%27%B0%B2
        %7E%95-.%2C%B8%29%0D%0A%0D%0A%28%A8%5E%5E%88
        %60%5C%27%B0%B2%7E%95-.%2C%B8_%B8%2C.-%95%7E
        %B2%B0%5C%27%B4%88%5E%5E%A8%29%0D%0A.%29+HF
        %26GL++%28.%0D%0A%28.%B8%2C..--%95%7E%B2%B0%5C
        %27%B4%88%A8%AF%A8%88%60%5C%27%B0%B2%7E%95--..
        %2C%B8.%29%0D%0A%2A%B4%A8+%29%0D%0A%B8.%95%B4
        %B8.%95%B4%A8%29+%B8.%95%2A%A8%29%0D%0A%28%B8.
        %95%B4+%28%B8.%95%B4+%28%B8.%95%2A%B4%AF%60%2A
        %95%3E+Mr.%0D%0A%0D%0ARe+w%E4r+n1+%3B-%29

        Da mag einem im ersten Moment nichts auffallen, wenn man aber genau hinschaut, ist es nicht zu 100% die gleiche Koodierung.
        Gibt es irgendwie 'ne Möglichkeit herauszufinden, welche Koodierung bzw PHP Funktion beim Original angewandt wurde?

        Kommentar


        • #5
          das erste ist urlencode(), angewandt auf einen text in utf-8.
          das zweite ist in iso 8859-1.

          kannst du beides an dem "ä" sehen.

          Kommentar


          • #6
            Hm, wie kann ich dann meine Ausgabe entsprechend dem original ändern? Soweit ich gesehen hab, kann man bei url_encode doch kein Kodierungsprotokoll angeben, oder irre ich?

            Kommentar


            • #7
              der weg ist schon richtig, du machst aber irgendwas falsch.

              Kommentar


              • #8
                Hm.. aber was? :/

                Kommentar


                • #9
                  Ok.. Meta Angabe des Protokolls.. *kopfschüttel*

                  Kommentar


                  • #10
                    meta angabe des protokolls?

                    Kommentar


                    • #11
                      PHP-Code:
                      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"

                      Kommentar


                      • #12
                        "...der html seite" oder "...der antwort" dann.

                        Kommentar


                        • #13
                          Beides.
                          In meinem Script stand das Protokoll auf ISOxxxxx, Emfpängerseite nutzt UTF8, also hab ichs auch in meinem Script auf UTF8 gestellt, nun funktioniert es auch.
                          Warum ich nicht eher drauf gekommen bin, gute Frage.. viel mir ganz plötzlich beim Brötchen schmieren ein.

                          Kommentar


                          • #14
                            ich wollte dich nur darauf hinweisen, dass du das wort "protokoll" falsch nutzst.

                            Kommentar


                            • #15
                              Ahja? Versteh ich grad nicht.

                              //Edit
                              Nungut, hab das Wort "Wort" überlesen..

                              Kommentar

                              Lädt...
                              X