TAGs filtern bei Suche in statischen Seiten

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • TAGs filtern bei Suche in statischen Seiten

    Hallo Gemeinde,

    ich hätte da gerne mal ein Problem. Ich habe ne Suchfunktion, die statische HTML-Seiten in einem Verzeichnis nach dem Suchwort durchwühlt. Seiten die das Suchwort enthalten werden gelistet - klickt man auf die Seite, erscheint diese und die Such-Phrasen werden farblich hervorgehoben.

    Nun das Problem: Gibt man irgend nen Suchbegriff ein, der im TAG enthalten ist, wird letzterer zwerstört. Wenn ich also nach "able" suche, wird folglich der TABLE-Tag zerstört etc.

    Wie geht man so was geschickt an?

    Ich lese die HTML-Seite ein und markiere dann per preg_replace() die Suchbegriffe. Kann man preg_replace irgendwie sagen, dass es nicht in TAGs suchen soll???

    Dank & Grüße,
    Andi

  • #2
    Du könntest vorher strip_tags drauf anwenden, wenn du eh mit PHP drin suchst!

    Kommentar


    • #3
      Es gibt Leute die schreiben für so etwas einen eigenen Parser, d.h. Datei Buchstabe für Buchstabe durch gehen und dabei mit"schreiben", ob man in einem Tag ist oder nicht um das dann ggf. zu highlighten oder eben nicht.

      Alternativ kannst du mit "preg_replace <.+> $rand"+Zwischenspeichern von dem was ersetzt wurde, preg_replace("suchwort","<em>suchwort</em>", "Rückersetzung" der durch rand Ersetzten Teile, was natürlich nicht hundertprozentig funktioniert.

      Als dumm-Lösung könntest du oben hinschreiben, dass der Benutzer Strg+F drücken soll und sein Suchwort erneut eingeben soll... ^^;

      Ein netter Guide zum übersichtlichen Schreiben von PHP/MySQL-Code!

      bei Klammersetzung bevorzuge ich jedoch die JavaCoding-Standards
      Wie man Fragen richtig stellt

      Kommentar


      • #4
        Hi und Danke schon mal.

        Ne, die Dumm-Lösung kommt nicht in Frage ;-) Man soll schon wirklich auf der Seite sehen wo das gefundene Wort steht.

        War auch schon am überlegen mit stip_tags() erst mal alles rauszuschmeissen - aber die Tag brauch ich ja wieder, sonst ist das Layout ja zwersört.

        Ok, also irgend einen Weg, der nur zwischen den Tags liest, bzw diese wieder zurückschreibt. Ich tüftel noch mal ein bissl.

        Andi

        Kommentar


        • #5
          vielleicht noch als anregung:
          http://www.php-faq.de/q/q-regexp-ersetzen.html

          dabei gefällt mir der modifier e gar nicht.

          ich würde wahrscheinlich auch so lösen, wie ghostgambler vorgeschlagen hat.

          @ghostgambler warum meinst du, dass es nicht "hundertprozentig funktioniert"?
          als $rand würde ich eine zählvariable benutzen.

          Kommentar


          • #6
            Ja das ist es! Sehr sehr geil!

            Was hast Du gegen den Modifier "e"? Der ist sehr nützlich - wie in diesem Fall ;-)

            Danke,
            Andi

            Kommentar


            • #7
              Original geschrieben von andik2000
              Was hast Du gegen den Modifier "e"?
              er ist der kleine bruder von eval().

              http://en.wikiquote.org/wiki/Rasmus_Lerdorf:
              If eval() is the answer, you're almost certainly asking the wrong question.
              gut, in deinem fall ist es statischer html, aber ich würde es trotzdem nicht benutzen. oder nenne es einfach nur "persönliche abneigung"

              Kommentar


              • #8
                Original geschrieben von 3DMax
                @ghostgambler warum meinst du, dass es nicht "hundertprozentig funktioniert"?
                als $rand würde ich eine zählvariable benutzen.
                Eine Zählvariable geht nicht, weil eine 1 z.B. ja durchaus auch einfach so im Text stehen kann.

                Mit dem, dass es nicht immer geht, meinte ich, dass man den kompletten HTML-Standard in ein Pattern packen müsste, damit es wirklich nur HTML-Tags matcht.
                Alternativ müsste man den kompletten Standard in die Schleife packen, die den Text durch geht... so oder so ist die perfekte Lösung ziemlich aufwändig.

                Ein netter Guide zum übersichtlichen Schreiben von PHP/MySQL-Code!

                bei Klammersetzung bevorzuge ich jedoch die JavaCoding-Standards
                Wie man Fragen richtig stellt

                Kommentar


                • #9
                  Original geschrieben von ghostgambler
                  Eine Zählvariable geht nicht, weil eine 1 z.B. ja durchaus auch einfach so im Text stehen kann.
                  ja, ist klar. ich würde auch durch soetwas in der art ersetzen: {1} oder besser <1>
                  Original geschrieben von ghostgambler
                  Mit dem, dass es nicht immer geht, meinte ich, dass man den kompletten HTML-Standard in ein Pattern packen müsste, damit es wirklich nur HTML-Tags matcht.
                  ich sehe da nicht das problem. wenn es normaler text sein soll, muss auch < und > als &lt; bzw. &gt; dargestellt sein., also kann man keine falschen tags erwischen.

                  ps:
                  man könnte auch alle bereiche zwischen > und < rausfischen und die dann ersetzen.
                  preg_replace_callback

                  Kommentar


                  • #10
                    wieso nicht file_get_contents, strip_tags und preg_match_all benutzen?

                    Kommentar


                    • #11
                      Original geschrieben von Koala
                      wieso nicht file_get_contents, strip_tags und preg_match_all benutzen?
                      weil dann die tags weg sind und das layout etwas monoton aussieht?

                      den vorschlag + gegenargument gab's aber schonmal in diesem thread

                      Kommentar


                      • #12
                        Ich hätte da auch noch einen abwegigen Vorschlag.

                        Evtl etwas oversized:
                        http://de2.php.net/manual/de/ref.dom.php oder irgend einen anderen xml Parser. In der Baumstruktur kann man dann nach belieben operieren. Zumindest mit XHTML kommen diese recht gut klar. Zur Not noch vorher ein http://de2.php.net/manual/de/ref.tidy.php oder vergleichbares drüber scheuchen...
                        Zuletzt geändert von combie; 16.12.2007, 21:51.
                        Wir werden alle sterben

                        Kommentar


                        • #13
                          Suchen auf dem Server, Markieren beim Client:
                          Wenn das gesuchte Wort in strip_tags($file) enthalten ist, wird in $file mit str_ireplace('</head>', $js.'</head>') ein wenig JavaScript injiziert, welches alle DOM-Elemente unter <body> durchiteriert, innerHTML vergleicht und ggf. manipuliert.


                          Diese Lösung ist zwar auch nicht ganz sauber, weil der Server meint, einen Treffer zu haben, auch wenn der z.B. display:none ist. Aber das beherrscht fast keine Suche.

                          Kommentar

                          Lädt...
                          X