Feste URL parsen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • #31
    Das kommt drauf an, was als Muster vorgegeben ist - "example.com" oder "example.com/". Bei letzterem findet er 2-4. Das funktioniert auch.

    Kommentar


    • #32
      das ist falsch. hausaufgabe: warum?

      Kommentar


      • #33
        Wenn ich bei mir im Skript (!) "http://www.spiegel.de" suche, findet er alles unterhalb dieser Seite. Das ist Fakt.

        Kommentar


        • #34
          mit welchem ausdruck?

          Kommentar


          • #35
            Code:
            !(href=[/"]' . preg_quote($url) . '[^\s]*[/"])!i
            Allerdings funktioniert das, wie gesagt, nicht mit einfachen statt doppelten Anführungszeichen.

            Kommentar


            • #36
              schon besser, du bist endlich auf "*" gekommen.
              und was soll jetzt dieses [/"]? hast du dir einfach mal eben so ausgedacht?

              Kommentar


              • #37
                Nein, das stammt von dir. Allerdings hieß es damals noch [/"/'], was bedauerlicherweise nicht funktioniert.

                Kommentar


                • #38
                  das ist unsinn. aber das kann nur jemand feststellen, der aufmerksam liest.
                  noch besser: verstehen, was "escape"-t werden muss, und was nicht.

                  Kommentar


                  • #39
                    Wie müsste das denn stattdessen lauten?

                    Kommentar


                    • #40
                      Da du mir so freundlich hilfst, habe ich gleich noch eine Frage.
                      Angenommen eine URL lautet demokratie.zip. Die würde mich interessieren, die log.txt genauso, nicht aber "http://xy.de/log.txt" oder "http://www.xy.de/demokratie.zip". Ich hätte dann gerne den Wert demokratie.zip bzw. log.txt in der matches-Variable. Solch ein Wert kann mehrmals vorkommen und sollte innerhalb eines href-Tages sein.
                      Dbzgl. habe ich nun auch herumprobiert und kam - wie sollte es schon sein - nicht zum Ergebnis (Regexp ist nunmal alles andere, nur keine Stärke meinerseits; ich arbeite dran).
                      Zuletzt geändert von frederic; 15.08.2007, 12:25.

                      Kommentar


                      • #41
                        Wie müsste das denn stattdessen lauten?
                        meinen vorschlag kannst du weiter oben nachlesen. ob jetzt anführungsstriche oder hochkommata escape-t werden müssen, musst du selbst entscheiden - je nach dem, wie du den string begrenzst.

                        Angenommen eine URL lautet demokratie.zip
                        angenommen du weißt, dass ein dateiname keine url ist. die frage finde ich unklar.

                        Kommentar


                        • #42
                          Es geht ja - leider - darum, dass ich einen Dateinamen und keine URL parsen möchte (wobei es auch "ordner/demokratie.zip" sein kann). Folgendes: Es gibt einen Editor des CMS, der leider interne URLs entfernt und stattdessen nur alles oberhalb der Adresse speichert. Gebe ich als URL z. B. "http://www.spiegel.de/xy.pdf" ein, macht er mir daraus allgemein ein "xy.pdf"! Daran kann ich nichts ändern. Da ich aber lediglich interne (!) Links überprüfen möchte (darum dreht sich hier alles), möchte ich auch nur entsprechende "URLs" parsen.

                          Kommentar


                          • #43
                            klären wir erst mal die erste frage. hast du es endlich hinbekommen?

                            Kommentar


                            • #44
                              Ja, das Thema ist soweit geklärt. Bis auf die Frage mit dem href-Tag, der deinen Angaben zufolge mit meinem Code einen "falschen" href-Tag nicht ausschließt.

                              Kommentar


                              • #45
                                zeig mal deinen ausdruck. (das "falsche" an dem vorschlag hat nichts mit dem href zu tun. aber du hast ja noch etwas zeit, darüber nachzudenken).

                                Kommentar

                                Lädt...
                                X