Frage zu regulärem Ausdruck

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Frage zu regulärem Ausdruck

    Hi,

    wie kann man erreichen, das nicht beide Wortgruppen gefunden werden, sondern nur die, die auch genau übereinstimmt. Es soll also nix gefunden werden, wenn nur "Haus" im Suchmuster steht, da ja im Satz "Haus & Hof" steht.

    PHP-Code:
    $satz "Das ist mein Haus & Hof";

    $p "Haus";
    $p "Haus & Hof";

    if (
    preg_match('/'.$p.'/'$satz)) usw... 

  • #2
    Hallo,

    das erreichst du (sofern ich deine recht vage Beschreibung richtig verstanden habe), indem du die Suchbegriffe in ein Array packst, mit usort der Länge nach absteigend sortierst und mit foreach durchiterierst. In der Schleife nimmst du den ersten Treffer und brichst sie mit break ab. Dann hast du den längsten möglichen Suchbegriff, falls es das ist, was du wolltest. Wenn nicht, bitte Beschreibung nachbessern und mit sinnvollerem Code illustrieren. Momentan überschreibst du dort die Variable $p, was so gar keinen Sinn ergibt.

    Gruß,

    Amica
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      Hi,

      die beiden Variablen hatte ich nur zur Veranschaulichung der beiden Sachverhalte hingeschrieben.

      Ich möchte , das mir preg_match nur true zurückliefert, wenn das Sucmuster "Haus & Hof" genau im Satz vorkommt. Ist das Suchmuster nur "Haus", dann soll false zurückommen, denn der Satz lautet "Das ist mein Haus & Hof" und nicht "Das ist mein Haus"

      Kommentar


      • #4
        Wenn im Suchmuster "Haus & Hof" drin steht, wird es auch nur bei "Haus & Hof" matchen und nicht bei "Haus" alleine. Wenn du aber nur nach "Haus" suchst, ist das dein Problem, denn das passt nun mal bei beiden. Kein Computer (auch kein Mensch) kann erkennen, dass "Haus & Hof" für dich als Einheit zusammengehört und nicht auf "Haus" passen soll.

        Worum geht es denn im Großen und Ganzen? Vielleicht kann ich dir dann einen Lösungsvorschlag bieten, denn momentan kann ich nur sagen: Dann such halt nach "Haus & Hof" und nicht nur nach "Haus", wenn du keins ohne Hof finden willst.
        [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
        Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
        Super, danke!
        [/COLOR]

        Kommentar


        • #5
          Deswegen hatte ich ja hier gefragt, weil ich diese Unterscheidung nicht hinbekommen habe, aber deine Erklärung is ja einleuchtend...

          Es geht um Tarifbezeichnungen: T-Mobile Call und T-Mobile Call & Surf, die unterschieden werden müssen.

          Die Zeichenkette ist jeweils der Tarifname und das Muster ist Call bzw. Call & Surf. Aber da es wohl nicht über den Ausdruck geht, werd ich mir wohl was anderes überlegen müssen.

          Kommentar


          • #6
            Aber das ist doch kein Problem...
            Prüf doch einfach ob da drin steht "call & surf". Wenn das zu trifft dann ist es true alles andere demnach false

            Kommentar


            • #7
              Zitat von boeserfrosch Beitrag anzeigen
              Aber das ist doch kein Problem...
              Prüf doch einfach ob da drin steht "call & surf". Wenn das zu trifft dann ist es true alles andere demnach false
              Genau, das ist das was ich meinte, als ich die absteigende Sortierung nach Länge vorgeschlagen hatte. Die längsten Treffer werden dabei zuerst probiert, also wird "call & surf" schon gefunden, bevor überhaupt nach "call" gesucht wird.
              [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
              Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
              Super, danke!
              [/COLOR]

              Kommentar


              • #8
                @AmicaNoctis,

                ich habe deinen ersten Beitrag vorhin nicht gleich so richtig verstanden, aber es klappt nun mittels der Sortierung. Sobald der Begriff gefunden wurde gehe ich aus der Schleife.

                Vielen Dank nochmal. Durch deine letzte Erklärung habe ich es dann geschnallt :-)

                Kommentar


                • #9
                  Zitat von lx-club Beitrag anzeigen
                  Hi,

                  wie kann man erreichen, das nicht beide Wortgruppen gefunden werden, sondern nur die, die auch genau übereinstimmt. Es soll also nix gefunden werden, wenn nur "Haus" im Suchmuster steht, da ja im Satz "Haus & Hof" steht.

                  PHP-Code:
                  $satz "Das ist mein Haus & Hof";

                  $p "Haus";
                  $p "Haus & Hof";

                  if (
                  preg_match('/'.$p.'/'$satz)) usw... 
                  Sortiere die Suchbegriffe nach ihrer Länge. Führe Alle Suchbegriffe im RegEx vom längsten zum kürzesten auf.
                  Preg_match() ist schlau genug, um abzubrechen, wenn das längstmögliche Suchmuster gefunden wurde.
                  In deinem Beispiel also:

                  PHP-Code:
                  preg_match('/(Haus & Hof|Haus)/'$satz); 
                  Als komplette Funktion:
                  PHP-Code:
                  function find_one_of_many(
                      
                  $needles/// array
                      
                  $haystack /// string
                  ) {
                      if (!
                  is_array($needles)) {
                          
                  $needles = (array) (string) $needles;
                      }
                      
                  // nach Laenge sortieren
                      
                  usort(
                          
                  $needles,
                          function(
                  $a$b) {return strlen($b) - strlen($a);}
                      );
                      
                  // daraus RegEx bauen
                      // ignore case: /(%s)/i
                      // UTF-8: /(%s)/u

                      
                  $pcre sprintf(
                          
                  '/(%s)/',
                          
                  implode(
                              
                  '|',
                              
                  array_map(
                                  function(
                  $i) {return preg_quote($i);},
                                  
                  $needles
                              
                  )
                          )
                      );

                      
                  // Suchen
                      
                  $found preg_match($pcre, (string) $haystack);
                      
                      return 
                  is_int($found) ? (bool) $found NULL;
                  }

                  // Anwendung
                  $satz 'Das ist mein Haus & Hof';
                  $p = array ('Haus',  'Haus & Hof''x''aus & h');
                  $found find_one_of_many($p$satz);

                  var_dump($found); 
                  Der Vorteil gegenüber deiner Schleifen-Lösung ist, dass mit einer winzigen Änderung Unterschiede in der Groß- und Kleinschreibung ignoriert werden können und UTF-8-Unterstützung möglich ist.
                  Zuletzt geändert von fireweasel; 30.04.2011, 13:08.
                  Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                  Kommentar

                  Lädt...
                  X