php-resource




Archiv verlassen und diese Seite im Standarddesign anzeigen :
Frage zu regulärem Ausdruck


 
lx-club
28-04-2011, 19:01 
 
Hi,

wie kann man erreichen, das nicht beide Wortgruppen gefunden werden, sondern nur die, die auch genau übereinstimmt. Es soll also nix gefunden werden, wenn nur "Haus" im Suchmuster steht, da ja im Satz "Haus & Hof" steht.


$satz = "Das ist mein Haus & Hof";

$p = "Haus";
$p = "Haus & Hof";

if (preg_match('/'.$p.'/', $satz)) usw...

 
AmicaNoctis
28-04-2011, 19:16 
 
Hallo,

das erreichst du (sofern ich deine recht vage Beschreibung richtig verstanden habe), indem du die Suchbegriffe in ein Array packst, mit usort der Länge nach absteigend sortierst und mit foreach durchiterierst. In der Schleife nimmst du den ersten Treffer und brichst sie mit break ab. Dann hast du den längsten möglichen Suchbegriff, falls es das ist, was du wolltest. Wenn nicht, bitte Beschreibung nachbessern und mit sinnvollerem Code illustrieren. Momentan überschreibst du dort die Variable $p, was so gar keinen Sinn ergibt.

Gruß,

Amica

 
lx-club
28-04-2011, 20:17 
 
Hi,

die beiden Variablen hatte ich nur zur Veranschaulichung der beiden Sachverhalte hingeschrieben.

Ich möchte , das mir preg_match nur true zurückliefert, wenn das Sucmuster "Haus & Hof" genau im Satz vorkommt. Ist das Suchmuster nur "Haus", dann soll false zurückommen, denn der Satz lautet "Das ist mein Haus & Hof" und nicht "Das ist mein Haus"

 
AmicaNoctis
28-04-2011, 20:29 
 
Wenn im Suchmuster "Haus & Hof" drin steht, wird es auch nur bei "Haus & Hof" matchen und nicht bei "Haus" alleine. Wenn du aber nur nach "Haus" suchst, ist das dein Problem, denn das passt nun mal bei beiden. Kein Computer (auch kein Mensch) kann erkennen, dass "Haus & Hof" für dich als Einheit zusammengehört und nicht auf "Haus" passen soll.

Worum geht es denn im Großen und Ganzen? Vielleicht kann ich dir dann einen Lösungsvorschlag bieten, denn momentan kann ich nur sagen: Dann such halt nach "Haus & Hof" und nicht nur nach "Haus", wenn du keins ohne Hof finden willst.

 
lx-club
28-04-2011, 20:45 
 
Deswegen hatte ich ja hier gefragt, weil ich diese Unterscheidung nicht hinbekommen habe, aber deine Erklärung is ja einleuchtend...

Es geht um Tarifbezeichnungen: T-Mobile Call und T-Mobile Call & Surf, die unterschieden werden müssen.

Die Zeichenkette ist jeweils der Tarifname und das Muster ist Call bzw. Call & Surf. Aber da es wohl nicht über den Ausdruck geht, werd ich mir wohl was anderes überlegen müssen.

 
boeserfrosch
28-04-2011, 21:59 
 
Aber das ist doch kein Problem...
Prüf doch einfach ob da drin steht "call & surf". Wenn das zu trifft dann ist es true alles andere demnach false

 
AmicaNoctis
28-04-2011, 22:05 
 
Aber das ist doch kein Problem...
Prüf doch einfach ob da drin steht "call & surf". Wenn das zu trifft dann ist es true alles andere demnach false

Genau, das ist das was ich meinte, als ich die absteigende Sortierung nach Länge vorgeschlagen hatte. Die längsten Treffer werden dabei zuerst probiert, also wird "call & surf" schon gefunden, bevor überhaupt nach "call" gesucht wird.

 
lx-club
28-04-2011, 22:19 
 
@AmicaNoctis,

ich habe deinen ersten Beitrag vorhin nicht gleich so richtig verstanden, aber es klappt nun mittels der Sortierung. Sobald der Begriff gefunden wurde gehe ich aus der Schleife.

Vielen Dank nochmal. Durch deine letzte Erklärung habe ich es dann geschnallt :-)

 
fireweasel
30-04-2011, 13:00 
 
Hi,

wie kann man erreichen, das nicht beide Wortgruppen gefunden werden, sondern nur die, die auch genau übereinstimmt. Es soll also nix gefunden werden, wenn nur "Haus" im Suchmuster steht, da ja im Satz "Haus & Hof" steht.


$satz = "Das ist mein Haus & Hof";

$p = "Haus";
$p = "Haus & Hof";

if (preg_match('/'.$p.'/', $satz)) usw...


Sortiere die Suchbegriffe nach ihrer Länge. Führe Alle Suchbegriffe im RegEx vom längsten zum kürzesten auf.
Preg_match() ist schlau genug, um abzubrechen, wenn das längstmögliche Suchmuster gefunden wurde.
In deinem Beispiel also:


preg_match('/(Haus & Hof|Haus)/', $satz);


Als komplette Funktion:

function find_one_of_many(
$needles, /// array
$haystack /// string
) {
if (!is_array($needles)) {
$needles = (array) (string) $needles;
}
// nach Laenge sortieren
usort(
$needles,
function($a, $b) {return strlen($b) - strlen($a);}
);
// daraus RegEx bauen
// ignore case: /(%s)/i
// UTF-8: /(%s)/u

$pcre = sprintf(
'/(%s)/',
implode(
'|',
array_map(
function($i) {return preg_quote($i);},
$needles
)
)
);

// Suchen
$found = preg_match($pcre, (string) $haystack);

return is_int($found) ? (bool) $found : NULL;
}

// Anwendung
$satz = 'Das ist mein Haus & Hof';
$p = array ('Haus', 'Haus & Hof', 'x', 'aus & h');
$found = find_one_of_many($p, $satz);

var_dump($found);


Der Vorteil gegenüber deiner Schleifen-Lösung ist, dass mit einer winzigen Änderung Unterschiede in der Groß- und Kleinschreibung ignoriert werden können und UTF-8-Unterstützung möglich ist.

- -

Alle Zeitangaben in WEZ +2. Es ist jetzt 03:26 Uhr.