php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 03-12-2008, 21:27
mgutt
 Registrierter Benutzer
Links : Onlinestatus : mgutt ist offline
Registriert seit: May 2006
Beiträge: 73
mgutt ist zur Zeit noch ein unbeschriebenes Blatt
Standard preg_match ist Greedy, obwohl der Syntax Ungreedy ist

Hi,

ich habe ein Problem mit diesem Syntax:
PHP-Code:
    if (preg_match('#<a(.*?href=("|\')' $www '[/ ]?("|\').*?)>.*?</a>#is'$content$matches)) { 
das gleiche hier:
PHP-Code:
    if (preg_match('#<a(.*href=("|\')' $www '[/ ]?("|\').*)>.*</a>#Uis'$content$matches)) { 
Und zwar sucht er sich den ersten <a und geht dann solange weiter bis der $www gefunden wurde.

Das passiert aber komischerweise nur, wenn im $content erst ein <a href=" kommt und dann der eigentliche $www mit a href=' verlinkt wurde.

Hier der vollständige Test-Code:
PHP-Code:
$content '<a href="/">Logo</a>
Content<br />
<a href=\'http://domain.de\'>Link</a>
Footer<br />'
;
$website 'http://domain.de';

$www str_replace('.''\.'$website);
$matches = array();
if (
preg_match('#<a(.*?href=("|\')' $www '[/ ]?("|\').*?)>.*?</a>#is'$content$matches)) {
        
print_r($matches);

Ausgabe $matches:
PHP-Code:
Array
(
    [
0] => <a href="/">Logo</a>
Content<br />
<
a href='http://domain.de'>Link</a>
    [
1] =>  href="/">Logo</a>
Content<br />
<
a href='http://domain.de'
    
[2] => '
    [3] => '

Ich habe doch extra ungreedy zwischen <a und href= angegeben, also warum verhält er sich trotzdem greedy?

EDIT:
Auch diese Variante gibt $matches[1] wie zuvor aus:
PHP-Code:
if (preg_match("#<a(.*href='" $www "[/ ]?'.*)>.*</a>#Uis"$content$matches)) { 

Geändert von mgutt (03-12-2008 um 21:37 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 03-12-2008, 21:42
TBT
  Moderator
Links : Onlinestatus : TBT ist offline
Registriert seit: Sep 2002
Ort: Berlin
Beiträge: 2.787
TBT befindet sich auf einem aufstrebenden Ast
TBT eine Nachricht über ICQ schicken TBT eine Nachricht über AIM schicken TBT eine Nachricht über Yahoo! schicken
Standard

nach dem <a nicht mit .* weitermachen sondern mit [^<]*
__________________
TBT

Die zwei wichtigsten Regeln für eine berufliche Karriere:
1. Verrate niemals alles was du weißt!


PHP 2 AllPatrizier II Browsergame
Mit Zitat antworten
  #3 (permalink)  
Alt 03-12-2008, 21:43
mgutt
 Registrierter Benutzer
Links : Onlinestatus : mgutt ist offline
Registriert seit: May 2006
Beiträge: 73
mgutt ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Gut ist eine Lösung (erstmal danke soweit), aber ich verstehe nicht warum mein Syntax Greedy ist?
Mit Zitat antworten
  #4 (permalink)  
Alt 03-12-2008, 22:39
TBT
  Moderator
Links : Onlinestatus : TBT ist offline
Registriert seit: Sep 2002
Ort: Berlin
Beiträge: 2.787
TBT befindet sich auf einem aufstrebenden Ast
TBT eine Nachricht über ICQ schicken TBT eine Nachricht über AIM schicken TBT eine Nachricht über Yahoo! schicken
Standard

weil beim ersten <a anfängt, was er findet, ab denn ist der Ausdruck ungreedy.
Ungreedy bedeutet nicht, das er den Anfang auch weit möglichst nach hinten schiebt, sondern nur, dass er den Ausdruck frühest möglich beendet.
__________________
TBT

Die zwei wichtigsten Regeln für eine berufliche Karriere:
1. Verrate niemals alles was du weißt!


PHP 2 AllPatrizier II Browsergame
Mit Zitat antworten
  #5 (permalink)  
Alt 03-12-2008, 23:15
mgutt
 Registrierter Benutzer
Links : Onlinestatus : mgutt ist offline
Registriert seit: May 2006
Beiträge: 73
mgutt ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Ok, geht also nur vorwärts nicht rückwärts. Wieder was gelernt. Das erklärt dann auch warum ich den NOT-Part nur am Anfang setzen muss.

Nochmals Danke!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 23:54 Uhr.