php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 25-04-2008, 23:55
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard Quellcode filtern (regex?)

Hallo,

ich hab da ein paar Probleme atm einen bestimmten Quelltext rauszufiltern..

Beispielcode sieht wie folgt aus: http://pastebin.ca/997688
Das result, was ich erhalten möchte darunter..

Hat da jmd eine Idee?
PHP-Code:
$pattern "#<tr>([^<]*)</tr>#is"// bzw. #isU (gar kein Ergebnis)
$pattern "#<tr>(.*)</tr>#is"//  bzw. #isU (das falsche) 
funktionieren nicht richtig.

Sowohl mit preg_match als auch mit ~_all bekomm ich nicht das richtige Ergebnis..

Bin im Moment recht ratlos
Problem ist auch, dass die mittleren <table> immer unterschiedliche anzahlen von <tr><td>*</td></tr> reihen haben .. sodass ich auch nicht abzählen kann ansich..

Jmd. ne Idee?

mfg
edit: pattern hervorgehoben, da eventuell übersehen..

Geändert von Blackgreetz (26-04-2008 um 00:25 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 26-04-2008, 00:16
medium22
 Registrierter Benutzer
Links : Onlinestatus : medium22 ist offline
Registriert seit: Mar 2006
Beiträge: 308
medium22 zeigte ein beschämendes Verhalten in der Vergangenheit
Standard

N'abend,


PHP-Code:
$pattern '&<tr>(.*)</tr>&is'
?


Gruss
Mit Zitat antworten
  #3 (permalink)  
Alt 26-04-2008, 00:23
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Wo ist der Unterschied zu

PHP-Code:
$pattern "#<tr>(.*)</tr>#is"
?
Bis auf die Delimiter ist ja nichts anders^^..

mfg
Mit Zitat antworten
  #4 (permalink)  
Alt 26-04-2008, 00:26
medium22
 Registrierter Benutzer
Links : Onlinestatus : medium22 ist offline
Registriert seit: Mar 2006
Beiträge: 308
medium22 zeigte ein beschämendes Verhalten in der Vergangenheit
Standard

Die Woche war lang, verzeig. <g>

Was ist denn das 'falsche' Ergebniss?
Mit Zitat antworten
  #5 (permalink)  
Alt 26-04-2008, 00:30
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hallo,

kein Problem.

Hier mal ausprobiert:

#isU: http://regexp-evaluator.de/evaluator...dcc0/#ergebnis

#is: http://regexp-evaluator.de/evaluator...54ce/#ergebnis

Wo es greedy ist, siehts fast richtig aus, allerdings ist in der Mitte noch der </tr><tr> , der das Ergebnis genau halbieren sollte ....

mfg
Mit Zitat antworten
  #6 (permalink)  
Alt 26-04-2008, 02:02
jmc
 PHP Junior
Links : Onlinestatus : jmc ist offline
Registriert seit: Mar 2006
Beiträge: 868
jmc befindet sich auf einem aufstrebenden Ast
Standard

Soviel ich weiss kannst du das nicht sehr gut mit preg_match lösen. Es gäbe eine Möglichkeit mit lookaheads und ä., aber das ist sehr aufwendig.

In deinem Fall wäre es am einfachsten einfach eine Schlaufe zu erzeugen, immer das nächste <tr zu suchen und dann eine Laufzahl jeweils um eins erhöhen. Gleichzeitig speicherst du den String bis wo du gekommen bist und Prüfst das nächste Vorkommen von </tr (auch mit stripos z.B.). Die Laufzahl wird bei einem gefundenen </tr immer um 1 gesenkt, also hast du den benötigten string sobald die Laufzahl wieder 0 also false ist. Dann musst du nur noch den String mit > ergänzen und die aktuelle Suchposition um eins erhöhen und dies fortsetzen bis du am Ende des Strings angelangt bist. Alle Treffer kannst in einem Array speichern und von der Funktion zurückgeben lassen.
Mit Zitat antworten
  #7 (permalink)  
Alt 26-04-2008, 02:05
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Original geschrieben von jmc
In deinem Fall wäre es am einfachsten einfach eine Schlaufe zu erzeugen, immer das nächste <tr zu suchen und dann eine Laufzahl jeweils um eins erhöhen. Gleichzeitig speicherst du den String bis wo du gekommen bist und Prüfst das nächste Vorkommen von </tr (auch mit stripos z.B.). Die Laufzahl wird bei einem gefundenen </tr immer um 1 gesenkt, also hast du den benötigten string sobald die Laufzahl wieder 0 also false ist. Dann musst du nur noch den String mit > ergänzen und die aktuelle Suchposition um eins erhöhen und dies fortsetzen bis du am Ende des Strings angelangt bist. Alle Treffer kannst in einem Array speichern und von der Funktion zurückgeben lassen.
Wäre natürlich eine Idee .. werd ich dann nach'm Schlafen mal umsetzen .. - Danke.
Allerdings die Frage, wie würdest du danach suchen?


mfg

Geändert von Blackgreetz (26-04-2008 um 02:08 Uhr)
Mit Zitat antworten
  #8 (permalink)  
Alt 26-04-2008, 02:15
jmc
 PHP Junior
Links : Onlinestatus : jmc ist offline
Registriert seit: Mar 2006
Beiträge: 868
jmc befindet sich auf einem aufstrebenden Ast
Standard

wonach suchen?
Mit Zitat antworten
  #9 (permalink)  
Alt 26-04-2008, 02:22
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
In deinem Fall wäre es am einfachsten einfach eine Schlaufe zu erzeugen, immer das nächste <tr zu suchen und dann eine Laufzahl jeweils um eins erhöhen.
Würde jetzt nur auf die doofe Idee kommen, dass 1. Vorkommen des trs zu suchen .... gucken ob vorher ein /tr vorkommt und jenachdem bis dahin abschneiden ... und dann weiter suchen..

Gibts da nicht ne elegantere Möglichkeit des Zählens bzw. des Suchens zum Zählen..

mfg
Mit Zitat antworten
  #10 (permalink)  
Alt 26-04-2008, 02:41
jmc
 PHP Junior
Links : Onlinestatus : jmc ist offline
Registriert seit: Mar 2006
Beiträge: 868
jmc befindet sich auf einem aufstrebenden Ast
Standard

stripos gibt dir z.B. den Ort des vorkommens zurück:

PHP-Code:
function outer_tags($str$tag){
 if(
stripos ($str"</" $tag$pos) === false){
  return Array();
 }
 
$arr = Array();
 
$pos 0;
 
$count = -1;
 
$start = -1;
 while(
stripos ($str"</" $tag$pos) !== false){
  if(
$start == -1){
   
$start stripos($str"<" $tag$pos);
   
$pos $start 1;
   
$count 1;
   continue;
  }
  if(
stripos($str"<" $tag$pos) < stripos ($str"</" $tag$pos)){
   
$pos stripos ($str"<" $tag$pos) + 1;
   
$count++;
  }else{
   
$pos stripos ($str"<" $tag$pos) + 1;
   
$count--;
  }
  if(!
$count){
   
$arr[] = Array($start$pos strlen($tag) + 2);
   
$start = -1;
   
$count = -1;
  }
 }
 return 
$arr;

habs nicht getestet, da direkt im Forum geschrieben und ist sehr schlecht optimiert, aber habe momentan keine Zeit noch etwas besseres zu schreiben, vieleicht morgen, falls das Problem noch nicht gelöst ist.
Die Funktion gibt einen Array mit allen gefundenen Start- und Endpositionen zurück, die du dann z.B. mit substr aus dem String rausnehmen kannst.

Gruss

JMC
Mit Zitat antworten
  #11 (permalink)  
Alt 26-04-2008, 04:17
3DMax
 PHP Senior
Links : Onlinestatus : 3DMax ist offline
Registriert seit: Jan 2004
Beiträge: 1.916
3DMax ist zur Zeit noch ein unbeschriebenes Blatt
Standard

mein ansatz bei solch geschachtelten strukturen wäre DOM XML
Mit Zitat antworten
  #12 (permalink)  
Alt 26-04-2008, 16:09
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hallo,

@3DMax: Danke, guck ich mir mal an

@jmc: Genau das meinte ich ja im Post über deiner aw, aber danke fürs Script..

Ich habs gleich mal genutzt (noch etwas modifiziert bzw. korrigiert):
PHP-Code:
<form action="" method="post">
<textarea name="text" rows="3" cols="100"><?php echo $_POST['text'];?>
</textarea><input type="submit" name="submit" value="submit"
</form>
<?php
   
function outerTags($str$tag){
      if(
stripos ($str"</" $tag$pos) === false){
         return Array();
      }else{
         
$arr = Array();
         
$pos 0;
         
$count = -1;
         
$start = -1;
         while(
stripos ($str"</" $tag$pos) !== false){
            if(
$start == -1){
               
$start stripos($str"<" $tag$pos);
               
$pos $start 1;
               echo 
"Start: ".$pos."<br>";
               
$count 1;
               continue;
            }
            if(
stripos($str"<" $tag$pos) < stripos ($str"</" $tag$pos)){
               
$pos stripos ($str"<" $tag$pos) + 1;
               echo 
"#Found: ".$pos."<br>";
               
$count++;
            }else{
               
$pos stripos ($str"</" $tag$pos) + 1;
               echo 
"##Found: ".$pos."<br>";
               
$count--;
            }
            if(!
$count){
               
$arr[] = Array($start$pos strlen($tag) + 2);
               
$start = -1;
               
$count = -1;
               echo 
"<p>Ende</p>";
            }
         }
         return 
$arr;
      }
   }

   if(isset(
$_POST['submit'])){

    
$blubbl outerTags($_POST['text'],'tr');
    
print_r($blubbl);

   }

?>
So.. nun hab ich es getestet mit:
Code:
<table><tr><td><table><tr><td></td></tr><tr><td></td></tr><tr><td>
</td></tr><tr><td></td></tr></table></td></tr>
<tr><td><table><tr><td></td></tr><tr><td></td></tr><tr><td></td>
</tr><tr><td></td></tr></table></td></tr></table>
(Zeilenumbrüche müsste man natürlich alle entfernen)..

Wenn ich das Script so mache, bekomm ich nie ein Ende (deshalb die Testausgaben):

Code:
Start: 8
#Found: 23
##Found: 36
#Found: 41
##Found: 54
#Found: 59
##Found: 72
#Found: 77
##Found: 90
##Found: 108

Ende
Start: 113
#Found: 128
##Found: 141
#Found: 146
##Found: 159
#Found: 164
##Found: 177
#Found: 182
#Found: 1
#Found: 8
#Found: 23
Wie man sieht, bricht er nach Zeichen 182 irgendwie ab, bzw. findet nichts mehr und fängt wieder vorne an..
Was nun aber komisch ist, dass die ganze Tabellenkette 225 Zeichen lang ist. D.h. er "bricht" mitten im 2. gesuchten tr-inhalt ab ... Obwohl danach natürlich noch </tr> und noch weitere <tr> kommen..

Konnte man das verstehen ? Wenn ja, weiß jmd woran es liegt? Ich finde es sehr komisch...

mfg
Mit Zitat antworten
  #13 (permalink)  
Alt 26-04-2008, 19:15
jmc
 PHP Junior
Links : Onlinestatus : jmc ist offline
Registriert seit: Mar 2006
Beiträge: 868
jmc befindet sich auf einem aufstrebenden Ast
Standard

Ist mein Fehler... und ich war schon müde... durch die Addition von 1 , die nötig ist um das nächste Vorkommen zu erhalten verhinderte dauerhaft ein Abbruch der Schleife, da $pos immer wieder auf 1 gesetzt (false + 1) wurde.
Habs jetzt kurz noch etwas verbessert und diesmal auch getestet:

PHP-Code:
function outer_tags($str$tag){
 
$arr = Array();
 
$pos 0;
 
$start = -1;
 while((
$n stripos($str"</" $tag$pos)) !== false){
  
$f stripos($str"<" $tag$pos);
  if(
$start == -&& $f !== false){
   
$start $f;
   
$pos $f 1;
   
$count 1;
   continue;
  }
  if(
$f !== false && $f $n){
   
$pos $f 1;
   
$count++;
  }else{
   
$pos $n 1;
   
$count--;
   if(!
$count){
    
$arr[] = Array($startstrpos($str">"$pos) +1);
    
$start = -1;
   }
  }
 }
 return 
$arr;
}

/***** Ausgabe *****
Array
(
    [0] => Array
        (
            [0] => 7
            [1] => 113
        )

    [1] => Array
        (
            [0] => 114
            [1] => 220
        )
)
*/



function outer_tags($str$tag){
 
$arr = Array();
 
$pos 0;
 
$start = -1;
 while((
$n stripos($str"</" $tag$pos)) !== false){
  
$f stripos($str"<" $tag$pos);
  if(
$start == -&& $f !== false){
   
$start $f;
   
$pos $f 1;
   
$count 1;
   continue;
  }
  if(
$f !== false && $f $n){
   
$pos $f 1;
   
$count++;
  }else{
   
$pos $n 1;
   
$count--;
   if(!
$count){
    
$arr[] = "\"".substr($str$start,  strpos($str">"$pos) +$start)."\"";
    
$start = -1;
   }
  }
 }
 return 
$arr;
}

/***** Ausgabe *****
Array
(
    [0] => "<tr><td><table><tr><td></td></tr><tr><td></td></tr><tr><td>
</td></tr><tr><td></td></tr></table></td></tr>"
    [1] => "<tr><td><table><tr><td></td></tr><tr><td></td></tr><tr><td></td>
</tr><tr><td></td></tr></table></td></tr>"
)
*/ 
Sollte also nun zu 99% funktionieren. Die erste Variante ist bei grossen Texten um einiges sparsamer als die zweite und zusätzlich hast du da noch die Positionen falls du diese irgendwie mal brauchs
Mit Zitat antworten
  #14 (permalink)  
Alt 28-04-2008, 20:07
Blackgreetz
 PHP Junior
Links : Onlinestatus : Blackgreetz ist offline
Registriert seit: Oct 2005
Beiträge: 901
Blackgreetz ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Ich bedanke mich für das Script jmc
Funkt wunderbar (1. Version mit den Zahlen)..

allerdings muss ich nochmal nachfragen:
Zitat:
Ist mein Fehler... und ich war schon müde... durch die Addition von 1 , die nötig ist um das nächste Vorkommen zu erhalten verhinderte dauerhaft ein Abbruch der Schleife, da $pos immer wieder auf 1 gesetzt (false + 1) wurde.
Wo wird es auf false + 1 gesetzt ? Ich hab mir das Script angeguckt, aber irgendwie komm ich nicht drauf. Vlt sind meine Gedanken durch das permanente draufstarren (bevor ich fragte) schon so steif, dass ich es nicht sehe ^^..

mfg
Mit Zitat antworten
  #15 (permalink)  
Alt 28-04-2008, 21:46
jmc
 PHP Junior
Links : Onlinestatus : jmc ist offline
Registriert seit: Mar 2006
Beiträge: 868
jmc befindet sich auf einem aufstrebenden Ast
Standard

bei stipos + 1, wenn stripos === false dann gibts 1 aus. Kannst du ja mal mit der alten Version versuchen. deswegen beginnt die Schlaufe immer wieder bei $pos = 1 also stoppt sie nie und es wird ein riesiges Array erstellt bis der Speicher erschöpft ist.

Die 2. Version geht doch aber auch? o.O
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:05 Uhr.