php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 3 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 18-10-2012, 15:01
none
 Registrierter Benutzer
Links : Onlinestatus : none ist offline
Registriert seit: Apr 2006
Beiträge: 68
none ist zur Zeit noch ein unbeschriebenes Blatt
Standard PHP <Body> auslesen, und JS entfernen

Hallo,

ich habe ein kleines Problem. Ich erstelle ein Analyse Script welches mir den Body Parsen soll, leider klappt das nicht so richtig.

Die Suche sieht so aus (für pref_replace)

PHP-Code:
$suche "%(<[ ]*\?.*\?[ ]*>)|(<[ ]*script[ ]*(.*)>.*<[ ]*/[ ]*script[ ]*>)%siU"
Ich bekomme auch alles raus, außer inline Javascripte und den von Google (analytics). Fehlermeldungen bekomme ich leider keine.
Ein Beispiel für inline wäre:
HTML-Code:
$(document).ready(function() {
und der Google Analytics Code sieht so aus

HTML-Code:
<script type="text/javascript">

  var _gaq = _gaq || [];
  _gaq.push(['_setAccount', 'UA-XXXXXX-X']);
  _gaq.push(['_trackPageview']);

  (function() {
    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
  })();

</script>
Vielleicht hat jemand einen Tipp für mich?

Danke !
Mit Zitat antworten
  #2 (permalink)  
Alt 18-10-2012, 15:37
Benutzerbild von ApoY2k ApoY2k
 Registrierter Benutzer
Links : Onlinestatus : ApoY2k ist offline
Registriert seit: Nov 2006
Beiträge: 359
ApoY2k befindet sich auf einem aufstrebenden Ast
ApoY2k eine Nachricht über ICQ schicken ApoY2k eine Nachricht über Skype™ schicken
Standard

Du willst den body parsen, warum suchst du dann nicht einfach nach <body> und </body>?
__________________
This is what happens when an unstoppable force meets an immovable object.
Mit Zitat antworten
  #3 (permalink)  
Alt 18-10-2012, 15:55
none
 Registrierter Benutzer
Links : Onlinestatus : none ist offline
Registriert seit: Apr 2006
Beiträge: 68
none ist zur Zeit noch ein unbeschriebenes Blatt
Standard Sorry

Falsch ausgedrückt. Ich will nur den reinen Text ohne b's oder strongs oder javascript "anzeigen".


Gruß und danke
Mit Zitat antworten
  #4 (permalink)  
Alt 18-10-2012, 16:38
ezkimo
 Registrierter Benutzer
Links : Onlinestatus : ezkimo ist offline
Registriert seit: Apr 2005
Ort: Beckum / Westf.
Beiträge: 279
ezkimo befindet sich auf einem aufstrebenden Ast
ezkimo eine Nachricht über ICQ schicken
Standard

Wieso wendest Du nicht die DOM Objekte von PHP an, die genau für Dein Anliegen entwickelt wurden? Auf jeden Fall kannst Du so auch nur den Text filtern.
__________________
MM Newmedia | MeinBlog
Mit Zitat antworten
  #5 (permalink)  
Alt 18-10-2012, 18:09
none
 Registrierter Benutzer
Links : Onlinestatus : none ist offline
Registriert seit: Apr 2006
Beiträge: 68
none ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hallo ezkimo,

danke für den Hinweis, hatte ich aber auch schon probiert (leider ohne erfolg) der hat auch den script Bereich im Body nicht erkannt. Also die Scripte an sich bekomm ich hin, nur nicht die scripte

HTML-Code:
$html = new DOMDocument();
$html->loadHtml($html_content);
$xpath = new DOMXPath($html);

$nodebody = $xpath->query('//body');
$scriptes = $xpath->query('//script');
Gruß
Mit Zitat antworten
  #6 (permalink)  
Alt 19-10-2012, 08:31
Benutzerbild von ApoY2k ApoY2k
 Registrierter Benutzer
Links : Onlinestatus : ApoY2k ist offline
Registriert seit: Nov 2006
Beiträge: 359
ApoY2k befindet sich auf einem aufstrebenden Ast
ApoY2k eine Nachricht über ICQ schicken ApoY2k eine Nachricht über Skype™ schicken
Standard

Poste mal bitte irgendwelche Testdaten, mir kommt das spanisch vor. Zeig mal, was du parsen willst und danach bitte auch, was du als Ergebnis erwartest.
__________________
This is what happens when an unstoppable force meets an immovable object.
Mit Zitat antworten
  #7 (permalink)  
Alt 19-10-2012, 10:01
ezkimo
 Registrierter Benutzer
Links : Onlinestatus : ezkimo ist offline
Registriert seit: Apr 2005
Ort: Beckum / Westf.
Beiträge: 279
ezkimo befindet sich auf einem aufstrebenden Ast
ezkimo eine Nachricht über ICQ schicken
Standard

Also ich habe es gerade mal mit dem oben bereitgestellten Javascript probiert. Läuft problemlos.

Ausgangslage:
PHP-Code:
$str = <<<XML
<script type="text/javascript">

  var _gaq = _gaq || [];
  _gaq.push(['_setAccount', 'UA-XXXXXX-X']);
  _gaq.push(['_trackPageview']);

  (function() {
    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
  })();

</script>
XML; 
Fallbeispiel 1:
PHP-Code:
$doc = new DomDocument();
$doc->loadHTML($str);

$elements $doc->getElementsByTagName('script');
for (
$i 0$i $elements->length$i++) {
    echo 
"<pre>";
    
var_dump($elements->item($i)->nodeValue);
    echo 
"</pre>";

Ganz normales Suchen mittels getElementsByTagName();

Fallbeispiel 2:
PHP-Code:
$xpath = new DOMXPath($doc);
$scripts $xpath->query('//script');

for (
$i 0$i $scripts->length$i++) {
    echo 
"<pre>";
    
var_dump($scripts->item($i)->nodeValue);
    echo 
"</pre>";

Beide Fallbeispiele liefern den Inhalt der Script Tags. Jetzt kommt es eigentlich nur drauf an, wie Dein konkretes Beispiel aussieht, an dem diese beiden Herangehensweisen nicht funktionieren.
__________________
MM Newmedia | MeinBlog
Mit Zitat antworten
  #8 (permalink)  
Alt 22-10-2012, 20:08
none
 Registrierter Benutzer
Links : Onlinestatus : none ist offline
Registriert seit: Apr 2006
Beiträge: 68
none ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hallo,

also mit deinem Fallbeispiel 1 werden tatsächlich (soweit ich das beurteilen kann) alle JS aus dem Body gefunden.
Bei mir sieht es jetzt so aus:

PHP-Code:
$doc = new DomDocument();
$doc->loadHTML($this->content->html);

$elements $doc->getElementsByTagName('script');
for (
$i 0$i $elements->length$i++) {
    echo 
"<pre>";
    
var_dump($elements->item($i)->nodeValue);
    echo 
"</pre>";

Nur wie kann ich jetzt den ermittelten Code aus dem html Code extrahieren.

Ich hatte die Idee $elements->item($i)->nodeValue in einem Array zu speichern und dann mit replace die Daten aus dem HTML Code zu ersetzen. Leider bekomme ich da immer einen Fehler 500 ..

Ich habe auch hier im Forum mehrere Ansätze gesehen mit removeChild die aber irgendwie bei mir nicht hinhauen.

Hättest du da eventuell noch einen Tipp für mich ?

Vielen Dank aber schon einmal für deine Hilfe!
Mit Zitat antworten
  #9 (permalink)  
Alt 23-10-2012, 09:02
ezkimo
 Registrierter Benutzer
Links : Onlinestatus : ezkimo ist offline
Registriert seit: Apr 2005
Ort: Beckum / Westf.
Beiträge: 279
ezkimo befindet sich auf einem aufstrebenden Ast
ezkimo eine Nachricht über ICQ schicken
Standard

Ich habe gerade noch mal getestet, ob die Inhalte in der for-Schleife manipuliert werden können. Das funktioniert problemlos, indem Du dem Du der Eigenschaft nodeValue einfach einen anderen Wert zuweist. Schau Dir bitte in diesem Zusammenhang auch die DomDocument::saveXML() und DomDocument::saveHTML() Methoden an. Ich glaube nämlich, dass Du das DomDocument Objekt von PHP noch nicht richtig verstanden hast. Wenn Du weitere Probleme haben solltest, schreibe bitte immer Deinen Lösungsansatz als Codebeispiel dabei.
__________________
MM Newmedia | MeinBlog
Mit Zitat antworten
  #10 (permalink)  
Alt 24-10-2012, 02:45
derphpprofie
 Registrierter Benutzer
Links : Onlinestatus : derphpprofie ist offline
Registriert seit: Oct 2012
Beiträge: 9
derphpprofie befindet sich auf einem aufstrebenden Ast
Standard

Schreibe alles was du über echo ausgibst in eine Variable, dann kannst du die Variable später ausgeben mit echo und z.B. in einem Textarea.

Beispiel:
$aus .= '<body><h1>';
...
$aus .= '</body></html>';

echo $aus;

echo "<textarea name='DOM String' class='myfirst' rows='12' cols='60' wrap='virtual' id='TEXTAREA1'>$aus</textarea>";

unset($aus);
Mit Zitat antworten
  #11 (permalink)  
Alt 26-10-2012, 09:22
none
 Registrierter Benutzer
Links : Onlinestatus : none ist offline
Registriert seit: Apr 2006
Beiträge: 68
none ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Hallo,

ich wollte mich nur schnell bedanken, die Tipps waren wirklich sehr hilfreich. Mit DOM konnte ich das mehr oder minder Problemlos auslesen
Mit Zitat antworten
  #12 (permalink)  
Alt 26-10-2012, 17:54
derphpprofie
 Registrierter Benutzer
Links : Onlinestatus : derphpprofie ist offline
Registriert seit: Oct 2012
Beiträge: 9
derphpprofie befindet sich auf einem aufstrebenden Ast
Standard

Du hast meist diese Tags selbst Geschrieben und Definiert, nur bei größeren Projekten die Dynamisch sind ist ein Tool namens DOM Inspektor sehr Hilfreich.

Zitat:
Zitat von none Beitrag anzeigen
Hallo,

ich wollte mich nur schnell bedanken, die Tipps waren wirklich sehr hilfreich. Mit DOM konnte ich das mehr oder minder Problemlos auslesen
__________________
php = play home page
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
body, javascript, javascript filter, löschen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[REGEX] Inhalt zwischen <body> und </body> Tiger_XT PHP Developer Forum 2 23-03-2007 14:32
<body... </body> auslesen starsk8er PHP Developer Forum 2 03-08-2006 16:30
PHP-Code zwischen </head> und <body>? Boneman PHP Developer Forum 12 03-09-2005 19:53
txt auslesen und kommas entfernen nero25 PHP Developer Forum 9 02-08-2005 09:51
HTML innerhalb von <body></body> auslesen chrisonline PHP Developer Forum 4 21-09-2002 15:41

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:41 Uhr.