brauche Webseite ideal für Vereine und Firmen
- Ad -
php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Post your PHP questions here!

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 1 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 17-06-2010, 21:12
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard Regex - JS Script entfernen

Hallo Gemeinde,

ich möchte aus einer HTML Datei den kompletten JavaScript entfernen.

Dazu benutze ich

PHP-Code:
    preg_match_all("%<script[^>]*?>.*?</script>%msi"$result$matches1,PREG_SET_ORDER);
    echo 
"<pre>";
    foreach (
$matches1 as $match){
        
print_r($match);
    } 
um alle JS Sourcen zu finden....

Leider findet er folgende JS Code nicht - den ich gerne entfernen würde.
Der ist ziemlich verzwickt - daher hab ich den mal komplett reingehängt.

Warum krieg ich den oben nicht mit der Regex ?
Vielleicht kann ja einer helfen ?

Gruß Tom

Die Datei ist im Anhang

HTML-Code:
<script type="text/javascript">
		  <! CDATA  */window.BF_BUILD="Mon Jun 14 11:03:55 2010";if(!window.
LOADED){window.BF_BEFORE=new Date().getTime();
 
 * jQuery JavaScript Library v1.3.2
 * http: jquery.com/
 *
 * Copyright (c) 2009 John Resig
 * Dual licensed under the MIT and GPL licenses.
 * http: docs.jquery.com/License
 *
 * Date: 2009-02-19 17:34:21 -0500 (Thu, 19 Feb 2009)
 * Revision: 6246
 */
(function(){var q=this,j,E=q.jQuery,u=q.$,t=q.jQuery=q.$=function(K,L){return new ......

		})()    > */
		</script>
Angehängte Dateien
Dateityp: txt jsdatei.txt (122,4 KB, 38x aufgerufen)
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.

Geändert von JR-EWING (17-06-2010 um 23:10 Uhr)
Mit Zitat antworten
  #2 (permalink)  
Alt 17-06-2010, 22:00
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

da das dazwischen doch etwas lang ist, vermute ich einfach, dass da ein internes Limit überschritten wird.

Ich würde es mal über DOM versuchen.

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 17-06-2010, 22:03
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.308
Kropff befindet sich auf einem aufstrebenden Ast
Standard

das hier funktioniert:
PHP-Code:
<?php
  $str 
'<script type="text/javascript">
          <! CDATA  */window.BF_BUILD="Mon Jun 14 11:03:55 2010";
if(!window.LOADED){window.BF_BEFORE=new Date().getTime();
 
 * jQuery JavaScript Library v1.3.2
 * http: jquery.com/
 *
 * Copyright (c) 2009 John Resig
 * Dual licensed under the MIT and GPL licenses.
 * http: docs.jquery.com/License
 *
 * Date: 2009-02-19 17:34:21 -0500 (Thu, 19 Feb 2009)
 * Revision: 6246
 */
(function(){var q=this,j,E=q.jQuery,u=q.$,t=q.jQuery=q.$=function(K,L){return new ......

        })()    > */
        </script>'
;
  
$str preg_replace('/<script[^>]*>.*?<\/script>/msi'''$str);
  
print_r($str);
?>
Kannst du auch mit
PHP-Code:
$str preg_match_all('/<script[^>]*>.*?<\/script>/msi'$str $hit);
print_r($hit); 
machen. Tipp. Quelltext ansehen! Der JavaScript-Code wird im Browser nicht angezeigt.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #4 (permalink)  
Alt 17-06-2010, 23:28
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard

hm es scheint wirklich irgendwo ein Limit Problem zu sein.
Hab gerade oben die Snippets ausprobiert und bekomme das gleich Ergebnis. Wenn ich den String kürze klappt es

hm will das ungern mit DOM lösen - da müsste ich die ganze Klasse umschreiben
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.
Mit Zitat antworten
  #5 (permalink)  
Alt 17-06-2010, 23:32
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von JR-EWING Beitrag anzeigen
da müsste ich die ganze Klasse umschreiben
So schlimm kann das doch nicht sein, ca. 10 Zeilen. Wenn du es nicht machen willst, ist es auf jeden Fall schwierig, dir weiterzuhelfen.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #6 (permalink)  
Alt 18-06-2010, 08:54
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.481
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Auch wenn es dieses ominöse Limit nicht gäbe, wäre dein Regex gefährlich ungenau. Im zu entfernenden JS-Code könnte nämlich </script> z.B. als String oder in einem Kommentar vorkommen. Deswegen kannst du nicht ungreedy suchen. Greedy geht auch nicht, weil dann alles vom ersten bis zum letzten script-Tag entfernt werden würde, inklusive HTML dazwischen. Folglich müsstest du ungreedy suchen, aber dafür sorgen, dass "</script>" nur als Tag gematcht wird, aber nicht als String oder Kommentar in JS. Das ist ziemlich komplex. DOM ist dagegen deutlich einfacher.
Mit Zitat antworten
  #7 (permalink)  
Alt 18-06-2010, 12:42
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard

Hab es jetzt mal mit DOM versucht.

PHP-Code:
 $doc = new DOMDocument();
 
$doc->loadHTML($result);
 
$scripts $doc->getElementsByTagName('script');
 
print_r($scripts); 
das spuckt mir ein Haufen Fehler aus bei LoadHTML.

htmlParseEntityRef: expecting ';'

Tags mit Script werden anscheinend garnicht gefunden.
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.
Mit Zitat antworten
  #8 (permalink)  
Alt 18-06-2010, 13:09
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von JR-EWING Beitrag anzeigen
das spuckt mir ein Haufen Fehler aus bei LoadHTML.
PHP-Code:
    // ...
    
libxml_use_internal_errors(true);
    
$doc->loadHTML($result);
    
print_r(libxml_get_errors()); // nur, falls die dich interessieren
    // ... 
Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #9 (permalink)  
Alt 18-06-2010, 13:43
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.481
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Wenn dein HTML-Code nicht valide ist, kannst du dennoch mit getElementsByTagName() filtern. Allerdings kannst du die daraus resultierende DOMNodeList nicht einfach mit print_r() oder var_dump() ausgeben. DOMNodeList ist nämlich nur ein Container, ein PHP-Objekt ähnlich einem Handle für ein MySQL-Resultset. Das kannst du auch nicht print_r'n - da steht dann nur "Resource #1".

So wirds was:
PHP-Code:
$scripts $doc->getElementsByTagName('script');
for (
$i 0$i $scripts->length$i++) {
  print 
$scripts->item($i)->nodeName '=' $scripts->item($i)->nodeValue "\n";

Dabei wirkt DOMNodeList::item() ähnlich wie mysql_fetch_object() - es lädt den nächsten Eintrag der Ergebnisliste (lässt sich den von libxml geben).

Eventuell kannst du auch mit forach über DOMNodeList iterieren. Hab ich grad nicht im Kopf, musst du ausprobieren.
Mit Zitat antworten
  #10 (permalink)  
Alt 18-06-2010, 13:46
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Warum so umständlich?

PHP-Code:
foreach ($doc->getElementsByTagName('script') as $elem) {
    
// mach was mit $elem, z. B.
    
print $elem->nodeName '=' $elem->nodeValue "\n";

__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!

Geändert von AmicaNoctis (18-06-2010 um 13:48 Uhr)
Mit Zitat antworten
  #11 (permalink)  
Alt 18-06-2010, 14:27
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard

Vielen Lieben DANK - versuch ich gleich mal
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.
Mit Zitat antworten
  #12 (permalink)  
Alt 18-06-2010, 16:59
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard

irgendwie steh ich noch auf dem Schlauch .....


PHP-Code:
$doc = new DOMDocument();
$doc->loadHTML($result);

$scripts $doc->getElementsByTagName('script');
for (
$i 0$i $scripts->length$i++) {
  print 
$scripts->item($i)->nodeName '=' $scripts->item($i)->nodeValue "\n";
  
$old $doc->removeChild($scripts->item($i));
}  

echo 
$doc->saveHTML(); 
kreig ich jetzt folgenden Fehler:
HTML-Code:
<b>Fatal error</b>:  Uncaught exception 'DOMException' with message 'Not Found Error' in /var/www/clients/client4/web9/web/density.php:65
Stack trace:
#0 /var/www/clients/client4/web9/web/density.php(65): DOMNode-&gt;removeChild(Object(DOMElement))
Das hab ich aus dem Manual - eigentlich mach ich das gleiche :-(

PHP-Code:

// we retrieve the chapter and remove it from the book
$chapter $book->getElementsByTagName('chapter')->item(0);
$oldchapter $book->removeChild($chapter); 
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.
Mit Zitat antworten
  #13 (permalink)  
Alt 18-06-2010, 18:19
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

removeChild kann nur für unmittelbare Kindknoten (daher der Name) benutzt werden. Damit du das script-Element also entfernen kannst, musst du dir dessen Elternelement holen:

PHP-Code:
foreach ($doc->getElementsByTagName('script') as $elem) {
    
$elem->parentNode->removeChild($elem);

__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #14 (permalink)  
Alt 18-06-2010, 19:23
JR-EWING
 Registrierter Benutzer
Links : Onlinestatus : JR-EWING ist offline
Registriert seit: Jul 2004
Ort: Kissing
Beiträge: 99
JR-EWING befindet sich auf einem aufstrebenden Ast
Standard

Super Danke - jetzt hab ichs hingekriegt. Vielen Dank an alle Helfer - hab ich viel davon gelernt, wenn auch noch nicht kapiert. Aber mit DOM Parsen macht wohl mehr Sinn und wohl auch besser als Regex ;-)
__________________
Spambot Falle
Wem das Wasser bis zum Hals steht, sollte nicht den Kopf hängen lassen.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
javscript, regex


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Regex zum entfernen eines Attributes aus img tag Pete82 PHP Developer Forum 4 09-12-2009 16:52
javascript entfernen - RegEx janein Appz und Script Gesuche 17 19-04-2008 12:00
[REGEX] Alle Links entfernen, Prob REGEX: /<a href.*<\/a>/s Thomas7 PHP Developer Forum 3 19-02-2006 23:23
Regex Kommentarzeilen entfernen TobiaZ PHP Developer Forum 2 12-12-2004 17:16
PHP-Code entfernen mit RegEx tlausen PHP Developer Forum 9 03-12-2004 14:44

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

MariaDB 5.5 veröffentlicht
MariaDB 5.5 veröffentlichtDie freie MySQL-Alternative MariaDB wurde in der stabilen Version 5.5.23 veröffentlicht und soll einige Verbesserungen gegenüber Oracles Communityversion von MySQL mitbringen.

16.04.2012 | Berni

Deutsche Yii Framework Community
Deutsche Yii Framework CommunitySeit dem 19.03.2012 gibt es für die Yii PHP Framework Community ein deutsches Zuhause.

20.03.2012 | dhcomputer

 

Aktuelle PHP Scripte

EM 2012 Tipp-Spiel ansehen EM 2012 Tipp-Spiel

Online Tipp-Spiel zur Fussball Europameisterschaft 2012, basierend auf php-Script mit hinterlegter mySql-Datenbank

27.05.2012 tippimnetz | Kategorie: PHP/ Spiele
Advanced Login ansehen Advanced Login

Login-System und Kundenverwaltung, die sich spielend leicht in bestehende Webseiten einbauen lässt und einen enormen Funktionsumfang bietet. Ihre eigene Webseite muss mit Advanced Login nicht umständlich an ein fertiges System angepasst werden.

25.05.2012 Madden | Kategorie: PHP/ Kundenverwaltung
BROM CMS/BelCal 3 ansehen BROM CMS/BelCal 3

Spezielles CMS für Betreiber von Ferienwohnungen. Komplette Seitenerstellung online, Verwaltung mehrerer Objekte, Reservierungssystem mit sofortigem Abgleich im Belegungskalender und vieles mehr bietet dieses Content Management System.

25.05.2012 belcal2 | Kategorie: PHP/ CMS
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 12:12 Uhr.