php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 12-08-2009, 22:42
hsiebert
 Registrierter Benutzer
Links : Onlinestatus : hsiebert ist offline
Registriert seit: Aug 2009
Beiträge: 2
hsiebert befindet sich auf einem aufstrebenden Ast
Angry Aarrgh - Regex - bzw. automatisches ändern von img-src

Hallo liebes Forum!

ich weiß, das wird vielleicht dumm klingen, aber ich sitze schon den ganzen tag an einem simplen problem.

ich habe einen großen string, der jede menge HTML code enthält.

aus dem möchte ich, für alle img-tags die src anpassen.

z.B. aus
<img alt="lalala" src="images/a.gif" title="link" width="20px">
soll
<img alt="lalala" src="http://localhost/a.gif" title="link" width="20px">
werden.

Aber das soll ach funktionieren, wenn aus:
<Img alt="lalala" title="link" height="10" SRC="wichtig/mein/images/b.gif" width="20px">
werden soll:
<Img alt="lalala" title="link" height="10" SRC="http://localhost/b.gif" width="20px">

d.h. es darf nicht case sensitive sein -- im endeffekt möchte ich für alle bilder den src auf einen und denselben ordner bringen.

Ich habe mich zunächst mit regulären ausdrücken probiert, um überhaupt mal an den src teil heranzukommen.

Das habe ich geschafft mit:

$pat = "/\< *[img][^\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)/i";
preg_match_all($pat,$inhalt, $matches);

wobei eben in $inhalt der HTML code ist, also etwa:

$inhalt = "<p>en wnig text und dann ein bild und noch<Img alt=\"lalala\" title=\"link\" height=\"10\" SRC=\wichtig/mein/images/b.gif\" width="20px\"> ein wenig text und <b>mehe</b> und noch ein <img alt=\"lalala\" src=\"images/a.gif\" title=\"link\" width=\"20px\"></p>";

wenn ich diesen regex anwende, dann erhalte ich in matches in zweidimensionales array, wobei $matches[1][$i] jeweils den src wert enthält (das $i ist eine Zählvariable).

Hier bin ich quasi stecken geblieben...das muss doch einfacher gehen.
Kann ich nicht direkt die ersetzung machen?

Wäre echt toll, wenn mir jemand helfen kann!

Beste Grüße

H. Siebert
Mit Zitat antworten
  #2 (permalink)  
Alt 12-08-2009, 23:01
wahsaga
  Moderator
Links : Onlinestatus : wahsaga ist offline
Registriert seit: Sep 2001
Beiträge: 25.236
wahsaga befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von hsiebert Beitrag anzeigen
Kann ich nicht direkt die ersetzung machen?
Wenn man Ersetzen möchte, dann nutzt man nicht preg_match_all, sondern preg_replace ...
__________________
I don't believe in rebirth. Actually, I never did in my whole lives.
Mit Zitat antworten
  #3 (permalink)  
Alt 12-08-2009, 23:01
combie
 PHP Expert
Links : Onlinestatus : combie ist offline
Registriert seit: May 2006
Beiträge: 3.296
combie wird schon bald berühmt werden
Standard

Wenn das HTML halbwegs valide ist, könntest du da auch per DOM drüberrupeln.
__________________
Wir werden alle sterben
Mit Zitat antworten
  #4 (permalink)  
Alt 12-08-2009, 23:11
hsiebert
 Registrierter Benutzer
Links : Onlinestatus : hsiebert ist offline
Registriert seit: Aug 2009
Beiträge: 2
hsiebert befindet sich auf einem aufstrebenden Ast
Standard

Hallo...
ja an DOM dache ich auch schon, aber das ist eben nicht notwendigerweise valides HTML (auch handelt es sich bei dem HTML um einen Auszug aus einer HTML Seite, nicht das ganze per-se).

Deswegen ist das mit preg_replace wohl schon der bessere Zug...

Ich denke mit dem

$pat = "/\< *[img][^\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)/i";

kann ich mal anfangen. ich muss da jetzt jedoch verschiedene "oder" konditionen einbauen, also, dass da mehrere verzeichnisse davor in der struktur kommen könnten, also etwa /imags/was/bild.jpg, daraus soll ja werden http://localhost/bild.jpg.

D.h. der src steht ja quasi wo {0,1} hier im pattern ist, jetzt muss ich das aber noch verfeinern.

ich könnte es quasi einfacher machen, wenn ich die php funktion "basename" verwenden kann, weil ich weiß, dass die sachen im src alles pfadangaben sind, also keine URLs -- habt ihr mir einen tipp, wie ich das mit preg_replace umsetzen kann?

aber vielleicht denk ich einfach auch zu kompliziert (ich muss sagen, REGEX sind nicht meine stärke -- wenn man von stärke überhaupt sprechen kann!!).

vielen dank und beste grüße
H Siebert
Mit Zitat antworten
  #5 (permalink)  
Alt 12-08-2009, 23:12
wahsaga
  Moderator
Links : Onlinestatus : wahsaga ist offline
Registriert seit: Sep 2001
Beiträge: 25.236
wahsaga befindet sich auf einem aufstrebenden Ast
Standard

Und je nach Umfang (wie viele Dateien; einmaliges Vorhaben oder periodisch/mehrfach auszuführendes), würde ich das vielleicht auch eher mit einem Texteditor machen, der Suchen/Ersetzen mit regulären Ausdrücken ermöglicht.

Und auch schauen, wie kompliziert der reguläre Ausdruck überhaupt sein muss - vielleicht reicht es ja auch, nach src=".../irgendwas" zu suchen - so oft kommt src als Attribut ja nicht vor, und ein paar SCRIPT/IFRAME-Tags kann man dann zur Not auch manuell wieder auf den Ursprungszustand zurücksetzen.
__________________
I don't believe in rebirth. Actually, I never did in my whole lives.
Mit Zitat antworten
  #6 (permalink)  
Alt 12-08-2009, 23:23
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von hsiebert Beitrag anzeigen
ich habe einen großen string, der jede menge HTML code enthält.

aus dem möchte ich, für alle img-tags die src anpassen.
Bevor wir zur Tat schreiten: Diesem Problem kann man nicht in jedem Fall mit simplen regulären Ausdrücken beikommen. Mit extrem kaputten HTML kann ein toleranter Parser oft besser umgehen.

Zitat:
z.B. aus
<img alt="lalala" src="images/a.gif" title="link" width="20px">
soll
<img alt="lalala" src="http://localhost/a.gif" title="link" width="20px">
werden.

Aber das soll ach funktionieren, wenn aus:
<Img alt="lalala" title="link" height="10" SRC="wichtig/mein/images/b.gif" width="20px">
werden soll:
<Img alt="lalala" title="link" height="10" SRC="http://localhost/b.gif" width="20px">

d.h. es darf nicht case sensitive sein -- im endeffekt möchte ich für alle bilder den src auf einen und denselben ordner bringen.
Für "Case-Insensitivity" gibts den Modifikator "/i", aber das ist dir ja schon aufgefallen.
Außerdem nehmen wir zur weiteren Problemlösung an, dass du den "Basename" (also den Dateinamen) des Pfadteils beibehalten, den Rest des Pfades aber ändern möchtest.

Zitat:
...
Das habe ich geschafft mit:

$pat = "/\< *[img][^\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)/i";
preg_match_all($pat,$inhalt, $matches);

wobei eben in $inhalt der HTML code ist, also etwa:

$inhalt = "<p>en wnig text und dann ein bild und noch<Img alt=\"lalala\" title=\"link\" height=\"10\" SRC=\wichtig/mein/images/b.gif\" width="20px\"> ein wenig text und <b>mehe</b> und noch ein <img alt=\"lalala\" src=\"images/a.gif\" title=\"link\" width=\"20px\"></p>";

wenn ich diesen regex anwende, dann erhalte ich in matches in zweidimensionales array, wobei $matches[1][$i] jeweils den src wert enthält (das $i ist eine Zählvariable).

Hier bin ich quasi stecken geblieben...das muss doch einfacher gehen.
Kann ich nicht direkt die ersetzung machen?
Yep. Exakt für diesen Zweck haben die PHP-Götter die Funktion preg_replace() erfunden.

PHP-Code:

$old 
'...'// dein Original-HTML
$new_path 'file://localhorst/';

$pcre '/(<img.+?src=)(["\']?)([^'"]+?)([^\/]+)(\2.*?\/?>)/is';
$replace = '$1$2' . $new_path . '$4$5';

$new = preg_replace($pcre, $replace, $old); 
So in etwas müsste das aussehen. Ich hoffe, das funktioniert auf Anhieb.

Noch ein paar Erklärungen:

Das zweite Subpattern fängt das linke Quote-Zeichen oder eben keins, wenn keins da ist.

Das dritte passt auf den Pfad und wird deshalb ersetzt.

Das vierte Subpattern erfasst alles nach dem letzten Slash bis zum Ende des Dateinamens.

'\2' ist eine Rückreferenz ("back reference") und passt auf exakt das gleiche Zeichen wie das zweite Subpattern, also '"', "'" oder kein Zeichen. Der Rest versucht alle möglichen Arten von img-Tags zu erfassen: "<img ...>", "<img .../>" und "<img ... />".

Die Anwendung von preg_match_all() ist übrigens ganz praktisch beim Testen, ob der entwickelte RegEx auch richtig auf alle gewünschten Muster passt.

*Nachtrag*
Hehe, das liest sich jetzt so, als ob ich alle Vorposts nicht gelesen hätte.
Hab ich wirklich geschlagene 23 Minuten gebraucht, um diesen Text zu verfassen?
Man sollte besser nicht nebenher noch andere Dinge tun. ;-)

Geändert von fireweasel (12-08-2009 um 23:27 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
img, php, regex, src


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[REGEX] regex korrekt? bitte prüfen JuliusCaesar PHP Developer Forum 0 25-01-2008 20:59
Link ändern - Regex - PHP Flyboy PHP Developer Forum 2 19-04-2006 12:19
[REGEX] automatisches verlinken will nicht Luke PHP Developer Forum 3 03-03-2006 22:20
[REGEX] Alle Links entfernen, Prob REGEX: /<a href.*<\/a>/s Thomas7 PHP Developer Forum 3 19-02-2006 23:23
[REGEX] Regex mit 2 Variablen - Parser wird gierig daniel987 PHP Developer Forum 9 17-09-2005 15:17

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 01:56 Uhr.