php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 21-09-2011, 20:24
chefdesigner
 Registrierter Benutzer
Links : Onlinestatus : chefdesigner ist offline
Registriert seit: Oct 2003
Ort: Bayern
Beiträge: 257
chefdesigner ist zur Zeit noch ein unbeschriebenes Blatt
Standard Funktionserweiterung strip_tags

Hallo,

kann mir jemand sagen, wie ich Teile des Quellcodes ersetzen kann?
Ich verwende bisher die Funktion strip_tags() um den Plaintext der Seite zu erhalten. Allerdings möchte nicht nur die HTML-Tags entfernen, sondern bei bestimmten Tags (z. B. <a>, <img>, <h1> etc.) soll auch der eingeschlossene Plaintext mit entfernt werden.

Beispiel:
<a href="/link.html" title="Linktext">Hier steht der Linktext</a>

Hier soll also nicht "Hier steht der Linktext" übrig bleiben, sondern alles komplett entfernt werden.

Gibt es eine Möglichkeit die Funktion strip_tags zu erweitern oder das Vorhaben anderweitig umzusetzen?

Hat jemand eine Idee?
__________________
Das Genie überblickt das Chaos!

Wer Rechtschreibfehler findet, darf sie behalten!
Mit Zitat antworten
  #2 (permalink)  
Alt 21-09-2011, 20:45
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

schreib dir doch eine eigene Funktion, die das erledigt. Ich würde spontan dazu tendieren, dass man da mit einer XSL-Transformation am elegantesten zum Ziel kommt.

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 21-09-2011, 21:10
chefdesigner
 Registrierter Benutzer
Links : Onlinestatus : chefdesigner ist offline
Registriert seit: Oct 2003
Ort: Bayern
Beiträge: 257
chefdesigner ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Um ehrlich zu sein, ich hatte bereits eine ähnliche Idee. Ich habe nach einem HTML-Parser gesucht und das hier gefunden: PHP Simple HTML DOM Parser

Problem ist, dass er mir beispielsweise Links zwar korrekt ausliest und diese z. B. aufgelistet werden können. Dann hatte ich folgendes vor:
1. Ich hole mir den kompletten Quellcode
2. Ich liste mir die Links zuerst auf und nach dem auflisten lasse ich einen Replace über den kompletten Code laufen, der mir dann mit $element->outertext den kompletten Link (also den Tag inkl. Linktext) "rausschneidet".
3. Nachdem ich das mit Links, Headlines etc. gemacht habe bleibt dann der reine Text übrig (ohne HTML-Tags UND ohne den Text, den diese umschließen.

Problem dabei ist, dass das irgendwie nicht funktioniert. Teilweise klappt es, teilweise nicht. Ich versuche seit Stunden herauszufinden, an was es liegt, finde aber einfach keine Lösung.

PHP-Code:
<?php
include_once('./html-parser/simple_html_dom.php');
include_once(
'./inc/functions.inc.php');
$url 'http://www.url.net/';
$url2 'http://www.url.net/';
$url3 'http://www.url.net';

// Seite laden
$code file_get_contents($url);

// Script-Tags entfernen
$content preg_replace('/<script\b[^>]*>(.*?)<\/script>/is'""$code);

// Alle HTML-Tags bis auf Links, Headings und Images entfernen
$code_view strip_tags($content'<a><h1><h2><h3><h4><h5><h6><img>');

$html file_get_html($url);
foreach(
$html->find('a') as $element) {
  
$code_view str_replace($element->outertext,"",$code_view);
}
/**
 * Code ohne Links UND ohne Linktexte ausgeben
 */
echo $code_view;
?>
Das komische ist, dass es eben teilweise funktioniert und größtenteils aber leider nicht. Ich habe die Vermutung, dass es mit dem Quellcode an sich zu tun haben könnte. Weil beispielsweise der HTML-Parser unnötige Leerzeichen und Zeilenumbrüche löscht, der Replace jedoch nicht...

Könnt ihr mir einen Tipp geben, wie ich das Problem lösen kann?
__________________
Das Genie überblickt das Chaos!

Wer Rechtschreibfehler findet, darf sie behalten!
Mit Zitat antworten
  #4 (permalink)  
Alt 21-09-2011, 21:23
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Wofür dieser Parser? PHP hat doch einen eingebaut: PHP: DOM - Manual

DOMDocument ist zwar auf XML ausgelegt, hat aber auch Methoden, um HTML zu parsen und auch wieder zu serialisieren.

Mit regulären Ausdrücken solltest du dabei gar nicht erst anfangen. Entweder vergisst du dabei was und irgendwann kracht es oder du machst alles richtig (was nicht ganz einfach ist) und hast am Ende lächerlich umständliche, nicht nachvollziehbare und rekursive Regexe.

Darum lautet die Devise: Nimm den eingebauten und bewährten Parser! Am besten wie gesagt in Verbindung mit XSL, dann kannst du auf übersichtliche und nachvollziebare Weise definieren, was wie ersetzt werden soll und kannst das später auch noch verändern, ohne alles neu schreiben zu müssen, weil du nicht mehr durchsiehst.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
strip_tags() Psy1988 PHP Developer Forum 2 22-09-2010 21:35
strip_tags $allowable_tags Truncate PHP Developer Forum 2 02-08-2007 10:08
strip_tags() Frage pPanther PHP Developer Forum 3 23-07-2007 01:39
strip_tags alternative? marc75 PHP Developer Forum 4 23-04-2004 14:38
strip_tags und PHP 4.3 Kropff PHP Developer Forum 3 02-12-2003 15:55

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 12:03 Uhr.