php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 21-02-2011, 20:20
TommyD
 Registrierter Benutzer
Links : Onlinestatus : TommyD ist offline
Registriert seit: Aug 2004
Beiträge: 12
TommyD ist zur Zeit noch ein unbeschriebenes Blatt
Standard Suchen und Textbereich auslesen

Hallo zusammen,

ich suche jetzt seit Tagen eine Lösung für ein Problem.

Ich bin dabei eine Suchfunktion für meine HP zuschreiben. Wenn der Suchbegriff gefunden wurde, soll der gesamte Satz oder Textabschnitt drum herum ausgelesen werden.

Kann mir da jemand einen Tipp geben?

Ich habe schon

PHP-Code:
$pos strripos($string$suchstring);
$rest substr($string$pos-50150); 
probiert, dass trennt aber auch brutal mitten im Wort. Ich denke, da gibt es was eleganteres, kenne mich aber nicht so gut mit den regulären Ausdrücken aus.

Besten Dank im Voraus.
Mit Zitat antworten
  #2 (permalink)  
Alt 21-02-2011, 23:12
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von TommyD Beitrag anzeigen
Hallo zusammen,

ich suche jetzt seit Tagen eine Lösung für ein Problem.

Ich bin dabei eine Suchfunktion für meine HP zuschreiben. Wenn der Suchbegriff gefunden wurde, soll der gesamte Satz oder Textabschnitt drum herum ausgelesen werden.

Kann mir da jemand einen Tipp geben?

...
Ich denke, da gibt es was eleganteres, kenne mich aber nicht so gut mit den regulären Ausdrücken aus.
Nun, du müsstest schon die Art des Textes näher beschreiben (hoffentlich kein HTML). Wenn Satzanfänge und -enden und Abschnitt-Trenner konsistent gestaltet sind, könnte man sicher einen RegEx bauen, der die erkennt.
Mit Zitat antworten
  #3 (permalink)  
Alt 22-02-2011, 06:52
TommyD
 Registrierter Benutzer
Links : Onlinestatus : TommyD ist offline
Registriert seit: Aug 2004
Beiträge: 12
TommyD ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Guten Morgen,

der Text kann alles Mögliche sein. HTML höchstens wenn per BBCode ein Hyperlink vorkommt.
Normalerweise wären die Begrenzer um einen Text herum der Punk vor und am Ende des Satzes.
Ansonsten eben die normalen Textinhalte einer Homepage.

Danke schon mal für die Antwort.

Gruß Thomas
Mit Zitat antworten
  #4 (permalink)  
Alt 28-02-2011, 13:53
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von TommyD Beitrag anzeigen
Guten Morgen,

der Text kann alles Mögliche sein. HTML höchstens wenn per BBCode ein Hyperlink vorkommt.
Irgendwelches Markup-Zeug im Fließtext kompliziert meist die saubere Erkennung. Wir ignorieren daher die BBCode-Bestandteile erstmal.

Zitat:
Normalerweise wären die Begrenzer um einen Text herum der Punk vor und am Ende des Satzes.
Das ist zwar der Standard, macht aber eben Schwierigkeiten, wenn typografisch korrekte Abkürzungen mit Punkten verwendet werden, wie "Dr.", "F. D. P." und ähnliches. Außerdem gehe ich mal davon aus, dass auch Frage- und Ausrufezeichen Sätze beenden dürfen.

PHP-Code:
/// return array() | NULL
function search(
    
$needle/// string to search for
    
$haystack/// string to search in
    
$type /// 0: sentences 1: paragraphs
) {
    if (!
is_string($needle) || !is_string($haystack)) {
        return 
NULL;
    }

    
$pcre sprintf(
        
// wichtig: keine Option /x verwenden, da preg_quote() anscheinend
        // Leerzeichen nicht escaped
        
$type === 1
            
// Absaetze
            
'/(?:\A|(?:\r?\n){2,})\s*\K(?:[^\r\n]|\r?\n(?![\r\n]))*?(%s)'.
              
'(?:[^\r\n]|\r?\n(?![\r\n]))*?(?=(?:\r?\n){2,}|\s*\z)/is'

            
// Saetze
            
'/(?:\A|[.!?]\s)\s*\K(?:(?:[^.!?]|[.!?](?!\s))*?)(%s)'.
              
'(?:.*?(?:[.!?](?=\s|\z)|\z))/is',
        
preg_quote(trim($needle), '/')
    );
    return (bool) 
preg_match($pcre$haystack$hits) ? $hits NULL;

Falls der Suchstring ($query) entsprechende Satz- oder Absatz-Trennzeichenkombinationen enthält, werden beide (Ab-)Sätze gefunden.

Wie schon erwähnt, machen Abkürzungen mit Punkten Schwierigkeiten, wenn die Satz-Ende-Erkennung benutzt wird.

Man kann das umgehen, wenn man den zu durchsuchenden Text ($haystack) so präpariert, dass Satz-Enden sich von Abkürzungen mit Punkt unterscheiden. Ein gängiges Verfahren dazu ist, nach einem Satz-Ende-Punkt, mindestens zwei Leerzeichen zu setzen.

Der andere Weg wäre, dem RegEx die Erkennung aufzubürden, das könnte mit Abkürzungen funktionieren, bei denen nur Einzelbuchstaben vorkommen ("F. D. P.").

Bei mehr Buchstaben (wie "Dr.", "Prof.") bräuchte man dann zusätzlich eine Liste der Strings, die Abkürzungen darstellen, weil es (wenn auch selten) Sätze gibt wie "Oh.", die keine Abkürzungen sind. Spätestens da stoßen reguläre Ausdrücke an ihre Grenzen.
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Pluginbeschreibung im Kommentar suchen und auslesen maffy PHP Developer Forum 3 22-02-2010 11:27
textfeld und textbereich jhaustein HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 6 10-09-2007 22:03
Mit php Textbereich extrahieren Sevenger PHP Developer Forum 1 22-09-2003 16:14
[JavaScript] versteckten textbereich per klick zeigen WhiZZler HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 4 03-09-2003 16:39
Farben beim Textbereich Adler HTML, JavaScript, AJAX, jQuery, CSS, Bootstrap, LESS 2 16-07-2003 23:16

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script ansehen ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script

Mit unserer Lösungen können Sie nahezu jeden B2B / B2C Marktplatz betreiben den Sie sich vorstellen können. Ganz egal ob Sie einen Automarktplatz, Immobilenportal oder einfach einen Anzeigenmarkt betreiben möchten. Mit ebiz-trader können Sie Ihre Anforder

11.10.2018 Berni | Kategorie: PHP/ Anzeigenmarkt
PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 18:52 Uhr.