php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 20-10-2006, 20:22
Zocker
 Banned
Links : Onlinestatus : Zocker ist offline
Registriert seit: Sep 2002
Beiträge: 348
Zocker ist zur Zeit noch ein unbeschriebenes Blatt
Standard Wörter zählen

Guten Abend,

mit substr_count kann man die Anzahl der Wörter in einem String auslesen. Der Nachteil aber ist, dass er nur exakte Wörter zählt.

Würde ich z.B. nach Suchmaschine suchen, dann würde er nicht die Wörter Suchmaschinen zählen. Wie läßt sich dieses Problem lösen?


Mfg
Zocker
Mit Zitat antworten
  #2 (permalink)  
Alt 20-10-2006, 20:26
Morri
 Newbie
Links : Onlinestatus : Morri ist offline
Registriert seit: May 2006
Beiträge: 22
Morri ist zur Zeit noch ein unbeschriebenes Blatt
Standard

schau dir mal reguläre ausdrücke an und mach es damit.
Mit Zitat antworten
  #3 (permalink)  
Alt 20-10-2006, 20:27
Shurakai
 Master
Links : Onlinestatus : Shurakai ist offline
Registriert seit: May 2004
Ort: Bergisch Gladbach
Beiträge: 3.084
Shurakai ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Suchmaschinen ist doch ein Wort?!


... Ah, JETZT verstehe ich. Okay - hast du ne Datenbank, wo der Text drinne steht?
Mit Zitat antworten
  #4 (permalink)  
Alt 20-10-2006, 20:31
penizillin
 PHP Guru
Links : Onlinestatus : penizillin ist offline
Registriert seit: Feb 2004
Beiträge: 10.166
penizillin ist zur Zeit noch ein unbeschriebenes Blatt
Standard

und was ist, wenn jemand nach "Suchmaschinen" sucht? wird er keinen einzigen treffer haben, wenn der text vierzig mal das wort "suchmaschine" enthält?
Mit Zitat antworten
  #5 (permalink)  
Alt 20-10-2006, 20:36
Zocker
 Banned
Links : Onlinestatus : Zocker ist offline
Registriert seit: Sep 2002
Beiträge: 348
Zocker ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Vielen Dank für eure Antworten!

@Morri
Könntest du mir ein Beispiel geben, wie sich das mit den regulären ausdrücken lösen läßt? Danke!


Mfg
Zocker
Mit Zitat antworten
  #6 (permalink)  
Alt 20-10-2006, 22:16
Slava
 PHP Senior
Links : Onlinestatus : Slava ist offline
Registriert seit: Nov 2002
Ort: Köln->Karlsruhe
Beiträge: 1.589
Slava befindet sich auf einem aufstrebenden Ast
Standard

wenn du bei google "Suchmaschinen" schreibst, dann bekommst du auch die "Suchmaschinen" und keine "Suchmaschine" und das ist gut so.
wenn du alle Wortteile die irgendwo in dem Wort stehen haben willst, dann bekommst du nie eine eindeutige Suche.
es wird dir Such, Su, Suc , ch, und alle andere mögliche Variazionen geben, die mit deiner Suche nichts zutun haben.
Teoretisch kannst du natürlich jeder eingegebener Wort lexikalisch untersuchen um z.b.s rausfinden, das "Suchmaschienen" eine mehrzahl von "Suchmaschiene" ist um die zusätzliche suche von "Suchmaschiene" zu starten, aber in diesem Fall hilft dir natürlich kein REGEX sondern ein extra-Datenbank oder spezifische Datei um ein Wort erst lexikalisch zuordnen, und danach alle mögliche Varianten von diesem Wort für die Suche einzusätzen.
__________________
Slava
bituniverse.com
Mit Zitat antworten
  #7 (permalink)  
Alt 20-10-2006, 22:28
penizillin
 PHP Guru
Links : Onlinestatus : penizillin ist offline
Registriert seit: Feb 2004
Beiträge: 10.166
penizillin ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Teoretisch kannst du natürlich jeder eingegebener Wort lexikalisch untersuchen um z.b.s rausfinden, das "Suchmaschienen" eine mehrzahl von "Suchmaschiene" ist um die zusätzliche suche von "Suchmaschiene" zu starten, aber in diesem Fall hilft dir natürlich kein REGEX sondern ein extra-Datenbank oder spezifische Datei um ein Wort erst lexikalisch zuordnen, und danach alle mögliche Varianten von diesem Wort für die Suche einzusätzen.
das geht auch automatisierter, wenn auch nicht perfekt, aber deutsch ist in der hinsicht gar nicht so kompliziert.
Mit Zitat antworten
  #8 (permalink)  
Alt 20-10-2006, 23:00
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.471
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Stichwort Stemming!

Und wer einen wirklich guten deutschen Stemmer findet, möge sich bitte melden.
Mit Zitat antworten
  #9 (permalink)  
Alt 20-10-2006, 23:11
Slava
 PHP Senior
Links : Onlinestatus : Slava ist offline
Registriert seit: Nov 2002
Ort: Köln->Karlsruhe
Beiträge: 1.589
Slava befindet sich auf einem aufstrebenden Ast
Standard

o doch!
da ich mich die letzte zeit ein wenig mit Hyphenatoren(Silbentrennung) beschäftigt habe, die sogar von Latex nicht ohne Fehler läuft und das gerade wegen Zusammensetzung von deutschen Wörter(SuchMaschine ist ein Beispiel dafür)
In jedem fall wird es nicht ohne extrabibliotheken klappen, da dieser Algorithmus in jedem Fall zusätzliche Informationen braucht.
wenn man die Dateien von aspell anschaut,
ftp://ftp.gnu.org/gnu/aspell/dict/de/
dann wird es auch klar, dass dieser Projekt, doch einige Massen komplex ist.
__________________
Slava
bituniverse.com
Mit Zitat antworten
  #10 (permalink)  
Alt 20-10-2006, 23:11
Slava
 PHP Senior
Links : Onlinestatus : Slava ist offline
Registriert seit: Nov 2002
Ort: Köln->Karlsruhe
Beiträge: 1.589
Slava befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Original geschrieben von onemorenerd
Stichwort Stemming!

Und wer einen wirklich guten deutschen Stemmer findet, möge sich bitte melden.
ich glaube, dass es auch nicht so einfach ist, und wieder wegen Zusammensätzung von Wörter.
Du kannst auch die sprachdateien von OpenOffice anschauen, da kann man glaube ich auch die Stammwörter finden.
__________________
Slava
bituniverse.com

Geändert von Slava (20-10-2006 um 23:14 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 05:25 Uhr.