php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 24-06-2013, 18:32
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard Indexierung.

Hallo!

Ich habe ein kleines CMS für mich geschrieben. Mit TinyMCE erstelle ich die Inhalte (also als HTML).

Nun würde ich gerne ein Index erstellen.

Wie kann ich das anstellen?

Wie lasse ich am besten die HTML-Tags aus? In der Datenbank gibt es < und auch &lt;.

Wie kann ich deutsche Füllwörter von der Indexierung auslassen?
z.B.
ein, der, eine, eines
usw. ?

Den Index würde ich dann in eine Datenbank schreiben wollen.

Vielen Dank für Anregungen!

bofan
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #2 (permalink)  
Alt 24-06-2013, 18:58
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von bofan Beitrag anzeigen
Wie lasse ich am besten die HTML-Tags aus?
strip_tags
Zitat:
Zitat von bofan Beitrag anzeigen
In der Datenbank gibt es ... und auch &lt;.
str_replace
Zitat:
Zitat von bofan Beitrag anzeigen
Wie kann ich deutsche Füllwörter von der Indexierung auslassen?
z.B.
ein, der, eine, eines
usw. ?
Dito

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 24-06-2013, 19:02
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

okay. klar. das kling gut!

Aber wie mache ich es

wenn es z.B. heißt

<a href='index.php' target='_blank'>Home</a>

wenn ich jetzt nur Home haben will?
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #4 (permalink)  
Alt 24-06-2013, 19:17
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

strip_tags

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #5 (permalink)  
Alt 26-06-2013, 16:21
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Vielen Dank. So dürfte das mit der Umsetzung klappen.

eine Weitere Frage.

Wie würdet ihr die "Ausnahmen" (z.B. ein, eine, eines, usw.) speichern?

Als Liste in der MySQL DB? Ausgelesen als Array?
Als txt-File? Ausgelesen als Array?
1x täglich generiertes php-File? Da dann als Array?



Wie würdet Ihr den Index in der Datenbank speichern?

Index-File

index-wort tabelle
index-wort-seiten-verknüpung tabelle?

sprich
Seite-ID | Seite-Text


Index-Wort-ID | Index-Wort


Index-Wort-Seite-ID | Seite-ID | Index-Wort-ID



Die Suche dann

Select[*] FROM index-wort LEFT JOIN index-wort-seite ON index-wort-id = index-wort-id AS a LEFT JOIN seite-ID ON seite-id = seite-id AS B WHERE index-wort = 'suchbegriff' ?
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #6 (permalink)  
Alt 26-06-2013, 20:12
Melewo
 Registrierter Benutzer
Links : Onlinestatus : Melewo ist offline
Registriert seit: Jan 2013
Beiträge: 365
Melewo befindet sich auf einem aufstrebenden Ast
Standard

Und eine Stoppwortliste hast Du schon?
Diese hier wäre als Array:

Stoppwortliste deutsch ? php bar

Gibt aber wesentlich längere Listen.

Es kommt ja auch darauf an, was Du damit vorhast. Ich hatte mal eine Liste für eine kleine Suche benötigt, wo man dann zwischen dem genauen Wortlaut usw. wählen konnte. Dafür hatte ich dann eine Stoppwortliste als datei.txt. Nur, die Stoppwörter sind ja gleich aus der Post rausgeflogen und nach denen wurde dann ja nicht mehr gesucht. Also, bevor die Suche begonnen hat, wurden die Stoppwörter in den Suchanfragen schon eliminiert.

Wenn Du aber einen Index erstellen möchtest, dann würde sich wohl eher die Datenbank anbieten. Für meine kleine Suche hatte ich um die 770 Stoppwörter, falls ich mich nicht irre, rechne lieber mit mehr. Weiß nicht mehr, woher ich die hatte, weiß nur noch, dass ich die etwas einkürzte.

Geändert von Melewo (26-06-2013 um 20:58 Uhr)
Mit Zitat antworten
  #7 (permalink)  
Alt 18-07-2013, 11:10
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Danke Indexierung klappt nun.

Hast du vllt. auch eine Idee, ob ich pdf dateien oder doc dateien indexieren kann?

Also ich hab n linux-server... (root)
[Nur im Intranet ohne Bezug nach außen.]

Mit ist klar, dass gescannte Dokumente in PDF-Dateien nicht indexiert werden können.
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #8 (permalink)  
Alt 19-07-2013, 19:27
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zum Auslesen könntest du zum Beispiel FPDF mit FPDI nutzen. Bei Word sieht es da schon ein wenig schlechter aus, da das erstens nicht offen ist und zweitens auch noch verschiedene Formate vorliegen können.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
G00gle URL-Indexierung !? GundeCK SEO - Suchmaschinen Tricks und Tipps 2 26-10-2005 21:30
Suchen und Indexierung? Ghostrider SQL / Datenbanken 0 01-07-2004 12:21

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 13:45 Uhr.