php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 24-06-2013, 19:32
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard Indexierung.

Hallo!

Ich habe ein kleines CMS für mich geschrieben. Mit TinyMCE erstelle ich die Inhalte (also als HTML).

Nun würde ich gerne ein Index erstellen.

Wie kann ich das anstellen?

Wie lasse ich am besten die HTML-Tags aus? In der Datenbank gibt es < und auch &lt;.

Wie kann ich deutsche Füllwörter von der Indexierung auslassen?
z.B.
ein, der, eine, eines
usw. ?

Den Index würde ich dann in eine Datenbank schreiben wollen.

Vielen Dank für Anregungen!

bofan
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #2 (permalink)  
Alt 24-06-2013, 19:58
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von bofan Beitrag anzeigen
Wie lasse ich am besten die HTML-Tags aus?
strip_tags
Zitat:
Zitat von bofan Beitrag anzeigen
In der Datenbank gibt es ... und auch &lt;.
str_replace
Zitat:
Zitat von bofan Beitrag anzeigen
Wie kann ich deutsche Füllwörter von der Indexierung auslassen?
z.B.
ein, der, eine, eines
usw. ?
Dito

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #3 (permalink)  
Alt 24-06-2013, 20:02
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

okay. klar. das kling gut!

Aber wie mache ich es

wenn es z.B. heißt

<a href='index.php' target='_blank'>Home</a>

wenn ich jetzt nur Home haben will?
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #4 (permalink)  
Alt 24-06-2013, 20:17
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

strip_tags

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
  #5 (permalink)  
Alt 26-06-2013, 17:21
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Vielen Dank. So dürfte das mit der Umsetzung klappen.

eine Weitere Frage.

Wie würdet ihr die "Ausnahmen" (z.B. ein, eine, eines, usw.) speichern?

Als Liste in der MySQL DB? Ausgelesen als Array?
Als txt-File? Ausgelesen als Array?
1x täglich generiertes php-File? Da dann als Array?



Wie würdet Ihr den Index in der Datenbank speichern?

Index-File

index-wort tabelle
index-wort-seiten-verknüpung tabelle?

sprich
Seite-ID | Seite-Text


Index-Wort-ID | Index-Wort


Index-Wort-Seite-ID | Seite-ID | Index-Wort-ID



Die Suche dann

Select[*] FROM index-wort LEFT JOIN index-wort-seite ON index-wort-id = index-wort-id AS a LEFT JOIN seite-ID ON seite-id = seite-id AS B WHERE index-wort = 'suchbegriff' ?
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #6 (permalink)  
Alt 26-06-2013, 21:12
Melewo
 Registrierter Benutzer
Links : Onlinestatus : Melewo ist offline
Registriert seit: Jan 2013
Beiträge: 365
Melewo befindet sich auf einem aufstrebenden Ast
Standard

Und eine Stoppwortliste hast Du schon?
Diese hier wäre als Array:

Stoppwortliste deutsch ? php bar

Gibt aber wesentlich längere Listen.

Es kommt ja auch darauf an, was Du damit vorhast. Ich hatte mal eine Liste für eine kleine Suche benötigt, wo man dann zwischen dem genauen Wortlaut usw. wählen konnte. Dafür hatte ich dann eine Stoppwortliste als datei.txt. Nur, die Stoppwörter sind ja gleich aus der Post rausgeflogen und nach denen wurde dann ja nicht mehr gesucht. Also, bevor die Suche begonnen hat, wurden die Stoppwörter in den Suchanfragen schon eliminiert.

Wenn Du aber einen Index erstellen möchtest, dann würde sich wohl eher die Datenbank anbieten. Für meine kleine Suche hatte ich um die 770 Stoppwörter, falls ich mich nicht irre, rechne lieber mit mehr. Weiß nicht mehr, woher ich die hatte, weiß nur noch, dass ich die etwas einkürzte.

Geändert von Melewo (26-06-2013 um 21:58 Uhr)
Mit Zitat antworten
  #7 (permalink)  
Alt 18-07-2013, 12:10
bofan
 Registrierter Benutzer
Links : Onlinestatus : bofan ist offline
Registriert seit: Aug 2005
Ort: Berlin / Germany
Beiträge: 188
bofan ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Danke Indexierung klappt nun.

Hast du vllt. auch eine Idee, ob ich pdf dateien oder doc dateien indexieren kann?

Also ich hab n linux-server... (root)
[Nur im Intranet ohne Bezug nach außen.]

Mit ist klar, dass gescannte Dokumente in PDF-Dateien nicht indexiert werden können.
__________________
Beachte: Dumm ist, wer Dummes tut.
Mit Zitat antworten
  #8 (permalink)  
Alt 19-07-2013, 20:27
Kropff
  Administrator
Links : Onlinestatus : Kropff ist offline
Registriert seit: Mar 2002
Ort: Köln
Beiträge: 11.722
Kropff befindet sich auf einem aufstrebenden Ast
Standard

Zum Auslesen könntest du zum Beispiel FPDF mit FPDI nutzen. Bei Word sieht es da schon ein wenig schlechter aus, da das erstens nicht offen ist und zweitens auch noch verschiedene Formate vorliegen können.

Peter
__________________
Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
Meine Seite
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
G00gle URL-Indexierung !? GundeCK SEO - Suchmaschinen Tricks und Tipps 2 26-10-2005 22:30
Suchen und Indexierung? Ghostrider SQL / Datenbanken 0 01-07-2004 13:21

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Die RIGID-FLEX-Technologie
Die RIGID-FLEX-TechnologieDie sogenannte "Flexible Elektronik" , oftmals auch als "Flexible Schaltungen" bezeichnet, ist eine zeitgemäße Technologie zum Montieren von elektronischen Schaltungen.

06.12.2018 | Berni

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni


 

Aktuelle PHP Scripte

HeidiSQL - kostenloses MySQL front-end Editor für Windows ansehen HeidiSQL - kostenloses MySQL front-end Editor für Windows

HeidiSQL - ist ein Windows-Editor für die bekannt open Source Datenbank mySQL

10.12.2018 Berni | Kategorie: MYSQL/ Management
piwik Open-Source Webanalyse-Software ansehen piwik Open-Source Webanalyse-Software

piwik ist eine gute Alternative zu Google Analytics. Viele Features und ein modernes Erscheinungsbild mit aussagefähigen Statistiken in Echtzeit

10.12.2018 phpler | Kategorie: PHP/ Besucherzaehler
jQuery Mobile ansehen jQuery Mobile

Touch-Optimized Web Framework für Smartphones & Tablets

09.12.2018 phpler | Kategorie: AJAX/ Framework
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:11 Uhr.