| PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Post your PHP questions here! |
 |
|

30-07-2008, 10:45
|
|
Jayjay
Registrierter Benutzer
|
|
Registriert seit: Jul 2008
Beiträge: 86
|
|
Links und Text aus Website auslesen
Hi,
ich will mal ein bisschen mit nem Webcrawler experimentieren,
dieser soll Links von externen Websites auslesen können und auch den Text davon in einer Datenbank speichern.
Ich bräuchte also eine Funktion für den Text und für Links.
gru?
Jayjay
|

30-07-2008, 10:49
|
|
Schnoop
PHP Senior
|
|
Registriert seit: Apr 2003
Beiträge: 1.049
|
|
Dann fang mal an.
Stichwort: RegExp
Wenn du ein konkretes Problem bei der Implementierung hast kannst du gerne nochmal fragen.
|

30-07-2008, 10:50
|
jahlives
Master  
|
|
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.283
|
|
Zitat:
|
Ich bräuchte also eine Funktion für den Text und für Links.
|
Reguläre Ausdrücke sind genau dazu da. Für mehr Infos gibt's das Manual. Und bei einer konkreten Frage darfst du gerne wiederkommen
|

30-07-2008, 10:51
|
|
Schnoop
PHP Senior
|
|
Registriert seit: Apr 2003
Beiträge: 1.049
|
|
|

30-07-2008, 10:53
|
|
Jayjay
Registrierter Benutzer
|
|
Registriert seit: Jul 2008
Beiträge: 86
|
|
Ok erst mal danke,
also mit RegExp?
|

30-07-2008, 10:54
|
|
Schnoop
PHP Senior
|
|
Registriert seit: Apr 2003
Beiträge: 1.049
|
|
Nee, mit Sauerkraut.
Wenn 2 Leute RegExp schreiben, meinen sie das auch so
|

30-07-2008, 10:54
|
jahlives
Master  
|
|
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.283
|
|
Ja. Denn alles andere würde ein ziemliches Gefummel werden
|

30-07-2008, 10:57
|
|
Jayjay
Registrierter Benutzer
|
|
Registriert seit: Jul 2008
Beiträge: 86
|
|
Ok erst mal danke,
da hab ich jetzt schon gute Seiten gefunden,
aber soweit ich das überblicken konnte kann amn damit z.b. einen Text durchsuchen, ich will ja aber den ganzen text speichern.
|

30-07-2008, 10:57
|
jahlives
Master  
|
|
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.283
|
|
OffTopic:
Gerade im Manual gesehen, dass es sauerkraut(float menge, int dauer, double gasmenge)- Funktion in PHP 6 geben wird 
|

30-07-2008, 10:59
|
|
Schnoop
PHP Senior
|
|
Registriert seit: Apr 2003
Beiträge: 1.049
|
|
|

30-07-2008, 10:59
|
jahlives
Master  
|
|
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.283
|
|
Zitat:
|
aber soweit ich das überblicken konnte kann amn damit z.b. einen Text durchsuchen, ich will ja aber den ganzen text speichern.
|
Man kann damit durchsuchen, ausschneiden, ersetzen. Also matched du erst mit einem RegExp die URL und den Text und speicherst diese beiden Vars in eine Textdatei oder Datenbank.
|

30-07-2008, 11:07
|
|
Schnoop
PHP Senior
|
|
Registriert seit: Apr 2003
Beiträge: 1.049
|
|
Zitat:
Original geschrieben von jahlives
OffTopic:
Gerade im Manual gesehen, dass es sauerkraut(float menge, int dauer, double gasmenge)- Funktion in PHP 6 geben wird 
|
Das geht aber nur wenn Sauerkraut eine Class ist und das Interface Kartoffeln und Bratwurst implementiert hat.
|

30-07-2008, 11:16
|
|
3DMax
PHP Senior
|
|
Registriert seit: Jan 2004
Beiträge: 1.916
|
|
regex sind frickelei.
DOM XML
|

30-07-2008, 13:23
|
|
PHP-Desaster
PHP Expert
|
|
Registriert seit: Mar 2006
Beiträge: 3.104
|
|
Sehe ich genau so. Das Problem ist allerdings, dass du nicht sicher sein kannst, dass die Eingabedaten gültiges XML/HTML sind. Da musst du dann mit einem entsprechenden XmlParser ansetzen, mit der DOM-Extension wirst du da wohl scheitern.
|

30-07-2008, 17:21
|
|
3DMax
PHP Senior
|
|
Registriert seit: Jan 2004
Beiträge: 1.916
|
|
Zitat:
Original geschrieben von PHP-Desaster
Das Problem ist allerdings, dass du nicht sicher sein kannst, dass die Eingabedaten gültiges XML/HTML sind.
|
stimmt schon. nur soll es ja ein webspider werden, da kann oder sollte man dann schon von gültigem html ausgehen. ungültige seiten werden dann halt nicht erfasst.
|
|
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
|
|
|
| Themen-Optionen |
|
|
| Thema bewerten |
|
|
Forumregeln
|
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.
HTML-Code ist aus.
|
|
|
|
PHP News
|