php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Bewertung: Bewertung: 2 Stimmen, 5,00 durchschnittlich.
  #1 (permalink)  
Alt 30-07-2008, 11:45
Jayjay
 Registrierter Benutzer
Links : Onlinestatus : Jayjay ist offline
Registriert seit: Jul 2008
Beiträge: 87
Jayjay ist zur Zeit noch ein unbeschriebenes Blatt
Standard Links und Text aus Website auslesen

Hi,

ich will mal ein bisschen mit nem Webcrawler experimentieren,
dieser soll Links von externen Websites auslesen können und auch den Text davon in einer Datenbank speichern.
Ich bräuchte also eine Funktion für den Text und für Links.

gru?

Jayjay
Mit Zitat antworten
  #2 (permalink)  
Alt 30-07-2008, 11:49
Schnoop
 PHP Senior
Links : Onlinestatus : Schnoop ist offline
Registriert seit: Apr 2003
Beiträge: 1.049
Schnoop ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Dann fang mal an.

Stichwort: RegExp

Wenn du ein konkretes Problem bei der Implementierung hast kannst du gerne nochmal fragen.
Mit Zitat antworten
  #3 (permalink)  
Alt 30-07-2008, 11:50
jahlives
 Master
Links : Onlinestatus : jahlives ist offline
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.279
jahlives ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Ich bräuchte also eine Funktion für den Text und für Links.
Reguläre Ausdrücke sind genau dazu da. Für mehr Infos gibt's das Manual. Und bei einer konkreten Frage darfst du gerne wiederkommen
__________________
Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."
Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)
Mit Zitat antworten
  #4 (permalink)  
Alt 30-07-2008, 11:51
Schnoop
 PHP Senior
Links : Onlinestatus : Schnoop ist offline
Registriert seit: Apr 2003
Beiträge: 1.049
Schnoop ist zur Zeit noch ein unbeschriebenes Blatt
Standard

OffTopic:
High 5
Mit Zitat antworten
  #5 (permalink)  
Alt 30-07-2008, 11:53
Jayjay
 Registrierter Benutzer
Links : Onlinestatus : Jayjay ist offline
Registriert seit: Jul 2008
Beiträge: 87
Jayjay ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Ok erst mal danke,

also mit RegExp?
Mit Zitat antworten
  #6 (permalink)  
Alt 30-07-2008, 11:54
Schnoop
 PHP Senior
Links : Onlinestatus : Schnoop ist offline
Registriert seit: Apr 2003
Beiträge: 1.049
Schnoop ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Nee, mit Sauerkraut.

Wenn 2 Leute RegExp schreiben, meinen sie das auch so
Mit Zitat antworten
  #7 (permalink)  
Alt 30-07-2008, 11:54
jahlives
 Master
Links : Onlinestatus : jahlives ist offline
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.279
jahlives ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
also mit RegExp?
Ja. Denn alles andere würde ein ziemliches Gefummel werden
__________________
Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."
Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)
Mit Zitat antworten
  #8 (permalink)  
Alt 30-07-2008, 11:57
Jayjay
 Registrierter Benutzer
Links : Onlinestatus : Jayjay ist offline
Registriert seit: Jul 2008
Beiträge: 87
Jayjay ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Ok erst mal danke,
da hab ich jetzt schon gute Seiten gefunden,
aber soweit ich das überblicken konnte kann amn damit z.b. einen Text durchsuchen, ich will ja aber den ganzen text speichern.
Mit Zitat antworten
  #9 (permalink)  
Alt 30-07-2008, 11:57
jahlives
 Master
Links : Onlinestatus : jahlives ist offline
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.279
jahlives ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Nee, mit Sauerkraut.
OffTopic:

Gerade im Manual gesehen, dass es sauerkraut(float menge, int dauer, double gasmenge)- Funktion in PHP 6 geben wird

__________________
Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."
Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)
Mit Zitat antworten
  #10 (permalink)  
Alt 30-07-2008, 11:59
Schnoop
 PHP Senior
Links : Onlinestatus : Schnoop ist offline
Registriert seit: Apr 2003
Beiträge: 1.049
Schnoop ist zur Zeit noch ein unbeschriebenes Blatt
Standard

http://de2.php.net/manual/de/functio...-match-all.php <- Parameter "matches" wäre für dich interessant.

Hier mal zum ausprobieren: http://regexp-evaluator.de/evaluator/
Mit Zitat antworten
  #11 (permalink)  
Alt 30-07-2008, 11:59
jahlives
 Master
Links : Onlinestatus : jahlives ist offline
Registriert seit: Jun 2004
Ort: Hooker in Kernel
Beiträge: 8.279
jahlives ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
aber soweit ich das überblicken konnte kann amn damit z.b. einen Text durchsuchen, ich will ja aber den ganzen text speichern.
Man kann damit durchsuchen, ausschneiden, ersetzen. Also matched du erst mit einem RegExp die URL und den Text und speicherst diese beiden Vars in eine Textdatei oder Datenbank.
__________________
Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."
Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)
Mit Zitat antworten
  #12 (permalink)  
Alt 30-07-2008, 12:07
Schnoop
 PHP Senior
Links : Onlinestatus : Schnoop ist offline
Registriert seit: Apr 2003
Beiträge: 1.049
Schnoop ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Original geschrieben von jahlives
OffTopic:

Gerade im Manual gesehen, dass es sauerkraut(float menge, int dauer, double gasmenge)- Funktion in PHP 6 geben wird

Das geht aber nur wenn Sauerkraut eine Class ist und das Interface Kartoffeln und Bratwurst implementiert hat.
Mit Zitat antworten
  #13 (permalink)  
Alt 30-07-2008, 12:16
3DMax
 PHP Senior
Links : Onlinestatus : 3DMax ist offline
Registriert seit: Jan 2004
Beiträge: 1.916
3DMax ist zur Zeit noch ein unbeschriebenes Blatt
Standard

regex sind frickelei.

DOM XML
Mit Zitat antworten
  #14 (permalink)  
Alt 30-07-2008, 14:23
PHP-Desaster
 PHP Expert
Links : Onlinestatus : PHP-Desaster ist offline
Registriert seit: Mar 2006
Beiträge: 3.105
PHP-Desaster befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
regex sind frickelei.

DOM XML
Sehe ich genau so. Das Problem ist allerdings, dass du nicht sicher sein kannst, dass die Eingabedaten gültiges XML/HTML sind. Da musst du dann mit einem entsprechenden XmlParser ansetzen, mit der DOM-Extension wirst du da wohl scheitern.
Mit Zitat antworten
  #15 (permalink)  
Alt 30-07-2008, 18:21
3DMax
 PHP Senior
Links : Onlinestatus : 3DMax ist offline
Registriert seit: Jan 2004
Beiträge: 1.916
3DMax ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Original geschrieben von PHP-Desaster
Das Problem ist allerdings, dass du nicht sicher sein kannst, dass die Eingabedaten gültiges XML/HTML sind.
stimmt schon. nur soll es ja ein webspider werden, da kann oder sollte man dann schon von gültigem html ausgehen. ungültige seiten werden dann halt nicht erfasst.
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Die RIGID-FLEX-Technologie
Die RIGID-FLEX-TechnologieDie sogenannte "Flexible Elektronik" , oftmals auch als "Flexible Schaltungen" bezeichnet, ist eine zeitgemäße Technologie zum Montieren von elektronischen Schaltungen.

06.12.2018 | Berni

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni


 

Aktuelle PHP Scripte

Formmailer v1.6.1 Bootstrap 4

Formmailer v1.6.1 Bootstrap wurde extra für Bootstrap entwickelt. Mit Bootstrap kann man schnell und einfach kleine oder große Projekte entwickeln, die auf Geräten in allen erdenklichen Formen funktionieren.

18.12.2018 arne-home | Kategorie: PHP/ Formular
HeidiSQL - kostenloses MySQL front-end Editor für Windows ansehen HeidiSQL - kostenloses MySQL front-end Editor für Windows

HeidiSQL - ist ein Windows-Editor für die bekannt open Source Datenbank mySQL

10.12.2018 Berni | Kategorie: MYSQL/ Management
piwik Open-Source Webanalyse-Software ansehen piwik Open-Source Webanalyse-Software

piwik ist eine gute Alternative zu Google Analytics. Viele Features und ein modernes Erscheinungsbild mit aussagefähigen Statistiken in Echtzeit

10.12.2018 phpler | Kategorie: PHP/ Besucherzaehler
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 15:15 Uhr.