PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr

PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr (https://www.php-resource.de/forum/)
-   Apps und PHP Script Gesuche (https://www.php-resource.de/forum/apps-und-php-script-gesuche/)
-   -   10 am häufigsten benutzten Wörter finden (https://www.php-resource.de/forum/apps-und-php-script-gesuche/86077-10-am-haeufigsten-benutzten-woerter-finden.html)

WebDödel 09-08-2007 16:33

10 am häufigsten benutzten Wörter finden
 
Hallo,

ich bin auf der Suche nach einem kleinen php script welches eine URL aufruft und mir dann die 10 am häufigsten vorkommenden Wörter ausgibt (oder in ein Array oder DB übergibt). Von Vorteil wäre auch eine Beachtung einer blacklist mit Wörtern die das script nicht zählen soll.

Das größte Problem hierbei ist das evtl. JavaScript-Passagen und Style-Definitionen im Quellcode nicht mit berücksichtigt werden sollen. (strip_tags() entfernt leider nur html-tags).

Vielleicht habt ihr ja einen Ansatz oder für mich.

Schon mal vielen Dank.

jahlives 09-08-2007 16:53

PHP-Code:

$worte str_word_count($str,1);
$count = array();
foreach(
$worte as $wert){
  if(!
key_exists($wert,$count)){
    
$count[$wert] = 1;
  }else{
    
$count[$wert] += 1;
  }


Dann den Array $count nach den Werten absteigend sortieren und die 10 ersten ziehen.
Zitat:

(strip_tags() entfernt leider nur html-tags).
woher diese Info ?
Gruss

tobi

WebDödel 09-08-2007 17:32

tach,

erstmal danke.

Zitat:

quote:
(strip_tags() entfernt leider nur html-tags).


woher diese Info ?
hatte das problem vor kurzem. strip_tags() hat nicht mal xhtml-tags (z.B. <br /> entfernen können.

Zitat:

Dann den Array $count nach den Werten absteigend sortieren und die 10 ersten ziehen.
wenn ich $count sortieren lassen habe ich net viel davon, nur ein array welches mir absteigende zahlen ausgibt aber net die dazugehörigen wörter.,

gruß

jahlives 09-08-2007 17:53

Zitat:

wenn ich $count sortieren lassen habe ich net viel davon, nur ein array welches mir absteigende zahlen ausgibt aber net die dazugehörigen wörter.,
Drum stehen die Wörter ja jeweils als Key im Array !$
Btw hat du überhaupt verstanden was der Code macht ??

TobiaZ 09-08-2007 17:59

asort :rtfm:

WebDödel 09-08-2007 18:02

Zitat:

Drum stehen die Wörter ja jeweils als Key im Array !
vor dem sortieren geb ich dir recht, nach dem sortieren mit z.B. rsort($count) net mehr. warum auch immer.

hast du nen plan wie man die css anweisungen entfernen kann? str_replace() evtl. ?

gruß

edit:

ich sollte man arsort() nehmen. sorry war blind.

TobiaZ 09-08-2007 18:04

Zitat:

hast du nen plan wie man die css anweisungen entfernen kann? str_replace() evtl. ?
nur wenn du weißt, wie sieht heißt, bzw. geschrieben ist. ansonsten preg_replace.

WebDödel 09-08-2007 18:25

Zitat:

nur wenn du weißt, wie sieht heißt, bzw. geschrieben ist. ansonsten preg_replace.
viele wege führen nach rom. einer der gründe warum ich mich in foren registriere ist die meinung anderer Leute die evtl. ein "bissl" mehr Erfahrung haben als ich.
Wenn mir also jemand einen anderen besseren Weg aufzeigt bin ich gern bereit diese Erkenntnisse zu nutzen.

danke

TobiaZ 09-08-2007 18:28

OffTopic:
war doch ganz sachlich geantwortet. wer wird denn da gleich rumzicken?

WebDödel 09-08-2007 18:39

Zitat:

war doch ganz sachlich geantwortet. wer wird denn da gleich rumzicken?
sorry wenn das so rüber gekommen ist. sollte gar net zichig sein. hab wirklich nur mitteilen wollen das ich mich hauptsächlich zum Erfahrungsaustausch in Foren anmelde.

Was anderes:

bei dem von jahlives stamnmenden codeschnipsel kickt der mir alle umlaute raus. da hab ich aber nur wirklich keinen lösungsansatz.

TobiaZ 09-08-2007 18:45

abermals str_word_count :rtfm:

Zitat:

Beachten Sie bei der Verwendung dieser Funktion, dass "Wörter" als locale-abhängige Strings interpretiert werden, die nur die Buchstaben des Alphabets enthalten. Sie dürfen außerdem "'"- und "-"-Zeichen enthalten, jedoch nicht damit beginnen.
Zitat:

charlist
Eine Liste zusätzlicher Zeichen, die ebenfalls als 'Wort' betrachtet werden

WebDödel 09-08-2007 19:02

Zitat:

Beachten Sie bei der Verwendung dieser Funktion, dass "Wörter" als locale-abhängige Strings interpretiert werden, die nur die Buchstaben des Alphabets enthalten. Sie dürfen außerdem "'"- und "-"-Zeichen enthalten, jedoch nicht damit beginnen.
ok, weder dort noch in meinem schlauen buch welches vor mir liegt steht drin das str_word_count() auch codierungen missachtet bzw. rauskickt. so schlau war ich vorher schon umlaute zu ersetzen.

PHP-Code:

&#228; für ä 

Zitat:

charlist
Eine Liste zusätzlicher Zeichen, die ebenfalls als 'Wort' betrachtet werden
leider net in meiner php-version (4.4.irgendwas). dauert auch noch ne weile bis redhat php 5.1 als stabil und sicher frei gibt. vorher kommt das net auf meinen webserver.

danke und gruß

TobiaZ 09-08-2007 19:17

Zitat:

ok, weder dort noch in meinem schlauen buch welches vor mir liegt steht drin das str_word_count() auch codierungen missachtet bzw. rauskickt.
Wenn man diese Kodierungen zu den "Buchstaben des Alphabets" zäht, hast du recht. ;)

WebDödel 09-08-2007 19:23

Zitat:

Wenn man diese Kodierungen zu den "Buchstaben des Alphabets" zäht, hast du recht.
Davon steht leider nix in meinem Büchlein (trotz der 1000 seiten). Und ständig das manual zu lesen wäre zu einfach :D .

Ich gelobe Besserung.

Gruß


Alle Zeitangaben in WEZ +2. Es ist jetzt 14:07 Uhr.

Powered by vBulletin® Version 3.8.2 (Deutsch)
Copyright ©2000 - 2019, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.3.0
[c] ebiz-consult GmbH & Co. KG