php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 04-08-2011, 15:18
Besth
 Registrierter Benutzer
Links : Onlinestatus : Besth ist offline
Registriert seit: Mar 2006
Beiträge: 249
Besth ist zur Zeit noch ein unbeschriebenes Blatt
Standard Verzeichnis auslesen nach bestimmten Kriterien

Hallo,
ich möchte gern ein Verzeichnis auslesen, dabei aber am Ende nur die Dateien bekommen, die einem bestimmten Kriterium entsprechen
Bisher habe ich folgendes:
PHP-Code:
if ($handle opendir("pfad")) {
  while (
false !== ($file readdir($handle))) {
// $pattern = "";
//    if ( preg_match($pattern, $file) )
    
echo $file."<br>";
  }
  
closedir($handle);

Nun scheitert es bei mir bei dem preg_match Pattern.
Die Dateien haben folgende Struktur:
jfBI8BJKD_page_0001.png
jfBI8BJKD_page_0002.png
jfBI8BJKD_page_0003.png
3kGsd78J_page_0001.png
3kGsd78J_page_0002.png
usw
Am ende möchte ich nur wissen wieviele "Seiten" (Bilder) jede Nummer hat.

Muss ich da überhaupt mit preg_match rangehen oder gibt es etwas performanteres? Das Verzeichnis kann später unter Umständen >100.000 Dateien beinhalten
__________________
Mess with the Besth, die like the rest!
Mit Zitat antworten
  #2 (permalink)  
Alt 04-08-2011, 15:29
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

ich würde da mit einem FilterIterator über einem DirectoryIterator herangehen und dann einen Gruppenwechsel machen.

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 04-08-2011, 16:08
wahsaga
  Moderator
Links : Onlinestatus : wahsaga ist offline
Registriert seit: Sep 2001
Beiträge: 25.236
wahsaga befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von Besth Beitrag anzeigen
Das Verzeichnis kann später unter Umständen >100.000 Dateien beinhalten
Dann kannst du Performance aber gleich auf den „ist mir nicht so wichtig“-Zettel notieren ...

Zitat:
jfBI8BJKD_page_0001.png
jfBI8BJKD_page_0002.png
jfBI8BJKD_page_0003.png
3kGsd78J_page_0001.png
3kGsd78J_page_0002.png
Da gehört m.E. anstelle des ersten Unterstriches ein Slash rein, wenn das halbwegs performant umgesetzt werden soll.
__________________
I don't believe in rebirth. Actually, I never did in my whole lives.
Mit Zitat antworten
  #4 (permalink)  
Alt 05-08-2011, 13:42
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Besth Beitrag anzeigen
Hallo,
ich möchte gern ein Verzeichnis auslesen, dabei aber am Ende nur die Dateien bekommen, die einem bestimmten Kriterium entsprechen
Bisher habe ich folgendes:
PHP-Code:
if ($handle opendir("pfad")) {
  while (
false !== ($file readdir($handle))) {
// $pattern = "";
//    if ( preg_match($pattern, $file) )
    
echo $file."<br>";
  }
  
closedir($handle);

Nun scheitert es bei mir bei dem preg_match Pattern.
Und an welcher Stelle im Pattern, wenn man fragen darf?

Zitat:
Die Dateien haben folgende Struktur:
jfBI8BJKD_page_0001.png
jfBI8BJKD_page_0002.png
jfBI8BJKD_page_0003.png
3kGsd78J_page_0001.png
3kGsd78J_page_0002.png
usw
Ist die Unterscheidung von Groß- und Kleinschreibung wichtig oder nicht?

Gibts in dem Verzeichnis noch Dateien mit anderem Namensmustern? Dann wird das "Pattern" länger. Wenn nicht, reicht es, die Ziffern vor dem ".png" zu erfassen.

Ist die Zeichenanzahl aller Namen gleich? Dann reicht substr().

Zitat:
Am ende möchte ich nur wissen wieviele "Seiten" (Bilder) jede Nummer hat.
Ach so, also eine Art Fold-Funktion für ein Verzeichnis.

Zitat:
Muss ich da überhaupt mit preg_match rangehen oder gibt es etwas performanteres? Das Verzeichnis kann später unter Umständen >100.000 Dateien beinhalten
Erstmal ist preg_match() per se nicht "unperformant". Woher kommen nur immer diese irrigen Annahmen?[0]

Ob du preg_match() oder eine ähnliche Mustersuchfunktion[1] benötigst, hängt (wie oben schon angedeutet) von den Namensmustern ab, die vorhanden sind und welche davon du "einfangen" möchtest.

Bei Verzeichnissen, die mehrere 100k Einträge haben, dürfte der Overhead von preg_match() nicht ins Gewicht fallen.

Dagegen habe ich bei Tests an Verzeichnissen mit ein paar tausen Einträgen unter Windows mit NTFS festgestellt, dass die gewöhnlichen Verzeichnisfunktionen (opendir(), readdir(), ...) oder das Dir-Objekt 50 bis 100 Prozent schneller sind als die SPL-Directory-Iteratoren. Frag mich aber bitte nicht, warum[2]. Ich war selbst überrascht, dass ein Haufen PHP-Script-Code einen Haufen C so deutlich schlägt ...

PHP-Code:
// Der Default-Wert von $pcre ist ein Vorschlag.
// Er lässt sich sicher noch optimieren.
// Aber erstmal funktioniert er.

function count_files(
    
$url/// string() directory path
    
$pcre '/\A(.+)[0-9]+\.png\z/'/// string(pcre) regex pattern
    
$xmpl_basename 'jfBI8BJKD_page_0001.png' /// for testing the regex
) {
    if (
        !
is_int(@preg_match($pcre$xmpl_basename$hits)) ||
        
count($hits) < // we use $hits[1] later
    
) {
        return 
null// invalid regex pattern
    
}
    if (!
is_resource($dir opendir($url))) {
        return 
null// could not open directory
    
}
    
$pwd getcwd(); // memoize current working dir
    
if (!chdir($url)) {
        return 
null// could not change current working dir
    
}
    
$accu = array (); /// assoc array
    
while (is_string($entry readdir())) {
        if (!
is_file($entry)) {
            continue; 
// skip non-files
        
}
        if (!
preg_match($pcre$entry$hits)) {
            continue; 
// skip non-matching filenames
        
}
        
$base $hits[1]; // if file-system is case-sensitive
        
if (!isset ($accu[$base])) {
            
$accu[$base] = 0;
        }
        
$accu[$base] += 1;
    }
    
closedir($dir);
    
chdir($pwd); // switch back to previous working dir
    
return $accu;


[0] Die gerne zitierte Aussage im PHP-Handbuch, dass preg_match() und Kollegen nicht für "einfache" String-Suche benutzt werden sollten, ist Unsinn. Die "Performance" hängt immer vom konkreten Anwendungsfall ab.

[1] PHP hat bspw. auch glob(), fnmatch() und einen "FilterIterator", der über Verzeichnisse operieren kann.

[2] Vermutlich bauen die den üblichen Opendir-readdir-closedir-Ablauf auch nur als C-Version mit den Funktionen der Zend-Engine nach und packen dann den Iterator-Krempel obendrauf.

P.S.: Man lernt eben nie aus: Ich wollte gerade einen vermeintlichen Fehler berichtigen, und readdir() durch readdir($dir) zu ersetzen, stellte aber fest, dass das Script auch ohne extra Argument funktioniert. Im Handbuch ist keine PHP-Versionsnummer erwähnt, ab der dieses Argument optional wurde. Was heißt: Das war höchstwahrscheinlich schon immer so ...

Geändert von fireweasel (05-08-2011 um 14:35 Uhr)
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Objekte sortieren nach bestimmten Kriterien Danni78h PHP Developer Forum 8 14-06-2013 19:02
Tabelle nach mehreren Kriterien auslesen knaller SQL / Datenbanken 4 04-09-2005 14:12
Verzeichnis nach bestimmten Dateien suche ??? otto-mueller PHP Developer Forum 15 26-02-2004 00:24
Variable nach bestimmten Kriterien durchkämmen DuRoX PHP Developer Forum 11 28-05-2003 14:13
Datein einlesen nach bestimmten vorgegebenen Kriterien MHeiss PHP Developer Forum 4 13-07-2001 19:05

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 15:08 Uhr.