Einige allgemeine Fragen zur Performance

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Einige allgemeine Fragen zur Performance

    Moin Leute,

    bisher habe ich nur kleine Seite gebastelt, meist für mich und meinen Freundeskreis, nun wurschtel ich aber an etwas Größerem herum, und dabei kamen mir einige Fragen in den Sinn.

    Vorweg noch ein kleiner Kommentar zu meinen Ressourcen: Ich hab nur einen kleinen, virtuellen Webspace für 2 Euro im Monat, also keinen eigenen Rootserver oder solche Spielereien, darum mache ich mir langsam Gedanken.


    1) MySQL:

    1.1) Ich benutze meist "SELECT * FROM tabelle WHERE bla", und lade dann das Ergebnis in ein Object mit "mysql_fetch_object();" weil ich finde, dass das schön leicht zu handlen ist. Nun habe ich mir mal die Frage gestellt wie sinnvoll das wirklich ist, da ja meiner Meinung nach jedes Mal die komplette Tabelle abgearbeitet werden muss, um alle Datensätze zu finden.


    Macht es also Sinn meine Daten in möglichst viele, kleine Tabellen aufzuteilen, oder kann ich sie auch genausogut in einer Großen zusammenpacken ? Rein von der Logik würde ich sagen, dass viele kleine besser sind, doch ich habe relativ wenig Ahnung von der Materie, darum ersuche ich hier um Rat.

    1.2) Macht es Sinn, bzw. ist es möglich mehrere solcher Queries wie in 1.1) in einer Anfrage zu senden, oder kommt das letztendlich aufs Selbe raus, oder ist sogar noch aufwändiger ?

    1.3) Oder ist es generell perfomanter, wenn man anstatt "SELECT * FROM" z.B. "SELECT id FROM" benutzt, wobei man da dann ja wieder mehrere Anfragen benötigen würde, um alle relevanten Daten aus einem Datensatz zu erhalten. Da könnte evtl. auch die Antwort auf Frage 1.2) Abhilfe schaffen.

    2.) txt-Datei als DB

    2.1) Die nächste Frage kam auf, als ich mir überlegt habe, ob es auch ganz ohne MySQL geht. Man könnte für Informationen, die nur aus Zahlen-Werten bestehen, die IDs zugeordnet werden, evtl. auch Text-Dateien verwenden. Die Position des Wertes in der Datei entspräche dabei dann der ID, der sie zugeordnet wäre. Das wäre zwar vom Code her deutlich aufwändiger, als es einfach mit MySQL zu lösen, aber vielleicht ist es ja perfomanter ? Das ist die Frage. MySQL oder Datei besser für diesen Zweck geeignet ?


    3.) ' ' vs " "

    3.1) Ich habe hier im Forum einen Thread gelesen, in dem um die Tauglichkeit von '' und "" heiß diskutiert wurde. Ein relativ qualifiziert wirkender Mensch erklärte dann irgendwann, dass die doppelten Anführungszeichen "interpolieren" würden, die einfachen nicht, daher würden die Strings in einfachen Anführungszeichen schneller abgearbeitet. Soweit so gut, für mich heißt das -> "Benutze nurnoch einfache Anführungszeichen, die werden schneller abgearbeitet".

    Ich wüsste aber auch gerne warum das so ist. Interpolieren kenne ich nur aus der Stochastik, wenn man bei Wahrscheinlichkeits-Tabellen einen Zwischenwert von zwei dort eingetragenen Werten brauchte, dann musste man das mit den Wahrscheinlichkeiten anstellen um einen möglichst genauen Wert zu erhalten. Wie aber ist das im Bezug auf das Abarbeiten von Strings hier gemeint ?



    Danke schonmals für eure Antworten!

    Gruß,
    Aza

  • #2
    Okay, 3.) hat sich bereits erledigt.

    Bei "" werden Ersetzungen vorgenommen (\t wird als Tab erkannt, $test wird durch den Wert von $test ersetzt), bei '' wird der String so gespeichert, wie er auch im Quellcode steht (d.h. \t bleibt \t, auch ohne zusätzlichen \ davor, Variablen werden nicht ersetzt).

    Kommentar


    • #3
      Gleich kriegst Du von den Cracks hier folgendes gesagt:

      -Mehrere Tabellen sind schneller
      -SELECT * ist BÄH (besonders, wenn TEXT-Felder in der Datenbank drin sind)
      -Datenbanken sind schneller als Textfiles

      Warum genau das so ist, erklären die Dir sicher oder verweisen auf einen anderen Thread.... ;-)

      *duck*
      Gruß, Coni
      ~~ codito ergo sum - ich code, also bin ich! ~~

      Kommentar


      • #4
        -SELECT * ist BÄH (besonders, wenn TEXT-Felder in der Datenbank drin sind)
        Also wäre es besser immer direkt das Feld auszuwählen ? Wenn ich nun aber 5 oder 6 Felder aus einem Datensatz benötige, dann brauch ich doch total viele Queries. :>

        Kommentar


        • #5
          SELECT * ist unter anderem bäh, weil es meistens aus blanker Faulheit benutzt wird. Es werden nämlich alle Spalten der jeweiligen Datensätze ausgewählt, auch wenn man nachher gar nicht alle benötigt. Das kostet also unnötig Performance. Und nicht zu vergessen:

          Zitat aus dem Manual
          You should NEVER, in an application, use SELECT * and retrieve the columns based on their position, because the order in which columns are returned CANNOT be guaranteed over time; A simple change to your database may cause your application to fail rather dramatically.
          Nieder mit der Camel Case-Konvention

          Kommentar


          • #6
            -Mehrere Tabellen sind schneller
            wenn die Normalisierungsformen beachtet werden. Suche Normalisierung

            -SELECT * ist BÄH (besonders, wenn TEXT-Felder in der Datenbank drin sind)
            Sollte man nicht verallgemeinern. Aber generell gilt natürlich, dass man nur das holen soll, was man braucht. Übrigens, das hier
            "SELECT * FROM" z.B. "SELECT id FROM" benutzt, wobei man da dann ja wieder mehrere Anfragen benötigen würde, um alle relevanten Daten aus einem Datensatz zu erhalten.
            Ist totaler Schwachsinn. Du möchtest dir vielleicht erstmal ein paar Grundlagen aneignen, bevor du weitermachst. Ein "SELECT id, name, email FROM..." sollte wohl jeder schon mal gesehen haben.

            -Datenbanken sind schneller als Textfiles
            Ne Textdatei könnte man auch als Datenbank bezeichnen. Generell gillt natürlich, dass man ein vernünftiges DBMS verwenden sollte. Und dank SQL kann man dann auch tolle Abfragen erstellen, die man in Textdateien nie performant hinbekommen würde.

            Warum genau das so ist,
            oder auch eben nicht.

            3.1) also mein letzter Stand ist, dass " u.U. sogar schneller ist. Aber das ist nun wirklich Kinderkacke im gegensatz zu den Ansätzen, die du zuvor geliefert hast. Wichtig ist in diesem Zusammenhang nur, dass du Variablen nicht in die Strings passt. Das macht den code meist lesbarer und weniger fehleranfällig.

            Kommentar


            • #7
              Original geschrieben von Azadoras
              Also wäre es besser immer direkt das Feld auszuwählen ? Wenn ich nun aber 5 oder 6 Felder aus einem Datensatz benötige, dann brauch ich doch total viele Queries. :>
              Code:
              SELECT
                  column_1,
                  column_2,
                  column_3,
                  ... column_n
              FROM
                  table_name
              ...
              Nieder mit der Camel Case-Konvention

              Kommentar


              • #8
                Original geschrieben von Azadoras
                Also wäre es besser immer direkt das Feld auszuwählen ? Wenn ich nun aber 5 oder 6 Felder aus einem Datensatz benötige, dann brauch ich doch total viele Queries. :>
                Sag mal, wo hast du denn SQL gelernt? Schon mal sowas gesehen:

                select colA, colB, colC from tblA where id=...

                Kommentar


                • #9
                  OffTopic:
                  langsam...

                  Kommentar


                  • #10
                    Ah, super, das ist toll, ich danke euch sehr, prägnant auf den Punkt gebracht, was ich wissen wollte.

                    Doch ist mir nun noch eine weitere Frage eingefallen:

                    Ich benutze diverse Log-Tabellen, um z.B. den Besuch von einer IP aus nur einmal am Tag zu zählen, das mehrmalige Voten innerhalb von 24h und das Posten von Einträgen innerhalb von 30 Minuten zu verhindern.

                    Natürlich müllt das die Tabellen ziemlich voll, da dachte ich mir "Mensch, da schreibste einfach nen CronJob, der alle Einträge, die älter als 24h/30min sind löscht.

                    Nun stellt sich mir wieder die Frage, in welchen Zeitintervallen sich das Ausführen der Cronjobs lohnt. Einerseits beansprucht die Ausführung des Löschens an sich wohl einiges an Performance, insbesondere wenn es viele Datensätze sind. Andererseits müssen bei jedem Zugriff auf die Datenbank ja alle vorhandenen Einträge abgearbeitet werden.

                    Macht es eurer Ansicht nach prinzipiell mehr Sinn den CronJob öfter auszuführen und die Zahl der Datensätze klein zu halten, oder den Cronjob seltener auszuführen, und dafür die Zahl der Datensätze etwas höher anzusiedeln ?

                    Kommentar


                    • #11
                      Re: Einige allgemeine Fragen zur Performance

                      Eigentlich habe ich keine große Lust hier zu antworten, ähnliche Themen gibt's hier täglich. Ich "schubs" dich aber mal in die richtige Richtung mit dem Verweis auf die SuFu!
                      1.1) Ich benutze meist "SELECT * FROM tabelle WHERE bla", und lade dann das Ergebnis in ein Object mit "mysql_fetch_object();" weil ich finde, dass das schön leicht zu handlen ist. Nun habe ich mir mal die Frage gestellt wie sinnvoll das wirklich ist, da ja meiner Meinung nach jedes Mal die komplette Tabelle abgearbeitet werden muss, um alle Datensätze zu finden.
                      Mit dem * selektierst du alle Felder der Tabelle. Da du aber nicht alle benötigst (vielleicht kommen ja später noch welche dazu), solltest du auch nur die selektieren, die du auch wirklich benötigst. Ist auch viel übersichtlicher, da du direkt weißt, auf welche Werte du zugreifen kannst. Da erschlage ich 1.3 gleich mal mit! Du musst natürlich nicht jedes Feld einzeln selektieren, du kannst schon mehrere auswählen:
                      Code:
                      select id, title, content, foo, bar from mytable where id=123
                      Macht es also Sinn meine Daten in möglichst viele, kleine Tabellen aufzuteilen, oder kann ich sie auch genausogut in einer Großen zusammenpacken ? Rein von der Logik würde ich sagen, dass viele kleine besser sind, doch ich habe relativ wenig Ahnung von der Materie, darum ersuche ich hier um Rat.
                      Einfach besonders viele Tabellen anlegen, ist natürlich Blödsinn. Am besten ließt du dir mal diesen Wikipedia-Eintrag zu Datenbanken-Normalisierung durch. Wenn du dann irgendwann mal dazu kommst, eine Tabelle mit ner Millionen Datensätzen zu haben, gibt's hier schon nen Haufen Threads! -> SuFu

                      1.2) Macht es Sinn, bzw. ist es möglich mehrere solcher Queries wie in 1.1) in einer Anfrage zu senden, oder kommt das letztendlich aufs Selbe raus, oder ist sogar noch aufwändiger ?
                      Kennst du Joins?

                      2.1) Die nächste Frage kam auf, als ich mir überlegt habe, ob es auch ganz ohne MySQL geht. Man könnte für Informationen, die nur aus Zahlen-Werten bestehen, die IDs zugeordnet werden, evtl. auch Text-Dateien verwenden. Die Position des Wertes in der Datei entspräche dabei dann der ID, der sie zugeordnet wäre. Das wäre zwar vom Code her deutlich aufwändiger, als es einfach mit MySQL zu lösen, aber vielleicht ist es ja perfomanter ? Das ist die Frage. MySQL oder Datei besser für diesen Zweck geeignet ?
                      Lass den Quatsch. Die Datenbankensysteme sind dafür ausgelegt, große Datenmengen performant zu verwalten. Da brauchst du nicht dein eigenes txt-File-DB-System in PHP zusammen frickeln. Die einzigen Textfiles sind INI-Dateien für die Konfigurationen


                      3.1) Ich habe hier im Forum einen Thread gelesen, in dem um die Tauglichkeit von '' und "" heiß diskutiert wurde. Ein relativ qualifiziert wirkender Mensch erklärte dann irgendwann, dass die doppelten Anführungszeichen "interpolieren" würden, die einfachen nicht, daher würden die Strings in einfachen Anführungszeichen schneller abgearbeitet. Soweit so gut, für mich heißt das -> "Benutze nurnoch einfache Anführungszeichen, die werden schneller abgearbeitet".
                      Du sagst zwar, das hätte sich schon erledigt, aber trotzdem nochmal ein paar Tackte.
                      Es ist generell eh sauberer und weniger fehleranfällig, Strings vernünftig zu verketten. Also:
                      PHP-Code:
                      echo "hier ist ".$irgendwas." und ".$foo[123].$bar."<br />";
                      // anstatt von
                      echo "hier ist $irgendwas und {$foo[123]}$bar<br />"
                      Wobei ich gar nicht mal weiß, ob ich das Array in der zweiten Zeichenkette korrekt eingefügt habe!
                      Andererseits ist nur der Einsatz von Hochkommata auch Käse, wenn du Escapesequenzen wie \t oder \n verwendest.
                      Wie (ich glaube er was) asp2php im anderen Thread gesagt hat: wenn du auch in anderen Programmiersprachen arbeitest, sind meist die Anführungszeichen für Strings und Hochkommata für einzelne Buchstaben. Da sitzt dir das schon im Blut und du wendest automatisch entsprechende Zeichen an.
                      Performancemäßig ist dieses Problem aber eine ganz andere Hausnummer, als deine Nummer 1!

                      Bevor du dir jetzt aber zu viele Sorgen um solche "Performanceprobleme" machst, Sorge dafür, sauber zu Programmieren und Konzeptionieren.

                      Kommentar


                      • #12
                        Hm ... nichts ist leichter als löschen , 1 mal am Tag reicht völlig aus. wieviele Hits hast du denn pro Tag auf deiner Seite?

                        Kommentar


                        • #13
                          Original geschrieben von TobiaZ
                          OffTopic:
                          langsam...
                          Und ich erstmal. Als ich anfing, hatte dieser Thread nur 5 Beiträge

                          Kommentar


                          • #14
                            Besonderen Dank nochmals an PHP-Desaster, der sich ja richtig Mühe gemacht hat mit der Antwort.

                            Hm ... nichts ist leichter als löschen , 1 mal am Tag reicht völlig aus. wieviele Hits hast du denn pro Tag auf deiner Seite?
                            Noch garkeine, die Seite ist noch in Planung. Wenn es aber klappt wie geplant dürften es relativ viele werden.

                            Kommentar


                            • #15
                              OffTopic:
                              *lol*
                              Wußte ich doch, daß die gleich kommen!
                              Und wow, dreimal fast die gleiche Antwort hintereinander das SELECT a,b,c ... betreffend!

                              Gruß, Coni
                              ~~ codito ergo sum - ich code, also bin ich! ~~

                              Kommentar

                              Lädt...
                              X