Logisches Problem mit Table / Wortsuche

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Logisches Problem mit Table / Wortsuche

    Hi,

    ich habe ein logisches Problem.

    Ich habe z.B. den Satz "Dies ist ein Satz mit einigen Worten"

    Den zerlege ich mit explode() nach Leerstellen, habe also ein Array, in dem die einzelnen Worte stehen.

    Dann habe ich eine SQL-Tabelle, die etwa so aufgebaut ist (vereinfacht):

    ID Wort1 Wort2 ...
    1 worten satz
    3 ist worten
    4 nicht satz

    Ich will jetzt als Treffer die ersten beiden Zeilen, (also Wort 1 und Wort 2 sollen beide im Satz vorhanden sein, Reihenfolge ist egal) bei Treffern in nur einer Spalte soll das kein Treffer sein.

    Momentan suche ich nach einem Wort und laß das zweite in einer while-Schleife aus dem Array raussuchen. Das ist nicht nur unelegant, das funktioniert auch nicht immer, je nach Satzkonstellation.

    Geht das auch rein als SQL-Query?

    Danke schonmal,

    Pust

  • #2
    Hallo,

    da für musst du ganz anders rangehen. Zuerst brauchst du eine normalisierte und indizierte Datenbank und dann noch etwas Abfragelogik.

    So wie du es jetzt machst, mag es zwar für zwei Sätze funktionieren, aber wenn du mal richtig viele Daten in der Tabelle hast, knüpft sich PHP aus deiner Schleife einen Strick.

    Gruß,

    Amica
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      Okay, das dachte ich mir. Ich weiß nur nicht, wie ich die Datenbank normalisieren soll, da ja in der Zeile

      ID Wort1 Wort2 mehr weiteres ... ...

      noch mehr Daten sind. Ich kann das kaum noch auseinandernehmen. Die zwei Wörter am Anfang müssen zwingend miteinander kombiniert sein, weil die ja fest mit den Daten, die danach kommen verknüpft sind.

      Und eine Selectanfrage, die sowas macht wie ...WHERE Wort1=$wort1 AND Wort2=$wort2
      innerhalb einer Schleife laufen zu lassen, die alle Arrays durchläuft, klingt für mich ziemlich nach einem Sakrileg an der Performance...

      Kommentar


      • #4
        Was sind denn das für Spalten nach Wort1 und Wort2? So wie ich dich verstanden habe, kommt für jedes Wort in einem Satz eine eigene Spalte. Oder stimmt das nicht? Wenn doch, wäre das totaler Blödsinn und sollte über eine 1:n- oder, noch besser, n:m-Beziehung aufgelöst werden.

        Wenn die Tabelle erstmal nichts mit dem Satz zu tun hat, sondern nur eine Art gespeicherten Suchfilter darstellt, dann würde ich gar nicht erst den Umweg über explode gehen, sondern gleich sowas wie
        Code:
        select ...
        from ...
        where $satz like concat('% ', `wort1`, ' %')
            and $satz like concat('% ', `wort2`, ' %');
        suchen. Damit er auch das erste und das letzte Wort findet, vorher
        PHP-Code:
        $satz " " $satz " "
        setzen und natürlich real-escapen. Oder sowas in der Art.
        Zuletzt geändert von AmicaNoctis; 21.01.2010, 16:16.
        [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
        Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
        Super, danke!
        [/COLOR]

        Kommentar


        • #5
          Hi!

          Das mit dem concat klingt schonmal ziemlich gut, damit werde ich mal experimentieren.

          Mit LIKE möchte ich nicht so gerne was machen, weil es mein Ergebnis verfälscht, es soll ja z.B. nicht das Wort "schein" finden, wenn das Wort "unscheinbar" vorkommt. Da kann ich wirklich nur nach ganzen Worten gehen, die nach einem Leerzeichen beginnen und auch mit einem wieder aufhören (Satzzeichen werden entfernt).

          Zu Deiner anderen Frage:

          Ein konkretes Beispiel wäre, wenn jemand in das Textform eingibt:

          "Ich möchte ein Rezept für einen Cocktail"

          ID - wort1 -- wort2 ---- RezeptA ---------------- RezeptB --- usw.
          0 - rezept - cocktail -- Man nehme ein Glas... Man nehme 5cl.....

          Mit mehr als 2 Schlüsselworten wird es mir dann allerdings zu aufwändig.

          Hm, wie schlägst Du eine Lösung mit einer m:n-Beziehung vor? Möglicherweise ist das zwar jetzt mehr Arbeit, aber später weniger Aufwand, wenn ich das erweitern will...
          Zuletzt geändert von Pust; 23.01.2010, 00:33.

          Kommentar


          • #6
            In dem geposteten Beispielcode habe ich dieses Leerzeichenproblem bereits berücksichtigt. Wenn du genau hinsiehst, erkennst du, dass es "Prozent, Leerzeichen, wort1, Leerzeichen, Prozent" lautet und damit es auch das erste und letzte Wort findet, hab ich den Hinweis gegeben, $satz vorher links und rechts mit einem Leerzeichen zu erweitern.

            [COLOR="Red"]Edit[/COLOR]: Was stellen RezeptA und RezeptB dar? Vor allem, was ist "usw."? Kommt dort noch Rezept C, D, E? Das klingt sehr nach schlechtem Design. Also wäre es besser, eine Stichworttabelle, eine Rezepttabelle und eine n:m-Tabelle mit Verweisen auf die anderen beiden zu haben.

            Gruß,

            Amica
            Zuletzt geändert von AmicaNoctis; 23.01.2010, 02:30.
            [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
            Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
            Super, danke!
            [/COLOR]

            Kommentar


            • #7
              Dahinter kommen nur noch allgemeine Informationen, die für die ganze Zeile gelten, z.B. "ohne Alkohol" oder sowas. Das ist auch nicht weiter relevant.

              Lediglich die Zeile soll gefunden werden, wenn der Satz, den der User eingegeben hat, "rezept" UND "cocktail" enthält.

              Diese Zeile soll auch beim Satz "Ich suche ein Rezept für einen Cocktail" und "Für einen Cocktail suche ich ein Rezept" gefunden werden.

              PHP-Code:
              $satzdb=preg_replace('/[^a-zA-Z 0-9äöüÄÖÜß]/'''$satz);
              $satzdb=" ".$satzdb." ";

              $query=mysql_query("select * FROM cocktails WHERE $satzdb like concat('% ', wort1, ' %') 
              and 
              $satzdb like concat('% ', wort2, ' %') ORDER BY RAND() LIMIT 1"
              or die (
              mysql_error()); 
              Gibt mir einen SQL-Fehler aus (Beispiel erster Satz):
              You have an error in your SQL syntax; ...near 'suche ein rezept für einen cocktail like concat('% ', wort1, ' %') and ich suc' at line 1

              Edit:
              Die Rezepte und alles weitere dahinter ist nur Information, die ausgegeben wird, nichts weiter. Es sollen halt zwei Rezepte angezeigt werden.
              Zuletzt geändert von Pust; 10.02.2010, 17:54.

              Kommentar

              Lädt...
              X