PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks. |
 |

15-12-2010, 14:16
|
beginner123
Registrierter Benutzer
|
|
Registriert seit: Nov 2010
Beiträge: 42
|
|
Google-Suchvorschläge abfragen
Hallo,
ich möchte die Vorschläge, die Google beim Eintippen von Suchwörtern gibt, abfragen. Dazu habe ich folgendes gefunden:
http://google.com/complete/search?ou...ar&q=Webmaster
Diese URL liefert für beliebige Keywords (statt "Webmaster") eine XML-Datei. Wenn ich diese jedoch mit file_get_contents($URL) abfrage, erhalte ich keine sinnvolle Rückgabe.
Ich habe in der Google Web Search API gesucht, aber ich glaube, das beinhaltet auch nicht das, was ich möchte.
Irgendeine Idee, wo ich noch suchen könnte? Danke!
|

17-12-2010, 16:10
|
pascal007
Registrierter Benutzer
|
|
Registriert seit: Jul 2006
Beiträge: 257
|
|
Was liefert den file_get_contents($URL) zurück? Unter "nicht sinnvoll" kann sich glaube ich niemand was vorstellen  .
|

18-12-2010, 00:35
|
 |
fireweasel
Registrierter Benutzer
|
|
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
|
|
Zitat:
Zitat von beginner123
Hallo,
ich möchte die Vorschläge, die Google beim Eintippen von Suchwörtern gibt, abfragen. Dazu habe ich folgendes gefunden:
http://google.com/complete/search?ou...ar&q=Webmaster
Diese URL liefert für beliebige Keywords (statt "Webmaster") eine XML-Datei. Wenn ich diese jedoch mit file_get_contents($URL) abfrage, erhalte ich keine sinnvolle Rückgabe.
|
Diese "Schnittstelle" kannte ich bisher noch nicht. Gibts dafür keine offizielle Dokumentation?
Zitat:
Irgendeine Idee, wo ich noch suchen könnte? Danke!
|
Bei mir hat es beim ersten Versuch geklappt ...
Prüfe den Rückgabewert von file_get_contents(). Ist es kein String (sondern FALSE), dann wurde höchstwarscheinlich auch eine (aussagekräftige) Warnung oder Fehlermeldung generiert. Also error_reporting() hochdrehen.
Kommt ein String zurück, dann solltest du ihn mal durch htmlspecialchars() laufen lassen, bevor du ihn im Browser anzeigen lässt.
|

19-12-2010, 13:11
|
beginner123
Registrierter Benutzer
|
|
Registriert seit: Nov 2010
Beiträge: 42
|
|
Sorry, "nicht sinnvoll" heißt in diesem Fall leer.
|

19-12-2010, 13:52
|
TobiaZ
 Moderator
|
|
Registriert seit: Jan 2001
Ort: MUC und MGL, Germany
Beiträge: 34.421
|
|
Und? Mal gedebuggt warum leer?
|

19-12-2010, 22:08
|
 |
fireweasel
Registrierter Benutzer
|
|
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
|
|
Zitat:
Zitat von beginner123
Sorry, "nicht sinnvoll" heißt in diesem Fall leer.
|
Für den Fall, dass der tatsächlich leer ist (also Länge gleich 0 Zeichen), schrub ich bereits:
Zitat:
Zitat von firefiesel;
... Kommt ein String zurück, dann solltest du ihn mal durch htmlspecialchars() laufen lassen, bevor du ihn im Browser anzeigen lässt.
|
Der scheinbar leere String könnte nämlich durchaus Text (XML) enthalten, nur sieht man den nicht ohne weiteres, wenn man ihn einfach so im Browserfenster ausgibt.
|

20-12-2010, 11:02
|
beginner123
Registrierter Benutzer
|
|
Registriert seit: Nov 2010
Beiträge: 42
|
|
Ich bekomme z.B. mit dem Titel "Krankenkosten" (URL http://google.com/complete/search?ou...=Krankenkosten) folgende Rückgabe:
Gebe ich das in den Browser ein, erscheint:
<toplevel>
−
<CompleteSuggestion>
<suggestion data="krankenkosten steuerlich absetzbar"/>
<num_queries int="679"/>
</CompleteSuggestion>
−
<CompleteSuggestion>
<suggestion data="krankenkosten absetzbar"/>
<num_queries int="831"/>
</CompleteSuggestion>
usw.
Nach dem Code: $s = file_get_contents($URL);
Länge URLContent ( http://google.com/complete/search?ou...rankenkosten): 32
Nach $s = htmlspecialchars($s);
Rückgabe: <?xml version="1.0"?><toplevel/>, Länge: 54
Nach: $doc = DOMDocument::loadXML($s);
Warning: DOMDocument::loadXML() [ domdocument.loadxml]: Start tag expected, '<' not found in Entity, line: 1 in /www/htdocs/....php on line 628
und nach: $list = $doc->getElementsByTagName ( "data" );
Fatal error: Call to a member function getElementsByTagName() on a non-object in /www/htdocs/....php on line 629
|

20-12-2010, 11:42
|
AmicaNoctis
 Moderatorin
|
|
Registriert seit: Jul 2009
Beiträge: 5.709
|
|
Hallo,
in deinem Posting fehlt die Frage. Lies dir die Fehlermeldungen durch und prüfe nach, was du gemacht haben könntest, das diese Fehlermeldung verursacht hat. Befreie deinen Code von Altlasten, die du zu Test- und/oder reinen Ausgabezwecken drin hattest und gehe strikt nach dem Handbuch zu DOMDocument vor.
Gruß,
Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt? 
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke! 
|

20-12-2010, 12:15
|
beginner123
Registrierter Benutzer
|
|
Registriert seit: Nov 2010
Beiträge: 42
|
|
@fireweasel
Bei Dir scheint da ja etwas gültiges zurückgekommen zu sein, oder? Muss man vielleicht irgendwas noch tun, bevor man diese URL mit file_get_contents ausliest?
Danke!
|

20-12-2010, 14:06
|
AmicaNoctis
 Moderatorin
|
|
Registriert seit: Jul 2009
Beiträge: 5.709
|
|
Lies mal nach, was htmlspecialchars eigentlich macht und ob es sinnvoll ist, XML-Code damit zu behandeln, wenn du ihn nicht ausgeben, sondern in ein DOM parsen willst.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt? 
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke! 
|

20-12-2010, 16:39
|
beginner123
Registrierter Benutzer
|
|
Registriert seit: Nov 2010
Beiträge: 42
|
|
@AmicaNoctis
Das war nur ein Versuch aufgrund des Hinweises von fireweasel.
Ich habe jetzt folgenden Code vorgeschaltet:
Code:
$snoopy = new Snoopy;
$snoopy->fetch($urlend);
$hdrs = @get_headers($urlend);
return is_array($hdrs) ? preg_match('/^HTTP\\/\\d+\\.\\d+\\s+2\\d\\d\\s+.*$/',$hdrs[0]) : false;
Das hat mir schon mal geholfen, andere URLs zu lesen. Aber hat leider in diesem Fall nichts gebracht.
So bekomme ich für folgenden Code weiterhin diese Ausgabe:
Code:
echo "URL $URL<br>";
$res = url_check2($URL);
if (! ($res == false) ) {
$seiteninhalt = file_get_contents($URL);
echo "Länge URLContent ($URL): " . strlen($seiteninhalt) . "<br>";
echo "Rückgabe: $seiteninhalt, Länge: " . strlen($seiteninhalt) . "<br>";
$doc = DOMDocument::loadXML($seiteninhalt);
$list = $doc->getElementsByTagName ( "data" );
$nb = $list->length;
echo "Länge NodeList: $nb<br>";
Länge URLContent ( http://google.com/complete/search?ou...rankenkosten): 32
Rückgabe: , Länge: 32
Also mit 32 Zeichen irgendein Rückgabewert, aber auf keinen Fall das, was das Kopieren der URL im Browser bringt. Kann das am Format liegen, dass es eine XML-Datei ist, die man dort zurückbekommt? Und falls ja, wäre ich für jeden Hinweis, eine XML-Datei richtig zu lesen, denkbar.
|

21-12-2010, 12:13
|
ezkimo
Registrierter Benutzer
|
|
Registriert seit: Apr 2005
Ort: Beckum / Westf.
Beiträge: 279
|
|
Also Folgendes habe ich gerade herausgefunden:
Zunächst kannst Du auf Dein file_get_contents() komplett verzichten, da das DomDocument Objekt eigene Methoden liefert, die Dir diesen Schritt ersparen. Schaue hier einfach mal bei PHP: DOMDocument::load - Manual nach.
Dein zweiter Fehler ist, dass Du versuchst Elemente mit dem Tagname "data" zu ermitteln. Das zurückgelieferte XML Schema beinhaltet keine Tags mit dem Namen "data". Es sind lediglich "suggestion" Tags mit dem Attribut "data" vorhanden. Erkundige Dich, wie man mit dem DomDocument Objekt Attribute ermittelt.
Das sind aber Kleinigkeiten. Das größere Problem ist, dass das gelieferte XML Schema anhand des Stichwortes "Krankenkosten" nur ein leeres Element "toplevel" via DomDocument ausgelesen werden kann. Dieses XML Schema ist genau 32 Zeichen lang. Nehme ich ein Stichwort "Webdesign" kann das komplette XML Schema gelesen werden. Da ich jetzt die Dokumentation nicht finden konnte, weiss ich nicht, ob bestimmte Stichwörter nicht erlaubt sind oder dergleichen.
Geändert von ezkimo (21-12-2010 um 12:21 Uhr)
|
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
|
|
Themen-Optionen |
|
Thema bewerten |
|
Forumregeln
|
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.
HTML-Code ist aus.
|
|
|
|
PHP News
|