php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > PHP Developer Forum
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


PHP Developer Forum Hier habt ihr die Möglichkeit, eure Skriptprobleme mit anderen Anwendern zu diskutieren. Seid so fair und beantwortet auch Fragen von anderen Anwendern. Dieses Forum ist sowohl für ANFÄNGER als auch für PHP-Profis! Fragen zu Laravel, YII oder anderen PHP-Frameworks.

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 15-11-2010, 15:27
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard Sonderzeichen / UTF-8-Problematik bei Import von Wikipedia

Hallo,

ich lasse mir aus einigen Einträgen automatisiert einen Index erstellen, und lese - wo vorhanden - dafür einige Teile von Wikipedia ein.

Das einlesen sieht so aus:
Code:
$URL = "http://de.wikipedia.org/wiki/" . $urlend;
$URL = utf8_encode($URL);
$seiteninhalt = file_get_contents($URL);
Sowohl die PHP-Datei, die das macht, als auch die erzeugte HTML-Datei enthalten den Eintrag charset=UTF-8.

Trotzdem erhalte ich sehr unschöne Effekte mit allen Sonderzeichen, ein Beispiel:
Zitat:
Die <b>Demografie</b> (auch <b>Demographie</b>, griech. <b>δημογραφία</b>, von <i>δήμος, démos â€" Volk</i> und <i>γραφή, grafé â€" Schrift, Beschreibung</i>) bzw. <b>Bevölkerungswissenschaft</b>
Was mache ich da noch falsch? Danke!
Mit Zitat antworten
  #2 (permalink)  
Alt 15-11-2010, 15:33
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

dann codierst du es vermutlich doppelt als UTF-8.

Genaueres kann man nicht sagen. Bei deinen Angaben, wo du überall UTF-8 angibst, hättest du etwas mehr ins Detail gehen oder ein Onlinebeispiel liefern können.

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 15-11-2010, 15:41
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard

Hmm, ich versuche mal, mehr Details zu geben:

Code:
            $URL = "http://de.wikipedia.org/wiki/" . $urlend;
            $URL = utf8_encode($URL);

            $seiteninhalt = file_get_contents($URL);
            // Anfang weg bis hier
            $pos = strpos($seiteninhalt, '<h1 id="firstHeading" class="firstHeading">');
            if ($pos > 0) {
               $seiteninhalt = substr($seiteninhalt, $pos);
            }
Dann kommt noch div. anderes. Es bleibt ein String übrig, mit möglichst wenigen HTML-Kommandos. Und den füge ich dann an passender Stelle ein und schreibe die neue HTML-Datei:

Code:
if (strlen($URLcontent) > 0) {
         $pos1 = strpos($all, "-- INHALTSBESCHREIBUNG --");
         $pos2 = strpos($all, "-- INHALTSBESCHREIBUNG_ENDE --");
         if ($pos1 !== false and $pos2 !== false) {
            $all = substr($all, 0, $pos1 - 2) . $URLcontent . substr($all, $pos2 + 31);
         } 

      $filename = $keyword . ".html";
      $handle   = fopen ($themeindexpath . $filename, "w");
      if (! fwrite($handle, $all) ) {
         die(utf8_encode("Fehler: Neue Begriffsdatei $filename konnte nicht geschrieben werden!"));
      }
      fclose ($handle);
Hilft das?
Mit Zitat antworten
  #4 (permalink)  
Alt 15-11-2010, 15:46
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Naja, fast schon ein bisschen. Ich sehe jetzt, dass du den HTML-Code abspeicherst und nciht direkt ausgibst, aber mehr eigentlich nicht.

Kannst du mal so eine gespeicherte HTML-Datei als Anhang hochladen?
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #5 (permalink)  
Alt 15-11-2010, 15:50
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard

Gerne:
Mit Zitat antworten
  #6 (permalink)  
Alt 15-11-2010, 15:55
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von beginner123 Beitrag anzeigen
Gerne:
Aha
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #7 (permalink)  
Alt 15-11-2010, 15:57
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard

Sorry, ich hatte nicht gesehen, dass man html-files nicht anhängen kann. Jetzt sollt´s als zip dabei sein.
Angehängte Dateien
Dateityp: zip Demographie.zip (13,6 KB, 11x aufgerufen)
Mit Zitat antworten
  #8 (permalink)  
Alt 15-11-2010, 16:08
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Alles klar, du baust da irgendwas zusammen aber kein HTML.

Erste Zeile:

Code:
<html header('Content-Type: text/html; charset=utf-8')><head>
Das kann so nicht gehen. header ist eine PHP-Funktion, kein HTML-Attribut.

Die Lösung: HTML korrigieren und das im head einfügen:
HTML-Code:
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #9 (permalink)  
Alt 15-11-2010, 16:14
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard

Super, danke, nach vielen Stunden Programmieren macht man manchmal die dümmsten Fehler...
Mit Zitat antworten
  #10 (permalink)  
Alt 15-11-2010, 16:31
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Jag aber trotzdem mal den HTML-Code durch den W3C Validator. Da ist noch mehr im Argen.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #11 (permalink)  
Alt 15-11-2010, 16:33
beginner123
 Registrierter Benutzer
Links : Onlinestatus : beginner123 ist offline
Registriert seit: Nov 2010
Beiträge: 42
beginner123 befindet sich auf einem aufstrebenden Ast
Standard

Mache ich sowieso noch. Aber vorher noch: Kannst du mir erklären, warum z.B. der lange Gedankenstrich nach wie vor nicht passt? Gleich oben bei den griechischen Zeichen, siehe Themenindex fr Schlsselwort Demographie von www.dvd-wissen.com
Mit Zitat antworten
  #12 (permalink)  
Alt 15-11-2010, 16:40
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Erklären nicht, aber vermuten: du arbeitest mit den normalen Stringfunktionen und machst/suchst/ersetzt damit irgendwas, ich nehme an genau in dem weggelassenen Teil von dem geposteten Script. Dabei zerstörst du dir deine UTF-8-Sequenzen.

Sieh dir mal die MBString-Erweiterung von PHP an.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #13 (permalink)  
Alt 15-11-2010, 16:43
Benutzerbild von onemorenerd onemorenerd
  Moderator
Links : Onlinestatus : onemorenerd ist offline
Registriert seit: Mar 2005
Ort: Berlin
Beiträge: 9.471
onemorenerd wird schon bald berühmt werdenonemorenerd wird schon bald berühmt werden
Standard

Déjà-vu!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[MySQL 5.0.33] Sonderzeichen-Müll beim Import gmw SQL / Datenbanken 0 08-04-2007 00:54
[MySQL 4.1] Sonderzeichen bei Import von DBF in mysql Matreju SQL / Datenbanken 12 06-07-2005 16:00
Real Time Problematik MaikelCoke PHP Developer Forum 11 08-06-2004 14:20
Cookie Problematik ->X³<- PHP Developer Forum 5 11-09-2003 14:11
Open Basedir Problematik darkone PHP Developer Forum 4 17-07-2003 22:12

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

Projektmanagement Damals und Heute
Projektmanagement Damals und HeuteWerfen Sie einen Blick auf das, was sich verändert hat, und entdecken Sie, wo die Zukunft dieses Gebietes hinsteuert.

18.01.2021 | Berni

Arbeitsmanagement-Tools
Arbeitsmanagement-ToolsWarum jedes Team Arbeitsmanagement-Tools benötigt. Man schätzt, dass 25% eines durchschnittlichen Mitarbeiter-Tages durch ineffiziente Arbeit vergeudet werden.

11.12.2020 | Berni


 

Aktuelle PHP Scripte

ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script ansehen ebiz-trader 6.0 - Das professionelle PHP Marktplatz Script

Mit unserer Lösungen können Sie nahezu jeden B2B / B2C Marktplatz betreiben den Sie sich vorstellen können. Ganz egal ob Sie einen Automarktplatz, Immobilenportal oder einfach einen Anzeigenmarkt betreiben möchten. Mit ebiz-trader können Sie Ihre Anforder

21.10.2020 Berni | Kategorie: PHP/ Anzeigenmarkt
Sendeplan Script inkl. Wunsch- und Grußbox + Kick-System + Bewerbungssystem

Das professionelle Sendeplan PHP Script inkl. Wunsch- und Grußbox + Kick-System für dein Webradio. Der übersichtliche Sendeplan bietet deinen Moderatoren und Zuhörern die perfekte Übersicht der aktuellen Shows! Du kannst nicht nur Sendungen eintragen, s

20.10.2020 drcomputer | Kategorie: PHP/ Web Radio
Newsmanager 2

Der Newsmanager 2 ist sehr Vielfältig und kann News schreiben, Newsletter versenden und RSS Feeds in einem erzeugen.

20.10.2020 Stephan_1972 | Kategorie: PHP/ News
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 18:06 Uhr.