- Ad -
php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Scripts > Appz und Script Gesuche
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 

 


Appz und Script Gesuche Hier könnt ihr nach Skripten und Programmen fragen. Postet eure Wünsche (Bitte keine Warez!)!

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 30-09-2011, 14:27
proterra
 Registrierter Benutzer
Links : Onlinestatus : proterra ist offline
Registriert seit: Sep 2011
Beiträge: 2
proterra befindet sich auf einem aufstrebenden Ast
Standard Website Crawler / Migration nach Excel/SQL

Hi,

ich habe eine ganz alte stark verschachtelte Webseite noch auf HTML Basis, die ich nun in ein CMS überführen möchte.

Die HTML-Daten bestehen immer aus den Metatags, aus dem Titel und dem Text (in tables)

Der Ordner-Aufbau ist beispielsweise so:

2011/09/29/12345/index.html

Was ich nun möchte (suche) ist ein Skript oder auch einen Ansatz, wie ich die verschiedenen Daten in entsprechende Felder beispielsweise in Excel importiere, um diese dann später in die Mysql-Datenbank des CMS (Joomla) zu migrieren.

Dabei soll nicht nur der Inhalt der HTML-Seite in die Felder geschrieben werden, sondern auch die Ordner-Struktur, so dass ich hinterher wieder dieselbe URL erhalte.

Hinterher soll das dann so aussehen:

Feld 1: 12345 (ID des Artikels)
Feld 2: /2011/09/29/12345/
Feld 3: Meta Description
Feld 4: Meta Keywords
Feld 5: Titel
Feld 6: Text Inhalt der html-datei

Der Inhalt im Feld Text muss jetzt auch nicht frei von <tables> sein.

Hat vielleicht jemand ein paar Hinweise, wie ich das am Besten umsetzen kann? Ich habe mich schon wund gegoogelt. Ich weiß natürlich das es nicht die eierlegende Wollmichsau gibt, aber ein paar Tipps wäre super.



Danke im voraus.
Mit Zitat antworten
  #2 (permalink)  
Alt 30-09-2011, 15:10
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.550
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

du solltest nicht den Umweg über Excel gehen. Das Script, das diese Daten ermittelt kann das direkt in die MySQL-Datenbank schreiben. Ein fertiges Script dafür wirst du zwar nicht finden, weil dein Anliegen zu einfach aber gleichzeitig zu speziell ist. Wenn du ein wenig PHP kannst, kriegst du das aber selbst hin.

Mit einem RecursiveDirectoryIterator kannst du die Verzeichnisse durchsuchen und lädst die gefundenen Dateien mit DOMDocument, um die Meta-Angaben herauszuholen. Schließlich schiebst du die ermittelten Informationen mit PDO in die Datenbank.

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 30-09-2011, 15:31
proterra
 Registrierter Benutzer
Links : Onlinestatus : proterra ist offline
Registriert seit: Sep 2011
Beiträge: 2
proterra befindet sich auf einem aufstrebenden Ast
Standard

PHP kann ich nur rudimentär ;-)

Wichtig wäre ja das, der Ordnerpfad mit abgebildet wird und der letzte Ordner als ID fungiert.

Dann müsste ich dem Skript ja sagen welche Textbausteine ausgelesen werden sollen.

Hatte das jetzt so überlegt:
Via Editor automatisiert die HTML Dateien von Code und nicht benötigten Infos zu befreien.

Dann mit Unix-Befehlen die Ordnerstruktur und die alle Dateien in eine neue Textdatei schreiben und dann an die Datenbankstruktur anpassen.

Wenn es per PHP gehen könnte wäre super. Hilfe würde ich natürlich auch nicht umsonst erwarten, sondern natürlich auch was dafür geben.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
csv, excel, html, migration, sql


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[Einzelauftrag] Kleiner Website Crawler JayQ Jobgesuche 2 20-06-2008 16:47
Excel auf Website rebulo BRAINSTORMING PHP/SQL/HTML/JS/CSS 9 29-09-2006 13:51
Excel auf Website rebulo BRAINSTORMING PHP/SQL/HTML/JS/CSS 0 28-09-2006 20:38
Altes Excel-Dok nach SQL Mannis SQL / Datenbanken 3 01-05-2004 23:30
Probleme bei der Migration von PHP3 nach PHP4 JosefYY PHP Developer Forum 4 22-09-2003 16:45

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

MariaDB 5.5 veröffentlicht
MariaDB 5.5 veröffentlichtDie freie MySQL-Alternative MariaDB wurde in der stabilen Version 5.5.23 veröffentlicht und soll einige Verbesserungen gegenüber Oracles Communityversion von MySQL mitbringen.

16.04.2012 | Berni

Deutsche Yii Framework Community
Deutsche Yii Framework CommunitySeit dem 19.03.2012 gibt es für die Yii PHP Framework Community ein deutsches Zuhause.

20.03.2012 | dhcomputer

 

Aktuelle PHP Scripte

E-Mail-Coder Generator ansehen E-Mail-Coder Generator

E-Mail-Coder Generator, komplett in deutscher Sprache. Mit diesem Generator können Sie Ihre E-Mail-Adresse codieren und so gegenüber Spidern schützen.

23.05.2012 fullmedia | Kategorie: PHP/ Mail
EMO Realty Manager ansehen EMO Realty Manager

EMO Realty Manager is a complete realty listing management solution software. It is easily customized to reflect your creativity whether you are starting from scratch or integrating into an existing web site. EMO Realty Manager can be used to promote re

23.05.2012 myrephp | Kategorie: PHP/ Anzeigenmarkt
MatPo Image Hosting Script ansehen MatPo Image Hosting Script

Mit diesem PHP-Script (mini CMS) kann man .jpg, .gif und .png-Dateien auf den Server laden. Bildergröße beim Hochladen änderbar sowie eine Beschreibung zum Bild angegeben werden kann. Damit das Webspace nicht missbraucht werden kann gibt es jetzt auch

23.05.2012 MatPo | Kategorie: PHP/ Bilder
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 05:53 Uhr.