php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > ASP, PERL, CGI, C und alles andere
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


ASP, PERL, CGI, C und alles andere Wolle ma net so sein. Obwohl Perl, ASP, C und TCL zu den minderwertigen Internet-Skriptsprachen zählen, dürfen ab sofort hierzu auch Fragen gestellt werden. ;)

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 04-04-2011, 16:21
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard [python] IMAP, Gmail und encoding

Hey,
nach ca. vier Jahren ohne Post, jetzt mal wieder ich... und dann nicht mal PHP

Ich versuch email (betreffe) per imap von gmail abzurufen, hab aber probleme. obwohl ich ca. 200 code varianten ausprobiert habe die man so über google findet.

wenn die email non-ascii zeichen enthällt bekomme ich:
Code:
Subject: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=
statt:
Code:
Subject: Beste Grüße
Der Code ist:
Code:
#!/usr/bin/python
import email, getpass, imaplib, os,re
m = imaplib.IMAP4_SSL("imap.googlemail.com",993)
m.login(user,pwd)
m.select("INBOX")
resp, data = m.search(None, "FLAGGED")
keys = data[0].split()
for num in keys:
        raw = m.fetch(num, '(BODY.PEEK[HEADER.FIELDS (SUBJECT)])')[1][0][1]
        subj = email.Header.decode_header(raw)
        subject = u"".join([unicode(text, charset or "utf-8") for text, charset in subj])
        print subject
Any hints would be much appreciated
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #2 (permalink)  
Alt 04-04-2011, 16:37
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

so werden Sonderzeichen in Kopfzeilen codiert, es ist also nichts falsch daran, dass du sowas bekommst.

MIME - Wikipedia, the free encyclopedia

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 04-04-2011, 17:12
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard

Hey, danke für deine Antwort.

Ja das weiß ich, aber sollte:

Code:
email.Header.decode_header
sich nicht darum kümmern?
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #4 (permalink)  
Alt 04-04-2011, 17:25
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Achso, sorry, hab mir deinen Code mangels Python-Kenntnissen nicht angesehen. Auf den ersten Blick sollte es das tun, da geb ich dir recht, aber was der Code jetzt genau macht, bleibt mir als Nicht-Python verborgen.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #5 (permalink)  
Alt 05-04-2011, 14:03
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Tartax Beitrag anzeigen
... sollte:

Code:
email.Header.decode_header
sich nicht darum kümmern?
Im Prinzip ja. Daher würde ich mal vermuten, dass der Fehler im übergebenen Header-String liegt. Lass dir doch mal probeweise den Wert von raw vor dem Aufruf von .decode_header() und danach die beiden Rückgabewerte anzeigen.

Geändert von fireweasel (05-04-2011 um 14:07 Uhr)
Mit Zitat antworten
  #6 (permalink)  
Alt 05-04-2011, 16:49
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard

Jup, gerade gemacht, raw scheint in ordnung zu sein, aber mir ist aufgefallen dass es bei utf-8 klappt. iso-8859 schient das problem zu sein:

erst mail (iso):
Code:
raw: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

subj: [('Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=\r\n\r\n', None)]
output: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

zweite email(utf):
Code:
raw: Subject: =?UTF-8?B?0JLQuNC60YLQvtGAINCS0L7RgNC+0LHRh9GD0Lo=?=
 =?UTF-8?B?IHBvc3RlZCBvbiB5b3Vy?= =?UTF-8?B?IFdhbGwu?=

subj: [('Subject:', None), ('\xd0\x92\xd0\xb8\xd0\xba\xd1\x82\xd0\xbe\xd1\x80 \xd0\x92\xd0\xbe\xd1\x80\xd0\xbe\xd0\xb1\xd1\x87\xd1\x83\xd0\xba posted on your Wall.', 'utf-8'), ('', None)]
output: Subject:Виктор Воробчук posted on your Wall.
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #7 (permalink)  
Alt 08-04-2011, 15:24
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Tartax Beitrag anzeigen
Jup, gerade gemacht, raw scheint in ordnung zu sein, aber mir ist aufgefallen dass es bei utf-8 klappt. iso-8859 schient das problem zu sein:

erst mail (iso):
Code:
raw: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

subj: [('Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=\r\n\r\n', None)]
output: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

zweite email(utf):
Code:
raw: Subject: =?UTF-8?B?0JLQuNC60YLQvtGAINCS0L7RgNC+0LHRh9GD0Lo=?=
 =?UTF-8?B?IHBvc3RlZCBvbiB5b3Vy?= =?UTF-8?B?IFdhbGwu?=

subj: [('Subject:', None), ('\xd0\x92\xd0\xb8\xd0\xba\xd1\x82\xd0\xbe\xd1\x80 \xd0\x92\xd0\xbe\xd1\x80\xd0\xbe\xd0\xb1\xd1\x87\xd1\x83\xd0\xba posted on your Wall.', 'utf-8'), ('', None)]
output: Subject:Виктор Воробчук posted on your Wall.
Mhmmm, das ist merkwürdig. Die Zeichensatz-Kodierung (ISO-Latin, UTF-8) sollte keine Rolle spielen, sie wird nur als Klartext zurückgeliefert. Wenn der Ausgangsstring zurückgeliefert wird, hat .decode_header() die Quoted-Printable-Kodierung nicht erkannt. Der dazu (in email/mail.py) benutzte RegEx lautet:

Code:
ecre = re.compile(r'''
  =\?                   # literal =?
  (?P<charset>[^?]*?)   # non-greedy up to the next ? is the charset
  \?                    # literal ?
  (?P<encoding>[qb])    # either a "q" or a "b", case insensitive
  \?                    # literal ?
  (?P<encoded>.*?)      # non-greedy up to the next ?= is the encoded string
  \?=                   # literal ?=
  (?=[ \t]|$)           # whitespace or the end of the string
  ''', re.VERBOSE | re.IGNORECASE | re.MULTILINE)
Ich sehe nicht, wo der auf deinen Header nicht passen sollte.

Wenn man ein wenig herumgoogelt, findet man zu .header_decode() lediglich "Bugs", die mit (nichtvorhandenen) Leerzeichen am Ende eines kodierten Teilstücks zu tun haben. Du könntest versuchsweise ein Leerzeichen vor den Zeilenumbruch einfügen, um zu sehen, ob das Zeilenende nicht richtig erkannt wird. Aber $ und MULTILINE (entspricht /m in PCRE) sollten eigentlich zusammenpassen.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
email, gmail, imap, python


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
gmail-Abmahnung - Lösung vorhanden ab-design Off-Topic Diskussionen 42 20-04-2009 00:41
[Script] Gmail / Orkut Login steffenh82 Apps und PHP Script Gesuche 1 13-04-2006 07:49
imap_open gmail kevin-k PHP Developer Forum 4 18-09-2005 23:20
Was haltet ihr von Python ?? jahlives Off-Topic Diskussionen 18 16-12-2004 13:21
php/python jacknirons PHP Developer Forum 5 18-08-2003 15:53

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

ADSMAN V3 - Werbe-Manager ansehen ADSMAN V3 - Werbe-Manager

ADSMAN V3 - mehr als nur ein Bannermanager! Banner, Textanzeigen und PagePeel Manager! Mit ADSMAN PRO haben Sie die Marketinglösung für eine effektive und effiziente Werbeschaltung mit messbaren Ergebnissen. Unterstützt werden Bannerformate in beliebi

25.10.2018 virtualsystem | Kategorie: PHP/ Bannerverwaltung
PHP News und Artikel Script V2

News schreiben, verwalten, veröffentlichen. Dies ist jetzt mit dem neuen PHP News & Artikel System von virtualsystem.de noch einfacher. Die integrierte Multi-User-Funktion und der WYSIWYG-Editor (MS-Office ähnliche Bedienung) ermöglichen...

25.10.2018 virtualsystem | Kategorie: PHP/ News
Top-Side Guestbook

Gästebuch auf Textbasis (kein MySQL nötig) mit Smilies, Ip Sperre (Zeit selbst einstellbar), Spamschutz, Captcha (Code-Eingabe), BB-Code, Hitcounter, Löschfunktion, Editierfunktion, Kommentarfunktion, Kürzung langer Wörter, Seiten- bzw. Blätterfunktion, V

22.10.2018 webmaster10 | Kategorie: PHP/ Gaestebuch
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 00:04 Uhr.