php-resource



Zurück   PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr > Entwicklung > ASP, PERL, CGI, C und alles andere
 

Login

 
eingeloggt bleiben
star Jetzt registrieren   star Passwort vergessen
 

 

 


ASP, PERL, CGI, C und alles andere Wolle ma net so sein. Obwohl Perl, ASP, C und TCL zu den minderwertigen Internet-Skriptsprachen zählen, dürfen ab sofort hierzu auch Fragen gestellt werden. ;)

Antwort
 
LinkBack Themen-Optionen Thema bewerten
  #1 (permalink)  
Alt 04-04-2011, 15:21
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard [python] IMAP, Gmail und encoding

Hey,
nach ca. vier Jahren ohne Post, jetzt mal wieder ich... und dann nicht mal PHP

Ich versuch email (betreffe) per imap von gmail abzurufen, hab aber probleme. obwohl ich ca. 200 code varianten ausprobiert habe die man so über google findet.

wenn die email non-ascii zeichen enthällt bekomme ich:
Code:
Subject: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=
statt:
Code:
Subject: Beste Grüße
Der Code ist:
Code:
#!/usr/bin/python
import email, getpass, imaplib, os,re
m = imaplib.IMAP4_SSL("imap.googlemail.com",993)
m.login(user,pwd)
m.select("INBOX")
resp, data = m.search(None, "FLAGGED")
keys = data[0].split()
for num in keys:
        raw = m.fetch(num, '(BODY.PEEK[HEADER.FIELDS (SUBJECT)])')[1][0][1]
        subj = email.Header.decode_header(raw)
        subject = u"".join([unicode(text, charset or "utf-8") for text, charset in subj])
        print subject
Any hints would be much appreciated
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #2 (permalink)  
Alt 04-04-2011, 15:37
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Hallo,

so werden Sonderzeichen in Kopfzeilen codiert, es ist also nichts falsch daran, dass du sowas bekommst.

MIME - Wikipedia, the free encyclopedia

Gruß,

Amica
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #3 (permalink)  
Alt 04-04-2011, 16:12
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard

Hey, danke für deine Antwort.

Ja das weiß ich, aber sollte:

Code:
email.Header.decode_header
sich nicht darum kümmern?
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #4 (permalink)  
Alt 04-04-2011, 16:25
AmicaNoctis
  Moderatorin
Links : Onlinestatus : AmicaNoctis ist offline
Registriert seit: Jul 2009
Beiträge: 5.709
Blog-Einträge: 9
AmicaNoctis sorgt für eine eindrucksvolle AtmosphäreAmicaNoctis sorgt für eine eindrucksvolle Atmosphäre
Standard

Achso, sorry, hab mir deinen Code mangels Python-Kenntnissen nicht angesehen. Auf den ersten Blick sollte es das tun, da geb ich dir recht, aber was der Code jetzt genau macht, bleibt mir als Nicht-Python verborgen.
__________________
Hast du die Grundlagen zur Fehlersuche gelesen? Hast du Code-Tags benutzt?
Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
Super, danke!
Mit Zitat antworten
  #5 (permalink)  
Alt 05-04-2011, 13:03
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Tartax Beitrag anzeigen
... sollte:

Code:
email.Header.decode_header
sich nicht darum kümmern?
Im Prinzip ja. Daher würde ich mal vermuten, dass der Fehler im übergebenen Header-String liegt. Lass dir doch mal probeweise den Wert von raw vor dem Aufruf von .decode_header() und danach die beiden Rückgabewerte anzeigen.

Geändert von fireweasel (05-04-2011 um 13:07 Uhr)
Mit Zitat antworten
  #6 (permalink)  
Alt 05-04-2011, 15:49
Tartax
 PHP Senior
Links : Onlinestatus : Tartax ist offline
Registriert seit: Oct 2002
Ort: BRD
Beiträge: 1.167
Tartax ist zur Zeit noch ein unbeschriebenes Blatt
Tartax eine Nachricht über ICQ schicken
Standard

Jup, gerade gemacht, raw scheint in ordnung zu sein, aber mir ist aufgefallen dass es bei utf-8 klappt. iso-8859 schient das problem zu sein:

erst mail (iso):
Code:
raw: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

subj: [('Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=\r\n\r\n', None)]
output: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

zweite email(utf):
Code:
raw: Subject: =?UTF-8?B?0JLQuNC60YLQvtGAINCS0L7RgNC+0LHRh9GD0Lo=?=
 =?UTF-8?B?IHBvc3RlZCBvbiB5b3Vy?= =?UTF-8?B?IFdhbGwu?=

subj: [('Subject:', None), ('\xd0\x92\xd0\xb8\xd0\xba\xd1\x82\xd0\xbe\xd1\x80 \xd0\x92\xd0\xbe\xd1\x80\xd0\xbe\xd0\xb1\xd1\x87\xd1\x83\xd0\xba posted on your Wall.', 'utf-8'), ('', None)]
output: Subject:Виктор Воробчук posted on your Wall.
__________________
Die Musikreview Seite

hi, i'm a signature virus. copy me into your signature to help me spread.
Mit Zitat antworten
  #7 (permalink)  
Alt 08-04-2011, 14:24
Benutzerbild von fireweasel fireweasel
 Registrierter Benutzer
Links : Onlinestatus : fireweasel ist offline
Registriert seit: Sep 2008
Ort: At home
Beiträge: 851
fireweasel wird schon bald berühmt werdenfireweasel wird schon bald berühmt werden
fireweasel eine Nachricht über AIM schicken fireweasel eine Nachricht über Yahoo! schicken
Standard

Zitat:
Zitat von Tartax Beitrag anzeigen
Jup, gerade gemacht, raw scheint in ordnung zu sein, aber mir ist aufgefallen dass es bei utf-8 klappt. iso-8859 schient das problem zu sein:

erst mail (iso):
Code:
raw: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

subj: [('Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=\r\n\r\n', None)]
output: Subject: Fwd: Beste =?ISO-8859-15?Q?Gr=FC=DFe?=

zweite email(utf):
Code:
raw: Subject: =?UTF-8?B?0JLQuNC60YLQvtGAINCS0L7RgNC+0LHRh9GD0Lo=?=
 =?UTF-8?B?IHBvc3RlZCBvbiB5b3Vy?= =?UTF-8?B?IFdhbGwu?=

subj: [('Subject:', None), ('\xd0\x92\xd0\xb8\xd0\xba\xd1\x82\xd0\xbe\xd1\x80 \xd0\x92\xd0\xbe\xd1\x80\xd0\xbe\xd0\xb1\xd1\x87\xd1\x83\xd0\xba posted on your Wall.', 'utf-8'), ('', None)]
output: Subject:Виктор Воробчук posted on your Wall.
Mhmmm, das ist merkwürdig. Die Zeichensatz-Kodierung (ISO-Latin, UTF-8) sollte keine Rolle spielen, sie wird nur als Klartext zurückgeliefert. Wenn der Ausgangsstring zurückgeliefert wird, hat .decode_header() die Quoted-Printable-Kodierung nicht erkannt. Der dazu (in email/mail.py) benutzte RegEx lautet:

Code:
ecre = re.compile(r'''
  =\?                   # literal =?
  (?P<charset>[^?]*?)   # non-greedy up to the next ? is the charset
  \?                    # literal ?
  (?P<encoding>[qb])    # either a "q" or a "b", case insensitive
  \?                    # literal ?
  (?P<encoded>.*?)      # non-greedy up to the next ?= is the encoded string
  \?=                   # literal ?=
  (?=[ \t]|$)           # whitespace or the end of the string
  ''', re.VERBOSE | re.IGNORECASE | re.MULTILINE)
Ich sehe nicht, wo der auf deinen Header nicht passen sollte.

Wenn man ein wenig herumgoogelt, findet man zu .header_decode() lediglich "Bugs", die mit (nichtvorhandenen) Leerzeichen am Ende eines kodierten Teilstücks zu tun haben. Du könntest versuchsweise ein Leerzeichen vor den Zeilenumbruch einfügen, um zu sehen, ob das Zeilenende nicht richtig erkannt wird. Aber $ und MULTILINE (entspricht /m in PCRE) sollten eigentlich zusammenpassen.
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
email, gmail, imap, python


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
gmail-Abmahnung - Lösung vorhanden ab-design Off-Topic Diskussionen 42 19-04-2009 23:41
[Script] Gmail / Orkut Login steffenh82 Apps und PHP Script Gesuche 1 13-04-2006 06:49
imap_open gmail kevin-k PHP Developer Forum 4 18-09-2005 22:20
Was haltet ihr von Python ?? jahlives Off-Topic Diskussionen 18 16-12-2004 12:21
php/python jacknirons PHP Developer Forum 5 18-08-2003 14:53

Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an


PHP News

ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlicht
ebiz-trader 7.5.0 mit PHP7 Unterstützung veröffentlichtDie bekannte Marktplatzsoftware ebiz-trader ist in der Version 7.5.0 veröffentlicht worden.

28.05.2018 | Berni

Wissensbestand in Unternehmen
Wissensbestand in UnternehmenLebenslanges Lernen und Weiterbilden sichert Wissensbestand in Unternehmen

25.05.2018 | Berni


 

Aktuelle PHP Scripte

PHP Server Monitor

PHP Server Monitor ist ein Skript, das prüft, ob Ihre Websites und Server betriebsbereit sind.

11.09.2018 Berni | Kategorie: PHP/ Security
PHP WEB STATISTIK ansehen PHP WEB STATISTIK

Die PHP Web Statistik bietet Ihnen ein einfach zu konfigurierendes Script zur Aufzeichnung und grafischen und textuellen Auswertung der Besuchern Ihrer Webseite. Folgende zeitlichen Module sind verfügbar: Jahr, Monat, Tag, Wochentag, Stunde Folgende son

28.08.2018 phpwebstat | Kategorie: PHP/ Counter
Affilinator - Affilinet XML Produktlisten Skript

Die Affilinator Affilinet XML Edition ist ein vollautomatisches Skript zum einlesen und darstellen der Affili.net (Partnerprogramm Netzwerk) Produktlisten und Produktdaten. Im Grunde gibt der Webmaster seine Affilinet PartnerID ein und hat dann unmittelb

27.08.2018 freefrank@ | Kategorie: PHP/ Partnerprogramme
 Alle PHP Scripte anzeigen

Alle Zeitangaben in WEZ +2. Es ist jetzt 18:38 Uhr.