Olivier Miakinen wrote:
> Le 21/12/2007 00:53, regis a écrit :
>> Je retourne demain matin en Normandie, et je n'aurais pas de connexion.
>> Donc, je ne pourrais poursuivre le sujet (jusqu'au 3 Janvier...)
>
> Je crois que tu en as parfaitement fait le tour. Les RFC 850 et 1036 se
> réclament du RFC 822 pour le format des champs d'entête, donc ASCII
> seul, puis les RFC MIME sont venus étendre la signification des carac-
> tères ASCII dans les champs d'entête, mais seulement pour le courriel.
>
> Quant à ton problème particulier, je me demande si tu n'utiliserais pas
> un logiciel en avance sur les autres, plutôt qu'en retard, en ce qu'il
> s'attend à trouver éventuellement du 8 bits dans les entêtes mais
> seulement si c'est de l'UTF-8. Du coup, le 8 bits que l'on rencontre
> souvent sur usenet-fr, supposément du Latin-1, serait considéré par ton
> logiciel comme trop nul pour être traité autrement que par le mépris (et
> donc supprimé).
oui et non:
mozilla/seamonkey affiche correctement le message à l'arrivée.
c'est seulement lorsque je fait Reply qu'il génère un
"Re: " + (rien) dans l'éditeur.
De plus, si l'auteur a choisit un pseudo contenant un
caractère 8-bit comme Phénix l'a fait récemment,
le reply génère "Phix wrote:", en mangeant le "én" de "Phénix",
probablement parce que la séquence d'octets est interprétée
comme invalide en utf-8. En effet:
(é, n) en latin-1= (E9, 6E) en hexa= (11101001, 01101110) en binaire,
or les sequences utf-8 légales (hors extensions à venir) sont:
-le singleton (0xxxxxxx): ascii
-la paire (110xxxxx, 10xxxxxx): langues latines
-le triplet (1110xxxx, 10xxxxxx, 10xxxxxx): langues asiatiques...
donc à la vue du 1er octet (é) 11101001, deux autres octets
de forme 10xxxxxx sont attendus, mais (n) 01101110 arrive à la place,
et les 2 sont dégagés.
--
regis