accès aux groupes de discussion, consultation et publication d'articles, recherche de "newsgroups"...
membres, identifiez-vous
é-mail Mot de passe
nouveau ? mot de passe oublié ?
Chargement... Chargement en cours...

Groupes français belges canadiens suisses internationaux Nétiquette
Échangez opinions et commentaires dans les forums de discussion.

Re: Accents en 8 bits brut dans le champ Subject [Fut : (rien)]

 [  Nouvelle Discussion Nouvelle discussion  |  Répondre au groupe Répondre au groupe  |  fr.usenet.8bits ] 

Retour : Accueil du site fr usenet 8bits   charte stats de ce groupe


  Sujet:   Re: Accents en 8 bits brut dans le champ Subject [Fut : (rien)]  
 De: regis.barbanc...@free.fr (regis)
 Groupes: fr.usenet.8bits
 Organisation: Guest of ProXad - France
 Date: 21. Dec 2007, 01:51:01
 References: 1 2 3 4 5 6 7 8 9 10
Olivier Miakinen wrote:
> Le 21/12/2007 00:53, regis a écrit :
>> Je retourne demain matin en Normandie, et je n'aurais pas de connexion.
>> Donc, je ne pourrais poursuivre le sujet (jusqu'au 3 Janvier...)
> 
> Je crois que tu en as parfaitement fait le tour. Les RFC 850 et 1036 se
> réclament du RFC 822 pour le format des champs d'entête, donc ASCII
> seul, puis les RFC MIME sont venus étendre la signification des carac-
> tères ASCII dans les champs d'entête, mais seulement pour le courriel.
> 
> Quant à ton problème particulier, je me demande si tu n'utiliserais pas
> un logiciel en avance sur les autres, plutôt qu'en retard, en ce qu'il
> s'attend à trouver éventuellement du 8 bits dans les entêtes mais
> seulement si c'est de l'UTF-8. Du coup, le 8 bits que l'on rencontre
> souvent sur usenet-fr, supposément du Latin-1, serait considéré par ton
> logiciel comme trop nul pour être traité autrement que par le mépris (et
> donc supprimé).

oui et non:
mozilla/seamonkey affiche correctement le message à l'arrivée.
c'est seulement lorsque je fait Reply qu'il génère un
"Re: " + (rien) dans l'éditeur.

De plus, si l'auteur a choisit un pseudo contenant un
caractère 8-bit comme Phénix l'a fait récemment,
le reply génère "Phix wrote:", en mangeant le "én" de "Phénix",
probablement parce que la séquence d'octets est interprétée
comme invalide en utf-8. En effet:

(é, n) en latin-1= (E9, 6E) en hexa= (11101001, 01101110) en binaire,
or les sequences utf-8 légales (hors extensions à venir) sont:

-le singleton (0xxxxxxx): ascii
-la paire (110xxxxx, 10xxxxxx): langues latines
-le triplet (1110xxxx, 10xxxxxx, 10xxxxxx): langues asiatiques...

donc à la vue du 1er octet (é) 11101001, deux autres octets
de forme 10xxxxxx sont attendus, mais (n) 01101110 arrive à la place,
et les 2 sont dégagés.

-- 
regis


DateSujet  Auteur
01.01.
o 
Groups Explorer contact votre avis comment ça marche? rechercher un groupe suggérer un groupe abuse accueil du site   Imprimer cette page   Envoyer cette page à un(e) ami(e)
Usenet Gratuit