8792 sujets

Développement web côté serveur, CMS

Avez vous d'une idée où on pourrai avoir les informations exactes des formats tels que les URL (dont les noms de domaines), et les formats d'adresses email.

J'ai regardé les RFC 822, 2822, 1738 ... il y a des informations correspondantes mais (peut être) pas assez exacte et peut être même éronnées sachant que certains documents datent d'y a plus de 20ans. Et ne prennent pas en compte les nouveaux formats de domaines avec des caractères non ASCII (chinois par exemple) (retranscrit -> xn-- ?) par exemple.

Elles n'indiquent par exemple pas la longueur minimum ou maximum d'une url, domaine, adresse mail ... (63 ?) (ou sinon j'ai pas trouvé)

Si quelqu'un pouvait m'éclairer avec ça lanterne j'y verrais plus clair.

En fait le problème vient du fait que j'aimerai trouver ces règles pour pouvoir valider par exemple une adresse mail.
J'ai déja trouvé des expressions régulières, mais il serait mieux (même pour une culture personnel) de savoir exactement ce qui est "valide" ou pas.

Source (il y a même une expression régulière qui fait 6343 caractères et qui est sensé correspondre au plus exacte de la "Request for comments" 822)
Les adresses emails acceptent tout et surtout n'importe quoi.
Il y aura toujours des cinglés pour penser qu'une email peut ressembler a ceci :
haha_________@_______________.ext

Perso, je pars du principe qu'une adresse email doit être quelquechose de logique, de clair et facile à lire et surtout qui ne prête à confusion dans aucun esprit.
Donc une adresse email composée de caractères alphanumérique, l'underscore, le tiret et le point.
Tout le reste est pour moi est totalement ridicule.

Je ne connais aucune entreprise digne de ce nom qui possède une adresse email complètement loufoque et illisible.
Les adresses emails à la gomme, on les trouve chez les fans de Caramail et autres trucs du même genre.

Quand à la fameuse regex citée, elle est totalement imbuvable, totalement dingue, inutile et tout à fait entre-nous, n'est utilisée par personne.
Modifié par Bison (14 Dec 2006 - 23:00)
Voilà la regex que j'utilise en ce moment pour les e-mails:


/^[a-zA-Z][a-zA-Z0-9-_\.]+@([-_a-zA-Z]+\.)+[a-zA-Z]{2,6}/

Modifié par GeorgesM (15 Dec 2006 - 08:01)
GeorgesM a écrit :
Voilà la regex que j'utilise en ce moment pour les e-mails:


/^[a-zA-Z][a-zA-Z0-9-_\.]+@[-_a-zA-Z]+\.[a-zA-Z]{2,6}$/


Testes ce que j'ai mis comme email d'exemple dans le post précédent et dis-moi Smiley cligne
Mieux testes ceci : a.@_.fr
Smiley langue
GeorgesM a écrit :
pour filtrer a.@_.fr

/^[a-zA-Z]+[\.]*[-_a-zA-Z0-9]+@([-_a-zA-Z]+\.)+[a-zA-Z]{2,6}/

Oui, bien sûr, en "corrigeant" la regex.
Le problème c'est que c'est totalement faux, ce genre d'email n'existe pas et n'est pas acceptable dans sa syntaxe.

Entre ce qui est du pur bon sens et ce que la norme accepterait, il y a un précipice. Faut remettre la norme d'origine dans le contexte d'origine.

Ray Tomlinson qui a mis au point le premier programme de messagerie électronique n'a penser à rien d'autre que de trouver le caractère qui séparerait le nom de la personne du nom de l'ordinateur

nom_de_la_personne@nom_de_l_ordinateur

A partir de là, la norme d'écriture s'est quasi imposée d'elle même en sachant qu'on pouvait presque tout utiliser sauf l'arobase (et quelques autres comme le slash,...)
Modifié par Bison (15 Dec 2006 - 08:47)