Bonjour,

Je suis en train de créer un dictionnaire lingala-français. Le lingala est une langue africaine qui utilise deux caractères unicode : le o ouvert ɔ et le e ouvert ɛ .

Mes mots sont stockés dans une base mysql. Un script permet d'afficher les mots, classés par ordre alphabétique. Voir cette page par exemple : Mots lingala-français de M à P :
http://www.lien-mort.net/lingala/lingala-francais-m.php

Le problème : je constate que les caractères unicode 596 et 603 apparaissent en tête de liste dans l'ordre alphabétique, et non pas à l'endroit des e et o latins. La liste de la page citée en exemple donne ainsi :
moko (m + o ouvert)
mona (m + o ouvert)
moto (m + o ouvert)
mela (m + e ouvert)
meme (m + e ouvert)
mabe (m + a)
...
mobali (m + o fermé, caractère non unicode)


Voyez-vous un moyen de faire en sorte que ces mots soient au bon endroit dans la liste alphabétique. NB : j'ai déjà pensé créer une nouvelle colonne dans la table, sans caractères unicode, sur laquelle s'effectuerait le tri alphabétique. Je recherche une solution qui évite de créer ainsi une colonne supplémentaire.

Merci Smiley cligne
Modifié par Felipe (13 Jun 2008 - 16:31)
Hum... En vieux traumatisé de l'alphabet phonétique intenational qui m'a toujours compliqué la vie quand j'étais à l'école ou quand j'ai, par la suite, appris des langues orales sur le tas (ou plutôt sur le zinc)... je vote résolument pour la colonne supplémentaire et contre le purisme exclusif Smiley cligne

Intéressant problème d'accessibilité du contenu, en fait : l'alphabet phonétique international est évidemment approprié dans ta page puisqu'elle se veut un lexique de référence. Mais son utilisation exclusive favorise-t-elle l'accès au contenu pour tout ton public potentiel ?
Laurent :

Je ne comprends pas bien ta référence à l'API. En fait, les lettres que je cite (o ouvert et e ouvert) existent dans l'écriture correcte du lingala, à part entière. Les ouvrages papiers (dictionnaires, etc., en tout cas les bons !) les utilisent. Ce ne sont pas des signes phonétiques indiquant comment on doit prononcer ces lettres, mais des lettres à part entière.

Dans les dictionnaires papiers, le o ouvert et le e ouvert sont ainsi classés apès le o et le e fermé, dans l'ordre alphabétique. D'où la question que je posais. Et à laquelle effectivement je n'entrevois difficilement d'autre solution que la colonne supplémentaire pour le tri. Mais c'est un boulot en plus. Grr... NB : je vais déjà devoir utiliser la même technique pour la liste allemand-lingala car php-mysql n'aiment pas les ä, ü et ö allemands...

Question subsidiaire, qui ne pose apparemment pas de problème, mais sur laquelle j'aimerais avoir "le coeur net" :

Mon usage de l'unicode se limite à ces deux caractères. J'ai constaté que les caractères "français" e, a accentués etc. ne s'affichaient pas correctement lorsqu'on utilise des include php, qu'on les a tapés au clavier sans utiliser leur code &#xxx; ET qu'on déclare un charset utf-8.

J'ai constaté néanmoins que tout s'affiche correctement, Y COMPRIS mes ɛ et ɔ lorsque je laisse un charset iso-8859-1 et que j'utilise une police Lucida Sans Unicode. Ce qui donc me convient parfaitement, bien que n'étant pas parfaitement académique. Cf une page et son code source, par exemple celle citée tout à l'heure :
http://www.lien-mort.net/lingala/lingala-francais-m.php

Est-ce que cela peut toutefois poser des problèmes, plus tard, ailleurs, sous d'autres OS ??? Ou est-ce à dire que l'iso-8859-1 sait reconnaître quelques cacartères unicode courants tels que ɔ et ɛ ??
Modifié par Felipe (13 Jun 2008 - 16:32)
gral a écrit :
Laurent :

Je ne comprends pas bien ta référence à l'API. En fait, les lettres que je cite (o ouvert et e ouvert) existent dans l'écriture correcte du lingala, à part entière. Les ouvrages papiers (dictionnaires, etc., en tout cas les bons !) les utilisent. Ce ne sont pas des signes phonétiques indiquant comment on doit prononcer ces lettres, mais des lettres à part entière.


Quel serait, dans un tel lexique, et pour le lecteur, leur valeur autre que phonétique ? Car elles ont tout de même ce rôle, même si ce n'est pas le seul ? Smiley ohwell
gral :

Ton site est vraiment bien fait, je l'utilise fréquemment. Mais ce serais aussi utile d'avoir les intonations, elle sont grandement utile car le lingala est une langue tonique. Malheureusement les accents sur les ɛ et ɔ ne sont pas disponibles en iso-8859-1, seulement en Unicode.

La colonne avec les caractères ASCII devrait fonctionner. Sans, il faudrait soit un algorithme de triage adapté au lingala dans tes scripts, ou bien que les scripts utilisent ceux définit par la locale ou régionalisation du système.

Denis moyogo
Modifié par moyogo (12 May 2005 - 07:04)