Bonjour à tous,

Je tenais à partager ma découverte: une DTD et un ensemble de feuilles XLST orientés vers l'écriture de documents scientifiques: tbook.
Ce n'est pas du docbook.
Ce n'est pas du LaTeX.
Ce n'est pas du xHTML.
Mais çà produit tout çà de manière très professionnelle.
Téléchargement et démonstrations (impressionnant vraiment)
http://tbookdtd.sourceforge.net/
A noter: l'auteur fournit un exécutable qui installe tout le nécessaire pour Windows (assez rare!). Tout fonctionne du premier coup!
Merci Eric pour ce moment culturel.

A la lecture du lien que tu proposes, une réflexion m'est venue :
je rêve du moment où ce genre d'outil ne serait plus nécessaire !

Il y a de mon point de vue bien trop de façons de décrire des contenus (Xhtml, Latex, Docbook...) et Tbook en ajoute une nouvelle (vocabulaire proche de Latex, mais syntaxe XML). Ces manières de faire du contenu, toutes aussi valables les unes que les autres, nécessitent finalement des passerelles pour naviguer des unes aux autres. Tbook qui est l’une de ces passerelles introduit quand même son propre langage.
Ces sémantiques ont pourtant entre elles de très nombreux points communs dans la nécessité de décrire par exemple des chapitres, des paragraphes, des tableaux... Il serait temps de faire pot commun de ces bases. Bien sur dans le détail les besoins diffèrent : une page web doit pouvoir décrire un formulaire ce qu'un document mathématique ignore, alors que ce dernier doit par exemple prendre en charge des formules.
Mon idéal serait qu'émerge un langage commun, un peu dans l'esprit de l'orientation prise pour Xhtml, c'est à dire construit à partir de modules. Un module de base pour ce que l'on retrouve dans un grand nombre de documents, et des modules complémentaires concentriques (ou non) permettant des ajouts pour les subtilités que les besoins des uns et des autres font apparaître.
Xhtml me parait un bon point de départ pour cette harmonisation. Je regrette finalement que Tbook ait considéré utile de redéfinir les bases via une nouvelle langue.

Voilà pour la sémantique. Qu'en est-il de la présentation ? La question est plus complexe encore probablement.
Il me semble que, pour bien faire, la question de la présentation devrait être attachée à la nature du support utilisé pour produire le document, et non pas à un format de sortie (PS, PDF, RTF...). Cependant il faut bien reconnaître que cet idéal est une chimère, bien plus que pour la sémantique.
Pourtant j'aurais bien vu un format pivot de présentation en XSL-FO. Cela aurait fait joli à mon goût, et les outils permettant d'obtenir les PS, PDF, RTF... existent déjà.
Xavier a écrit :
je rêve du moment où ce genre d'outil ne serait plus nécessaire !
N'était-ce pas le but initial du XML (avant la prolifération des "dialectes" spécifiques) ?
Modifié le 01 Feb 2005 - 16:03
a écrit :
N'était-ce pas le but initial du XML

XML n'est qu'une syntaxe, et ne dit rien des langages bâtis par dessus cette syntaxe.

D'après ce que j'ai compris XML devait faciliter les échanges informatiques par la normalisation de la couche la plus basse : la syntaxe. Et c'est bien le cas puisque plus grand monde ne s'intéresse aujourd'hui à la problématique de l'analyse syntaxique, ce qui est déjà un bon point.
En revanche, en considérant le vocabulaire comme un "paramètre" (via la DTD) on pouvait au contraire s'attendre à ce que chacun invente son propre langage. C'est un peu le cas même si de nombreux efforts de normalisation (W3C, Oasis) tentent de contrecarrer cette dispersion.

En fait j'ai le sentiment que les efforts de normalisation sont également à l'origine de cette dispersion dans la mesure ou les standards qui en sortent sont présentés à chaque fois comme des langages différents. Pour des raisons psychologiques, je crois qu'il pourrait être intéressant d'inverser la tendance en déclarant que XHTML, Xlink, Xforms, SVG, MATHML... sont au contraire des composantes ou des modules d'un même effort de structuration d'un langage commun.
Je peux rejoindre ton raisonnement. Il faut aussi se souvenir que le HTML n'est qu'une DTD du SGML. Le XML n'a rien inventé.

Pour mettre un peu d'eau à ton moulin et soulever un autre danger, j'utilise tout les jours du GPX (format XML d'échange de données GPS) qui est un standard (j'ai failli écrire, de fait) topografix, donc propriétaire. Que doit-on penser de ce type de "standard". J'aime bien qu'un standard soit assis sur unr "autorité indépedante". Bien sûr, je caricature quelque peu mais la dérive peut s'étendre à d'autres aspects plus "vicieux".
Habot a parfaitement raison: le XML (en tant que refonte du SGML) a la volonté de donner à chaqyue créateur la base pour construire ses outils spécifiques (dédiés à la chimie, à lé geo. etc.)
Je dois pourtant avouer que la profilération des grammaires XML (les DTD) est source de confusion pour le novice. Comme dit, chaque grammaire se réclame "norme" à part entière.
Comment comprendre alors qu'une des forces des documents XML est de pouvoir mixer les contenus (du MathML dans du xHTML)?
Un des problèmes que les concepteurs se focalisent sur leurs problèmes spécifiques et ne fournissent que les outils appropriés (je pense spécifiquement aux feuilles XLST).
J'ambitionnais de construire ma DTD pour décrire les sorties d'un logiciel de statistique. Mais s'il faut aussi faire le(s) XLST et le CSS, c'est galère.
D'un autre côté, la DTD ultime n'existera jamais.
Au moins, l'utilisation de langages balisés est rassurant: il permet (ou permettra) tout de même une bonne (ré)utilisation. A preuve le LaTeX et xHTML produits par tbook sans trop d'efforts (au vu de la taille des XLST).
Belgeric a écrit :
...Comment comprendre alors qu'une des forces des documents XML est de pouvoir mixer les contenus...
Et c'est cette possibilité qui rend les syntaxes (et les dérives) dangereuses.
Pour rester dans le GPX, "l'inventeur" autorise la création de "classes" dans son format (utilisées par un site d'échange d'informations pour ses propres besoins. En gros, ajouter les informations n'ayant pas de rapport avec les données GPS mais bien une de leurs utilisations) qui sont relues sans problème par un logiciel spécifique, qui, à son tour, ajoute des classes pour permettre l'échange des données supplémentaires qu'il gère lui même (à destination des autres utilisateurs du même programme). Heureusement, l'effet "poupées russes" s'arrête là, mais on ne parle ici que d'une seule DTD.
Belgeric a écrit :
une des forces des documents XML est de pouvoir mixer les contenus
XML n'est qu'une syntaxe, il n'est donc pas en son pouvoir de mixer les contenus. C'est aux outils qui traitent, éditent, visualisent, les contenus que l'on doit (ou non) la possibilité de mélanger des contenus de natures différentes. Cette aptitude ne tient qu'a la capacité des outils et des utilisateurs à interpréter des vocabulaires variés. Tout au plus (mais c'est déjà beaucoup) XML offre un socle commun de syntaxe qui simplifie l'acquisition technique des documents par les outils.
Belgeric a écrit :
la DTD ultime n'existera jamais
C'est certain, comme tu l'as évoqué, chaque domaine à ses propres besoins, et qui prétendrait répertorier tous ces besoins dans l’exhaustivité ?
Mais je crois que lorsque quelqu'un propose une extension pour un sujet particulier, s'il a l'ambition de faire largement partager son extension, alors il doit être attentif à ne pas recréer des choses déjà existantes, avec un nouveau vocabulaire. Dit autrement, supposons DTD1 et DTD2 deux DTDs documentaires largement diffusées. Si DTD1 et DTD2 sont réellement complémentaires (intersection vide ou quasiment) alors pas de problème. Si au contraire elle se superpose (intersection notable) alors il y a fort à parier qu'un jour émergera la nécessiter de bâtir des outils de traduction, et c'est contre productif.
Je reviens à Tbook. Je suppose que son créateur est un nostalgique de Latex. Mais il aurait pu tout aussi bien fonder sa description documentaire sur XHTML, MathML et SVG plutôt que d'introduire une nouvelle DTD. Il me semble qu'alors les outils de traduction incorporés à Tbook n'en auraient eu que plus de valeur.
Belgeric a écrit :
J'ambitionnais de construire ma DTD pour décrire les sorties d'un logiciel de statistique. Mais s'il faut aussi faire le(s) XLST et le CSS, c'est galère
Tu abordes la question de la présentation des documents, et finalement tu renforces me semble-t-il mon propos. Je suppose que pour décrire un document orienté statistiques il faut prendre en charge des commentaires, des formules, des tableaux de chiffres et des graphiques. Pourquoi vouloir alors créer une nouvelle DTD ? Est-ce que, au moment de transcrire tes informations dans du XML, XHTML, MathML et SVG ne sont-ils pas suffisant ?
Il se peut que tu souhaites une présentation bien à toi de la chose, mais il existe aussi des outils capables de faire une présentation décente de ces DTDs (un navigateur récent tout simplement). Si tu utilises un navigateur :
- l'étape XSLT (changement de DTD) est inutile puisque l'outil interprète directement ces DTDs
- l'étape CSS est inutile puisque l'outil dispose de règles de présentation par défaut
C'est tout bénéfice non ?

Introduire à tout va de nouvelles DTDs est un piège que tu as bien illustré, tout comme Habot l'a décrit avec ses "poupées russes".
salut !!!

ne pensez vous pas que le XML est une sorte de nouveau code ASCII ? ...
Modifié le 04 Feb 2005 - 11:17
medjai94 a écrit :
salut !!!

ne pensez vous pas que le XML est une sorte de nouveau code ASCII ? ...

La tu confond codage des caractère et document à syntaxe particulière Smiley confus

L'XML permet de décrire des données (donc ce morceau est un paragraphe, ce truc là est un titre), l'ASCII lui, est une table de conversion entre un caractère et un numéro...

De plus, l'ASCII est remplacé par l'Unicode. Le problème avec l'ASCII étant qu'il est limité à 255 caractère par défaut, d'où la nécessité de plusieurs tables ASCII pour couvrir tous les caractères.
FlorentG je pense que tu n'as pa bien saisie ce que j'ai voulu dire
je m'explique:

Le principe est le même: de la même manière que l'ASCII est un standard venant structurer les suites de 0 et de 1 en leur affectant une signification (et en définissant des suites de bits invalides), XML est une recommandation structurant des suites de caractères en leur attribuant une signification (et en définissant des règles de conformité).

Dans les deux cas, il s'agit d'une spécification facilitant la communication entre machines en standardisant la manière dont un flux de 0 et de 1 doit être compris de part et d'autre.

de plus :

De la même manière que l'ASCII est insuffisant pour communiquer entre applications sans conventions préétablies sur la structure des informations échangées, XML est insuffisant pour communiquer entre applications sans conventions préétablies sur la signification (cette sémantique devient un leitmotiv) des informations échangées.

Smiley sweatdrop
Si, j'ai bien compris ce que t'as dit Smiley cligne mais je soutiens que ce n'est pas la même chose Smiley smile

L'ASCII est une norme de codage, l'XML une norme syntaxique.
moi ce que je pense c'est XML vient entourer le code ASCII

du style -->

si bits étaient des particules élémentaires, l'ASCII serait le niveau atomique, XML le niveau moléculaire et RDF les chaînes moléculaires organiques !