Le Serveur Web :
un Nouvel Outil de Communication Scientifique ?
CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641, École polytechnique, Institut Polytechnique de Paris, CNRS, France
france telecom, France Telecom R&D
[Site Map, Help and Search [Plan du Site, Aide et Recherche]]
[The Y2K Bug [Le bug de l'an 2000]]
[Real Numbers don't exist in Computers and Floating Point Computations aren't safe. [Les Nombres Réels n'existent pas dans les Ordinateurs et les Calculs Flottants ne sont pas sûrs.]]
[N'oubliez pas de visiter Une Machine Virtuelle à Explorer l'Espace-Temps et au-delà où vous trouverez plus de 10.000 images et animations à la frontière de l'Art et de la Science]
(Site WWW CMAP28 : cette page a été créée le 20/02/1998 et mise à jour le 21/12/2024 04:20:05 -CET-)
(publié dans les actes de la Journée sur la Publication Scientifique Electronique, Paris, 24/03/1998)
[in english/en anglais]
Résumé : En quelques mois, le réseau Internet est
passé du stade de l'expérience universitaire à
celui d'outil de communication universelle.
Son succès actuel est évidemment
médiatique, mais au-delà de l'effet de mode
certain, se cache un bouleversement profond
de toutes nos activités. La recherche
scientifique ne peut y échapper. Ce texte est destiné à
relater la mise en place d'un site Web, les
difficultés rencontrées, ainsi que les leçons
qu'il est possible d'en tirer, sans oublier
les questions que cela pose.
Mots-Clefs : Web Server, Internet.
Plan de ce document :
La recherche en Visualisation
scientifique est par définition très visuelle et
se prète donc fort bien à une exposition sur
le Web. En 1994, il a donc été décidé de
mettre en place le serveur
http://www.lactamme.polytechnique.fr
destiné à présenter les techniques
sous-jacentes, ainsi que quelques grandes
applications. Très rapidement, un certain
nombre de questions se sont posées :
- Quelle apparence donner à ce site ?
- Dans quelle langue publier ?
- Comment utiliser efficacement le langage HTML
(celui-ci ne disposant pas,
par exemple, des structures propres aux
langages de programmation) ?
- Comment gérer (créer, mettre à jour,...)
une grande quantité de fichiers (117016
à la date du Samedi 21 Décembre 2024) ?
- Comment disposer d'une vue tant locale que globale du serveur ?
- Comment maîtriser les nombreuses relations d'interdépendances
qu'entretiennent tous les fichiers entre-eux ?
- Comment faire des statistiques utiles de fréquentation ?
- Comment prendre en compte le problème de la
propriéte des différents "objets" exposés ?
- Comment atteindre un niveau de securité acceptable ?
Donnons donc ci-après quelques
éléments de réponses à ces diverses
questions :
1-L'APPARENCE DE CE SITE :
Nombreuses sont sur Internet les pages où la forme l'emporte
largement sur le fond ou bien dont le suivi n'est
plus assuré. Citons ainsi quelques "anomalies"
fréquemment rencontrées :
- fonds multicolores rendant illisibles les
textes ou pire éblouissant le lecteur,
- programmes Java animant tout ou partie de
la page, détournant bien souvent l'attention,
masquant ainsi l'information présentée,
- images trop nombreuses et/ou trop
volumineuses, rendant le temps de chargement
trop important et pouvant aller jusqu'à
décourager le visiteur,
- informations obsolètes (de nombreux sites
sont créés, puis très rapidement abandonnés),
- manque d'homogénéïté lorsque le site
contient plusieurs pages distinctes,
- etc...
Ces quelques constatations ont conduit a
privilégier ici la sobriété et l'homogenéïté. Il a
donc été décidé :
- de rendre préponderant le fond sur la forme
et de s'intéresser plus à la structure des documents
qu'à leur apparence,
- de définir un modèle de présentation unique
partagé par toutes les pages (ceci est rendu
possible grâce au langage qui sera presenté
au chapitre 3),
- d'imposer le moins possible de contraintes
en ce qui concerne la présentation (seules sont
utilisées les directives de centrage, de respect des
tabulations, de mise en gras ou en italique et de
taille relative des caractères), ainsi les fontes ou
encore la couleur du fond sont laissées à la
discrétion du visiteur,
- de n'afficher automatiquement à l'intérieur
de chaque page qu'un nombre très réduit de
petites images -ou "vignettes"- (ceci n'est pas en
contradiction avec l'existence de pages allant
jusqu'à présenter plusieurs centaines de
vignettes car, en effet, ces documents sont plus
des outils de gestion du site -en en donnant par
exemple une vue globale-
qu'autre chose...),
- de limiter la taille des fichiers images en
adaptant automatiquement le taux de
compression des images JPEG et la définition
des animations MPEG,
- développer des outils d'automatisation des
créations et des mises a jour, partout où cela est
possible,
- de mettre en commun tout ce qui peut
(légende des images par exemple) et/ou doit
l'être (paramètres généraux, coordonnées de
l'auteur,...),
- etc...
2-LE CHOIX DE LA LANGUE :
La diffusion sur Internet étant internationale, il
est impératif, pour être lus, que les documents
soient redigês en langue anglaise. Malgré
cela, il est important, autant que faire se
peut, d'offrir simultanêment une traduction
en langue française. Ainsi que cela sera dit
par la suite, le nécessaire a été introduit dans
l'environnement de travail afin d'éviter les
duplications que cela entraineraient (à titre
d'exemple, le plan d'un document est
unique, quelles que soient les langues utilisées).
3-LES OUTILS DE CONCEPTION ET DE GESTION :
Toute personne ayant jeté un coup
d'œil sur le contenu de pages HTML ne peut
qu'être horrifiée par le désordre qui y règne
généralement et par l'absence totale de
structuration. Or cette notion fait partie des
recommendations données dans le monde du
Génie Logiciel afin d'aboutir a des
réalisations de qualité, qui soient facilement
maintenables et qui puissent ensuite évoluer
facilement. Utilisant le pré-processeur m4
disponible sous UNIX, un petit langage de
description de pages a donc été conçu
(notons au passage que c'est l'utilisation
d'une plate-forme UNIX qui a conduit,
malheureusement, à omettre les accents pour
les textes rédigés en français, comme il est facile de le constater sur cette page
-à partir du mois de janvier 2010, les accents furent systématiquement introduits-...).
Il permet :
- de structurer les documents,
- de créer naturellement les liens utiles,
- de prévenir les fautes de frappe
et d'orthographe les plus couramment rencontrées
chez les visiteurs ; ainsi, à partir du nom de chaque document,
sont crées automatiquement des "synonymes" (utilisant la notion de
liens UNIX), par exemple,
en remplaçant les majuscules par des minuscules...
- d'éviter la duplication (a titre d'exemple,
les quelques lignes définissant
les coordonnées de l'auteur
sont communes à l'ensemble des documents),
- de définir une seule et même structure pour
un document produit simultanément en plusieurs langues,
- d'intégrer des éléments issus d'autres processus
(des sources de programmes par exemple),
- de traduire rapidement des documents externes (article
rédigé sur un MacIntosh par exemple, comme c'est le
cas pour cette page),
- etc...
(voir par exemple le source de cette page ou encore le catalogue général -généré automatiquement- du site).
Plusieurs utilitaires ont été développés
afin d'automatiser au maximum la création et
la gestion des pages. C'est ainsi, par
exemple, qu'afin d'introduire une nouvelle
image, la commande :
creation IMAGE PALETTE "LEGENDE EN ANGLAIS" "LEGENDE EN FRANCAIS"
a été développée. Elle crée, s'il n'existait
pas déjà, un directory de nom IMAGE
contenant :
- le programme (en m4) d'affichage de cette image,
- le fichier JPEG correspondant,
- un fichier MPEG lorsqu'il s'agit en
plus d'une animation, auquel cas le JPEG
donne alors une matrice "résumé" (afin de ne
pas rendre les temps de chargement trop
importants, les fichiers MPEG sont générés
en très faible résolution et ainsi n'excèdent
jamais deux à trois cents kilo-octets),
- deux fichiers textes contenant les légendes en français et en anglais respectivement
(celles-ci sont alors réutilisables partout),
- et enfin, une "vignette" JPEG de
l'image argument permettant, par exemple, la
construction de matrices d'images.
D'autres commandes sont disponibles ;
elles permettent de créer automatiquement
des programmes m4 donnant :
Enfin, une dernière catégorie de
commandes permet d'assurer la surveillance
permanente du bon fonctionnement du site.
4-LA PROTECTION DE L'INFORMATION :
Ainsi que cela fut déjà dit, ce site est dédié principalement à
la visualisation scientifique. Il contient donc
de nombreux catalogues d'images classées
par thème :
Gallery : Deterministic Fractal Geometry [Galerie : Géométrie Fractale Déterministe]
|
Gallery : Non Deterministic Fractal Geometry and Natural Phenomenon Synthesis [Galerie : Géométrie Fractale Non Déterministe et Synthèse de Phénomènes Naturels]
|
Gallery : Deterministic Chaos [Galerie : Chaos Déterministe]
|
Gallery : Sensitivity to Rounding-Off Errors [Galerie : Sensibilité aux Erreurs d'Arrondi]
|
Gallery : Statistical Mechanics and Particle Systems [Galerie : Mécanique Statistique et Systèmes de Particules]
|
Gallery : Fluid Mechanics [Galerie : Mécanique des Fluides]
|
Gallery : Quantum Mechanics [Galerie : Mécanique Quantique]
|
Gallery : Celestial Mechanics [Galerie : Mécanique Céleste]
|
Gallery : Astrophysics and Cosmology [Galerie : Astrophysique et Cosmologie]
|
Gallery : Number Theory and much more (Hyperbolic Geometry, Complex Functions, Great Conjectures, Knots, Cellular Automata, Tilings, Meshings, Trees, Fractals,...) [Galerie : Théorie des Nombres et beaucoup d'autres sujets (Géométrie Hyperbolique, Grandes Conjectures, Nœuds, Automates Cellulaires, Pavages, Maillages, Arbres, Fractales,...)]
|
Gallery : Pi [Galerie : Pi]
|
Gallery : Numbers and Light (Mathematics as a virtual optical instrument) [Galerie : Les Nombres et la Lumière (Les Mathématiques, un Instrument d'Optique Virtuel)]
|
Gallery : Numbers and Light (Mathematics as a virtual optical instrument) -"light" version- [Galerie : Les Nombres et la Lumière (Les Mathématiques, un Instrument d'Optique Virtuel) -version "légère"-]
|
Gallery : Signal Processing [Galerie : Traitement du Signal]
|
Gallery : Texture Synthesis [Galerie : Synthèse de Textures]
|
Mais s'y trouvent aussi présentés des
articles généraux portant principalement sur :
Actuellement, plus de 1700 visiteurs
différents viennent quotidiennement
consulter les documents présentés sur ce site
(une pointe record de 7424 visiteurs a été
observée le 16/11/2023). Le problème de
leur protection se pose donc. Il a ètè choisi
pour des raisons de simplicitè d'apposer sur
chaque documents (textes, images,...) une
notice de copyright n'imposant aucune
contrainte pour les utilisations non lucratives
et rèclamant une demande d'autorisation
dans les autres cas.
Enfin, et afin de limiter les risques d'intrusion
destructive, ce site est hébergé par une
machine dédiée, dont les fonctionnalités ont
été réduites au maximum.
5-DE L'UBIQUITE SUR INTERNET :
Un site Internet peut et doit être considéré
comme une nouvelle forme de publication
scientifique. Il apporte au chercheur
l'ubiquité : en effet, l'information, sous
toutes ses formes (textes, sons, images fixes
et animées,...) devient disponible en temps
réel dans le monde entier et sa mise a jour
(corrections, améliorations,...) est elle-aussi
possible instantanément, contrairement au
support papier par exemple. En
contre-partie, elle ne va pas sans poser
quelques problèmes non résolus, parmi
lesquels :
- Comment effacer l'information, si
besoin est, une fois qu'elle est rendue
disponible (en particulier la notion de cache,
fait que toute information diffusée sur
Internet peut être dupliquée en de très
nombreux exemplaires dispersés sur la
planete entière, et ce sans aucun contrôle de la part de son producteur) ?
- Comment protéger les auteurs
(scientifiques, artistes,...) contre le pillage, lorsqu'ils
le souhaitent ?
- Comment contrôler la qualité et la
véracité des informations (de récents
événements relevant de la politique confirme
que les rumeurs -vraies ou fausses- se
propagent aujourd'hui à la vitesse de la
lumière) ?
- Comment éviter la publication hâtive
(tout se faisant facilement -trop facilement ?-,
la tentation est grande de publier trop
rapidement ; il conviendrait d'apprendre ici
de nouveaux tourner sept fois la langue dans sa bouche
et vingt fois sur le métier -sur le clavier ?- remettez votre ouvrage...) ?
- Comment rendre possible la non répudiation ?
En effet, lorsqu'un document imprimé (un livre ou un article
par exemple) a été diffusé, son auteur peut d'une part prouver
qu'il a mis en circulation telle information à telle date.
D'autre part, celui-ci ne peut pas contester la mise en
circulation de cette information à cette date. Comment donc transposer
cette possibilité sur un médium tout à la fois volatil, virtuel,
infiniment malléable, "parfait" (dans le sens ou la modification ou
la copie d'un document n'altère pas sa qualité),... ?
- Un site peut être l'œuvre d'un seul individu. Dans ces conditions,
que deviendra-t-il si son créateur/administrateur disparait (au sens propre,
comme au sens figuré) ? Qui continuera à le maintenir ? Que se passera-t-il
lorsque l'ordinateur-hôte disparaitra lui-aussi ? Ne risque-t-on pas ainsi
de voir s'effacer une partie de notre savoir ?
Finalement, le médium numérique est-il pérenne ?
Nos ordinateurs sont-ils plus sûrs que la Bibliotheque d'Alexandrie ?
Copyright © Jean-François COLONNA, 1998-2024.
Copyright © France Telecom R&D and CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641 / École polytechnique, Institut Polytechnique de Paris, 1998-2024.