Un
système de gestion de contenu ou
SGC (
Content Management System ou
CMS) est une famille de logiciels destinés à la conception et à la mise à jour dynamique de
sites Web ou d'applications multimédia. Ils partagent les fonctionnalités suivantes :
- ils permettent à plusieurs individus de travailler sur un même document ;
- ils fournissent une chaîne de publication (workflow) offrant par exemple la possibilité de mettre en ligne le contenu des documents ;
- ils permettent de séparer les opérations de gestion de la forme et du contenu ;
- ils permettent de structurer le contenu (utilisation de FAQ, de documents, de blogs, de forums de discussion, etc.) ;
- ils permettent de hiérarchiser les utilisateurs et de leur attribuer
des rôles et des permissions (utilisateur anonyme, administrateur,
contributeur, etc.) ;
- certains SGC incluent la gestion de versions.
Lorsque le SGC gère du contenu dynamique, on parle de
système de gestion de contenu dynamique ou
SGCD (
Dynamic Content Management System ou
DCMS).
Les SGC ne doivent pas être confondus avec les systèmes de
gestion électronique des documents (GED) qui permettent de réaliser la
gestion de contenu dans l'entreprise.
Fonctions communes
Pour arriver à offrir les fonctionnalités citées plus haut la conception se fonde assez souvent sur les mécanismes suivants :
Utilisation d'interface web - SGC
Au travers d'
interfaces web, les SGC sont accessibles quel que soit le type de
système d'exploitation au moyen d'un
navigateur Web. Ainsi, les utilisateurs n'ont pas besoin d'installer de logiciels spécifiques supplémentaires. Grâce aux
standards du web, les SGC offrent donc un format de données lisible (
HTML et ses dérivés
RIA),
imprimable et stockable par tous, ce qui facilite l'échange et
l'accessibilité des documents. Un SGCD permet de gérer et de générer le
code source des projets pour l'exporter.
Séparation entre contenu et présentation
C'est un principe fondateur de la gestion de contenu :
- Le contenu est stocké le plus souvent dans une base de données,
structurée en tables et en champs. C'est le contenu des champs de la
base qui est créé/modifié par le rédacteur, et non pas la page
elle-même. On parle de site « dynamique » ;
- La présentation est définie dans un gabarit. Le gabarit définit deux
choses : la mise en page proprement dite - via les feuilles de style
(parmi lesquelles les CSS, ou les règles de transformation XSLT), et la structuration des données, au moyen de standards tels que XML,
ainsi que les informations extraites de la base de données (de même que
l'endroit où celles-ci doivent être affichées et sous quelles
conditions).
Édition de page simplifiée
Du fait du principe de séparation contenu/présentation, les
rédacteurs peuvent se concentrer sur le contenu. L'édition des pages est
considérablement simplifiée. Deux mécanismes sont proposés :
- Une interface WYSIWYG qui propose une interface graphique de mise en forme similaire à celle qui existe dans un traitement de texte ;
- L'utilisation de balises simplifiées, visant à mettre le texte en forme. Il en existe plusieurs types, dont le plus répandu est BBCode. On peut aussi citer des alternatives plus modernes telles que Markdown ou Textile. Les wikis qui ne sont pas WYSIWYG utilisent le wikitexte.
Pour aider les contributeurs à saisir plus simplement des contenus,
de nombreux outils de gestion de contenu proposent des fonctions
d'édition «
inline », c'est-à-dire d'édition depuis la partie visible du site sur internet (appelée aussi front-office, en jargon informatique).
De multiples méthodes de rangement de l'information
La
théorie de l'information
affirme que plus il y a d’informations, plus le désordre augmente. En
pratique, lors de la recherche d'une information spécifique, toutes les
autres créent du bruit. Pour y remédier, un SGC propose habituellement
de multiples mécanismes de tri plus ou moins complexes comme :
- les hyperliens, qui permettent de référencer les articles entre eux ;
- un moteur de recherche sur le texte ;
- des tris spécifiques (par date de modification, auteurs, liens…).
La majorité des SGC offrent la possibilité de catégoriser l’information, de l’indexer ou d’utiliser des
taxinomies
pour améliorer les méthodes de recherche et l'affichage des contenus.
On peut donc créer des catégories de contenus, des sections (ou
rubriques), voire des mots clés favorisant l’
indexation.
La multiplication des vues, des mécanismes de choix, diminue la
profondeur de l’information par rapport à la page d’entrée en
multipliant les chemins, et la rend donc plus accessible.
Gestion des droits
Par le biais de l’interface d’administration, les systèmes offrent le
plus souvent la possibilité de gérer les utilisateurs et leurs
droits.
C'est-à-dire de leur donner accès ou non aux fonctionnalités du
système. Les fonctionnalités sont multiples et variables selon la
plate-forme, très basiques comme un droit de lecture/écriture sur un
article, ou plus élaborées comme un droit de modération d’autres
utilisateurs. Afin de gérer plus globalement les droits des
utilisateurs, certaines solutions de CMS permettent de créer et gérer
des groupes d'utilisateurs. Les utilisateurs sont ensuite intégrés aux
groupes. Pour répondre aux besoins des organisations, la plupart des
outils de CMS permettent l'interfaçage avec des annuaires d'entreprises (
LDAP, AD).
Le SGC, évolution convergente de la société de l'information
Le concept de
WYSIWYG a rencontré un grand succès dans la création de contenu dans les
années 1980,
et fait perdre alors du terrain aux systèmes de marquage qui séparaient
à la source le contenu de la forme (le rendu). Sauf à utiliser un
éditeur approprié (comme
Markup sur PC), un délai de plusieurs
secondes séparait alors l’insertion d’une balise et une de ses
visualisations possibles dans un contexte donné : une compilation était
en effet nécessaire pour que l’utilisateur visualise le résultat.
Néanmoins, ce principe de
texte marqué par des balises donnait seul la flexibilité imposée par l’édition professionnelle et continue à être utilisé :
TeX,
GML,
SGML, etc., tandis que le cycle du rendu passait de quelques dizaines de secondes à parfois quelques
dixièmes de seconde en raison de la puissance accrue des machines, puissance qui augmentait conformément à la
loi de Moore.
Le WYSIWYG a pour sa part repris quelques concepts du texte marqué en
bureautique et reste dominant dans la création de contenu grand public, car demandant moins d’effort d’
abstraction. La séparation du contenu et de la forme est toutefois partiellement réalisée par l’usage du concept de
styles, à l’image du rendu de l’
HTML par des
feuilles de style (
Cascading Style Sheet ou CSS) en texte marqué. Les deux systèmes ont donc en partie convergé.
La spécialisation des organisations fait qu’il existe des
départements spécialisés dans la présentation des contenus issus de
l’entreprise (département chargé de la
charte graphique de l’entreprise, souvent rattaché au
marketing)
et d’autres dans la rédaction de contenu (par exemple : département
commercial, technique ou relations publiques), qui rédigent au kilomètre
en s’insérant dans les moules existants. Le découplage entre fond et
forme est là aussi assuré.
L’introduction de
feuilles de style
propose ou impose des formats prédéfinis à la création de
documents-types. La convergence des moyens de visualisation (liée à
l’accessibilité généralisée de diverses polices jadis réservées aux
seuls services de composition) a fini par simplifier non seulement la
création de contenu, mais aussi son échange.
L’intégration de documents hétérogènes à la fois par la nature
(images, feuilles de calcul) et la provenance (sous-traitants) au sein
d’un même document nécessite une gestion unifiée des pièces incluses.
Enfin, dans le cadre de la relation client pour les
entreprises
ou des réglementations pour les administrations, il faut pouvoir suivre
les flux d’informations émis. Il fut donc demandé aux utilisateurs de
ranger leurs documents de manière à pouvoir les trouver, et suivre les
modifications faites dans la communication :
Des tâches annexes comme la mise en page, la gestion des flux
documentaires, la gestion des formats, jadis traitées comme annexes au
contenu proprement dit du document, en font maintenant partie
intégrante, conjointement aux définitions
extérieures au document indiquant leurs modalités.
Prospective
Le SGC s’inscrit dans cette évolution générale, en combinant la
création de contenu avec sa gestion, son archivage, et la publication.
Les systèmes les plus avancés à l’heure actuelle répondent déjà aux
besoins suivants :
Gestion de versions successives et/ou concourantes
Lorsque plusieurs personnes ou entités travaillent sur un même
document, elle fournit un outil qui trace les évolutions, et permet de
visualiser/gérer les modifications et les éventuelles situations
conflictuelles. Grâce à elle, on peut également savoir qui a apporté
telle modification et quand.
Multiplication des vues
En fonction des centres d’intérêt des lecteurs, certains SGC actuels
permettent de présenter un contenu de manière personnalisée tout en
exploitant le même contenu original. Par exemple, une organisation
fournit la même base documentaire mais des présentations différentes à
ses différentes parties prenantes : pour une entreprise, ce peut être
ses clients, ses fournisseurs, ses catégories de personnels, et ses
actionnaires.
Travail collaboratif (groupware)
Plusieurs parties prenantes peuvent trouver avantage à travailler sur
un espace commun privé, lié à une communication précise (suivi d’une
relation client pour une entreprise et son fournisseur), tout en gardant
une trace historique matérialisable (en général par la couleur)
permettant de savoir qui a modifié quoi. Un logiciel précurseur dans le
domaine a été
Lotus Word Pro, dont
Microsoft Word reprit plus tard cette fonction.
Multiplication des sources de contenu
Il s’agit de mutualiser les contenus de plusieurs organisations tout
en présentant le contenu d’informations issues de sources différentes
avec leur mise en page, comme le font les journaux qui diffusent les
dépêches d’agences de presse. Ce mécanisme s’appelle généralement la
syndication de site.
La plupart des projets SGC
libres fonctionnant sur le
Web
proposent de créer des forums associés aux articles pour laisser les
visiteurs réagir. Ils sont la base du succès des sites de nouvelles en
fil. On a pu constater sur des sites comme
Slashdot que les commentaires des lecteurs apportaient eux-mêmes une
valeur ajoutée à l’information, la scindant en deux blocs :
- L’information institutionnelle, qui apporte ce qui peut être émis par une source dite de confiance ;
- L’information officieuse qui, par un mécanisme de retour,
permet d’obtenir : la validation, la correction, la discussion d’une
information, et son enrichissement par tout lecteur.
Le commentaire fait évoluer les outils logiciels d’édition (destinés à
la simple diffusion d’information) vers des outils de communication. En
effet, la
communication est bilatérale, à la différence de l’information, unilatérale.
Ceci est probablement la plus grande évolution qui implique un
changement profond de notre façon de considérer le partage de la
connaissance et d’appréhender le web. En effet, d’un côté le diffuseur
d’information, en proposant un forum de réactions, prend les risques
inhérents à l’expression publique (juridiques et rédactionnels) et, de
l’autre, l’utilisateur prend le risque de la modification/suppression de
son contenu par les auteurs du site.
Il est certain qu’il pourrait être décidé que seules les personnes utilisant la
signature numérique
puissent réagir afin que tous soient responsables de leurs dires, mais
qu’advient-il alors de l’anonymat qui permet la liberté de parole ? Il
est probable que les personnes devront se baser sur la confiance qu’ils
ont dans l’
éthique
des éditeurs, et les éditeurs espérer que la loi ne les tienne pas pour
responsables en toutes circonstances des propos des lecteurs.
L'amélioration qualitative se poursuit
Ces logiciels ont énormément amélioré leurs qualités :
- La sécurité informatique,
en particulier pour empêcher la prise de contrôle par des tiers, est
désormais correcte voire excellente (prise en charge native de SSL, voire Kerberos) ;
- La qualité du code (PHP, Python, PERL…) : il est de mieux en mieux indenté, commenté (donc plus clair), ce qui favorise l’identification des bugs et l’amélioration par la communauté ;
- La qualité des documents informatiques publiés, la qualité du code HTML, JavaScript etc., le respect des normes ainsi que l’ergonomie.
La mise en conformité au standard
XHTML et l’actualisation des méthodes de programmation des concepteurs avec des méthodes telles que l’
Extreme programming ont permis une nette amélioration de la qualité des systèmes de gestion de contenu.
Rentabilité
La mise en place d’un système de gestion de contenu simple pour une
petite entreprise représente un investissement certain. Dans cette
optique, l’entreprise doit considérer les points suivants afin d’évaluer
si l’implantation d’un tel système sera rentable :
- étendue des modifications du site ;
- fréquence des modifications du site ;
- urgence des modifications du site.
Liste de SGC
Liste des principaux SGC :
- WordPress est un moteur de blog
- Dotclear est un moteur de blog
- Magnolia est un CMS OpenSource Java
- Joomla! est un moteur de portails
- Drupal est un moteur de portails
- Concrete5 est un moteur de portails
- Xoops est un moteur de portails
- Spip est un CMS à templates
- fluxBB est un moteur de forum
- phpBB est un moteur de forum
- SMF est un moteur de forum
- MediaWiki est un moteur de wikis
- Prestashop est un moteur de boutique en ligne
- DotNetNuke est un CMS libre de droits sur la plateforme Microsoft .Net
- Rubedo est un CMS open source multi-sites