109Lab au SemanticCamp Paris

Le samedi 16 avril a eu lieu la troisième édition du SemanticCamp Paris à laquelle j'ai eu la chance de participer. Voici un petit bilan des débats qui ont retenu mon attention...

NB : l'objectif de ce post n'est pas de faire un bilan complet du SemanticCamp Paris, mais de vous présenter plutôt les points qui m’ont marqués.

Wiki, Web Sémantique et Entités Nommées

Gil Francopoulo (Tagmatica), qui travaille sur des thématique du traitement de la langue naturelle et notamment les *entités nommées*, a présenté un de leurs outils qui s'appuient sur Wikipédia : Ils utilisent une ontologie prédéfinie dans laquelle ils cherchent à placer des "instances" qu'ils obtiennent via Wikipédia. Les "instances" ainsi créées sont liées avec des actualités récentes.

Wiki et Web Sémantique

Karima Rafes (BorderCloud et organisatrice du SemanticCamp) à parler d'un projet dont le but est d'étendre un Wiki pour lui ajouter des capacités de mappings vers des ontologies prédéfinies. Ceci permet notamment de rapidement obtenir des "triplets" et interroger le Wiki via du SPARQL.

Drupal et Web Sémantique

Frédéric G. MARAND (OSInet), a présenté Drupal 7 qui permet en natif un support de RDFa. Ainsi, il est désormais possible dans ce CMS de mettre en place des correspondances entre les informations associés au "nodes" Drupal et le vocabulaire d'une ontologie.

Stockage et interrogation des données du Web Sémantique

Laurent BEL (Armadillo) a fait un retour d’expérience sur leur approche de stockage dans une base de données relationnelle classique de "triplets" inspirés du web sémantique. Il a présenté les bases de ce qui leur permet d’interroger de manière efficace une base de tels triplets dans le cadre de stockage de données multimédia. Il rapporte que cette approche permet de gagner un temps considérable dans la conception et mise en œuvre du modèle d'une base de données classique.

Comment "sémantiser" des données peu structurés existantes ?

Ivan Beraud (CFDT) à fait un retour sur un besoins métier concret. Comment transformer des données existantes relativement formalisé (mais pour des être humains) en données "sémantisé". Le problème particulier qu'il évoque est la structuration de "fiches métiers" et les chemins pour arriver à un métier et les chemins vers lequel un métier peut mener. Un des problèmes soulevés est assez classique : mettre tout le monde d'accord sur un découpage conceptuel et ou la confrontation de différents découpages existants (e.g. ceux de Pôle emploi et ceux de la CFDT elle-même). Outre celui-ci un autre est d’offrir des outils aux utilisateurs qui leur permette de structurer

Mes conclusions

Ce Semantic Camp a été très enrichissant pour moi de plusieurs points de vu. Il m'a permis de rencontrer d'autres acteurs défendant l'idée d'un Web plus "sémantique". Il m'a conforté dans la vision que je me fait du Web sémantique. Il m’a permis d'avoir des retours sur ce que d'autres font dans le cadre du Web sémantique et d'ainsi me faire une petite idée du chemin parcouru dans le domaine du Web sémantique.
Les deux présentations sur les Wiki plus celles sur Drupal, ont conforté mon idée qu'il est possible d'envisager des outils qui permettent d'alimenter le Web d'"instances" d'ontologies formalisées sans que l'utilisateur final ait forcément conscience des formalismes sous-jacents. Par ailleurs, ceci montre de manière plus générale que l'intelligence collective est un bon moyen d'obtenir des "instances" formalisées de concepts d'un Web plus sémantique.
La réalité actuelle du Web sémantique est encore à ses balbutiements mais commence à prendre des formes concrète via des solutions qui sautent le pas. Notamment, ceci est probablement favorisé par le fait que la prise en compte par Google de RDFa va se voir de plus en plus. Deux aspects toutefois qui, à mon sens, sont cruciales pour que le web sémantique démontre toute sa puissance :

  • d'une part la capacité de raisonner avec les données issues de cette nouvelle version du web
  • d'autre part compléter l'assistance à l'enrichissement sémantique de données existantes et/ou la création de nouvelles données déjà "sémantisées".