Cette page recense les différents logiciels développés ou adaptés par les partenaires durant le projet EPAC.

Segmentation et regroupement en locuteur (SRL)

  • LIUM_SpkDiarization est un système SRL entièrement développé par le LIUM est très compétitif et très utilisé à travers le monde. Un site web lui est consacré dans lequel les sources sont téléchargeables : http://lium3.univ-lemans.fr/diarization. Il est diffusé sous licence GPL.

Transcription automatique de la parole

  • Le LIUM développe son système de transcription automatique de la parole à partir du projet CMU Sphinx. Le LIUM intervient directement dans le projet. Certains fonctionnalités ajoutées par le LIUM sont implémentées directement dans le code source de la version officielle de CMU Sphinx (dans les décodeurs Sphinx3 et Sphinx4). L'intégralité du code source développé par le LIUM durant le projet EPAC affectant les moteurs de transcription a été déposée dans la branche LIUM du projet CMU Sphinx lui-même : branche LIUM du serveur Subversion de CMU Sphinx. CMU Sphinx et les ajouts du LIUM sont distribués sous licence BSD-like.

Traitement automatique du langage naturel

  • Le LIF a développé un ensemble d'outils logiciels, MACAON, dédié au TALN. MACAON est une chaîne de traitement permettant d’effectuer des tâches standard de traitement automatique de la langue aussi bien sur du texte natif (produit par un être humain) que sur des hypothèses multiples issues de processus automatiques (reconnaissance de la parole, traduction automatique …). MACAON est composée de plusieurs modules réalisant des traitements classiques (découpage en mots, étiquetage morpho-syntaxique, lemmatisation, analyse morphologique, analyse syntaxique partielle). Le site web de MACAON présente plus en détail ces outils et permet de télécharger le code source de MACAON qui est distribué sous licence GPL (outild) ou licence LGPL (librairies).
  • LIA_NE est l'outil de détection et catégorisation des entités nommées développé par le LIA. Il est le système qui a obtenu les meilleurs résultats sur des transcriptions automatiques lors de la campagne ESTER 2 en 2008. LIA_NE est téléchargeable sur le site de Frédéric Béchet.
  • SECARE est l'outil de segmentation en chunks des énoncés oraux développé par le LI. Il est utilisable avec la plate-forme Unitex complémentée par le système de gestion de cascades de transducteurs CasSys. SECARE est téléchargeable sur le site de l'équipe BDTLN du LI. Adresse précise : SECARE
  • CASEN est une ressource linguistique (ensemble de règles linguistiques sous la forme d'une cascade de transducteurs) permettant la détection des entités nommées développé par le LI. Il est utilisable avec l'outil de gestion de cascades de transducteurs, CasSys, intégré dans la plate-forme Unitex. CASEN est téléchargeable sur le site de l'équipe BDTLN du LI ou bien sur le site d'Unitex
logiciels.txt · Dernière modification: 2011/01/08 15:50 par li