1-4 sept. 2015 Strasbourg (France)

Formations

Journées de formation LTT

Les journées de formation LTT s’adressent principalement aux doctorants en linguistique, traduction, terminologie travaillant sur des corpus électroniques. Les formations proposées présentent des aspects méthodologiques liés à l’exploitation des ressources électroniques mais ainsi que des aspects pratiques liés à l’exploitation des ressources et des outils dédiés ou à la professionalisation dans le domaine des sciences humaines. Les doctorants peuvent compléter leur formation avec la maîtrise des outils ou des ressources (bases lexico-sémantiques, corpus annotés, bases terminologique).

Enseignement et recherche, théorie et pratique

Les formations proposées s’appuieront sur des modules spécialisés proposés dans divers Masters de l’Université de Strasbourg adossés à l’EA 1339 - LiLPa. Elles feront également appel à des formateurs extérieurs en lien avec le Consortium Corpus Écrits du TGIR Huma-Num. Les participants aux journées de formation auront l’occasion de mettre en pratique les méthodologies d’exploration de corpus à travers des outils spécifiques. Les jeunes chercheurs et doctorants participant aux formations sont par ailleurs invités à présenter leur thématique de recherche dans le cadre de la conférence LTT pour établir des liens avec d’autres membres de la communauté scientifique.

Déroulement des journées de formation

Les journées de formation se dérouleront sur les deux premières journées du colloque, mardi 1er et mercredi 2 septembre 2015. Deux sessions parallèles sont prévues, dans deux salles informatiques. La plateforme pédagogique Moodle sera utilisée pour mettre des ressources logicielles et pédagogiques à disposition des participants. Chaque participant se verra remettre une documentation imprimée comportant les supports utilisés au cours de la formation.

 

INSCRIPTION PREALABLE OBLIGATOIRE aux formations (avant le 23 juillet 2015) : https://framacalc.org/jdut8h6vwi

Les bénéficiaires des journées de formation

Les journées de formation sont avant tout destinées aux doctorants ou jeunes docteurs en sciences du langage, afin de leur permettre d’acquérir des outils et techniques de base d’exploration et d’annotation de corpus, utiles pour leurs travaux de recherche. Elles s'adressent aussi aux enseignants désireux d'étendre leurs domaines de compétences.

Formations proposées

Initiation à l’analyse de corpus de textes avec le logiciel libre TXM (S.Heiden, ENS Lyon)

Mardi, le 1er septembre 2015, 9h-12h30 et 14h-17h30

Patio, salle 3210

Qu’est-ce que la textométrie ?

La textométrie, née en France dans les années 80, a développé des techniques puissantes et originales pour l’analyse de grands corpus de textes. Reprenant les acquis de la lexicométrie et de la statistique textuelle, elle propose des outils et des méthodes éprouvés dans de multiples branches des SHS et statistiquement solidement fondés. Le projet Textométrie fédère les développements logiciels académiques du domaine pour mettre en place une plateforme modulaire et open-source appelée TXM <http://textometrie.ens-lyon.fr/spip.php?article60>. Il s’agit à la fois d’une opération patrimoniale au rayonnement international et du lancement d’une nouvelle génération de recherche textométrique, en synergie avec les technologies de corpus actuelles (Unicode, XML, TEI, outils de TAL, CQP, R). La formation est animée par Serge Heiden, responsable du projet « Textométrie ».

En savoir plus sur TXM <http://textometrie.ens-lyon.fr/spip.php?rubrique96>

Consulter les publications de l’équipe Textométrie <http://textometrie.ens-lyon.fr/spip.php?rubrique99>

Pourquoi utiliser TXM ?

La plateforme TXM est couramment utilisée par des projets de recherche de différentes disciplines de lettres, sciences humaines et sociales comme l’histoire, la littérature, la géographie, la linguistique, la sociologie et les sciences politiques. La plateforme TXM combine des techniques puissantes et originales pour l’analyse de grands corpus de textes au moyen de composants modulaires et open-source. TXM permet actuellement de : construire des sous-corpus à partir de différentes métadonnées (propriétés) des textes (eg. : date de publication, auteur, type de texte, thème) ; construire des partitions à partir de ces propriétés permettant d’appliquer des calculs de contraste entre les textes ou entre groupes de textes ; produire des concordances kwic à partir de recherches de motifs lexicaux complexes – construits à partir des propriétés des mots (eg. : « un mot de lemme ’aimer’ suivi à au plus de 2 mots d’un mot commençant par ’pouv’) ; calculer le vocabulaire d’ensemble d’un corpus ou la liste des valeurs attestées d’une propriété de mot donnée ; construire une édition HTML de base pour chaque texte du corpus et des tableaux de contingence croisant les mots, les textes et leurs structures, etc.

Contenus : initiation aux outils d’analyse et initiation à la préparation de corpus et prise en main de TXM

Publics : doctorants, enseignants-chercheurs et chercheurs analysant des corpus de textes.

Pré-requis : analyser des corpus de textes ; avoir une utilisation courant de la bureautique. La formation est également adaptée aux « faux débutants » TXM.

Intervenant : ingénieur de recherche en informatique linguistique à l’ENS de Lyon, Serge Heiden <http://textometrie.ens-lyon.fr/spip.php?article9> est responsable du projet « Textométrie » et exerce au sein de l’unité mixte de recherche ICAR.

OmegaT (T.Grass, Université de Strasbourg)

Mercredi 2 septembre 2015, 9h-12h30

Lieu : Salle Patio, 4SS12

Le logiciel libre de traduction assistée par ordinateur OmegaT permet de s'initier aux techniques de traduction professionnelle sur projets à l'aide de mémoires de traduction. Plus simple, moins contraignant bien que n'offrant pas non plus les mêmes fonctions que des logiciels commerciaux, c'est un outil idéal pour la sensibilisation des étudiants au flux de travail de la traduction professionnelle. Cet atelier d'une durée de 2h30 a pour but d'initier les participants au fonctionnement du logiciel ainsi qu'à la gestion de projets et la conception de glossaires de traduction.

Traitement de corpus textuels avec la plateforme R (N.Turenne, INRA)

Mercredi, le 2 septembre 2015, 9h-12h30 et 14h-17h30

Patio, salle 3210

  • Prise en main des formats de corpus pour un chargement dans R.

  • Utilisation de corpus intra-R et téléchargement de données twitter.

  • Segmentation et découpage d'un corpus (en phrases, monotermes et multitermes).

  • Classification automatique (clustering) de termes.

  • Extraction d'entités nommées.

  • Analyse des topics.

  • Visualisation d'un réseau sémantique.

 

Professionnalisation des formations en langue (N.Hillenweck, Université de Strasbourg)

Mercredi 2 septembre 2015, 14h-17h30

Lieu : Salle Patio, 4SS12

La formation proposée vise à éclairer la notion et les modalités possibles de la professionnalisation des formations universitaires en lettres, langues et sciences humaines, parfois réputées pour être éloignées du monde professionnel. En s'appuyant sur des exemples, on s'intéressera notamment aux questions suivantes : Comment favoriser l'employabilité des étudiants ? Comment aider les étudiants à valoriser leurs connaissances et compétences pour se préparer à leur insertion professionnelle ? Comment améliorer les liens avec le monde professionnel ? Comment adapter les formations ? Quels apports professionnalisants spécifiques peut-on fournir pour les formations en lettres et langues ? La formation s'adressera à des doctorants ou jeunes chercheurs qui possèdent ou visent à acquérir une expérience d'enseignement dans l'enseignement supérieur.

Personnes connectées : 1