LI063(6) : Bases formelles du TAL

2e semestre
Mardi, 14h00-16h00, salle 417 B, Halle aux farines
Premier cours 22 janvier 2007, dernier cours le 15 avril 13 mai 2008.
Pas de séance le(s) 26 février, 04 mars, 11 mars, 01 avril, 08 avril.
Deux séances supplémentaires les vendredis 21 et 28 mars 2008 de 10h30 à 12h30 en salle 417B dans le bâtiment de la halle aux farines
Séances supplémentaires le 15 avril (dernier cours), le 6 mai, et le 13 14 mai (soutenances)

Premiers éléments mathématiques et informatiques nécessaires pour les approches formelles du TAL, avec une insistance particulière sur le théorie des langages formels. Automates, Grammaires, Expressions Régulières.
On s'intéressera aussi aux propriétés formelles des réseaux sémantiques.


 

Organisation du cours (à titre indicatif)

22/01/08 CM Ch1. Bases mathématiques de la théorie des langages formels
  • Rappels de théorie des ensembles (poly)
  • Le monoïde (libre) (X, . )
  • Langages formels et expressions rationnelles
29/01/08 TD Théorie des langages formels(poly, exos)
05/02/08 CM Ch2. Automates à états finis
  • Automates déterministes
  • Automates non déterministes
12/02/08 TD Automates (exos)
19/02/08 CM Ch2. Automates à états finis
Ch3. Grammaires formelles
26/02/08 / pas de séance
04/03/08 / pas de séance
11/03/08 / pas de séance
18/03/08 CM Ch3. Grammaires formelles
21/03/08 (Ve) TD Grammaires (exos)
25/03/08 CM Ch4. Théorème de Kleene
28/03/08 (Ve) TD Kleene (exos)
01/04/08 / pas de séance
08/04/08 / pas de séance
15/04/08 CM Ch5. Réseaux sémantiques
06/05/08 TD Révisions (exos, corrigés 2 dernières séries)
1314/05/08 - Soutenances mini-projets
 

Contrôles

Modalités
  • Contrôle continu : un mini-projet (40%) et une épreuve écrite (session d'examen de mai, 60%).
  • Contrôle final : une épreuve écrite pendant la session d'examen de mai (100%). 
  • Session de rattrapage (juin) : pour tous : une épreuve écrite pendant la session d'examen (100%). 
  • Aucune note n'est conservée entre les deux sessions d'examen
Calendrier
  • Mini-projet : implémentation des algorithmes de manipulation d'automates, et application à la description de données linguistique, et à leur repérage dans des textes.
    • Énoncé (Dates modifiées).
    • Organisation :
      • Le travail peut être fait en groupe (1, 2 ou 3)
      • à rendre : (1) Code Java bien commenté ; (2) Description des choix linguistiques (2-3 pages).
      • Date du retour des documents : Mardi 6 mai 2008
      • Soutenance : mardi 13 mai 2008 mercredi 14 mai 2008, 14h00, salle 155 (CdR)
        10 minutes par groupe, exposant les choix et problèmes techniques, et les choix linguistiques. Rétro- ou vidéo-projecteur disponible.
    • Liens vers un corpus de test, et son jeu d'étiquettes. Autres ressources moins pertinentes sur cette page.
    • Notes
  • Examen final : Mardi 20 mai 2008
    14h-16h, salle 417B, halle aux farines
  • Deuxième session : Jeudi 26 juin 2008, 11h30-13h30, salle 131 (Ch. des Rentiers)

Annales : voir ma page d'archives
Voir en particulier les énoncé et corrigé de l'examen de 2005-06.
Attention Le corrigé comprend une erreur, exercice 2, (b): l'état (2,3) devrait être suprimé, et la transition qui y mène doit être corrigée :
δ{(1,3), c} = (2,3)(2,2).

 
 

    Bibliographie

    • à suivre
    • La bibliographie que je donne pour le cours de Langages Formels est un bon point d'entrée.

Ma maison-page June 29 2008