Méthodes à Noyau en Bio-Informatique

Jean-Philippe Vert, Ecole des Mines de Paris

DEA Mathématiques, Vision et Apprentissage (ENS Cachan), 2e semestre, 2003/2004

DEA Probabilités et Applications (Paris 6), 2e semestre, 2003/2004

Programme

Slides

  1. Resume du cours (pdf, ps.gz)
  2. Introduction a la biologie moleculaire et a la bio-informatique (pdf, ps.gz)
  3. Noyaux definis positifs (pdf, ps.gz)
  4. Methodes a noyaux (pdf, ps.gz)
  5. Noyaux pour séquences (pdf, ps.gz)

Description

Les méthodes à noyaux recouvrent un ensemble d'algorithmes pour l'analyse statistique de données, caractérisées par l'utilisation d'une fonction (appelée "noyau") permettant de mesurer la similarité entre les objets à analyser. En imaginant des fonctions noyaux pour des objets non vectoriels, tels des séquences, des graphes, des permutations ou des points sur des variétés différentielles, il est possibles d'appliquer à ces objets des méthodes puissantes d'analyse statistiques habituellement réservées à des données vectorielles, telles l'analyse en composantes principales, l'analyse de corrélations canoniques, ou les Support Vector Machines pour la classification et la régression.

La bio-informatique vise à analyser des masses de données biologiques pour en extraire de l'information pertinente. Ces données sont typiquements des séquences (d'ADN, d'acides aminés, etc...), des graphes, des structures tridimensionnelles de molécules, ou des arbres phylogénétiques. A partir de problèmes réels, nous montrerons comment des noyaux peuvent être construits pour ces différents types d'objets, nous étudierons différentes méthodes à noyaux et leur lien avec la théorie de la régularisation, et nous approfondirons l'étude de l'espace des fonctions noyaux lui-même. Les exemples réels qui motiveront ce cours seront notamment:

Il est fortement conseillé de suivre le cours de A. Trouvé sur la théorie de l'apprentissage au premier trimestre en préparation de ce cours. Les élèves intéressés par les applications en bio-informatique peuvent également suivre le cours de B. Chalmond, "Traîtement de l'information en biotechnologie" qui présentera des outils complémentaires.

Projet obligatoire (DEA MVA)

Résultats examen (DEA MVA)

Résultats examen (DEA Paris 6)

Références:

Quelques livres: Des articles de référence: Des articles de recherche:
Last modified: Wed May 26 16:22:25 CEST 2004
Back to my homepage