Méthodes à Noyau en Bio-Informatique: Le projet

Jean-Philippe Vert, Ecole des Mines de Paris

DEA Mathématiques, Vision et Apprentissage (ENS Cachan), 2e semestre, 2003/2004

Présentation

Le but est de détecter des signaux dans les séquences de protéines. Le prix nobel 1999 de médecine a été attribué à Günter Blobel pour la découverte de ces signaux (voir explication ici.

Ce projet sera réalisé par équipes de 2-4 étudiants. Vous avez totale liberté en terme de méthodes, de language de programmation. Vous pouvez même tenter de répondre à d'autres questions que celles qui sont posées. Au final, vous devez aboutir à un rapport d'une dizaine de page qui explique la méthode utilisée, son implémentation, et l'évaluation de sa performance.

Vous serez jugés sur l'originalité de l'approche, sa pertinence, sa mise en oeuvre.

Données

Le format est expliqué ici.

Questions

Construire des algorithmes pour:
  1. Faire de la classification binaire de séquences pour discriminer:
    1. Signal.txt vs NoSignal.txt
    2. Signal.txt vs FalseSignal.txt
    3. Signal.txt vs (NoSignal.txt + FalseSignal.txt)
  2. Faire une méthode pour détecter automatiquement le site de clivage des séquences de Signal.txt
  3. (optionnel) Combiner l'ensemble pour aboutir à un programme qui prend une séquence en entrée, prédit si il y a un signal, et si oui prédit le site de clivage.
Pour évaluer la performance des méthodes, on utilisera typiquement de la validation croisée.

Liens utiles

Références

Equipes


Last modified: Fri Mar 12 19:37:02 CET 2004
Retour à la page du cours