Avancées en bio-informatique: naviguez dans l'ère des big data génomiques et métagénomiques
Clientèle cible
Spécialistes en agronomie et en biotechnologie, incluant les chercheurs en génomique végétale, les spécialistes en amélioration des cultures et en protection des plantes, désireux d'utiliser les données génomiques pour optimiser les rendements, la résistance aux maladies et la qualité des produits.
Scientifiques en écologie et en biologie de la conservation : incluant les gestionnaires de la biodiversité
Professionnels de l'industrie biotechnologique
Scientifiques de données et analystes en bio-informatique désirant maîtriser les dernières techniques d'analyses génomiques et métagénomiques pour extraire des connaissances pertinentes et soutenir la prise de décision basée sur des données.
Préalables
Obligatoires
- Formation académique ou expérience professionnelle : Un diplôme de premier cycle en sciences de la vie, agriculture, biotechnologie, ou domaine connexe, ou une expérience professionnelle équivalente dans ces domaines
- Compétences informatiques de base : Une familiarité avec l'utilisation d'ordinateurs, y compris la gestion de fichiers et l'utilisation d'Internet
- Connaissance de l'anglais technique : La capacité de lire et comprendre l'anglais technique est cruciale, car de nombreux logiciels, publications de recherche, et ressources sont uniquement disponibles dans cette langue
Recommandés
- Familiarité avec l'environnement linux : bien que l'introduction à Linux soit prévue dans la formation, une expérience préalable avec cet environnement de travail ou la ligne de commande est un atout significatif
- Notions de statistiques : une compréhension basique des principes statistiques est recommandée pour interpréter les résultats des analyses bio-informatiques efficacement
- Connaissance en biologie moléculaire : Une familiarité avec les concepts de base en génomique, tels que la structure de l'ADN, la transcription, la traduction, et les polymorphismes, enrichira l'expérience d'apprentissage
Description
Dans le monde contemporain, où la science et la technologie évoluent à un rythme sans précédent, la bio-informatique se présente comme un domaine clé pour décrypter la complexité du vivant.
Face à la multiplication des données génomiques accessibles et à la nécessité de les analyser de manière pertinente pour en extraire des informations valables, cette formation vise à outiller les participants des compétences méthodologiques et pratiques indispensables.
Que ce soit pour l'introduction à l'environnement Linux, l'analyse NGS, l'étude des polymorphismes ou l'exploitation des données du microbiome, chaque module est conçu pour répondre aux défis actuels et futurs de la recherche et de l'industrie.
Objectif général
Au terme de cette formation, le participant sera en mesure d'exploiter et analyser les données génomiques et métagénomiques, en utilisant des techniques avancées de bio-informatique pour adresser des questions de recherche et des applications professionnelles spécifiques.
Objectifs
Maîtriser l'environnement Linux et l'analyse NGS : acquérir une compétence pratique dans l'utilisation de Linux et des outils d'analyse NGS, en se concentrant sur l'automatisation et l'optimisation des flux de travail
Approfondir l'analyse des données SNP : comprendre et appliquer les méthodes d'analyse des SNP pour des applications en recherche génomique, tout en respectant les standards de qualité
Interpréter les données du Microbiome : analyser les données de séquençage du microbiome pour des applications en écologie ou en industrie, en utilisant des études de cas réelles
Utiliser l'apprentissage automatique (AA) : appliquer des modèles d'apprentissage automatique aux données génomiques pour résoudre des problèmes spécifiques, avec une attention particulière à la sélection et l'optimisation des modèles
Contenu
Module 1 (4 heures)
- Introduction à l'environnement Linux, à la ligne de commande, et à l'analyse NGS
Module 2 (3,5 heures)
- Analyse bio-informatique des données SNP
Module 3 (3,5 heures)
- Atelier pratique de mi-parcours
- Exercices dirigés et synthèse mi-parcours
Module 4 (3,5 heures)
- Analyse des données du microbiome, y compris les données de séquençage à haut débit de l'ARNr 16S et ITS1
Module 5 (3,5 heures)
- Utilisation de modèles d'apprentissage automatique pour les analyses de données génomiques et métagénomiques
Module 6 (2 x 3,5 heures)
- Atelier synthèse- Travaux en groupe sur les cas pratiques proposés par les participants
Stratégies pédagogiques
Au cours de cette formation, le participant devra consacrer entre 3 et 5 heures de travail à la maison en formule asynchrone pour compléter les exercices amorcés lors des séances en direct.
- Présentation interactive
- Atelier d’exercices dirigés à partir de cas fictifs et de cas réels des participants
- Discussions de groupe
- Quiz
Ce qui est attendu des participants
- Préparation technique: Les participants devront avoir un ordinateur personnel équipé des logiciels nécessaires à la pratique des exercices. La liste inclut, mais n'est pas limitée à : MobaXterm, Bitvise, IGV (Integrative Genomics Viewer), Notepad++, Tassel, Haploview, R, et RStudio. Des instructions détaillées pour l'installation de ces logiciels seront fournies avant le début de la formation.
- Projet personnel: Pour les séances de la semaine 6, les participants seront invités à travailler sur un cas concret, seul ou en groupe, en appliquant les techniques et outils étudiés pour analyser un jeu de données réel. Ce projet est l'occasion de consolider les apprentissages et de produire un travail qui reflète les compétences acquises durant la formation.
Reconnaissance
Une attestation de participation reconnaissant les 30 heures de formation continue est décernée, après la formation, à chacun des participants qui respectent les conditions d'attestation.