Bonsoir à tous, Vous trouverez joint à ce message votre compte rendu de TP corrigé, en tout cas pour ce qui concerne ma partie. J'ai ajouté des infobulles d'annotations rouges pour les erreurs qui me semblent graves, jaunes pour des pistes d'améliorations, vertes pour les compliments (j'en suis particulièrement avare, ne vous en faîtes pas si vous n'en trouvez pas dans votre copie). Je me suis rendu compte en faisant la correction que la question 6.3 était difficile dans la mesure où l'événement décrit n'est pas aussi récurrent que dans mes souvenirs dans le cancer du sein, je considérerais donc cette question comme un bonus. La 7.3 était également assez difficile compte tenu du peu de temps que nous avons pu consacrer ensemble à ces exercices, j'en ai tenu compte dans la notation. Je vous ai tout de même rappelé à plusieurs reprises que vous pouviez me contacter si vous aviez des questions, j'aurais préféré que certains d'entre vous le fassent plutôt que de partir en hors-sujet. Globalement j'ai un peu l'impression que cet exercice a été réalisé à la va-vite pour pas mal d'entre vous, j'en suis un peu déçu. Nous avions fait le choix avec Pascaline de vous laisser terminer cet exercice à la maison justement pour éviter cela. Je vais donc encore une fois insister sur ce point (pour l'examen qui vous attend notamment ...) : soignez votre rédaction ! Dans un exercice comme celui ci on sait que vous connaissez la réponse, ce que l'on attend de vous c'est de nous montrer que vous comprenez la question et quel raisonnement tenir pour arriver à cette réponse, lancer des chiffres ou une capture d'écran sans explication n'apporte rien. Et si l'on peut vous pardonner (en devoir sur table notamment) de ne pas avoir un français digne du Goncourt, faîtes au moins l'effort de vous relire une fois pour vous assurer que vos phrases ont un sens et chasser les fautes d'orthographe les plus évidentes. Pour finir soignez la mise en page de vos documents électroniques, en 2014 de la part d'étudiants avec une certaine affinité pour l'informatique je pense être en droit d'espérer un minimum de couleurs et de mise en valeur des titres et images (certains ont fait cet effort). Ce sont des petites choses qui jouent beaucoup sur l'état d'esprit (et la générosité) du correcteur, vous auriez tors de les négliger. Je me garde les notes sous le coude, pour en discuter à la rentrée avec Pascaline et Hélène Dauchel. Pas d'inquiétude à avoir à ce sujet, compte tenu de la difficulté du sujet je ne pense pas qu'il y aura de notes en dessous de la moyenne (5/10 pour ma moitié donc). Que cela ne vous empêche pas de réviser avec assiduité pour l'examen, je ne serais pas aussi conciliant que pour cet exercice. De manière générale : - Citez vos sources Lorsque vous prenez des captures d'écran, que vous expliquez le contenu d'une base ou que vous citez une donnée, il est capital que l'on puisse remonter à la page où vous avez trouvé cette information. Idéalement vous devriez donner l'URL exacte (attention à bien donner une URL persistante cependant, de nombreux outils en ligne utilisent des sessions qui disparaissent au bout de quelques heures) et signaler la date à laquelle vous avez accédé à cette page, mais au minimum donnez une description succincte (« page About du site officiel de COSMIC »). - Légendez et appelez vos figures Que ce soient des tableaux, captures d'écran ou schémas, numérotez vos figures et donnez leur un titre (et une description rapide si nécessaire). Ajouter dans votre texte un appel « Voir Figure X » au moment opportun, cela facilite grandement la lecture. Et si vous ne trouvez pas où insérer un tel appel, c'est peut être que votre figure n'est pas aussi indispensable que vous ne le pensiez ... Pour reprendre les différentes questions de ce TP : 5.1. Pour décrire COSMIC, j'attendais de lire au moins la signification du sigle (Catalogue of Somatic Mutations in Cancers), et qu'il s'agit d'une base de données de variants somatiques, c'est à dire décrits dans des tumeurs de différents types. Vous pouviez piocher sur la page d'accueil du site quelques chiffres pour illustrer la taille de cette banque, souligner que la quasi totalité des gènes humains sont décrits comme mutés au moins une fois dans cette base de données et surtout préciser la version de la base de données que vous décrivez (71 sur le site de COSMIC, 68 sur l'UCSC). Il aurait été souhaitable de remarquer qu'on y trouve un grand nombre d'événements différents : mutations, ponctuelles, délétions, fusions de gènes ... Certains ont décrit les différentes sources de ces données (qu'on retrouve sur le site de COSMIC ou dans la description de la piste COSMIC sur l'UCSC), c'est plus que j'en attendais mais c'est très bien. Quand à l'intérêt qu'on peut avoir à utiliser une telle banque, c'est de pouvoir vérifier si d'autres équipes ont déjà identifié des anomalies similaires dans la pathologie qui nous occupe ou des pathologies proches, ce qui tendrait à confirmer qu'il s'agit bien d'événement somatiques et non de polymorphismes. 5.2. Concernant le choix des variants dans le premier exercice, nous avions convenu ensemble de partir sur CDKN2A (j'ai fais la remarque à certains d'entre vous, par convention les noms des gènes s'écrivent en italique dans les documents électroniques). J'attendais que vous choisissiez COSM12526 ou COSM13587, qui correspondent à des délétions du gène entier, en m'expliquant que c'est assez similaire à ce qu'on observe chez nos patients (même si la délétion est bien plus large chez nos patients, COSMIC travaille par gène). La première des deux est à privilégier car elle recense un bien plus grand nombre de patients. A noter que la seconde a essentiellement été recensée dans des lignées cellulaires, qui sont des génomes un peu particuliers pas forcément représentatifs de ce qu'on trouve chez des patients. Quel que soit votre choix partir sur l'une des (très) nombreuses mutations ponctuelles n'était pas vraiment pertinent compte tenu du contexte de l'exercice (recherche d'anomalies du nombre de copies en CGH), jouer un peu avec le zoom vous aurait permis assez facilement de séparer SNV et CNV. Pour ce qui était des fréquences, cliquer sur un variant dans la représentation de l'UCSC vous permettait d'avoir la fréquence globale dans un tissu. 6.1. Concernant les mutations fréquentes de CDKN2A, j'aurais aimé voir une capture d'écran de l'onglet « Mutations » trié par « Count » décroissant (que j'ai croisé dans plusieurs compte rendus tout de même). Vous pouviez y remarquer que les événements les plus fréquents sont des délétions assez larges au sein de ce gène, et ne pas vous laisser induire en erreur par les « ? » et « unknown » simplement dus au fait que les délétions décrites couvrent à la fois des introns et des exons, et sont donc délicates à traduire en coordonnées protéiques. En bonus vous auriez pu remarquer que les premiers SNV en terme de fréquence sont des mutations non-sens (apparition d'un stop) en début de gène, ce qui colle assez bien avec l'idée que le gène est globalement désactivé dans les cancers (par délétion au niveau de l'ADN génomique ou par troncation lors de la traduction). 6.2. Pour la fréquence, tout dépendait du variant que vous aviez choisi. A noter que COSMIC n'indique que le nombre d'échantillons tumoraux présentant la mutation, pas l'écrasante majorité d'échantillons tumoraux qui ne la présentent pas. J'attendais de vous que vous vous cantonniez au nombre de cas répertoriés dans le tissu qui nous intéressait, ou que vous reveniez à l'UCSC pour avoir une fréquence de mutation pertinente (l'UCSC décrit le nombre total d'échantillons considérés). Diviser le nombre d'échantillons mammaires par le nombre total d'échantillons recensés par COSMIC n'est pas une faute en soit, mais ne répond pas à la question qui était « combien d'échantillons mammaires présentent cette mutation ». A souligner également que le site internet de COSMIC et l'UCSC ne travaillent pas avec les mêmes versions de COSMIC, d'où certaines disparités. 6.3. Comme expliqué plus haut, c'était difficile de conclure correctement avec ces données. Le fait que vous trouviez dans COSMIC un variant semblable à ce que vous observez dans vos données avec une certaine récurrence devrait vous faire penser qu'il y a de bonnes chances qu'il s'agisse effectivement d'un variant somatique. En partant sur COSM12526 vous étiez à 0,44 % de récurrence, il faut bien avouer que c'était perturbant (j'ai fais comme certains d'entre vous l'erreur de lire 44 % en écrivant ce sujet ...). 7.1. Pour ce qui est de la Database of Genomic Variants, j'attendais que vous mettiez en évidence la différence avec COSMIC : il s'agit maintenant d'événements retrouvés chez des individus sains, et non plus des génomes tumoraux. Quelques chiffres à extraire sur la page d'accueil encore une fois, en soulignant qu'en plus des CNV on y trouve des inversions. Pas de numéro de version pour la DGV, dans ce cas là donnez au minimum la date à laquelle vous avez collecté ces statistiques. Si vous êtes capables de retrouver la date de la dernière mise à jour c'est encore mieux. Comme pour COSMIC vous pouviez décrire rapidement les sources de cette base : dbVar (NCBI) et DGVa (EBI). 7.2. J'attendais de vous lire m'expliquer que vous observez de nombreux polymorphismes dans cette région, et vous voir partir sur l'un des plus récurrents (entre 5,43 et 5,49 Mb) ou sur l'un des plus ressemblant à ce qu'on observe dans nos données (ns896934). La ressemblance n'est évidemment pas parfaite, mais gardez bien à l'esprit que deux puces CGH ou SNP de designs différents vous donneront des positions différentes pour les points de cassure, selon la position des sondes dans cette région. Avec un œil particulièrement averti (ça n'était pas attendu) vous auriez pu remarquer que la résolution est très basse (régions de 50 kb, soit 3 sondes consécutives environ sur une puce de 180 000 sondes), et les coordonnées très similaires entre nos patients, ce qui suggère qu'on est à la limite de détectabilité de la techniques (3 sondes vraisemblablement) et qu'il n'est pas raisonnable d'attendre une grande précision. On vous demandait en revanche de citer une publication, pour pas mal d'entre vous les informations relevées n'étaient pas suffisantes : la tradition veut qu'on cite au minimum le nom du premier auteur, le nom du journal et l'année. Si vous souhaitez ajouter le titre et les numéros de volume / de pages c'est encore mieux. Pour ce qui est des identifiants PubMed attention, il s'agit d'un des nombreux moteurs d'indexation (limité à la biologie et la médecine), tous les articles scientifiques n'y figurent pas, loin de là, ce n'est donc pas une référence absolue. Une bonne façon de vérifier que vous en donnez assez et de faire une recherche sur PubMed ou Google Scholar avec les données que vous avez reportées, si plusieurs articles ressortent c'est que vous n'avez pas été assez précis. 7.3. Une fois constaté que la DGV (qui ne contient que des événements retrouvés chez des individus sains) contient des délétions similaires à ce qu'on observe chez nos patients, il était simple de conclure qu'il s'agit probablement de polymorphismes, n'ayant pas de rôle particulier dans le fonctionnement de ces tumeurs. Il ne me reste plus qu'à vous souhaiter de bonnes révisions, et bonne chance pour les examens qui vous attendent en janvier. Encore une fois si vous avez des questions sur le TP ou un point du cours, n'hésitez pas à m'écrire. Joyeuses fêtes, Sylvain Mareschal