banner

Blog

Dec 14, 2023

Émergence d'une nouvelle régulation et expression de gènes de céphalopodes à travers

Nature Communications volume 13, Numéro d'article : 2172 (2022) Citer cet article

8354 Accès

9 Citations

284 Altmétrique

Détails des métriques

Les céphalopodes coléoïdes (calmars, seiches, poulpes) ont le plus grand système nerveux parmi les invertébrés qui, avec de nombreux traits morphologiques spécifiques à la lignée, permet des comportements complexes. La base génomique sous-jacente à ces innovations reste inconnue. En utilisant la génomique comparative et fonctionnelle chez le calmar modèle Euprymna scolopes, nous révélons l'organisation génomique, topologique et réglementaire unique des génomes des céphalopodes. Nous montrons que les génomes des céphalopodes coléoïdes ont été largement restructurés par rapport à d'autres animaux, conduisant à l'émergence de centaines de groupes de gènes uniques étroitement liés et évolutifs (microsynténies). Ces nouvelles microsynténies correspondent à des compartiments topologiques avec une structure régulatrice distincte et contribuent à des modèles d'expression complexes. En particulier, nous identifions un ensemble de microsynténies associées aux innovations céphalopodes (MACI) largement enrichies dans l'expression du système nerveux des céphalopodes. Nous postulons que l'émergence des MACI a joué un rôle déterminant dans l'évolution du système nerveux des céphalopodes et proposons que le profilage microsynténique sera au cœur de la compréhension des innovations des céphalopodes.

Les céphalopodes ont les plus grands systèmes nerveux des invertébrés et possèdent de nombreuses adaptations spécifiques à la lignée telles que le camouflage adaptatif rapide, les bras avec ventouses et les yeux de type caméra. De nombreuses caractéristiques des céphalopodes ont évolué de manière convergente vers celles des vertébrés, ce qui en fait un système attrayant pour étudier la base génétique des innovations d'organismes à grande échelle et les voies de leur évolution.

Au niveau génomique, l'émergence de nouveaux gènes, de nombreuses duplications de gènes et une vaste édition de l'ARN ont été décrites dans les génomes des céphalopodes1. Les expansions de familles de gènes telles que les C2H2, les protocadhérines et les GPCR, ainsi que l'édition extensive de l'ARN ont permis la diversification des transcrits codant pour les protéines dans le système nerveux et auraient joué un rôle important dans son évolution. Bien que des innovations similaires soient connues à partir des génomes de vertébrés, les mécanismes à l'origine de l'évolution de ces caractéristiques sont différents : les vertébrés ont traversé plusieurs séries de duplications du génome entier qui ont produit de grands ensembles de gènes à copies multiples et la diversification de leurs fonctions, rien n'indique pour des événements similaires chez les céphalopodes1,2,3. En revanche, il a été suggéré que la lignée des céphalopodes coléoïdes (calmars, seiches, poulpes) a subi une réorganisation du génome à grande échelle2,3.

Une propriété des génomes métazoaires est que l'ordre local des gènes ou la microsynténie est conservé entre des espèces même éloignées4,5,6. Cette conservation est étayée par des études fonctionnelles des contraintes régulatrices, mises en évidence dans les blocs régulateurs génomiques (GRB)4,5,7, ainsi que la co-expression de gènes voisins dans des tissus ou des types cellulaires8. Les premiers assemblages de génomes dans plusieurs coléoïdes indiquent que l'ordre local des gènes a été fortement perturbé, brisant d'anciennes microsynténies et réunissant des gènes auparavant non liés2,3. Cet événement, potentiellement à l'échelle du génome entier, aurait pu affecter des centaines de familles de gènes, perturbant l'ordre des gènes par rapport au dernier ancêtre commun des céphalopodes coléoïdes et d'autres mollusques. L'étendue de cet événement est difficile à estimer en raison du manque d'assemblages à l'échelle chromosomique chez les céphalopodes. Pour commencer à comprendre l'étendue de la réorganisation du génome et son impact sur la biologie et l'évolution du génome des céphalopodes, nous étudions l'espèce modèle émergente Euprymna scolopes (calmar bobtail hawaïen). Cette espèce est au centre de la recherche sur la symbiose depuis plus de 30 ans9,10, mais constitue également un système modèle attrayant pour la recherche sur l'évolution et le développement en raison de sa petite taille adulte, de ses grandes couvées d'œufs et de sa relative facilité de culture.

Pour reconstruire le paysage réglementaire dans le génome d'E. scolopes, nous avons appliqué des techniques de capture de conformation chromosomique (Hi-C) et de profilage de la chromatine ouverte (ATAC-seq), ainsi que des données d'expression supplémentaires. Hi-C nous a permis à la fois d'améliorer l'assemblage du génome d'E. scolopes précédemment publié et de capturer l'organisation tridimensionnelle du génome. À l'aide d'approches génomiques comparatives, nous décrivons la nature globale du remaniement du génome chez les céphalopodes coléoïdes et démontrons l'émergence de nombreuses régions microsynténiques qui n'étaient auparavant pas liées chez d'autres espèces. Nos données révèlent également des interactions entre des loci génomiques distants (l'organisation topologique du génome) éclairant l'organisation tridimensionnelle du génome d'E. scolopes, ainsi que l'identification de gènes situés dans des boucles de régulation et des domaines d'association topologique (TAD). Nos données ouvertes sur la chromatine révèlent des régions accessibles aux facteurs de transcription et constituant ainsi potentiellement des éléments de régulation. Ensemble, ces données nous permettent de mieux comprendre l'impact des changements évolutifs dans les liaisons génétiques et l'émergence d'une nouvelle régulation des gènes. Cette étude fournit la base pour la compréhension de l'évolution des génomes des céphalopodes et des implications possibles sur les nouveautés morphologiques dans ce clade.

Les informations de liaison issues de la capture de la conformation chromosomique nous ont permis de reconstruire 46 échafaudages chromosomiques chez E. scolopes ("Méthodes", Notes supplémentaires 1 et 2, Fig. 1a, b supplémentaires) sur la base de l'assemblage publié3. Nous avons ensuite comparé l'ordre des gènes avec des orthologues trouvés dans 24 autres espèces animales allant des éponges aux vertébrés, ce qui nous a permis de reconstruire des blocs microsynténiques partagés entre différents clades ("Méthodes", Note complémentaire 3, Fig. 2a complémentaire, Données complémentaires 1) . En bref, nous définissons les blocs microsynténiques comme au moins trois gènes orthologues cooccurrents ou plus avec jusqu'à cinq gènes intermédiaires sans contraintes sur leur colinéarité. Cette définition de la microsynténie donne le moins de blocs faussement positifs (par rapport à seulement des paires de gènes) tout en offrant suffisamment de flexibilité pour détecter les régions synténiques qui ont subi un réarrangement et une expansion locaux. Nous récupérons 505 microsynténies uniques aux céphalopodes, représentant des blocs de gènes trouvés uniquement à proximité les uns des autres chez E. scolopes et au moins une espèce de poulpe. Pour le même échantillonnage d'espèces et les mêmes paramètres de détection de microsynténie, seuls 2 blocs auraient été attendus par hasard (médiane de 3 cycles de randomisation, comme décrit dans 6). Cinq de ces 505 blocs étaient paralogues. Au total, seuls 48 des 2290 gènes de ces 505 blocs ont été identifiés comme des gènes orphelins sans homologie en dehors des céphalopodes, tandis que tous les autres ont des orthologues chez d'autres animaux, ce qui suggère que l'origine de la microsynténie était due à des changements dans les emplacements des gènes plutôt qu'à de nouveaux émergence de gènes. Ces microsynténies ont été conservées chez les céphalopodes coléoïdes malgré leur long temps de divergence (Fig. 1b, c), suggérant une contrainte évolutive qui maintenait ces blocs de gènes ensemble. De même, une comparaison avec d'autres mollusques, comme le pétoncle Mizuhopecten yessoensis11 et le bivalve Crassostrea gigas a montré qu'un nombre beaucoup plus petit de microsynténies spécifiques aux bivalves (152) est partagé entre ces espèces. Pour déduire l'ensemble de blocs microsynténiques hautement conservés, nous avons reconstruit des microsynténies partagées entre E. scolopes et au moins six espèces plus éloignées sur un ensemble de 23 espèces (Fig. 2 supplémentaire). Nous avons récupéré 275 microsynténies métazoaires de ce type, qui sont conservées dans la lignée E. scolopes et dont on suppose qu'elles remontent au moins au dernier ancêtre bilatéral commun (Fig. 1c, Fig. 2a supplémentaire, "Méthodes"). En comparaison, le bivalve M. yessoensis conserve un nombre similaire de microsynténies de métazoaires (216). Ces résultats fournissent la preuve d'un gain microsynténique à grande échelle chez les céphalopodes coléoïdes.

a Photographie d'un nouveau-né Euprymna scolopes. b Arbre schématique avec les temps de divergence des principales lignées de céphalopodes des deutérostomes et d'autres protostomes53,54. c Diagramme de Circos montrant la perte de synténies conservées dans d'autres métazoaires et l'émergence d'un grand nombre de nouvelles microsynténies spécifiques aux céphalopodes au sein des céphalopodes. Chaque ligne représente un cluster synténique partagé entre différentes espèces. Les lignes oranges indiquent des grappes synténiques partagées entre au moins sept de ces 24 espèces (grappes ancestrales, métazoaires); les lignes vertes représentent de nouvelles synténies de mollusques, partagées entre cinq mollusques ou plus mais non présentes dans aucune espèce non mollusque. Les lignes bleues représentent des synténies spécifiques aux céphalopodes partagées entre les trois espèces de céphalopodes (bleu foncé) ou deux des trois espèces de céphalopodes (bleu clair) mais non présentes chez les espèces non céphalopodes ; les lignes grises représentent d'autres synténies qui n'appartiennent à aucune des catégories précédentes. Abréviations : Aca - Acanthaster planci, Aqu - Amphimedon queenslandica, Bfl - Branchiostoma floridae,Cel - Caenorhabditis elegans, Cgi - Crassostrea gigas, Cmi - Callistoctopus minor, Cte - Capitella teleta, Dme - Drosophila melanogaster, Esc - Euprymna scolopes, Lgi - Lottia gigantea, Mle - Mnemiopsis leidyi, Mye - Mizuhopecten yessoensis, Nve - Nematostella vectensis, Obi - Octopus bimaculoides, Sko - Saccoglossus kowalevskii d Exemple d'un échafaudage complet à l'échelle chromosomique (à droite) d'E. scolopes montrant la distribution de la densité génétique, céphalopode -synténies métazoaires spécifiques (bleu) et conservées (orange). Encart (à gauche) avec les emplacements des gènes dans deux blocs synténiques spécifiques.

Des blocs microsynténiques métazoaires spécifiques aux céphalopodes et conservés sont présents sur 44 des 46 échafaudages chromosomiques (deux chromosomes étant trop petits pour contenir des microsynténies). Alors que certains chromosomes ont une proportion plus élevée de nouvelles microsynténies de céphalopodes (Fig. 1b, c supplémentaires), les deux types de microsynténie sont mélangés dans le génome (Fig. 1d). Ce résultat suggère un mécanisme à l'échelle du génome pour l'émergence de nouvelles microsynténies. La grande majorité des gènes à copie unique (71 %) qui composent 232 nouvelles microsynténies de céphalopodes sont situés sur différents chromosomes du pétoncle M. yessoensis. Comme l'organisation du génome de Nautilus récemment publié12 est similaire à celle d'autres mollusques, ces résultats suggèrent que de nombreuses translocations ou fusions au niveau chromosomique se sont produites chez l'ancêtre coléoïde.

Les nouveaux céphalopodes et la microsynténie conservée des métazoaires présentent des propriétés génomiques différentes. Les nouvelles microsynténies de céphalopodes sont en moyenne plus petites que les microsynténies de métazoaires encore présentes dans les génomes des céphalopodes (Fig. 2b supplémentaire), malgré un nombre similaire de gènes (Fig. 2c supplémentaire). Alors que les introns des gènes dans les microsynténies spécifiques aux céphalopodes sont plus petits que ceux des microsynténies métazoaires, la majorité des différences de taille proviennent de régions intergéniques (~ 0, 2 kb contre ~ 7 kb de différence, respectivement).

Nous trouvons également des preuves d'enrichissement différentiel des catégories fonctionnelles entre les deux types de microsynténie. Les microsynténies métazoaires6 sont enrichies en composants de la voie de signalisation de la voie de signalisation Wnt, du transport des neurotransmetteurs et de l'exocytose des vésicules synaptiques, de la signalisation des récepteurs couplés aux protéines G, de la régulation négative de la transcription et des voies de signalisation BMP, entre autres. D'autre part, les gènes de la nouvelle microsynténie spécifique aux céphalopodes jouent un rôle dans la traduction, les processus redox, la régulation de l'entrée du calcium opérée par le stockage, le clivage de l'ARNm, le transport et l'organisation de la chromatine (valeurs p <0, 05) (Fig. 3).

La structure tridimensionnelle de la chromatine, y compris les domaines topologiquement associés (TAD), facilite les interactions régulatrices distantes impliquées dans la régulation des gènes13,14. Bien qu'il existe à ce jour très peu de données sur l'organisation topologique du génome des invertébrés, nous avons constaté que, par rapport aux données connues sur la taille des TAD des vertébrés, les distances d'interaction étaient généralement plus grandes chez le calmar (Fig. 2a, b, note complémentaire 4). Les outils de prédiction de TAD (voir "Méthodes") révèlent une taille médiane de TAD d'E. scolopes de 2,5 Mb, contre une moyenne de 1,2 Mb chez l'homme15. De plus, la distribution des tailles de TAD chez E. scolopes était considérablement plus large que chez l'homme, suggérant une variabilité plus élevée.

a Haut : matrice d'interaction normalisée Hi-C à une résolution de 100 kb pour l'échafaudage chromosomique 10. Bas : nombre relatif de Hi-C et scores de limite TAD tels que prédits par tadbit (1 = le plus bas, 10 = le plus élevé). b Graphique en violon des distributions de taille de TAD pour les scolopes humaines et Euprymna calculées à une résolution de 100 kb, tracées dans des bacs de 100 kb. c Motif de liaison CTCF tel qu'identifié par la recherche de motifs homériques dans 100 kpb des limites TAD prédites. d Exposition de surface de surface de solvant (SASA) par bp pour les échafaudages chromosomiques individuels (observés et aléatoires). Synténie métazoaire conservée en abscisse, microsynténie spécifique aux céphalopodes en ordonnée. e Modèle tridimensionnel de l'échafaudage chromosomique 10 avec des emplacements de microsynténie nouveaux (bleu) et conservés (jaune) étiquetés. Les modèles gauche et droit sont identiques, décalés de 90°.

Chez les vertébrés, la formation de TAD est médiée par des protéines, telles que le CTCF et la cohésine16,17. Nous en déduisons que les mêmes mécanismes, y compris CTCF et les protéines Smc1 et Smc3 du complexe cohésine, sont présents dans le génome d'E. scolopes et conservés chez d'autres animaux, suggérant que des mécanismes similaires pourraient être déployés chez les céphalopodes (Fig. 4 supplémentaire). Nous trouvons également que les limites de TAD sont enrichies pour un motif de type CCCTC 18, 19, 20 rappelant un site de liaison CTCF (Fig. 2c, p = 1e-12, "Méthodes", note complémentaire 4).

Plusieurs études ont suggéré la possibilité d'une correspondance entre la microsynténie et les domaines régulateurs dans les génomes métazoaires4,5,7,8,21,22,23. Pour comprendre la relation entre les microsynténies et les TAD, nous avons comparé la localisation de blocs microsynténiques calculés au hasard, qui suivent les mêmes propriétés que nos blocs observés mais sont distribués de manière aléatoire dans tout le génome aux microsynténies observées ("Méthodes"). Nous constatons une tendance des microsynténies conservées de métazoaires à se localiser vers le centre des TAD prédits, alors que les nouvelles microsynténies de céphalopodes semblent être plus uniformément réparties (Fig. 3a).

a Rapport entre les densités du centre des emplacements de microsynténie observés et randomisés dans les TAD normalisés. Le rapport augmente vers le centre des TAD pour les synténies de métazoaires et diminue pour les synténies de céphalopodes. b Compacité de la microsynténie nouvelle et métazoaire, par rapport aux simulations aléatoires. Les clusters microsynténiques doivent contenir au moins 3 gènes, si moins de gènes ont été annotés dans l'arbre, ces clusters ont été exclus. Les rapports entre le nombre de bacs (à une résolution Hi-C de 40 kb, bacs de microsynténie de céphalopodes n = 143 969, bacs de microsynténie de métazoaires n = 82 417, bacs de microsynténie de céphalopodes aléatoires n = 3 499 849, bacs de microsynténie de métazoaires aléatoires n = 1 889 687) dans microsynten je clusters (entre 7 et 25 bacs, microsynténies valides : céphalopode n = 265, métazoaire n = 125, céphalopode aléatoire n = 4265, métazoaire aléatoire n = 2180) et le nombre de bacs "descendants" du dernier ancêtre commun de ces bacs microsynténiques ("Méthodes", céphalopode n = 143 969, métazoaire n = 82 417, céphalopode aléatoire n = 3 499 849, métazoaire aléatoire n = 1 889 687). Le rapport (n = 6835) du nombre de cases dans un cluster et le nombre de cases dans le sous-arbre ont été comparés par le test bilatéral Wilcoxon rank-sum comparant les groupes liés (****p < 0,0001, * < 0,05, ns : non significatif). Plus le rapport est proche de 1, plus la différence entre la taille du bloc synténique et le nombre de cases dans un arbre extrait est faible. Graphiques en violon—distribution, cases—intervalle interquartile (céphalopode = inférieur 0,06, supérieur 0,56, métazoaire = inférieur 0,01, supérieur 0,58, céphalopode aléatoire = inférieur 0,01, supérieur 0,49, métazoaire aléatoire = inférieur 0,01, supérieur 0,46), barres—médiane (céphalopode = 0,31, métazoaire = 0,28, céphalopode aléatoire = 0,18, métazoaire aléatoire = 0,17), moustaches - échantillon le plus éloigné dans l'intervalle interquartile 1,5x (céphalopode = min 0,002, max 0,94, métazoaire = min 0,002, max 0,95, céphalopode aléatoire = min 0,002, max 0,96, métazoaire aléatoire = min 0,002, max 0,96), ratios maximum et minimum : céphalopode = min 0,00189, max = 0,941, métazoaire = min 0,00217, max = 0,952, céphalopode aléatoire = min 0,00151, max 0,962, métazoaire aléatoire = min 0,00150 , maximum 0,96. c Corrélation de co-expression de gènes dans des grappes microsynténiques (céphalopode n = 476, métazoaire n = 236, céphalopode aléatoire n = 6925, métazoaire aléatoire n = 4038). La corrélation de co-expression des synténies métazoaires est supérieure à celle des synténies spécifiques aux céphalopodes ou des grappes aléatoires (****p < 0,0001, ***p < 0,001, * < 0,05). Diagrammes de violon - distribution, cases - échantillon le plus éloigné dans l'intervalle interquartile de 1,5x (céphalopode = min -0,69, max 0,87, métazoaire = min -0,63, max 1,0, céphalopode aléatoire = min -0,72, max 0,95, métazoaire aléatoire min -0,66, max 0,9), barres - médiane (céphalopode = 0,05, métazoaire = 0,15, céphalopode aléatoire = 0,07670835, métazoaire aléatoire = 0,07) les valeurs aberrantes ont été exclues de ces chiffres. Valeurs maximum et minimum : −1 et 1 dans tous les cas. d Regroupement de l'expression moyenne par groupe de synténie, code couleur par type de synténie, expression parmi les tissus adultes d'Euprymna scolopes. Les clusters synténiques forment huit modules d'expression avec des modèles d'expression spécifiques. La matrice d'expression est normalisée en z-score. Organe léger—E. organe spécifique aux scolopes abritant des symbiotes, glande nidamentale accessoire - organe reproducteur spécifique à la femelle de certaines espèces de calmars. e Annotation de l'emplacement du pic ATAC dans l'organogenèse tardive. Les pics annotés comme associés aux microsynténies spécifiques aux céphalopodes se trouvent plus souvent dans les régions introniques. Promoteur défini comme +10 kb et -10 kb prédit le site de début de transcription.

Pour étudier plus avant les relations des régions génomiques et leurs interactions indépendantes des prédictions TAD, nous avons calculé une structure arborescente reflétant l'organisation de chaque échafaudage chromosomique ("Méthodes", note complémentaire 4). Chaque branche bifurquante reflète les relations des régions génomiques dans la force du signal Hi-C, nous permettant de suivre les intensités d'interaction dans les microsynténies (Fig. 3b). Étonnamment, nous avons constaté que les nouvelles microsynténies sont plus susceptibles de former des régions d'interaction étroite, reflétées par des sous-arbres avec peu de branches, par rapport aux synténies échantillonnées au hasard (Fig. 3b). Ce résultat indique des niveaux significativement plus élevés de compartimentation dans les microsynténies céphalopodes et ancestrales.

Motivée par l'importance de l'architecture tridimensionnelle du génome et de la co-localisation microsynténique dans les scolopes d'Euprymna, une modélisation tridimensionnelle basée sur des matrices d'interaction Hi-C a été réalisée ("Méthodes", Fig. 5 supplémentaire, Note supplémentaire 5) pour fournir une analyse plus approfondie. compréhension des propriétés spatiales et de la co-localisation des régions microsynténiques nouvelles et anciennes dans les échafaudages chromosomiques modélisés. Des modèles tridimensionnels ont révélé que les nouvelles microsynténies de céphalopodes ont des propriétés spatiales distinctes des anciennes microsynténies. En particulier, les deux types de synténie ont montré une accessibilité différentielle aux solvants sur certains chromosomes par rapport aux distributions aléatoires (Fig. 2d). De plus, les nouvelles microsynténies de céphalopodes étaient en moyenne moins enfouies, couvrant ainsi une plus grande proportion de la surface chromosomique (Fig. 6 supplémentaire). Ce résultat contraste avec les microsynténies métazoaires conservées, qui ont tendance à participer à la formation du noyau chromosomique (Fig. 2e, Fig. 6 supplémentaire). Étant donné que les nouvelles microsynténies sont transcriptionnellement actives (Fig. 3, voir ci-dessous), leur emplacement sur la surface chromosomique peut refléter une régulation interchromosomique hautement dynamique, tout en étant plus accessible aux facteurs de transcription.

La teneur en GC de la microsynténie spécifique aux métazoaires et aux céphalopodes a été évaluée ainsi que les prédictions des compartiments A/B basées sur la matrice d'interaction Hi-C ("Méthodes"). L'analyse n'a pas fourni de preuves suffisantes pour que l'un des types mycrosynténiques soit plus répandu dans l'un ou l'autre des compartiments. Jusqu'à ce que d'autres données expérimentales soient disponibles (telles que le profilage de la méthylation et de l'acétylation) pour les scolopes d'Euprymna, nous ne pouvons pas déduire avec précision la distribution de la microsynténie spécifique aux céphalopodes et aux métazoaires dans les compartiments A/B.

Pris ensemble, la forte conservation génomique parmi les céphalopodes séquencés, l'emballage relativement serré (distances intergéniques courtes) des grappes microsynténiques et leur association répandue avec des sous-compartiments définis dans les TAD détectés suggèrent une forte pression sélective pour maintenir les propriétés régulatrices des nouvelles unités microsynténiques dans le céphalopode génomes.

La co-expression de gènes synténiques est une propriété importante qui peut refléter leur régulation. Les gènes des microsynténies spécifiques aux céphalopodes n'ont pas tendance à être co-exprimés, malgré leur co-localisation étroite ("Méthodes", note complémentaire 7). Comparé à des groupes de gènes échantillonnés au hasard qui suivent une distribution similaire aux nouvelles microsynténies observées, le coefficient de co-expression moyen est même légèrement inférieur dans les données observées (test de Wilcoxon, p ≤ 0, 05, figure 3c). En revanche, les microsynténies de métazoaires conservées présentent une co-expression significative (test de Wilcoxon, p ≤ 0, 001) par rapport aux microsynténies simulées (Fig. 3c). Ce résultat indique que les gènes de la microsynténie des métazoaires ont tendance à co-exprimer dans un ensemble défini de tissus, similaire aux découvertes précédentes pour l'ancienne microsynténie des métazoaires8. Un schéma similaire a également été observé pour la co-expression de microsynténies de métazoaires nouvelles et conservées chez O. bimaculoides (Fig. 7a supplémentaire). Aucun type de microsynténie n'a montré d'enrichissement de la spécificité d'expression dans un tissu particulier24.

Pour catégoriser davantage les profils d'expression, nous avons étudié l'expression moyenne des régions synténiques. Cette analyse a montré des schémas complexes répartis en huit modules d'expression distincts dans les tissus adultes d'E. scolopes (Fig. 3d, "Méthodes", note complémentaire 7). Bien que la plupart des modules aient des proportions similaires des deux types de microsynténie, certains groupes ont formé des valeurs aberrantes. Par exemple, le module 8 a montré une expression spécifique à l'œil et était principalement dominé par la microsynténie métazoaire. Fait intéressant, les grappes englobant plusieurs tissus nerveux, en particulier les modules 2 et 4, ont été enrichies en nouvelles microsynténies de céphalopodes (valeurs p exactes du test de Fisher ≤ 0, 02 et ≤ 1e − 07, respectivement). Leurs orthologues étaient exprimés de la même manière dans les tissus nerveux d' O. bimaculoides , avec de nouvelles microsynténies dominant dans les modules associés à l'expression cérébrale la plus forte (Fig. 7b supplémentaire). Cependant, la correspondance globale des modules a été affectée par la différence d'échantillonnage des tissus (Fig. 7c supplémentaire).

Nous avons ensuite voulu étudier si ces modèles d'expression sont biaisés en raison d'un seul gène hautement exprimé par bloc synténique. La grande majorité des blocs microsynténiques (76%, Fig. 8b supplémentaire) ont un gène qui contribue à plus de 50% de l'expression cumulée. Nous avons ensuite calculé les niveaux d'expression relatifs dans les tissus par gène et en avons fait la moyenne pour chaque bloc, montrant que les identités globales des modules d'expression sont conservées (Fig. 8a supplémentaire). En général, la variance d'expression est en corrélation avec l'expression absolue des gènes (Fig. 8c supplémentaire). Cependant, dans certaines synténies de métazoaires, en particulier dans les tissus définissant un module, la variance était faible, indiquant des contraintes de co-expression plus élevées (Fig. 8c supplémentaire).

Ensemble, ces résultats mettent en évidence la contribution complexe au domaine d'expression des régions microsynténiques et identifient un écart dans la dynamique de co-expression entre les nouveaux microsynténies de céphalopodes et de métazoaires. Cette rareté de co-expression dans les microsynténies de céphalopodes indique un mode potentiellement différent de leur régulation génique.

Les modules d'expression ont montré des signatures spécifiques de motifs régulateurs qui leur sont associés. Nous avons prédit les régions régulatrices à l'aide des données d'analyse de la chromatine accessible à la transposase (ATAC-seq25) à partir d'une évolution temporelle du développement ("Méthodes", note complémentaire 9). Les pics prédits associés à chaque groupe d'expression ont ensuite été analysés plus en détail pour l'enrichissement du motif du facteur de transcription connu, séparément pour les céphalopodes et l'ancienne microsynténie («Méthodes», données supplémentaires 2). Nous constatons que le module 2 de la microsynténie des céphalopodes, qui est associé à plusieurs tissus nerveux, a été enrichi pour les facteurs de transcription liant les motifs Chop26, E2F127, NeuroG228, COUP-TFII29, Atf430 impliqués dans la différenciation du système nerveux et les facteurs de transcription développementaux ZBTB18, Esrrb, Tcf21 , Pitx1, GATA aux trois stades de développement (p < 1e−3). Le module 4 était également enrichi en motifs de liaison aux facteurs de transcription impliqués dans le système nerveux et le développement général tels que Tcf3, TCFL2, GATA, Tcf21 et Pitx1 aux trois stades de développement (p < 1e-3). Cela suggère un schéma de régulation commun responsable de l'expression génique dans chacun des modules d'expression et une association de ces motifs avec une nouvelle microsynténie de céphalopodes.

Pour compléter nos données ATAC-seq, nous avons effectué des alignements du génome entier entre les génomes de céphalopodes disponibles en utilisant différents seuils de similarité d'alignement et de longueur ("Méthodes", note complémentaire 8, tableau complémentaire 5 et figure complémentaire 9). Cela a permis d'identifier les éléments non codants conservés potentiels (CNE) et leur association avec les corps de gènes et la topologie du génome («Méthodes», Fig. 10 supplémentaire, note supplémentaire 8). En raison de la distance évolutive entre les lignées de calmars et de poulpes, notre approche n'a produit que 1187 candidats CNE de céphalopodes coléoïdes avec un seuil de similarité de 0,95 et une taille minimale de 100 pb (tableau supplémentaire 5), dont 613 pourraient être localisés à des caractéristiques génétiques ( Fig. 10a–c supplémentaires). 139 étaient associés à de nouvelles microsynténies de céphalopodes (à l'intérieur ou à moins de 1 kb de la microsynténie), 73 à des synténies de métazoaires à l'intérieur ou à moins de 1 kb de la microsynténie) et 401 étaient situés en dehors de toute synténie (Fig. 10b supplémentaire). Seuls 12 des 1187 candidats avaient un chevauchement avec les pics ATAC-seq (tableau supplémentaire 5). Pour les CNE partagés entre les génomes de calmar, nous avons trouvé 42 920 CNE putatifs avec un seuil de similarité de 0, 95 et une taille minimale de 100 pb (tableau supplémentaire 5), dont 13 889 pourraient être localisés en fonction des caractéristiques génétiques (Fig. 10a – c supplémentaires). 2444 étaient associés à une nouvelle microsynténie de céphalopodes (à l'intérieur ou à moins de 1 kb de la microsynténie), 3255 à une synténie de métazoaires et 8190 étaient situés autour de gènes en dehors de toute synténie (Fig. 10c supplémentaire). De même, très peu chevauchaient les pics ATAC (14). Par conséquent, le rôle régulateur de ces régions reste flou.

Une contribution potentielle à cette observation pourrait être le renouvellement évolutif élevé des régions régulatrices au sein de la lignée des calmars, diminuant les connaissances acquises à partir des inférences basées sur l'alignement du génome / la conservation. Les génomes des céphalopodes sont volumineux, plus de 50 % de la longueur du génome étant attribuée à des éléments répétitifs2,3. Nous avons ainsi évalué la composition en éléments transposables des pics ATAC-seq associés aux clusters microsynténiques. Les deux types de microsynténie ont montré un taux de répétition moyen de 40 %. Les séquences de pics ATAC-seq dans les microsynténies de céphalopodes chez E. scolopes ont montré une teneur élevée en éléments répétitifs de 82 % et étaient le plus souvent associées aux éléments LINE/CR1-Zenon (44 %, contre 35 % dans les pics microsynténiques métazoaires). L'extension LINE/CR1 a été identifiée comme la classe d'éléments répétés la plus courante et spécifiquement étendue dans la lignée des calmars (E. scolopes)3.

La co-localisation conservée des gènes peut s'expliquer par des régions régulatrices au sein d'un gène voisin, même si la fonction du gène peut être indépendante (le scénario spectateur), formant ensemble un bloc régulateur génomique (GRB)4,5, ou via des éléments régulateurs partagés contrôlant l'expression de tous les gènes synténiques, résultant en une co-expression plus élevée8. Notre approche de microsynténie est agnostique à cette distinction, se concentrant sur toute co-localisation conservée de trois gènes ou plus. Nous pouvons donc utiliser nos données pour profiler indépendamment la propension des microsynténies de métazoaires ou de céphalopodes à correspondre à des modèles microsynténiques fonctionnels connus. L'emplacement des pics ATAC-seq dans les amas microsynténiques révèle que les régions de chromatine ouvertes associées à la microsynténie spécifique aux céphalopodes étaient plus souvent trouvées dans les introns que les pics trouvés dans la microsynténie métazoaire conservée ou d'autres gènes non synténiques (Fig. 3e, test exact de Fisher p < 1e−5). Fait intéressant, tout en partageant peu de chevauchement, la distribution des CNE, en particulier des CNE partagés entre les calmars, a montré une localisation significative vers les régions distales dans les synténies de métazoaires (test exact de Fisher p <2, 2e-16) (Fig. 10 supplémentaire). Ce résultat indique que, contrairement aux microsynténies plus conservées, les nouvelles microsynténies de céphalopodes sont plus similaires au scénario GRB, en particulier le modèle de proximité, dans lequel des activateurs putatifs se trouvent dans des gènes proches (bystander) à l'intérieur du même cluster microsynténique et peuvent potentiellement manquer distale domaines réglementaires. Cette observation peut également compléter la découverte d'une co-expression plus faible des gènes microsynténiques dans la microsynténie spécifique aux céphalopodes, par rapport aux microsynténies plus anciennes et conservées.

Compte tenu de cette idée, nous avons en outre cherché à étudier la fonction potentielle de nouvelles microsynténies de céphalopodes dans les modules d'expression 2 et 4 qui ont montré la plus grande contribution aux domaines d'expression des tissus neuronaux. De telles microsynténies peuvent être considérées comme un ensemble de tests utiles de microsynténies fonctionnelles impliquées dans l'évolution du système nerveux des céphalopodes. Nous avons ainsi examiné le réarrangement génomique, le paysage réglementaire et l'expression des gènes dans l'une des microsynténies représentatives spécifiques aux céphalopodes du module d'expression 2. Il s'agissait de l'un des clusters avec le plus grand nombre de gènes, codant pour la protéine de transfert de phosphate céramide-1. , la phénylalanine-ARNt ligase, la sous-unité du facteur d'épissage 3B, la sous-unité du complexe intégrateur et la protéine de liaison aux protéines amyloïdes. Les orthologues de cette microsynténie étaient largement répartis sur deux chromosomes chez le pétoncle (Fig. 4a), mais étaient densément entassés dans le génome d' E. scolopes avec presque aucun espace intergénique et quelques pics ATAC dominants vers une extrémité du groupe dans l'intron de la phénylalanine -ARNt ligase (Fig. 4b). Semblable à la tendance générale, ce regroupement chez les céphalopodes implique soit plusieurs translocations locales, soit une fusion chromosomique à grande échelle, suivie de réarrangements. Le cluster était localisé vers le centre du TAD prédit (Fig. 4b), à proximité d'une autre nouvelle unité microsynténique (du même module d'expression). Ensemble, ces deux unités forment un compartiment à haute densité d'interaction Hi-C, séparé du compartiment microsynténique métazoaire le plus proche et de ses pics ATAC associés (Fig. 4b). Dans notre modèle chromosomique tridimensionnel, cette microsynténie a également été trouvée à la surface de l'échafaudage chromosomique 2 (Fig. 4c). Fait intéressant, les gènes de ce groupe montrent une expression du système nerveux à la fois chez le pétoncle et E. scolopes (Fig. 5a, note complémentaire 10). Bien que certains de ces gènes soient considérés comme des gènes purement métaboliques ou domestiques, chez les vertébrés, ils sont connus pour jouer un rôle important dans le développement et l'activité du système nerveux31,32,33,34,35. Nous avons effectué une hybridation in situ pour visualiser l'expression des gènes au cours du développement dans les embryons d'E. scolopes et confirmé l'expression dans toutes les principales régions centrales du cerveau (Fig. 5b, c, note complémentaire 11). Cependant, nous avons également révélé une expression dans d'autres nouveaux tissus et organes de céphalopodes, tels que les cordons nerveux axiaux ainsi que le cœur et les branchies (Fig. 5b, c, Fig. 11 supplémentaire). Ce résultat fournit la preuve que ce cluster microsynténique et ses frères et sœurs du module d'expression 2 pourraient comprendre une microsynténie fonctionnelle du type de modèle spectateur qui ont été des contributeurs cruciaux à l'émergence de nouveaux domaines d'expression de céphalopodes. Plus généralement, l'observation des microsynténies associées aux innovations céphalopodes (MACI) et leur étude plus approfondie pourraient aider à disséquer l'évolution des modèles complexes d'expression tissulaire des céphalopodes.

a Emplacement des gènes orthologues de l'un des MACI chez Mizuhopecten yessoensis. Les gènes sont situés sur deux chromosomes distincts (en haut - chromosome entier, en bas - zoom avant, noir - densité de gènes, bleu - emplacement des gènes orthologues) avec de nombreux gènes intermédiaires entre les deux. Les orthologues de pétoncles des gènes du cluster microsynténique sont tracés en bas surlignés en bleu. b Gènes du même groupe chez Euprymna scolopes. Les gènes (surlignés en bleu) sont étroitement regroupés sur un échafaudage chromosomique avec un seul gène intermédiaire (haut - échafaudage chromosomique entier, bas - zoom avant, orange - conservé, amas microsynténiques métazoaires, bleu - amas microsynténiques spécifiques aux céphalopodes). Le cluster est situé dans un TAD. Deux pics ATAC-seq majeurs sont présents dans les régions introniques du dernier gène du cluster à trois stades de développement (axe y - valeur du signal). Le nombre de lectures d'ARN-seq de trois stades de développement montre plusieurs petits pics dans la région du cluster (axe y - nombre de lectures). Stade précoce - organogenèse précoce, stade 20, stade intermédiaire - organogenèse tardive, stade 24/25, stade tardif - proche de l'éclosion, stade 28/29. c Reconstruction tridimensionnelle de l'échafaudage chromosomique 2. L'amas synténique spécifique aux céphalopodes est situé à la surface. Les vues gauche et droite sont décalées de 90°.

une carte thermique montrant l'expression de gènes orthologues du groupe spécifique aux céphalopodes dans les tissus de pétoncles adultes et d'E. scolopes montrant l'expression neuronale chez les deux espèces. La barre d'échelle affiche les niveaux d'expression normalisés du score z par ligne. b Schéma du stade avancé (stade 27–29) Anatomie d'E. scolopes et coupe du nouveau-né. c Expression des gènes MACI dans les tissus nerveux et les organes internes des derniers stades de développement d'E. scolopes. Tous les gènes montrent une expression dans différents lobes du cerveau, principalement l'ASM et le PSM. Les modèles d'expression de la lumière sont présents dans les lobes optiques, la glande digestive et les intestins dans la plupart des gènes. Les profils d'expression diffèrent de la bêta-tubuline, qui a été choisie comme témoin pour son domaine d'expression panneuronal, dans son intensité et sa distribution. Barres d'échelle = 100 µm. Masse sous-œsophagienne antérieure ASM, glande digestive DG, œsophage ES, organe entonnoir FT, branchies GI, intestin INT, sac d'encre IS, jaune interne IYO, lobe optique OL, masse sous-œsophagienne postérieure PSM, statocyste ST. Cercles en pointillés - piégeage des couleurs.

En résumé, nous présentons une étude approfondie de l'organisation topologique et réglementaire du génome chez un céphalopode coléoïde. Caractérisés par des interactions mégabase-gamme, les génomes des céphalopodes ont été impactés par une réorganisation synténique à l'échelle du génome, avec une ampleur rare parmi les génomes animaux. Cette réorganisation a conduit au gain de centaines de microsynténies spécifiques aux céphalopodes qui sont associées à des régions topologiques compactes et à un mode distinct de régulation des gènes. Leurs séquences régulatrices putatives étaient souvent situées dans les introns des gènes au sein du même cluster microsynténique, comme cela a été proposé pour la liaison fonctionnelle des gènes dans le modèle spectateur. Notre analyse des données d'expression microsynténique a révélé des modèles d'expression complexes de nouvelles microsynténies associées à un ensemble spécifique de tissus neuraux de céphalopodes et d'autres organes nouveaux. Nous identifions deux de ces modules d'expression les plus affectés par l'émergence de nouvelles microsynténies de céphalopodes, chacune associée à une signature régulatrice spécifique. Nous proposons que ce «verrouillage» synténique, c'est-à-dire une compacité élevée et une rationalisation réglementaire, était responsable de l'émergence et de l'extension des domaines d'expression des tissus neuronaux ancestraux des mollusques. Comme une grande partie de la biologie moléculaire des céphalopodes reste insaisissable, notre étude propose l'utilisation de ces microsynténies associées aux innovations de céphalopodes (MACI) pour commencer à démêler les changements moléculaires associés aux innovations de développement et d'organisme des céphalopodes. Cette étude ouvre la voie à une enquête plus approfondie sur les MACI et leurs rôles dans l'émergence de nouveaux domaines d'expression et d'innovations d'organismes chez les céphalopodes.

Les œufs d'E. scolopes ont été obtenus à partir de cultures et conservés au zoo de Vienne ou au laboratoire de biologie marine. Tous les travaux ont été effectués conformément à la directive européenne 2010/63/UE sur l'utilisation des céphalopodes et aux directives de l'AAALAC sur les soins et le bien-être des céphalopodes36. Les E. scolopes adultes ont frayé naturellement dans leurs réservoirs, et les embryons ont été collectés peu de temps après le frai et maintenus dans un système d'aquarium fermé rempli d'eau de mer artificielle. Les embryons se sont développés jusqu'au stade approprié et ont été anesthésiés avec de l'éthanol à 2 % avant utilisation37,38,39.

La préparation des échantillons Hi-C a été effectuée comme décrit dans la note supplémentaire 2. En bref, des échantillons Hi-C ont été générés au stade de développement 2740 avec 30 embryons regroupés à l'aide de l'enzyme de restriction à six bases Hind3. Un séquençage apparié de 50 pb a été effectué sur un Illumina HiSeq2500. Les lectures Hi-C ont été alignées sur le génome de référence (à l'exclusion des échafaudages <50k), ce qui a donné plus de 106 millions de paires d'interactions valides (taux d'alignement ~ 71%). Des lectures alignées ont été utilisées pour échafauder le génome aux échafaudages chromosomiques. Les statistiques d'assemblage sont résumées dans la note supplémentaire 2. Les lectures Hi-C brutes ont ensuite été à nouveau cartographiées sur les nouveaux échafaudages chromosomiques, récupérant plus de 106 millions de paires d'interaction valides (taux d'alignement ~ 71%). La modélisation tridimensionnelle des échafaudages chromosomiques est décrite dans la note complémentaire 3. Pour les échantillons humains, des échantillons Hi-C de lymphoblastoïdes B ont été téléchargés à partir du NCBI (réf. 41, SRR1658570, HIC001) et alignés sur le génome de référence humain (GRCh38.p12 ) obtenant plus de 144 millions de paires d'interactions valides (taux d'alignement d'environ 73 %).

L'orthologie des gènes a été reconstruite à l'aide de 27 espèces couvrant tous les principaux clades de métazoaires. La microsynténie a été calculée à l'aide d'outils internes, comme décrit en détail dans la note complémentaire 3. La synténie des métazoaires a été définie comme l'ensemble des blocs synténiques partagés entre au moins sept autres espèces. Une nouvelle synténie spécifique aux céphalopodes a été définie comme une synténie partagée entre E. scolopes et au moins une espèce de poulpe. Les microsynténies aléatoires ont été modélisées d'après la distribution des synténies observées comme décrit dans la réf. 8 pour 20 itérations. Des détails supplémentaires sur les scripts et les étapes se trouvent dans la note complémentaire 3.

Les TAD pour E. scolopes et Human ont été appelés avec Tadbit42 avec l'algorithme Tadbit et avec HiCExplorer43. Les TAD d'E. scolopes ont été moyennés et l'emplacement du milieu de chaque groupe synténique a été cartographié pour analyser la distribution des synténies au sein des TAD. Si les synténies couvraient plusieurs TAD, seul le TAD cartographiant le milieu de cette synténie était pris en compte. Pour analyser plus en détail la topologie des clusters microsynténiques, la matrice d'interaction Hi-C normalisée a été utilisée pour regrouper chaque bac à son voisin le plus proche par la force d'interaction du bac. Un cladogramme d'interaction pour chaque chromosome a été reconstruit de cette façon. Pour comprendre à quel point une région synténique est définie par ses interactions, nous avons extrait le dernier ancêtre commun de cette région (c'est-à-dire les bacs de cette région) de l'arbre entier constituant le chromosome. Ensuite, le rapport entre ces sous-arbres et le nombre de bacs dans un cluster synténique a été calculé et les différences entre les groupes ont été testées à l'aide du test de Wilcoxon.

Le centre de chaque groupe synténique a été localisé dans les limites prévues de TAD. Les emplacements ont ensuite été normalisés et tracés pour les microsynténies observées et aléatoires. Pour visualiser les différences entre observé et aléatoire, le rapport entre les densités de chacun a été calculé et tracé dans les emplacements TAD normalisés (Fig. 3a). Une densité supérieure à un signifie un enrichissement de la synténie observée par rapport aux clusters aléatoires. Une densité inférieure à un signifie un signal appauvri de la synténie observée par rapport aux grappes aléatoires. La synténie aléatoire représente des grappes échantillonnées à partir de la distribution des blocs observés à partir d'emplacements aléatoires dans le génome.

Les coefficients de co-expression pour les tissus adultes de E. scolopes et O. bimaculoides ont été calculés comme décrit dans la réf. 8. Une description détaillée des étapes est fournie dans la note complémentaire 7.

Les génomes de E. scolopes et O. bimaculoides et de E. scolopes et A. dux ont été alignés avec le mégablaste, en utilisant E. scolopes comme séquence de requête. Cinq paramètres différents pour les scores de similarité BLAST44 (-perc_identity) ont été utilisés : 0 %, 70 %, 80 %, 95 % et 98 % (Figures supplémentaires 9, 10, Tableau supplémentaire 5, voir réf. 4, 7, 45, 46). Pour plus de paramètres, voir la note complémentaire 8. Les régions de multicartographie ont été exclues si elles se chevauchaient de plus de 50 % et se produisaient plus de 3 fois à l'aide de la bedmap BEDOPS47. bedmap --count --echo --fraction-both 0.5 --delim '\t' prefiltered_megablast.bed | awk '$1<4' | coupe -f2- |sort-lit - | unique. Les régions qui se chevauchaient restantes ont été fusionnées avec bedops –merge. Toute région chevauchant un exon de 1 pb ou plus a été exclue à l'aide de bedtools48 subtract. Pour exclure les régions répétitives, des séquences fasta ont été extraites des emplacements CNE putatifs filtrés et la fonction de poussière de meme49 (seuil 10) a été utilisée pour masquer les répétitions. De plus, deux ensembles de données ont été créés pour chaque score de similarité avec une taille minimale de 100 bp ou 50 bp respectivement. Pour des scores de similarité de 0 %, seules les régions de 100 pb ont été conservées. Toute région avec plus de 25% Ns a été exclue. Pour supprimer toutes les séquences codantes restantes, les séquences CNE putatives restantes ont été dynamitées par rapport à la base de données NCBI50 NR et toutes les régions chevauchant une correspondance BLAST ont été supprimées.

La préparation et l'analyse des échantillons ATAC-seq sont décrites dans la note supplémentaire 9. ATAC-seq a été généré pour les étapes 20, 25 et 28/2940 avec deux réplicats biologiques chacun, comme décrit dans les réf. 25,51,52 avec de légères modifications. Chaque bibliothèque ATAC-seq a été générée avec deux échantillons biologiques répliqués. Les échantillons ont été séquencés sur Illumina HiSeqV4 en utilisant des lectures appariées de 125 pb. Les lectures ont été coupées avec BBDuk (https://jgi.doe.gov/data-and-tools/bbtools/bb-tools-user-guide/bbduk-guide/) et mappées sur les échafaudages chromosomiques. Les pics ont été appelés avec Genrich (https://github.com/jsh58/Genrich). Après avoir coupé, il restait entre 72 et 143 millions de lectures qui ont été cartographiées entre 79 et 83% et entre 22 443 et 36 933 pics ont été appelés pour chaque échantillon.

Les embryons d'E. scolopes retirés des œufs et des couches de gelée et les nouveau-nés ont été anesthésiés dans de l'EtOH à 4 % dans de l'eau de mer ou dans de l'EtOH à 4 % et du MgCl2 (solution 2 M ajoutée lentement à l'eau de mer) et ensuite fixés dans du paraformaldéhyde à 4 %38. Des séquences d'intérêt ont été identifiées à partir des transcriptomes adultes d'E. scolopes. L'ADNc des stades de développement regroupés a été utilisé pour la PCR avec la polymérase Q5. Les produits ont été clonés dans des vecteurs pjet et isolés avec un innuPREP Plasmid Mini Kit (Analytik jena (Jena, Allemagne)) et séquencés. Des ribosondes ont été générées à partir de minipreps amplifiés et rétrotranscrites avec des nucléotides marqués au DIG. Des détails sur les protocoles FISH et ISH sont disponibles dans la note complémentaire 11. Les embryons et les nouveau-nés ont été imagés sur un microscope à balayage laser confocal multiphoton Zeiss (Oberkochen, Allemagne) LSM 780 inversé.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.

Les données à l'appui de cette étude sont disponibles auprès des auteurs correspondants sur demande raisonnable. Les données Hi-C et ATAC-seq ont été déposées dans la base de données NCBI sous Bioproject PRJNA661684. Toutes les données d'expression, ATAC-seq et CNE qui sont mappées au génome de référence sont disponibles sur un navigateur de génome (actuellement, http://metazoa.csb.univie.ac.at:8000/euprymna/jbrowse ou sur demande). Toutes les autres données génomiques et trascriptomiques utilisées ont été téléchargées depuis NCBI (GCA_002113885.2, GCA_000002075.2, GRCh38.p12, GCA_001949145.1 OLI-Apl_1.0, GCA_000003605.1, GCA_000224145.2, GCA_0000038 15.1 Version 2, GCA_004765925.1 , Spur_3.1, GRCm38.p6, SAMN00691532, SAMN00152410), ENSEMBL (BDGP6.28 http://www.ensembl.org/Drosophila_melanogaster/Info/Index, WBcel235 http://m.ensembl.org/Caenorhabditis_elegans/Info/ Annotation, Capitella_teleta_v1.0 http://metazoa.ensembl.org/Capitella_teleta/Info/Index, ASM23792v2 http://metazoa.ensembl.org/Schistosoma_mansoni/Info/Index, oyster_v9 http://metazoa.ensembl.org/Crassostrea_gigas /Info/Index, Helro1 http://metazoa.ensembl.org/Helobdella_robusta/Info/Index, Lotgi1 http://metazoa.ensembl.org/Lottia_gigantea/Info/Index, PRJNA270931 https://metazoa.ensembl.org/ Octopus_bimaculoides/Info/Index, Stegodyphus_mimosarum_v1 [https://metazoa.ensembl.org/Stegodyphus_mimosarum/Info/Index], Tcas5.2 [http://metazoa.ensembl.org/Tribolium_castaneum/Info/Index, AMS_PRJEB1171_v1 [https:/ /metazoa.ensembl.org/Adineta_vaga/Info/Index, GRCh37.p13 https://grch37.ensembl.org/Homo_sapiens/Info/Index, ASM20922v1 https://metazoa.ensembl.org/Nematostella_vectensis/Info/Index, Aqu1 https://metazoa.ensembl.org/Amphimedon_queenslandica/Info/Index, MneLei_Aug2011 http://metazoa.ensembl.org/Mnemiopsis_leidyi/Info/Index) ou GIGA (PRJNA421033 https://www.ebi.ac.uk/ena /navigateur/view/PRJNA421033). Les données humaines Hi-C ont été téléchargées à partir du NCBI (SRR1658570, HIC001). Les fichiers et tableaux traités nécessaires pour recréer les figures sont accessibles via un référentiel bitbucket : https://bitbucket.org/hannahschm/ceph_regulation_microsynteny/. Les données sources sont fournies avec ce document.

Tous les protocoles bioinformatiques seront mis à disposition sous https://bitbucket.org/hannahschm/ceph_regulation_microsynteny/ avec des paramètres détaillés pour chaque programme et des exemples de scripts. Le script C++ pour les structures 3D des chromosomes individuels peut être consulté sur demande auprès de T. Clarence ([email protected]).

Ritschard, EA et al. Histoires évolutives génomiques couplées en tant que signatures d'innovations d'organismes chez les céphalopodes : les signatures co-évolutives à travers les niveaux d'organisation du génome peuvent éclairer le lien fonctionnel et l'origine des nouveautés de céphalopodes. BioEssays N. Rev. Mol. Cellule. Dév. Biol. 41, e1900073 (2019).

Google Scholar

Albertin, CB et al. Le génome du poulpe et l'évolution des nouveautés neurales et morphologiques des céphalopodes. Nature 524, 220-224 (2015).

Article ADS CAS PubMed PubMed Central Google Scholar

Belcaid, M. et al. Organes symbiotiques façonnés par des modes distincts d'évolution du génome chez les céphalopodes. Proc. Natl Acad. Sci. États-Unis 116, 3030–3035 (2019).

Article CAS PubMed PubMed Central Google Scholar

Engström, PG, Ho Sui, SJ, Drivenes, O., Becker, TS et Lenhard, B. Les blocs de régulation génomique sous-tendent la conservation extensive de la microsynténie chez les insectes. Génome Res. 17, 1898-1908 (2007).

Article CAS PubMed PubMed Central Google Scholar

Irimia, M. et al. Conservation étendue de la microsynténie ancienne à travers les métazoaires en raison de contraintes cis-régulatrices. Génome Res. 22, 2356-2367 (2012).

Article CAS PubMed PubMed Central Google Scholar

Simakov, O. et al. Aperçu de l'évolution bilatérale à partir de trois génomes spiraliens. Nature 493, 526-531 (2013).

Article ADS CAS PubMed Google Scholar

Kikuta, H. et al. Les blocs régulateurs génomiques englobent plusieurs gènes voisins et maintiennent une synténie conservée chez les vertébrés. Génome Res. 17, 545-555 (2007).

Article CAS PubMed PubMed Central Google Scholar

Zimmermann, B., Robert, NSM, Technau, U. & Simakov, O. L'architecture du génome animal ancien reflète les identités de type cellulaire. Nat. Écol. Évol. 3, 1289-1293 (2019).

Article PubMed Google Scholar

McFall-Ngai, MJ & Ruby, EG Reconnaissance des symbiotes et morphogenèse subséquente en tant qu'événements précoces dans un mutualisme animal-bactérien. Sciences 254, 1491-1494 (1991).

Article ADS CAS PubMed Google Scholar

Nyholm, SV & McFall-Ngai, MJ Une symbiose durable : comment le calmar bobtail hawaïen trouve et conserve son partenaire bactérien bioluminescent. Nat. Rév. Microbiol. https://doi.org/10.1038/s41579-021-00567-y (2021).

Wang, S. et al. Le génome du pétoncle donne un aperçu de l'évolution du caryotype bilatéral et du développement. Nat. Écol. Évol. 1, s41559-017–0120–017 (2017).

Article Google Scholar

Zhang, Y. et al. Le génome de Nautilus pompilius éclaire l'évolution et la biominéralisation des yeux. Nat. Écol. Évol. 5, 927–938 (2021).

Article PubMed PubMed Central Google Scholar

van Berkum, NL et al. Hi-C : une méthode pour étudier l'architecture tridimensionnelle des génomes. J.Vis. Exp. JoVE https://doi.org/10.3791/1869 (2010).

Friedman, N. & Rando, OJ L'épigénomique et la structure du génome vivant. Génome Res. 25, 1482–1490 (2015).

Article CAS PubMed PubMed Central Google Scholar

Dali, R. & Blanchette, M. Une évaluation critique des outils de prédiction de domaine à association topologique. Nucleic Acids Res. 45, 2994-3005 (2017).

Article CAS PubMed PubMed Central Google Scholar

Cubeñas-Potts, C. & Corces, VG Protéines architecturales, transcription et organisation tridimensionnelle du génome. FEBS Lett. 589, 2923-2930 (2015).

Article CAS PubMed PubMed Central Google Scholar

Symmons, O. et al. Caractéristiques fonctionnelles et topologiques des domaines de régulation des mammifères. Génome Res. 24, 390-400 (2014).

Article CAS PubMed PubMed Central Google Scholar

Heger, P., Marin, B., Bartkuhn, M., Schierenberg, E. & Wiehe, T. L'isolant de chromatine CTCF et l'émergence de la diversité des métazoaires. Proc. Natl Acad. Sci. États-Unis 109, 17507–17512 (2012).

Article ADS CAS PubMed PubMed Central Google Scholar

Rubio, ED et al. Le CTCF relie physiquement la cohésine à la chromatine. Proc. Natl Acad. Sci. États-Unis 105, 8309–8314 (2008).

Article ADS CAS PubMed PubMed Central Google Scholar

Filippova, GN et al. Un répresseur transcriptionnel exceptionnellement conservé, CTCF, utilise différentes combinaisons de doigts de zinc pour lier des séquences promotrices divergentes d'oncogènes c-myc aviaires et mammifères. Mol. Cellule. Biol. 16, 2802–2813 (1996).

Article CAS PubMed PubMed Central Google Scholar

Acemel, RD, Maeso, I. & Gómez-Skarmeta, JL Domaines topologiquement associés : un échafaudage réussi pour l'évolution de la régulation des gènes chez les animaux. Wiley Interdiscip. Rév. Dev. Biol. 6, e265 (2017).

Lazar, NH et al. Maintien épigénétique des domaines topologiques dans le génome gibbon hautement réarrangé. Génome Res. 28, 983–997 (2018).

Article CAS PubMed PubMed Central Google Scholar

Touceda-Suarez, M. et al. Les anciens blocs régulateurs génomiques sont une source de déserts de gènes régulateurs chez les vertébrés après des duplications du génome entier. Mol. Biol. Évol. 37, 2857–2864 (2020).

Article CAS PubMed PubMed Central Google Scholar

Kryuchkova-Mostacci, N. & Robinson-Rechavi, M. La spécificité tissulaire de l'expression génique diverge lentement entre les orthologues et rapidement entre les paralogues. Calcul PLOS. Biol. 12, e1005274 (2016).

Article ADS CAS PubMed PubMed Central Google Scholar

Buenrostro, JD, Giresi, PG, Zaba, LC, Chang, HY & Greenleaf, WJ Transposition de la chromatine native pour un profilage épigénomique rapide et sensible de la chromatine ouverte, des protéines de liaison à l'ADN et de la position du nucléosome. Nat. Méthodes 10, 1213 (2013).

Article CAS PubMed PubMed Central Google Scholar

Hood, KN et al. Le stress du réticulum endoplasmique contribue à la perte de neurones de l'hippocampe nouveau-né après une lésion cérébrale traumatique. J. Neurosci. 38, 2372-2384 (2018).

Article CAS PubMed PubMed Central Google Scholar

Wang, Y. et al. Le rôle de la signalisation E2F1-topoIIβ dans la régulation de la sortie du cycle cellulaire et la différenciation neuronale des cellules SH-SY5Y humaines. Différer. Rés. Biol. Plongeurs 104, 1–12 (2018).

CAS Google Scholar

Lu, C. et al. La surexpression de NEUROG2 et NEUROG1 dans les cellules souches embryonnaires humaines produit un réseau de neurones excitateurs et inhibiteurs. FASEB J. 33, 5287–5299 (2019).

Article CAS PubMed PubMed Central Google Scholar

Kanatani, S. et al. Le COUP-TFII/Neuropilin-2 est un interrupteur moléculaire dirigeant les neurones GABAergiques dérivés du diencéphale dans le cerveau de souris en développement. Proc. Natl Acad. Sci. États-Unis 112, E4985–E4994 (2015).

Article CAS PubMed PubMed Central Google Scholar

Corona, C. et al. L'activation du facteur de transcription 4 (ATF4) régule l'activité neuronale en contrôlant le trafic de GABABR. J. Neurosci. 38, 6102–6113 (2018).

Article CAS PubMed PubMed Central Google Scholar

Shinghal, R., Scheller, RH & Bajjalieh, SM Activité céramide 1-phosphate phosphatase dans le cerveau. J. Neurochem. 61, 2279-2285 (1993).

Article CAS PubMed Google Scholar

Oegema, R. et al. Les mutations humaines dans les sous-unités du complexe intégrateur relient l'intégrité du transcriptome au développement du cerveau. PLoS Genet. 13, e1006809 (2017).

Article CAS PubMed PubMed Central Google Scholar

Hamley, IW Le peptide bêta-amyloïde : le point de vue d'un chimiste. Rôle dans la maladie d'Alzheimer et la fibrillation. Chim. Rév. 112, 5147–5192 (2012).

Article CAS PubMed Google Scholar

Wang, Q., Moore, MJ, Adelmant, G., Marto, JA et Silver, PA PQBP1, un facteur lié à la déficience intellectuelle, affecte l'épissage alternatif associé à la croissance des neurites. Gènes Dév. 27, 615–626 (2013).

Article CAS PubMed PubMed Central Google Scholar

Zadjali, F. et al. L'homozygotie pour la mutation FARSB conduit à une maladie liée à la Phe-tRNA synthétase de restriction de croissance, de calcification cérébrale et de maladie pulmonaire interstitielle. Hum. Mutat. 39, 1355–1359 (2018).

Article CAS PubMed Google Scholar

Fiorito, G. et al. Lignes directrices pour les soins et le bien-être des céphalopodes dans la recherche - un consensus basé sur une initiative de CephRes, FELASA et le Boyd Group. Laboratoire. Anim. 49, 1–90 (2015).

Article PubMed Google Scholar

Butler-Struben, HM, Brophy, SM, Johnson, NA & Crook, RJ Enregistrement in vivo des corrélats neuronaux et comportementaux de l'induction, de l'inversion et de l'euthanasie de l'anesthésie chez les mollusques céphalopodes. Devant. Physiol. 9, 109 (2018).

Shigeno, S., Parnaik, R., Albertin, CB et Ragsdale, CW Preuve d'un schéma cordial, non ganglionnaire, de neurogenèse cérébrale des céphalopodes. Zoologique Lett. https://doi.org/10.1186/s40851-015-0026-z (2015).

Collins, AJ & Nyholm, SV Obtention d'hémocytes du calmar bobtail hawaïen Euprymna scolopes et observation de leur adhérence à des bactéries symbiotiques et non symbiotiques. J.Vis. Exp. JoVE 1714, https://doi.org/10.3791/1714 (2010).

Lee, PN, Callaerts, P. & de Couet, HG Le développement embryonnaire du calmar bobtail hawaïen (Euprymna scolopes). Cold Spring Harb. Protocole 2009, pdb.ip77 (2009).

Article CAS PubMed Google Scholar

Rao, SSP et al. Une carte 3D du génome humain à une résolution de kilobase révèle les principes du bouclage de la chromatine. Cellule 159, 1665-1680 (2014).

Article CAS PubMed PubMed Central Google Scholar

Serra, F. et al. L'analyse automatique et la modélisation 3D des données Hi-C à l'aide de TADbit révèlent les caractéristiques structurelles des couleurs de la chromatine de la mouche. Calcul PLOS. Biol. 13, e1005665 (2017).

Article CAS PubMed PubMed Central Google Scholar

Wolff, J. et al. Galaxy HiCExplorer 3 : un serveur Web pour le Hi-C reproductible, la capture Hi-C et l'analyse des données Hi-C monocellulaires, le contrôle qualité et la visualisation. Nucleic Acids Res. https://doi.org/10.1093/nar/gkaa220 (2020).

Camacho, C. et al. BLAST+ : architecture et applications. BMC Bioinforma. 10, 421 (2009).

Article CAS Google Scholar

Engström, PG, Fredman, D. & Lenhard, B. Ancora : une ressource Web pour explorer des éléments non codants hautement conservés et leur association avec des gènes régulateurs du développement. Génome Biol. 9, R34 (2008).

Article CAS PubMed PubMed Central Google Scholar

Bejerano, G. et al. Eléments ultra conservés dans le génome humain. Sciences 304, 1321-1325 (2004).

Article ADS CAS PubMed Google Scholar

Neph, S. et al. BEDOPS : opérations de caractéristiques génomiques à haute performance. Bioinformatique 28, 1919-1920 (2012).

Article CAS PubMed PubMed Central Google Scholar

Quinlan, AR & Hall, IM BEDTools : une suite flexible d'utilitaires pour comparer les caractéristiques génomiques. Bioinformatique 26, 841–842 (2010).

Article CAS PubMed PubMed Central Google Scholar

Bailey, TL, Johnson, J., Grant, CE et Noble, WS La suite MEME. Nucleic Acids Res. 43, W39–W49 (2015).

Article CAS PubMed PubMed Central Google Scholar

Sayers, EW et al. Ressources de la base de données du centre national d'information sur les biotechnologies. Nucleic Acids Res. 50, D20–D26 (2022).

Article CAS PubMed Google Scholar

Corces, MR et al. Un protocole ATAC-seq amélioré réduit le bruit de fond et permet l'interrogation des tissus congelés. Nat. Méthodes 14, 959–962 (2017).

Article CAS PubMed PubMed Central Google Scholar

Buenrostro et al. ATAC-seq : une méthode pour tester l'accessibilité de la chromatine à l'échelle du génome. Courant. Protocole Mol. Biol. Éd. Frederick M Ausubel Al 109, 21.29.1–21.29.9 (2015).

Google Scholar

Tanner, AR et al. Les horloges moléculaires indiquent le renouvellement et la diversification des céphalopodes coléoïdes modernes au cours de la révolution marine mésozoïque. Proc. R. Soc. B Biol. Sci. 284, 20162818 (2017).

Article Google Scholar

Kröger, B., Vinther, J. & Fuchs, D. Origine et évolution des céphalopodes : une image congruente émergeant des fossiles, du développement et des molécules. BioEssays 33, 602–613 (2011).

Article CAS PubMed Google Scholar

Télécharger les références

HS, OPH, ER et OS ont été soutenus par la subvention P30686-B29 du Fonds scientifique autrichien (FWF). OS a été soutenu par Whitman Center Early Career Fellowship (Frank R. Lillie Quasi-Endowment Fund, L. & A. Colwin Summer Research Fellowship, Bell Research Award in Tissue Engineering). HS a été soutenu par la bourse à court terme à l'étranger (KWA) de l'Université de Vienne. HS et OS ont été soutenus par la bourse de mobilité du programme de partenariat stratégique de l'Université de Chicago/Vienne. AK a été soutenu par le programme de bourses postdoctorales JSPS pour les chercheurs étrangers du Japon. L'ABC a été soutenue par la bourse Hibbitt Early Career. Les œufs et les paralarves d'E. scolopes ont été générés en partie grâce au soutien de la NASA Space Biology 80NSSC18K1465 attribué à JSFSVN a été soutenu par la National Science Foundation IOS-1557914. Ce travail a été soutenu par le Francis Crick Institute, qui reçoit son financement de base de Cancer Research UK (FC0001003), du UK Medical Research Council (FC001003) et du Wellcome Trust (FC001003). Les auteurs tiennent à remercier le zoo de Vienne (Tiergarten Schönbrunn), en particulier Roland Halbauer et l'équipe d'aquariophilie pour l'élevage, ainsi que le programme des céphalopodes MBL, leur équipe, Emily Garcia, et le MBL Central Microscopy Facility (MBL, Woods Hole) . Les auteurs remercient le Département de neurosciences et de biologie du développement de l'Université de Vienne, en particulier Andreas Denner. Le calcul a été effectué à l'aide du Life Sciences Cluster de l'Université de Vienne. Le sectionnement a été effectué au Core Facility CIUS (Université de Vienne). Les auteurs tiennent à remercier Daniel Rokhsar et Clifton Ragsdale pour leurs conseils et avis.

Ces auteurs ont contribué à parts égales : Hannah Schmidbaur, Akane Kawaguchi.

Département de neurosciences et de biologie du développement, Université de Vienne, Vienne, Autriche

Hannah Schmidbaur, Oi Pui Hoang, Bob Zimmermann, Elena A. Ritschard et Oleg Simakov

Institut de pathologie moléculaire, Vienne, Autriche

Akane Kawaguchi & Elly Tanaka

Laboratoire de modélisation biomoléculaire, The Francis Crick Institute, Londres, Royaume-Uni

Tereza Clarence, Xiao Fu et Paul A. Bates

Département de biologie et évolution des organismes marins, Stazione Zoologica Anton Dohrn, Naples, Italie

Elena A. Ritschard

Zoo de Vienne, Maxingstraße 13b, 1130, Vienne, Autriche

Anton Weissenbacher

Département de microbiologie et de sciences cellulaires, Université de Floride, Space Life Science Lab, Merritt Island, Floride, États-Unis

Jamie S.Foster

Département de biologie moléculaire et cellulaire, Université du Connecticut, Storrs, CT, États-Unis

Spencer V. Nyholm

Bell Center for Regenerative Biology and Tissue Engineering, Laboratoire de biologie marine, Woods Hole, MA, États-Unis

de Caroline B. Albert

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

HS a effectué une analyse génomique comparative avec le soutien d'OS, AK a effectué des expériences Hi-C, HS et AK ont effectué une collecte de données ATAC-seq. HS et CA ont effectué une hybridation in situ. TG, XF et PB ont effectué une reconstruction et une analyse 3D. HS et OPH ont effectué la quantification ATAC-seq. HS et BZ ont effectué une analyse de co-expression et de randomisation synténique, EAR, HS et CA ont effectué une extraction d'ARN-seq. JF et SN ont fourni des animaux. AW et le zoo de Vienne abritaient des animaux. HS, CA, ET et OS ont conçu la recherche. HS et OS ont rédigé le manuscrit avec la contribution de tous les autres auteurs.

Correspondance à Caroline B. Albertin, Elly Tanaka ou Oleg Simakov.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Jose Martín-Durán et les autres évaluateurs anonymes pour leur contribution à l'évaluation par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Schmidbaur, H., Kawaguchi, A., Clarence, T. et al. Émergence d'une nouvelle régulation et expression de gènes de céphalopodes grâce à une réorganisation du génome à grande échelle. Nat Commun 13, 2172 (2022). https://doi.org/10.1038/s41467-022-29694-7

Télécharger la citation

Reçu : 19 août 2020

Accepté : 28 mars 2022

Publié: 21 avril 2022

DOI : https://doi.org/10.1038/s41467-022-29694-7

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

BMC Biologie (2022)

BMC Biologie (2022)

Communication Nature (2022)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.

PARTAGER