آنالیز مقایسه‌ای ژنومی درختان صنعتی و تندرشد صنوبر و اکالیپتوس

نوع مقاله : علمی - پژوهشی

نویسنده

استادیار دانشکده کشاورزی و منابع طبیعی اهر، دانشگاه تبریز

چکیده

مقدمه و هدف: شناسایی تشابهات ژنتیکی و ارتولوژی ژنی بین گونه‌های مختلف درختی می‌تواند در درک تکامل ژنوم، به‌نژادی و حفاظت گونه‌ها کاربرد داشته باشد. دانش زیادی در مورد عملکرد ژنوم درختان جنگلی از طریق مطالعات ژنومیکس مقایسه‌ای قابل استخراج است. تاکنون، گونه‌های گیاهی دارای اهمیت اقتصادی مختلفی در این زمینه به خوبی مورد پژوهش قرار گرفته‌اند، اما ژنومیکس مقایسه‌ای درختان جنگلی کمتر مورد بررسی واقع شده‌اند. به نظر می‌رسد مطالعات جامعی به‌منظور مقایسه ژنومی بین درختان صنعتی و تندرشد صنوبر (Populus trichocarpa) و اکالیپتوس (Eucalyptus grandis) متعلق به جد مشترک و کلاد گل‌سرخ‌داران (Rosids) کمتر انجام شده است به‌خصوص با توجه به‌این‌که این دو گونه گیاهی مدل بوده و داده‌های زیستی آنها به‌روزرسانی می‌شود. هدف از انجام پژوهش حاضر، ارزیابی مقایسه‌ای توالی کامل ژنوم درختان صنعتی اکالیپتوس و صنوبر از نظر خصوصیات ژنومی مهم مانند اندازه ژنوم، تعداد کروموزوم، محتوای ژنی، نشانگرهای ریزماهواره، تعداد ژن‌های خانواده ژنی ترپن سنتاز و شناسایی ژن‌های مرتبط با دو صفت مهم و مورد توجه به‌نژادگران درختان جنگلی، شامل صفات تشکیل چوب و کیفیت دیواره سلولی است.
مواد و روش‌ها: در این پژوهش، از دو فایل مربوط به توالی‌یابی کل ژنوم (Whole genome sequencing) اکالیپتوس (E. grandis) با شماره دسترسی مرکز ملی اطلاعات فناوری زیستی آمریکا (NCBI) GCF-016545825.1 و صنوبر (P. trichocarpa) با شماره دسترسی GCF-000002775.5 استفاده شده است. هر دو گونه گیاهی جزو گیاهان مدل ژنتیکی بوده و ژنوم آن‌ها در سطح کروموزوم سرهم‌بندی شده بود. در پژوهش حاضر، به بررسی برخی مشخصات ژنومی مانند اندازه ژنوم، تعداد کروموزوم، محتوای کلیGC، تعداد کل ژن‌ها، ژن‌های رمز کننده پروتئین،RNA های کوچک غیررمزکننده (SncRNA) و ژن‌های کاذب دو گونه تندرشد صنوبر و اکالیپتوس پرداخته شده و نمودار ون رسم شد. همچنین، توالی‌های ریزماهوارهای‌ با نرم‌افزار MISA در زبان برنامه‌نویسی Perl و توالی‌های مربوط به تکثیر پشت‌سرهم موجود بر روی ژنوم‌های دو گونه فوق استخراج شد. همچنین تعداد ژن‌های خانواده ژنی ترپن سنتاز در این دو گونه، مورد مقایسه قرار گرفت. ژن‌های مرتبط با دو صفت تشکیل چوب و کیفیت دیواره سلولی گیاه مورد بررسی قرار گرفت.
یافته‌ها: نتایج این پژوهش نشان داد اندازه ژنوم اکالیپتوس نسبت به صنوبر، بزرگ‌تر و دارای 42619 ژن است که از این میان، 33352 ژن رمزکننده پروتئین در سراسر ژنوم وجود داشت. ژنوم صنوبر نیز واجد 34621 ژن بوده که 29617 ژن، رمزکننده پروتئین بوده است. علاوه بر آن، تعداد ژن‌های کاذب در ژنوم اکالیپتوس 9/2 برابر صنوبر بود. تعداد کروموزم‌های اکالیپتوس 11 و تعداد کروموزوم‌های صنوبر 19 عدد شمارش شده است. تعداد RNAs کوچک برای ژنوم اکالیپتوس و صنوبر به‌ترتیب 1507 و 1347 بود. بر اساس اطلاعات حاشیه نویسی ژنوم موجود در سایت NCBI، برخی از ژن‌ها فقط در درخت اکالیپتوس و برخی از ژن‌ها فقط در درخت صنوبر یافت شدند. مطابق نمودار ون، 14484 ژن منحصر به فرد برای اکالیپتوس و 12114 ژن مخصوص گونه صنوبر شناسایی شد. 9133 ژن نیز مشترک بین دو گونه بوده است. تعداد کل نشانگرهای ریزماهواره شناسایی شده بر روی ژنوم اکالیپتوس 136147 عدد و برای ژنوم صنوبر 77024 عدد بود. نتایج به دست آمده نشان می‌دهد که ژنوم‌های اکالیپتوس و صنوبر به‌ترتیب از Mb 8/3 و Mb 2/10 توالی‌های ریزماهوارهای تشکیل شده است. جالب‌توجه است که تعداد و تراکم نشانگرهای ریزماهواره شناسایی شده در ژنوم اکالیپتوس به‌ترتیب 8/1 و 2/1 برابر صنوبر بود. لازم به ذکر است به تعداد 4067 نوع موتیف در اکالیپتوس و 2898 نوع موتیف در ژنوم صنوبر شناسایی شد. از دیگر نتایج پژوهش حاضر می‌توان به وجود ارتباط عکس میان فراوانی ریزماهواره‌ها و تعداد توکلئوتیدها در میان توالی‌های ژنومی گونه‌های گیاهی مورد پژوهش اشاره کرد. به‌طوری‌که با افزایش فراوانی ریزماهواره‌ها، کاهش قابل‌توجهی در تعداد نوکلئوتیدها مشاهده شده است. بر این اساس، ریزماهواره‌های تک و دو نوکلئوتیدی دارای بیشترین فراوانی بوده، درحالی‌که ریزماهواره‌‌های هشت و نه نوکلئوتیدی، کمترین فراوانی را داشتند. نتایج حاصل از ارزیابی صورت گرفته در خصوص بررسی تفاوت حضور خانواده ژنی ترپن سنتاز در دو گونه گیاهی مورد پژوهش نیز حاکی از آن بوده است که در اکالیپتوس، 112 ژن و در صنوبر 7 ژن از خانواده ژنی فوق وجود دارد. تعداد خوشه یا همان تعداد مناطق گسترش یافته پشت‌سرهم در ژنوم گونه اکالیپتوس 3185 عدد و برای گونه صنوبر 2575 عدد شناسایی شده است. تعداد کل ژن‌های پشت‌سرهم حفظ شده در ژنوم اکالیپتوس به اندازه 16 درصد بیشتر از ژنوم صنوبر بود. تعداد ژن‌های عملکردی و غیرعملکردی اکالیپتوس نیز بزرگتر از صنوبر بود. در تعداد زیادی از ژن‌های مرتبط با صفت مهم تشکیل چوب در دو درخت مورد پژوهش، رویداد پیرایش جایگزین با الگوهای مختلف رخ داده است. در مجموع، به تعداد 59 ژن کاندید برای صفت مهم کیفیت دیواره سلولی برای دو گونه صنوبر و اکالیپتوس شناسایی شد.
نتیجه‌گیری کلی: ژنومیکس مقایسه‌ای می‌تواند با در اختیار قرار دادن آلل‌های متنوع مرتبط با صفات مهم اقتصادی و اکولوژیکی، فرایند اصلاح نژاد گونه‌های درختی را سرعت بخشیده و همچنین، به حفظ گونه‌هایی که از نظر ژنتیکی متمایز و در معرض خطر انقراض هستند، کمک کند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Comparative analysis of genomic features in industrial and fast-growing trees: A study of poplar and eucalypt

نویسنده [English]

  • Mohammad Esmaeilpour
Assistant professor, Ahar Faculty of Agriculture and Natural Resources, University of Tabriz, Ahar , Iran
چکیده [English]

Extended abstract
Background and objectives: Identification of genetic similarities and gene orthology between species can be used in understanding the evolution of genomes, conservation and breeding. A lot of knowledge about the genome function of forest trees can be extracted through comparative genomics studies. So far, various economically important crop species have been well studied in this field, but forest trees have been less studied. It seems that comprehensive studies in the direction of genome comparison between industrial and fast-growing trees, poplar (Populus trichocarpa) and eucalypt (Eucalyptus grandis), which share a common ancestor from the Rosids clade, have been relatively limited, especially given that these two plant species serves as model and have up-to-date biological data. The aim of this study is to compare the complete genome sequence of eucalyptus and poplars in terms of genomic characteristics such as genome size, chromosome number, gene content, microsatellite markers, the number of genes of the terpene synthase gene family and identification of genes related to two important traits of interest to forest tree breeders, including wood formation and cell wall quality.
Methodology: In this research, whole genome sequencing of eucalyptus (E. grandis) with NCBI accession number GCF-016545825.1 and poplar (P. trichocarpa) with NCBI accession number GCF- 000002775.5 is used. Both the tree species are model plants and their genomes were assembled at the chromosome level. In this study, we investigate various genomic characteristics, including genome size, chromosome number, total GC content, gene count, protein-coding genes, small non-coding RNAs (SncRNA), pseudogenes, and microsatellite sequences, in two rapidly growing poplar and eucalypt species. Additionally, we construct a corresponding Venn diagram to illustrate the findings. Also, the sequences of microsatellites with MISA software in Perl and the sequences related to tandem duplication on the genomes were extracted. Also, the number of terpene synthase gene family genes in two species was compared. Finally, genes related to two important traits of interest to breeders, including wood formation and cell wall quality traits, were studied.
Results: The results reveal that the eucalypt genome is larger than that of poplar, containing 42,619 genes, including 33,352 protein-encoding genes. The poplar genome, on the other hand, consists of 34,621 genes, with 29,617 being protein-coding. Moreover, the number of pseudogenes in the eucalypt genome is 2.9 times higher than that in poplar. The number of eucalyptus chromosomes is 11 and the number of poplar chromosomes is 19. The number of small RNAs for eucalyptus and poplar genomes were 1507 and 1347, respectively. According to the genome annotation information available on NCBI site, some genes were found only in Eucalyptus and some genes were found only in poplar. According to the Venn diagram, 14,484 unique genes for Eucalyptus and 12,114 genes specific to poplar were identified. 9133 genes were shared between the two species. The total number of microsatellite markers identified on the eucalyptus genome was 136,147 and for the poplar genome was 77,024. The results showed that the genomes of eucalyptus and poplar are composed of 3.8 Mb and 10.2 Mb of microsatellite sequences, respectively. Interestingly, the eucalypt genome exhibits 1.8 times more microsatellite markers and a 1.2 times greater marker density (Total microsatellite sizes in kilobases divided by genome size in megabases or kb/Mb) compared to the poplar genome. It should be noted that 4067 types of motifs were identified in the eucalyptus genome and 2898 types of motifs were identified in the poplar genome. We observed an inverse relationship between the frequency of microsatellites and the number of nucleotides among the genomic sequences of the studied species. So, with the increase in the frequency of microsatellites, a significant decrease in the number of nucleotides has been observed. Based on this, single and two nucleotide microsatellites had the highest frequency, while eight and nine nucleotide microsatellites had the lowest frequency. The results of the evaluation regarding the difference in the presence of the terpene synthase gene family in the two studied species also indicated that 112 genes were identified in eucalyptus and 7 genes were identified in poplar. The number of clusters has been identified as 3185 in Eucalyptus species and 2575 in poplar species. The total number of retained tandem genes in the eucalypt genome was 16 % more than that of the poplar genome. Additionally, the number of functional and non-functional genes in eucalypt surpasses that of poplar. The valuable insights obtained from such comparative genomics studies have the potential to facilitate plant breeding and conservation genetic efforts. The alternative splicing event has occurred in a large number of genes related to wood formation trait in the two studied trees with different patterns. A total of 59 candidate genes for cell wall quality trait were identified for poplar and eucalyptus.
Conclusion: Comparative genomics can speed up the breeding program of tree species by providing diverse alleles related to important economic and ecological traits and also help to preserve endangered and genetically distinct species.

کلیدواژه‌ها [English]

  • Genome evolution
  • Genome size
  • Microsatellite
  • Whole genome sequencing