Thesis or Dissertation Amulti-gene phylogenetic analysis of Drosophila species by next generation sequencing technology

Iwasaki, Yuma

pp.1 - 100 , 2015-03-25
There are as many species as 1,193 in the genus Drosophila including 717 species in the subgenus Drosophila and 348 species in the subgenus Sophophora. In the genus Drosophila, whole genome sequences were determined for 12 species including D.melanogaster, a model organism. In these species, three species belong to the subgenus Drosophila and nine species including D.melanogaster belong to the subgenus Sophophora. The phylogenetic relationships among species in the subgenus Sophophora have been well studied but those in the subgenus Drosophila have not been so. The D.quinaria section, one of two major sections in the subgenus Drosophila, consists of many species but genome sequence has not been determined for any species. Phylogenetic analyses of the D.quinaria section have been based on only a small number of genes including mitochondrial genes. Therefore, I focused on the D.quinaria section and studied the phylogenetic relationships among the species in this section using a large number of orthologous nuclear genes. In this study, I performed transcriptome cDNA sequence analyses for nine species (D.funebris, D.angularis, D.orientacea, D.sternopleuralis, D.tripunctata, D. albomicans, D.bizonata, D.guarani, and D.cardini)in the D.quinaria section. I determined cDNA sequences of approximately 1,000-3,000 genes for each species by the RNA-seq method using a Roche 454 GS Junior sequencer to conduct a large scale phylogenetic analysis. In those genes, I identified 300-1,000 orthologous genes in each species searching the 12 genome sequence database. Finally, I analyzed the phylogeny based on 161 orthologous genes shared by all the species used. The result showed that three New World species (D.tripunctata, D.guarani, D.cardini) were clustered as a monophyletic clade and the species groups in the D.quinaria section diverged during the period of 10 to 31 MYA. However, the positons of the New World species and D.funebris were inconsistent between DNA and protein datasets with high bootstrap values and Bayesian posterior probabilities, indicating the need of further improvement of theoretical methods for phylogenetic analyses with a big sequence dataset.
ショウジョウバエ属は1,193種が記載され多様性に富むが、その中でもショウジョウバエ亜属717種、シマショウジョウバエ亜属348種が多数を占める。ショウジョウバエ属の系統解析は、モデル生物であるキイロショウジョウバエ(Drosophila melanogaster)を中心に12種で全ゲノム配列が決定されており、これらをもとに進められている。12種中9種がキイロショウジョウバエを含むシマショウジョウバエ亜属に含まれ、ショウジョウバエ亜属は多くの種を抱えるにも関わらず十分になされていのが現状である。特にD.quinaria sectionにはショウジョウバエ亜属の半数近い種が属すが、全ゲノム配列が決定された種が存在しない。更に先行研究においては、ミトコンドリア遺伝子などの数遺伝子座のみを用いた系統解析しか行われておらず、その信頼性は低い。そこで本研究ではD.quinaria sectionに着目し、核ゲノム由来の単一コピー遺伝子を多数用いた解析を行うことを目的とした。本研究ではD.quinaria sectionから、代表的な種群を形成する9種(D.funebris, D.angulalis, D.orientacea, D.sternopleuralis, D.tripunctata, D. albomicans, D.bizonata, D.guarani, D.cardini)を対象にトランスクリプトーム解析を行った。遺伝子情報の少なさをカバーするため、次世代シーケンサー(Roche454 GS junior)を用いて成虫のRNA-seqを行い、1種につき3,000遺伝子座程度のcDNA配列を決定した。得られた配列データについては、ショウジョウバエ12種の全ゲノムデータを基にデータベース検索を行い、1種につき核由来オーソログ遺伝子を600遺伝子座程度同定した。それらの中から、全種で共有する161遺伝子座を用いて系統解析を行ったところ、新大陸産のショウジョウバエ(D.tripunctata, D.guarani, D.cardini)は単系統群になることがわかった。また、D.quinaria sectionの種群は1,000~3,100万年前に分岐した可能性が高いことがわかった。しかし、DNAを用いた解析とアミノ酸を用いた解析では、樹形肉での新大陸産のショウジョウバエの位置が若干異なり、どちらも高いブートストラップ値とベイズ法の事後確率を示した。大規模なデータセットによる解析であっても方法によって樹形が変化する可能性が示され、大規模データ解析のための理論的解析法の必要性が示唆された。

