系統解析・とは?初心者でもわかる基礎と身近な例共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
系統解析・とは?初心者でもわかる基礎と身近な例共起語・同意語・対義語も併せて解説!
この記事を書いた人

岡田 康介

名前:岡田 康介(おかだ こうすけ) ニックネーム:コウ、または「こうちゃん」 年齢:28歳 性別:男性 職業:ブロガー(SEOやライフスタイル系を中心に活動) 居住地:東京都(都心のワンルームマンション) 出身地:千葉県船橋市 身長:175cm 血液型:O型 誕生日:1997年4月3日 趣味:カフェ巡り、写真撮影、ランニング、読書(自己啓発やエッセイ)、映画鑑賞、ガジェット収集 性格:ポジティブでフランク、人見知りはしないタイプ。好奇心旺盛で新しいものにすぐ飛びつく性格。計画性がある一方で、思いついたらすぐ行動するフットワークの軽さもある。 1日(平日)のタイムスケジュール 7:00 起床:軽くストレッチして朝のニュースをチェック。ブラックコーヒーで目を覚ます。 7:30 朝ラン:近所の公園を30分ほどランニング。頭をリセットして新しいアイデアを考える時間。 8:30 朝食&SNSチェック:トーストやヨーグルトを食べながら、TwitterやInstagramでトレンドを確認。 9:30 ブログ執筆スタート:カフェに移動してノートPCで記事を書いたり、リサーチを進める。 12:30 昼食:お気に入りのカフェや定食屋でランチ。食事をしながら読書やネタ探し。 14:00 取材・撮影・リサーチ:街歩きをしながら写真を撮ったり、新しいお店を開拓してネタにする。 16:00 執筆&編集作業:帰宅して集中モードで記事を仕上げ、SEOチェックやアイキャッチ作成も行う。 19:00 夕食:自炊か外食。たまに友人と飲みに行って情報交換。 21:00 ブログのアクセス解析・改善点チェック:Googleアナリティクスやサーチコンソールを見て数字を分析。 22:00 映画鑑賞や趣味の時間:Amazonプライムで映画やドラマを楽しむ。 24:00 就寝:明日のアイデアをメモしてから眠りにつく。


系統解析・とは?

系統解析とは、生物同士の進化の関係を調べ、祖先がどのように分岐して現在の生物が生まれたかを推定する学問です。結果として現れるのが、系統樹と呼ばれる木の形の図です。系統樹では枝の分かれ方が、祖先から子孫への道筋を示します。

系統解析は難しそうに見えますが、基本は「データを集めて、それをどう並べると進化の道筋が最も自然か」を探す作業です。データとしては主に二つの種類があります。遺伝情報(DNAやRNA、タンパク質配列)形態的特徴(形の違い、色、サイズなど)です。遺伝情報は分子レベルの違いを比べるのに適しており、形態的特徴は古くから使われてきました。

データの種類

DNA配列のデータは、文字列のようにA、C、G、Tの並びとして表現されます。異なる生物どうしの差を数えることで「似ている・違う」という判断材料になります。形態的特徴は、体の色、形、器官の有無など、観察できる特徴を使います。どちらのデータを使うかは研究の目的や手元のデータの量で決まります。

代表的な推定方法

系統解析ではいくつかの方法で木を推定します。近傍法(Neighbor-Joining)は計算が速く、初期の推定に向いています。最尤法(Maximum Likelihood)は、データに最もよく合う木を選ぶ方法で、解析がやや難しく計算が重いことがあります。ベイズ推定(Bayesian Inference)は、事前情報を取り入れて確率的に木を推定します。最頻度法(Maximum Parsimony)は、分岐数を最小に抑える木を探します。これらの方法は長所と短所があり、データの性質によって使い分けます。

分析の流れ(基本的な手順)

1) データを集める。DNA配列や形態的特徴準備します。

2) データを整列させる。配列の場合は整列(アラインメント)を行い、比較できる状態にします。

3) 木の推定方法を選ぶ。データと目的に合わせて、近傍最尤法ベイズ推定などを選択します。

4) 木を描く。推定結果として系統樹が得られます。分岐の位置は、生物同士の共通点の多さに基づいて決まります。

5) 信頼性を評価する。ブートストラップという方法で、木の各枝の信頼性を確かめます。値が高い枝ほど信頼性が高いと判断します。

例え話でイメージをつかもう

身近な例として、3つの鳥のグループを考えます。オスの羽の色が黒い、白い、そして茶色いとします。 DNAは違っても、羽の色の違いという「形の違い」だけを使って木を作るとします。近傍法なら、似た特徴を持つグループがすぐに近い枝としてつながります。最尤法やベイズ推定を使えば、データ全体を見たときに「どの組み合わせが最も確からしいか」を確率として表せます。

なぜ系統解析は重要か

医療生態系の保全、新種の発見、薬の開発などに役立ちます。病気の原因となる病原体の進化を追うと、感染の拡がり方や薬剤耐性の動きを理解しやすくなります。農業では作物の祖先を特定して、耐性のある品種を作る手掛かりにします。

便利な表:主要な推定方法のまとめ

able> 方法 特徴 近傍法 計算が速い。初期の推定に適する。 最尤法 データに最も適合する木を探す。計算量が多いことがある。 ベイズ推定 事前情報を取り入れ、確率的に推定。結果に分布がつく。 最頻度法 分岐数を最小化する木を選ぶ。 ble>

重要ポイントのまとめ

系統解析は「進化の道筋を読み解くための分析」であり、データの種類・分析方法・信頼性評価の3つが基本です。初心者は、まずデータの種類と木の意味を理解し、次に推定方法の違いを知って、最後に信頼性の評価方法を学ぶとよいでしょう。


系統解析の同意語

系統推定
生物種間の進化関係を推定する作業。DNAデータや形態データなどを用いて、最適な系統樹を導くことを指します。
系統樹推定
系統樹を推定する具体的な作業。祖先と分岐の関係を木構造として表現することを含みます。
系統樹構築
系統樹を構築すること。データに基づき最適な系統樹を作成する過程を指します。
系統樹解析
系統樹を用いた解析。系統関係の信頼性評価や分岐時刻の推定、進化パターンの解釈などを含みます。
系統学的解析
系統学の枠組みでデータを解析する手法全般。種間の関係・共通祖先・形質の進化の解明を目指します。
クラド分析
クラドに基づく分析。共通祖先の分岐を重視して系統関係を推定・解釈する方法です。
進化系統解析
進化史に基づく系統関係の解析。DNAデータや形質データを用い、系統樹や分岐パターンを明らかにします。
分岐推定
生物群の分岐パターンを推定すること。系統樹の分岐関係を解明する作業の一部です。

系統解析の対義語・反対語

非系統解析
系統関係の推定を目的としない、別の目的のための解析。データを扱うが系統関係推定を最優先しない。
形態学的分類
生物の形態や構造といった形態情報を基準に分類する方法。進化系統の推定を前提としないことが多い。
古典分類学
遺伝データを使わず、観察・解剖・形態を中心に分類する従来の学問。
種の記述・命名
新種の命名と説明に焦点を当て、系統推定を必須としないことが多い。
分子データ不使用の分類
DNAなどの遺伝子データを使わずに分類を行うアプローチ。
形質比較中心
複数の形質を比較して差異を整理する方法で、系統関係の推定を主眼としない。
系統推定を伴わない研究
系統樹作成を目的としない研究全般を指す言い換え。
分類学(Taxonomy)
生物を名前と階級で整理する学問。系統分析とは別の目的を持つこともある。
表現型ベースの分類
見た目や機能などの表現型情報を用いて分類する方法。遺伝的関係の推定を必須としないことが多い。

系統解析の共起語

系統樹
系統解析の結果として得られる、種や遺伝子の進化的な関係を木の形で表した図・データ構造。
分岐
進化の過程で生物が分かれて別種になる点を指す概念。
演化
生物が時間とともに形質を変化させていく過程。
分子系統樹
DNAやタンパク質の配列データから推定された系統関係を示す樹。
DNA配列
DNAの核酸配列。遺伝情報の基本データ。
タンパク質配列
タンパク質を構成するアミノ酸の並び順。
配列データ
遺伝子・タンパク質の配列データ全般。
遺伝子
生物の形質を決める設計情報の単位となる遺伝子。
遺伝子配列
遺伝子を構成するDNAの並び順。
遺伝距離
2つの配列の違いの程度を示す指標
アライメント
複数の配列の同一部を揃えて比較できるように並べる作業。
多重配列アライメント
複数のDNA/タンパク質配列を同時に整列させる作業。
置換モデル
配列の変化を数理的に表すルール。
演化モデル
進化のプロセスを表す数学的なモデル。
最大尤度法
与えられたデータが出る確率を最大化する推定法。
最尤推定
最大尤度法と同義
ベイズ推定
事前情報とデータを組み合わせて確率分布を推定する方法。
MCMC
ベイズ推定でサンプルを得るための乱択法。
マルコフ連鎖モンテカルロ
MCMCの正式名称。
分子時計
分子の変化速度を用いて時間を推定する概念。
分子時計仮説
分子変化が一定速度で進むという仮説。
分枝長
各分岐の進化量・時間を示す長さ
根付き木
根がある、祖先を起点とする系統樹。
無根木
根がない、相対関係だけを示す樹。
クレード
共通の祖先を共有する生物の集まり。
ブートストラップ
データを再サンプリングして権限性を評価する手法。
ブートストラップ値
分岐の信頼度を示す値(例: パーセント)。
支持値
分岐の信頼性を示す統計的指標の総称。
系統解析ソフト
系統推定を行うためのソフトウェア群。
MEGA
初心者にも使いやすい系統解析ソフトの一つ。
IQ-TREE
高速で高精度な系統推定ソフト。
RAxML
大規模データ向けの最大尤度系統推定ソフト。
MrBayes
ベイズ推定を用いた系統解析ソフト。
BEAST
ベイズ推定を用いて分子時計推定もできるソフト。
BEAST2
BEASTの後継バージョン
PHYML
最大尤度推定を行う系統解析ソフト。
GARLI
最大尤然度法に基づく系統推定ソフト。
外群
系統樹を根付けする基準となる外部のグループ。
祖先状態再構成
祖先の特徴を推定する分析。
祖先状態推定
祖先の遺伝子状態などを推定する作業。
分岐年代
分岐が起きたと推定される年代。
分岐年代推定
データから分岐年代を推定する分析。
モデル選択
どの進化モデルを使うか選ぶこと。
アライメント品質
アライメントの精度・適合性を評価する観点。
データ前処理
分析前にデータを整え・クリーニングする作業。

系統解析の関連用語

系統解析
生物の進化の歴史や種間の関係を推定する手法の総称。DNAやタンパク質配列などのデータを使って系統樹を作成・解釈します。
系統樹
遺伝的関係を木の形で表した図。分岐点は共通祖先を示し、種間の進化の道筋を視覚化します。根付き樹と無根樹があることが多いです。
系統発生
生物の進化の歴史そのもの、種や群の起源と分岐の順序を指す概念です。
分岐
祖先が分かれて新しい系統が生じる進化的イベントのことです。
分岐点
系統樹上のノード。共通祖先を表す点です。
同源特徴
異なる種で共通の起源を持つ形質。系統解析の情報源になります。
単系統群
ある共通祖先とその全ての子孫を含むグループ。系統学で“単系統性”を評価する際の基本概念です。
不全系統群
共通祖先を持つが一部の子孫を含まないグループ。
多系統群
共通祖先を含まない、複数の系統由来の形質で構成されるグループ。
収斂進化
異なる系統で似た形質が独立に発生する現象。
平行進化
同じ系統内で似た特徴が独立して進化する現象。
ホモロジー
同源性。共通祖先由来の形質のこと。
ホモプラジー
収斂・平行進化によって生じた類似性。祖先には見られないことが多い。
アウトグループ
系統樹の根付けに用いる、比較対象として外部に置かれるグループ。
根付き樹
祖先を起点として分岐を表す系統樹。
無根樹
根が定まっていない系統樹。
配列アラインメント
複数の配列を同一の相同性仮定の下で整列させる作業。MSAとも呼ばれます。
多重配列整列(MSA)
複数の遺伝子配列を一度に整列させ、相同性を揃える処理。
分子データ
DNA・RNA・タンパク質配列など、進化関係を推定する主なデータ。
オルソログ
種間で分岐した遺伝子が同じ機能を保つ相同遺伝子。
パラログ
同一生物内で遺伝子が複製され、別の機能を持つようになった遺伝子。
置換モデル
配列中の塩基やアミノ酸の置換の確率を表す統計モデル。例として Jukes-Cantor、Kimura 2パラメータ、GTR など。
Jukes-Cantorモデル
すべての置換が等確率で起こる単純な置換モデル。
Kimura 2パラメータモデル
遷移とトランジションの置換確率を別々に扱うモデル。
GTRモデル
General Time Reversible。複数の置換パラメータを使う実用的なモデル。
分子時計
変異速度をほぼ一定と仮定して分岐年代を推定する考え方・道具。
分岐年代推定
系統樹の分岐の年代を推定する手法全般。
最大尤推定法
データが観測される確率を最大にする系統樹とパラメータを推定する方法。
最小変化法
生じた変化の総数を最小化する原理に基づく系統樹推定法(Parsimony)。
距離法
遺伝的距離に基づいて系統樹を構築する方法。
Neighbor-Joining
距離法の代表的アルゴリズム。高速で実用的。
UPGMA
距離法の一つ。分岐長を等分布の仮定で推定する。
ブートストラップ値
系統樹のノードの信頼性をデータ再サンプリングで評価する指標。
事後確率
Bayesian 推定で得られるノードの信頼度を表す確率値。
ベイズ推定
事前情報とデータから系統樹を推定する統計的方法。
情報量規準
モデルの適合と複雑さのバランスを評価する指標(AIC、BIC など)。
AIC
赤池情報量規準。モデルの情報損失を推定して最適モデルを選ぶ指標。
BIC
ベイズ情報量規準。サンプルサイズを考慮してモデル選択を行う指標。
クラドグラム
分岐関係のみを示す樹形図。分岐長を重視しないことが多い表現。
系統解析ソフトウェア
分析を実行するツール群。例: BEAST、RAxML、MrBayes、IQ-TREE、MEGA、PAUP*、PhyML。
全ゲノム系統解析
全ゲノムデータを用いた系統推定。コア遺伝子やSNPを活用する手法。
アウトグループ分析
根を安定にするため、外部グループを含めた分析を行う作業。
遺伝子ツリーと種ツリー
遺伝子レベルの系統と生物種全体の系統が必ずしも一致しない現象を扱う概念。

系統解析のおすすめ参考サイト


学問の人気記事

十進数・とは?初心者でも分かる基本のしくみと使い方共起語・同意語・対義語も併せて解説!
585viws
データ標準化とは?初心者にもわかる基礎と実務での活用法共起語・同意語・対義語も併せて解説!
573viws
閾値(閾値)・とは?初心者向けにわかりやすく解説する基本ガイド共起語・同意語・対義語も併せて解説!
349viws
t値・とは?を徹底解説!初心者に優しい統計入門ガイド共起語・同意語・対義語も併せて解説!
260viws
慰安婦問題とは?初心者でも分かる歴史と現在をやさしく解説共起語・同意語・対義語も併せて解説!
242viws
シオニズムとは?基礎知識からよくある誤解まで徹底解説共起語・同意語・対義語も併せて解説!
237viws
シールリング・とは?を徹底解説!中学生にも分かる入門ガイド共起語・同意語・対義語も併せて解説!
227viws
点火源・とは?初心者にもわかる基本と日常の事例共起語・同意語・対義語も併せて解説!
218viws
平安京遷都とは?日本の都が移された理由をやさしく解説共起語・同意語・対義語も併せて解説!
200viws
静電容量方式とは?初心者向けの仕組みと使い方を徹底解説共起語・同意語・対義語も併せて解説!
192viws
誇示とは?意味・使い方・例文を徹底解説して分かりやすく理解する共起語・同意語・対義語も併せて解説!
192viws
回旋運動・とは?回転の基本と身近な例をやさしく解説共起語・同意語・対義語も併せて解説!
172viws
光触媒とは?初心者にも分かる基本の仕組みと生活での活用術共起語・同意語・対義語も併せて解説!
152viws
トゥルー・とは?真実の意味と使われ方をわかりやすく解説共起語・同意語・対義語も併せて解説!
148viws
電気伝導性とは?初心者にもわかる基本と身近な例共起語・同意語・対義語も併せて解説!
147viws
メガシティ・とは?初心者でもわかる現代都市の仕組み解説共起語・同意語・対義語も併せて解説!
145viws
慣例的・とは?初心者にもわかる解説と使い方共起語・同意語・対義語も併せて解説!
140viws
空隙率・とは?初心者が押さえる基礎と日常の理解ポイント共起語・同意語・対義語も併せて解説!
137viws
論旨・とは?初心者でも分かる論旨の意味と使い方ガイド共起語・同意語・対義語も併せて解説!
133viws
プレシジョンとは?初心者が知るべき正確さの基本と日常・仕事での活用法共起語・同意語・対義語も併せて解説!
131viws

新着記事

学問の関連記事