自分と他人との違いは何によって決まっているのでしょうか?
世の中には全く同じ顔の人はいないし、一卵性双生児であっても全く同じ顔・身長・体重..etc.になるわけではありません。
この個人と個人の違いを生み出してい流のが、ヒトの全ゲノム(30億塩基対)のうちの0.1%の違いだと言われています。
特に、一塩基だけ置き換わったもの(SNPs:スニップ)が病気へのかかりやすさなどに関連していることがわかってきて、病気とSNPsの関係を解析する手法が生み出されました。
今回は、このSNPsと病気の関連を解析する「ゲノム関連解析(GWAS)」について簡単にまとめていきます。
SNPsについてはこちらの記事をご覧ください
ゲノムワイド関連解析(GWAS)とは?
ゲノムワイド関連解析はgenome-wide association studyを略してGWASと呼ばれます。
ゲノム全体のSNPs(一塩基多型)の遺伝子型を決定し、SNPsの頻度や病気との関連を遺伝統計学的に解析する手法のことです。
要は、一塩基の変異と表現型に関連があるかどうか?網羅的に解析してみるということ。
このことからも、かなりのデータ量を扱うことが想像できますね。
GWASを使ってわかること
世界で初めてGWASを使った報告がされたのは2002年。
理化学研究所が心筋梗塞を対象とした世界中数十万〜数百万という膨大な量のデータ解析を行い、この報告によって、心筋梗塞の形質と関連するSNPが見出されました。
この膨大なデータの取得を可能にしたのは、全ゲノム解析の低コスト化です。
この2002年の報告を皮切りに、2005年ごろからGWASを使った報告が増えてきました。
世界中でGWASを使ったSNPsの解析が増えてきたことで、SNPsのデータを統合する国際共同研究や、サンプル収取を目的としたバイオバンクなどが設立されました。
GWASで解析された結果は、GWAS catalogサイトで世界中で公開・共有が進んでいます。
この世界的な共有は、まだ研究されていない病気との新たな関連の発見につながると期待されています。
「データの共有」は2000年代の科学的なトレンドになってきています。
GWASのデータの見方
GWASはSNPの頻度と疾患や表現型との関連を解析する手法でした。
どのSNPが疾患の表現型と関連しているかの絞り込みは、連鎖不平衡(linkage disequilibrium: LD)によって行われます。
連鎖不平衡とは?
対立遺伝子が親から子へ引き継がれる時には、通常はメンデルの法則に従います。減数分裂の時に、染色体はランダムに分配されるので別々の染色体上にある場合は(メンデルの)独立の法則が成り立ちます。
しかし、2つの同じ染色体の非常に近い場所にある場合(連鎖している場合)は独立の法則が成り立たないことがわかってきたのです。(高校の生物でやった記憶がある方が多いかと思います)
連鎖不平衡とは、ある生物集団において遺伝子Aと遺伝子多型Xの組み合わせ(ハプロタイプ)が有意に高くなる現象のことを指します。(例えで「多型」にしています)
一般的に、連鎖不平衡が起こるということは遺伝子Aと遺伝子多型Xが連鎖していると考えられます。
が、連鎖していても連鎖不平衡が起こらない場合や連鎖していないくても連鎖不平衡が起こる場合も稀にあるようです。
連鎖不平衡のp値の計算の概要
連鎖不平衡が有意に起こっているかどうかの、効果量・関連度は「オッズ比」で計算されます。
有意に関連があるかどうかの有意性の検定は、カイ二乗検定で計算します。
オッズ比が同じであっても、サンプル数が多いほど検出力が大きくなり、p値は小さくなります。
検定力が大きくなりすぎると、検定の過誤を起こしやすくなってしまいます。
通常の検定では、有意水準は0.05に設定されますが、サンプル数の影響を抑えるためにGWAS解析の場合は有意水準は5×10^(-8)に設定されているのです。
カイ二乗検定に関してはこちらにまとめています。
GWAS解析のデータの見方
一般的にGWAS解析されたデータはマンハッタン・プロットという手法を用いて図示されます。
マンハッタンプロットは、ドットがY軸方向に高いほど疾患との関連が高いことを示しています。
X軸は、ゲノム上の位置を示しているので染色体のどの位置と疾患が関連しているかを可視化できるのです。
連鎖不平衡が起こると、SNPと疾患の表現型の関連は予想できますが間接的な関連しか示せないので、より詳細な解析が必要となります。
ゲノムワイド関連解析(GWAS)とは? まとめ
最後に「ゲノムワイド関連解析(GWAS)」についてまとめていきましょう。
- GWASとはSNPsと疾患の表現型との関連を解析する手法
- GWASで解析した結果は世界中で共有する動きがある
- GWASの結果はマンハッタンプロットで示されることが多い