人気ブログランキング | 話題のタグを見る

CLC Sequence Viewerで分子系統樹を作る.

今日は超動物マニア向けのネタ.
そして,長文.

動物マニアにありがちな疑問として,狼と犬はどれ位近い種なんだろうかとか,
オカピとキリンはマジで近いのか?とか,ゴリラとチンパンジーとオランウータンの中で人間に近いのはどっちなのか?
とか,そんなことに思いをはせることが結構有るかと思います(俺だけか?).
そんな疑問をサクッと解決してくれるのがこれ.

CLC Sequence Viewer
http://www.clcbio.com/index.php?id=962

どんなソフトかというと,DNA配列データの検索,収集,編集,制限酵素切断部位の表示,マルチプルアラインメント作成,分子系統樹作成など,
この一本でいろんなことが出来ます.しかもフリー(w
なかなか使いやすいUIなので,ほぼド素人の私でも何とか使えます.

では,早速ですがこのソフトを利用した超適当(素人故の思い込み,間違いはご指摘ください)な分子系統樹の作成方法について説明します.

大まかな流れとしては,
1.GenBank検索
2.DNA配列の収集
3.目的領域の切り出し
4.マルチプルアラインメント
5.分子系統樹作成
といった感じの流れになります.
さて,いきなりですが言葉の意味が分からないという方はググって事前学習してください(w

今回の例ではクマ軍団の分子系統樹を作ってみます.
まずは上記サイトよりソフトをダウンロードしてインストールします.
で,起動した後,「Ctrlキー+B」を押すとGenBankの検索画面が開きます.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20265547.jpg

上図の例ではクマ軍団の中のホッキョクグマの配列データの引っ張り方が示してあります.
検索ウインドのAll Fieldsにホッキョクグマの学名「Ursus maritimus」とミトコンドリア「mitochondrion」を入れ,
次に,「Add search parameters」ボタンを押して,検索ウインドウを追加し,
ウインドウの左側のプルダウンメニューで「Sequence Length>=」を選択した後「16000」と入力しています.
尚,動物の学名は日本語でググレばたいてい出てきます.学名でなくても慣用名でもたぶん大丈夫です(当然,日本語は不可).
検索ワードにmitochondrionを入れたのは多くの種でミトコンドリア全長配列が登録されている事が多いからです.
検索配列長を16000以上としたのは哺乳類のミトコンドリアの全配列長が16000-17000bp付近であるためです.

Start Searchボタンを押してしばらく待つと,下側に検索結果がリストアップされます.
アクセッションNo.NC_003428が表示され,ホッキョクグマのミトコンドリアの全長配列であることがDescriptionに表示されています.
NC_から始まるアクセッションNo.はGenBankのリファレンス配列(RefSeq)でそれなりに信用が置けますのこれを選択して,
左側のカラムにドラックすることで配列データが保存されます.
他種の配列データについてもRefSeqのもの(NC_等)を集めたほうが良いでしょう.
今回は左側のカラムに「熊」フォルダを作成して,そこに配列データを保存しました.

次に保存した配列データをダブルクリックで開き,ウインド左下側にある赤丸ボタンを押すと,本来のミトコンドリアDNAの形である環状で表示されます.
別に線形でも良いのですがこちらの方が見通しが良くなります.
今回の例では各クマのミトコンドリアのサイトクロムb(CYTB)領域を集めて系統樹を作ります.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20272068.jpg


次に環状に表示させた配列データのCYTBと表示された部分を右クリックし,「Open Annotation in New View」を選択します.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20274783.jpg


すると,下側のウインドウにホッキョクグマのミトコンドリア中のCYTB領域のみが切り出された状態で表示されます.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20275758.jpg

この状態で切り出されたウインドウのタブを左カラムのフォルダにドラックすることで保存できます.
以上の操作を各クマ種で繰り返し行い,各クマのCYTB配列をかき集めます.
尚,上記のGenBank検索でミトコンドリア完全長の配列データが見つからない場合でも,
「mitochondrion」の代わりに「cytb complete」等を検索ワードに入れれば,
CYTB領域のみの完全長で引っかかる場合もありますので,あきらめずにがんばりましょう.

今回の例ではアメリカグマ,ホッキョクグマ,ジャイアントパンダ,メガネグマ,マレーグマ,ヒグマ,ツキノワグマ,レッサーパンダ,アライグマの
CYTB配列で分子系統樹を作成します.
尚,かき集める領域は種間で同じであれば別にどこでも構いません.
ただし,選択した領域によって,微妙に系統樹が変わります.
また,DNA配列ではなくアミノ酸配列に変換したものでもOKです(このソフトで出来ますが詳細は省きます).
種の範囲が広くなる場合はアミノ酸配列のほうが良いかもしれません.
また,極近い種で比較する場合はD-loop領域などの特異性が高い配列を利用するのが良いと思います.

次に,かき集めたCYTB配列のマルチプルアラインメントを作成します.
手順としては保存したCYTB配列を複数選して,右クリック→Toolbox→Alignments and Trees→Create Alignmentを選択します.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20281619.jpg


すると,次のダイアログボックスが表示されますのでNextを何回か押して最後にfinishを押します.
尚,アラインメント速度は正確なslowが良いと思います.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20282965.jpg


しばらくするとマルチプルアラインメントが終わります.配列が長くなったり,種類が多いと糞遅くなります.そのときは茶でも飲みながら待ちましょう.
例によって,ウインドウのタブを左のカラムにドラッグすることでマルチプルアラインメント結果を保存できます.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20284181.jpg


次はいよいよマルチプルアラインメントから分子系統樹を作成します.
保存したマルチプルアラインメントを右クリック→Toolbox→Alignments and Trees→Create Treeを選択します.
CLC Sequence Viewerで分子系統樹を作る._e0060169_20285490.jpg

すると,例によってダイアログボックスが出てきますので,Nextを連打してFinishを押します.
尚,アルゴリズムはNJでもUPGMAでも好きなほうを選んでください.
残念ながら最近流行のMCMCはありません.
CLC Sequence Viewerで分子系統樹を作る._e0060169_2029713.jpg


と,言うわけで,ようやく分子系統樹が完成しました!
CLC Sequence Viewerで分子系統樹を作る._e0060169_20291684.jpg

なんか,いまいちですが,まぁ,こんなもんでしょう(w
もう少しいろんな種を入れ込むときれいに分かれると思います.
ヒグマとホッキョクグマはcytb配列で比較すると殆ど同じ種と考えられますね.
人間でたとえれば,アフリカのクロンボと北欧のシロンボくらいの違いなのかもしれません.
実際,自然界にはヒグマとシロクマのハイブリットが存在しているらしいです.
暇で動物マニアの方は色々と試してみると新発見があって面白いと思いますよ.

尚,全然サクッとじゃねーよボケ!とか思われるかもしれませんが,
私は無料でここまで簡単に出来る(効率は悪いが)ソフトを他に知りません.知っている超々マニアの方がいましたら教えてください.
普通のソフトはアラインメントならアラインメントだけって感じでもっと面倒くさいのです.
ここまで,読んで試してみようと持ってみた人は一人いるかいないかと見ました(w

by bizen_yoshikage | 2008-10-30 20:29 | 色々…

<< 天王寺動物園589 スマートフォン祭り >>