タグ:系統樹 ( 2 ) タグの人気記事

CLC Sequence Viewerその後.

さてと,先週のネタの続きです.
多分,誰も試していない気がするので,自分でトライしてみた系統樹を貼ってみます.
e0060169_2234158.jpg
(クリックで大きくなります)
かなりブートストラップ値の怪しい箇所がありますが,気にしないでください(w
先週は交絡気味だった軍団クマも,概ね納得のいく分岐じゃないでしょうか?
しかし,軍団ラクダ-カバ,ウマ-サイ,軍団クジラ-軍団ウシの近さは納得がいきませんね(w
[PR]

by bizen_yoshikage | 2008-11-07 22:34

CLC Sequence Viewerで分子系統樹を作る.

今日は超動物マニア向けのネタ.
そして,長文.

動物マニアにありがちな疑問として,狼と犬はどれ位近い種なんだろうかとか,
オカピとキリンはマジで近いのか?とか,ゴリラとチンパンジーとオランウータンの中で人間に近いのはどっちなのか?
とか,そんなことに思いをはせることが結構有るかと思います(俺だけか?).
そんな疑問をサクッと解決してくれるのがこれ.

CLC Sequence Viewer
http://www.clcbio.com/index.php?id=962

どんなソフトかというと,DNA配列データの検索,収集,編集,制限酵素切断部位の表示,マルチプルアラインメント作成,分子系統樹作成など,
この一本でいろんなことが出来ます.しかもフリー(w
なかなか使いやすいUIなので,ほぼド素人の私でも何とか使えます.

では,早速ですがこのソフトを利用した超適当(素人故の思い込み,間違いはご指摘ください)な分子系統樹の作成方法について説明します.

大まかな流れとしては,
1.GenBank検索
2.DNA配列の収集
3.目的領域の切り出し
4.マルチプルアラインメント
5.分子系統樹作成
といった感じの流れになります.
さて,いきなりですが言葉の意味が分からないという方はググって事前学習してください(w

今回の例ではクマ軍団の分子系統樹を作ってみます.
まずは上記サイトよりソフトをダウンロードしてインストールします.
で,起動した後,「Ctrlキー+B」を押すとGenBankの検索画面が開きます.
e0060169_20265547.jpg

上図の例ではクマ軍団の中のホッキョクグマの配列データの引っ張り方が示してあります.
検索ウインドのAll Fieldsにホッキョクグマの学名「Ursus maritimus」とミトコンドリア「mitochondrion」を入れ,
次に,「Add search parameters」ボタンを押して,検索ウインドウを追加し,
ウインドウの左側のプルダウンメニューで「Sequence Length>=」を選択した後「16000」と入力しています.
尚,動物の学名は日本語でググレばたいてい出てきます.学名でなくても慣用名でもたぶん大丈夫です(当然,日本語は不可).
検索ワードにmitochondrionを入れたのは多くの種でミトコンドリア全長配列が登録されている事が多いからです.
検索配列長を16000以上としたのは哺乳類のミトコンドリアの全配列長が16000-17000bp付近であるためです.

Start Searchボタンを押してしばらく待つと,下側に検索結果がリストアップされます.
アクセッションNo.NC_003428が表示され,ホッキョクグマのミトコンドリアの全長配列であることがDescriptionに表示されています.
NC_から始まるアクセッションNo.はGenBankのリファレンス配列(RefSeq)でそれなりに信用が置けますのこれを選択して,
左側のカラムにドラックすることで配列データが保存されます.
他種の配列データについてもRefSeqのもの(NC_等)を集めたほうが良いでしょう.
今回は左側のカラムに「熊」フォルダを作成して,そこに配列データを保存しました.

次に保存した配列データをダブルクリックで開き,ウインド左下側にある赤丸ボタンを押すと,本来のミトコンドリアDNAの形である環状で表示されます.
別に線形でも良いのですがこちらの方が見通しが良くなります.
今回の例では各クマのミトコンドリアのサイトクロムb(CYTB)領域を集めて系統樹を作ります.
e0060169_20272068.jpg


次に環状に表示させた配列データのCYTBと表示された部分を右クリックし,「Open Annotation in New View」を選択します.
e0060169_20274783.jpg


すると,下側のウインドウにホッキョクグマのミトコンドリア中のCYTB領域のみが切り出された状態で表示されます.
e0060169_20275758.jpg

この状態で切り出されたウインドウのタブを左カラムのフォルダにドラックすることで保存できます.
以上の操作を各クマ種で繰り返し行い,各クマのCYTB配列をかき集めます.
尚,上記のGenBank検索でミトコンドリア完全長の配列データが見つからない場合でも,
「mitochondrion」の代わりに「cytb complete」等を検索ワードに入れれば,
CYTB領域のみの完全長で引っかかる場合もありますので,あきらめずにがんばりましょう.

今回の例ではアメリカグマ,ホッキョクグマ,ジャイアントパンダ,メガネグマ,マレーグマ,ヒグマ,ツキノワグマ,レッサーパンダ,アライグマの
CYTB配列で分子系統樹を作成します.
尚,かき集める領域は種間で同じであれば別にどこでも構いません.
ただし,選択した領域によって,微妙に系統樹が変わります.
また,DNA配列ではなくアミノ酸配列に変換したものでもOKです(このソフトで出来ますが詳細は省きます).
種の範囲が広くなる場合はアミノ酸配列のほうが良いかもしれません.
また,極近い種で比較する場合はD-loop領域などの特異性が高い配列を利用するのが良いと思います.

次に,かき集めたCYTB配列のマルチプルアラインメントを作成します.
手順としては保存したCYTB配列を複数選して,右クリック→Toolbox→Alignments and Trees→Create Alignmentを選択します.
e0060169_20281619.jpg


すると,次のダイアログボックスが表示されますのでNextを何回か押して最後にfinishを押します.
尚,アラインメント速度は正確なslowが良いと思います.
e0060169_20282965.jpg


しばらくするとマルチプルアラインメントが終わります.配列が長くなったり,種類が多いと糞遅くなります.そのときは茶でも飲みながら待ちましょう.
例によって,ウインドウのタブを左のカラムにドラッグすることでマルチプルアラインメント結果を保存できます.
e0060169_20284181.jpg


次はいよいよマルチプルアラインメントから分子系統樹を作成します.
保存したマルチプルアラインメントを右クリック→Toolbox→Alignments and Trees→Create Treeを選択します.
e0060169_20285490.jpg

すると,例によってダイアログボックスが出てきますので,Nextを連打してFinishを押します.
尚,アルゴリズムはNJでもUPGMAでも好きなほうを選んでください.
残念ながら最近流行のMCMCはありません.
e0060169_2029713.jpg


と,言うわけで,ようやく分子系統樹が完成しました!
e0060169_20291684.jpg

なんか,いまいちですが,まぁ,こんなもんでしょう(w
もう少しいろんな種を入れ込むときれいに分かれると思います.
ヒグマとホッキョクグマはcytb配列で比較すると殆ど同じ種と考えられますね.
人間でたとえれば,アフリカのクロンボと北欧のシロンボくらいの違いなのかもしれません.
実際,自然界にはヒグマとシロクマのハイブリットが存在しているらしいです.
暇で動物マニアの方は色々と試してみると新発見があって面白いと思いますよ.

尚,全然サクッとじゃねーよボケ!とか思われるかもしれませんが,
私は無料でここまで簡単に出来る(効率は悪いが)ソフトを他に知りません.知っている超々マニアの方がいましたら教えてください.
普通のソフトはアラインメントならアラインメントだけって感じでもっと面倒くさいのです.
ここまで,読んで試してみようと持ってみた人は一人いるかいないかと見ました(w
[PR]

by bizen_yoshikage | 2008-10-30 20:29 | 色々…