人気ブログランキング | 話題のタグを見る

したっぱ昆虫細胞研究者のメモ

insectcell.exblog.jp
ブログトップ
2011年 05月 07日

ヒト組織をNGSで解析して、そこにいる菌とかを検出するシステム

次世代シーケンサーで発現解析とかやってるときに、なぜかマッピング/アセンブリが上手く行かない。。。
そんなときにあぶれた配列を調べたら、サンプルが汚染されてる証拠が見つかったりします。
なので、次世代シーケンス解析からの寄生生物探索は行けるなぁと思ってました。

次世代シーケンサーを使って、ヒト組織からmicrobsを見つけられるよ!(ソフト作ったよ)というお話です。

Nature Biotechnology 29, 393–396 (2011) doi:10.1038/nbt.1868
PathSeq: software to identify or discover microbes by deep sequencing of human tissue
Aleksandar D Kostic, Akinyemi I Ojesina, Chandra Sekhar Pedamallu, Joonil Jung, Roel G W Verhaak, Gad Getz & Matthew Meyerson

著者らは、次世代シーケンス解析でマッピングに用いられるMAQ、有名すぎるBLAST、やはり次世代シーケンス解析でアセンブリに使われるVelvetを組み合わせることで、ショートリードからヒト由来配列を取り除き、残った配列を分析して、組織中にいるmicrobsを塩基配列から検出するソフトをつくりました。

以下のように動くようです。
1、MAQでヒトゲノムにマッピングしてunused readsを得る。
2、上記unused readsをヒト配列にMegaBLASTをかけて、相同性の無い配列を得る。
3、MegaBLASTで引っかからなかった配列をヒト配列にBLASTNして、相同性のない配列を得る。
4、そうして得たヒトゲノム以外に由来する配列を、メタゲノム解析したり、既知配列に相同性検索かけたり、もしくはアセンブリしてから相同性検索したりして同定!

これを使えば、病気のところをサクッと取ってきて、何にかかってるのかを簡単に調べることが出来るようになるでしょう。
原因がよくわからない皮膚病とかの菌相をこれで解析すれば新しい治療法が見つかるかもしれないですね。

この研究でおそらく頑張ったところは、NGSのデータからとにかくヒト由来の配列を除いて行く部分だと思います。通常、マッピングしても数%程度のアンマップリードは出て来てしまうので、それらの中からさらにヒト由来を除いて行く作業を執拗に繰り返しています。
現場的に気になったのは、MAQ, MegaBLAST, BLAST+, Velvetという4つのソフトを使うってことはアップデートが面倒なんじゃないかなってところですね^^


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking


by koretoki | 2011-05-07 08:18


<< SRAにハエセルライン45li...      バッタ胚セルライン >>