2011年 05月 09日

SRAにハエセルライン45lineのmRNA-seqデータ上がってる!

NCBIが打ち切り表明をしているSRAに、D. melanogaster由来のセルラインのRNA Seqデータが45line分も上がってました!
したっぱ歓喜!!w
NCBI->SRA->"cell line"で検索で出てきます。
もしくは"SRX047232"などのアクセッション番号で検索すれば出てくるかと思われます。

公開したのは米エネルギー省のBerkeley Lab。
エネルギー省関係なくね?と思ったら、伝統のテーマみたい。Fluit Fly Sequencing As Genetic Research Milestone
今せっせとDLしてるけど、これはかなり楽しみ!

公開されているのは以下の45のセルラインのRNA Seqデータ。

2: SRX047232S2R+ cell line
3: SRX045359ML-DmD4-c1 cell line
4: SRX045358ML-DmD32 cell line
5: SRX045357ML-BG2-c2 cell line
6: SRX045356ML-DmD11 cell line
7: SRX045355CME W2 cell
8: SRX045354mbn2 cell line
9: SRX045353ML-DMD20-c5 cell line
10: SRX045352S1 cell line
11: SRX045351S3 cell line
12: SRX029219Sg4 cell line
13: SRX029218S3 cell line
14: SRX029217S2R+ cell line
15: SRX029216S2R cell line
16: SRX029215S2R+ cell line
17: SRX029214S1 cell line
18: SRX029213S1 cell line
19: SRX029212ML-DmD9 cell line
20: SRX029211ML-DmD8 cell line
21: SRX029210ML-DmD4-c1 cell line
22: SRX029209ML-DmD32 cell line
23: SRX029208ML-DmD32 cell line
24: SRX029207ML-DmD21 cell line
25: SRX029206ML-DMD20-c5 cell line
26: SRX029205ML-DmD17-c3 cell line
27: SRX029204ML-DmD17-c3 cell line
28: SRX029203ML-DmD16-c3 cell line
29: SRX029202ML-DmD16-c3 cell line
30: SRX029201ML-DmD11 cell line
31: SRX029200ML-DmD11 cell line
32: SRX029199ML-DmBG1-c1 cell line
33: SRX029198ML-BG2-c2 cell line
34: SRX029197ML-BG2-c2 cell line
35: SRX029196mbn2 cell line
36: SRX029195Kc167 cell line
37: SRX029194Kc167 cell line
38: SRX029193Kc167 cell line
39: SRX029192GM2 cell line
40: SRX029191GM2 cell line
41: SRX029190GM2 cell line
42: SRX029189CME W2 cell
43: SRX029188CME W2 cell
44: SRX029187CME L1 cell
45: SRX029186CME L1 cell
46: SRX0291851182-4H cell line


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

# by koretoki | 2011-05-09 20:07
2011年 05月 07日

ヒト組織をNGSで解析して、そこにいる菌とかを検出するシステム

次世代シーケンサーで発現解析とかやってるときに、なぜかマッピング/アセンブリが上手く行かない。。。
そんなときにあぶれた配列を調べたら、サンプルが汚染されてる証拠が見つかったりします。
なので、次世代シーケンス解析からの寄生生物探索は行けるなぁと思ってました。

次世代シーケンサーを使って、ヒト組織からmicrobsを見つけられるよ!(ソフト作ったよ)というお話です。

Nature Biotechnology 29, 393–396 (2011) doi:10.1038/nbt.1868
PathSeq: software to identify or discover microbes by deep sequencing of human tissue
Aleksandar D Kostic, Akinyemi I Ojesina, Chandra Sekhar Pedamallu, Joonil Jung, Roel G W Verhaak, Gad Getz & Matthew Meyerson

著者らは、次世代シーケンス解析でマッピングに用いられるMAQ、有名すぎるBLAST、やはり次世代シーケンス解析でアセンブリに使われるVelvetを組み合わせることで、ショートリードからヒト由来配列を取り除き、残った配列を分析して、組織中にいるmicrobsを塩基配列から検出するソフトをつくりました。

以下のように動くようです。
1、MAQでヒトゲノムにマッピングしてunused readsを得る。
2、上記unused readsをヒト配列にMegaBLASTをかけて、相同性の無い配列を得る。
3、MegaBLASTで引っかからなかった配列をヒト配列にBLASTNして、相同性のない配列を得る。
4、そうして得たヒトゲノム以外に由来する配列を、メタゲノム解析したり、既知配列に相同性検索かけたり、もしくはアセンブリしてから相同性検索したりして同定!

これを使えば、病気のところをサクッと取ってきて、何にかかってるのかを簡単に調べることが出来るようになるでしょう。
原因がよくわからない皮膚病とかの菌相をこれで解析すれば新しい治療法が見つかるかもしれないですね。

この研究でおそらく頑張ったところは、NGSのデータからとにかくヒト由来の配列を除いて行く部分だと思います。通常、マッピングしても数%程度のアンマップリードは出て来てしまうので、それらの中からさらにヒト由来を除いて行く作業を執拗に繰り返しています。
現場的に気になったのは、MAQ, MegaBLAST, BLAST+, Velvetという4つのソフトを使うってことはアップデートが面倒なんじゃないかなってところですね^^


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

# by koretoki | 2011-05-07 08:18
2011年 05月 06日

バッタ胚セルライン

飛蝗とか問題児なのになかなかセルラインが出来ないバッタさんのセルラインの報告。
実は前にも2つくらいあったけど、どっちも絶えてて今不在だったはず。

Xin Zhang, Ying Feng, Wei-Feng Ding, Xiao-Ming Chen, Cheng-Ye Wang and Tao Ma
Establishment and characterization of an embryonic cell line from Gampsocleis gratiosa (Orthoptera: Tettigoniidae)
In Vitro Cell.Dev.Biol.—Animal (2011) 47:327–332

著者らは5-7日齢のバッタ卵を70%Et-OHで3分滅菌、顕微鏡下で開いて2つか3つの胚を12.5-cm2のフラスコに入れ培養しました。その後胚は取り除かれ、2mlの0.1%トリプシンで4分処理することで解離された。解離は0.2%のトレハロース、0.2%のTC-Yeastolate、20%のFBSを添加したGrace培地で止めた。胚組織をチューブに移し、150xg 5mimで集めて、そのペレットを3mlのフラスコでバラして25℃で培養した。毎週培地を半分交換した。150日目から増え始めたらしい。
FBSの濃度は30代くらいで25-20%、50代では20%-15%にした。25代まではゆっくりだった。最終的には15%にして、毎週サブカルチャーしてる。

培地にトレハロース入れるアイデアは初見かも!
培養細胞の位相差写真が素晴らしい。鞘翅目のになんか似てる。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

# by koretoki | 2011-05-06 03:38
2011年 05月 05日

エサでメチレーションが変わってスプライシングも変わる:ミツバチ

Frank Lyko, Sylvain Foret, Robert Kucharski, Stephan Wolf, Cassandra Falckenhayn, Ryszard Maleszka
The Honey Bee Epigenomes: Differential Methylation of Brain DNA in Queens and Workers
PLoS BiologyNovember 2010 | Volume 8 | Issue 11 | e1000506

ミツバチは行動と繁殖の異なる2つのカースト、ワーカーとクイーンがいます。著者らは、エサ依存のphenotypesが脳のメチロームと相関を持ってるか持ってないかを調べるために、ワーカーとクイーンの脳のメチロームをショットガンバイスルファイトシーケンシングで調べました。

実験には、50頭の産卵してるクイーン(2.5wk old)と、15頭の8-d-oldのワーカーが用いられました。DNAを抽出し、バイスルファイト処理した後、GAⅡxでシーケンシングしました。データは131 million reads, 18.8Gb(10.2Gbクイーン, 8.6Gbワーカー)で260Mbのゲノムに対してx20のカバレッジでした。マッピングはBSMAPを使いました。68.5%がユニークにマップされました。数学的なことはRでやりました。だいたいBenjamini and Hochbergのやり方に従って統計しました。ESTと予測データベースをMysqlでつくり、Gbrouseで見たりしました。

550の遺伝子について、ワーカーとクイーンでメチレーションパターンが違ってました。454を使って8遺伝子について検証もしました。特にGB18602という遺伝子では、スプライシングとメチレーションの間に相関がありました。

こっちはBSMAP使ってますね。
擬陽性の問題があまり語られてないので、SOAPalignerよりこっちのがやっぱりいいのかも?

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

# by koretoki | 2011-05-05 19:33
2011年 05月 05日

カイコゲノムのメチル化具合

昆虫ゲノムのメチル化具合について出てきました。
全体の>0.2%しかメチル化されてない上に、トランスポゾン、プロモーターはスルーで転写領域ばかりがメチル化されてるそうです。

Hui Xiang, Jingde Zhu, Quan Chen, Fangyin Dai, Xin Li, Muwang Li, Hongyu Zhang, Guojie Zhang, Dong Li, Yang Dong, Li Zhao, Ying Lin, Daojun Cheng, Jian Yu, Jinfeng Sun, Xiaoyu Zhou, Kelong Ma, Yinghua He, Yangxing Zhao, Shicheng Guo, Mingzhi Ye, Guangwu Guo, Yingrui Li, Ruiqiang Li, Xiuqing Zhang, Lijia Ma, Karsten Kristiansen, Qiuhong Guo, Jianhao Jiang, Stephan Beck, Qingyou Xia, Wen Wang & Jun Wang
Single base–resolution methylome of the silkworm reveals a sparse epigenomic map
Nature Biotechnology 28, 516–520 (2010)

虫のエピジェネティックな制御は多様な生物学的過程を持っている。今回著者らは、カイコのメチローム(methylome)について、1塩基単位の分析が可能なillumine high-throghput bisulfite sequencing(MethylC-Seq)を使って調べました。当初、0.11%のシトシンがメチルシトシンになっているだろうし、おそらくそれはCGで起きてると思いました。CGメチレーションは転写領域に集中しており、発現レベルと相関がありそうです。このことは、遺伝子発現に対してポジティブな作用を持っている事を示唆します。トランスポゾンとか、プロモーター、リボソーマルDNAは少ししかメチル化されていませんでしたが、対照的に、転写領域にあるsmall RNAは高密度にメチル化されてました。

"遺伝子のプロモータ領域にメチル化修飾を受けたシトシン塩基が遺伝子発現調節に関与していることが示唆されています。これらの調節機構を領域としてメチル化シトシンのパターンを検出するには、シーケンス反応をベースにした検出系が有効です。
ゲノムDNAにバイサルファイト処理を行なうとメチル化シトシンは変換されず、非メチル化シトシンのみがウラシルに変換されます。シーケンス反応としてウラシルはチミンとして表現されますので、バイサルファイト処理前後で生じるシトシンとチミン(ウラシル)の差異を配列データとして得ることができます。"Applied Biosystems社HPより引用

5令の大造の絹糸腺を液体窒素でサンプリング。bisulfite処理をしたtotalDNAをシーケンスしました。272,312,422readsがとれ、クオリティ低いの除いて133,765,113readsを使う事にしました。これは5.9Gbpで、カイコゲノムのシトシンのうち92%をカバーし、平均深度はx7.4です。0.67%のCG, 0.21%のCHG, 0.24%のCHHが最初にみつかりました。(H=A,C or T)non-CGメチル化はミツバチにおいては、非常に稀か存在しないと考えられるので、擬陽性を疑います。メチル化していると推定される部位のうち、どれだけがメチル化されているのかを旧来のシーケンスと454のシーケンスで確かめることにしました。ゲノム中から、26のmCGsを含む5部位、98のmCHHsとひとつのmCHGを含む3部位を選び、旧来のバイサルファイトPCRとシーケンスを行いました。すると、CG部位については92.3%のシトシンのメチル化が確認され、non-CG部位のメチル化は確認されませんでした。さらに、692 CGs, 29 CHGs and 63 CHHsを含む部位をバイサルファイトPCRしたのち、454でシーケンスしました。CG部位に付いては82.9%のメチレーションが確認され,non-CG部位のメチレーションは見つかりませんでした。ということは、カイコでもミツバチでもnon-CGのmGsは稀か存在しないでしょう。

擬陽性を除くために、dipthを上げる事にしました(※怪しいときにdipthを上げるのはGA使う研究のいつもの手)。絹糸腺を他の個体から取り出し、MethylC-Seqしました。今度は9.9Gb, dipth x9.0で取れました。さっきのと同じ事をしたら、983,395のmCsが見つかり、6割くらいがnon-CG部位でした。さっきのと比べてみたら、CG部位は大体一緒だったけどnon-CGは一緒じゃありませんでした。カイコの場合は非non-CG部位のmGsはほとんどすべてが擬陽性であるようです。

2つのMethylC-Seqに基づくmethylome解析の結果はよく一致しており、BS-PCRで確かめた191部位のうち、190部位については2回目の結果でも発見されました。
2つの結果を合わせる事で、最終的に173,505個のmGsについてのDNA methylation Mapを作りました。そのうちCG部位は99.2%でnon-CG部位は0.8%でした。BS-PCRの結果を鑑みるにMethylC-seqの結果の85.2%のmGCsが実際にメチル化されているので、ゲノム上の0.11%のシトシンがメチル化されているだろうと推察しました。これは、液クロを使った結果とも一致します。

メチル化の機能を調べるため、遺伝子、smallRNA、Transposable elements,ribosomal DNAのメチレーションプロファイルを見る事にしました。すると、遺伝子、cds,イントロン,small RNAがよくメチル化されており、TEsはわずかに、rRNAはまったくメチル化されていませんでした。

遺伝子の発現調節に関わっていそうなので、絹糸腺をつかって発現量を見てみました。illuminaのを使って2回はかりました。特にdnmt1とdnmt2(DNA methyltransferase)についてはRT-PCRも使って調べました。遺伝子を発現量を指標に5群にわけ、それぞれのメチル化具合と比較しました。メチル化の少ない遺伝子程よく発現していたので、転写領域についてはメチレーションの機能は植物やセキサク動物と同じなようです。でも、プロモーター部位に関しては相関がありませんでした。さらに、geneontologyを見ました。メチル化された遺伝子は結合活性に富み、転写制御因子を含みました。バイオロジカルプロセス、細胞の代謝や生合成プロセスに関わるところもメチル化されてました。一方、転写因子はメチル化されてませんでした。また、制御や接着にかかわるものもメチル化されてませんでした。



この研究ではmappingをSOAPalignerでやってました。44-nt pair-end 2mismatches , 75-nt pair-end 4mismatchesという具合です。BS-SEQだったら、こういうの使うんじゃないかと思ったんですが、>0.2という低いメチル化レベルのカイコだったら普通のmapperでも良いのかと思ってエキロロアンしましたー



人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

# by koretoki | 2011-05-05 17:21