したっぱ昆虫細胞研究者のメモ

insectcell.exblog.jp
ブログトップ

カテゴリ:未分類( 99 )


2012年 11月 28日

貝の殻は血球が作ってるっぽい:カキゲノムの解析

ゲノムを想いながら食べればオイスターバーの楽しみも増えるかもしれません

Nature. 2012 Oct 4;490(7418):49-54. doi: 10.1038/nature11413. Epub 2012 Sep 19.
The oyster genome reveals stress adaptation and complexity of shell formation.
Zhang G, Fang X et al.


マガキのゲノムを得ることは、単にカキの研究のために役立つだけでなく、複雑なゲノムを解読するという点で重要な課題である。カキや他の海洋生物で、高レベルの多型があることが知られている。これを解決するために、近交系(4世代のfull-sibling mating) を作成しゲノムシーケンスを行った。

[ゲノム解読]

様々なインサート長のショートリードを得るとともに、フォスミドライブラリのショートリードを得た。ゲノム由来のショートリードのアセンブリによって(Fig1 dc)、500-600Mb と推定されるカキゲノムを再構築することは非常に困難であるが、ゲノムの一部から切り出して作成した40Kbのフォスミドであれば、比較的容易に再構築ができる(Fig1 ab)。それらを合わせることで複雑なゲノムを決定できると考えた。平均するとゲノムの155倍のデータを得た(TableS1)。フォスミドを作成してイルミナで読む方が、Roche-454で読んだりBAC-to-BACで読むよりも安いらしい。この方法でカキゲノムを決定した。559Mbだった。

ゲノムサイズの推定には...
フローサイトメトリー(鶏とゼブラフィッシュと比較して使う)、あるいはゲノム由来のショートリードのkmer distribution を用いる。後者の方法が右図。kmerというのは、塩基配列の中から任意の長さの配列を切り出したものである。例えばkmer length = 17で考えるとき、任意の17bpの配列は4^17種類ある。それらの配列が塩基配列の中に何回出てくるのかということを数えて(Depth)、それの頻度分布を求めると、(FigS1)のようになる。カキゲノム由来のこの図では、ピークが2つあるのでヘテロザイゴートな度合い(heterozygosity)が高いことがわかる。右端のDepthがx255以上のkmerは反復配列を示唆するが、それがショートリード全体の35%もあるので、カキゲノムは反復配列が多いことが推定される。

[ゲノム解析]
カキゲノムの多型について調べるために、wild型のカキのゲノムをシーケンスし、マッピングしてSNPとかInDelとかを探した。3.1MのSNPと258,405のInDelが見つかった。遺伝子の領域だけに限定すると、2,665個の遺伝子に3,094個のInDelがあった。また、反復配列について、既知の反復配列を参照してゲノム中の反復配列を探した。202Mb(カキゲノムの36%)が反復配列であるようだった。359個のtranspsaseと、779個のreverse-transcriptase がゲノム中に見つかり、それらの96%が転写されていることがトランスクリプトーム解析(後述)で分かった。wild型のカキのゲノムからは20,605個の欠失(>100bp)が見つかっており、これらの80%がトランスポゾンと一致していた。これらのことは、トランスポゾンが活性化していることを示唆する。

トランスクリプトーム解析は成体から器官別のサンプルを得、また、幼生から発生ステージ別のサンプルを得た。使われた器官は外套膜mantle (Man), エラgill (Gil), 貝柱adductor muscle (Amu), 消化腺digestive gland (Dgl), 血球hemocyte (Hem), 唇弁labial palp (Lpa) and 雌性腺female gonad (Fgo). 外套膜は外の端の方と、中の方とで分けた。For mantle, the outer edge (MO) along the margin of the shell and the inner pallial part (MI) covering the inner surface of the shell were dissected separately as two samples. 残り物A mixture of remaining tissues (Rem) was collected and included. Another two samples of female (G3) and male (Mgo) gonad were obtained from F1 offspring of family “G3” and included.幼生のステージは(Table S12)。

カキゲノムの遺伝子領域を決めるために3つの方法を使い、最後にGLEANでまとめた。28,027個の遺伝子が予測された。
RNA-seq: カキゲノムをリファレンスにトランスクリプトームのリードをTopHatでマッピングもの。
De novo: Augustus, SNAP, Glimmer-HMMでゲノムから遺伝子予測。
Homolog: 6種の無脊椎動物のタンパク配列をカキゲノムにTBLASTXでマッピングした(eVal<1E-5) (Capitella teleta, L. gigantea, Helobdella robusta, Anopheles gambiae, C. elegans, D. melanogaster)

カキゲノムに特徴的な遺伝子を知るために6種のゲノムと比較した。
(Nematostella vectensis, Strongylocentrotus purpuratus, Ciona intestinalis, C. elegans, D. melanogaster, Danio rerio and Homo sapiens.)
8,654個の遺伝子がカキ特異的な遺伝子であった(カキの遺伝子は28027個)。それらの遺伝子のGeneOntologyを調べると、”protein binding”, “apoptosis”, “cytokine activity”, “inflammatory(炎症) response” が多かった。biotic(病原菌とか)やabiotic(暑いとか)なストレスから身を守ってることが示唆された。色々な実験によって(”Manual examination shows”)、いくつかの遺伝子が防御のためのパスウェイト関連していることが分かった(Fig3a)。カキゲノム中には88個のヒートショックプロテイン70(HSP70)が含まれており、ヒト17個、ウニ39個と比べて非常に多い。

Fig S19ではHSP70を比較している。ウニから88個、Lottia gigantea (貝)から15個、その他37種の軟体動物から68個を集めてきた。71個のカキHSPはクラスター(系統上で)を形成しているので、それらはカキが独自に獲得してきた物ではないかと考えられる。
P450も発達していて、136個見つかった(ヒト57、ハエ78、アネモネ82、ウニ120)。また、P450がクラスター(ゲノム上で)を形成していた。

[カキのストレス応答]

カキのストレス応答を見る目的で9種のストレス環境での実験を行った。実験に用いたカキは、2歳で、殻の長さが9-12cmのものであった。20±0.5℃で水が循環するタンクで飼育した。塩分(salinity)は30±1、pHは8.0±0.3であった。カキたちは一日中スピルリナという藻のパウダーを食べて過ごした。

実験条件
Salinity: 5, 10, 15, 20, 25, 30, 40にして7日間飼育した。エラからRNAを取った。
Temperature: 5, 10, 15, 20, 25, 30, 35 °Cで飼育した。5-25℃では7日間、30, 35℃では12時間処理した。エラからRNAを取った。
Exposure to air: 5頭をよくエアレーションした海水中でタンクで飼育した(コントロール)。50頭を空のタンクに入れ,1, 3, 5, 7, 9, 10, 11日間処理した。エラと貝柱からRNAを取った。
Heavy Metals: 亜鉛(1 mg/L)で 0 h, 12 h, 5 d, 7 d, 9 d, 13 d処理。エラと消化腺からRNAを取った。5種の金属(亜鉛, 1mg/L; カドミウム, 100 μg/L; 銅, 100 μg/L; 鉛, 500 μg/L; 水銀, 20 μg/L; 亜鉛とカドミウム, 500μg/L と50μg/L,)12時間(急性毒性試験)と9日(慢性毒性試験)で処理した。

5,844の遺伝子が少なくともどれかの条件で発現量を変動させた。結構互いに重なっている(Fig3b)。空気に触れさせるのが一番多くの遺伝子を変動させた。カキにとって一番のストレスは空気ではないか。発現変動する遺伝子はパラログを持っている物が多かった(Fig3c)ことから、これらのストレス対応遺伝子がカキにとって重要であることが示唆された。

[カキの殻のでき方]

石灰化している殻はカキを守る。貝の殻はCaCO3の結晶がアラゴナイトとして存在するか、あるいは、カルサイト(方解石)を含んだ有機構造体(炭素)として存在する。また、貝の殻形成とのモデルとして2つの仮説がある。マトリックスモデルは、外套膜から分泌されたキチン、シルクフィブロインを酸化タンパクが石化することを仮定している。キチンとシルクタンパクは、構造の成分を提供し、酸化タンパクがCaCO3の結晶の核と成長をコントロールする。一方で、細胞モデルでは、石灰化が細胞の仲介によっておこるとする、すなわち、結晶が血球内で形成され、それから石化すべきところに沈着すると考える。

カキの貝殻のタンパクを、MSを使ってシーケンスし、配列をカキゲノムにマップすることで、貝殻タンパクを259個同定した。また、トランスクリプトームデータを参照した。キチンが含まれていることが示されたが、カキゲノムに含まれていたシルク様タンパクは全く見つからなかった。それだけでなく、代わりに多様な、構造を作っているタンパクが見つかった。特に、フィブロネクチンは発生の初期 (Fig 4a) や幼生の殻ができるときに発現しており、成体の外套膜で多く発現していた(Fig 4b)。フィブロネクチンはカキの殻でよくみつかるタンパクである。外套膜では典型的な細胞外マトリックス(ECM)タンパクも見つかっていて、殻が動物の結合組織や、基底膜に似ていることを示唆している。自己組織化するシルクフィブロインと異なり、ビブロネクチンが繊維を形成するためには細胞の仲介が必要である。カキフィブロネクチン様タンパクはインテグリンや細胞に結合するためのタイプⅢドメインを5つ持っている。そして、インテグリンを最も良く発現しているのは血球である。これらのことを合わせると、血球がフィブロネクチン様繊維形成を殻のところで行っていると考えられる。
殻形成に細胞が深く関わっていることは、殻から見つかったタンパクからも支持できる。house keeping タンパクが殻から見つかっている。実は、カキの殻のタンパク質の多くは、構造タンパク質ではなく、多様な代謝経路の遺伝子なのである(Fig 4c)。これらの多様な機能をもったタンパクが、殻タンパクに含まれていることは細胞がいたことを反映している。これは、マトリックスモデルでは全く想定されていなかったことである。さらに、259個の殻タンパクの84%は分泌性タンパクではない。それらは細胞の一部であったか、あるいはエキソソームによって沈着させられたのである。61個の殻タンパクがエキソソームデータベースのタンパクと一致していたことも、エキソソームの存在を示唆する。カルサイト結晶を含んだ細胞やエキソソーム様小胞が石化部分で見つかっている(Science. 2004 Apr 9;304(5668):297-300.”Hemocyte-mediated shell mineralization in the eastern oyster.” Mount AS, Wheeler AP, Paradkar RP, Snider D.)にも関わらず、それらの殻形成における重要性は議論されてきた。本研究はそれらの細胞が殻の中にいたことや、殻形成に参加している分子的な証拠を提示する。

--------------------------------------------------------------------------------

JC用のメモを流用したので訳っぽい雰囲気...
ゲノム解析して何がわかるんだよ、ってのに答えるのにとってもいい論文だと思います。
最後の貝殻の話で血球がでてきたのでとても興奮しました。昆虫の顆粒細胞が酸素を運搬してるかもしれない(昆虫にも肺) なんて話もあって、血球ってすごく多機能なんじゃないかと個人的には思っています。

ゲノムサイズをkmerで推定するところがやっぱりピンと来なかったのですが、サプリメンタルをみると"ゲノムサイズGは(kmerの総数)を(kmerの最大頻度)で割って求めた"って書いてありました。実際これをどうやって計算するのか&どうして求められるのかってのは seq. an. でも話題になっていて パンダのときから気になってました。ちょっと考えたのでメモをば

一般にゲノムシーケンスした時のカバレッジ(Cov.)はシーケンス塩基総数をゲノムサイズで割ったものになります。
De novo genome 解析の場合、シーケンス塩基総数は(シーケンスして得たんだから)分かってて、ゲノムサイズは不明です。じゃあカバレッジ(Cov.)はどうなるのか。
kmer distribution のグラフをみると(カキゲノム論文のFig S1とか)、左端に激坂、x46に小山、x92に大山があって、あとはたぶんロングテールです。で、x46とx92の山ができるのが大事です。
kmer length = 17bp の時、考えられるkmerの種類は4の17乗通りで17,179,869,184通りになります。生物のゲノムサイズなんてせいぜい数Gなので、同じkmerがゲノム中に何度も出てくるとは考え難いです。もちろん反復配列とかはkmer distribution の右の方に吸われて行きますし、偶々被ってるところがあって決まった被り回数の組み合わせがよっぽどの数ないと山はつくれないです。逆に言うと小山と大山はそうとうのもんです。じゃあこの大山と小山はなにかと言うと、大山がゲノム中に1回しか出てこないkmer達の山で、小山はゲノム中に1/2回しか出てこない山です。1/2回と言うのは、ヘテロザイゴートなところのことです。カキは2倍体が基本なので、2nのそれぞれが同じところもあれば、違うところもあります。で、違うところが1/2回としてでてくるんです。たぶん

ここで、ちょっと戻ってもらって、カバレッジ(Cov.)はどうなるのかっていうと
大山はゲノム中に1回しか出てこなくて、そいつがx92だって言うんだからCov.は92なんです。
僕はぴんと来なかったので絵を描いてたんですけど、ゲノム上にとある一度しか出てこない17bpの配列があって、今回シーケンスした全てのデータの中にその配列が92回含まれてたならこれはもうCov. = 92 でしょう。

最初の "ゲノムシーケンスした時のカバレッジ(Cov.)はシーケンス塩基総数をゲノムサイズで割ったもの" に戻ると、
カバレッジ←既知(x92)
シーケンス総数←既知(少なくとも実験者は)
なので、ゲノムサイズがそれらの割り算で出てきます。
たぶんあってると思うのですけどDe novo genome 解析は専門じゃないので間違ってたら教えて下さい。

あと、スプライシングバリアントは見てないそうです(当時)

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2012-11-28 03:14
2012年 03月 25日

お家でできるMac Bookでやる次世代シーケンスデータ解析

『お家でできるMac Bookでやる次世代シーケンスデータ解析』iPadZineで公開しました。pdf形式になってます。http://www.ipad-zine.com/b/1520

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2012-03-25 23:35
2011年 07月 12日

オートファジーがアポトーシスを防ぐ

2つの鱗翅目のセルラインの飢餓への対応から、オートファジーの仕事をみた論文

Wu W, Wei W, Ablimit M, Ma Y, Fu T, Liu K, Peng J, Li Y, Hong H.
Responses of two insect cell lines to starvation: Autophagy prevents
them from undergoing apoptosis and necrosis, respectively.
J Insect Physiol. 2011 Jun;57(6):723-34. Epub 2011 Feb 16.

著者らは、セルラインをIBSS(Insect balanced salt solution: 75mM
Nacl, 5mM CaCl2, 55mM KCl, 2.6mM MgCl2・6H2O, 2.8 mM MgSO4・7H2O, 4.2 mM
NaHCO3, 7.3mM NaH2PO4・H2O, 10 mM glucose, pH 6.4)に移し、飢餓状態にして実験しました。

SL-ZSL-1をIBSSに入れるとのオートファジーを誘導されました。長い飢餓でアポトーシスが誘導され、apoptotic bodyの形成やcaspase-3-likeの活性上昇など、48h以上の飢餓で引き起こされます。飢餓の早い段階で3-MAを添加してオートファジーを防ぐとアポトーシスすることがわかり、このことからオートファジーがアポトーシスを阻害しているのではないかとかんがえました。

一方、Bm36は48h以上の飢餓においてもアポトーシスはしませんが壊死に近い死を迎えます。Actinomycin Dの添加によってアポトーシスを引き起こせるので、Bm36はアポトーシスの機能は保持しています。また、48hの飢餓でも死なないBm36は、飢餓の早い段階での3-MA添加によるオートファジーの阻害によってアポトーシスを誘導せずにに壊死します。

2つのセルラインのAcid phosphataseについて分析すると、SL-ZSL-1の方がBm36よりもオートファジー活性が強いことがわかりました。また、caspase-likeの活性も高く飢餓に誘導されます。

オートファジーはアポトーシスを防いでいるが、長期の飢餓により昆虫細胞は死に至る。
そしてその死の経路には、caspase-9-like, saposin-like, Atg6が必要そうだ。




人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-07-12 03:23
2011年 05月 24日

D.m.由来セルラインの発現比較

キイロショウジョウバエのセルラインは生物学的な資源として貴重な存在です。それらが、どのような遺伝子を発現しているのか、著者らはマイクロアレイと次世代シーケンサーを用いて調査しました。

Lucy Cherbas, Aarron Willingham, Dayu Zhang, et al.
The transcriptional diversity of 25 Drosophila cell lines
Genome Res. 2011 Feb;21(2):301-14. Epub 2010 Dec 22.

25のセルラインについてしらべた、結果、発現しているものが以下の様であるとしています。
・64%の遺伝子は少なくとも一つのセルラインで発現していたが、21%の遺伝子だけが全てのセルラインで発現していた。
・それぞれのセルラインは平均5885の遺伝子を発現していて、3109個は共通していた。
・ほとんどのdifferentiation pathwayはoffであり、いくつかのdifferentiation pathwayとgrowth pathwayがonであった。
・それぞれのセルラインで発現しているだいたい50%の遺伝子は一般的なセットではなく、それらが個性を示しているかもしれない。
・31%の遺伝子は少なくとも一つのセルラインで発生上のどのステージより高い発現を示しており、このことは、それぞれのセルラインが細胞の小さいセットの遺伝子の特性に富んでいる事を示唆する。

さらに、成虫盤由来のセルラインについて、それぞれのセルラインが由来する成虫盤上の部位のマーカーとなる遺伝子を発現しているかを調べたところ、セルラインの発現パターンは、由来である発生中の成虫盤の小さな範囲の遺伝子発現パターンと一致していることが明らかになりました。転写因子独自に発現しているセルラインは見つからず、これらの結果から、それぞれのセルラインは始祖の細胞の特徴を維持しながら、一般的な"cell line"の遺伝子発現パターンを合わせ持っていると結論づけました。


Entdifferenzierungは無いということか…
そうかなぁ


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-24 02:22
2011年 05月 12日

次世代解析の特に比較に便利なRパッケージ: DEseq

次世代シーケンスデータの解析には、配列情報を扱うものと、それに引き続く数値(発現量とか)を扱う段階がありますが、後者の方はまだあんまり王道がないです(と思ってます)。

mRNA-seqの発現比較方法として、Z検定を用いたもの、GLMを用いたものなんかがありますが、パッケージになってないと使い方分からないし、正規化の方法も何やってんだかわからないです。

Rのパッケージで使ってみて良さそうなのがあったのでメモメモ

Simon Anders* and Wolfgang Huber
Differential expression analysis for sequence count data
Genome Biology 2010, 11:R106

いつもお世話になってる門田先生のHP(Rで)塩基配列解析(主に次世代シーケンサーのデータ) by 門田幸二DEGseqっていうパッケージとDEseqっていうパッケージが紹介されていたので試しに使ってみました。

データ次第でしょうが、僕の手元のデータではDEGseqを使うとFDRが小さいものが大量に出てきてしまいました。発現変動遺伝子が多すぎて溺れそうです。一方、DEseqではFDRが小さいものが”ぼちぼち”出てきました。いい感じです。しかも計算が早い。途中、

sizeFactors(cds)

をして計算された正規化係数をみると、TMM正規化で出てきた正規化係数と近い値が出てきていました。TMM正規化では、そもそも細胞/組織中のtotalRNAの量なんて違うんじゃないの?発現の大きな一部の遺伝子にほとんどひっぱられてんじゃないの?という仮定に基づいていて、個人的に説得力があって好きです。

感動したのはこの一節。
"DESeq allows analysis of experiments with no biological replicates in one or even both of the conditions. While one may not want to draw strong conclusions from such an analysis, it may still be useful for exploration and hypothesis generation."
かゆいところに手が届きそうですw

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-12 05:13
2011年 05月 09日

SRAにハエセルライン45lineのmRNA-seqデータ上がってる!

NCBIが打ち切り表明をしているSRAに、D. melanogaster由来のセルラインのRNA Seqデータが45line分も上がってました!
したっぱ歓喜!!w
NCBI->SRA->"cell line"で検索で出てきます。
もしくは"SRX047232"などのアクセッション番号で検索すれば出てくるかと思われます。

公開したのは米エネルギー省のBerkeley Lab。
エネルギー省関係なくね?と思ったら、伝統のテーマみたい。Fluit Fly Sequencing As Genetic Research Milestone
今せっせとDLしてるけど、これはかなり楽しみ!

公開されているのは以下の45のセルラインのRNA Seqデータ。

2: SRX047232S2R+ cell line
3: SRX045359ML-DmD4-c1 cell line
4: SRX045358ML-DmD32 cell line
5: SRX045357ML-BG2-c2 cell line
6: SRX045356ML-DmD11 cell line
7: SRX045355CME W2 cell
8: SRX045354mbn2 cell line
9: SRX045353ML-DMD20-c5 cell line
10: SRX045352S1 cell line
11: SRX045351S3 cell line
12: SRX029219Sg4 cell line
13: SRX029218S3 cell line
14: SRX029217S2R+ cell line
15: SRX029216S2R cell line
16: SRX029215S2R+ cell line
17: SRX029214S1 cell line
18: SRX029213S1 cell line
19: SRX029212ML-DmD9 cell line
20: SRX029211ML-DmD8 cell line
21: SRX029210ML-DmD4-c1 cell line
22: SRX029209ML-DmD32 cell line
23: SRX029208ML-DmD32 cell line
24: SRX029207ML-DmD21 cell line
25: SRX029206ML-DMD20-c5 cell line
26: SRX029205ML-DmD17-c3 cell line
27: SRX029204ML-DmD17-c3 cell line
28: SRX029203ML-DmD16-c3 cell line
29: SRX029202ML-DmD16-c3 cell line
30: SRX029201ML-DmD11 cell line
31: SRX029200ML-DmD11 cell line
32: SRX029199ML-DmBG1-c1 cell line
33: SRX029198ML-BG2-c2 cell line
34: SRX029197ML-BG2-c2 cell line
35: SRX029196mbn2 cell line
36: SRX029195Kc167 cell line
37: SRX029194Kc167 cell line
38: SRX029193Kc167 cell line
39: SRX029192GM2 cell line
40: SRX029191GM2 cell line
41: SRX029190GM2 cell line
42: SRX029189CME W2 cell
43: SRX029188CME W2 cell
44: SRX029187CME L1 cell
45: SRX029186CME L1 cell
46: SRX0291851182-4H cell line


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-09 20:07
2011年 05月 07日

ヒト組織をNGSで解析して、そこにいる菌とかを検出するシステム

次世代シーケンサーで発現解析とかやってるときに、なぜかマッピング/アセンブリが上手く行かない。。。
そんなときにあぶれた配列を調べたら、サンプルが汚染されてる証拠が見つかったりします。
なので、次世代シーケンス解析からの寄生生物探索は行けるなぁと思ってました。

次世代シーケンサーを使って、ヒト組織からmicrobsを見つけられるよ!(ソフト作ったよ)というお話です。

Nature Biotechnology 29, 393–396 (2011) doi:10.1038/nbt.1868
PathSeq: software to identify or discover microbes by deep sequencing of human tissue
Aleksandar D Kostic, Akinyemi I Ojesina, Chandra Sekhar Pedamallu, Joonil Jung, Roel G W Verhaak, Gad Getz & Matthew Meyerson

著者らは、次世代シーケンス解析でマッピングに用いられるMAQ、有名すぎるBLAST、やはり次世代シーケンス解析でアセンブリに使われるVelvetを組み合わせることで、ショートリードからヒト由来配列を取り除き、残った配列を分析して、組織中にいるmicrobsを塩基配列から検出するソフトをつくりました。

以下のように動くようです。
1、MAQでヒトゲノムにマッピングしてunused readsを得る。
2、上記unused readsをヒト配列にMegaBLASTをかけて、相同性の無い配列を得る。
3、MegaBLASTで引っかからなかった配列をヒト配列にBLASTNして、相同性のない配列を得る。
4、そうして得たヒトゲノム以外に由来する配列を、メタゲノム解析したり、既知配列に相同性検索かけたり、もしくはアセンブリしてから相同性検索したりして同定!

これを使えば、病気のところをサクッと取ってきて、何にかかってるのかを簡単に調べることが出来るようになるでしょう。
原因がよくわからない皮膚病とかの菌相をこれで解析すれば新しい治療法が見つかるかもしれないですね。

この研究でおそらく頑張ったところは、NGSのデータからとにかくヒト由来の配列を除いて行く部分だと思います。通常、マッピングしても数%程度のアンマップリードは出て来てしまうので、それらの中からさらにヒト由来を除いて行く作業を執拗に繰り返しています。
現場的に気になったのは、MAQ, MegaBLAST, BLAST+, Velvetという4つのソフトを使うってことはアップデートが面倒なんじゃないかなってところですね^^


人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-07 08:18
2011年 05月 06日

バッタ胚セルライン

飛蝗とか問題児なのになかなかセルラインが出来ないバッタさんのセルラインの報告。
実は前にも2つくらいあったけど、どっちも絶えてて今不在だったはず。

Xin Zhang, Ying Feng, Wei-Feng Ding, Xiao-Ming Chen, Cheng-Ye Wang and Tao Ma
Establishment and characterization of an embryonic cell line from Gampsocleis gratiosa (Orthoptera: Tettigoniidae)
In Vitro Cell.Dev.Biol.—Animal (2011) 47:327–332

著者らは5-7日齢のバッタ卵を70%Et-OHで3分滅菌、顕微鏡下で開いて2つか3つの胚を12.5-cm2のフラスコに入れ培養しました。その後胚は取り除かれ、2mlの0.1%トリプシンで4分処理することで解離された。解離は0.2%のトレハロース、0.2%のTC-Yeastolate、20%のFBSを添加したGrace培地で止めた。胚組織をチューブに移し、150xg 5mimで集めて、そのペレットを3mlのフラスコでバラして25℃で培養した。毎週培地を半分交換した。150日目から増え始めたらしい。
FBSの濃度は30代くらいで25-20%、50代では20%-15%にした。25代まではゆっくりだった。最終的には15%にして、毎週サブカルチャーしてる。

培地にトレハロース入れるアイデアは初見かも!
培養細胞の位相差写真が素晴らしい。鞘翅目のになんか似てる。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-06 03:38
2011年 05月 05日

エサでメチレーションが変わってスプライシングも変わる:ミツバチ

Frank Lyko, Sylvain Foret, Robert Kucharski, Stephan Wolf, Cassandra Falckenhayn, Ryszard Maleszka
The Honey Bee Epigenomes: Differential Methylation of Brain DNA in Queens and Workers
PLoS BiologyNovember 2010 | Volume 8 | Issue 11 | e1000506

ミツバチは行動と繁殖の異なる2つのカースト、ワーカーとクイーンがいます。著者らは、エサ依存のphenotypesが脳のメチロームと相関を持ってるか持ってないかを調べるために、ワーカーとクイーンの脳のメチロームをショットガンバイスルファイトシーケンシングで調べました。

実験には、50頭の産卵してるクイーン(2.5wk old)と、15頭の8-d-oldのワーカーが用いられました。DNAを抽出し、バイスルファイト処理した後、GAⅡxでシーケンシングしました。データは131 million reads, 18.8Gb(10.2Gbクイーン, 8.6Gbワーカー)で260Mbのゲノムに対してx20のカバレッジでした。マッピングはBSMAPを使いました。68.5%がユニークにマップされました。数学的なことはRでやりました。だいたいBenjamini and Hochbergのやり方に従って統計しました。ESTと予測データベースをMysqlでつくり、Gbrouseで見たりしました。

550の遺伝子について、ワーカーとクイーンでメチレーションパターンが違ってました。454を使って8遺伝子について検証もしました。特にGB18602という遺伝子では、スプライシングとメチレーションの間に相関がありました。

こっちはBSMAP使ってますね。
擬陽性の問題があまり語られてないので、SOAPalignerよりこっちのがやっぱりいいのかも?

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-05 19:33
2011年 05月 05日

カイコゲノムのメチル化具合

昆虫ゲノムのメチル化具合について出てきました。
全体の>0.2%しかメチル化されてない上に、トランスポゾン、プロモーターはスルーで転写領域ばかりがメチル化されてるそうです。

Hui Xiang, Jingde Zhu, Quan Chen, Fangyin Dai, Xin Li, Muwang Li, Hongyu Zhang, Guojie Zhang, Dong Li, Yang Dong, Li Zhao, Ying Lin, Daojun Cheng, Jian Yu, Jinfeng Sun, Xiaoyu Zhou, Kelong Ma, Yinghua He, Yangxing Zhao, Shicheng Guo, Mingzhi Ye, Guangwu Guo, Yingrui Li, Ruiqiang Li, Xiuqing Zhang, Lijia Ma, Karsten Kristiansen, Qiuhong Guo, Jianhao Jiang, Stephan Beck, Qingyou Xia, Wen Wang & Jun Wang
Single base–resolution methylome of the silkworm reveals a sparse epigenomic map
Nature Biotechnology 28, 516–520 (2010)

虫のエピジェネティックな制御は多様な生物学的過程を持っている。今回著者らは、カイコのメチローム(methylome)について、1塩基単位の分析が可能なillumine high-throghput bisulfite sequencing(MethylC-Seq)を使って調べました。当初、0.11%のシトシンがメチルシトシンになっているだろうし、おそらくそれはCGで起きてると思いました。CGメチレーションは転写領域に集中しており、発現レベルと相関がありそうです。このことは、遺伝子発現に対してポジティブな作用を持っている事を示唆します。トランスポゾンとか、プロモーター、リボソーマルDNAは少ししかメチル化されていませんでしたが、対照的に、転写領域にあるsmall RNAは高密度にメチル化されてました。

"遺伝子のプロモータ領域にメチル化修飾を受けたシトシン塩基が遺伝子発現調節に関与していることが示唆されています。これらの調節機構を領域としてメチル化シトシンのパターンを検出するには、シーケンス反応をベースにした検出系が有効です。
ゲノムDNAにバイサルファイト処理を行なうとメチル化シトシンは変換されず、非メチル化シトシンのみがウラシルに変換されます。シーケンス反応としてウラシルはチミンとして表現されますので、バイサルファイト処理前後で生じるシトシンとチミン(ウラシル)の差異を配列データとして得ることができます。"Applied Biosystems社HPより引用

5令の大造の絹糸腺を液体窒素でサンプリング。bisulfite処理をしたtotalDNAをシーケンスしました。272,312,422readsがとれ、クオリティ低いの除いて133,765,113readsを使う事にしました。これは5.9Gbpで、カイコゲノムのシトシンのうち92%をカバーし、平均深度はx7.4です。0.67%のCG, 0.21%のCHG, 0.24%のCHHが最初にみつかりました。(H=A,C or T)non-CGメチル化はミツバチにおいては、非常に稀か存在しないと考えられるので、擬陽性を疑います。メチル化していると推定される部位のうち、どれだけがメチル化されているのかを旧来のシーケンスと454のシーケンスで確かめることにしました。ゲノム中から、26のmCGsを含む5部位、98のmCHHsとひとつのmCHGを含む3部位を選び、旧来のバイサルファイトPCRとシーケンスを行いました。すると、CG部位については92.3%のシトシンのメチル化が確認され、non-CG部位のメチル化は確認されませんでした。さらに、692 CGs, 29 CHGs and 63 CHHsを含む部位をバイサルファイトPCRしたのち、454でシーケンスしました。CG部位に付いては82.9%のメチレーションが確認され,non-CG部位のメチレーションは見つかりませんでした。ということは、カイコでもミツバチでもnon-CGのmGsは稀か存在しないでしょう。

擬陽性を除くために、dipthを上げる事にしました(※怪しいときにdipthを上げるのはGA使う研究のいつもの手)。絹糸腺を他の個体から取り出し、MethylC-Seqしました。今度は9.9Gb, dipth x9.0で取れました。さっきのと同じ事をしたら、983,395のmCsが見つかり、6割くらいがnon-CG部位でした。さっきのと比べてみたら、CG部位は大体一緒だったけどnon-CGは一緒じゃありませんでした。カイコの場合は非non-CG部位のmGsはほとんどすべてが擬陽性であるようです。

2つのMethylC-Seqに基づくmethylome解析の結果はよく一致しており、BS-PCRで確かめた191部位のうち、190部位については2回目の結果でも発見されました。
2つの結果を合わせる事で、最終的に173,505個のmGsについてのDNA methylation Mapを作りました。そのうちCG部位は99.2%でnon-CG部位は0.8%でした。BS-PCRの結果を鑑みるにMethylC-seqの結果の85.2%のmGCsが実際にメチル化されているので、ゲノム上の0.11%のシトシンがメチル化されているだろうと推察しました。これは、液クロを使った結果とも一致します。

メチル化の機能を調べるため、遺伝子、smallRNA、Transposable elements,ribosomal DNAのメチレーションプロファイルを見る事にしました。すると、遺伝子、cds,イントロン,small RNAがよくメチル化されており、TEsはわずかに、rRNAはまったくメチル化されていませんでした。

遺伝子の発現調節に関わっていそうなので、絹糸腺をつかって発現量を見てみました。illuminaのを使って2回はかりました。特にdnmt1とdnmt2(DNA methyltransferase)についてはRT-PCRも使って調べました。遺伝子を発現量を指標に5群にわけ、それぞれのメチル化具合と比較しました。メチル化の少ない遺伝子程よく発現していたので、転写領域についてはメチレーションの機能は植物やセキサク動物と同じなようです。でも、プロモーター部位に関しては相関がありませんでした。さらに、geneontologyを見ました。メチル化された遺伝子は結合活性に富み、転写制御因子を含みました。バイオロジカルプロセス、細胞の代謝や生合成プロセスに関わるところもメチル化されてました。一方、転写因子はメチル化されてませんでした。また、制御や接着にかかわるものもメチル化されてませんでした。



この研究ではmappingをSOAPalignerでやってました。44-nt pair-end 2mismatches , 75-nt pair-end 4mismatchesという具合です。BS-SEQだったら、こういうの使うんじゃないかと思ったんですが、>0.2という低いメチル化レベルのカイコだったら普通のmapperでも良いのかと思ってエキロロアンしましたー



人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2011-05-05 17:21