「ほっ」と。キャンペーン

<   2012年 11月 ( 1 )   > この月の画像一覧


2012年 11月 28日

貝の殻は血球が作ってるっぽい:カキゲノムの解析

ゲノムを想いながら食べればオイスターバーの楽しみも増えるかもしれません

Nature. 2012 Oct 4;490(7418):49-54. doi: 10.1038/nature11413. Epub 2012 Sep 19.
The oyster genome reveals stress adaptation and complexity of shell formation.
Zhang G, Fang X et al.


マガキのゲノムを得ることは、単にカキの研究のために役立つだけでなく、複雑なゲノムを解読するという点で重要な課題である。カキや他の海洋生物で、高レベルの多型があることが知られている。これを解決するために、近交系(4世代のfull-sibling mating) を作成しゲノムシーケンスを行った。

[ゲノム解読]

様々なインサート長のショートリードを得るとともに、フォスミドライブラリのショートリードを得た。ゲノム由来のショートリードのアセンブリによって(Fig1 dc)、500-600Mb と推定されるカキゲノムを再構築することは非常に困難であるが、ゲノムの一部から切り出して作成した40Kbのフォスミドであれば、比較的容易に再構築ができる(Fig1 ab)。それらを合わせることで複雑なゲノムを決定できると考えた。平均するとゲノムの155倍のデータを得た(TableS1)。フォスミドを作成してイルミナで読む方が、Roche-454で読んだりBAC-to-BACで読むよりも安いらしい。この方法でカキゲノムを決定した。559Mbだった。

ゲノムサイズの推定には...
フローサイトメトリー(鶏とゼブラフィッシュと比較して使う)、あるいはゲノム由来のショートリードのkmer distribution を用いる。後者の方法が右図。kmerというのは、塩基配列の中から任意の長さの配列を切り出したものである。例えばkmer length = 17で考えるとき、任意の17bpの配列は4^17種類ある。それらの配列が塩基配列の中に何回出てくるのかということを数えて(Depth)、それの頻度分布を求めると、(FigS1)のようになる。カキゲノム由来のこの図では、ピークが2つあるのでヘテロザイゴートな度合い(heterozygosity)が高いことがわかる。右端のDepthがx255以上のkmerは反復配列を示唆するが、それがショートリード全体の35%もあるので、カキゲノムは反復配列が多いことが推定される。

[ゲノム解析]
カキゲノムの多型について調べるために、wild型のカキのゲノムをシーケンスし、マッピングしてSNPとかInDelとかを探した。3.1MのSNPと258,405のInDelが見つかった。遺伝子の領域だけに限定すると、2,665個の遺伝子に3,094個のInDelがあった。また、反復配列について、既知の反復配列を参照してゲノム中の反復配列を探した。202Mb(カキゲノムの36%)が反復配列であるようだった。359個のtranspsaseと、779個のreverse-transcriptase がゲノム中に見つかり、それらの96%が転写されていることがトランスクリプトーム解析(後述)で分かった。wild型のカキのゲノムからは20,605個の欠失(>100bp)が見つかっており、これらの80%がトランスポゾンと一致していた。これらのことは、トランスポゾンが活性化していることを示唆する。

トランスクリプトーム解析は成体から器官別のサンプルを得、また、幼生から発生ステージ別のサンプルを得た。使われた器官は外套膜mantle (Man), エラgill (Gil), 貝柱adductor muscle (Amu), 消化腺digestive gland (Dgl), 血球hemocyte (Hem), 唇弁labial palp (Lpa) and 雌性腺female gonad (Fgo). 外套膜は外の端の方と、中の方とで分けた。For mantle, the outer edge (MO) along the margin of the shell and the inner pallial part (MI) covering the inner surface of the shell were dissected separately as two samples. 残り物A mixture of remaining tissues (Rem) was collected and included. Another two samples of female (G3) and male (Mgo) gonad were obtained from F1 offspring of family “G3” and included.幼生のステージは(Table S12)。

カキゲノムの遺伝子領域を決めるために3つの方法を使い、最後にGLEANでまとめた。28,027個の遺伝子が予測された。
RNA-seq: カキゲノムをリファレンスにトランスクリプトームのリードをTopHatでマッピングもの。
De novo: Augustus, SNAP, Glimmer-HMMでゲノムから遺伝子予測。
Homolog: 6種の無脊椎動物のタンパク配列をカキゲノムにTBLASTXでマッピングした(eVal<1E-5) (Capitella teleta, L. gigantea, Helobdella robusta, Anopheles gambiae, C. elegans, D. melanogaster)

カキゲノムに特徴的な遺伝子を知るために6種のゲノムと比較した。
(Nematostella vectensis, Strongylocentrotus purpuratus, Ciona intestinalis, C. elegans, D. melanogaster, Danio rerio and Homo sapiens.)
8,654個の遺伝子がカキ特異的な遺伝子であった(カキの遺伝子は28027個)。それらの遺伝子のGeneOntologyを調べると、”protein binding”, “apoptosis”, “cytokine activity”, “inflammatory(炎症) response” が多かった。biotic(病原菌とか)やabiotic(暑いとか)なストレスから身を守ってることが示唆された。色々な実験によって(”Manual examination shows”)、いくつかの遺伝子が防御のためのパスウェイト関連していることが分かった(Fig3a)。カキゲノム中には88個のヒートショックプロテイン70(HSP70)が含まれており、ヒト17個、ウニ39個と比べて非常に多い。

Fig S19ではHSP70を比較している。ウニから88個、Lottia gigantea (貝)から15個、その他37種の軟体動物から68個を集めてきた。71個のカキHSPはクラスター(系統上で)を形成しているので、それらはカキが独自に獲得してきた物ではないかと考えられる。
P450も発達していて、136個見つかった(ヒト57、ハエ78、アネモネ82、ウニ120)。また、P450がクラスター(ゲノム上で)を形成していた。

[カキのストレス応答]

カキのストレス応答を見る目的で9種のストレス環境での実験を行った。実験に用いたカキは、2歳で、殻の長さが9-12cmのものであった。20±0.5℃で水が循環するタンクで飼育した。塩分(salinity)は30±1、pHは8.0±0.3であった。カキたちは一日中スピルリナという藻のパウダーを食べて過ごした。

実験条件
Salinity: 5, 10, 15, 20, 25, 30, 40にして7日間飼育した。エラからRNAを取った。
Temperature: 5, 10, 15, 20, 25, 30, 35 °Cで飼育した。5-25℃では7日間、30, 35℃では12時間処理した。エラからRNAを取った。
Exposure to air: 5頭をよくエアレーションした海水中でタンクで飼育した(コントロール)。50頭を空のタンクに入れ,1, 3, 5, 7, 9, 10, 11日間処理した。エラと貝柱からRNAを取った。
Heavy Metals: 亜鉛(1 mg/L)で 0 h, 12 h, 5 d, 7 d, 9 d, 13 d処理。エラと消化腺からRNAを取った。5種の金属(亜鉛, 1mg/L; カドミウム, 100 μg/L; 銅, 100 μg/L; 鉛, 500 μg/L; 水銀, 20 μg/L; 亜鉛とカドミウム, 500μg/L と50μg/L,)12時間(急性毒性試験)と9日(慢性毒性試験)で処理した。

5,844の遺伝子が少なくともどれかの条件で発現量を変動させた。結構互いに重なっている(Fig3b)。空気に触れさせるのが一番多くの遺伝子を変動させた。カキにとって一番のストレスは空気ではないか。発現変動する遺伝子はパラログを持っている物が多かった(Fig3c)ことから、これらのストレス対応遺伝子がカキにとって重要であることが示唆された。

[カキの殻のでき方]

石灰化している殻はカキを守る。貝の殻はCaCO3の結晶がアラゴナイトとして存在するか、あるいは、カルサイト(方解石)を含んだ有機構造体(炭素)として存在する。また、貝の殻形成とのモデルとして2つの仮説がある。マトリックスモデルは、外套膜から分泌されたキチン、シルクフィブロインを酸化タンパクが石化することを仮定している。キチンとシルクタンパクは、構造の成分を提供し、酸化タンパクがCaCO3の結晶の核と成長をコントロールする。一方で、細胞モデルでは、石灰化が細胞の仲介によっておこるとする、すなわち、結晶が血球内で形成され、それから石化すべきところに沈着すると考える。

カキの貝殻のタンパクを、MSを使ってシーケンスし、配列をカキゲノムにマップすることで、貝殻タンパクを259個同定した。また、トランスクリプトームデータを参照した。キチンが含まれていることが示されたが、カキゲノムに含まれていたシルク様タンパクは全く見つからなかった。それだけでなく、代わりに多様な、構造を作っているタンパクが見つかった。特に、フィブロネクチンは発生の初期 (Fig 4a) や幼生の殻ができるときに発現しており、成体の外套膜で多く発現していた(Fig 4b)。フィブロネクチンはカキの殻でよくみつかるタンパクである。外套膜では典型的な細胞外マトリックス(ECM)タンパクも見つかっていて、殻が動物の結合組織や、基底膜に似ていることを示唆している。自己組織化するシルクフィブロインと異なり、ビブロネクチンが繊維を形成するためには細胞の仲介が必要である。カキフィブロネクチン様タンパクはインテグリンや細胞に結合するためのタイプⅢドメインを5つ持っている。そして、インテグリンを最も良く発現しているのは血球である。これらのことを合わせると、血球がフィブロネクチン様繊維形成を殻のところで行っていると考えられる。
殻形成に細胞が深く関わっていることは、殻から見つかったタンパクからも支持できる。house keeping タンパクが殻から見つかっている。実は、カキの殻のタンパク質の多くは、構造タンパク質ではなく、多様な代謝経路の遺伝子なのである(Fig 4c)。これらの多様な機能をもったタンパクが、殻タンパクに含まれていることは細胞がいたことを反映している。これは、マトリックスモデルでは全く想定されていなかったことである。さらに、259個の殻タンパクの84%は分泌性タンパクではない。それらは細胞の一部であったか、あるいはエキソソームによって沈着させられたのである。61個の殻タンパクがエキソソームデータベースのタンパクと一致していたことも、エキソソームの存在を示唆する。カルサイト結晶を含んだ細胞やエキソソーム様小胞が石化部分で見つかっている(Science. 2004 Apr 9;304(5668):297-300.”Hemocyte-mediated shell mineralization in the eastern oyster.” Mount AS, Wheeler AP, Paradkar RP, Snider D.)にも関わらず、それらの殻形成における重要性は議論されてきた。本研究はそれらの細胞が殻の中にいたことや、殻形成に参加している分子的な証拠を提示する。

--------------------------------------------------------------------------------

JC用のメモを流用したので訳っぽい雰囲気...
ゲノム解析して何がわかるんだよ、ってのに答えるのにとってもいい論文だと思います。
最後の貝殻の話で血球がでてきたのでとても興奮しました。昆虫の顆粒細胞が酸素を運搬してるかもしれない(昆虫にも肺) なんて話もあって、血球ってすごく多機能なんじゃないかと個人的には思っています。

ゲノムサイズをkmerで推定するところがやっぱりピンと来なかったのですが、サプリメンタルをみると"ゲノムサイズGは(kmerの総数)を(kmerの最大頻度)で割って求めた"って書いてありました。実際これをどうやって計算するのか&どうして求められるのかってのは seq. an. でも話題になっていて パンダのときから気になってました。ちょっと考えたのでメモをば

一般にゲノムシーケンスした時のカバレッジ(Cov.)はシーケンス塩基総数をゲノムサイズで割ったものになります。
De novo genome 解析の場合、シーケンス塩基総数は(シーケンスして得たんだから)分かってて、ゲノムサイズは不明です。じゃあカバレッジ(Cov.)はどうなるのか。
kmer distribution のグラフをみると(カキゲノム論文のFig S1とか)、左端に激坂、x46に小山、x92に大山があって、あとはたぶんロングテールです。で、x46とx92の山ができるのが大事です。
kmer length = 17bp の時、考えられるkmerの種類は4の17乗通りで17,179,869,184通りになります。生物のゲノムサイズなんてせいぜい数Gなので、同じkmerがゲノム中に何度も出てくるとは考え難いです。もちろん反復配列とかはkmer distribution の右の方に吸われて行きますし、偶々被ってるところがあって決まった被り回数の組み合わせがよっぽどの数ないと山はつくれないです。逆に言うと小山と大山はそうとうのもんです。じゃあこの大山と小山はなにかと言うと、大山がゲノム中に1回しか出てこないkmer達の山で、小山はゲノム中に1/2回しか出てこない山です。1/2回と言うのは、ヘテロザイゴートなところのことです。カキは2倍体が基本なので、2nのそれぞれが同じところもあれば、違うところもあります。で、違うところが1/2回としてでてくるんです。たぶん

ここで、ちょっと戻ってもらって、カバレッジ(Cov.)はどうなるのかっていうと
大山はゲノム中に1回しか出てこなくて、そいつがx92だって言うんだからCov.は92なんです。
僕はぴんと来なかったので絵を描いてたんですけど、ゲノム上にとある一度しか出てこない17bpの配列があって、今回シーケンスした全てのデータの中にその配列が92回含まれてたならこれはもうCov. = 92 でしょう。

最初の "ゲノムシーケンスした時のカバレッジ(Cov.)はシーケンス塩基総数をゲノムサイズで割ったもの" に戻ると、
カバレッジ←既知(x92)
シーケンス総数←既知(少なくとも実験者は)
なので、ゲノムサイズがそれらの割り算で出てきます。
たぶんあってると思うのですけどDe novo genome 解析は専門じゃないので間違ってたら教えて下さい。

あと、スプライシングバリアントは見てないそうです(当時)

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2012-11-28 03:14