「ほっ」と。キャンペーン

カテゴリ:未分類( 99 )


2017年 12月 31日

はじめまして!

はじめまして!
昆虫に関する論文、細胞に関する論文、培養に関する論文を好んで読んでいます。

人気ブログランキングに参加しています。
本家に追いつけるように、サボらないように頑張りますので応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2017-12-31 23:59
2016年 12月 14日

R作図 軸を省略する

軸を途中波線で省略したい時の作図
データは下記の通り。data.txtとする。

pbentropyhyst
09.9582011
010.391451
010.550411
0.2510.177021
0.2510.36021
0.2510.434361
18.1718641
17.5698931
18.0024861
2.57.6817491
2.57.3344651
2.58.0597491
12.58.0045861
12.57.5191571
12.57.9314761
010.128374
09.7516554
010.264994
0.259.3499724
0.2510.220824
0.259.1107974

data<-read.table("data.txt",header=T)
attach(data)
options(repos="http://cran.md.tsukuba.ac.jp")
library(plotrix)
plot(log(pb+0.09),entropy,xaxt="n",xlab="mM (Drug concentration)",ylab="Hij (transcriptome diversity)",pch=ifelse(hyst<2,1,3))
axis(side=1,at=c(log(0.09),log(0.25+0.09),log(1+0.09),log(2.5+0.09),log(12.5+0.09)),labels=c("0","0.25","1.0","2.5","12.5")) #軸に好きな点を数字を書き足してる
axis.break(1,log(0.15)) #線に切り込みを入れてる

e0160319_14401994.png

http://dx.doi.org/10.1371/journal.pone.0144822.g001

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2016-12-14 14:41
2016年 06月 24日

培養改善を目指した開発を行う前に確認しておきたいトランスクリプトーム

数十mlのフラスコでの培養の結果と、数Lのジャーでの培養の結果が一致しないことはよくあります。というか、ほとんど一致しないと思います。
その原因をアレイで調べ、培養方法を変えてフラスコとジャーの結果を一致させた研究です。

PMID: 25271019
Hypoxia influences protein transport and epigenetic repression of CHO cell cultures in shake flasks

著者らの先行研究で、フラスコ培養において銅の添加が細胞増殖や組み替えタンパク質生産量が改善できるというものがありましたが、ジャーで再現することができませんでした。
フラスコとジャーが一致しなかった原因を調べるため、それぞれで培養したCHO細胞をマイクロアレイで分析しました。
分析の結果、
タンパク質の細胞内輸送に関わる遺伝子の発現量がフラスコ培養<ジャー培養、
エピジェネティック制御に関わる遺伝子の発現量がフラスコ培養>ジャー培養、
となっていた他、低酸素状態で発現する遺伝子の発現がフラスコ培養>ジャー培養となっていました。

そこで、先の銅添加による培養改善効果をジャーで再現するため、ジャーでの培養を元々のDO60%からDO15%に下げて実験を行いました。
DOを15%まで下げた結果、金属イオン(銅とか鉄とか、と論文中にはフワッとした記述)による培養改善効果がジャーで再現したとのことです。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking


培養改善のための開発を行う前に、実生産タンク培養中のCHO細胞のデータと開発時の評価系に用いる培養中のCHO細胞のデータを比べておいて、ここならこの系で開発しても実生産タンクに持っていけるなっていうのを確認しようと思いました。
[PR]

by koretoki | 2016-06-24 17:15
2016年 06月 21日

自殺を止めて増産させる:アレイから見つけた遺伝子が実際に良い遺伝子であった例

前回に引き続き「トランスクリプトーム解析から見つけた遺伝子が実際に良い遺伝子だった」例を取り上げます。
今回の研究は、アレイで良い遺伝子を見つける論文と、見つけた遺伝子の良し悪しを調べた論文に分かれています。

アレイで良い遺伝子を見つける方
PMID: 16570314
Transcriptional profiling of apoptotic pathways in batch and fed-batch CHO cell cultures.
培養細胞を用いたタンパク質製造工程では、培養皿の代わりにジャーなどを使ってバッチ培養(BC)、またはフェドバッチ培養(FBC)を行います。バッチとはフラスコに張り込んだ培地に細胞を加え、途中一切培地等の添加を行わずに最後まで培養を行うものです。フェドバッチ培養では、培養の経過に伴ってフィード培地を加えます。また、pH、DO等をコントロールすることも多いです。FBCの方が長期間培養可能ですが、いずれの培養においても最終的に細胞は死滅します。死滅の原因はアポトーシスと考えられますが、小胞体ストレスへの応答としてのアポトーシスなのか、DNA損傷などによるミトコンドリアを介したアポトーシスなのか、もしくはサイトカインによるシグナルを受けてのデスレセプターからくるアポトーシスなのかがわかっていませんでした。

著者らはCHO細胞をBCまたはFBCで培養し、培養中の細胞死が主にアポトーシスに由来することを確かめると共に、マウスのマイクロアレイを用いて培養中のCHO細胞の遺伝子発現変動を調査しました。

以下メモ。

デスレセプター関連
FasL:BCのコンルフエントになった時期(stationary phase: Stat)で発現上昇(↑)。FBCの死につつある時期(death phase: D)で発現減少(↑)。
Fadd:BC、FBCのStatで↑
Rip1:BCのStatで↑。FBC変化なし。
Casp8:BCのStatで↑。FBC変化なし。
※BCでは、FaddとRip1が共に↑で、協働によるCaps8↑(既報)が起きた。
※FBCではCD95を介したシグナルの方がTNF−R1、DR3を介するより優先。Farm、Btk、Cashの動きも一致。

ミトコンドリア関連
Bim:BC、FBCのStatで↑
Bad:BC、FBCのStatで↑
※Bim、BadはBax、Bakが無いとアポトーシス起こせない。
Bcl2-L10:BC、FBCのDで↑。ミトコンドリアからのチトクロームc放出を邪魔。
Casp9:BCのStatで↑。FBC変化なし。
※BCでのCasp8、Casp9の↑、それらが引き起こすCasp3下流のCasp11、DNase1、DNase、Dffaの↑はBCでデスレセプター、ミトコンドリアを介在したアポトーシスが起きているため。BCだから栄養不足で仕方ない。

小胞体関連
Ire-1:↓
Casp7:↓
※小胞体ストレスはかかっていない。

その他
Alg-2:BC、FBCのStatで↓。機能不明。
Requiem:BC、FBCのStatで↑。

次の論文に持ち込む4遺伝子
Fadd:BC、FBCのStatで↑だった。Rip1と揃うとCasp8を発現させるから片方KOしたい。
Alg-2:メカニズムはわからないが、BC、FBCの対数増殖期後期で↑だし、アポトーシス関連らしい。
Requiem:FBCのStatの初期に↑。メカニズム不明。
Faim:経路の図に載っていないが、FBCの初期に↓。



4つの遺伝子を評価した論文
PMID: 16894638
Targeting Early Apoptotic Genes in Batch and Fed-Batch CHO Cell Cultures

先のマイクロアレイを用いた研究で絞り込んだ、CHO細胞のアポトーシスの初期を支配していそうな遺伝子について、介入を行っていきます。
Faim: overexpression
Fadd: Dominant negative
Alg-2: siRNA knockdown
Requiem: siRNA knockdown
siRNAはp.SUPERベクターに入れて細胞に作らせています。

いずれの区でも、タンパク質生産量がコントロールより良くなりました。
BC: Requiem>Fadd>Alg-2>Faim>ctrl
FBC: Requiem>Alg-2>Faim>Fadd=ctrl
FBCで、Fadd遺伝子への介入があまり効果がなかったことは、元々FBCではFadd下流のCasp9、Casp3を介したアポトーシスが起きていなかったことと一致します。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking


上記の研究では、比較的少ない~50mg/Lでのタンパク質生産を扱っていたために小胞体ストレスによるアポトーシスが起こっていなかった可能性もあります。
最近のCHO細胞は抗体であれば20倍以上作るので、それぞれについてアポトーシス経路のモニタリングをやろうと思いました。
[PR]

by koretoki | 2016-06-21 05:43
2016年 06月 18日

医薬品製造用CHOにも使えるゲノム編集技術:RNA-seqから見つけた遺伝子が実際に良い遺伝子であった例

「RNA-seqから見つけた遺伝子が実際に良い遺伝子であった例」をよく求められるのですが、これはRNA-seqで見つけた6遺伝子のうち2個でknockoutすると良いことがあった例です。
あと、CHOの論文で5番目の著者がCHOさん。

PMID: 26854539
Targeted gene deletion using DNA-free RNA-guided Cas9 nuclease accelerates
adaptation of CHO cells to suspension culture
工業的なタンパク質生産に用いるCHO細胞は無血清培地に馴化させており、また、足場のない浮遊細胞を行います。著者らは、ゲノム編集技術を用いてCHO-K1細胞の無血清・浮遊培養への馴化促進を試みました。

まず開発の対象を得るため、CHO-K1細胞を無血清培地で浮遊培養して馴化させました。継代は10回行い、7回目ほどで馴化が完了したようです。馴化中の細胞及び馴化後の細胞についてRNA-seqを行い、DESeqを用いて発言変動遺伝子(DEG)を抽出しました。得られたDEGより、馴化に伴って発現の減少するDEGとして減少幅の大きい6遺伝子を選抜しました。
次に、それらの6遺伝子についてDNA-free RNA-guided Cas 9の系を用いてknockout したCHO-K1細胞を作成し、無血清・浮遊培養への馴化を行いました。結果、6遺伝子中2個の遺伝子については、それぞれのknochoutによって馴化が促進されました。また、アンプリコンシークエンスにより、馴化前後で細胞集団中のknochoutが成功している細胞の割合を調べたところ、馴化促進効果のあった2遺伝子については、knochoutの成功している細胞が集団中の割合を増加させていました。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking


元々CHO細胞の無血清浮遊化にかかる期間は1ヶ月程度ですので、ゲノム編集の手間を考えると実用性には疑問がありますが、RNA-seqで見つけた良さそうな遺伝子の答え合わせの例題としてクリアであると思います。通常のCRISPR/Cas9の系ではプラスミドやレンチウィルスの配列がホスト細胞ゲノムに導入されてしまうことがあり抗体医薬製造用の細胞開発では不適切であるため、CHO細胞のゲノム編集にはDNA-free な編集系の適用が必要であると著者らは述べており、ここが本研究の重心のようです。なので、DEGを得るためにどのサンプル間で比較したのかがわからなかった点、シークエンスした細胞のうち1つの実験区でのみ培養初期(培地に細胞を播種してすぐ)にサンプリングを行ってしまった点(なのでひとつだけPCAで外れてる)も致し方ないのかなと思いました。
[PR]

by koretoki | 2016-06-18 11:49
2016年 06月 16日

6x8x8 人工イクラ細胞アレイ

産業用の動物細胞の研究開発では、増殖や生産性が良くなることを期待して培地を改造することがあります。アミノ酸、ビタミン、乳酸、グルタミン酸など多数の培地成分について濃度を振って培養試験を行うためサンプル数が多くなりがちなので、どうやって捌くかが悩みの種になっています。
タンパク質製造のための細胞の培養試験では、細胞数、生産タンパク質濃度の他、糖や乳酸などの代謝物の測定を行うことが多いのですが、細胞数の測定の自動化の点で特に問題がありました。例えば、最も普及している自動細胞数測定装置であるvicellは、一度の測定に500μLのサンプルを要求します。同時に多くの試験を行うにはひとつひとつの培養を小さくしたいのですが、小さくし過ぎると細胞数が数えられなくなってしまうのです。
そこで著者らは、侵襲性のある方法ではあるものの細胞数を測定可能な小さな培養系を用いることにしました。

PMID 24227746
Microarray platform affords improved product analysis in mammalian cell growth studies

培養系の構築は下記の通りです。
polystyrene-co-maleic anhydride でコートしたガラス板の上にpoly-L-Lysineと塩化バリウムの混合液をスポットします。スポットにはMicrosSys 5100-4SQ microcontact microarray spotter という装置を用いるようです。
スポットが十分に乾いたら、200細胞を含んだ60nlの培養液をその上にスポットします。ここで、培養液には、アルギン酸が1%溶かされています。元のスポットに含まれるバリウムがアルギン酸を架橋してアルギン酸バリウムゲルになります。ちなみに人工イクラはアルギン酸カルシウムゲルです。
このようにして固定した細胞を含むゲルたちを、培地で封入して乾燥を防ぎます。

実験終了後はガラス板上に固定したままインビトロジェンのlive/dead viability/ cytotoxicity kit for mammalian cellsを用いて生細胞数を測定することができます。

論文中ではこの系を用いて培地の改変を行っています。



ひとつのガラス板には6x8個の培養をつくることができ、ひとつの装置にはガラス板が8枚乗るそうなので、6x8x8で384の培養をつくることができます。10日間の培養中に4回測定するとしてn=5でやっても20。ひとつの装置で20ほどの条件を調べることができる計算です。
著者らが引用していたambr15は15mL程度のバイオリアクターを24個並列に実験可能ではありますが、ambr15はクリーンベンチひとつ独占するので単位ラボ面積あたりでは利点がありそうです。

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking


96穴プレート振るのと比べて果たして買うかなと思いました。
一方で、培地の最適化で使う材料はなるほどなと思いました。
[PR]

by koretoki | 2016-06-16 11:43
2014年 09月 09日

ダーウィンは一回だけevolved と書いた

wiki見てたら"ダーウィンは、『種の起源』の中で、evolution ではなく、Descent with modification という単語を使っている。これは Evolution という語が進歩や前進を意味しており、ダーウィンは進化にそのような意味を込めていなかったからである。" とあったので The Origin of Species を眺めてみた。

The Origin of Species
http://www.literature.org/authors/darwin-charles/the-origin-of-species/index.html

evolve 一個だけ
"There is grandeur in this view of life, with its several powers, having been originally breathed into a few forms or into one; and that, whilst this planet has gone cycling on according to the fixed law of gravity, from so simple a beginning endless forms most beautiful and most wonderful have been, and are being, evolved."

一方、変化を伴う由来(Descent with modification)の方はそこら中にでてきた。

-----

descent の数を数えた。少ない時は引用した。

http://www.literature.org/authors/darwin-charles/the-origin-of-species/preface.html

In 1846 the veteran geologist N. J. d'Omalius d'Halloy published in an excellent though short paper ("Bulletins de l'Acad. Roy Bruxelles,' tom. xiii. p. 581) his opinion that it is more probable that new species have been produced by descent with modification than that they have been separately created: the author first promulgated this opinion in 1831.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-01.html

May not those naturalists who, knowing far less of the laws of inheritance than does the breeder, and knowing no more than he does of the intermediate links in the long lines of descent, yet admit that many of our domestic races have descended from the same parents may they not learn a lesson of caution, when they deride the idea of species in a state of nature being lineal descendants of other species?

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-02.html

The term 'variety' is almost equally difficult to define; but here community of descent is almost universally implied, though it can rarely be proved.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-03.html

There is no exception to the rule that every organic being naturally increases at so high a rate, that if not destroyed, the earth would soon be covered by the progeny of a single pair. Even slow-breeding man has doubled in twenty-five years, and at this rate, in a few thousand years, there would literally not be standing room for his progeny. Linnaeus has calculated that if an annual plant produced only two seeds and there is no plant so unproductive as this and their seedlings next year produced two, and so on, then in twenty years there would be a million plants. The elephant is reckoned to be the slowest breeder of all known animals, and I have taken some pains to estimate its probable minimum rate of natural increase: it will be under the mark to assume that it breeds when thirty years old, and goes on breeding till ninety years old, bringing forth three pairs of young in this interval; if this be so, at the end of the fifth century there would be alive fifteen million elephants, descended from the first pair.

So it is when we travel northward, but in a somewhat lesser degree, for the number of species of all kinds, and therefore of competitors, decreases northwards; hence in going northward, or in ascending a mountain, we far oftener meet with stunted forms, due to the directly injurious action of climate, than we do in proceeding southwards or in descending a mountain. When we reach the Arctic regions, or snow-capped summits, or absolute deserts, the struggle for life is almost exclusively with the elements.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-04.html

"descendants" "descends" 等54カ所

Natural Selection * its power compared with man's selection * its power on characters of trifling importance * its power at all ages and on both sexes * Sexual Selection * On the generality of intercrosses between individuals of the same species * Circumstances favourable and unfavourable to Natural Selection, namely, intercrossing, isolation, number of individuals * Slow action * Extinction caused by Natural Selection * Divergence of Character, related to the diversity of inhabitants of any small area, and to naturalisation * Action of Natural Selection, through Divergence of Character and Extinction, on the descendants from a common parent * Explains the Grouping of all organic beings

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-05.html

14カ所

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-06.html

15カ所

Difficulties on the theory of descent with modification * Transitions * Absence or rarity of transitional varieties * Transitions in habits of life * Diversified habits in the same species * Species with habits widely different from those of their allies * Organs of extreme perfection * Means of transition * Cases of difficulty * Natura non facit saltum * Organs of small importance * Organs not in all cases absolutely perfect * The law of Unity of Type and of the Conditions of Existence embraced by the theory of Natural Selection

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-07.html

No complex instinct can possibly be produced through natural selection, except by the slow and gradual accumulation of numerous, slight, yet profitable, variations. Hence, as in the case of corporeal structures, we ought to find in nature, not the actual transitional gradations by which each complex instinct has been acquired for these could be found only in the lineal ancestors of each species but we ought to find in the collateral lines of descent some evidence of such gradations; or we ought at least to be able to show that gradations of some kind are possible; and this we certainly can do.

For no amount of exercise, or habit, or volition, in the utterly sterile members of a community could possibly have affected the structure or instincts of the fertile members, which alone leave descendants. I am surprised that no one has advanced this demonstrative case of neuter insects, against the well-known doctrine of Lamarck.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-08.html

10カ所

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-09.html

14カ所

"revolution"
He who can read Sir Charles Lyell's grand work on the Principles of Geology, which the future historian will recognise as having produced a revolution in natural science, yet does not admit how incomprehensibly vast have been the past periods of time, may at once close this volume.

From these and similar considerations, but chiefly from our ignorance of the geology of other countries beyond the confines of Europe and the United States; and from the revolution in our palaeontological ideas on many points, which the discoveries of even the last dozen years have effected, it seems to me to be about as rash in us to dogmatize on the succession of organic beings throughout the world, as it would be for a naturalist to land for five minutes on some one barren point in Australia, and then to discuss the number and range of its productions.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-10.html

25カ所

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-11.html

13カ所

"revolution"
Several facts in distribution, such as the great difference in the marine faunas on the opposite sides of almost every continent, the close relation of the tertiary inhabitants of several lands and even seas to their present inhabitants, a certain degree of relation (as we shall hereafter see) between the distribution of mammals and the depth of the sea, these and other such facts seem to me opposed to the admission of such prodigious geographical revolutions within the recent period, as are necessitated in the view advanced by Forbes and admitted by his many followers.

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-12.html

6カ所

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-13.html

79カ所

"revolve"

Would it be thought sufficient to say that because planets revolve in elliptic courses round the sun, satellites follow the same course round the planets, for the sake of symmetry, and to complete the scheme of nature? An eminent physiologist accounts for the presence of rudimentary organs, by supposing that they serve to excrete matter in excess, or injurious to the system; but can we suppose that the minute papilla, which often represents the pistil in male flowers, and which is formed merely of cellular tissue, can thus act?

http://www.literature.org/authors/darwin-charles/the-origin-of-species/chapter-14.html

33カ所

"revolution"
When the views entertained in this volume on the origin of species, or when analogous views are generally admitted, we can dimly foresee that there will be a considerable revolution in natural history.

"evolved"
There is grandeur in this view of life, with its several powers, having been originally breathed into a few forms or into one; and that, whilst this planet has gone cycling on according to the fixed law of gravity, from so simple a beginning endless forms most beautiful and most wonderful have been, and are being, evolved.




人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2014-09-09 12:20
2014年 05月 23日

genome.fa とtranscripts.gtf でtranscripts.fa をつくる


genome.fa とtranscripts.gtf でtranscripts.fa をつくる

編集 | 削除
tophat-cufflinks を使ってtranscripts.gtf は手に入れたもののtranscripts.fa がないから遺伝子見るの大変、とか、何でか知らないけどtranscripts.gtf しか貰えなかったパターンのときにtranscripts.fa を作らないといけない状況になります。

#transcripts.gtf とgenome.fa からtranscripts.fa を作る。
#transcripts.gtf を加工1
more transcripts.gtf | awk -F "\t" '{print $1"\t"$3"\t"$4"\t"$5"\t"$9}' | grep exon | awk '{print $1"\t"$3"\t"$4"\t"$6"\t"$8"\t"$10}' | tr -d "\"" | tr -d ";" | awk '{print "transcript_id_"$5"\t"$1"\t"$2"\t"$3"\t"$6}' | awk '{print $1"\t"$2"\tsubstr($2,"$3","$4-$3+1")\t"$5/100"0"}' | awk '{print $1"\t"$2"\t"$3"\tn"substr($4,3,2)}' | sed -e '/n01/s/subs/@subs/g' | awk '{print $3}' | tr -d "\n" | tr "@" "\n" | grep substr > temp1.txt
#transcripts.gtf の加工2
more transcripts.gtf | awk -F "\t" '{print $1"\t"$3"\t"$4"\t"$5"\t"$9}' | grep exon | awk '{print $1"\t"$3"\t"$4"\t"$6"\t"$8"\t"$10}' | tr -d "\"" | tr -d ";" | awk '{print "transcript_id_"$5"\t"$1"\t"$2"\t"$3"\t"$6}' | awk '{print $1"\t"$2}' | uniq > temp2.txt

#genome.fa を1行にしておく
more genome.fa | sed -e '/>/s/$/@/g' | tr -d "\n" | tr ">" "\n" > line_genome.txt

#transcripts.gtf の情報を使って
paste temp2.txt temp1.txt | head -n 10
transcript_id_CUFF.1.1NODE_1000_length_89123_cov_46.018040substr($2,2,2497)
transcript_id_CUFF.2.1NODE_1000_length_89123_cov_46.018040substr($2,3291,1003)substr($2,4409,646)

#こういうコマンドをつくりたい
more line_genome.txt | grep NODE_1000_length_89123_cov_46.018040 | awk -F "@" '{print ">transcript_id_CUFF.1.1@"substr($2,2,2497)}' | tr "@" "\n" >> transcripts.fa
>transcript_id_CUFF.1.1
CGTAGTAGTATCGATCGTATCTACTATCGTACGTAGCTAGTCGATGCTAGTCGTAGCTAACTCGATCGATCGTAGTCTGTTAGCTAGCTGATCGTAGCTAGCTGATCGTAGCTAGCTGATCGTAGCTAGCTGATCGTAGCTGATCGTAGCTGATGCTGTAGCTGATCGTAGCTGATCGTAGCTAGTCTAGCTGATGCTAGCTGATCGTAGCTAGCTGATCGTAGCTAGCTGATGCTAGCTGATCGTAGCTGATCGTAGCTAGCTGATCgTAGCTAGCTTATCGTGTAGTCGTAGCTAGCTGATCGTAGCTAGATAAAAACGGGGATCGATCGTAGCTAAAAAGCTTTTTTTGAAAAATCGTAGCTGATGCTAGCTGATGCTGTAGTGTGTGATTTATATTACTAGCTAGCCCCATGCTAGTCGATCACACAC

#transcripts.gtf の情報を使ってコマンドを作る
paste temp2.txt temp1.txt | awk '{print "more line_genome.txt | grep "$2" | awk -F \"@\" %{print \">"$1"@\""$3"}% | tr \"@\" \"\\n\" >> transcripts.fa"}' | tr "%" "'" > make_transcripts.sh

#準備ができたら実行
sh make_transcripts.sh

#できる
ls

genome.fa
transcripts.gtf
temp1.txt
temp2.txt
line_genome.txt
make_transcripts.sh
transcripts.fa <- NEW!!!


終わってから気づいたけどこれでいいじゃん

http://cufflinks.cbcb.umd.edu/gff.html

Extracting transcript sequences
The gffread utility can be used to generate a FASTA file with the DNA sequences for all transcripts in a GFF file. For this operation a fasta file with the genomic sequences have to be provided as well. For example, one might want to extract the sequence of all transfrags assembled from a Cufflinks assembly session. This can be accomplished with a command line like this:

gffread -w transcripts.fa -g /path/to/genome.fa transcripts.gtf

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2014-05-23 15:00
2014年 01月 09日

makeblastdb

makeblastdb -in ref.fa -dbtype nucl -hash_index
blastn -db ref.fa -query que.fa -outfmt 6 > blastout.txt

makeblastdb -in ref.pep.fa -dbtype prot
blastp -db ref.pep.fa -query que.pep.fa -outfmt 6 > blastout.txt
[PR]

by koretoki | 2014-01-09 12:25
2014年 01月 07日

メタボデータをくっつけた

メタボローム解析の反復データをひとつにまとめたい。
n=3のものとn=1のものを比べたいのだけど、できればn=3全部使いたい。
(a1+a2+a3)/3 ってやっていいのかわからなかったから調べてみた。

#もともと持っているのはこんなデータ。いわゆるMartixとして得られたデータである。
name a1 a2 a3
CYT001 0.0007330321 0.0004886212 0.0008590029
CYT002 0.1763202000 0.1228157000 0.1730612000
CYT003 0.0137760700 0.0123575800 0.0164345100
CYT004 0.0121694300 0.0103101300 0.0095795930
CYT005 0.0008732506 0.0006902750 0.0008904565
CYT006 0.0007769990 0.0005277728 0.0005936377
CYT007 0.0010050660 0.0005964599 0.0010336850
CYT008 0.0000000000 0.0000000000 0.0000000000
CYT009 0.0000000000 0.0000000000 0.0000000000
CYT010 0.0005402510 0.0004378932 0.0003912269
CYT011 0.0000000000 0.0000000000 0.0000000000
CYT012 0.0000000000 0.0000000000 0.0000000000
#(これがずっと続いてる)

#R様に読んでいただく。
> data<-read.table("data.txt",header=T,row.names=1)
> attach(data)
> summary(data)
a1 a2 a3
Min. :0.0000000 Min. :0.0000000 Min. :0.0000000
1st Qu.:0.0003296 1st Qu.:0.0002691 1st Qu.:0.0000955
Median :0.0015751 Median :0.0015310 Median :0.0010649
Mean :0.0696770 Mean :0.0660012 Mean :0.0445601
3rd Qu.:0.0200691 3rd Qu.:0.0198329 3rd Qu.:0.0128484
Max. :2.4163290 Max. :2.2341410 Max. :1.5474730

#読んでいただけた。実際にはデータが全部表示されるが省略。
> data
a1 a2 a3
CYT001 0.0007330321 0.0004886212 0.0008590029
CYT002 0.1763202000 0.1228157000 0.1730612000
CYT003 0.0137760700 0.0123575800 0.0164345100
CYT004 0.0121694300 0.0103101300 0.0095795930
CYT005 0.0008732506 0.0006902750 0.0008904565
CYT006 0.0007769990 0.0005277728 0.0005936377
CYT007 0.0010050660 0.0005964599 0.0010336850

#総和がこんなにズレてる...
> sum(a1)
[1] 15.53798
> sum(a2)
[1] 14.71827
> sum(a3)
[1] 9.936896

#これをそのままプロットして1:1のところに線引いてみる。
> plot(a1,a3)
> abline(0,1,col="red")
e0160319_1135217.png

#ずれずれっぽいけどよく見えないからlog
> plot(log(a1),log(a3))
> abline(0,1,col="red")
e0160319_114586.png


#とりあえず総和で割ればいけそう
> plot(log(a1/sum(a1)),log(a3/sum(a3)))
> abline(0,1,col="red")
e0160319_1152369.png


(a1/sum(a1)+a2/sum(a2)+a3/sum(a3))/3
すればとりあえず物質間の比については使えるデータになりそう。
a1*x+a2*y+a3*zの形にしたい。
総和でも良さそうだけど怖いから回帰で比を出してもらうことにした。

#それぞれ回帰してもらう
#回帰モデルする
> fit_12<-lm(a1~a2)
> fit_23<-lm(a2~a3)
#中見る1vs2
> fit_12

Call:
lm(formula = a1 ~ a2)

Coefficients:
(Intercept) a2
-0.0005735 1.0643829
#中見る2vs3
> fit_23

Call:
lm(formula = a2 ~ a3)

Coefficients:
(Intercept) a3
0.006123 1.343758

#調節する時にかける値は
x:y=1:1.0643829
y:z=1:1.343758
x:y:z=1:1.0643829:1.430273=0.2861512:0.3045745:0.4092743

0.2861512*a1+0.3045745*a2+0.4092743*a3 で欲しい値が取れる。

#総和の比でやると
> sum(a1)
[1] 15.53798
> sum(a2)
[1] 14.71827
> sum(a3)
[1] 9.936896
> sum(a1)/sum(a2)
[1] 1.055693
> sum(a2)/sum(a3)
[1] 1.481174
> #x:y=1:1.055693
> #y:z=1:1.481174
> 1.055693*1.481174
[1] 1.563665
> #x:y:z=1:1.055693:1.563665
> 1*1/(1+1.055693+1.563665)
[1] 0.2762921
> 1*1.055693/(1+1.055693+1.563665)
[1] 0.2916796
> 1*1.563665/(1+1.055693+1.563665)
[1] 0.4320283
> #x:y:z=1:1.055693:1.563665=0.2762921:0.2916796:0.4320283

総和の方が強い?補正になってるのは、値の大きな子が引っ張ってるのかなー?

#回帰で求めた比がちゃんとハマるか心配
> plot(a1,a2)
> abline(0,1/1.0643829,col="red")
> plot(a2,a3)
> abline(0,1/1.343758,col="red")
> lm(a3~a1)

Call:
lm(formula = a3 ~ a1)

Coefficients:
(Intercept) a1
-0.00182 0.66564

> plot(a3,a1)
> abline(0,1/0.66564,col="red")

#logでもハマるか一応
> plot(log(a1),log(a2))
> e<-exp(1)
> e
[1] 2.718282
> abline(-log(1.0643829),1,col="red")
> plot(log(a2),log(a3))
> abline(-log(1.343758),1,col="red")
> abline(0,1,col="blue")
> plot(log(a3),log(a1))
> abline(0,1,col="blue")
> abline(-log(0.66564),1,col="red")

e0160319_116455.png


赤線が回帰の線
青線は1:1の線

人気ブログランキングに参加しています。
応援よろしくお願いします。
FC2 Blog Ranking

[PR]

by koretoki | 2014-01-07 01:18