bioinformatics

大量の fastq をトリミング "Trimmomatic"

大量の fastq をトリミングしたかったので。 以下のように、fastq データがあるときに while read で2行ずつ読み込んで処理する方法。 $ find | grep fastq.gz RUN001_1.fastq.gz RUN001_2.fastq.gz RUN002_1.fastq.gz RUN002_2.fastq.gz RUN003_1.fastq.gz…

gtf から転写物配列取得 "gffread"

この記事では、gtf を使って、リファレンス配列から転写物の配列を切り出す方法を紹介します。 gffread は cufflinks の昨日のうちの一つで、 gtf <-> gff の変換もできます。 以下の記事を参考に実際に gffread を使って転写物の配列を切り出します。 gffre…

融合遺伝子検出ツール EricScript

EricScript で融合遺伝子検出 ペアエンドの RNA-seq データから融合遺伝子を検出する. Fastq ファイルを入力として、pre build のリファレンスにマッピングしていく. すべての予測された融合遺伝子検出結果(~.results.total.tsv)と 独自のスコアによりフィル…

アノテーションファイルとリファレンス配列から遺伝子領域の配列の fasta

切り出したGTFファイルとリファレンス配列から SeqKit - Ultrafast FASTA/Q kit を用いて、各遺伝子領域の配列の fasta ファイルを作成。 以下の記事を参考にさせていただきました。 kazumaxneo.hatenablog.com

遺伝子アノテーションファイル(GTFファイル)から特定の遺伝子を抽出

GTFファイルのうち特定の(調べたい)遺伝子だけを使いたいとき、 grepコマンドを用いて、その遺伝子を含む行を抽出する方法。 orebibou.com