fasta/fastq

大量の fastq をトリミング "Trimmomatic"

大量の fastq をトリミングしたかったので。 以下のように、fastq データがあるときに while read で2行ずつ読み込んで処理する方法。 $ find | grep fastq.gz RUN001_1.fastq.gz RUN001_2.fastq.gz RUN002_1.fastq.gz RUN002_2.fastq.gz RUN003_1.fastq.gz…

gtf から転写物配列取得 "gffread"

この記事では、gtf を使って、リファレンス配列から転写物の配列を切り出す方法を紹介します。 gffread は cufflinks の昨日のうちの一つで、 gtf <-> gff の変換もできます。 以下の記事を参考に実際に gffread を使って転写物の配列を切り出します。 gffre…

アノテーションファイルとリファレンス配列から遺伝子領域の配列の fasta

切り出したGTFファイルとリファレンス配列から SeqKit - Ultrafast FASTA/Q kit を用いて、各遺伝子領域の配列の fasta ファイルを作成。 以下の記事を参考にさせていただきました。 kazumaxneo.hatenablog.com