Julia のデータフレーム の操作. R, Python との比較.

R のループが遅いので, Julia を試してみた。 とりあえず、データフレーム の処理とかをまとめてることにする。 インストール 以下で、macOS Package( .dmg )をダウンロードし、インストール(v1.0.1)。 Julia Downloads 実行すると、ターミナル画面が開き…

大量の fastq をトリミング "Trimmomatic"

大量の fastq をトリミングしたかったので。 以下のように、fastq データがあるときに while read で2行ずつ読み込んで処理する方法。 $ find | grep fastq.gz RUN001_1.fastq.gz RUN001_2.fastq.gz RUN002_1.fastq.gz RUN002_2.fastq.gz RUN003_1.fastq.gz…

gtf から転写物配列取得 "gffread"

この記事では、gtf を使って、リファレンス配列から転写物の配列を切り出す方法を紹介します。 gffread は cufflinks の昨日のうちの一つで、 gtf <-> gff の変換もできます。 以下の記事を参考に実際に gffread を使って転写物の配列を切り出します。 gffre…

融合遺伝子検出ツール EricScript

EricScript で融合遺伝子検出 ペアエンドの RNA-seq データから融合遺伝子を検出する. Fastq ファイルを入力として、pre build のリファレンスにマッピングしていく. すべての予測された融合遺伝子検出結果(~.results.total.tsv)と 独自のスコアによりフィル…

アノテーションファイルとリファレンス配列から遺伝子領域の配列の fasta

切り出したGTFファイルとリファレンス配列から SeqKit - Ultrafast FASTA/Q kit を用いて、各遺伝子領域の配列の fasta ファイルを作成。 以下の記事を参考にさせていただきました。 kazumaxneo.hatenablog.com

遺伝子アノテーションファイル(GTFファイル)から特定の遺伝子を抽出

GTFファイルのうち特定の(調べたい)遺伝子だけを使いたいとき、 grepコマンドを用いて、その遺伝子を含む行を抽出する方法。 orebibou.com

統計解析の学習に役立つ R データセット

R

R で統計解析をいろいろ試したいときに、役立つ R のデータセットがまとまっていたので d.hatena.ne.jp

Markdown 記法まとめ

Markdown のお勉強 qiita.com qiita.com 参考 Markdown再入門 - Qiita Qiita マークダウン記法 一覧表・チートシート - Qiita

R のデータフレームで数値要素だけ抽出

データフレームの相関行列を作成するときに文字列要素が邪魔なので、 数値データ以外を除去する方法をまとめます。 dplyr パッケージを用いて dplyr::select_if(データセット名, is.numeric) で数値列のみを抽出できます。

ぶろぐはじめました

研究用の備忘録として いろいろ投稿していきます。