2018-01-01から1年間の記事一覧
R のループが遅いので, Julia を試してみた。 とりあえず、データフレーム の処理とかをまとめてることにする。 インストール 以下で、macOS Package( .dmg )をダウンロードし、インストール(v1.0.1)。 Julia Downloads 実行すると、ターミナル画面が開き…
大量の fastq をトリミングしたかったので。 以下のように、fastq データがあるときに while read で2行ずつ読み込んで処理する方法。 $ find | grep fastq.gz RUN001_1.fastq.gz RUN001_2.fastq.gz RUN002_1.fastq.gz RUN002_2.fastq.gz RUN003_1.fastq.gz…
この記事では、gtf を使って、リファレンス配列から転写物の配列を切り出す方法を紹介します。 gffread は cufflinks の昨日のうちの一つで、 gtf <-> gff の変換もできます。 以下の記事を参考に実際に gffread を使って転写物の配列を切り出します。 gffre…
EricScript で融合遺伝子検出 ペアエンドの RNA-seq データから融合遺伝子を検出する. Fastq ファイルを入力として、pre build のリファレンスにマッピングしていく. すべての予測された融合遺伝子検出結果(~.results.total.tsv)と 独自のスコアによりフィル…
切り出したGTFファイルとリファレンス配列から SeqKit - Ultrafast FASTA/Q kit を用いて、各遺伝子領域の配列の fasta ファイルを作成。 以下の記事を参考にさせていただきました。 kazumaxneo.hatenablog.com
GTFファイルのうち特定の(調べたい)遺伝子だけを使いたいとき、 grepコマンドを用いて、その遺伝子を含む行を抽出する方法。 orebibou.com
R で統計解析をいろいろ試したいときに、役立つ R のデータセットがまとまっていたので d.hatena.ne.jp
Markdown のお勉強 qiita.com qiita.com 参考 Markdown再入門 - Qiita Qiita マークダウン記法 一覧表・チートシート - Qiita
データフレームの相関行列を作成するときに文字列要素が邪魔なので、 数値データ以外を除去する方法をまとめます。 dplyr パッケージを用いて dplyr::select_if(データセット名, is.numeric) で数値列のみを抽出できます。
研究用の備忘録として いろいろ投稿していきます。