NCBI GEO (Gene Expression Omnibus)は
NCBIが提供・維持管理している遺伝子発現情報のデータベースです。GEOには、主にRNA-seqやマイクロアレイ実験で得られたデータが日々蓄積されており、その登録データ数は世界最大です。それらの中から、自分の興味のある発現データセットや遺伝子プロファイルを検索することができるだけでなく、それらの生データを自由にダウンロードすることが可能です。
今回は、Macのターミナルを使用してRNA-seq解析に必要なデータのダウンロード方法と、fastqファイルの作成までを紹介します。動画の前半部分ではデータをダウンロードする前に必要な準備としてHomebrewを用いた環境構築方法について説明しています。後半では、導入したSRA Toolkit や pigzを用いて複数のRNA-seqデータを並列にダウンロードし、圧縮保存する方法について説明しています。