公共の遺伝子発現データの検索や解析を行う

NCBI GEO を使ってRNA-seqの生データおよびカウントデータを取得する

ここをクリックするとコース内の動画が確認できます。

NCBI GEO を使ってRNA-seqの生データおよびカウントデータを取得する

NCBI GEO (Gene Expression Omnibus)NCBIが提供・維持管理している遺伝子発現情報のデータベースです。GEOには、主にRNA-seqやマイクロアレイ実験で得られたデータが日々蓄積されており、その登録データ数は世界最大です。それらの中から、自分の興味のある発現データセットや遺伝子プロファイルを検索することができるだけでなく、それらの生データを自由にダウンロードすることが可能です。
今回は、Macのターミナルを使用してRNA-seq解析に必要なデータのダウンロード方法と、fastqファイルの作成までを紹介します。動画の前半部分ではデータをダウンロードする前に必要な準備としてHomebrewを用いた環境構築方法について説明しています。後半では、導入したSRA Toolkit や pigzを用いて複数のRNA-seqデータを並列にダウンロードし、圧縮保存する方法について説明しています。

見どころダイジェスト

  • 00:09 1. Homebrewのインストール
  • 01:10 2. SRA Toolkitのインストール
  • 02:01 3. Pigzのインストール
  • 02:30 4. ディレクトリの作成
  • 03:18 5. RNA-seqデータのダウンロード
  • 04:36 6. 複数のRNA-seqデータのダウンロード
  • 06:28 7. fastqファイルへの変換
  • 07:28 8. 複数のファイルをfastqへの変換
  • 08:16 9. pigzによるfastqファイルの圧縮

動画ファイルのダウンロード

231030_GEO_get_RNAseqData.mov

再利用時のライセンス

クリエイティブ・コモンズ CC-BY-4.0

スキル別コースから探す

    新着動画

      視聴ランキング

        新着イラスト