DDBJ Pipelineを用いたDNA多型注釈解析の実習

イベント・講習会の情報

  • 開催日時: 2015-05-20
  • 講習会名: AJACS御茶ノ水
  • 講師: 望月 孝子 ( 情報・システム研究機構 新領域融合研究センター(国立遺伝学研究所))
  • 会場: 東京医科歯科大学 M&Dタワー3F 図書館内情報検索室
  • このテキストを引用する際はDOIをご利用ください。DOI: 10.7875/ajacs.2015.009
  • この講習に関連するタグ:実習 AJACS DDBJ パイプライン 多型

AJACS御茶ノ水 DDBJ Pipelineを用いたDNA多型注釈解析の実習

国立遺伝学研究所 大量遺伝情報研究室
望月孝子 tm@nig.ac.jp
2015年5月20日 AJACS御茶ノ水@東京医科歯科大学


これは統合データベース講習会 御茶ノ水「DDBJ Pipelineを用いたDNA多型注釈解析の実習」の資料です。
講習会全体のプログラムはこちらです。


概要

本講習は、DDBJ Read Annotation Pipeline (DDBJ Pipeline) を使用して、新型シーケンサ配列のアーカイブデータベース (DDBJ SRA) の 全ゲノム配列をリファレンスゲノムにマッピング、リファレンスゲノムとの配列比較からDNA多型の検出、そして、検出されたDNA多型に既知遺伝子アノテーションの注釈を行います。


講習の流れ

今回の講習では、コンピュータを使って以下の内容について説明します。

【実習】 - DDBJ Pipeline 基礎処理部 (https://p.ddbj.nig.ac.jp/) にてDDBJ SRAの公開データのインポート、マッピング - DDBJ Pipeline 高次処理部 p-galaxy (https://p-galaxy.ddbj.nig.ac.jp) にてDNA多型の検出、既知遺伝子注釈


講習に際しての注意とお願い
  • みんなで同時にアクセスするとサイトにつながりにくくなることが予想されます。
    • サイトの反応が悪い時はタイミングをずらして実行してみてください。
    • 反応が無いからと言って何度もクリックするとますます繋がらなくなってしまいます。おおらかな気持ちで臨みましょう。
  • わからないことがあったら挙手にてスタッフにお知らせください。
    • 遠慮は無用です(そのための講習会です!)。おいてけぼりは楽しくありません。

実習を始める前に

【実習】DNA多型注釈 DNApod ワークフロー

  • 本日の実習の流れ
    Gyazo

  • DDBJ Pipeline 基礎処理部へのアクセス  Gyazo

  • DDBJ pipeline 基礎部へのログイン
     講習用のID と パスワードでログインしてください。
       ご自分のデータでの解析を行う場合は、アカウントを取得してください。
    Gyazo

  • クエリの選択
     今回の講習用データは、DRAの公開データを使用します。
        今回の講習で使用するERA013525のデータは既にインポート済みですが、実際にDRAのデータを解析したい場合は、データインポートを行ってください。また、ご自分のローカルPCにあるFastq fileを使用して解析したい場合は、FTP uploadの機能が使えます。
     DRAのデータフォーマットの意味は、DDBJ Sequence Read Archive Handbook をご確認下さい。
     Gyazo

  • マッピングツールの選択
     今回はbwaを使ってマッピングしていきます。
     各ツールの説明は、Tool名のリンクをクリックしてください。各Toolのwebサイトで確認することができます。  Gyazo

  • クエリセットの作成
     クエリに使用するRun accessionが複数ある場合、この機能を使用します。
     今回はRun accessionが1つしかないので、あまり気にせず、セット作成を行って下さい。  Gyazo

  • リファレンスの指定
     今回の講習では、ローカルファイルをアップロードすることでリファレンスを指定する。
     リファレンスFASTAファイルはこちらからダウンロードしてください。

  • Escherichia coli_ O157:H7 str. Sakai (ftp://tga.nig.ac.jp/dnapod/sequence1.fasta) Gyazo

  • 実行パラメータを設定
    必要に応じて実行パラメータを変更してください。
    パラメータの詳細は、各ツールのHELPをご確認下さい。 Gyazo

  • 実行条件の確認
    Gyazo

  • 実行結果の確認
    高次処理部にて、基礎部の実行結果をインポートする。その際に、JOBIDが必要になるので覚えておく。
    今回の例のJOBIDは17855。 Gyazo

  • 実行結果の確認 -詳細- Gyazo

  • 基礎処理部のログアウト Gyazo

  • 高次処理部 (p-galaxy) へのアクセス Gyazo

  • 高次処理部 (p-galaxy) へのログイン  Gyazo

  • ヒストリーの作成  Gyazo

  • 基礎処理部のsamtools mpileupデータインポート
     今回の例のJOBIDは17855。このIDの結果をインポートする。  Gyazo

  • ホモSNPsの検出  Gyazo

  • SNPsアノテーション SnpEff  Gyazo

  • SNPsアノテーション SnpEff 出力ファイル (1) アノテーション情報  詳細はSnpEffのサイトを参照 (http://snpeff.sourceforge.net/SnpEff_manual.html#input) Gyazo

  • SNPsアノテーション SnpEff 出力ファイル (2) 統計情報 Gyazo


講習は以上です。
お疲れ様でした。

ご不明点があれば、pipeline_dev@ddbj.nig.ac.jp へお問い合わせください。