パスウェイデータベース KEGG/GenomeNetのWebサービスの紹介

イベント・講習会の情報

  • 開催日時: 2015-05-21
  • 講習会名: AJACS御茶ノ水
  • 講師: 川島 秀一 ( 情報・システム研究機構 ライフサイエンス統合データベースセンター (DBCLS))
  • 会場: 東京医科歯科大学 M&Dタワー3F 図書館内情報検索室
  • このテキストを引用する際はDOIをご利用ください。DOI: 10.7875/ajacs.2015.006
  • この講習に関連するタグ:実習 AJACS パスウェイ解析 KEGG

AJACS御茶ノ水 パスウェイデータベース KEGG/GenomeNetのWebサービスの紹介

情報・システム研究機構
ライフサイエンス統合データベースセンター
[川島 秀一] kwsm@dbcls.rois.ac.jp
2015年5月21日 AJACS御茶ノ水@東京医科歯科大学


これは統合データベース講習会 御茶ノ水「DDBJ Pipelineを用いたDNA多型注釈解析の実習」の資料です。
講習会全体のプログラムはこちらです。


概要

GenomeNet/KEGG が提供するウェブサービスの中で、主としてパスウェイやモジュールに関わるものについて、ウェブの検索ツールの利用を体験します。


講義の流れ

今回の講習では、コンピュータを使って以下の内容について説明します。

  • GenomeNet 概要
  • bget/bfind について
  • 【実習1】bget/bfind検索を体験する
  • LinkDB について
  • 【実習2】LinkDBを用いて、データベースIDの変換を行う。
  • KEGG 概要
  • KEGG Organisms / KEGG Genomes
  • KEGG Genes
  • KEGG Orthology
  • KEGG Pathway
  • KEGG BRITE
  • KEGG Module
  • KEGG Mapper
  • 【実習3】KEGG Mapperを用いて、パスウェイ再構築を行う。
  • 【実習4】KEGG Mapperを用いて、モジュール再構築を行う。
  • KAAS
  • 【実習5】KAASを用いて、自動遺伝子アノテーションを行う。
  • BlastKOALA
  • 【実習6】BlastKOALAを用いた、自動遺伝子アノテーション/パスウェイ再構築を行う。

講習に際しての注意とお願い
  • みんなで同時にアクセスするとサイトにつながりにくくなることが予想されます。
    • サイトの反応が悪い時はタイミングをずらして実行してみてください。
    • 反応が無いからと言って何度もクリックするとますます繋がらなくなってしまいます。おおらかな気持ちで臨みましょう。
  • わからないことがあったら挙手にてスタッフにお知らせください。
    • 遠慮は無用です(そのための講習会です!)。おいてけぼりは楽しくありません。
参考資料

GenomeNet 概要

  • ゲノム情報を基盤とした生命科学研究を促進するためのインターネットサービス
  • KEGGを中心とするデータベース群と、それらデータを解析するための計算ツール群からなっている
  • GenomeNet Home

bget/bfind

  • bget: GenomeNetのデータベースエントリーID検索
  • bfind: GenomeNetのデータベースに対するキーワード検索

【実習1】bget/bfind検索を体験する

  1. GenomeNet Homeへアクセスする。 GenomeNet Home
  2. ページ上部のテキスト検索ボックスに、好きなキーワードを入れて検索してみる。DB名:エントリーID という形式で入力するとbgetモード(例 eco:b0002)、それ以外では、bfindモードで検索が行われる(例 Histidine kinase, Cyanamide等)。

LinkDB

  • データベースエントリーID間のリンク情報を収集したデータベース
  • ID変換にも利用可能

LinkDB Home

【実習2】LinkDBを用いて、データベースIDの変換を行う。

  1. LinkDB Home へアクセスする。
  2. データベースリンクダイアグラム中の各データベースを表す矩形をクリックし、どのようにデータベース間がリンクされているか調べてみる。(このダイアグラムでは、KEGG内データベースから外部のデータベースか、外部データベース間のリンクのみ表示される)。 LinkDB Link Diagram Fig1
  3. ヒト遺伝子に関して、NCBI GENE と KEGG GENE の間の対応表を作成しダウンロードする。下図のように、from には、has (has は、Hono sapiens を意味する KEGGの生物種コード)を、to には、NCBI-GENE を入力し、downloadボタンを押す。 LinkDB Link Diagram Fig1
  4. ダウンロードされたテキストファイルの内容を確認する。

``` ncbi-geneid:1 hsa:1 equivalent ncbi-geneid:10 hsa:10 equivalent ncbi-geneid:100 hsa:100 equivalent ncbi-geneid:1000 hsa:1000 equivalent ncbi-geneid:10000 hsa:10000 equivalent ncbi-geneid:100008586 hsa:100008586 equivalent ncbi-geneid:100008587 hsa:100008587 equivalent ncbi-geneid:100008588 hsa:100008588 equivalent ncbi-geneid:100008589 hsa:100008589 equivalent ncbi-geneid:100009613 hsa:100009613 equivalent ncbi-geneid:100009676 hsa:100009676 equivalent ncbi-geneid:10001 hsa:10001 equivalent ncbi-geneid:10002 hsa:10002 equivalent ncbi-geneid:10003 hsa:10003 equivalent ncbi-geneid:100033413 hsa:100033413 equivalent ncbi-geneid:100033414 hsa:100033414 equivalent ncbi-geneid:100033415 hsa:100033415 equivalent ncbi-geneid:100033416 hsa:100033416 equivalent

```


KEGG 概要

  • ゲノムや分子レベルの情報から細胞、個体、エコシステムといった生命システムレベルの機能を整理したデータベース
  • 遺伝子や化合物などの分子部品のデータベースと、それらをつなぐネットワークのデータベースからなっている
  • KEGG Table of Contents
  • KEGGのパスウェイマップでは、色が様々な意味を持っている
  • KEGG color codes

Fig1


KEGG Organisms / KEGG Genomes

  • KEGG に含まれる生物種カタログ
  • KEGG Table of Contents の KEGG Organisms をクリック KEGG2 Fig1

KEGG Genomes


KEGG Genes

  • 生物種毎に、遺伝子・タンパク質配列を集めたデータベース

KEGG GENES


KEGG Orthology (KO)

KO_Fig1


KEGG Pathway

Pathway_Fig1

Pathway_Fig2

KEGG BRITE

  • KEGG BRITE Home
  • タンパク質の機能や、様々な知識の階層分類(タンパクファミリー、薬、病気、細胞、等)

KEGG BRITE Home

一般的なKEGGパスウェイ解析の流れ

  • ゲノム既知生物種の場合

  • 先にパスウェイにマップしたい遺伝子IDセットを作成(例:有意に遺伝子発現が変動した遺伝子IDセット)

  • それら遺伝子IDをKEGG GENESのIDに変換(ID変換表はLinkDBで作成可能)
  • KEGG Mapper Pathway reconstruction サービス等でパスウェイ再構築を行う

  • ゲノム未知生物種の場合

  • 先にパスウェイにマップしたい遺伝子配列セットを作成(例:新規に読んだゲノムからの遺伝子配列セット)

  • KAAS, BlastKOALA, GhostKOALA などで、K番号割り振りとパスウェイ再構築を行う

KEGG Pathway Analysis


KEGG Module

  • KEGG Module Home
  • Mで始まるIDで管理されている
  • PATHWAYマップより小さい単位
  • 複数のタンパク質から構成される、機能単位
  • 生物種間での保存度合い、複合体の形成、オペロン等を考慮し、オーソロググループの組み合わせで定義されている

KEGG Mapper

  • KEGG Mapper Home
  • Pathway, BRITE, Module などへ、指定した遺伝子、化合物等をマップするサービス一覧

【実習3】KEGG Mapperを用いて、パスウェイ再構築を行う。

  1. KEGG Mapper - Reconstruct Pathwayにアクセスする。
  2. 例として準備されている、genelist.txt (single organism)の内容を表示して、全てを選択し、元のページのテキストボックスにペーストする。 Reconstruction pathway Fig1
  3. Exec ボタンを押す
  4. 結果を確認する Reconstruction pathway list Fig1
  5. 好きなパスウェイをクリックしてどのようにマップされたか確認する。 Reconstruction pathway example
  6. 次に、例として準備されている、genelist2.txt (multipule organisms)の内容を表示して、全てを選択し、元のページのテキストボックスにペーストする。 Reconstruction pathway Fig1
  7. 結果を確認する Reconstruction pathway list Fig1
  8. 好きなパスウェイをクリックしてどのようにマップされたか確認する。 Reconstruction pathway example

【実習4】KEGG Mapperを用いて、モジュール再構築を行う。

  1. KEGG Mapper - Reconstruct Moduleにアクセスする。
  2. 例として準備されている、genelist.txt の内容を表示して、全てを選択し、元のページのテキストボックスにペーストする。 Reconstruction module Fig1
  3. View complete modules and 1 or 2 block missing modules を選択し、Exec ボタンを押す
  4. 結果を確認する

KAAS (KEGG Automatic Annotation Server)

Fig2

  • KEGG自動アノテーションサーバー KAAS Home
  • 入力:
  • 大規模シークエンスによって得られた生物種のアミノ酸や塩基配列
  • 出力:
  • 配列名とKOの対応表
  • PATHWAYマップ
  • BRITE階層分類

  • 配列類似性が高いというだけでなく、(片方向)ベストヒットである遺伝子同士が、よりオーソログの関係にある可能性が高く、双方向ベストヒットである遺伝子がさらにオーソログの関係にある可能性が高い

  • より詳しくは、KAAS Help ページを参照

Fig2

【実習5】KAASを用いて、自動遺伝子アノテーションを行う。

  • 時間がかかるため今回はやりません。

BlastKOALA / GhostKOALA

BlastKOALA Home

  • KOALAは、KEGG内部で、アミノ酸配列にK番号を割り当てるために利用しているシステム。
  • BlastKOALA および GhostKOALAは、ユーザの入力配列に対して、BLAST または GHOSTX を利用して、K番号を割り当てるシステム
  • KAAS の single-best に近い
  • 検索対象の配列データベースを絞っているため、KAASより高速にK番号の割り当てが行える。GHOSTX の方が BLASTより高速なため、BlastKOALA より GhostKOALAの方がさらに高速である。

【実習6】BlastKOALAを用いた、自動遺伝子アノテーション/パスウェイ再構築を行う。

  1. KEGG Mapper - Annotate Sequence by BlastKOALA にアクセスする KEGG Mapper - Annotate Sequence by BlastKOALA
  2. Example として準備されている、sequence.txt をダウンロードし、Choose File ボタンをクリックして選択する(もしくは、sequence.txt を別途ブラウザ上で表示し、コピーしたのち、Enter FASTA Sequence テキストボックスへペーストする)
  3. Select GENES family/genus dataset to be searched メニューで、Select Family/Genus ボタンをクリックする。別ウィンドウとして、Family/Genus を選択するページが表示されるので、Buchnera を見つけてクリックする
  4. 元のページに戻るので、Exec ボタンを押す
  5. しばらく待つと、以下のような結果ページが表示される SequenceAnnotationResult
  6. 次にPathway, Module, BRITE などがどのように再構築されたか確認する
  7. Reconstruct Module をクリックすると、再構築されたモジュール一覧が表示される。 BlastKOALA Result Module List
  8. 好きなモジュールをクリックして内容を見てみる。下の例は、M00176モジュール M00176
  9. モジュールエントリーページの、ortholog table ボタンをクリックして、生物種間でのそのモジュールの保存具合を見てみる。 M00176 OrthologTable1 M00176 OrthologTable1
  10. また、1 block missing や、2 block missing のオーソログテーブルや、タクソノミー(Tのアイコン)を見てみる。