RStudioを使って階層的クラスタリングを行う 2018

Rはフリーでオープンソースの統計解析環境です。Rを使うとデータの操作や計算、可視化を統合して行うことができます。豊富に用意されたサンプルデータや、対話的な解析、網羅的なパッケージアーカイブCRANが特徴です。Windows, MacOSX, Linux とマルチプラットホームで利用可能です。生命科学分野のためのRパッケージプロジェクトである『BioConductor』では、500以上のパッケージが配布されており、マイクロアレイデータなどの遺伝子発現プロファイルや質量分析データ、タンパク質相互作用データなどを解析するうえで、欠かせないものとなりつつあります。今回はRを使う上で基本的な知識や、便利なウェブサイトを紹介しつつ、Rの統合開発環境であるRStudioを用いて、論文の図 (「Hotspots of aberrant epigenomic reprogramming in human induced pluripotent stem cells, Nature volume 471, pages 68–73 (03 March 2011), doi:10.1038/nature09798」のFigure 1e) として掲載されている階層的クラスタリングの作成を実演します。解析に用いた生データはHuman Induced Pluripotent Stem Cell Epigenomesからダウンロードすることができます。
RStudio自体の導入・使い方は過去の統合TV番組「RStudioでRを直感的に使おう MacOS版 2017」をご覧ください。

見どころダイジェスト

  • 00:19 1. 階層的クラスタリングを例に、Rでパッケージについて調べる方法
  • 02:18 2. SeekRやRjpWikiを使って、Rに関する情報を検索する方法
  • 03:41 3. 実際の論文のデータを使って、階層的クラスタリング解析を行う
  • 08:28 4. メチル化率を計算して、階層的クラスタリングの結果を表示

動画ファイルのダウンロード

180125RStudio_HClust.mov

再利用時のライセンス

クリエイティブ・コモンズ CC-BY-4.0

スキル別コースから探す

    新着動画

      視聴ランキング

        新着イラスト