統計解析ソフト「R」の使い方 〜正規化編〜

Rは、フリーウェアでオープンソースのデータ解析環境です。Rはデータの操作や計算、可視化のためのソフトが統合されたもので、それらのサンプルデータが豊富に用意されていることやそれらを対話的に実行できることが特徴です。また、Windows, MacOSX, Linux とマルチプラットホームで利用可能です。近年、生命科学分野のためのRパッケージプロジェクトである『BioConductor』が立ち上がり、多くの関連パッケージが配布されており、マイクロアレイデータなどの遺伝子発現プロファイルや質量分析データ、タンパク質相互作用データなどを解析するうえで、欠かせないものとなりつつあります。前回のインストール編に引き続き、今回は、Rを用いたマイクロアレイ解析の前処理として必須なデータの正規化の方法について紹介しています。サンプルとしたマイクロアレイデータは、皮膚の線維芽細胞からiPS細胞を作製したときのデータで、以前に統合TVで紹介したNCBI Gene Expression Omnibus (GEO)からマイクロアレイの生データをダウンロードする方法で取得したものを用いています。また、マイクロアレイデータの正規化手法はさまざまなものが知られていますが、今回は、RMA (robust multiarray average)MAS5 (Affymetrix MicroArray Suite 5)を用いており、正規化したデータをそのままタブ区切りテキストファイルとして保存する方法を紹介しています。さらにMAS5に関してはPresent/Absentコールを同様に保存する方法も説明しています。

動画ファイルのダウンロード

090319Rrmamas5.mov

再利用時のライセンス

クリエイティブ・コモンズ CC-BY-4.0

スキル別コースから探す

    新着動画

      視聴ランキング

        新着イラスト