ProteInferは、タンパク質の機能予測の新たなアプローチとして深層学習の手法の一つである「深層拡張畳み込みニューラルネットワーク(Deep Convolutional Neural Networks)」を採用したツールです。
BLASTや
InterProScanに代表される従来のタンパク質の機能予測ツールは、配列アラインメントを利用してクエリ配列を大規模なデータベースと比較することが特徴です。しかし、このアプローチには配列類似性が低い配列に対して機能予測が難しいなど、限界もあります。
ProteInferが採用する手法では、配列アラインメントを必要とせずに、完全長アミノ酸配列からタンパク質の機能を予測することができます。モデルの学習データには、人の手によるアノテーションが行われているSwiss-Prot(UniProtKBを構成するデータベース)に登録されているアミノ酸配列が用いられていますが、それ以外のアミノ酸配列に関しても機能の予測が可能であることが示唆されています。ProteInferでは、
TensorFlow.jsというJavaScriptのライブラリを用いて、Webブラウザ上で予測手法を試すことができます。
この動画では、Web上で機能予測が実行可能なモデルを用いて、いくつかのアミノ酸配列を例にProteInferの使い方について紹介します。