データ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」

大規模言語モデルを用いたサンプルメタデータの自動キュレーション @ データ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」

ここをクリックするとコース内の動画が確認できます。

大規模言語モデルを用いたサンプルメタデータの自動キュレーション @ データ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」

本日の統合TVは、2025年6月26日に開催されたデータ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」から、ライフサイエンス統合データベースセンター 池田 秀也 による「大規模言語モデルを用いたサンプルメタデータの自動キュレーション」(講習スライドQ&A)をお送りします。
大規模言語モデル(LLM)によって自然言語からの高精度なエンティティ抽出が可能になりました。本講演では、モデルの追加学習なしで実装した我々のツールとその精度評価について解説します。DNA シーケンス試料の自由記述メタデータを自動で整理・補完することで、研究現場のデータ整備コスト削減と再利用性向上を目指しています。
講習会の一連の動画はYouTubeの再生リストからもご覧いただけます。

見どころダイジェスト

  • 00:20 1. 概要
  • 01:21 2. 背景: 公共データリポジトリによる実験データ共有の恩恵
  • 02:30 3. 背景: BioSampleデータベース
  • 03:16 4. 課題: サンプル情報の不備がデータの再利用性を下げている
  • 04:24 5. 課題の具体例
  • 05:30 6. 課題の解決策: オントロジーの利用(沈黙の数秒を少しカット)
  • 06:33 7. 既存研究: MetaSRA
  • 08:05 8. 既存研究の課題
  • 10:06 9. 研究目的: LLMを活用したサンプル情報の品質の改善
  • 11:35 10. 手法: LLM実行環境
  • 11. 結果: 細胞株名抽出とオントロジーマッピ

動画ファイルのダウンロード

250803_ikeda.mov

再利用時のライセンス

クリエイティブ・コモンズ CC-BY-4.0

スキル別コースから探す

    新着動画

      視聴ランキング

        新着イラスト