メインコンテンツへスキップ

坂東研究室

  • 展示会での実時間対話分析システムの展示
  • 音響イベントの教師なし視聴覚音源定位の実証実験
  • 残響環境下での対話分析システムの実証
  • 極限環境下でも動作する柔軟索状ロボット

坂東研究室は,国立研究開発法人 産業技術総合研究所 人工知能研究センター 社会知能研究チーム内のサブチームであり,併せて国立大学法人 筑波大学 知能機能システム学位プログラムの音響知能研究室 (連携大学院) として活動しています.

音響イベント検出 (SED) や遠隔音声認識 (DASR) など,ロボット聴覚を代表とした知能システムの研究に重点を置いています. 特に,複雑な実世界でも頑健に動作する枠組みの確立を目指して,自己教師あり学習や大規模事前学習の研究を推進しています.

連絡先 #

135-0064 東京都江東区青海2-4-7
産業技術総合研究所 臨海副都心センター 別館 8F

y.bando [at] aist.go.jp

最近の記事

M3Lは,マルチモーダル計算機聴取のためのオープンソースのツールキットです.音声・音響と他モダリティを組み合わせたモデルの構築・学習・評価のための基盤とレシピを提供します.

SBSSは,スケーラブルなブラインド音源分離(BSS)のためのPythonベースの研究向けツールキットです.Neural FCAやNeural FastFCAなどのE2Eモデルの構築環境を提供します.

Aiaccel

Aiaccelは,特にABCIのようなHPCクラスタ上での機械学習研究を加速するためのオープンソースなPythonツールキットです.

LEAD Dataset

LEAD Datasetは,各クリップに異なる20名によるアノテーションを提供する強ラベルの音響イベントのデータセットです.アノテータ間の差異を分析し,アノテーションのゆらぎに頑健なSEDモデルの開発に役立ちます.