微分可能フレーム・イベント変換に基づくイベント単位音響イベント検出 2 分 本稿では,深層音響イベント検出 (SED) モデルと隠れセミマルコフモデルを統合し,境界精度の高いイベント単位のSEDを実現しました.
ターゲット話者音声認識のための空間自己教師あり学習 2 分 本論文では,空間自己教師あり学習を活用したガイド付き因子分解モデルにより,CHiME-8 DASRベンチマークでターゲット話者を分離性能を評価しました.
時変深層フルランク空間相関分析 (TV Neural FCA) 3 分 本論文では,音源分離と音源定位を同時に解く償却変分推論(AVI)に基づき,移動音源を分離・追跡できる教師なし多チャネル学習法を提案しました.