Skip to the content.

歌声識別タスクのための
事前学習済み自己教師ありフロントエンドの調査

山本雄也(筑波大学)

概要

歌手認識や歌声採譜,歌唱表現識別等,歌声から情報を分析する認識タスクは歌声のバリエーションの多さから深層学習等によるデータ駆動型アプローチが有効である.その一方でラベル付きのデータの不足がボトルネックとなっている.近年音声処理や音楽識別では大規模なラベルなしデータを用いて自己教師あり学習を行なったモデル(SSL モデル)を用い,それを目的タスクにおいてファインチューニングさせることにより,少ない学習データで従来の教師あり学習に匹敵する識別性能を得ることができている. そこで本発表では,各種歌声認識タスクへの SSL モデルの有効性を調査する.本発表では,初期検討として異なる3タスクにおいて SSL モデルの結果を比較した実験の結果を報告し,これを議論したい.

比較手法