2022-01-01から1年間の記事一覧

論文解説 - Tree-constrained Pointer Generator with Graph Neural Network Encodings for Contextual Speech Recognition

Interspeech 読み会 2022 で発表したものです。 [元論文] arxiv.org Interspeech2022 の best student paper の 1 つ。 著者らが以前提案した Tree-constrained Pointer Generator (TCPGen) の拡張。 Contextual biasing という特定コンテキストの単語 (人名…

解説 - Factorized Neural Transducer for Efficient Language Model Adaptation

ICASSP 読み会 2022 で発表したものです. 元論文 arxiv.org End-to-End 音声認識の Transducer モデルにおける言語モデル適用に関する話題. Transducer の decoder は, vocabulary 予測と blank 予測による alignment を同時に行う. これを vocab 予測のみ行…