「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術

アスキー ニュース

「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術
ASCIIASCII.Jp角川アスキー総合研究所
  • 📰 asciijpeditors
  • ⏱ Reading Time:
  • 34 sec. here
  • 5 min. at publisher
  • 📊 Quality Score:
  • News: 27%
  • Publisher: 51%

若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。今回は、今回は、表現力豊かな音声合成技術の開発に取り組む、東京大学大学院の中田 亘さん、関 健太郎さんのチームを取り上げる。代表の中田さんに話を聞いた。

スマホやスマート・スピーカーに話しかけると音声で応えてくれるSiriやAlexaといった音声アシスタントは、今や日常的に使われている。だが、その声はというと明らかに人工的で、どこか無機質でつまらないものだ。顔の見えない音声アシスタントであればそれでも問題はないかもしれないが、機械と人間との共生が進み、ロボットやAIアバターと対話する機会が増えていくにつれ、そうした不自然さが適切な意思疎通をする上での大きな障壁になる可能性もある。もし今より表現力のある音声対話システムを作ることができれば、もっと豊かなコミュニケーションができるようになるのではないか——東京大学大学院の中田 亘さん、関 健太郎さんが「覚醒プロジェクト」で取り組むのは、まさにそのための研究である。

次に、このデータセットを用いて音声合成モデルを訓練する。ここでは、LLMの言語知識を活用するため、隠れ層出力とパラ言語情報・非言語情報の関係を学習させる。LLMの隠れ層(中間特徴量)を使うのは、対話音声のデータセット不足を補うためだ。先行研究では、ChatGPTを使って対話の台本を読み上げるためのパラ言語情報をテキスト化し、このテキストで音声合成モデルを条件付けるものがある。中田さんらは、LLM隠れ層出力は単語として離散化される前のニュアンスを適切に表していると考えられること、これらの情報はパラ言語情報・非言語情報の推測に有用であるとの仮説を立てた。これが、今回の研究のユニークな点となっている。「そもそも日本語のパラ言語情報を扱った大規模なデータが、現時点ではあまり存在しない。あくまで私の考えですが、何かのタスクに特化したデータセットはもちろん重要ではあるものの、近年の研究動向を見ると、それよりも抽象的な人間の対話をデータセットにしてモデルを学習させることによって、結果的にパラ言語情報も扱えるようなモデルができるのではないかと考えています」「例えば、LINE上のやりとりはターンが明確に

さらに、最近のAIブームの影響で、豊富な資金と人材を持つ企業や研究所が音声分野にも取り組むようになり、研究でも先行されることが増えてきた。研究を続けるためには常に新しい視野が不可欠だと感じているという。その点、覚醒プロジェクトのPM(プロジェクトマネージャー)の伴走支援が役立っているようだ。

このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。 続きを読む:

asciijpeditors /  🏆 98. in JP

ASCII ASCII.Jp 角川アスキー総合研究所

日本 最新ニュース, 日本 見出し

Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。

医師とのタッグで挑む、医療用マルチモーダルAIの先駆け的研究医師とのタッグで挑む、医療用マルチモーダルAIの先駆け的研究若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。今回は、医療分野における大規模な日本語マルチモーダルモデルの開発に挑む、東京大学大学院の助田一晟さん、澤野晋之介さんのチームを取り上げる。代表者である助田さんに話を聞いた。
続きを読む »

著作物ではない情報(1)~ありふれた表現や、社会的事件も著作物?著作物ではない情報(1)~ありふれた表現や、社会的事件も著作物?この連載では、学校生活やネット生活などさまざまな活動で必須知識となった「著作権」を、基本からできるだけわかりやすくレクチャーしていきます。今回は「何が自由に利用できる情報か」という例を挙げていきます。
続きを読む »

「日本の声優のすばらしさ広めたい」アニメの世界観ごと輸出するAI吹き替え技術「日本の声優のすばらしさ広めたい」アニメの世界観ごと輸出するAI吹き替え技術若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。今回は、「日本語の世界観を崩さないアニメの自動吹き替え」について研究する、野﨑雄斗さん・大嶽匡俊さん・加藤大地さん・廣岡聖司さん(いずれも東京大学大学院情報理工学系研究科)のチーム。代表の野﨑さんに話を聞いた。
続きを読む »

AIに難しい「時間的な動き」の理解、動画-自然言語モデルで目指す突破口AIに難しい「時間的な動き」の理解、動画-自然言語モデルで目指す突破口若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の覚醒プロジェクトに採択された研究者の研究内容を紹介する。今回は、動画-言語基盤モデルの研究開発に取り組む、東京大学大学院情報理工学系研究科の塩原 楓さんだ。
続きを読む »

どこまで似れば盗作なのか ~だってウサギなんだからどこまで似れば盗作なのか ~だってウサギなんだからこの連載では、学校生活やネット生活などさまざまな活動で必須知識となった「著作権」を、基本からできるだけわかりやすくレクチャーしていきます。今回は、人の作品を真似して似た作品を作った際に、どの程度似ていれば著作権侵害になってしまうのかを事例とともに紹介します。
続きを読む »

「まだまだ未熟な量子技術、だからこそおもしろい」覚醒PM・名古屋大学の藤巻 朗教授「まだまだ未熟な量子技術、だからこそおもしろい」覚醒PM・名古屋大学の藤巻 朗教授産業技術総合研究所(産総研)による若手ディープテック研究者を支援プロジェクト「覚醒プロジェクト」が、2024年度の研究実施者を募集している。プロジェクトマネージャー(PM)を務める名古屋大学大学院工学研究科 電子工学専攻 量子システム工学教授の藤巻 朗氏に、応募者への期待とプロジェクトへの思いを聞いた。
続きを読む »



Render Time: 2025-04-08 07:36:53