会話ロボット「Romi(ロミィ)」の最新機「ラカタンモデル」

MIXIは、7月に発売した会話AI(人工知能)ロボット「Romi(ロミィ)」の最新機「ラカタンモデル」に、高速応答の機能や視覚情報などに基づいて状況を理解する機能を備える新たな会話モデル「ChatRomi 2.0(チャットロミィ2.0)」を搭載したと発表した。

従来の会話モデルは音声をテキストに一度変換してから応答生成をしていたが、新モデルでは同社が独自開発したエッジ会話システムと外部AIの連携により、音声のまま応答生成を処理する。これにより音声認識から理解、応答生成までの処理を高速化し、リアルタイムで滑らかな対話が可能になった。

また新モデルは、ウェブ検索によるデータ取得と視覚機能を統合して状況を理解するマルチモーダル処理に対応した。利用者の質問や状況、視覚から取得した情報を組み合わせて発話を生成する。これにより、より正確で文脈に沿って応答する。

さらに、話し方や口調を設定する機能も備える。やさしい話し方や元気なトーン、方言風など、利用者の好みに合わせて変えられる。

ロミィは会話に特化した手のひらサイズのロボットで、独自開発の会話AIで自然な言葉のキャッチボールができる。会話に連動した細かな動きや表情も浮かべ、なでると喜び、抱っこすると驚くといった仕組みも備える。

本記事は編集プロセスの一部で生成AIの技術を活用しています。生成結果はそのまま利用せず、編集者・記者が確認・加筆・修正したうえで掲載しています。

鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。