当サイトのプライバシーポリシーはこちら

Apple、自社開発の対話型AI「ReALM」に関する論文を発表

AI

Appleが対話型AI「ReALM」に関する論文を発表しました。
「Reference Resolution As Language Modeling」(ReALM)と呼ばれる対話型AIシステムで、今までにないアプローチで照応解析を改善すると言います。ReALMでは、会話の文脈を理解し、画面上のコンテンツを処理し、周囲の状況を検知するSiriの能力の改善が期待されています。
ReALMは、画面上の物体への曖昧な言及や会話や背景の文脈を理解し、音声アシスタントよりも高度な会話やタスク実行を可能にするAIです。

ReALMは、Appleが独自開発した「Transformer」と呼ばれるニューラルネットワーク技術をベースに構築されています。Transformerは、従来のニューラルネットワーク技術よりも長文の理解に優れており、会話や文脈をより深く理解することができます。

研究チームはReALMモデルを、OpenAIが無料の「ChatGPT」や有料の「ChatGPT Plus」に搭載しているLLMの「GPT-3.5」および「GPT-4」と比較評価しました。論文によれば、チームが構築した最小のモデルのパフォーマンスはGPT-4に匹敵し、最大のモデルのパフォーマンスはGPT-4を大きく上回ったという言います。

ReALMの主な機能は以下の通りです。

  1. 画面上の物体への曖昧な言及の理解

ReALMは、画面上の物体への曖昧な言及を理解することができます。例えば、「画面の赤いボタンを押して」という指示に対して、ReALMは画面上の赤いボタンを特定して押すことができます。

  1. 会話や背景の文脈の理解

ReALMは、会話や背景の文脈を理解することができます。例えば、「今日の天気は?」という質問に対して、ReALMは現在地に基づいて今日の天気予報を答えることができます。

  1. 音声アシスタントよりも高度な会話やタスク実行

ReALMは、音声アシスタントよりも高度な会話やタスク実行を可能にします。例えば、「明日の午前10時に、田中さんに電話して、会議の日程について確認して」という指示に対して、ReALMはカレンダーアプリと連携して、田中さんに電話をかけ、会議の日程を確認することができます。

ReALMは、まだ開発段階ですが、将来的には、iPhoneやiPadなどのApple製品に搭載され、ユーザーの生活をより便利にすることが期待されています。

コメント