Fugu-MT 論文翻訳(概要): Document-editing Assistants and Model-based Reinforcement Learning as a Path to Conversational AI

論文の概要: Document-editing Assistants and Model-based Reinforcement Learning as a Path to Conversational AI

arxiv url: http://arxiv.org/abs/2008.12095v1
Date: Thu, 27 Aug 2020 13:05:51 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-24 07:26:35.410262
Title: Document-editing Assistants and Model-based Reinforcement Learning as a Path to Conversational AI
Title（参考訳）: 対話型AIへの道筋としての文書編集アシスタントとモデルに基づく強化学習
Authors: Katya Kudashkina, Patrick M. Pilarski, Richard S. Sutton
Abstract要約: 音声文書編集の領域とモデルに基づく強化学習の手法について論じる。音声文書編集の利点は、ドメインがしっかりとスコープ化されていることと、会話をするための何かを提供することである。言論の領域を真に理解するためには,モデルに基づく強化学習が必要である。
参考スコア（独自算出の注目度）: 9.329553018748207
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Intelligent assistants that follow commands or answer simple questions, such as Siri and Google search, are among the most economically important applications of AI. Future conversational AI assistants promise even greater capabilities and a better user experience through a deeper understanding of the domain, the user, or the user's purposes. But what domain and what methods are best suited to researching and realizing this promise? In this article we argue for the domain of voice document editing and for the methods of model-based reinforcement learning. The primary advantages of voice document editing are that the domain is tightly scoped and that it provides something for the conversation to be about (the document) that is delimited and fully accessible to the intelligent assistant. The advantages of reinforcement learning in general are that its methods are designed to learn from interaction without explicit instruction and that it formalizes the purposes of the assistant. Model-based reinforcement learning is needed in order to genuinely understand the domain of discourse and thereby work efficiently with the user to achieve their goals. Together, voice document editing and model-based reinforcement learning comprise a promising research direction for achieving conversational AI.
Abstract（参考訳）: コマンドに従ったり、SiriやGoogle検索といった単純な質問に答えるインテリジェントアシスタントは、AIの最も経済的に重要な応用のひとつだ。将来の会話型aiアシスタントは、ドメインやユーザ、あるいはユーザの目的をより深く理解することで、さらなる機能とより良いユーザエクスペリエンスを約束する。しかし、この約束を研究、実現するのに最適なドメインと方法は何だろうか? 本稿では,音声文書編集の領域とモデルに基づく強化学習の手法について議論する。音声文書編集の主な利点は、ドメインが厳密にスコープされ、会話(文書)に関するものを提供し、インテリジェントアシスタントに完全にアクセス可能であることである。強化学習の利点は、その手法が明示的な指示なしに対話から学ぶように設計され、アシスタントの目的を形式化することである。モデルに基づく強化学習は、会話の領域を真に理解し、ユーザーが目的を達成するために効率的に働くために必要である。音声文書編集とモデルに基づく強化学習は、会話型AIを実現するための有望な研究方向を構成する。

関連論文リスト

Towards Anthropomorphic Conversational AI Part I: A Practical Framework [49.62013440962072]
会話に関わる人間の知性の重要な側面を再現するために設計されたマルチモジュールフレームワークを導入する。アプローチの第2段階では、これらの会話データは、フィルタリングとラベル付けの後に、強化学習のためのトレーニングおよびテストデータとして機能する。
論文参考訳（メタデータ） (2025-02-28T03:18:39Z)
AI in Education: Rationale, Principles, and Instructional Implications [0.0]
ChatGPTのような生成AIは、人間のようなコンテンツを作り、その教育的役割について疑問を呈する。この研究は、AIが真の認知的努力を補うのではなく、確実に補完する意図的な戦略を強調している。
論文参考訳（メタデータ） (2024-12-02T14:08:07Z)
Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文参考訳（メタデータ） (2024-11-07T21:37:51Z)
SECURE: Semantics-aware Embodied Conversation under Unawareness for Lifelong Robot Learning [17.125080112897102]
SECUREはこのような問題を解決するために設計された対話型タスク学習フレームワークである。具体的会話を使って、その欠陥のあるドメインモデルを修正します。エージェントが意味論的に認識されている場合、無意識で再配置を解決する学習がより効率的であることを示す。
論文参考訳（メタデータ） (2024-09-26T11:40:07Z)
Integrating Cognitive AI with Generative Models for Enhanced Question Answering in Skill-based Learning [3.187381965457262]
本稿では,認知AIと生成AIを融合してこれらの課題に対処する手法を提案する。我々は、構造化知識表現、TMK(Task-Method-Knowledge)モデルを用いて、オンライン知識ベースのAIコースで教えられたスキルをエンコードする。
論文参考訳（メタデータ） (2024-07-28T04:21:22Z)
Distributed agency in second language learning and teaching through generative AI [0.0]
ChatGPTは、テキストまたは音声形式のチャットを通じて非公式な第二言語プラクティスを提供することができる。インストラクタはAIを使って、さまざまなメディアで学習と評価材料を構築することができる。
論文参考訳（メタデータ） (2024-03-29T14:55:40Z)
On the Robustness of Editing Large Language Models [57.477943944826904]
大型言語モデル(LLM)はコミュニケーションAIの構築において重要な役割を担っているが、効率的な更新の課題に直面している。この研究は、編集方法の長所と短所を理解し、コミュニケーション型AIの実践的応用を促進することを目的としている。
論文参考訳（メタデータ） (2024-02-08T17:06:45Z)
Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文参考訳（メタデータ） (2023-12-22T17:57:57Z)
How to Build an AI Tutor that Can Adapt to Any Course and Provide Accurate Answers Using Large Language Model and Retrieval-Augmented Generation [0.0]
OpenAI Assistants APIにより、AI Tutorは、ファイルやチャット履歴を簡単に埋め込み、保存、検索、管理できる。 AI Tutorのプロトタイプは、ソースの引用で関連性があり正確な回答を生成する能力を示している。
論文参考訳（メタデータ） (2023-11-29T15:02:46Z)
Build-a-Bot: Teaching Conversational AI Using a Transformer-Based Intent Recognition and Question Answering Architecture [15.19996462016215]
本稿では、自然言語パイプラインを用いて、独自の学校カリキュラムに基づく質問に答えるためにカスタマイズされたモデルを訓練することで、人工知能の原理を学習するためのインタフェースを提案する。このパイプラインは、AIエージェントを作成しながら、これらのプロセスのそれぞれを通じて、学生のデータ収集、データ拡張、意図認識、質問応答を教える。
論文参考訳（メタデータ） (2022-12-14T22:57:44Z)
KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文参考訳（メタデータ） (2022-05-11T16:01:03Z)
Few-Shot Bot: Prompt-Based Learning for Dialogue Systems [58.27337673451943]
ごく少数の例を使って会話を学ぶことは、会話型AIにおける大きな課題である。現在の最良の会話モデルは、良いチャットシャッター(例:BlenderBot)またはゴール指向システム(例:MinTL)である。グラデーションベースの微調整を必要とせず、学習の唯一の源としていくつかの例を用いるプロンプトベースの数ショット学習を提案する。
論文参考訳（メタデータ） (2021-10-15T14:36:45Z)
NaRLE: Natural Language Models using Reinforcement Learning with Emotion Feedback [0.37277730514654556]
NARLEは、対話システムの自然言語理解を改善するためのフレームワークである。 2つの意図的分類問題に対して、事前学習された教師付き学習モデルの微調整に強化学習を用いることで、最大43%の性能を向上させることを実証的に示す。
論文参考訳（メタデータ） (2021-10-05T16:24:19Z)
Rethinking Supervised Learning and Reinforcement Learning in Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文参考訳（メタデータ） (2020-09-21T12:04:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。