Fugu-MT 論文翻訳(概要): DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking

論文の概要: DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking

arxiv url: http://arxiv.org/abs/2310.18075v4
Date: Fri, 24 Nov 2023 09:18:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-28 02:51:05.210698
Title: DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking
Title（参考訳）: duma: 速い思考と遅い思考を持つデュアルマインド会話エージェント
Authors: Xiaoyu Tian, Liangyu Chen, Na Liu, Yaxuan Liu, Wei Zou, Kaijiang Chen, Ming Cui
Abstract要約: DUMAは2つの生成型Large Language Model(LLM)をそれぞれ高速な思考と低速な思考に利用することで、デュアルミンドのメカニズムを具現化している。我々は、不動産業界のオンライン調査を扱うための会話エージェントを構築した。
参考スコア（独自算出の注目度）: 12.71072798544731
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Inspired by the dual-process theory of human cognition, we introduce DUMA, a novel conversational agent framework that embodies a dual-mind mechanism through the utilization of two generative Large Language Models (LLMs) dedicated to fast and slow thinking respectively. The fast thinking model serves as the primary interface for external interactions and initial response generation, evaluating the necessity for engaging the slow thinking model based on the complexity of the complete response. When invoked, the slow thinking model takes over the conversation, engaging in meticulous planning, reasoning, and tool utilization to provide a well-analyzed response. This dual-mind configuration allows for a seamless transition between intuitive responses and deliberate problem-solving processes based on the situation. We have constructed a conversational agent to handle online inquiries in the real estate industry. The experiment proves that our method balances effectiveness and efficiency, and has a significant improvement compared to the baseline.
Abstract（参考訳）: 人間の認知の二重プロセス理論に着想を得て,2つの生成的大言語モデル(LLM)をそれぞれ高速・低速な思考に用い,二重マシン機構を具現化した対話エージェントフレームワークであるDUMAを導入する。高速思考モデルは、外的相互作用と初期応答生成の主要なインターフェースとして機能し、完全な応答の複雑さに基づいて、遅い思考モデルに取り組む必要性を評価する。起動すると、遅い思考モデルが会話を引き継ぎ、綿密な計画、推論、ツール利用に取り組み、よく分析された応答を提供する。このデュアルミンド構成は、直感的な応答と状況に基づいた意図的な問題解決プロセスのシームレスな遷移を可能にする。我々は,不動産業界のオンライン調査を扱う対話エージェントを構築した。実験は,本手法が有効性と効率のバランスをとることを証明し,ベースラインと比較して著しく改善した。

関連論文リスト

UniConv: Unifying Retrieval and Response Generation for Large Language Models in Conversations [71.79210031338464]
会話における大規模言語モデルに対する高密度検索と応答生成の統一方法を示す。目的の異なる共同微調整を行い、不整合リスクを低減するための2つのメカニズムを設計する。 5つの対話型検索データセットの評価は、我々の統合モデルがタスクを相互に改善し、既存のベースラインより優れていることを示す。
論文参考訳（メタデータ） (2025-07-09T17:02:40Z)
Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking [124.69672273754144]
HaluSearchは、ツリー検索ベースのアルゴリズムを組み込んだ新しいフレームワークである。テキスト生成をステップバイステップの推論プロセスとしてフレーム化する。認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。
論文参考訳（メタデータ） (2025-01-02T15:36:50Z)
Thinking Fast and Laterally: Multi-Agentic Approach for Reasoning about Uncertain Emerging Events [37.77679335989817]
本稿では,AIシステムにシステム2推論機能を実装するための側方的思考を紹介する。本稿では,側方的思考クエリと評価データセットを体系的に生成・モデル化するためのフレームワークを提案する。本稿では,ストリーミングデータ環境における複雑な低特異性クエリを処理するために設計されたマルチエージェントフレームワークであるStreaming Agentic Lateral Thinking (SALT)を紹介する。
論文参考訳（メタデータ） (2024-12-10T23:29:11Z)
Agents Thinking Fast and Slow: A Talker-Reasoner Architecture [1.7114665201319208]
大規模言語モデルにより、あらゆる種類のエージェントが自然な会話を通じてユーザと対話できるようになった。提案手法は,高速かつ直感的であり,会話応答の合成に係わる"Talker"エージェントで構成されている。本稿では,新しいTalker-Reasonerアーキテクチャについて述べる。
論文参考訳（メタデータ） (2024-10-10T19:31:35Z)
Iteration of Thought: Leveraging Inner Dialogue for Autonomous Large Language Model Reasoning [0.0]
反復的人間のエンゲージメントは、大規模言語モデル(LLM)の高度な言語処理能力を活用するための一般的かつ効果的な手段である。思考の反復(IoT)フレームワークを提案する。静的アプローチや半静的アプローチとは異なり、IoTは進化するコンテキストに基づいて推論パスを動的に適応する。
論文参考訳（メタデータ） (2024-09-19T09:44:17Z)
Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。 LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文参考訳（メタデータ） (2024-06-09T21:58:32Z)
What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal Models [50.97705264224828]
大規模マルチモーダルモデルに反現実的思考を組み込む新しい手法である反現実的インセプションを提案する。我々は、より広い文脈のシーン理解にまたがる応答をモデルが関与し、生成することを目指している。オープンソースモデルとプロプライエタリモデルの両方を含む様々なLMMの包括的分析は、反事実的思考が幻覚を著しく減少させることを裏付ける。
論文参考訳（メタデータ） (2024-03-20T11:27:20Z)
Interactive Autonomous Navigation with Internal State Inference and Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-11-27T18:57:42Z)
On the Discussion of Large Language Models: Symmetry of Agents and Interplay with Prompts [51.3324922038486]
本稿では,プロンプトの相互作用と議論機構の実証結果について報告する。また、コンピュートとマージに基づくスケーラブルな議論機構も提案している。
論文参考訳（メタデータ） (2023-11-13T04:56:48Z)
Neural Amortized Inference for Nested Multi-agent Reasoning [54.39127942041582]
本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
論文参考訳（メタデータ） (2023-08-21T22:40:36Z)
Multi-Modal Temporal Convolutional Network for Anticipating Actions in Egocentric Videos [22.90184887794109]
正確だが十分に速くないメソッドは、意思決定プロセスに高いレイテンシをもたらす。これは、反応時間が重要である自律運転のようなドメインに問題を引き起こす。本稿では,時間的畳み込みに基づくシンプルで効果的なマルチモーダルアーキテクチャを提案する。
論文参考訳（メタデータ） (2021-07-18T16:21:35Z)
Improving Response Quality with Backward Reasoning in Open-domain Dialogue Systems [53.160025961101354]
本稿では,バニラエンコーダデコーダトレーニングに後方推論ステップを追加することで,生成モデルを双方向にトレーニングすることを提案する。提案する後方推論ステップは、モデルがより有益で一貫性のあるコンテンツを生成するように促す。副次的な情報を導入することなく応答品質を向上させることができる。
論文参考訳（メタデータ） (2021-04-30T20:38:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。