Fugu-MT 論文翻訳(概要): Factored Reasoning with Inner Speech and Persistent Memory for Evidence-Grounded Human-Robot Interaction

論文の概要: Factored Reasoning with Inner Speech and Persistent Memory for Evidence-Grounded Human-Robot Interaction

arxiv url: http://arxiv.org/abs/2602.00675v1
Date: Sat, 31 Jan 2026 11:42:33 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 05:16:02.695391
Title: Factored Reasoning with Inner Speech and Persistent Memory for Evidence-Grounded Human-Robot Interaction
Title（参考訳）: 人間とロボットの対話における内的発話と永続記憶による要因的推論
Authors: Valerio Belcamino, Mariya Kilina, Alessandro Carfì, Valeria Seidita, Fulvio Mastrogiovanni, Antonio Chella,
Abstract要約: 本稿では,対話を部分的に観察可能なマルコフ決定プロセスとしてモデル化する支援ロボットの認知アーキテクチャであるJANUSを紹介する。 Janusは、全体的な振る舞いを、スコープ検出、意図認識、メモリ、内的音声、クエリ生成、外的音声に関連する特別なモジュールに分解する。我々は、知識グラフに基づく食事補助ドメインにおけるモジュールレベルのユニットテストを通じてJANUSを評価し、キュレートされた参照と実際の遅延プロファイルとの高い一致を報告した。
参考スコア（独自算出の注目度）: 38.120218754079055
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Dialogue-based human-robot interaction requires robot cognitive assistants to maintain persistent user context, recover from underspecified requests, and ground responses in external evidence, while keeping intermediate decisions verifiable. In this paper we introduce JANUS, a cognitive architecture for assistive robots that models interaction as a partially observable Markov decision process and realizes control as a factored controller with typed interfaces. To this aim, Janus (i) decomposes the overall behavior into specialized modules, related to scope detection, intent recognition, memory, inner speech, query generation, and outer speech, and (ii) exposes explicit policies for information sufficiency, execution readiness, and tool grounding. A dedicated memory agent maintains a bounded recent-history buffer, a compact core memory, and an archival store with semantic retrieval, coupled through controlled consolidation and revision policies. Models inspired by the notion of inner speech in cognitive theories provide a control-oriented internal textual flow that validates parameter completeness and triggers clarification before grounding, while a faithfulness constraint ties robot-to-human claims to an evidence bundle combining working context and retrieved tool outputs. We evaluate JANUS through module-level unit tests in a dietary assistance domain grounded on a knowledge graph, reporting high agreement with curated references and practical latency profiles. These results support factored reasoning as a promising path to scalable, auditable, and evidence-grounded robot assistance over extended interaction horizons.
Abstract（参考訳）: 対話に基づく人間とロボットのインタラクションでは、ロボットの認知アシスタントが永続的なユーザコンテキストを維持し、不特定な要求から回復し、外部のエビデンスで応答し、中間的な決定を検証しなければなりません。本稿では,対話を部分的に観測可能なマルコフ決定プロセスとしてモデル化し,型付きインタフェースを持つ因子制御系として制御を実現する支援ロボットの認知アーキテクチャであるJANUSを紹介する。この目的のために、ヤヌス一範囲検出、意図認識、記憶、内的音声、クエリ生成、外的音声に関する特定モジュールに全体的な動作を分解する。 (ii)情報満足度、実行準備性、ツール接地に関する明確なポリシーを公開する。専用メモリエージェントは、制御された統合とリビジョンポリシーを介して結合された、境界付き最近のバッファ、コンパクトコアメモリ、セマンティック検索を備えたアーカイブストアを保持する。認知理論における内的音声の概念にインスパイアされたモデルは、パラメータの完全性を検証する制御指向の内的テキストフローを提供し、接地前に明確化を誘発する。我々は、知識グラフに基づく食事補助ドメインにおけるモジュールレベルのユニットテストを通じてJANUSを評価し、キュレートされた参照と実際の遅延プロファイルとの高い一致を報告した。これらの結果は、拡張された相互作用の地平線を越えて、スケーラブルで監査可能で、エビデンスに基づくロボット支援への有望な道として、要因推論をサポートする。

関連論文リスト

Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers [0.42061757959666934]
大きな言語モデル(LLM)エージェントは、単一のコンテキストウィンドウが小さすぎて何が起きているのかをキャプチャできないような環境で、ますます運用される。メモリはステートレステキストジェネレータを真に適応的なエージェントに変える。この調査は、メモリがどのように設計され、実装され、現代のLCMベースのエージェントで評価されるかという構造化された説明を提供する。
論文参考訳（メタデータ） (2026-03-08T15:08:01Z)
ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents [14.695250837875454]
本稿では,ActMemと呼ばれる新しい動作可能なメモリフレームワークを提案する。 ActMemは非構造化対話履歴を構造化因果グラフと意味グラフに変換する。エージェントは暗黙の制約を推論し、過去の状態と現在の意図の間の潜在的な衝突を解決することができる。
論文参考訳（メタデータ） (2026-02-04T00:54:53Z)
From Transcripts to AI Agents: Knowledge Extraction, RAG Integration, and Robust Evaluation of Conversational AI Assistants [0.0]
顧客向け産業向けの信頼できる会話AIアシスタントの構築は、ノイズの多い会話データ、断片化された知識、正確なヒューマンハンドオフの必要性により、依然として困難である。本稿では,履歴書から直接対話型AIアシスタントを構築し,評価するためのエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-26T07:44:47Z)
Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey [211.01908189012184]
今年、何百もの論文が公開されたメモリは、ユーティリティギャップを埋めるための重要なソリューションとして現れます。ファンデーションエージェントのメモリを3次元に統一したビューを提供する。次に、異なるエージェントトポロジの下でメモリがどのようにインスタンス化され、操作されるかを分析する。
論文参考訳（メタデータ） (2026-01-14T07:38:38Z)
The AI Hippocampus: How Far are We From Human Memory? [77.04745635827278]
インプリシットメモリは、事前訓練されたトランスフォーマーの内部パラメータに埋め込まれた知識を指す。明示メモリは、動的でクエリ可能な知識表現でモデル出力を増大させるように設計された外部ストレージと検索コンポーネントを含んでいる。エージェントメモリは、自律エージェント内に永続的、時間的に拡張されたメモリ構造を導入する。
論文参考訳（メタデータ） (2026-01-14T03:24:08Z)
Generative Human-Object Interaction Detection via Differentiable Cognitive Steering of Multi-modal LLMs [85.69785384599827]
人間と物体の相互作用(Human-object Interaction、HOI)の検出は、人と物体のペアとそれらの相互作用を局在させることを目的としている。既存のメソッドはクローズドワールドの仮定の下で動作し、タスクを未定義の小さな動詞集合上の分類問題として扱う。本稿では,閉集合分類タスクから開語彙生成問題へのHOI検出を再構成する新しい生成推論・ステアブル知覚フレームワークGRASP-HOを提案する。
論文参考訳（メタデータ） (2025-12-19T14:41:50Z)
Self-evolving expertise in complex non-verifiable subject domains: dialogue as implicit meta-RL [0.0]
いわゆる「邪悪な問題」は、複雑な多次元の設定、検証不可能な結果、不均一な影響、客観的に正しい答えの欠如など、歴史を通じて人類を悩ませてきた。現状の人工知能システム(特にLarge Language Modelベースのエージェント)は、そのような問題を解決するために人間と共同で研究されている。この研究は、Dialecticaとのギャップに対処する。これは、エージェントが定義されたトピックに関する構造化された対話に従事し、メモリによる拡張、自己回帰、ポリシーに制約のあるコンテキスト編集を行うフレームワークである。
論文参考訳（メタデータ） (2025-10-17T15:59:44Z)
Interactive Autonomous Navigation with Internal State Inference and Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-11-27T18:57:42Z)
Learning to Memorize Entailment and Discourse Relations for Persona-Consistent Dialogues [8.652711997920463]
既存の作業は、高度ネットワーク構造を持つ対話者ペルソナを意図的に学習することで、対話システムの性能を改善した。本研究は,ペルソナ一貫性のある対話課題における係り受け関係と談話関係を記憶する学習方法を提案する。
論文参考訳（メタデータ） (2023-01-12T08:37:00Z)
A Controllable Model of Grounded Response Generation [122.7121624884747]
現在のエンドツーエンドのニューラルネットワークモデルは、応答生成プロセスにセマンティックコントロールを課す柔軟性を本質的に欠いている。我々は制御可能な接地応答生成(CGRG)と呼ばれるフレームワークを提案する。このフレームワークを用いることで、会話のようなRedditデータセットでトレーニングされた、新しいインダクティブアテンション機構を備えたトランスフォーマーベースのモデルが、強力な生成ベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2020-05-01T21:22:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。