論文の概要: Learning to Forget -- Hierarchical Episodic Memory for Lifelong Robot Deployment
- arxiv url: http://arxiv.org/abs/2604.11306v1
- Date: Mon, 13 Apr 2026 11:06:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.490528
- Title: Learning to Forget -- Hierarchical Episodic Memory for Lifelong Robot Deployment
- Title(参考訳): ロボットの生涯展開のための階層的エピソード記憶を忘れることの学習
- Authors: Leonard Bärmann, Joana Plewnia, Alex Waibel, Tamim Asfour,
- Abstract要約: H$2$-EMVは、ヒューマノイドがユーザーインタラクションを通じて何を記憶すべきかを学ぶことを可能にするフレームワークである。
H$2$-EMVは,メモリサイズを45%,クエリ時間を35%削減しながら,質問応答精度を維持していることを示す。
- 参考スコア(独自算出の注目度): 20.0978060116496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robots must verbalize their past experiences when users ask "Where did you put my keys?" or "Why did the task fail?" Yet maintaining life-long episodic memory (EM) from continuous multimodal perception quickly exceeds storage limits and makes real-time query impractical, calling for selective forgetting that adapts to users' notions of relevance. We present H$^2$-EMV, a framework enabling humanoids to learn what to remember through user interaction. Our approach incrementally constructs hierarchical EM, selectively forgets using language-model-based relevance estimation conditioned on learned natural-language rules, and updates these rules given user feedback about forgotten details. Evaluations on simulated household tasks and 20.5-hour-long real-world recordings from ARMAR-7 demonstrate that H$^2$-EMV maintains question-answering accuracy while reducing memory size by 45% and query-time compute by 35%. Critically, performance improves over time - accuracy increases 70% in second-round queries by adapting to user-specific priorities - demonstrating that learned forgetting enables scalable, personalized EM for long-term human-robot collaboration.
- Abstract(参考訳): ロボットは、ユーザーが「鍵をどこに置いたのか?」「なぜタスクが失敗したのか?」と聞くと、過去の経験を口頭で語らなければならない。
しかし、連続したマルチモーダル知覚から長寿命のエピソードメモリ(EM)を維持することは、記憶限界を急速に超過し、リアルタイムクエリを非現実的にし、ユーザの関連性の概念に適応する選択的な忘れを呼びかける。
H$^2$-EMVはヒューマノイドがユーザインタラクションを通じて何を記憶すべきかを学習できるフレームワークである。
提案手法は階層的EMを段階的に構築し,学習した自然言語規則に基づく言語モデルに基づく関連度推定を選択的に回避し,これらのルールを,忘れられた詳細に関するユーザフィードバックによって更新する。
H$^2$-EMVは、メモリサイズを45%削減し、クエリ時間計算を35%削減しつつ、質問応答精度を維持している。
重要な点として、パフォーマンスは時間とともに向上する - ユーザ固有の優先順位に適応することで、第2ラウンドクエリの精度が70%向上する - 学習した忘れは、長期的な人間とロボットのコラボレーションのために、スケーラブルでパーソナライズされたEMを可能にすることを実証する。
関連論文リスト
- PERMA: Benchmarking Personalized Memory Agents via Event-Driven Preference and Realistic Task Environments [72.02445514666428]
静的な嗜好リコールを超えてペルマの一貫性を評価するためのベンチマークであるPERMAを紹介する。
PerMAは、複数のセッションとドメインにまたがる時間的に順序付けられたインタラクションイベントと、時間とともに好みに関連するクエリで構成されている。
実験により、関連するインタラクションをリンクすることで、高度なメモリシステムはより正確な好みを抽出し、トークン消費を減らすことができることが示された。
論文 参考訳(メタデータ) (2026-03-24T14:04:11Z) - PersonaMem-v2: Towards Personalized Intelligence via Learning Implicit User Personas and Agentic Memory [56.81126490418336]
パーソナライゼーションは、AI能力とアライメントの進歩における次のマイルストーンの1つだ。
PersonaMem-v2は300以上のシナリオ、20,000以上のユーザの好み、128kのコンテキストウィンドウで、1,000の現実的なユーザ-チャットボットインタラクションをシミュレートする。
我々はQwen3-4BをトレーニングしてGPT-5を上回り、暗黙のパーソナライゼーションにおいて53%の精度を達成した。
論文 参考訳(メタデータ) (2025-12-07T06:48:23Z) - O-Mem: Omni Memory System for Personalized, Long Horizon, Self-Evolving Agents [60.1848551962911]
O-Memはアクティブユーザプロファイリングに基づく新しいメモリフレームワークである。
O-Memはペルソナ属性とトピック関連コンテキストの階層的検索をサポートする。
論文 参考訳(メタデータ) (2025-11-17T16:55:19Z) - MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation [59.31354761628506]
このようなタスクは本質的にマルコフ的ではないが、主流のVLAモデルはそれを見落としているため、ロボット操作には時間的コンテキストが不可欠である。
本稿では,長距離ロボット操作のためのコグニション・メモリ・アクション・フレームワークであるMemoryVLAを提案する。
本稿では,3つのロボットを対象とした150以上のシミュレーションと実世界のタスクについて評価する。
論文 参考訳(メタデータ) (2025-08-26T17:57:16Z) - LongMemEval: Benchmarking Chat Assistants on Long-Term Interactive Memory [68.97819665784442]
チャットアシスタントの5つのコアメモリ能力を評価するためのベンチマークであるLongMemEvalを紹介する。
LongMemEvalは、既存の長期記憶システムにとって重要な課題である。
本稿では,長期記憶設計をインデックス化,検索,読解の3段階に分割する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-14T17:59:44Z) - Episodic Memory Verbalization using Hierarchical Representations of Life-Long Robot Experience [12.9617156851956]
本研究では,大規模な事前学習モデルを用いて,エピソードデータの短い(数分間の)ストリームを音声化する。
樹状データ構造をエピソードメモリ(EM)から導出し,その低レベルは生の知覚と固有受容のデータを表す。
シミュレーションされた家庭用ロボットデータ,人間中心ビデオ,実世界のロボット記録について評価を行った。
論文 参考訳(メタデータ) (2024-09-26T10:16:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。