論文の概要: Semantic Commit: Helping Users Update Intent Specifications for AI Memory at Scale
- arxiv url: http://arxiv.org/abs/2504.09283v1
- Date: Sat, 12 Apr 2025 17:07:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:50:14.213463
- Title: Semantic Commit: Helping Users Update Intent Specifications for AI Memory at Scale
- Title(参考訳): ユーザによるAIメモリのインテント仕様の更新を支援するSemantic Commit
- Authors: Priyan Vaithilingam, Munyeong Kim, Frida-Cecilia Acosta-Parenteau, Daniel Lee, Amine Mhedhbi, Elena L. Glassman, Ian Arawjo,
- Abstract要約: 我々は、AIインターフェースが自然言語データのリポジトリに新しい情報を統合するのにどのように役立つかを検討する。
非局所的な影響で意味変化を管理するための手法とUIを開発する。
インテント仕様の更新時にユーザがコンフリクトを解決する方法を理解するために,SemanticCommitというインターフェースを開発した。
- 参考スコア(独自算出の注目度): 12.05355235353984
- License:
- Abstract: How do we update AI memory of user intent as intent changes? We consider how an AI interface may assist the integration of new information into a repository of natural language data. Inspired by software engineering concepts like impact analysis, we develop methods and a UI for managing semantic changes with non-local effects, which we call "semantic conflict resolution." The user commits new intent to a project -- makes a "semantic commit" -- and the AI helps the user detect and resolve semantic conflicts within a store of existing information representing their intent (an "intent specification"). We develop an interface, SemanticCommit, to better understand how users resolve conflicts when updating intent specifications such as Cursor Rules and game design documents. A knowledge graph-based RAG pipeline drives conflict detection, while LLMs assist in suggesting resolutions. We evaluate our technique on an initial benchmark. Then, we report a 12 user within-subjects study of SemanticCommit for two task domains -- game design documents, and AI agent memory in the style of ChatGPT memories -- where users integrated new information into an existing list. Half of our participants adopted a workflow of impact analysis, where they would first flag conflicts without AI revisions then resolve conflicts locally, despite having access to a global revision feature. We argue that AI agent interfaces, such as software IDEs like Cursor and Windsurf, should provide affordances for impact analysis and help users validate AI retrieval independently from generation. Our work speaks to how AI agent designers should think about updating memory as a process that involves human feedback and decision-making.
- Abstract(参考訳): 意図の変化によるユーザ意図のAIメモリの更新には,どうすればよいのか?
我々は、AIインターフェースが自然言語データのリポジトリに新しい情報を統合するのにどのように役立つかを検討する。
インパクト分析のようなソフトウェアエンジニアリングの概念にインスパイアされた我々は、非局所的な効果で意味変化を管理する方法とUIを開発し、それを「意味的コンフリクト解決(semantic conflict resolution)」と呼ぶ。
そしてAIは、ユーザが意図を表す既存の情報のストア内でセマンティックコンフリクトを検出し、解決するのを助ける("インテント仕様")。
我々は,カーソルルールやゲームデザイン文書などの意図仕様を更新する際に,ユーザがコンフリクトを解決する方法を理解するために,セマンティックコミット(SemanticCommit)というインターフェースを開発した。
知識グラフベースのRAGパイプラインは競合検出を駆動し、LLMは解決の提案を支援する。
我々はこの手法を初期ベンチマークで評価した。
次に、ゲームデザイン文書とChatGPTメモリスタイルのAIエージェントメモリという2つのタスクドメインを対象とした、SemanticCommitの12名のユーザ内調査を報告し、ユーザが新しい情報を既存のリストに統合した。
参加者の半数はインパクト分析のワークフローを採用し、まずAI修正なしで紛争をフラグ付けし、グローバルなリビジョン機能にアクセスできたにもかかわらず、紛争をローカルに解決しました。
我々は、CursorやWindsurfのようなソフトウェアIDEのようなAIエージェントインターフェースは、影響分析のための余裕を提供し、ユーザーが生成から独立してAI検索を検証する手助けをするべきだと論じている。
私たちの研究は、AIエージェントデザイナが、人間のフィードバックと意思決定を含むプロセスとして、メモリの更新をどう考えるべきかについて語っています。
関連論文リスト
- Multi-Agent Actor-Critic Generative AI for Query Resolution and Analysis [1.0124625066746598]
本稿では,アクタ批判モデルに基づく問合せ解決のための変換フレームワークであるMASQRADを紹介する。
MASQRADは不正確または曖昧なユーザからの問い合わせを正確で行動可能な要求に翻訳するのに優れている。
MASQRAD は高度なマルチエージェントシステムとして機能するが、単一のAIエンティティとしてユーザに対して "masquerad" を提供する。
論文 参考訳(メタデータ) (2025-02-17T04:03:15Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - SECURE: Semantics-aware Embodied Conversation under Unawareness for Lifelong Robot Learning [17.125080112897102]
SECUREはこのような問題を解決するために設計された対話型タスク学習フレームワークである。
具体的会話を使って、その欠陥のあるドメインモデルを修正します。
エージェントが意味論的に認識されている場合、無意識で再配置を解決する学習がより効率的であることを示す。
論文 参考訳(メタデータ) (2024-09-26T11:40:07Z) - Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.10194953873209]
我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。
学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。
トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文 参考訳(メタデータ) (2024-07-03T15:38:57Z) - I2EDL: Interactive Instruction Error Detection and Localization [65.25839671641218]
連続環境(IVLN-CE)における対話型VLNの新たな課題を提案する。
これにより、VLN-CEナビゲーション中にエージェントがユーザと対話し、命令エラーに関する疑念を検証できる。
我々は、事前学習したモジュールを利用して命令エラーを検出し、テキスト入力と過去の観察を相互参照することで、命令中のそれらをピンポイントする。
論文 参考訳(メタデータ) (2024-06-07T16:52:57Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - Exploiting Scene Graphs for Human-Object Interaction Detection [81.49184987430333]
ヒューマン・オブジェクト・インタラクション(Human-Object Interaction,HOI)検出は、人間とオブジェクト間のインタラクションのローカライズと認識を目的とした、基本的な視覚的タスクである。
そこで本研究では,シーングラフを用いたヒューマン・オブジェクト・インタラクション(SG2HOI)検出タスクのための新しい手法を提案する。
SG2HOIはSG情報を2つの方法で組み込む:(1)シーングラフを世界的文脈の手がかりに埋め込み、シーン固有の環境コンテキストとして機能し、(2)オブジェクトの近傍から関係を収集し、それらを対話に転送するリレーショナル・アウェア・メッセージ・パッシング・モジュールを構築する。
論文 参考訳(メタデータ) (2021-08-19T09:40:50Z) - Personalized Query Rewriting in Conversational AI Agents [7.086654234990377]
本稿では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-11-09T20:45:39Z) - IART: Intent-aware Response Ranking with Transformers in
Information-seeking Conversation Systems [80.0781718687327]
我々は、情報探索会話におけるユーザ意図パターンを分析し、意図認識型ニューラルレスポンスランキングモデル「IART」を提案する。
IARTは、ユーザ意図モデリングと言語表現学習とTransformerアーキテクチャの統合の上に構築されている。
論文 参考訳(メタデータ) (2020-02-03T05:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。