論文の概要: Semantic Prompting: Agentic Incremental Narrative Refinement through Spatial Semantic Interaction
- arxiv url: http://arxiv.org/abs/2604.19971v1
- Date: Tue, 21 Apr 2026 20:28:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.782337
- Title: Semantic Prompting: Agentic Incremental Narrative Refinement through Spatial Semantic Interaction
- Title(参考訳): セマンティック・プロンプト:空間的セマンティック・インタラクションによるエージェント的インクリメンタル・ナラティブ・リファインメント
- Authors: Xuxin Tang, Ibrahim Tahmid, Eric Krokos, Kirsten Whitley, Xuan Wang, Chris North,
- Abstract要約: 本稿ではセマンティック・プロンプト(Semantic Prompting)を紹介する。
S-PRISMは相互作用修正の精度を効果的に向上させた。
その結果,ユーザは効率,適応性,信頼に足るサポートを高く評価し,人間-LLMの意図的アライメントを効果的に強化した。
- 参考スコア(独自算出の注目度): 8.657871568409925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive spatial layouts empower users to synthesize information and organize findings for sensemaking. While Large Language Models (LLMs) can automate narrative generation from spatial layouts, current collage-based and re-generation methods struggle to support the incremental spatial refinements inherent to the sensemaking process. We identify three critical gaps in existing spatial-textual generation: interaction-revision misalignment, human-LLM intent misalignment, and lack of granular customization. To address these, we introduce Semantic Prompting, a framework for spatial refinement that perceives semantic interactions, reasons about refinement intent, and performs targeted positional revisions. We implemented S-PRISM to realize this framework. The empirical evaluation demonstrated that S-PRISM effectively enhanced the precision of interaction-revision refinement. A user study ($N=14$) highlighted how participants leveraged S-PRISM for incremental formalization through interactive steering. Results showed that users valued its efficient, adaptable, and trustworthy support, which effectively strengthens human-LLM intent alignment.
- Abstract(参考訳): インタラクティブな空間レイアウトは、ユーザが情報を合成し、センスメイキングのための発見を整理することを可能にする。
大規模言語モデル(LLM)は空間的レイアウトから物語を生成することができるが、現在のコラージュベースおよび再生方法は、センスメイキングプロセスに固有の漸進的な空間的洗練をサポートするのに苦労している。
我々は,既存の空間・テクスチャ生成における3つの重要なギャップを識別する:インタラクション・リビジョンのミスアライメント,ヒューマン・LLMの意図のミスアライメント,粒度のカスタマイズの欠如。
これらの問題に対処するため,セマンティック・プロンプティング(Semantic Prompting)を導入する。
我々はこのフレームワークを実現するためにS-PRISMを実装した。
実験により,S-PRISMはインタラクション・リビジョン・リファインメントの精度を効果的に向上した。
ユーザ調査(N=14$)では、参加者がS-PRISMをインタラクティブなステアリングを通じて段階的なフォーマル化に活用する方法を強調した。
その結果,ユーザは効率,適応性,信頼に足るサポートを高く評価し,人間-LLMの意図的アライメントを効果的に強化した。
関連論文リスト
- SocialMirror: Reconstructing 3D Human Interaction Behaviors from Monocular Videos with Semantic and Geometric Guidance [49.69016078147708]
密接な相互作用シナリオにおける人間の行動の正確な再構築は、拡張現実における現実的な仮想インタラクションの実現に不可欠である。
本稿では,これらの問題に効果的に対処するための意味的および幾何学的手がかりを統合する拡散ベースのフレームワークであるSocialMirrorを提案する。
SocialMirrorはインタラクティブなヒューマンメッシュを再構築する上で,最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-15T07:41:52Z) - Interactive ASR: Towards Human-Like Interaction and Semantic Coherence Evaluation for Agentic Speech Recognition [52.63676763985825]
トークンレベルの精度を超えた認識品質を評価するための意味認識評価指標を提案する。
我々は,人間のようなマルチターンインタラクションをシミュレートするエージェント・フレームワークを設計し,認識出力の反復的改善を可能にする。
対話型およびエージェント型ASRにおける今後の研究を促進するためのコードをリリースする。
論文 参考訳(メタデータ) (2026-04-10T09:02:42Z) - DIAURec: Dual-Intent Space Representation Optimization for Recommendation [11.613859816621337]
本稿では,意図と言語モデリングを統合した表現学習フレームワークを提案する。
DIAURecは、協調的および言語信号によって形成されるプロトタイプと配布意図空間に基づいて、表現を再構築する。
3つの公開データセットの実験は、DIAURecが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2026-04-10T08:16:55Z) - AffordGrasp: Cross-Modal Diffusion for Affordance-Aware Grasp Synthesis [50.793806818677716]
AffordGraspは、物理的に安定し、セマンティックに忠実な人間の握りを高精度に生成する。
AffordGraspは、手ポーズの空きを意識した潜在表現を二重条件拡散プロセスに統合する。
AffordGraspはHO-3D, OakInk, GRAB, AffordPoseの4つの命令強化ベンチマークで評価した。
論文 参考訳(メタデータ) (2026-03-09T06:56:35Z) - Give Users the Wheel: Towards Promptable Recommendation Paradigm [21.39017335979666]
Decoupled Promptable Sequential Recommendation (DPR)は、従来のシーケンシャルバックボーンにPromptable Recommendationをサポートするためのモデルに依存しないフレームワークである。
DPRは、潜在ユーザ表現を検索空間内で直接変調する。
プロンプト誘導タスクにおいて、最先端のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-21T18:41:28Z) - EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks [24.41705039390567]
EmbodiedVSR (Embodied Visual Space Reasoning) は動的シーングラフ誘導型Chain-of-Thought (CoT)推論を統合する新しいフレームワークである。
本手法はタスク固有の微調整なしでゼロショット空間推論を可能にする。
実験により,我々のフレームワークは,既存のMLLM法よりも精度と推論コヒーレンスにおいて優れていることが示された。
論文 参考訳(メタデータ) (2025-03-14T05:06:07Z) - Dynamic benchmarking framework for LLM-based conversational data capture [0.0]
本稿では,大規模言語モデル(LLM)を評価するためのベンチマークフレームワークを提案する。
生成エージェントシミュレーションを統合して、情報抽出、コンテキスト認識、適応エンゲージメントといった重要次元のパフォーマンスを評価する。
その結果,不明瞭な応答を扱う場合,適応戦略によりデータの抽出精度が向上することが示唆された。
論文 参考訳(メタデータ) (2025-02-04T15:47:47Z) - An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.45660055499103]
ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:53:01Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。