論文の概要: Modular Speaker Architecture: A Framework for Sustaining Responsibility and Contextual Integrity in Multi-Agent AI Communication
- arxiv url: http://arxiv.org/abs/2506.01095v1
- Date: Sun, 01 Jun 2025 17:39:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.92868
- Title: Modular Speaker Architecture: A Framework for Sustaining Responsibility and Contextual Integrity in Multi-Agent AI Communication
- Title(参考訳): モジュール型話者アーキテクチャ: マルチエージェントAI通信における責任とコンテキスト整合性を維持するためのフレームワーク
- Authors: Khe-Han Toh, Hong-Kuan Teo,
- Abstract要約: マルチエージェントシステム間のコヒーレントでロールアウェアなコミュニケーションを持続することは、AIの基本的な課題である。
講演者の振る舞いを,役割追跡,責任継続性,コンテキストコヒーレンスのためにモジュールコンポーネントに分解するフレームワークである,モジュール型話者アーキテクチャ(MSA)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sustaining coherent, role-aware communication across multi-agent systems remains a foundational challenge in AI. Current frameworks often lack explicit mechanisms for speaker responsibility, leading to context drift, alignment instability, and degraded interpretability over time. We propose the Modular Speaker Architecture (MSA), a framework that decomposes speaker behavior into modular components for role tracking, responsibility continuity, and contextual coherence. Grounded in high-context human-AI dialogues, MSA includes three core modules: a Speaker Role Module, a Responsibility Chain Tracker, and a Contextual Integrity Validator. We evaluate MSA through annotated case studies and introduce structural metrics-pragmatic consistency, responsibility flow, and context stability-quantified via manual and automatic scoring and bootstrapped statistical analysis. Our results show that MSA reliably maintains interaction structure without reliance on affective signals or surface-level heuristics. We further implement a prototype configuration language (G-Code) and modular API to support MSA deployment in dynamic multi-agent scenarios.
- Abstract(参考訳): マルチエージェントシステム間のコヒーレントでロールアウェアなコミュニケーションを持続することは、AIの基本的な課題である。
現在のフレームワークでは、話者責任の明確なメカニズムが欠如しており、コンテキストドリフト、アライメント不安定、時間の経過とともに解釈可能性の低下につながっている。
講演者の振る舞いを,役割追跡,責任継続性,コンテキストコヒーレンスのためにモジュールコンポーネントに分解するフレームワークである,モジュール型話者アーキテクチャ(MSA)を提案する。
MSAは、高コンテキストのヒューマンAI対話に基盤を置いており、話者ロールモジュール、責任連鎖追跡モジュール、コンテキスト統合検証モジュールの3つのコアモジュールを含んでいる。
我々は、注釈付きケーススタディを通じてMSAを評価し、手動および自動スコアリングと自己ストラップ付き統計分析による構造的メトリクスの整合性、責任フロー、文脈安定性の定量化を導入する。
以上の結果から,MSAは感情信号や表面レベルのヒューリスティックに頼らずに,相互作用構造を確実に維持できることがわかった。
さらに、動的マルチエージェントシナリオにおけるMSAデプロイメントをサポートするために、プロトタイプ構成言語(G-Code)とモジュールAPIを実装します。
関連論文リスト
- WHEN TO ACT, WHEN TO WAIT: Modeling Structural Trajectories for Intent Triggerability in Task-Oriented Dialogue [13.925217613823264]
タスク指向対話システムは、ユーザ発話が意味的に完全であるように見えるが、適切なシステムアクションに必要な構造情報がない場合、しばしば困難に直面する。
我々は、UserLLMとAgentLLMの対話を通して非対称情報ダイナミクスをモデル化するフレームワークSTORMを提案する。
コントリビューションには,(1)対話システムにおける非対称情報処理の形式化,(2)協調理解の進化をモデル化する意図形成,(3)タスクパフォーマンスとともに内部認知改善を測定する評価指標などが含まれている。
論文 参考訳(メタデータ) (2025-06-02T17:11:10Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - Context-Aware Semantic Recomposition Mechanism for Large Language Models [0.0]
コンテキスト・アウェア・セマンティック・リコレーション・メカニズム(CASRM)は、大規模テキスト生成タスクにおけるコヒーレンス、コンテキスト適応性、エラー伝搬の制限に対処する新しいフレームワークとして導入された。
実験により、技術的、会話的、物語的テキストを含む複数の領域における意味的コヒーレンスを大幅に改善した。
このフレームワークは、逐次的なタスクにおけるエラーの伝播を軽減し、対話継続と多段階テキスト合成のパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-01-29T02:38:28Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks [4.132793413136553]
可変長アテンション機構を備えたピンブルモジュールであるEcho-MSAを紹介する。
提案した設計は,音声の可変長の特徴を捉え,固定長注意の限界に対処する。
論文 参考訳(メタデータ) (2023-09-14T14:51:51Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。