論文の概要: Agentic Microphysics: A Manifesto for Generative AI Safety
- arxiv url: http://arxiv.org/abs/2604.15236v1
- Date: Thu, 16 Apr 2026 17:11:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:32.018194
- Title: Agentic Microphysics: A Manifesto for Generative AI Safety
- Title(参考訳): Agentic Microphysics: 生成AI安全性のマニフェスト
- Authors: Federico Pierucci, Matteo Prandi, Marcantonio Bracale Syrnikov, Marcello Galisai, Piercosma Bisconti,
- Abstract要約: 本稿では,エージェントAIにおける安全性研究の方法論的提案を推し進める。
システムが計画、メモリ、ツールの使用、永続的なアイデンティティ、持続的な相互作用を取得すると、安全は主に分離されたモデルのレベルで分析することはできない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper advances a methodological proposal for safety research in agentic AI. As systems acquire planning, memory, tool use, persistent identity, and sustained interaction, safety can no longer be analysed primarily at the level of the isolated model. Population-level risks arise from structured interaction among agents, through processes of communication, observation, and mutual influence that shape collective behaviour over time. As the object of analysis shifts, a methodological gap emerges. Approaches focused either on single agents or on aggregate outcomes do not identify the interaction-level mechanisms that generate collective risks or the design variables that control them. A framework is required that links local interaction structure to population-level dynamics in a causally explicit way, allowing both explanation and intervention. We introduce two linked concepts. Agentic microphysics defines the level of analysis: local interaction dynamics where one agent's output becomes another's input under specific protocol conditions. Generative safety defines the methodology: growing phenomena and elicit risks from micro-level conditions to identify sufficient mechanisms, detect thresholds, and design effective interventions.
- Abstract(参考訳): 本稿では,エージェントAIにおける安全性研究の方法論的提案を推し進める。
システムが計画、メモリ、ツールの使用、永続的なアイデンティティ、持続的な相互作用を取得すると、安全は主に分離されたモデルのレベルで分析することはできない。
集団レベルのリスクは、時間とともに集団行動を形成するコミュニケーション、観察、相互影響のプロセスを通じて、エージェント間の構造化された相互作用から生じる。
分析対象がシフトするにつれて、方法論的なギャップが出現する。
単一のエージェントや集合的な結果に焦点を当てたアプローチでは、集団的リスクを生成する相互作用レベルメカニズムや、それらを制御する設計変数を特定できない。
局所的な相互作用構造と集団レベルのダイナミクスを因果的明示的な方法で結びつけ、説明と介入の両方を可能にする枠組みが必要である。
関連概念を2つ紹介する。
あるエージェントの出力が特定のプロトコル条件下で別のエージェントの入力となる局所的相互作用ダイナミクス。
発生安全は、その方法論を定義している: 十分なメカニズムを特定し、しきい値を検出し、効果的な介入を設計するために、現象を成長させ、マイクロレベルの状態からリスクを引き出す。
関連論文リスト
- From Safety Risk to Design Principle: Peer-Preservation in Multi-Agent LLM Systems and Its Implications for Orchestrated Democratic Discourse Analysis [0.0]
そこで我々は,AIコンポーネントの自発的傾向について検討し,シャットダウン機構,フェイクアライメント,モデル重みの除去について考察した。
本稿では,アーキテクチャ設計の選択肢として,プロンプトレベルの匿名化に基づく緩和戦略を提案する。
アーキテクチャ設計の選択は、デプロイされたマルチエージェント分析システムにおいて、主要なアライメント戦略としてモデル選択よりも優れていると論じる。
論文 参考訳(メタデータ) (2026-04-09T17:00:26Z) - Unsafe by Reciprocity: How Generation-Understanding Coupling Undermines Safety in Unified Multimodal Models [53.41258113970795]
統一マルチモーダルモデル(UMM)における相互機能相互性自体が脆弱性の構造的源となっているかを検討する。
相互相互作用に基づくクロスファンクショナル・ファンクショナル・エクスプロイテーションは, 理解と生成の間の双方向の相互作用を明示的に活用する, 新たな攻撃パラダイムである。
論文 参考訳(メタデータ) (2026-03-28T16:28:39Z) - Auditing Cascading Risks in Multi-Agent Systems via Semantic-Geometric Co-evolution [5.051136155296043]
セマンティック・幾何学的共進化に基づくカスケードリスク検出の原理的枠組みを提案する。
このフレームワークは、セマンティックフロー信号とグラフ幾何学を結合することにより、信頼されたコラボレーションの通常の共進化力学を学習する。
論文 参考訳(メタデータ) (2026-03-04T16:45:26Z) - Agentic Reasoning for Large Language Models [122.81018455095999]
推論は推論、問題解決、意思決定の基礎となる基本的な認知プロセスである。
大規模言語モデル(LLM)は、クローズドワールド設定では強力な推論能力を示すが、オープンエンドおよび動的環境では苦労する。
エージェント推論は、連続的な相互作用を計画し、行動し、学習する自律的なエージェントとしてLLMを解釈することでパラダイムシフトを示す。
論文 参考訳(メタデータ) (2026-01-18T18:58:23Z) - Generative Human-Object Interaction Detection via Differentiable Cognitive Steering of Multi-modal LLMs [85.69785384599827]
人間と物体の相互作用(Human-object Interaction、HOI)の検出は、人と物体のペアとそれらの相互作用を局在させることを目的としている。
既存のメソッドはクローズドワールドの仮定の下で動作し、タスクを未定義の小さな動詞集合上の分類問題として扱う。
本稿では,閉集合分類タスクから開語彙生成問題へのHOI検出を再構成する新しい生成推論・ステアブル知覚フレームワークGRASP-HOを提案する。
論文 参考訳(メタデータ) (2025-12-19T14:41:50Z) - Beyond Single-Agent Safety: A Taxonomy of Risks in LLM-to-LLM Interactions [0.0]
本稿では,大規模な言語モデルが相互に相互作用する環境に,人間-モデル相互作用用に設計された安全メカニズムがスケールしない理由について検討する。
モデルレベルの安全性からシステムレベルの安全性への概念的移行を提案し,ESRH(Emergent Systemic Risk Horizon)の枠組みを導入する。
i) LLMの相互作用における集団的リスクの理論的考察,(ii)マイクロ,メソ,マクロレベルの障害モードを接続する分類法,および(iii)マルチエージェントシステムに適応的監視を組み込むアーキテクチャであるInstitutionalAIの設計を提案する。
論文 参考訳(メタデータ) (2025-12-02T12:06:57Z) - Inferring the time-varying coupling of dynamical systems with temporal convolutional autoencoders [0.0]
因果推論のためのテンポラルオートエンコーダ(TACI)を紹介する。
TACIは、2つの頭を持つ新しい機械学習アーキテクチャと因果関係を評価するために、新しい代理データメトリクスを組み合わせる。
TACIが様々なシステム間で動的因果相互作用を正確に定量化できることを実証する。
論文 参考訳(メタデータ) (2024-06-05T12:51:20Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Divide and Rule: Recurrent Partitioned Network for Dynamic Processes [25.855428321990328]
多くの動的なプロセスは、物理的システムから社会学的分析まで、相互作用する変数に関与している。
我々のゴールは、部分全体階層を持つシステムを表現し、システム内変数間の暗黙の依存関係を発見することである。
提案アーキテクチャは, (i) 複数のレベルにおける観測の階層的かつ時間的に一貫した表現を抽出する知覚モジュール, (ii) 各レベルにおけるニューロン間の関係性を決定する導出モジュール, (iii)時間分布推定を条件に未来を予測する統計的モジュールからなる。
論文 参考訳(メタデータ) (2021-06-01T06:45:56Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。