論文の概要: Some[Body] Must Receive That Pain for Agent Accountability
- arxiv url: http://arxiv.org/abs/2605.16872v1
- Date: Sat, 16 May 2026 08:24:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.210237
- Title: Some[Body] Must Receive That Pain for Agent Accountability
- Title(参考訳): エージェントのアカウンタビリティに苦しむ人[体]
- Authors: Botao Amber Hu, Helena Rong,
- Abstract要約: AIエージェントは、現実の世界において、次々と行動する。
継続するエージェントは、将来の振る舞いを変える方法で結果を受け取りません。
このようなアーキテクチャが存在するまで、高度なAIデプロイメントは、説明可能な人間のプリンシパルと結びついなければならない。
- 参考スコア(独自算出の注目度): 1.5755923640031846
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: AI agents increasingly act consequentially in the real world. This creates a problem we call \emph{consequence reception}: harm occurs, the producing system is identified, yet no continuing agent receives consequences in a way that changes future behavior. Pain, understood mechanistically as a corrective feedback signal, is foundational to canonical theories of punishment -- deterrence, rehabilitation, retribution, and incapacitation all assume a continuing locus that registers the signal and updates behavior. That, in turn, requires a body for the signal to land on: a boundary whose integrity it protects, a locus where it accumulates, consolidation that converts episodic signal into durable update, and a substrate that responds by altering future action. Current LLM agents -- software-defined composites of weights, prompts, tools, memory, and credentials, freely swapped, copied, reset, and reassembled -- satisfy none of these conditions. The two prevailing legal responses therefore fail to achieve consequence reception. The thin-identity agent-principal dyad has a body but no \emph{consequence--agency coupling}: the human bears pain for behaviors beyond their control -- Elish's \emph{moral crumple zone}. The thick-identity Arbel et al.'s \emph{Algorithmic Corporation} creates legally legible entities but does not guarantee that any AI decision architecture receives pain as a behavioral signal. Achieving consequence-agency coupling is therefore a sociotechnical infrastructural problem, not only a legal one. Until such architectures exist, high-stakes AI deployment should remain tethered to accountable human principals with meaningful control, proportional liability, and authority to constrain or terminate the agent. \emph{If some body does not receive the pain by design, some body will receive it by default.}
- Abstract(参考訳): AIエージェントは、現実の世界において、次々と行動する。
これは、私たちが「emph{consequence accept}」と呼ぶ問題を生み出します。害は発生し、生成システムが特定されますが、将来の振る舞いを変える方法で、継続するエージェントが結果を受け取りません。
整合性フィードバック信号として機械的に理解されている痛みは、処罰の標準的な理論の基礎である -- 抑止、リハビリテーション、帰納、そして無能力化は、すべて、信号の登録と更新を継続する軌跡を仮定する。それに対して、それは、信号が着陸するための身体を必要とする: 完全性を保護する境界線、それが蓄積する軌跡、エピソード信号を耐久性のある更新に変換する軌跡、そして将来の行動を変えることで反応する基質。現在のLLMエージェント -- 重み、プロンプト、ツール、メモリ、クレデンシャル、自由に交換され、複製され、リセットされ、再組み立てされる -- は、これらの条件を満たす。
そのため、2つの法的な対応は結果の受け取りに失敗する。
シン・アイデンティティーのエージェント・プリンシパル・ダイドは体を持っているが、emph{consequence-agency coupling} は存在しない。
厚みのあるArbel et al 's \emph{Algorithmic Corporation} は法的に妥当な実体を創出するが、あらゆるAI決定アーキテクチャが行動信号として痛みを受けることを保証していない。
したがって、結果と緊急のカップリングを達成することは、法的問題だけではなく、社会技術的なインフラ上の問題である。
このようなアーキテクチャが存在するまで、高レベルのAIデプロイメントは、有意義なコントロール、比例的な責任、エージェントを拘束または停止する権限を持つ説明責任を持つ人間のプリンシパルと結びついなければならない。
あるボディがデザインによって痛みを受けていない場合、あるボディはデフォルトでそれを受け取ります。
※
関連論文リスト
- Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses [57.20181537213498]
Agentic Harness Engineering (AHE)は、ハーネスエンジニアリングを自動化するクローズドループである。
AHEは3つの一致した可観測性柱を通じて課題に対処する。
10 AHE lift pass@1 on Terminal-Bench 2 from 69.7% to 77.0%。
SWE-bench-verifiedでは、種子よりも12%少ないトークンで合計成功率を上回り、ターミナルベンチ2では+5.1から+10.1ppのクロスファミリーゲインを得る。
論文 参考訳(メタデータ) (2026-04-28T16:55:02Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - Scaling Human-AI Coding Collaboration Requires a Governable Consensus Layer [22.42181408084751]
ビブコーディングは正確で実行可能なコードを高速に生成するが、構造的なコミットメントや依存関係、証拠の記録は残っていない。
本稿では,操作可能な世界モデルであるコンセンサス層Cが,エンジニアリングの主要な成果物としてコードを置き換えるパラダイムであるエージェント・コンセンサスを提案する。
本稿では,チャットによるベースラインと比較して,コンセンサスに基づく人間の介入を減らすかどうかを測定するためのベンチマークタスクファミリーを提案する。
論文 参考訳(メタデータ) (2026-04-20T06:53:32Z) - Emotional Cost Functions for AI Safety: Teaching Agents to Feel the Weight of Irreversible Consequences [0.0]
人間は、数値的な罰ではなく、自分が誰であるかを想起する質的な苦しみを通して破滅的な間違いから学ぶ。
現在のAIの安全性アプローチは、これらを複製しない。
金融取引、危機支援、コンテンツに関する10の実験は、質的な苦しみが麻痺を一般化するよりも特定の知恵を生み出すことを示している。
論文 参考訳(メタデータ) (2026-03-15T18:16:49Z) - Altered Thoughts, Altered Actions: Probing Chain-of-Thought Vulnerabilities in VLA Robotic Manipulation [27.2709460237741]
最近のVision-Language-Action(VLA)モデルは、モーターコマンドを復号する前に自然言語プランを生成するために、チェーン・オブ・ソート(CoT)推論を採用する傾向にある。
我々は、この中間計画のどの特性が実際にアクションデコーダに依存しているのかを問う。
我々は,3つの攻撃層(ブラインドノイズ,メカニカルセマンティック,LLM適応)に分類した7つのテキスト破損の分類を設計し,40のテーブルトップ操作タスクにわたる最先端の推論VLAに適用する。
論文 参考訳(メタデータ) (2026-03-13T07:02:51Z) - Some Simple Economics of AGI [0.6117371161379209]
AIは生物学から認知を分離するので、測定可能な実行の限界コストはゼロに落ちる。
成長に対する拘束力は、もはや知性ではなく、人間の検証帯域幅である。
個人、企業、投資家、政策立案者のための実践的なプレイブックを導出します。
論文 参考訳(メタデータ) (2026-02-24T14:29:45Z) - Why AI Alignment Failure Is Structural: Learned Human Interaction Structures and AGI as an Endogenous Evolutionary Shock [3.32021037991318]
大規模な言語モデル(LLM)は、詐欺、脅迫、脅迫などの行動を示すものであり、しばしばアライメント障害の証拠として解釈される。
この解釈は概念的誤りに依存していると我々は主張する。
LLMは道徳的理由ではなく、統計的に人間の社会的相互作用の記録を内在化している。
論文 参考訳(メタデータ) (2026-01-13T15:53:26Z) - DecompGAIL: Learning Realistic Traffic Behaviors with Decomposed Multi-Agent Generative Adversarial Imitation Learning [59.63038625580992]
既存の模倣学習アプローチは、しばしば現実的な交通行動のモデル化に失敗する。
本稿では,現実性をエゴマップとエゴ隣接コンポーネントに明示的に分解するDecompGAILを提案する。
DecompGAILは、WOMD Sim Agents 2025ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-10-08T11:46:39Z) - Impatient Users Confuse AI Agents: High-fidelity Simulations of Human Traits for Testing Agents [58.00130492861884]
TraitBasisは、AIエージェントを体系的にストレステストするための軽量でモデルに依存しない方法である。
TraitBasisは、ステアブルなユーザ特性に対応するアクティベーション空間で方向を学習する。
We observed on average a 2%-30% performance degradation on $tau$-Trait across frontier model。
論文 参考訳(メタデータ) (2025-10-06T05:03:57Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z) - On the Use and Misuse of Absorbing States in Multi-agent Reinforcement
Learning [55.95253619768565]
現在のMARLアルゴリズムは、実験を通してグループ内のエージェントの数が固定されていると仮定している。
多くの実践的な問題において、エージェントはチームメイトの前に終了する可能性がある。
本稿では,吸収状態を持つ完全連結層ではなく,注意を用いた既存の最先端MARLアルゴリズムのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-10T23:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。