論文の概要: To Throw a Stone with Six Birds: On Agents and Agenthood
- arxiv url: http://arxiv.org/abs/2604.03239v1
- Date: Tue, 03 Feb 2026 10:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.344819
- Title: To Throw a Stone with Six Birds: On Agents and Agenthood
- Title(参考訳): 6羽の鳥で石を投げる:エージェントとエージェントについて
- Authors: Ioannis Tsiokos,
- Abstract要約: Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
SBT内では,タイプ正当性評価を行う。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Six Birds Theory (SBT) treats macroscopic objects as induced closures rather than primitives. Empirical discussions of agency often conflate persistence (being an object) with control (making a counterfactual difference), which makes agency claims difficult to test and easy to spoof. We give a type-correct account of agency within SBT: a theory induces a layer with an explicit interface and ledgered constraints; an agent is a maintained theory object whose feasible interface policies can steer outside futures while remaining viable. We operationalize this contract in finite controlled systems using four checkable components: ledger-gated feasibility, a robust viability kernel computed as a greatest fixed point under successor-support semantics, feasible empowerment (channel capacity) as a proxy for difference-making, and an empirical packaging map whose idempotence defect quantifies objecthood under coarse observation. In a minimal ring-world with toggles for repair, protocol holonomy, identity staging, and operator rewriting, matched-control ablations yield four separations: calibrated null regimes with single actions show zero empowerment and block model-misspecification false positives; enabling repair collapses the idempotence defect; protocols increase empowerment only at horizons of two or more steps; and learning to rewrite operators monotonically increases median empowerment (0.73 to 1.34 bits). These results provide hash-traceable tests that separate agenthood from agency without making claims about goals, consciousness, or biological organisms, and they are accompanied by reproducible, audited artifacts.
- Abstract(参考訳): Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
エージェンシーに関する実証的な議論は、しばしば(オブジェクトである)永続性を制御(反ファクト的な違いを生み出す)と説明し、エージェンシーはテストが困難で、偽造が容易であると主張する。
我々は,SBT内のエージェントのタイプ正しい説明を与える: 理論は明示的なインターフェースと台帳付き制約を持つ層を誘導する; エージェントは維持された理論対象であり,実現可能なインターフェースポリシーは将来性を維持しつつも,未来の外部を操り続けることができる。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する:台帳ゲートの実現可能性、後継セマンティクスの下で最大の固定点として計算された堅牢な生存可能性カーネル、差分生成のためのプロキシとして実現可能なエンパワーメント(チャネルキャパシティ)、および粗い観察下でのオブジェクト間を定量化する経験的パッケージングマップ。
修復、プロトコルのホロノミー、アイデンティティのステージング、オペレータの書き換えのためのトグルを持つ最小のリングワールドでは、マッチ制御のアブリゲーションは4つの分離をもたらす: 単一のアクションを持つキャリブレーションされたヌルレジームは、ゼロエンパワーメントを示し、モデルミスセシエーションの偽陽性をブロックする; 修復を可能にすることで、イデペンポタンス欠陥を解消する; プロトコルは、2つ以上のステップの水平線でのみエンパワーメントを増大させる; 演算子を書き直すことを学ぶことは、単調に中央エンパワーメント(0.73ビットから1.34ビット)を増大させる。
これらの結果は、目標、意識、生物学的生物に関する主張をすることなくエージェントをエージェントから分離するハッシュ追跡可能なテストを提供し、再現可能な監査済みのアーティファクトを伴っている。
関連論文リスト
- Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - CoVerRL: Breaking the Consensus Trap in Label-Free Reasoning via Generator-Verifier Co-Evolution [52.691495954442985]
CoVerRLは1つのモデルがジェネレータと検証ロールを交換するフレームワークで、各機能が他方をブートストラップする。
Qwen と Llama のモデルファミリーでの実験では、CoVerRL は数理推論のベンチマークで4.7-5.9% でラベルなしのベースラインを上回っている。
自己検証の精度は55%から85%以上改善され、両方の能力が真に共存することを確認した。
論文 参考訳(メタデータ) (2026-03-18T14:38:55Z) - Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0]
既存のセキュリティレイヤでは、AIエージェントに何ができるか、それが主張するものを実行したのか、マルチエージェントインタラクションで何が起きたのかを検証できない。
既存のフレームワークはこれら2つを詳述し、サイレントな能力のエスカレーションを可能にし、検証済みの証明なしに相互作用を残す。
我々は3つのエージェントガバナンス要件を導出する:能力の完全性(G1)、行動の妥当性(G2)、相互作用監査性(G3)。
基本(Ed25519, SHA-256; 97 us verify)と拡張(BBS+選択開示、Groth16 DV-SNARK; 13.8 ms)の2つの暗号に依存しないインスタンス化で検証する。
論文 参考訳(メタデータ) (2026-03-15T11:46:57Z) - TraceGuard: Process-Guided Firewall against Reasoning Backdoors in Large Language Models [19.148124494194317]
我々は,小規模モデルを堅牢な推論ファイアウォールに変換するプロセス誘導型セキュリティフレームワークであるTraceGuardを提案する。
提案手法は,推理トレースを信頼できないペイロードとして扱い,詳細な防衛戦略を確立する。
グレーボックス設定における適応的敵に対する堅牢性を実証し、TraceGuardを実用的で低レイテンシなセキュリティプリミティブとして確立する。
論文 参考訳(メタデータ) (2026-03-02T22:19:13Z) - Verifiable Semantics for Agent-to-Agent Communication [0.2866560512724962]
マルチエージェントAIシステムは一貫した通信を必要とする。
自然言語は解釈可能であるが、セマンティックドリフトに弱い。
そこで本研究では,刺激意味モデルに基づく認証プロトコルを提案する。
論文 参考訳(メタデータ) (2026-02-18T12:55:58Z) - Multi-Agent Debate: A Unified Agentic Framework for Tabular Anomaly Detection [7.807411603618987]
マルチエージェント議論フレームワーク(MAD)は、不一致を第一級信号として扱う。
MADは、大言語モデル(LLM)ベースの批評家によって強化された正規化された異常スコア、信頼性、構造化された証拠を生成する。
コンフォメーションキャリブレーションが議論されたスコアをラップして、交換可能性の下で偽陽性を制御する方法を示す。
論文 参考訳(メタデータ) (2026-02-15T17:44:32Z) - Sponge Tool Attack: Stealthy Denial-of-Efficiency against Tool-Augmented Agentic Reasoning [58.432996881401415]
最近の作業では、エージェント推論を可能にするために、外部ツールで大きな言語モデル(LLM)を拡張している。
本稿では,入力プロンプトを書き換えることのみでエージェント推論を妨害するスポンジツールアタック(STA)を提案する。
STAは、意味的忠実度の高い原文からの良心的な即興的な書き直しを生成する。
論文 参考訳(メタデータ) (2026-01-24T19:36:51Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Core Safety Values for Provably Corrigible Agents [2.6451153531057985]
我々は,複数段階の部分的に観察された環境において,検証可能な保証を付与し,適応性のための最初の実装可能なフレームワークを紹介した。
私たちのフレームワークは、単一の報酬を5つの*構造的に分離された*ユーティリティヘッドに置き換えます。
敵がエージェントを修正できるオープンエンド設定では、任意のポストハックエージェントが調整性に反するかどうかを判断することは不可能である。
論文 参考訳(メタデータ) (2025-07-28T16:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。