論文の概要: A governance horizon for ethical-use constraints in open-weight AI models
- arxiv url: http://arxiv.org/abs/2605.24383v1
- Date: Sat, 23 May 2026 03:47:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.962837
- Title: A governance horizon for ethical-use constraints in open-weight AI models
- Title(参考訳): オープンウェイトAIモデルにおける倫理的制約に対するガバナンスの地平
- Authors: Weiwei Xu, Hengzhi Ye, Haoran Ye, Kai Gao, Vladimir Filkov, Minghui Zhou,
- Abstract要約: オープンウェイトAIモデルに対する倫理的制約は、社会的関心事の反映であり、AIガバナンスポリシーの基礎である。
私たちはHugging Face Hubで2,142,823のモデルリポジトリを監査し、この開示ベースのガバナンスインフラストラクチャが、ディープモデル系統にわたってトレーサビリティを維持できるかどうかを確認します。
- 参考スコア(独自算出の注目度): 29.29847173198524
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Ethical constraints on open-weight AI models are both a reflection of societal concerns and a foundation for AI governance policy. They are expected to propagate to downstream derivatives while implemented as voluntary metadata disclosures that must be restated at each generation of reuse. We audit 2,142,823 model repositories on Hugging Face Hub to test whether this disclosure-based governance infrastructure can sustain traceability across deep model lineages. Restriction evidence decays with a half-life of 1.31 derivation steps ($R^2$=0.98), and beyond seven downstream generations at least 80% of descendant models lack sufficient public evidence for a governance determination, a depth boundary we formalize as the governance horizon. Platform-level interventions to restore missing licence metadata reveal that policy design (not enforcement alone) is the binding factor: inheritance-only designs require near-complete enforcement to move the horizon, whereas a mandatory-declaration design that explicitly resolves orphan lineage components shifts the horizon already at moderate enforcement. The structural bottleneck is lineages with no inheritable upstream intent: such orphan components remain undecidable under any inheritance-only policy regardless of enforcement rate, and unresolved upstream nodes additionally create direct downstream undecidability bottlenecks that inheritance rules alone cannot recover. Comparison with PyPI, where governance signals are carried by explicit machine-readable declarations, corroborates that the collapse is topology-specific to open-weight derivation rather than inherent to open ecosystems. These results establish that disclosure-based governance has a shallow, structurally determined reach in open-weight AI, and that achieving deep supply-chain accountability requires provenance mechanisms propagating governance signals through derivation itself.
- Abstract(参考訳): オープンウェイトAIモデルに対する倫理的制約は、社会的関心事の反映と、AIガバナンスポリシーの基礎の両方である。
それらは下流のデリバティブに伝播し、任意のメタデータ開示として実装され、再利用の各世代で再利用されなければならない。
私たちはHugging Face Hubで2,142,823のモデルリポジトリを監査し、この開示ベースのガバナンスインフラストラクチャが、ディープモデル系統にわたってトレーサビリティを維持できるかどうかを確認します。
制限証拠は1.31の派生段階(R^2$=0.98)の半減期で崩壊し、少なくとも7つの下流世代以上の子孫モデルの80%は、ガバナンス決定のための十分な公的な証拠を欠いている。
継承のみの設計は、地平線を移動させるためにほぼ完全な強制を必要とするのに対して、孤児系統のコンポーネントを明示的に解決する強制宣言設計は、適度な強制で既に地平線をシフトしている。
このような孤児のコンポーネントは、施行率に関わらず、いかなる継承のみのポリシーの下でも決定不可能であり、未解決上流ノードは、継承ルールだけでは回復できない、直接下流の未決定のボトルネックを発生させる。
明示的な機械可読宣言によってガバナンスシグナルが運ばれるPyPIと比較すると、崩壊はオープンエコシステムに固有のものではなく、トポロジー固有のトポロジーとオープンウェイトな派生である、という結論が導かれる。
これらの結果は、開示ベースのガバナンスは、オープンウェイトAIにおいて浅い、構造的に決定されたリーチを持ち、深いサプライチェーンのアカウンタビリティを達成するには、導出自体を通じてガバナンス信号を伝播する証明機構が必要であることを証明している。
関連論文リスト
- Interpretation, Learning, and Empathy as One Constraint: A Residual-Adequacy Architecture with Accountable Abstention [0.0]
一つの量から限界が生じる小さな認知アーキテクチャを開発する。
解釈決定ユニット(IDU)は、コンテントベクトルをレギュレーションのファミリを通じて解釈し、ライセンスするアクションを決定する。
任意のコンテンツと固定構成に対して、ユニークな端末証人を持つ有限個の有界コストステップで停止する。
論文 参考訳(メタデータ) (2026-05-24T10:57:28Z) - Do Coding Agents Understand Least-Privilege Authorization? [14.240332406666779]
我々は、現在のモデルが認証境界自体を推測できるかどうか検討する。
We show that frontier model often off permissions by the execution chain while giving unuseed or sensitive accesss。
そこで我々は,まずカバレッジ指向のポリシを生成し,各エントリをグラウンドと感度で監査する,十分性-高度分解法を提案する。
論文 参考訳(メタデータ) (2026-05-14T14:05:58Z) - PRISM: : Planning and Reasoning with Intent in Simulated Embodied Environments [59.07829883257003]
5つの集合住宅の上に建設され、PRISMは300の人間認証タスクを3つの能力レベルに構成する。
PRISMはエージェントに依存しない実行可能なアクションAPIを公開し、任意のエージェントをエンドツーエンドで評価できるようにする。
論文 参考訳(メタデータ) (2026-05-12T04:59:47Z) - Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF) [0.0]
大規模言語モデルは、安全クリティカルエンジニアリングにおける制御可能性のギャップを生み出します。
本稿では,エージェントをオープンループ生成からクローズループフェールセーフ決定性に移行するConvergent AI Agent Framework(CAAF)を紹介する。
CAAFの3つの柱は相補的な故障面に対処し、コモディティコストで制御可能性ギャップを閉じることはない。
論文 参考訳(メタデータ) (2026-04-18T15:15:09Z) - PolicyBank: Evolving Policy Understanding for LLM Agents [51.86716874651299]
PolicyBankは構造化されたツールレベルの政策洞察を維持し、それらを反復的に洗練する。
PolicyBankは、人間の神託に対するギャップの最大82%を閉じている。
論文 参考訳(メタデータ) (2026-04-16T20:29:30Z) - Nidus: Externalized Reasoning for AI-Assisted Engineering [0.0]
我々は、AI支援ソフトウェアデリバリのVモデルを機械化するガバナンスランタイムであるNidusを紹介する。
LLMの3つの家族は、すべてのコミットに関する現在の義務に対して検証された証明義務の下で10万行のシステムを提供した。
Nidusは、エンジニアリング方法論を永続性の前にすべての突然変異で検証された決定可能なアーティファクトに外部化する。
論文 参考訳(メタデータ) (2026-04-06T18:32:09Z) - Improving Search Agent with One Line of Code [68.58667107354253]
ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文 参考訳(メタデータ) (2026-03-10T04:07:39Z) - Copyright Laundering Through the AI Ouroboros: Adapting the 'Fruit of the Poisonous Tree' Doctrine to Recursive AI Training [0.31061678033205636]
著作権の執行は明白な取引にかかっている。
マルチ世代パイプラインを通じてAIシステムがトレーニングされる場合、それは緊張する。
本条では,AI-FOPT標準を提案するために「有毒樹の果実(FOPT)」の原則を適用している。
論文 参考訳(メタデータ) (2026-01-06T01:02:50Z) - Beyond the Black Box: Identifiable Interpretation and Control in Generative Models via Causal Minimality [52.57416398859353]
因果的最小性は、明確な因果的解釈と頑健でコンポーネント単位で識別可能な制御を持つ拡散視覚と自己回帰言語モデルの潜在表現を許容できることを示す。
我々は階層的選択モデルのための新しい理論的枠組みを導入し、より高レベルな概念は低レベルの変数の制約された構成から生まれる。
これらの因果的基礎を持つ概念は、きめ細かいモデルステアリングのレバーとして機能し、透明で信頼性の高いシステムへの道を開く。
論文 参考訳(メタデータ) (2025-12-11T14:59:14Z) - Deliberative Alignment: Reasoning Enables Safer Language Models [64.60765108418062]
モデルセーフティ仕様を教える新しいパラダイムであるDeliberative Alignmentを紹介します。
このアプローチを使ってOpenAIのoシリーズモデルを整列させ、人書きのチェーンや回答を必要とせず、OpenAIの安全ポリシーに極めて正確な順守を実現しました。
論文 参考訳(メタデータ) (2024-12-20T21:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。