論文の概要: Prompt Governance? On Governing Technologies Governed by Natural Language
- arxiv url: http://arxiv.org/abs/2606.07539v1
- Date: Wed, 29 Apr 2026 17:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 22:12:57.814538
- Title: Prompt Governance? On Governing Technologies Governed by Natural Language
- Title(参考訳): プロンプトガバナンス : 自然言語による統治技術について
- Authors: Anna Neumann, Holli Sargeant, Jatinder Singh,
- Abstract要約: 文献におけるシステムレベルの指示について,研究者が議論し,扱い方を評価する。
本稿では,システムレベルの命令を安定的かつ解釈可能な制御機構として扱う政策アプローチを複雑に扱う方法を示す。
- 参考スコア(独自算出の注目度): 7.736311812168453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative artificial intelligence (GenAI) is increasingly operated by natural language instructions (prompts). Across the pipeline, stakeholders designate various forms, e.g. end-user guidelines, developer specifications, or system prompts, as prompt governance instruments. These textual artifacts are intended to shape model behaviour by specifying constraints, priorities, and compliance rules. Policymakers and regulators have begun to treat system-level instructions as accessible prompt-based GenAI intervention points, assuming they function (directly or indirectly) as behavioural control. Yet whether these instructions operate reliably and predictably enough across contexts to support such governance frameworks remains underexplored. Towards this, we systematically evaluate (i) how researchers discuss and treat system-level instructions in the literature, focusing on large language models (LLMs) as they isolate language effects; (ii) how policymakers position system-level instructions as governance objects, incorporating analysis of two policy frameworks (US Exec. Order on Preventing Woke AI, and EU General-Purpose AI Code of Practice); and (iii) whether misalignments between these perspectives warrant closer inspection of the viability of governing AI through natural language. We identify a fragmented literature advancing varying and contradictory claims about what goals system-level instructions can achieve, which we distil into a typology of claims. Further, we show how divergent claims complicate policy approaches that treat system-level instructions as stable, interpretable control mechanisms. We argue that given such misalignments, careful consideration must be given to prompt governance approaches. Our findings have broad implications, extending from a LLM policy context to the use of natural language as control mechanism in technical systems more generally.
- Abstract(参考訳): 生成人工知能(GenAI)は、自然言語命令(prompts)によってますます運用されている。
パイプライン全体を通じて、ステークホルダは、例えばエンドユーザガイドライン、開発者仕様、あるいはシステムプロンプトなど、さまざまな形式をガバナンスのプロンプトとして指定します。
これらのテキストアーティファクトは、制約、優先順位、コンプライアンスルールを指定することによってモデル行動を形成することを意図している。
政策立案者や規制当局は、システムレベルの指示を(直接的または間接的に)行動制御として機能すると仮定して、アクセス可能なプロンプトベースのGenAI介入ポイントとして扱うようになった。
しかし、これらの命令が、そのようなガバナンスフレームワークをサポートするためにコンテキスト全体にわたって確実に、そして、十分に予測できるかどうかはまだ未定だ。
これに向けて、我々は体系的に評価する。
一 研究者は、言語効果を孤立させるため、大規模言語モデル(LLM)に着目して、文献におけるシステムレベルの指示を議論し、どのように扱うか。
(二)政策立案者が統治対象としてシステムレベルの指示をどう位置づけるか、二つの政策枠組みの分析を取り入れているか(US Exec. Order onventing Woke AI, and EU General-Purpose AI Code of Practice)。
三 これらの視点の相違により、自然言語によるAI管理の可否をより精査するか否か。
我々は、システムレベルの指示が達成できる目標について、様々な、矛盾する主張を進めていく断片化された文献を特定し、クレームの類型化に駆り立てる。
さらに,システムレベルの命令を安定的,解釈可能な制御機構として扱うためのポリシーアプローチが複雑であることを示す。
このような不一致を前提として,ガバナンスアプローチの推進には慎重な考慮が必要である,と我々は主張する。
本研究は,LLM政策の文脈から,技術システムにおける制御機構としての自然言語の利用まで,幅広い意味を持つ。
関連論文リスト
- PolicyBank: Evolving Policy Understanding for LLM Agents [51.86716874651299]
PolicyBankは構造化されたツールレベルの政策洞察を維持し、それらを反復的に洗練する。
PolicyBankは、人間の神託に対するギャップの最大82%を閉じている。
論文 参考訳(メタデータ) (2026-04-16T20:29:30Z) - Policy-as-Prompt: Turning AI Governance Rules into Guardrails for AI Agents [0.19336815376402716]
我々は、構造化されていない設計成果物(RD、TDD、コードなど)を検証可能なランタイムガードレールに変換する規制機械学習フレームワークを導入します。
Promptメソッドとしての私たちのポリシーは、これらのドキュメントを読み、ソースリンクされたポリシーツリーを構築するためのリスクコントロールです。
システムは最小限の特権とデータ最小化を強制するために構築される。
論文 参考訳(メタデータ) (2025-09-28T17:36:52Z) - Statutory Construction and Interpretation for Artificial Intelligence [19.65776192762091]
同一規則の異なる解釈が不整合あるいは不安定なモデル行動を引き起こすことを示す。
本稿では2つの法的メカニズムを反映した計算フレームワークを提案する。
私たちのアプローチは、解釈的曖昧さを体系的に管理するための第一歩を提供します。
論文 参考訳(メタデータ) (2025-09-01T07:10:22Z) - Limits of Safe AI Deployment: Differentiating Oversight and Control [0.0]
「Human oversight」は、監視や制御といった重要な概念の曖昧さや矛盾した解釈を成すリスクである。
本稿では,AI以外の文献の監視を対象とする批判的レビューを行う。
コントロールは失敗を防ぐことを目的としており、監視は将来の予防のための検出、修復、インセンティブに焦点を当てている。
論文 参考訳(メタデータ) (2025-07-04T12:22:35Z) - Media and responsible AI governance: a game-theoretic and LLM analysis [61.132523071109354]
本稿では,信頼できるAIシステムを育成する上での,AI開発者,規制当局,ユーザ,メディア間の相互作用について検討する。
進化的ゲーム理論と大言語モデル(LLM)を用いて、異なる規制体制下でこれらのアクター間の戦略的相互作用をモデル化する。
論文 参考訳(メタデータ) (2025-03-12T21:39:38Z) - Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文 参考訳(メタデータ) (2024-10-10T17:38:38Z) - AutoGuide: Automated Generation and Selection of Context-Aware Guidelines for Large Language Model Agents [74.17623527375241]
オフライン体験からコンテキスト認識ガイドラインを自動的に生成する,AutoGuideという新しいフレームワークを導入する。
その結果,本ガイドラインはエージェントの現在の意思決定プロセスに関連性のある知識の提供を促進する。
評価の結果, AutoGuide は複雑なベンチマーク領域において, 競争ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-03-13T22:06:03Z) - DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation [57.07295906718989]
制約付き復号法は,事前訓練された大言語(Ms と PLMs)が生成するテキストの意味やスタイルを,推論時に様々なタスクに対して制御することを目的としている。
これらの方法は、しばしば、欲求的かつ明示的にターゲットを選択することによって、もっともらしい連続を導く。
認知二重プロセス理論に着想を得て,新しい復号化フレームワークDECDERを提案する。
論文 参考訳(メタデータ) (2024-03-04T11:49:08Z) - Social, Legal, Ethical, Empathetic, and Cultural Rules: Compilation and Reasoning (Extended Version) [8.425874385897831]
SLEEC(社会的、法的、倫理的、共感的、文化的)ルールは、AIベースの自律システムが従うべき規則の定式化、検証、実施を促進することを目的としている。
AIシステムで効果的な使用を可能にするためには、これらのルールを自動推論をサポートする形式言語に体系的に翻訳する必要がある。
本研究ではまず,SLEEC規則の古典論理への翻訳を正当化するSLEEC規則パターンの言語学的解析を行う。
論文 参考訳(メタデータ) (2023-12-15T11:23:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。