論文の概要: Toward Agentic Governance: What Shapes LLM-Agent Intervention in Public Forums?
- arxiv url: http://arxiv.org/abs/2606.00603v2
- Date: Fri, 05 Jun 2026 04:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.279279
- Title: Toward Agentic Governance: What Shapes LLM-Agent Intervention in Public Forums?
- Title(参考訳): エージェントガバナンスに向けて:公共フォーラムにおける LLM-Agent の介入はどのようなものか?
- Authors: Luyang Zhang, Yi-Yun Chu, Ramayya Krishnan,
- Abstract要約: 4つのデプロイメント選択は、それぞれエージェントのレスポンスレートをシフトする。
4つの選択肢は、(1)現在どのモデルバージョンが提供されているか、(2)モデルのウェイトリリースステータス、(3)どのプロバイダがリクエストをサービスしているか、(4)システムプロンプトポリシーが実行されているかである。
オープンウェイトとクローズドウェイトの両方で、これまで報告された傾向は、アクセス面よりもパネルのオープン/クローズドウェイト境界と一致している。
- 参考スコア(独自算出の注目度): 1.1907026010541675
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents are increasingly used in moderation-relevant public forum workflows, where their choices to answer, acknowledge, repair, or decline are routinely challenged by users, platforms, and regulators. The same agent often returns different responses on identical content, so any defense based on the agent's behavior cannot be reliably reproduced. The variation is structural. Four deployment choices typically invisible to the operator each shift the agent's response rate, and their combinations can produce substantially different interventions on the same forum posts. The four choices are (1) which model version is currently served, which can change between calls without notice; (2) the model's weight-release status (open-weight, with weights publicly downloadable, vs. closed-weight, with weights held by the provider); (3) which provider serves the request; and (4) which system-prompt policy is in force. Across LLMs spanning both open-weight and closed-weight families, we find that the previously reported tendency to decline more on visible than hidden challenges aligns with the open/closed weight boundary in our panel more than with access surface. Every closed-weight cell declines more on visible challenges; every open-weight cell reverses this or shows no gap. Auditable forum-agent governance requires awareness of all four choices, not just the model name, since each independently shifts behavior.
- Abstract(参考訳): LLMエージェントは、ユーザー、プラットフォーム、規制当局によって、回答、確認、修復、または減少の選択が日常的に挑戦される、モデレーションに関連のあるパブリックフォーラムワークフローで、ますます使われている。
同じエージェントは、しばしば同一内容に対して異なる応答を返すため、エージェントの振る舞いに基づく防御は確実に再現できない。
バリエーションは構造的です。
通常、オペレータに見えない4つのデプロイメント選択は、各エージェントのレスポンス率をシフトさせ、それらの組み合わせは、同じフォーラムポストに対して、かなり異なる介入を発生させる。
4つの選択肢は、(1)現在どのモデルバージョンが提供されており、それは、通知なしで呼び出しを切り替えることが可能であり、(2)モデルのウェイトリリースステータス(オープンウェイト、パブリックダウンロード可能、対クローズドウェイト、提供者によって保持されるウェイト)、(3)どのプロバイダが要求に対処するか、(4)システムプロンプトポリシーが実行されているかである。
オープンウェイトとクローズドウェイトの両方にまたがるLSMでは,これまで報告された傾向が,アクセス面よりもオープン/クローズドウェイト境界に一致することが判明した。
すべてのクローズドウェイト細胞は、目に見える課題により減少し、全てのオープンウェイト細胞は、これを反転させるか、ギャップを示さない。
監査可能なフォーラムエージェントガバナンスでは、モデル名だけでなく、4つの選択肢すべてを認識する必要があります。
関連論文リスト
- Easier to Mislead Than to Correct: Harmful and Beneficial Revision in LLM Conformity [1.4889674786265437]
ピア合意は、当初間違ったモデルを修正するよりも、最初に正しいモデルを誤解させるのがずっと簡単であることを示す。
これらの結果から,マルチエージェントLLMシステムは単に集約するのではなく,ピア回答を検証すべきであることが示唆された。
論文 参考訳(メタデータ) (2026-06-01T03:42:00Z) - 12 Angry AI Agents: Evaluating Multi-Agent LLM Decision-Making Through Cinematic Jury Deliberation [0.0]
RLHFスペクトルの両端を表す2つのモデルが試験された。
18人中17人が絞首刑の陪審で終わる。
映画の中心的な出来事である、徐々に少数派から多数派への説得は、ほとんど起こらない。
論文 参考訳(メタデータ) (2026-05-03T17:41:49Z) - Revisable by Design: A Theory of Streaming LLM Agent Execution [10.580232912847212]
本稿では,エージェントの実行とユーザの介入を同時に行うストリームパラダイムを提案する。
我々は、矛盾する補償可能な行為が避けられない適応コストを課し、矛盾する不可逆的な行為が完全な仕様満足度を不可能にすることを示す。
軽度仮定の下で構造的に最適であるEariest-Conflict Rollback則に基づくリアクティブアルゴリズムであるRevision Absorberを提案する。
論文 参考訳(メタデータ) (2026-04-25T12:55:15Z) - Are Smaller Open-Weight LLMs Closing the Gap to Proprietary Models for Biomedical Question Answering? [0.5692553719616764]
大規模言語モデル(LLM)のオープンウェイトバージョンは急速に進歩しており、DeepSeek-V3のような最先端モデルはプロプライエタリなLLMと互換性がある。
この進歩は、小規模なオープンウェイト LLM がより大きなクローズドソースモデルを効果的に置き換えられるかどうかという問題を提起する。
本研究では, GPT-4o, GPT-4.1, Claude 3.5 Sonnet, Claude 3.7 Sonnet など,いくつかのオープンウェイトモデルを比較した。
論文 参考訳(メタデータ) (2025-09-23T09:27:57Z) - Agent-Based Detection and Resolution of Incompleteness and Ambiguity in Interactions with Large Language Models [0.9856777842758593]
本稿では, LLMに基づく質問応答システムにエージェント・ベース・アーキテクチャを付加的な推論能力で活用することを検討した。
我々は、不完全性と曖昧性の欠陥を検知し解決する専門家として働くエージェントを、異なるLLMに装備する。
エージェントベースのアプローチを提案することは、LLMのパワーを利用してより堅牢なQAシステムを開発するための有用なメカニズムである。
論文 参考訳(メタデータ) (2025-07-04T17:28:33Z) - LLMs Can Generate a Better Answer by Aggregating Their Own Responses [83.69632759174405]
大きな言語モデル(LLM)はタスク間で顕著な機能を示しているが、複雑な問題に直面している場合、追加のプロンプト技術を必要とすることが多い。
この制限は、共通LLMポストトレーニング手順が差別的判断タスクの明示的な監督を欠いているという事実に起因している、と我々は主張する。
本稿では,モデルの識別機能を必要とせず,解答品質を向上させる手法である生成自己集合(GSA)を提案する。
論文 参考訳(メタデータ) (2025-03-06T05:25:43Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - On Imperfect Recall in Multi-Agent Influence Diagrams [57.21088266396761]
マルチエージェント・インフルエンス・ダイアグラム(MAID)はベイズネットワークに基づくゲーム理論モデルとして人気がある。
混合ポリシと2種類の相関平衡を用いて, 忘れ易いエージェントと不注意なエージェントでMAIDを解く方法を示す。
また,不完全なリコールがしばしば避けられないマルコフゲームやチーム状況へのMAIDの適用についても述べる。
論文 参考訳(メタデータ) (2023-07-11T07:08:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。