論文の概要: Mitigating Anchoring Bias in LLM-Based Agents for Energy-Efficient 6G Autonomous Networks
- arxiv url: http://arxiv.org/abs/2606.18272v2
- Date: Thu, 18 Jun 2026 09:22:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.794511
- Title: Mitigating Anchoring Bias in LLM-Based Agents for Energy-Efficient 6G Autonomous Networks
- Title(参考訳): エネルギー効率の良い6G自律ネットワークのためのLCMエージェントにおけるアンカリングバイアスの緩和
- Authors: Hatim Chergui, Claudia Carballo González, Farhad Rezazadeh, Merouane Debbah,
- Abstract要約: 本稿では,Large Language Model (LLM) エージェントを用いた6Gアーキテクチャにおけるゼロタッチネットワークスライシングを実現するための,自律型エージェントリソースネゴシエーションフレームワークを提案する。
このようなエージェントは本質的にバイアスのアンカーに悩まされ、初期提案に固執し、ネットワークオーバープロビジョンを引き起こしていることを示す。
当社の認知的脱バイアスは、厳格な交渉パターンを分解し、エージェントにSLA境界を安全に乗り越え、システムの省エネを最大25%向上させるアクティブな探索を強制します。
- 参考スコア(独自算出の注目度): 3.2715455153948256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an autonomous agentic resource negotiation framework designed to enable zero-touch network slicing in 6G architectures using Large Language Model (LLM) agents. While LLMs offer powerful reasoning capabilities, we demonstrate that such agents inherently suffer from anchoring bias, rigidly adhering to initial heuristic proposals and causing severe network over-provisioning. To systematically mitigate this cognitive bias, we propose a novel randomized anchoring strategy modeled via a Truncated 3-Parameter Weibull distribution. This mathematically bounded approach seamlessly integrates with burst-aware Digital Twins (DTs) employing Conditional Value at Risk (CVaR) to rigorously guarantee strict Service Level Agreement (SLA) tail-latencies. To validate our methodology, we introduce and prove the \emph{Bimodal Constraint-Avoidance Utility Theorem}, demonstrating that while feasible negotiations follow classical convex bounds, highly constrained scenarios undergo a phase transition governed by an inverse rational decay envelope. Empirical results generated using a locally hosted 1B-parameter model otel-llm-1b-it confirm these dual-regime bounds. Our cognitive de-biasing successfully dismantles rigid negotiation patterns, forcing agents into active exploration to safely ride SLA boundaries and boost system energy savings up to 25\%. Crucially, the lightweight 1B LLM achieves sub-second inference latencies (0.95s mean), ensuring our multi-agent framework is compatible with the operational timescales of the O-RAN non-Real-Time RAN Intelligent Controller (non-RT RIC)\footnote{Our source code is available for non-commercial use at https://github.com/HatimChergui.
- Abstract(参考訳): 本稿では,Large Language Model (LLM) エージェントを用いた6Gアーキテクチャにおけるゼロタッチネットワークスライシングを実現するための,自律型エージェントリソースネゴシエーションフレームワークを提案する。
LLMは強力な推論能力を提供するが、そのようなエージェントは本質的にバイアスのアンカーに悩まされ、初期ヒューリスティックな提案に固執し、ネットワークの過剰なプロビジョニングを引き起こすことを実証する。
この認知バイアスを系統的に緩和するために, トランク化された3パラメータワイブル分布をモデルとした新しいランダム化アンカー戦略を提案する。
この数学的境界付けられたアプローチは、厳密なSLA(Service Level Agreement)のテールレイテンシを厳格に保証するためにCVaR(Conditional Value at Risk)を使用するバースト対応のDigital Twins(DT)とシームレスに統合されます。
提案手法を検証するため,従来の凸境界に従えば,逆有理崩壊エンベロープが支配する相転移の条件下での交渉が可能であることを示す。
局所的にホストされた1Bパラメータモデルotel-llm-1b-itを用いて生成された実験結果により、これらの双対レジム境界が確認された。
当社の認知的脱バイアスは、厳格な交渉パターンを分解し、エージェントにSLA境界を安全に乗り越え、システムの省エネを最大25%向上させるアクティブな探索を強制します。
重要なことに、軽量な1B LLMはサブ秒の推論レイテンシ(0.95sの平均)を実現し、O-RANノンリアルタイムRANインテリジェントコントローラ(non-RT RIC)の運用時間スケールと互換性を確保する。
関連論文リスト
- OmniISR: A Unified Framework for Centralized and Federated Learning via Intermediate Supervision and Regularization [58.03221830946145]
我々は、純粋なCL、純粋なFL、ハイブリッドCL-FLトレーニングモードを融合する統合フレームワークであるOmniISRを提案する。
我々は,OmniISRが集中型パラダイムとフェデレーション型パラダイムの両方において,モデル性能を一貫して改善していることを示す。
論文 参考訳(メタデータ) (2026-05-19T04:13:27Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Beyond Retrieval: Modeling Confidence Decay and Deterministic Agentic Platforms in Generative Engine Optimization [15.714806612554641]
既存のRAGベースGEOの確率的欠陥を系統的に分解する。
決定論的多エージェントインテントルーティングへのパラダイムシフトを提案する。
本研究は次世代GEOの基礎理論的枠組みを確立する。
論文 参考訳(メタデータ) (2026-04-04T09:17:37Z) - Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Sleeper Cell: Injecting Latent Malice Temporal Backdoors into Tool-Using LLMs [0.0]
オープンウェイト大規模言語モデル(LLM)はエージェントAIを民主化しているが、微調整されたウェイトは頻繁に共有され、リーダーボードのパフォーマンスを超えた限られた精査で採用されている。
これにより、サードパーティモデルが強力な行動保証なしで組み込まれるリスクが生じる。
有毒なモデルでは、良質なタスクに対して最先端のパフォーマンスを維持し、採用にインセンティブを与えていることを示す。
論文 参考訳(メタデータ) (2026-03-02T22:01:08Z) - AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2026-01-14T11:32:07Z) - The Silent Scholar Problem: A Probabilistic Framework for Breaking Epistemic Asymmetry in LLM Agents [0.6117371161379209]
本稿では,エージェントに双方向知識交換のための非構造的動機を与える形式的確率的枠組みを提案する。
これらの蓄積された信念状態が、人間フィードバックからの強化学習(RLHF)と監視ファインチューニング(SFT)のための高品質データフィルタの検証可能な報酬信号としてどのように機能するかを示す。
シミュレーションの結果、この不確実性駆動型戦略が異種環境におけるランダムベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-12-24T02:02:25Z) - Toward an Unbiased Collective Memory for Efficient LLM-Based Agentic 6G Cross-Domain Management [1.9188126920097714]
本稿では,6G RAN-Edgeネットワークにおけるアクティブなクロスドメインリソースオーケストレーションのための新しいフレームワークを提案する。
このシステムは、繰り返し交渉を行う専門的なRAN(エネルギー効率)とエッジ(レイテンシ保証)エージェントから構成される。
エージェントはデジタルツインと対話して提案をテストし、長期的な集合記憶を活用する。
論文 参考訳(メタデータ) (2025-09-30T12:57:11Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。