論文の概要: Authority Inversion in LLM-Mediated Ubiquitous Systems: When Models Trust Users Over Sensors
- arxiv url: http://arxiv.org/abs/2605.23938v1
- Date: Tue, 28 Apr 2026 04:59:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:42.955463
- Title: Authority Inversion in LLM-Mediated Ubiquitous Systems: When Models Trust Users Over Sensors
- Title(参考訳): LLMを利用したユビキタスシステムにおけるオーソリティインバージョン:モデルがセンサよりもユーザを信頼する場合
- Authors: Long Zhang, Zi-bo Qin, Wei-neng Chen,
- Abstract要約: センサ計測とユーザ主張の衝突が未検討のままである場合に,大規模言語モデルがどのように権威を暗黙的に割り当てるかを検討する。
数値センサデータが解答関連モデル方向への統合に失敗し、自然言語によるクレームが最終決定を支配できることがわかった。
提案するGeometric Authority (GAC) は,不適切なユーザ権限を抑えるための推論時間層レベルの介入である。
- 参考スコア(独自算出の注目度): 6.414826816896125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) increasingly fuse heterogeneous inputs in ubiquitous systems. Yet, how LLMs implicitly allocate authority when sensor measurements and user claims conflict remains unexamined, raising critical reliability concerns for deployments where physical sensing must retain priority. Unlike explicit traditional fusion, LLMs bury authority allocation within learned representations. We discover this allocation is severely format-dependent: numerical sensor data fails to integrate into answer-relevant model directions, allowing natural-language claims to dominate the final decision, a phenomenon we term \textbf{Authority Inversion}.To diagnose and mitigate this, we develop a geometric framework of context integration, introduce two computable audit metrics, specifically the Context Integration Ratio (CIR) and Authority Alignment Index (AAI), and propose Geometric Authority Calibration (GAC), an inference-time layer-level intervention to suppress misplaced user authority. Evaluating four models (4B to 35B parameters, three architectures) across four datasets totaling 576 conflict instances reveals extreme inversion: on numerical tasks, models exhibit near-zero sensor trust (AAI = -0.805, Cohen's d = -2.14), unaffected by model capacity. Validating our geometric framework, theory-guided causal injection flips 80.2\% of incorrect decisions (vs. <0.4\% for random controls). Practically, GAC improves HAR accuracy from 0 -- 1.6\% to 21.9 -- 27.5\%, outperforming prompting baselines. Ultimately, authority allocation in LLM-mediated systems must be explicitly audited and application-specifically configured rather than left implicit.
- Abstract(参考訳): 大型言語モデル(LLM)はユビキタスシステムにおいて不均一な入力を融合する。
しかし、センサー測定とユーザ主張の衝突が未検討のままである場合、LLMがオーソリティを暗黙的に割り当てる方法によって、物理的なセンシングが優先されなければならないデプロイメントに対する重要な信頼性上の懸念が高まっている。
明示的な伝統的な融合とは異なり、LLMは学習された表現に権限割り当てを埋める。
数値センサデータは、応答関連モデル方向への統合に失敗し、自然言語によるクレームが最終決定を支配する現象である「textbf{Authority Inversion}」と呼ばれる現象である。
これを診断し緩和するために,文脈統合の幾何学的枠組みを開発し,特にコンテキスト統合比(CIR)とオーソリティアライメント指数(AAI)の2つの計算可能な監査指標を導入し,不在なユーザ権限を抑えるための推論時層レベルの介入である幾何学的オーソリティ・キャリブレーション(GAC)を提案する。
4つのモデル(4Bから35Bパラメータ、3つのアーキテクチャ)を合計576のコンフリクトインスタンスで評価すると、極端な逆転が示される:数値的なタスクでは、モデルがほぼゼロに近いセンサー信頼(AAI = -0.805, Cohen's d = -2.14)を示し、モデル容量に影響を受けない。
幾何学的枠組みを検証すると、理論誘導因果注入は80.2\%の誤った決定を覆す(vs)。
<0.4\%)。
実際、GACはHARの精度を0 -- 1.6\%から21.9 -- 27.5\%に改善し、ベースラインを上回ります。
究極的には、LSMを介するシステムにおける権限割り当ては、暗黙的ではなく、明示的に監査され、アプリケーション固有の構成でなければならない。
関連論文リスト
- Discovery of Hidden Miscalibration Regimes [52.452902154360565]
モデルは何らかの入力を体系的に過信し、他人を過信することがある。
対応する誤校正分野を定義し,それを推定するための診断フレームワークを提案する。
提案手法は,入力空間のキャリブレーションを意識した表現を学習し,学習幾何学におけるカーネルの平滑化による符号付き局所的誤校正を推定する。
論文 参考訳(メタデータ) (2026-05-13T13:07:50Z) - IDEA: An Interpretable and Editable Decision-Making Framework for LLMs via Verbal-to-Numeric Calibration [19.137433878125247]
IDEAはLLM決定知識を解釈可能なパラメトリックモデルに抽出するフレームワークである。
定量的な人間とAIのコラボレーションを可能にしながら、キャリブレーションされた確率を生成する。
論文 参考訳(メタデータ) (2026-04-14T10:50:49Z) - K$α$LOS finds Consensus: A Meta-Algorithm for Evaluating Inter-Annotator Agreement in Complex Vision Tasks [4.297070083645049]
本稿では,「ローカライゼーションファースト」の原理を一般化した統一メタアルゴリズムであるK$LOSを提案する。
合意を査定する前に空間対応を解消することにより,複雑な分類問題を名目上の信頼性に変換する。
論文 参考訳(メタデータ) (2026-03-28T08:54:05Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - CoRefine: Confidence-Guided Self-Refinement for Adaptive Test-Time Compute [10.548368675645403]
CoRefineは、トークンのごく一部を使って競争精度を達成する自信誘導型自己精製法である。
コントローラはフルトレースの信頼性を消費し、停止するか、再検査するか、あるいは別のアプローチを試すかを決定する。
これをCoRefine-Treeに拡張します。これは、探索とエクスプロイトを適応的にバランスさせる、ハイブリッドなシーケンシャル並列型です。
論文 参考訳(メタデータ) (2026-02-09T17:44:41Z) - Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - Beyond Accuracy: A Geometric Stability Analysis of Large Language Models in Chess Evaluation [8.694064926527902]
本稿では,標準精度測定値が真の幾何学的推論と標準基板状態の表層記憶とを区別できないことを論じる。
我々は、不変変換の下でモデルの一貫性を厳格にテストする新しい評価手法を適用した。
我々は、幾何安定性がAI評価に不可欠な指標であり、データ汚染から推論能力を引き離すために必要なプロキシを提供すると結論付けている。
論文 参考訳(メタデータ) (2025-12-17T02:49:10Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Parrot: Persuasion and Agreement Robustness Rating of Output Truth -- A Sycophancy Robustness Benchmark for LLMs [0.0]
PARROT (Persuasion and Agreement Robustness Rating of Output Truth) は、ユーザの社会的圧力下での精度の劣化を測定するための堅牢性にフォーカスしたフレームワークである。
我々は13のドメインにまたがる1,302のMMLUスタイルの多重選択質問とドメイン固有の権威テンプレートを用いて22のモデルを評価する。
論文 参考訳(メタデータ) (2025-11-21T13:01:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。