論文の概要: Model Routing as a Trust Problem: Route Receipts for Adaptive AI Systems
- arxiv url: http://arxiv.org/abs/2605.01710v1
- Date: Sun, 03 May 2026 04:49:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.897302
- Title: Model Routing as a Trust Problem: Route Receipts for Adaptive AI Systems
- Title(参考訳): 信頼問題としてのモデルルーティング:適応型AIシステムのための経路レシーブ
- Authors: Vincent Schmalbach,
- Abstract要約: ルーティングは、AIサービスが安価で、高速で、大規模に利用可能であることを支援する。
ルーティングがコストや品質,あるいは説明責任を変更すると,ユーザが何が起きたのかを判断できずに,信頼が損なわれる可能性がある。
本稿では、ルート受信の概念、最小限のスキーマとリアクションモデル、および選択したプラットフォームに関するドキュメントベースの調査を紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI products often route requests through version aliases, service tiers, tool choices, regional endpoints, fallback rules, or safety handling before responding. These routing steps are documented product surfaces in several widely used AI platforms and serving stacks. Routing helps AI services stay affordable, fast, and available at scale, and it shapes trust. Trust can break when routing changes the cost, quality, or accountability of a response without the user being able to tell what happened. "Which model answered?" is only part of the audit question. The runtime path matters. Adaptive AI systems should produce a runtime transparency artifact called the route receipt. A route receipt is a compact record of the route that served a request. It should capture enough material facts for people relying on the output to reconstruct important routing decisions without exposing proprietary internals or hidden reasoning. Route transparency should be part of model documentation. Model cards describe trained model artifacts, while route receipts describe the runtime conditions under which a particular answer was produced. The paper introduces the route-receipt concept, a minimal schema and redaction model, and a documentation-based survey of selected platforms showing that receipt fragments already exist without a portable per-answer record.
- Abstract(参考訳): AI製品は、バージョンエイリアス、サービス層、ツールの選択、地域エンドポイント、フォールバックルール、応答前の安全処理を通じて要求をルーティングすることが多い。
これらのルーティングステップは、広く使用されているAIプラットフォームとサービススタックで製品表面をドキュメント化します。
ルーティングは、AIサービスが安価で、高速で、大規模に利用可能であり、信頼を形作るのに役立つ。
ルーティングがコストや品質,あるいは説明責任を変更すると,ユーザが何が起きたのかを判断できずに,信頼が損なわれる可能性がある。
「Which model answered」は監査問題の一部に過ぎません。
実行時パスは重要です。
適応型AIシステムは、ルートレシートと呼ばれるランタイム透過的なアーティファクトを生成する必要がある。
ルートレシート(ルートレシート)は、要求に応えたルートのコンパクトな記録である。
プロプライエタリな内部や隠された推論を公開せずに、重要なルーティング決定を再構築するための出力に依存する人々にとって、十分な物質的事実をキャプチャするべきです。
ルートの透明性は、モデルドキュメンテーションの一部でなければならない。
モデルカードは訓練されたモデルアーティファクトを記述し、ルートレシートは特定の回答が生成されるランタイム条件を記述する。
本稿では,ルートレセプトの概念,最小限のスキーマとリアクションモデル,およびレシートフラグメントが可搬性のあるユーザ毎のレコードなしですでに存在することを示す,選択されたプラットフォームに関するドキュメントベースの調査を紹介する。
関連論文リスト
- RealRoute: Dynamic Query Routing System via Retrieve-then-Verify Paradigm [19.239852494559212]
予測ルーティングからロバストなRetrieve-then-VerifyメカニズムへパラダイムをシフトするフレームワークであるRealRouteを紹介する。
実験により、RealRouteはマルチホップRag推論タスクにおいて予測ベースラインを大幅に上回ることがわかった。
論文 参考訳(メタデータ) (2026-03-02T17:57:46Z) - When Routing Collapses: On the Degenerate Convergence of LLM Routers [46.01380774114097]
ユーザのコスト予算が増加するにつれて、ルータは体系的に最も有能で最も高価なモデルにデフォルトとなる。
モデルランキングを直接学習する決定対応ルータであるEquiを提案する。
RouterBenchでは、最強の先行ルータと比較して、GPT-4レベルのパフォーマンスでコストを約17%削減する。
論文 参考訳(メタデータ) (2026-02-03T12:51:55Z) - Routing with Generated Data: Annotation-Free LLM Skill Estimation and Expert Selection [70.73201284835498]
RGDは、ルータが生成されたクエリと回答のみに基づいてトレーニングされる、困難な設定である。
クエリ・アンサー・ルータ(クエリとラベルの両方を用いて)とクエリのみのルータを4つのベンチマークと12のモデルで評価する。
コンセンサス投票によってモデルの正しさを推定し,階層クラスタリングによるモデル固有のスキルニッチを識別する新しいクエリ専用ルータであるCASCALを提案する。
論文 参考訳(メタデータ) (2026-01-14T18:43:32Z) - ICL-Router: In-Context Learned Model Representations for LLM Routing [30.759446235510467]
本稿では,モデル機能を表現するために,コンテキスト内ベクトルを用いた新しいルーティング手法を提案する。
本手法は,分散処理とアウト・オブ・ディストリビューション処理の両方において,最先端のルーティング性能を実現する。
論文 参考訳(メタデータ) (2025-10-10T06:47:37Z) - Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs [69.2486294522259]
BaRPはBandit Routing-feedback with Preferencesアプローチであり、デプロイと同じ部分フィードバック制限の下でトレーニングされる。
提案手法は,学習中のオンラインフィードバック設定をシミュレートし,新たなプロンプトに適応する。
論文 参考訳(メタデータ) (2025-10-08T18:24:59Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - Explore before Moving: A Feasible Path Estimation and Memory Recalling
Framework for Embodied Navigation [117.26891277593205]
ナビゲーションに焦点をあて,経験や常識に欠ける既存のナビゲーションアルゴリズムの問題を解決する。
移動前に2回思考する能力に触発されて、不慣れな場面で目標を追求する実現可能な経路を考案し、パス推定とメモリリコールフレームワークと呼ばれる経路計画手法を提案する。
EmbodiedQAナビゲーションタスクにおけるPEMRの強力な実験結果を示す。
論文 参考訳(メタデータ) (2021-10-16T13:30:55Z) - Learn-n-Route: Learning implicit preferences for vehicle routing [9.434400627011108]
ルート計画(またはルーティング)を手動で作成する際に、人間のプランナーが有する暗黙の好みをルーティングエンジンが学習する車両ルーティングの学習意思決定支援システムについて検討する。
目標は、車両ルーティングシステムの距離ベースの客観的基準の上にこれらの主観的な好みを使用することです。
論文 参考訳(メタデータ) (2021-01-11T14:57:46Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。