論文の概要: Policy-Governed LLM Routing with Intent Matching for Instrument Laboratories
- arxiv url: http://arxiv.org/abs/2604.26955v1
- Date: Fri, 03 Apr 2026 15:36:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.241955
- Title: Policy-Governed LLM Routing with Intent Matching for Instrument Laboratories
- Title(参考訳): インテリジェンスマッチングを用いた政策統治型LCMルーティング
- Authors: Emmanuel A. Olowe, Danial Chitnis,
- Abstract要約: RoutiiumはOpenAI互換のゲートウェイで、複数のLLMバックエンドを管理する。
Eduは、ラベルごとの予算、承認、埋め込みベースの質問マッチングを強制するポリシー対応のルーティングサービスである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI tutoring systems in engineering labs face a tension between providing sufficient assistance and preserving learning opportunities. Existing systems typically offer instructors limited control over assistance timing, content, or cost. This paper describes a routing and governance system for LLM-based lab assistance comprising two components: Routiium, an OpenAI-compatible gateway that manages multiple LLM backends with configurable prompt modifications and usage logging, and EduRouter, a policy-aware routing service that enforces per-lab budgets, approval workflows, and embedding-based question matching. We evaluated the system using trace-driven simulation calibrated from two engineering labs (LED characterization, RC circuit analysis) and a 100-query replay through live models. In simulations, governed policies (P1/P2) increased challenge-alignment index from 0.90 to 0.98 and overlay-adherence score from 0.69 to 0.87 compared to ungoverned operation (P0). The productive-struggle window metric increased from 1.4 to 3.6 simulated turns before high-scaffold hints appeared. In the 100-query replay, EduRouter routed 75% of queries to a local model, reducing token costs by 66% ($0.087 vs. $0.26 for all-premium routing) while maintaining canonical hit rate of 1.0 for the curated 89-intent question bank. We release Routiium, EduRouter, canonical-task tooling, and simulator configurations to support replication and future classroom studies.
- Abstract(参考訳): 工学研究所のAI教育システムは、十分な支援と学習機会の確保の緊張に直面している。
既存のシステムは典型的には、援助のタイミング、内容、コストを限定的に制御するインストラクターを提供する。
本稿では,複数 LLM バックエンドを管理する OpenAI 対応ゲートウェイである Routiium と,ラベル単位の予算や承認ワークフロー,組込みベースの質問マッチングを実施可能なポリシ対応ルーティングサービスである EduRouter の2つのコンポーネントからなる LLM ベースのラボ支援のためのルーティングとガバナンスシステムについて述べる。
2つのエンジニアリングラボ(LEDキャラクタリゼーション,RC回路解析)と100クエリのライブモデルによるリプレイ)から校正したトレース駆動シミュレーションを用いてシステム評価を行った。
シミュレーションでは、制御されたポリシー(P1/P2)は、未処理(P0)と比較して、チャレンジアライメント指数が0.90から0.98に増加し、オーバーレイアジェンススコアが0.69から0.87に増加した。
プロダクティブ・ストラグル・ウインドウ・メトリックは、ハイスキャフォールド・ヒントが現れる前に、1.4から3.6のシミュレート・ターンに増加した。
100回のリプレイでは、EduRouterは75%のクエリをローカルモデルにルーティングし、トークンコストを66%削減した(全プリミウムルーティングでは0.087対0.26)。
Routiium、EduRouter、標準タスクツール、レプリケーションと将来の教室研究をサポートするシミュレータ構成をリリースする。
関連論文リスト
- LLM Readiness Harness: Evaluation, Observability, and CI Gates for LLM/RAG Applications [51.56484100374058]
評価をデプロイメント決定ワークフローに変換するLLMおよびRAGアプリケーションのための準備性ハーネスを提案する。
このシステムは、最小限のAPI契約の下で、自動ベンチマーク、OpenTelemetryオブザーバビリティ、CI品質ゲートを組み合わせる。
チケットルーティングとBEIRタスクのハーネスを、完全なAzureマトリックスカバレッジで評価する。
論文 参考訳(メタデータ) (2026-03-28T18:03:32Z) - SimulCost: A Cost-Aware Benchmark and Toolkit for Automating Physics Simulations with LLMs [56.07550353240028]
物理シミュレーションにおけるコスト依存パラメータチューニングをターゲットとした最初のベンチマークであるSimulCostを紹介する。
SimulCostは、LCMチューニングのコスト感受性パラメータと従来のスキャン手法の精度と計算コストを比較した。
各シミュレータのコストは解析的に定義され、プラットフォームに依存しない。
論文 参考訳(メタデータ) (2026-03-11T05:00:48Z) - Graph-Based Self-Healing Tool Routing for Cost-Efficient LLM Agents [0.0]
自己修復ルータはフォールトトレラントなオーケストレーションアーキテクチャである。
ほとんどのエージェント制御フロー決定を、推論よりもルーティングとして扱う。
すべての障害はログ化されたリルートか明示的なエスカレーションのどちらかで、無音スキップはしない。
論文 参考訳(メタデータ) (2026-03-02T07:21:15Z) - Replacing Multi-Step Assembly of Data Preparation Pipelines with One-Step LLM Pipeline Generation for Table QA [16.758340727602793]
TQA(Table Question Answering)は、構造化テーブル上の自然言語質問に答えることを目的としている。
大規模言語モデル(LLM)は、最先端のパフォーマンスを提供するマルチステップ方式でテーブル操作パイプラインを生成する演算子中心のソリューションによって、この問題に対する有望な解決策を可能にする。
我々は,TQAのための高品質なデータ準備パイプラインを単一推論ステップで作成するために,新しい改良型強化学習を通じて軽量LLMを訓練する最初のフレームワークであるOperation-R1を提案する。
論文 参考訳(メタデータ) (2026-02-26T07:49:50Z) - SAIR: Cost-Efficient Multi-Stage ML Pipeline Autoscaling via In-Context Reinforcement Learning [13.174004826305255]
マルチステージML推論パイプラインは、異種リソース、クロスステージ結合、動的ボトルネックマイグレーションによる自動スケールが難しい。
本稿では,LLMをテキスト内強化学習コントローラとして使用する自動スケーリングフレームワークであるSAIRを提案する。
SAIRはデプロイベースライン間で最高のあるいは結びついたP99レイテンシと効果的なリソースコストを実現し、P99を最大50%改善し、有効コストを最大97%削減する。
論文 参考訳(メタデータ) (2026-01-29T23:08:15Z) - Dr.LLM: Dynamic Layer Routing in LLMs [55.11953638340419]
Dr.LLMは、事前訓練されたモデルに軽量な層ごとのルータを装備し、ブロックをスキップ、実行、繰り返すように決定する、適合性のあるフレームワークである。
ARC(logic)とDART(math)では、Dr.LLMは平均で5つのレイヤを保存しながら、最大3.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-10-14T17:51:26Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - AMLNet: A Knowledge-Based Multi-Agent Framework to Generate and Detect Realistic Money Laundering Transactions [3.1459290341742676]
AMLNetは知識ベースのマルチエージェントフレームワークで、2つの調整されたユニット、規制対応トランザクションジェネレータとアンサンブル検出パイプラインを備えている。
このジェネレータはコア洗浄フェーズと高度なタイポロジーにまたがる1,090,173の合成トランザクションを生成する。
検出アンサンブルF1 0.90は、外部のSynthAMLデータセットに適応し、アーキテクチャ上の一般化性を示している。
論文 参考訳(メタデータ) (2025-09-15T05:25:46Z) - Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning [27.70756702796812]
マルチLLMルーティングとアグリゲーションを逐次決定プロセスとして定式化する強化学習フレームワークである textbf Generalization-R1 を提案する。
学習を容易にするために,形式報酬と最終結果報酬と,性能とコストのバランスを最適化するための新たなコスト報酬からなる軽量なルールベース報酬を用いる。
論文 参考訳(メタデータ) (2025-06-10T17:56:45Z) - Learning to Route Queries Across Knowledge Bases for Step-wise Retrieval-Augmented Reasoning [60.84901522792042]
Multimodal Retrieval-Augmented Generation (MRAG)は、マルチモーダル大言語モデル(MLLM)における幻覚の緩和を約束している。
進化する推論状態に基づいて知識をいつどこで取得するかを学習する新しいMRAGフレームワークであるR1を提案する。
R1-は多種多様なKBを適応的かつ効果的に利用でき、不要な検索を減らし、効率と精度を向上させる。
論文 参考訳(メタデータ) (2025-05-28T08:17:57Z) - Universal Model Routing for Efficient LLM Inference [69.86195589350264]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文 参考訳(メタデータ) (2025-02-12T20:30:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。