論文の概要: LogRouter: Adaptive Two-Level LLM Routing for Log Question Answering in Big Data Systems
- arxiv url: http://arxiv.org/abs/2605.18015v1
- Date: Mon, 18 May 2026 08:07:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.103843
- Title: LogRouter: Adaptive Two-Level LLM Routing for Log Question Answering in Big Data Systems
- Title(参考訳): LogRouter: ビッグデータシステムにおけるログ質問応答のための適応型2レベルLLMルーティング
- Authors: Mert Coskuner, Merve Zeybel, Melik Mert Dolan,
- Abstract要約: 本稿では,TUBITAK BILGEMの全国的ビッグデータプラットフォーム上に展開するエンドツーエンドの質問応答システムを提案する。
2レベルコスト対応ルータは、4つの実行パスのうちの1つに沿って各クエリをディスパッチする。
このシステムは、Fixed-32Bベースラインに対して平均レイテンシを55%削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Production log analytics in self-hosted, resource-constrained environments requires natural-language access to massive log streams without the cost of routing every query through a large language model. We present LogRouter, an end-to-end log question-answering system deployed on TUBITAK BILGEM's national big data platform that combines a PySpark-based Drain3 ingestion pipeline, GPU-accelerated embeddings, and dual-index storage in Apache Druid and PostgreSQL with pgvector. A two-level cost-aware router dispatches each query along one of four execution paths: direct response, Druid keyword search, template lookup with SQL generation, and pgvector semantic retrieval, while a Level-2 router selects either a 14B-class or 32B-class generator for the semantic path. A dedicated coder LLM handles text-to-SQL generation. We evaluate the system on four LogHub datasets (Linux, Apache, Windows, and Mac; 70 questions in total) under both an online full-pipeline configuration and an offline configuration that isolates the generator. The router reaches 88.4% mean accuracy across datasets and 94.7% on Linux, while the full pipeline attains a mean ROUGE-1 of 0.373, BERTScore of 0.879, RAGAS Faithfulness of 0.779, and an end-to-end latency of 18.6 s. In an apples-to-apples offline comparison, the routed system reduces mean latency by 55% versus a Fixed-32B baseline (46.3 s vs. 102.1 s) while preserving Answer Correctness within 5.8 points and exceeding a Fixed-14B baseline on RAGAS Faithfulness across every dataset. Cost-aware dispatching is therefore a practical mechanism for production log QA: routing recovers most of the quality of an always-32B configuration at less than half the latency, and the L1 keyword vocabulary makes that routing decision with high precision without a learned classifier.
- Abstract(参考訳): 自己ホスト型のリソース制約のある環境でのプロダクションログ分析では、大きな言語モデルを通じてすべてのクエリをルーティングするコストなしで、巨大なログストリームに自然言語でアクセスする必要がある。
我々は、TUBITAK BILGEMの全国的ビッグデータプラットフォーム上にデプロイされたエンドツーエンドのログ問合せシステムであるLogRouterを紹介します。
2レベルコスト対応ルータは、ダイレクトレスポンス、Druidキーワード検索、SQL生成によるテンプレート検索、pgvectorセマンティック検索の4つの実行パスのいずれかに沿ってクエリをディスパッチし、レベル2ルータはセマンティックパスのために14Bクラスまたは32Bクラスのジェネレータを選択する。
専用コーダLLMは、テキストからSQL生成を処理する。
オンラインのフルパイプ構成と、ジェネレータを分離するオフライン構成の両方で、4つのLogHubデータセット(Linux、Apache、Windows、Mac、合計70の質問)でシステムを評価する。
ルータはデータセットの平均精度88.4%、Linuxでは94.7%に達し、完全なパイプラインは平均ROUGE-1の0.373、BERTScoreの0.879、RAGAS Faithfulnessの0.779、エンドツーエンドのレイテンシは18.6秒に達した。
apples-to-applesのオフライン比較では、ルーティングシステムは平均レイテンシを55%削減し、固定32Bベースライン(46.3 s vs. 102.1 s)に対して、アンサーの正確性を5.8ポイント以内で保持し、RAGAS Fithfulnessの固定14Bベースラインを超える。
ルーティングは、常に32B構成の質の大部分をレイテンシの半分未満で回復し、L1キーワード語彙は、学習した分類子なしで高い精度でルーティング決定する。
関連論文リスト
- Equifinality in Mixture of Experts: Routing Topology Does Not Determine Language Modeling Quality [0.0]
学習したセントロイドに対するコサイン類似性ルーティングを用いたスパース・ミックス・オブ・エクササイズ(MoE)アーキテクチャを構築した。
ルーティングトポロジがパープレキシティ(PPL)を決定できないことが分かりました。
トポロジレベルの等質性と共存するエキスパートレベルと因果制御性について、共用論文で検討する。
論文 参考訳(メタデータ) (2026-04-15T21:02:02Z) - OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis [63.8655724265611]
深層研究エージェントの訓練には、探索、証拠収集、多段階推論をインターリーブする長い水平軌道が必要である。
既存のデータ収集パイプラインは、一般的にプロプライエタリなWeb APIに依存しており、大規模な軌道合成をコストが高く、不安定で、再現が難しい。
再生可能なパイプラインであるOpenResearcherは,複数ターン軌道合成から1回のコーパスブートストラップを分離する。
論文 参考訳(メタデータ) (2026-03-17T20:10:12Z) - Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.44875022114861]
ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:00:22Z) - Relatron: Automating Relational Machine Learning over Relational Databases [50.94254514286021]
本稿では, RDL と DFS を共有設計空間に統合し, 多様な RDB タスクを対象としたアーキテクチャ中心の検索を行う。
RDLはDFSを一貫して上回り、高いタスク依存性を持つ。(2)タスク全体において単一のアーキテクチャが支配的であり、タスク認識モデル選択の必要性を強調し、精度は選択アーキテクチャの信頼性の低いガイドである。
論文 参考訳(メタデータ) (2026-02-26T02:45:22Z) - Routing with Generated Data: Annotation-Free LLM Skill Estimation and Expert Selection [70.73201284835498]
RGDは、ルータが生成されたクエリと回答のみに基づいてトレーニングされる、困難な設定である。
クエリ・アンサー・ルータ(クエリとラベルの両方を用いて)とクエリのみのルータを4つのベンチマークと12のモデルで評価する。
コンセンサス投票によってモデルの正しさを推定し,階層クラスタリングによるモデル固有のスキルニッチを識別する新しいクエリ専用ルータであるCASCALを提案する。
論文 参考訳(メタデータ) (2026-01-14T18:43:32Z) - FuseSampleAgg: Fused Neighbor Sampling and Aggregation for Mini-batch GNNs [51.56484100374058]
FuseSampleAggは、隣人の平均アグリゲーションをGraphSAGEの1つのパスにフューズし、サンプリングする。
Operatorは決定論的であり、標準のPyTorchと統合され、CSVログからすべてのテーブルとフィギュアを再現するスクリプトが同梱されている。
論文 参考訳(メタデータ) (2025-11-17T17:57:18Z) - BAPPA: Benchmarking Agents, Plans, and Pipelines for Automated Text-to-SQL Generation [3.2476501707160543]
既存の大規模言語モデル(LLM)は、大きなスキーマサイズと複雑な推論のために、自然な命令からsqlを生成するのに苦労する。
本研究では,3つのマルチエージェントLPMパイプラインを探索し,小規模から大規模のオープンソースモデルにまたがる系統的なパフォーマンスベンチマークを行う。
Bird-Bench Mini-Dev セットの実験では、マルチエージェントの議論は小さなモデルの性能を向上させることができ、Qwen2.5-7b-Instruct の実行精度は最大10.6%向上した。
論文 参考訳(メタデータ) (2025-11-06T08:00:15Z) - Guarded Query Routing for Large Language Models [2.2349474636722317]
ガードドクエリルーティング問題について検討し、最初にガードドクエリルーティングベンチマーク(GQR-Bench)を導入する。
その結果,ドメイン外検出能力が向上したWideMLPでは,精度(88%)と速度(4ms)のトレードオフが最良であることがわかった。
本研究は,LLMを(保護された)クエリルーティングに自動的に依存させることに挑戦し,実用的なアプリケーションに具体的なレコメンデーションを提供する。
論文 参考訳(メタデータ) (2025-05-20T15:46:59Z) - RSL-SQL: Robust Schema Linking in Text-to-SQL Generation [51.00761167842468]
本稿では、双方向スキーマリンク、コンテキスト情報拡張、バイナリ選択戦略、マルチターン自己補正を組み合わせたRSLと呼ばれる新しいフレームワークを提案する。
ベンチマークの結果,オープンソースのソリューション間でのSOTA実行精度は67.2%,BIRDは87.9%,GPT-4オクルージョンは87.9%であった。
提案手法は,DeepSeekを同一のプロンプトで適用した場合,GPT-4ベースのテキスト・ツー・シークシステムよりも優れている。
論文 参考訳(メタデータ) (2024-10-31T16:22:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。