論文の概要: Neural Router: Semantic Content Matching for Agentic AI
- arxiv url: http://arxiv.org/abs/2605.25701v1
- Date: Mon, 25 May 2026 10:58:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.750997
- Title: Neural Router: Semantic Content Matching for Agentic AI
- Title(参考訳): ニューラルルータ:エージェントAIのためのセマンティックコンテンツマッチング
- Authors: Lauri Lovén, Abhishek Kumar, Alexander Engelhardt, Alaa Saleh, Roberto Morabito, Xiaoli Liu, Naser Hossein Motlagh, Sasu Tarkoma,
- Abstract要約: 大規模言語モデル(LLM)は、エージェントAIのためのコンテンツベースのパブリッシュ/サブスクライブブローカのセマンティックマッチングエンジンとして機能する。
3つの公開データセット上でオフラインのマルチラベル検索として評価され、我々の中心的な貢献は2つのクロスオーバーコストのキャラクタリゼーションである。
- 参考スコア(独自算出の注目度): 41.39228253084888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) can serve as the semantic-matching engine of a content-based publish/subscribe broker for agentic AI across the edge-cloud computing continuum, bridging the vocabulary and modality gaps that defeat keyword and embedding filters. Framed as offline multi-label retrieval over three public datasets spanning social-media, legal, and smart-home sensor domains (six LLMs, seven baselines), our central contribution is a two-crossover cost-accuracy characterisation: an analytical context-window crossover below which a CoverAndMerge compression pipeline reduces LLM invocations, and an empirical discrimination-capacity crossover above which matching accuracy collapses independently of context budget, by a model-dependent factor of parameter count and training generation. Two findings carry practical weight: above the discrimination crossover, compression cannot recover accuracy and only frontier-scale models clear large subscription sets; and there backend choice dominates configuration choice, so model selection, not pipeline tuning, is the primary operator lever. We accompany this with three composable algorithms and a per-cluster Quality-of-Experience framework for autonomic LLM-tier selection.
- Abstract(参考訳): 大規模言語モデル(LLM)は、エッジクラウドコンピューティング連続体をまたいだエージェントAIのためのコンテンツベースのパブリッシュ/サブスクライブブローカーのセマンティックマッチングエンジンとして機能し、キーワードを破り、フィルタを埋め込むボキャブラリとモダリティのギャップを埋める。
ソーシャルメディア、法律、スマートホームセンサードメイン(LLM6つ、ベースライン7つ)にまたがる3つのパブリックデータセットに対するオフラインマルチラベル検索として、我々の中心的なコントリビューションは2つのクロスオーバーコスト特性である:以下の分析的コンテキスト-ウインドウクロスオーバー:CoverAndMerge圧縮パイプラインがLCMの実行を減少させる分析的コンテキスト-ウインドウクロスオーバーと、その精度がコンテキスト予算とは無関係に崩壊する経験的識別-容量クロスオーバー。
2つの発見は現実的な重みを持っている: 識別クロスオーバー以上の圧縮は精度を回復できず、フロンティアスケールのモデルだけが大きなサブスクリプションセットをクリアし、バックエンドの選択が構成選択を支配しているため、パイプラインチューニングではなくモデル選択が主要なオペレータレバーである。
本稿では,3つの構成可能なアルゴリズムと,自律型LCM階層選択のためのクラスタごとの品質評価フレームワークを添付する。
関連論文リスト
- Context Pruning for Coding Agents via Multi-Rubric Latent Reasoning [14.508049757681862]
LLMベースのコーディングエージェントは、トークンの予算の大部分をリポジトリファイルを読むのに費やしている。
この定式化がモデリングのボトルネックを生み出すことを示す。
コード関連性を2つの解釈可能な品質次元に分解する構造化プルーニングフレームワークであるLaMRを提案する。
論文 参考訳(メタデータ) (2026-05-14T18:30:10Z) - MacNet: An End-to-End Manifold-Constrained Adaptive Clustering Network for Interpretable Whole Slide Image Classification [9.952997875404634]
クラスタリングに基づくアプローチは、説明可能な意思決定プロセスを提供するが、高次元の特徴と意味的にあいまいなセントロイドに悩まされる。
本稿では、グラスマン再埋め込みと多様体適応クラスタリングを統合したエンドツーエンドMILフレームワークを提案する。
マルチセントのWSIデータセットの実験では、1) クラスタを組み込んだモデルは、グレーディング精度と解釈可能性の両方において優れたパフォーマンスを実現し、2) エンドツーエンドの学習は、より良い特徴表現を洗練し、許容できるリソースを必要とします。
論文 参考訳(メタデータ) (2026-02-16T06:43:36Z) - SARM: LLM-Augmented Semantic Anchor for End-to-End Live-Streaming Ranking [49.109782956280064]
大規模なライブストリーミングレコメンデーションでは、リアルタイムサービス制約下での非定常コンテンツセマンティクスの正確なモデリングが必要である。
自然言語のセマンティックアンカーをランキング最適化に直接統合するエンドツーエンドのランキングアーキテクチャである textbfSARM を提案する。
SARMは完全にデプロイされており、毎日4億人のユーザにサービスを提供している。
論文 参考訳(メタデータ) (2026-02-10T04:15:53Z) - ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over Resource-Constrained Edge Networks [22.53431546014934]
ネットワークエッジでの大規模言語モデル(LLM)のトレーニングは、デバイスリソースの制約、厳密なデータの不均一性、プライバシーリスクの増大など、基本的な課題に直面している。
リソース制約付きエッジネットワーク上での分散LLM微調整のための分割学習(SL)と階層的フェデレーション学習(HFL)を統合する新しいフレームワークであるELSAを提案する。
まず、公的なプローブ入力と対称KL発散を用いたセマンティックフィンガープリントを構築するタスク非依存の振る舞い対応クライアントクラスタリング機構を用いる。
次に、LLMをクライアントとエッジサーバの3つの部分に分割し、クラウドはアダプタアグリゲーションにのみ使用される。
第三に
論文 参考訳(メタデータ) (2026-01-20T10:33:19Z) - A Multi-Agent LLM Framework for Multi-Domain Low-Resource In-Context NER via Knowledge Retrieval, Disambiguation and Reflective Analysis [7.594209761100934]
In-context Learning (ICL) with large language model (LLMs)は、低リソースシナリオにおける名前付きエンティティ認識(NER)のための有望なパラダイムとして登場した。
KDR-Agentは、知識検索、曖昧さ、反射分析を統合した、コンテキスト内NERのための新しいマルチエージェントフレームワークである。
5つのドメインから10のデータセットを対象とした実験では、KDR-Agentが既存のゼロショットと少数ショットのICLベースラインを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2025-11-24T13:23:34Z) - RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文 参考訳(メタデータ) (2025-08-06T21:59:34Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Latent Space Perspicacity and Interpretation Enhancement (LS-PIE)
Framework [0.0]
本稿では,線形潜在空間の解釈可能性向上のための潜在空間表現を強化するための一般的な枠組みを提案する。
この論文のコンセプトは言語に依存しないが、フレームワークはPythonで記述されている。
ラテント・ランキング(LR)、ラテント・スケーリング(LS)、ラテント・クラスタリング(LC)、ラテント・コンデンシング(LCON)など、いくつかの革新的な拡張が組み込まれている。
論文 参考訳(メタデータ) (2023-07-11T03:56:04Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。