論文の概要: Telco-oRAG: Optimizing Retrieval-augmented Generation for Telecom Queries via Hybrid Retrieval and Neural Routing
- arxiv url: http://arxiv.org/abs/2505.11856v1
- Date: Sat, 17 May 2025 05:46:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.898119
- Title: Telco-oRAG: Optimizing Retrieval-augmented Generation for Telecom Queries via Hybrid Retrieval and Neural Routing
- Title(参考訳): Telco-oRAG:ハイブリッド検索とニューラルルーティングによるテレコムクエリの検索拡張生成の最適化
- Authors: Andrei-Laurentiu Bornea, Fadhel Ayed, Antonio De Domenico, Nicola Piovesan, Tareq Si Salem, Ali Maatouk,
- Abstract要約: 本稿では,通信分野の技術的問題に対処するために最適化されたオープンソースのRetrieval-Augmented Generation(RAG)フレームワークであるTelco-oRAGを提案する。
- 参考スコア(独自算出の注目度): 11.668868749288421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence will be one of the key pillars of the next generation of mobile networks (6G), as it is expected to provide novel added-value services and improve network performance. In this context, large language models have the potential to revolutionize the telecom landscape through intent comprehension, intelligent knowledge retrieval, coding proficiency, and cross-domain orchestration capabilities. This paper presents Telco-oRAG, an open-source Retrieval-Augmented Generation (RAG) framework optimized for answering technical questions in the telecommunications domain, with a particular focus on 3GPP standards. Telco-oRAG introduces a hybrid retrieval strategy that combines 3GPP domain-specific retrieval with web search, supported by glossary-enhanced query refinement and a neural router for memory-efficient retrieval. Our results show that Telco-oRAG improves the accuracy in answering 3GPP-related questions by up to 17.6% and achieves a 10.6% improvement in lexicon queries compared to baselines. Furthermore, Telco-oRAG reduces memory usage by 45% through targeted retrieval of relevant 3GPP series compared to baseline RAG, and enables open-source LLMs to reach GPT-4-level accuracy on telecom benchmarks.
- Abstract(参考訳): 人工知能は、新たな付加価値サービスを提供し、ネットワーク性能を向上させることが期待されている、次世代のモバイルネットワーク(6G)の重要な柱の1つである。
この文脈では、大規模言語モデルは、意図的理解、知的な知識検索、コーディング能力、ドメイン間のオーケストレーション能力を通じて、通信環境に革命をもたらす可能性がある。
本稿では,通信分野の技術的問題に対処するために最適化されたオープンソースのRetrieval-Augmented Generation(RAG)フレームワークであるTelco-oRAGについて述べる。
Telco-oRAGは、3GPPドメイン固有の検索とWeb検索を組み合わせたハイブリッド検索戦略を導入している。
その結果,Telco-oRAGは3GPP関連質問に対する回答精度を最大17.6%向上し,ベースラインよりも10.6%向上した。
さらに、Telco-oRAGは、ベースラインRAGと比較して、関連する3GPPシリーズのターゲット検索によってメモリ使用量を45%削減し、オープンソースのLCMが通信ベンチマークでGPT-4レベルの精度に達することを可能にする。
関連論文リスト
- Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization [97.72503890388866]
本稿では,選択的検索と知識の言語化を結合する新しいフレームワークであるSelf-Routing RAG(SR-RAG)を提案する。
SR-RAGは、LLMが外部検索と独自のパラメトリック知識の言語化を動的に決定できるようにする。
近接探索による動的知識源推定を導入し,知識源決定の精度を向上させる。
論文 参考訳(メタデータ) (2025-04-01T17:59:30Z) - Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8352968531863]
大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。
本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-31T15:58:08Z) - GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.41557981816077]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - Chat3GPP: An Open-Source Retrieval-Augmented Generation Framework for 3GPP Documents [7.505486557025626]
大規模言語モデル(LLM)は自然言語処理タスクにおいて有望であるが、その汎用性は電気通信のような特定の領域における有効性を制限している。
そこで我々は,3GPP仕様に適したオープンソースの検索拡張生成(RAG)フレームワークChat3GPPを提案する。
チャンキング戦略,ハイブリッド検索,効率的なインデックス化手法を組み合わせることで,Chat3GPPは関連情報を効率的に検索し,ユーザクエリに対する正確な応答を生成することができる。
論文 参考訳(メタデータ) (2025-01-20T11:38:42Z) - SFR-RAG: Towards Contextually Faithful LLMs [57.666165819196486]
Retrieval Augmented Generation (RAG) は、外部コンテキスト情報を大言語モデル(LLM)と統合し、事実の精度と妥当性を高めるパラダイムである。
SFR-RAG(SFR-RAG)について述べる。
また、複数の人気かつ多様なRAGベンチマークをコンパイルする新しい評価フレームワークであるConBenchについても紹介する。
論文 参考訳(メタデータ) (2024-09-16T01:08:18Z) - RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs [60.38044044203333]
大規模言語モデル(LLM)は、通常、検索拡張生成(RAG)において、レトリバーからトップkコンテキストを利用する。
本稿では,RAGにおける文脈ランク付けと回答生成の両目的のために,単一のLLMをチューニング可能な新しい命令微調整フレームワークであるRanRAGを提案する。
例えば、GPT-4-0613, GPT-4-turbo-2024-0409, ChatQA-1.5, RAGベンチマークの最先端性能を備えたオープンソースモデルなどである。
論文 参考訳(メタデータ) (2024-07-02T17:59:17Z) - A Multi-Source Retrieval Question Answering Framework Based on RAG [3.731892340350648]
本研究では,従来のレトリバーをGPT-3.5に置き換える手法を提案する。
また,詳細な知識検索を実現するためのWeb検索手法を提案する。
Web検索におけるGPT検索の錯覚を緩和し,ノイズを低減するため,MSRAGというマルチソース検索フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T15:47:57Z) - Generative AI for the Optimization of Next-Generation Wireless Networks: Basics, State-of-the-Art, and Open Challenges [11.707122626823248]
生成AI(GAI)はその独特な強みのために強力なツールとして出現する。
GAIは現実世界のネットワークデータから学習し、その複雑さを捉えている。
本稿では、xG無線ネットワークにおいて、GAIベースのモデルが最適化の機会を解放する方法を調査する。
論文 参考訳(メタデータ) (2024-05-22T14:56:25Z) - On Topology Optimization and Routing in Integrated Access and Backhaul
Networks: A Genetic Algorithm-based Approach [70.85399600288737]
IABネットワークにおけるトポロジ最適化とルーティングの問題について検討する。
我々は、IABノード配置と非IABバックホールリンク分布の両方に効率的な遺伝的アルゴリズムベースのスキームを開発する。
メッシュベースのIABネットワークを実現する上での課題について論じる。
論文 参考訳(メタデータ) (2021-02-14T21:52:05Z) - Redefining Wireless Communication for 6G: Signal Processing Meets Deep
Learning with Deep Unfolding [17.186326961526994]
提案する6G通信アーキテクチャがもたらすサービス要件と課題について述べる。
従来のアルゴリズムの原則とデータに精通したディープラーニングアプローチの欠陥について概説する。
本稿では,将来の6Gネットワークにおいて,ハードウェア効率の高いエッジインテリジェンスを実現するためのオープンな研究課題を動機づける。
論文 参考訳(メタデータ) (2020-04-22T17:20:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。