論文の概要: An End-to-End Ukrainian RAG for Local Deployment. Optimized Hybrid Search and Lightweight Generation
- arxiv url: http://arxiv.org/abs/2604.22095v1
- Date: Thu, 23 Apr 2026 21:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.279052
- Title: An End-to-End Ukrainian RAG for Local Deployment. Optimized Hybrid Search and Lightweight Generation
- Title(参考訳): 局所展開のための終端ウクライナRAG -最適化ハイブリッドサーチと軽量生成-
- Authors: Mykola Trokhymovych, Yana Oliinyk, Nazarii Nyzhnyk,
- Abstract要約: 本稿では,ウクライナの文書質問応答に特化して構築されたレトリーバル拡張生成システム(RAG)について述べる。
我々のソリューションは、関係するドキュメントページを検索するカスタム2段階の検索パイプラインを備えており、ウクライナ語モデルと組み合わせて正確な答えを生成する。
- 参考スコア(独自算出の注目度): 2.1155908599769764
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents a highly efficient Retrieval-Augmented Generation (RAG) system built specifically for Ukrainian document question answering, which achieved 2nd place in the UNLP 2026 Shared Task. Our solution features a custom two-stage search pipeline that retrieves relevant document pages, paired with a specialized Ukrainian language model fine-tuned on synthetic data to generate accurate, grounded answers. Finally, we compress the model for lightweight deployment. Evaluated under strict computational limits, our architecture demonstrates that high-quality, verifiable AI question answering can be achieved locally on resource-constrained hardware without sacrificing accuracy.
- Abstract(参考訳): 本稿では,ウクライナの文書質問応答に特化して構築され,UNLP 2026共有タスクにおいて2位となった高効率検索・拡張生成(RAG)システムを提案する。
我々のソリューションは、関連するドキュメントページを検索するカスタム2段階の検索パイプラインを備えており、合成データに基づいて微調整されたウクライナ語モデルと組み合わせて、正確なグラウンドド回答を生成する。
最後に、軽量なデプロイメントのためにモデルを圧縮します。
厳密な計算限界の下で評価され、我々のアーキテクチャは、精度を犠牲にすることなく、リソース制約のあるハードウェア上で、高品質で検証可能なAI質問応答をローカルに実現できることを示した。
関連論文リスト
- DocSeeker: Structured Visual Reasoning with Evidence Grounding for Long Document Understanding [63.257540233507626]
本稿では、構造化解析、局所化、推論のワークフローを実行するためにモデルを必要とするパラダイムを提案する。
ショートページトレーニングから超長文書への堅牢な一般化を示し、視覚的検索・拡張生成システムと自然に相乗効果を示す。
論文 参考訳(メタデータ) (2026-04-14T14:39:26Z) - Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [54.987957691350665]
クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。
従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。
産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T08:51:51Z) - Tree-Based Text Retrieval via Hierarchical Clustering in RAGFrameworks: Application on Taiwanese Regulations [0.0]
階層的なクラスタリングに基づく検索手法を提案する。
本手法は,意味的関連コンテンツを適応的に選択しながら,システム応答の精度と関連性を維持する。
我々のフレームワークは実装が簡単で、既存のRAGパイプラインと簡単に統合できます。
論文 参考訳(メタデータ) (2025-06-16T15:34:29Z) - xRAG: Extreme Context Compression for Retrieval-augmented Generation with One Token [108.7069350303884]
xRAGは、検索拡張生成に適した、革新的なコンテキスト圧縮手法である。
xRAGは、言語モデル表現空間に文書の埋め込みをシームレスに統合する。
実験の結果、xRAGは6つの知識集約タスクで平均10%以上の改善を達成していることがわかった。
論文 参考訳(メタデータ) (2024-05-22T16:15:17Z) - Generator-Retriever-Generator Approach for Open-Domain Question Answering [18.950517545413813]
文書検索手法と大規模言語モデル(LLM)を組み合わせた新しい手法を提案する。
並行して、デュアルエンコーダネットワークは、外部コーパスから質問に関連する文書を検索する。
GRGは最先端のgenerator-then-readおよびrecovery-then-readパイプラインより優れている。
論文 参考訳(メタデータ) (2023-07-21T00:34:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。