Fugu-MT 論文翻訳(概要): Control Token with Dense Passage Retrieval

論文の概要: Control Token with Dense Passage Retrieval

arxiv url: http://arxiv.org/abs/2405.13008v1
Date: Mon, 13 May 2024 09:17:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-27 02:58:21.292081
Title: Control Token with Dense Passage Retrieval
Title（参考訳）: Dense Passage Retrieval を用いた制御トークン
Authors: Juhwan Lee, Jisu Kim,
Abstract要約: 本研究では,大規模言語モデル(LLM)における幻覚問題に対処する。我々は、関連する情報を適切な回答を得るためのプロンプトに埋め込む手法であるRetrieval-Augmented Generation (RAG) (Lewis et al., 2020) を採用した。そこで我々は、Dense Passage Retrieval(DPR)モデルを用いて、ユーザクエリに関連するドメイン固有のドキュメントを取得する。
参考スコア（独自算出の注目度）: 1.635645768730924
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This study addresses the hallucination problem in large language models (LLMs). We adopted Retrieval-Augmented Generation(RAG) (Lewis et al., 2020), a technique that involves embedding relevant information in the prompt to obtain accurate answers. However, RAG also faced inherent issues in retrieving correct information. To address this, we employed the Dense Passage Retrieval(DPR) (Karpukhin et al., 2020) model for fetching domain-specific documents related to user queries. Despite this, the DPR model still lacked accuracy in document retrieval. We enhanced the DPR model by incorporating control tokens, achieving significantly superior performance over the standard DPR model, with a 13% improvement in Top-1 accuracy and a 4% improvement in Top-20 accuracy.
Abstract（参考訳）: 本研究では,大規模言語モデル(LLM)における幻覚問題に対処する。我々は、関連する情報を適切な回答を得るためのプロンプトに埋め込む手法であるRetrieval-Augmented Generation (RAG) (Lewis et al , 2020) を採用した。しかし、RAGは正しい情報を取得する際にも固有の問題に直面した。そこで我々は、Dense Passage Retrieval(DPR)モデル(Karpukhin et al , 2020)を用いて、ユーザクエリに関連するドメイン固有のドキュメントを取得する。それにもかかわらず、DPRモデルは文書検索の精度に欠けていた。制御トークンを組み込んでDPRモデルを強化し,標準DPRモデルよりも優れた性能を実現し,Top-1精度が13%向上し,Top-20精度が4%向上した。

関連論文リスト

Evaluating the Impact of Data Cleaning on the Quality of Generated Pull Request Descriptions [2.2134505920972547]
プルリクエスト(PR)はコラボレーションコーディングの中心である。多くのPRは不完全、非形式的、あるいはアウト・オブ・コンテクストのコンテンツを持っている。本研究では,「ノイズ」PRの有病率について検討し,それらが記述生成モデルに与える影響を評価する。
論文参考訳（メタデータ） (2025-05-02T08:58:42Z)
R-PRM: Reasoning-Driven Process Reward Modeling [53.06844294668382]
プロセス・リワード・モデル(Process Reward Models, PRM)は、各推論ステップを評価することによって、有望なソリューションとして登場した。既存のPRMは評価スコアを直接出力し、学習効率と評価精度の両方を制限する。推論駆動プロセスリワードモデリング(R-PRM)を提案する。 R-PRMは限られたアノテーションからシードデータを生成し、効果的にモデルの推論能力をブートストラップします。
論文参考訳（メタデータ） (2025-03-27T09:23:08Z)
Practical Fine-Tuning of Autoregressive Models on Limited Handwritten Texts [0.0]
微調整は16行で確実に開始でき、CERが10%向上し、256行で最大40%向上することを示した。また,OCRモデルを用いて情報回線の信頼性に基づく選択を行うことで,アノテーションのコストを半減できることを示す。
論文参考訳（メタデータ） (2025-03-25T11:01:05Z)
An Empirical Study on Eliciting and Improving R1-like Reasoning Models [90.52239241349504]
RLトレーニングのスケーリングは、そのような推論モデルを実装するための中心的なテクニックとなっている。我々のRLトレーニングアプローチはQwen2.5-32Bベースモデルを継続的に改善することを示した。また、ツール操作の利用についても検討し、大きな推論モデルの推論性能を大幅に向上させることを見出した。
論文参考訳（メタデータ） (2025-03-06T15:34:27Z)
A RAG-Based Institutional Assistant [0.1499944454332829]
我々は,サンパウロ大学に特化されたRAGベースの仮想アシスタントの設計と評価を行った。最適レトリバーモデルではトップ5の精度が30%,最も有効な生成モデルでは22.04%,真理回答では22.04%のスコアが得られた。
論文参考訳（メタデータ） (2025-01-23T17:54:19Z)
RAG-ConfusionQA: A Benchmark for Evaluating LLMs on Confusing Questions [52.33835101586687]
会話AIエージェントはRetrieval Augmented Generation(RAG)を使用して、ユーザからの問い合わせに対して検証可能なドキュメント地上応答を提供する。本稿では,与えられた文書コーパスから,文脈に乱れた多様な質問を効率的に生成する,新しい合成データ生成手法を提案する。
論文参考訳（メタデータ） (2024-10-18T16:11:29Z)
REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models [14.023953508288628]
検索拡張生成(RAG)パイプラインは、質問応答(QA)などのタスクで一般的に使用される。本稿では,利用可能な文書から合成データを生成する新しい手法であるREFINEを提案する。
論文参考訳（メタデータ） (2024-10-16T08:43:39Z)
Optimizing Query Generation for Enhanced Document Retrieval in RAG [53.10369742545479]
大規模言語モデル(LLM)は様々な言語タスクに優れるが、しばしば誤った情報を生成する。 Retrieval-Augmented Generation (RAG) は、正確な応答に文書検索を使用することによってこれを緩和することを目的としている。
論文参考訳（メタデータ） (2024-07-17T05:50:32Z)
Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4 [23.856839017006386]
ルート原因分析(RCA)は、クラウドサービスのインシデント診断プロセスにおいて重要な役割を果たす。 GPT-4モデルの巨大なサイズは、ユーザデータにそれを微調整しようとする際の課題を示す。そこで本研究では,自動ルート生成のためのコンテキスト内学習手法を提案し,微調整の必要性を排除した。
論文参考訳（メタデータ） (2024-01-24T21:02:07Z)
The Chronicles of RAG: The Retriever, the Chunk and the Generator [0.0]
本稿では,ブラジルポルトガル語のRAGの実装,最適化,評価を行うための優れたプラクティスを提案する。我々は最初のハリー・ポッターの本についての質問に答えるための様々な方法を探究する。
論文参考訳（メタデータ） (2024-01-15T18:25:18Z)
Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文参考訳（メタデータ） (2023-11-29T05:33:28Z)
GAR-meets-RAG Paradigm for Zero-Shot Information Retrieval [16.369071865207808]
本稿では,既存のパラダイムの課題を克服する新しいGAR-meets-RAG再帰の定式化を提案する。鍵となる設計原則は、リライト・検索段階がシステムのリコールを改善し、最終段階が精度を向上させることである。我々の手法はBEIRベンチマークで新たな最先端性を確立し、8つのデータセットのうち6つでRecall@100とnDCG@10の指標で過去の最高の結果を上回った。
論文参考訳（メタデータ） (2023-10-31T03:52:08Z)
VisFIS: Visual Feature Importance Supervision with Right-for-the-Right-Reason Objectives [84.48039784446166]
モデルFI監督は、VQAモデルの精度と、Right-to-the-Right-Reasonメトリクスの性能を有意義に向上させることができることを示す。我々の最高のパフォーマンス手法であるVisual Feature Importance Supervision (VisFIS)は、ベンチマークVQAデータセットで強いベースラインを上回ります。説明が妥当で忠実な場合には予測がより正確になる。
論文参考訳（メタデータ） (2022-06-22T17:02:01Z)
Improving Passage Retrieval with Zero-Shot Question Generation [109.11542468380331]
オープンな質問応答における経路検索を改善するための,シンプルで効果的な再ランク付け手法を提案する。再ランカは、学習済み言語モデルを用いて、検索されたパスに条件付けられた入力質問の確率を算出するゼロショット質問生成モデルを用いて、検索されたパスを再スコアする。
論文参考訳（メタデータ） (2022-04-15T14:51:41Z)
Zero-shot Fact Verification by Claim Generation [85.27523983027471]
我々は,堅牢な事実検証モデルをトレーニングするフレームワークであるQACGを開発した。われわれは自動的に生成されたクレームを使って、Wikipediaのエビデンスからサポートしたり、反論したり、検証したりできる。ゼロショットシナリオでは、QACGはRoBERTaモデルのF1を50%から77%に改善し、パフォーマンスは2K以上の手作業による例に相当する。
論文参考訳（メタデータ） (2021-05-31T03:13:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。