論文の概要: RECOVER: Robust Entity Correction via agentic Orchestration of hypothesis Variants for Evidence-based Recovery
- arxiv url: http://arxiv.org/abs/2603.16411v1
- Date: Tue, 17 Mar 2026 11:48:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.251864
- Title: RECOVER: Robust Entity Correction via agentic Orchestration of hypothesis Variants for Evidence-based Recovery
- Title(参考訳): RecoVER: 証拠ベース回復のための仮説変数のエージェントオーケストレーションによるロバストエンティティの補正
- Authors: Abhishek Kumar, Aashraya Sachdeva,
- Abstract要約: ツール使用エージェントとして機能するエージェント修正フレームワークであるRECOVERを紹介する。
複数の仮説をASRの証拠として利用し、関連するエンティティを検索し、制約の下で大言語モデル(LLM)の修正を適用する。
エンティティ・フレーズの単語誤り率(E-WER)を8~46%削減し、リコール率を最大22ポイント向上させる。
- 参考スコア(独自算出の注目度): 8.750432529472802
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Entity recognition in Automatic Speech Recognition (ASR) is challenging for rare and domain-specific terms. In domains such as finance, medicine, and air traffic control, these errors are costly. If the entities are entirely absent from the ASR output, post-ASR correction becomes difficult. To address this, we introduce RECOVER, an agentic correction framework that serves as a tool-using agent. It leverages multiple hypotheses as evidence from ASR, retrieves relevant entities, and applies Large Language Model (LLM) correction under constraints. The hypotheses are used using different strategies, namely, 1-Best, Entity-Aware Select, Recognizer Output Voting Error Reduction (ROVER) Ensemble, and LLM-Select. Evaluated across five diverse datasets, it achieves 8-46% relative reductions in entity-phrase word error rate (E-WER) and increases recall by up to 22 percentage points. The LLM-Select achieves the best overall performance in entity correction while maintaining overall WER.
- Abstract(参考訳): 音声認識におけるエンティティ認識(ASR)は、希少かつドメイン固有の用語では困難である。
金融、医療、航空交通管理などの分野では、これらのエラーはコストがかかる。
エンティティがASR出力から完全に欠落している場合、ASR後の修正は困難になる。
そこで本稿では,ツール使用エージェントとして機能するエージェント修正フレームワークであるRECOVERを紹介する。
複数の仮説をASRの証拠として利用し、関連するエンティティを検索し、制約の下で大言語モデル(LLM)の修正を適用する。
仮説は1-Best、Entity-Aware Select、Recognizer Output Voting Error Reduction (ROVER) Ensemble、LLM-Selectといった異なる戦略を用いて使われる。
5つの多様なデータセットで評価され、エンティティ・フレーズの単語誤り率(E-WER)を8~46%削減し、リコール率を最大22ポイント向上させる。
LLM-Selectは、全体のWERを維持しながら、エンティティ修正において最高の全体的なパフォーマンスを達成する。
関連論文リスト
- Retrieval-Augmented Self-Taught Reasoning Model with Adaptive Chain-of-Thought for ASR Named Entity Correction [12.483998165719981]
自動音声認識(ASR)における名前付きエンティティエラーの修正のための検索拡張生成フレームワークを提案する。
提案手法は,(1)名前付きエンティティ認識のための言い換え言語モデル(RLM)と,(2)タスクの難易度に基づいて推論の深さを動的に調整する適応チェーン・オブ・シント(A-STAR)を用いた新しい自己学習推論モデルからなる。
論文 参考訳(メタデータ) (2026-01-21T15:05:39Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Relational Deep Dive: Error-Aware Queries Over Unstructured Data [9.0236658372663]
ReDD(Relational Deep Dive)は、クエリ固有のスキーマを動的に発見し、リレーショナルテーブルをポップアップさせ、証明可能な保証でエラー認識抽出を保証するフレームワークである。
主な貢献は、カバレッジ保証付きエラー検出の統計的校正手法であるSCAPEと、精度と人的補正コストのトレードオフを最適化するハイブリッドアプローチであるSCAPE-HYBである。
論文 参考訳(メタデータ) (2025-11-04T16:30:55Z) - Accelerating Automatic Program Repair with Dual Retrieval-Augmented Fine-Tuning and Patch Generation on Large Language Models [28.75106676284909]
新たに設計されたデュアルRAGモジュールと微調整LDMを統合した新しいAPR手法であるSelRepairを提案する。
このアプローチでは、バグフィックスペアデータセットを微調整に使用し、RAG選択ゲートを通じて意味的および構文的/構造的類似情報を組み込む。
Javaデータセットの評価では、SelRepairは他のAPRメソッドよりも優れており、異なるデータセット上での正確なマッチング(EM)で26.29%と17.64%を達成し、制御された入力長で推論時間を少なくとも6.42%削減している。
論文 参考訳(メタデータ) (2025-07-14T09:41:51Z) - Latent Veracity Inference for Identifying Errors in Stepwise Reasoning [78.29317733206643]
本稿では、精度割当てに対する離散探索アルゴリズムであるVeracity Search(VS)を紹介する。
その他の方法では、後続の精度値よりも後続の分布において難解な推論を行う。
VSを一般化し、新しいコンテキストで正確なゼロショットの精度推論を可能にする。
論文 参考訳(メタデータ) (2025-05-17T04:16:36Z) - Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization [95.85537087475882]
既存のアプローチは、大規模言語モデル(LLM)の固有の知識を過小評価している。
本稿では,選択検索と知識の言語化を結びつける新しいフレームワークであるSelf-Routing RAGを提案する。
SR-RAGは検索回数を29%削減し、性能は5.1%向上した。
論文 参考訳(メタデータ) (2025-04-01T17:59:30Z) - Error Correction by Paying Attention to Both Acoustic and Confidence References for Automatic Speech Recognition [52.624909026294105]
本稿では,非自己回帰型音声誤り訂正法を提案する。
信頼モジュールは、N-best ASR仮説の各単語の不確実性を測定する。
提案方式は,ASRモデルと比較して誤差率を21%削減する。
論文 参考訳(メタデータ) (2024-06-29T17:56:28Z) - Crossmodal ASR Error Correction with Discrete Speech Units [16.58209270191005]
ASR誤り訂正(AEC)に対するASR後処理手法を提案する。
我々は、事前学習と微調整の戦略を探求し、ASRドメインの不一致現象を明らかにする。
そこで本稿では,AEC品質向上のための単語埋め込みの整合・強化を目的とした,離散音声ユニットの組込みを提案する。
論文 参考訳(メタデータ) (2024-05-26T19:58:38Z) - How Fragile is Relation Extraction under Entity Replacements? [70.34001923252711]
関係抽出(RE)は、テキストコンテキストからエンティティ名間の関係を抽出することを目的としている。
既存の研究によると、REはエンティティ名パターンをモデル化し、テキストコンテキストを無視しながらRE予測を行う。
これは、REモデルはエンティティの置換に対して堅牢か?」という疑問を提起する動機になります。
論文 参考訳(メタデータ) (2023-05-22T23:53:32Z) - Factual Error Correction for Abstractive Summaries Using Entity
Retrieval [57.01193722520597]
本稿では,エンティティ検索後処理に基づく効率的な事実誤り訂正システムRFECを提案する。
RFECは、原文と対象要約とを比較して、原文から証拠文を検索する。
次に、RFECは、エビデンス文を考慮し、要約中のエンティティレベルのエラーを検出し、エビデンス文から正確なエンティティに置換する。
論文 参考訳(メタデータ) (2022-04-18T11:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。