論文の概要: UniFAR: A Unified Facet-Aware Retrieval Framework for Scientific Documents
- arxiv url: http://arxiv.org/abs/2602.23766v1
- Date: Fri, 27 Feb 2026 07:44:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.305556
- Title: UniFAR: A Unified Facet-Aware Retrieval Framework for Scientific Documents
- Title(参考訳): UniFAR: 科学文書のための一貫した顔認識検索フレームワーク
- Authors: Zheng Dou, Zhao Zhang, Deqing Wang, Yikun Ban, Fuzhen Zhuang,
- Abstract要約: 単一のアーキテクチャにおいて,doc-doc と q-doc SDR をサポートする一元化 Facet-Aware Retrieval フレームワークを提案する。
UniFARは、学習可能なファセットアンカーを通じて質問意図で文書構造を調整し、共同トレーニングを通じてドキュメントとq-docの監督を統一する。
- 参考スコア(独自算出の注目度): 35.00880322661589
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing scientific document retrieval (SDR) methods primarily rely on document-centric representations learned from inter-document relationships for document-document (doc-doc) retrieval. However, the rise of LLMs and RAG has shifted SDR toward question-driven retrieval, where documents are retrieved in response to natural-language questions (q-doc). This change has led to systematic mismatches between document-centric models and question-driven retrieval, including (1) input granularity (long documents vs. short questions), (2) semantic focus (scientific discourse structure vs. specific question intent), and (3) training signals (citation-based similarity vs. question-oriented relevance). To this end, we propose UniFAR, a Unified Facet-Aware Retrieval framework to jointly support doc-doc and q-doc SDR within a single architecture. UniFAR reconciles granularity differences through adaptive multi-granularity aggregation, aligns document structure with question intent via learnable facet anchors, and unifies doc-doc and q-doc supervision through joint training. Experimental results show that UniFAR consistently outperforms prior methods across multiple retrieval tasks and base models, confirming its effectiveness and generality.
- Abstract(参考訳): 既存の科学的文書検索法(SDR)は主に文書間関係から得られた文書中心表現を文書文書検索(doc-doc)に頼っている。
しかし LLM と RAG の台頭は SDR を疑問駆動型検索へとシフトさせ, 自然言語質問 (q-doc) に応答して文書を検索した。
この変更は、(1)入力の粒度(長い文書と短い質問)、(2)意味的焦点(科学的談話構造と特定の質問意図)、(3)学習信号(引用に基づく類似性と質問指向関連性)など、文書中心モデルと質問駆動検索の体系的ミスマッチを引き起こした。
そこで我々は,UniFAR(Uniified Facet-Aware Retrieval)フレームワークを提案し,単一のアーキテクチャでdoc-docとq-doc SDRを共同でサポートする。
UniFARは、適応的な多粒度アグリゲーションを通じて粒度差を調整し、学習可能なファセットアンカーを介して文書構造と質問意図を整列し、共同トレーニングによりドキュメント-docとq-docの監督を統一する。
実験の結果、UniFARは複数の検索タスクやベースモデルにまたがる先行手法よりも優れており、その有効性と汎用性が確認されている。
関連論文リスト
- CMRAG: Co-modality-based visual document retrieval and question answering [21.016544020685668]
共同モダリティベースのRAG(RAG)フレームワークは、テキストや画像を利用してより正確な検索と生成を行うことができる。
我々のフレームワークは、複数のビジュアル文書質問応答(VDQA)ベンチマークにおいて、単一モダリティベースのRAGを一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-02T09:17:57Z) - ABCD-LINK: Annotation Bootstrapping for Cross-Document Fine-Grained Links [57.514511353084565]
我々は、最高のパフォーマンスのアプローチを選択し、文書間リンクに注釈を付けるための新しいドメインに依存しないフレームワークを提案する。
当社のフレームワークを2つの異なるドメイン – ピアレビューとニュース – に適用しています。
結果として得られた新しいデータセットは、メディアフレーミングやピアレビューなど、数多くのクロスドキュメントタスクの基礎を築いた。
論文 参考訳(メタデータ) (2025-09-01T11:32:24Z) - Improving Document Retrieval Coherence for Semantically Equivalent Queries [63.97649988164166]
同じ文書を検索する際のモデルのコヒーレンスを改善する訓練DRにおける多段階ランク付け損失のバリエーションを提案する。
この損失は、多様だがセマンティックな等価なクエリのために検索されたトップkランクのドキュメント間の不一致を罰する。
論文 参考訳(メタデータ) (2025-08-11T13:34:59Z) - Extracting Document Relations from Search Corpus by Marginalizing over User Queries [0.0]
本稿では,クエリ境界化による文書関係の発見を行う新しいフレームワークを提案する。
ユーザクエリに対するMarginalizingによるドキュメント関係の抽出は、強く関連するドキュメントが多種多様なユーザクエリで共起する、という洞察に基づいている。
私たちのクエリ駆動フレームワークは、異なるユーザ視点と情報ニーズに適応するドキュメント組織に対して、実践的なアプローチを提供します。
論文 参考訳(メタデータ) (2025-07-14T18:47:13Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - CDER: Collaborative Evidence Retrieval for Document-level Relation Extraction [3.9499087751190243]
文書レベルの関係抽出(DocRE)は、文書内の複数の文にまたがるエンティティ間の関係を識別する。
既存のエビデンス検索システムは、同じ文書の中の意味論的に類似したエンティティペア間の協調性を見落とし、エビデンス検索タスクの有効性を妨げていることが多い。
我々は、CDERという新しいエビデンス検索フレームワークを提案する。CDERは、注意グラフに基づくアーキテクチャを用いて協調パターンをキャプチャし、エビデンス検索にさらなるロバスト性のための動的サブ構造を組み込む。
論文 参考訳(メタデータ) (2025-04-09T02:10:21Z) - DOGR: Leveraging Document-Oriented Contrastive Learning in Generative Retrieval [10.770281363775148]
生成検索における文書指向コントラスト学習(DOGR)の活用という,新規で汎用的な生成検索フレームワークを提案する。
クエリとドキュメントの関係を,直接的なインタラクションを通じて包括的にキャプチャする,2段階の学習戦略を採用している。
意味表現の学習を促進するために、否定的サンプリング手法とそれに対応するコントラスト学習目的を実装した。
論文 参考訳(メタデータ) (2025-02-11T03:25:42Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - Knowledge-Driven Cross-Document Relation Extraction [3.868708275322908]
関係抽出(RE)はよく知られたNLPアプリケーションであり、文レベルや文書レベルのタスクとして扱われる。
本稿では,文書横断REのための入力テキストにエンティティのドメイン知識を組み込む新しい手法KXDocREを提案する。
論文 参考訳(メタデータ) (2024-05-22T11:30:59Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。