論文の概要: PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing
- arxiv url: http://arxiv.org/abs/2508.11116v1
- Date: Thu, 14 Aug 2025 23:43:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.695029
- Title: PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing
- Title(参考訳): PaperRegister:階層型レジスタインデックスによるフレキシブルな紙検索の促進
- Authors: Zhuoqun Li, Xuanang Chen, Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun,
- Abstract要約: 研究が深まるにつれ、論文検索の要件はより柔軟になる可能性がある。
PaperRegisterは、従来の抽象的なインデックスを階層的なインデックスツリーに変換する。
様々な粒度の紙探索実験により,PaperRegisterが最先端の性能を達成することを示す。
- 参考スコア(独自算出の注目度): 46.14402767316296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Paper search is an important activity for researchers, typically involving using a query with description of a topic to find relevant papers. As research deepens, paper search requirements may become more flexible, sometimes involving specific details such as module configuration rather than being limited to coarse-grained topics. However, previous paper search systems are unable to meet these flexible-grained requirements, as these systems mainly collect paper abstracts to construct index of corpus, which lack detailed information to support retrieval by finer-grained queries. In this work, we propose PaperRegister, consisted of offline hierarchical indexing and online adaptive retrieval, transforming traditional abstract-based index into hierarchical index tree for paper search, thereby supporting queries at flexible granularity. Experiments on paper search tasks across a range of granularity demonstrate that PaperRegister achieves the state-of-the-art performance, and particularly excels in fine-grained scenarios, highlighting the good potential as an effective solution for flexible-grained paper search in real-world applications. Code for this work is in https://github.com/Li-Z-Q/PaperRegister.
- Abstract(参考訳): 論文検索は研究者にとって重要な活動であり、典型的には、関連する論文を見つけるためにトピックの説明付きクエリーを使用する。
研究が深まるにつれて、論文検索の要件はより柔軟になり、時には粗いトピックに制限されるのではなく、モジュール構成のような特定の詳細を含むこともある。
しかし,従来の論文検索システムは,細かなクエリによる検索を支援するための詳細な情報を持たないコーパスのインデックスを構築するために,主に論文要約を収集するので,これらのフレキシブルな要求を満たすことができない。
本研究では,オフラインの階層的インデックス作成とオンライン適応検索からなるPaperRegisterを提案し,従来の抽象的インデックスを階層的インデックスツリーに変換することにより,フレキシブルな粒度でクエリをサポートする。
様々な粒度の紙検索タスクの実験により、PaperRegisterは最先端のパフォーマンスを達成し、特に粒度の細かいシナリオに優れており、現実のアプリケーションにおけるフレキシブルな紙検索の有効なソリューションとしての可能性を強調している。
この作業のコードはhttps://github.com/Li-Z-Q/PaperRegisterにある。
関連論文リスト
- PRISM: Fine-Grained Paper-to-Paper Retrieval with Multi-Aspect-Aware Query Optimization [61.783280234747394]
PRISMは文書から文書への検索手法であり、クエリと候補文書の両方に対して、複数のきめ細かい表現を導入している。
SciFullBenchは、クエリと候補の両方のフルペーパーの完全かつセグメンテーションされたコンテキストが利用できる新しいベンチマークである。
実験の結果、PRISMは既存の検索基準よりも平均4.3%性能が向上した。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - ManuSearch: Democratizing Deep Search in Large Language Models with a Transparent and Open Multi-Agent Framework [73.91207117772291]
ManuSearchは,大規模言語モデル(LLM)の深層検索を民主化するために設計された,透明でモジュール化されたマルチエージェントフレームワークである。
ManuSearchは検索と推論のプロセスを,(1)サブクエリを反復的に定式化するソリューション計画エージェント,(2)リアルタイムWeb検索を通じて関連文書を検索するインターネット検索エージェント,(3)生のWebコンテンツから重要な証拠を抽出する構造化Webページ読取エージェントの3つに分解する。
論文 参考訳(メタデータ) (2025-05-23T17:02:02Z) - ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。
我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。
我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文 参考訳(メタデータ) (2025-02-11T21:35:13Z) - Ranking Narrative Query Graphs for Biomedical Document Retrieval (Technical Report) [7.527096697768715]
本稿では,生物医学領域における既存のグラフベースの発見システムを拡張する。
グラフベースの非教師付きランキング手法、新しいクエリ緩和パラダイム、存在論的書き換えに寄与する。
論文 参考訳(メタデータ) (2024-12-06T12:49:28Z) - PseudoSeer: a Search Engine for Pseudocode [18.726136894285403]
疑似コードを含む学術論文の効率的な検索と検索を容易にするために、新しい擬似コード検索エンジンが設計された。
スニペットを活用することで、ユーザはタイトル、抽象情報、著者情報、コードスニペットなど、紙のさまざまな面を検索できる。
重み付けされたBM25ベースのランキングアルゴリズムを検索エンジンで使用し、検索結果の優先順位付け時に考慮される要因について述べる。
論文 参考訳(メタデータ) (2024-11-19T16:58:03Z) - Taxonomy-guided Semantic Indexing for Academic Paper Search [51.07749719327668]
TaxoIndexは学術論文検索のためのセマンティックインデックスフレームワークである。
学術分類学によって導かれる意味指標として、論文から重要な概念を整理する。
既存の高密度レトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-10-25T00:00:17Z) - Generative Retrieval as Multi-Vector Dense Retrieval [71.75503049199897]
生成検索は、文書の識別子をエンドツーエンドで生成する。
それまでの研究は、原子識別子による生成的検索が単一ベクトル密度検索と等価であることを示した。
生成的検索と多ベクトル高密度検索は,文書の問合せに対する関連性を測定するのと同じ枠組みを共有していることを示す。
論文 参考訳(メタデータ) (2024-03-31T13:29:43Z) - Extracting Variable-Depth Logical Document Hierarchy from Long
Documents: Method, Evaluation, and Application [21.270184491603864]
我々は、長いドキュメント(HELD)から階層抽出(Hierarchy extract)というフレームワークを開発し、各物理オブジェクトを現在のツリーの適切な位置に「逐次」挿入する。
中国、イギリスの金融市場、イギリスの科学出版物から何千もの長い文書に基づく実験。
本稿では,下流経路検索タスクの性能向上に論理文書階層を用いる方法を提案する。
論文 参考訳(メタデータ) (2021-05-14T06:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。