論文の概要: A Large-Scale, Cross-Disciplinary Corpus of Systematic Reviews
- arxiv url: http://arxiv.org/abs/2604.22864v1
- Date: Thu, 23 Apr 2026 07:56:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.007718
- Title: A Large-Scale, Cross-Disciplinary Corpus of Systematic Reviews
- Title(参考訳): 大規模・クロスディシプリナ型システムレビューコーパス
- Authors: Pierre Achkar, Tim Gollub, Arno Simons, Harrisen Scells, Martin Potthast,
- Abstract要約: Webis-SR4ALL-26は、OpenAlexがカバーしているすべての科学分野にまたがる体系的なレビューである301,871の大規模な学際コーパスである。
複数段階の事前処理パイプラインを用いて、解決されたOpenAlexメタデータと参照リストにレビューをリンクし、明示的に報告された場合、検索およびスクリーニングに関連する構造化されたメソッドアーティファクトを抽出する。
- 参考スコア(独自算出の注目度): 20.88655348694586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing benchmarks for systematic reviewing remain limited either in scale or in disciplinary coverage, with some collections comprising only a modest number of topics and others focusing primarily on biomedical research. We present Webis-SR4ALL-26, a large-scale, cross-disciplinary corpus of 301,871 systematic reviews spanning all scientific fields as covered by OpenAlex. Using a multi-stage pre-processing pipeline, we link reviews to resolved OpenAlex metadata and reference lists and extract, when explicitly reported, structured method artifacts relevant to retrieval and screening. These artifacts include reported search strategies (Boolean queries or keyword lists) that we normalize into executable approximations, as well as reported inclusion and exclusion criteria. Together, these layers support cross-domain benchmarking of retrieval and screening components against review reference lists, training and evaluation of extraction methods for review artifacts, and comparative meta-science analyses of systematic review practices across disciplines and time. To demonstrate one concrete use case, we report large-scale baseline retrieval signals by executing normalized search strategies in OpenAlex and comparing retrieved sets to resolved reference lists. We release the corpus and the pre-processing pipeline, along with code used for extraction validation and the retrieval demonstration.
- Abstract(参考訳): 体系的レビューのための既存のベンチマークは、規模や学際的な範囲に限られており、いくつかのコレクションは、控えめな数のトピックと、主に医学的な研究に焦点を絞ったものだけで構成されている。
我々は、OpenAlexがカバーしているすべての科学分野にまたがる体系的なレビューを301,871の大規模で学際的なコーパスであるWebis-SR4ALL-26を提示する。
複数段階の事前処理パイプラインを用いて、解決されたOpenAlexメタデータと参照リストにレビューをリンクし、明示的に報告された場合、検索およびスクリーニングに関連する構造化されたメソッドアーティファクトを抽出する。
これらのアーティファクトには、報告された検索戦略(ブールクエリやキーワードリスト)が含まれており、実行可能近似に正規化するとともに、報告されたインクルージョンと除外基準が含まれます。
これらのレイヤは、レビュー参照リストに対する検索およびスクリーニングコンポーネントのクロスドメインベンチマーク、レビューアーティファクトの抽出方法のトレーニングと評価、および規律と時間にわたる体系的なレビュープラクティスの比較メタサイエンス分析をサポートする。
1つの具体的なユースケースを示すために、OpenAlexで正規化された検索戦略を実行し、検索した集合を解決された参照リストと比較することにより、大規模なベースライン検索信号を報告する。
コーパスと前処理パイプラインと,抽出バリデーションと検索デモに使用されるコードをリリースする。
関連論文リスト
- Unsupervised Evaluation of Deep Audio Embeddings for Music Structure Analysis [0.0]
音楽構造分析(MSA)は、高いレベルの楽曲組織を明らかにすることを目的としている。
そこで本研究では,MSAによる9つのオープンソース,汎用的な事前学習型ディープオーディオモデルの教師なし評価を提案する。
論文 参考訳(メタデータ) (2026-03-28T10:18:54Z) - An Artificial Intelligence Driven Semantic Similarity-Based Pipeline for Rapid Literature [0.0]
セマンティックな類似性を利用して文献レビューを行うための自動パイプラインを提案する。
この研究は、トランスフォーマーベースの埋め込みとコサイン類似性を利用することにより、最小限のオーバーヘッドと高い関連性を強調する。
論文 参考訳(メタデータ) (2025-09-18T17:24:47Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Ranking Narrative Query Graphs for Biomedical Document Retrieval (Technical Report) [7.527096697768715]
本稿では,生物医学領域における既存のグラフベースの発見システムを拡張する。
グラフベースの非教師付きランキング手法、新しいクエリ緩和パラダイム、存在論的書き換えに寄与する。
論文 参考訳(メタデータ) (2024-12-06T12:49:28Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - ExcluIR: Exclusionary Neural Information Retrieval [74.08276741093317]
本稿では,排他的検索のためのリソースセットであるExcluIRを提案する。
評価ベンチマークには3,452の高品質な排他的クエリが含まれている。
トレーニングセットには70,293の排他的クエリが含まれており、それぞれに正のドキュメントと負のドキュメントがペアリングされている。
論文 参考訳(メタデータ) (2024-04-26T09:43:40Z) - Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Abstract, Rationale, Stance: A Joint Model for Scientific Claim
Verification [18.330265729989843]
我々は,3つのタスクのモジュールを,機械読解フレームワークを用いて共同で学習するアプローチをARSJointとして提案する。
ベンチマークデータセットSciFactの実験結果は、我々のアプローチが既存の作業より優れていることを示している。
論文 参考訳(メタデータ) (2021-09-13T10:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。