論文の概要: Generating Natural Language Queries for More Effective Systematic Review
Screening Prioritisation
- arxiv url: http://arxiv.org/abs/2309.05238v1
- Date: Mon, 11 Sep 2023 05:12:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 13:48:06.520076
- Title: Generating Natural Language Queries for More Effective Systematic Review
Screening Prioritisation
- Title(参考訳): より効果的な体系的レビューのための自然言語クエリの生成
- Authors: Shuai Wang, Harrisen Scells, Martin Potthast, Bevan Koopman, Guido
Zuccon
- Abstract要約: 医学的体系的レビューにおける優先順位付けのスクリーニングは、複雑なブールクエリによって検索された文書群をランク付けすることを目的としている。
この技術の現在の状態は、レビューの最終タイトルを使用して、BERTベースのニューラル・ニューラル・ランサーを使用して文書をランク付けする。
我々の最善のアプローチは、スクリーニング時に利用可能な情報に基づいて実用的であるだけでなく、最終タイトルと有効性に類似している。
- 参考スコア(独自算出の注目度): 53.77226503675752
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Screening prioritisation in medical systematic reviews aims to rank the set
of documents retrieved by complex Boolean queries. The goal is to prioritise
the most important documents so that subsequent review steps can be carried out
more efficiently and effectively. The current state of the art uses the final
title of the review to rank documents using BERT-based neural neural rankers.
However, the final title is only formulated at the end of the review process,
which makes this approach impractical as it relies on ex post facto
information. At the time of screening, only a rough working title is available,
with which the BERT-based ranker achieves is significantly worse than the final
title. In this paper, we explore alternative sources of queries for screening
prioritisation, such as the Boolean query used to retrieve the set of documents
to be screened, and queries generated by instruction-based generative large
language models such as ChatGPT and Alpaca. Our best approach is not only
practical based on the information available at screening time, but is similar
in effectiveness with the final title.
- Abstract(参考訳): 医学的体系的レビューにおける優先順位付けは、複雑なブールクエリによって検索された文書の集合をランク付けすることを目的としている。
目標は、最も重要なドキュメントを優先順位付けし、その後のレビューステップをより効率的に実行できるようにすることです。
現在の最先端は、bertベースのニューラルランカを使用してドキュメントをランク付けするために、レビューの最終タイトルを使用する。
しかし、最終タイトルはレビュープロセスの終了時にのみ定式化されるため、このアプローチはポストファクト情報に依存しているため、現実的ではない。
スクリーニングの時点では、BERTベースのランキングが達成する粗悪なタイトルのみが利用可能であり、最終タイトルよりもはるかに悪い。
本稿では,文書集合の検索に使用されるbooleanクエリや,chatgptやalpacaなどの命令ベース生成型大規模言語モデルによって生成されたクエリなど,優先順位付けをスクリーニングするためのクエリの代替源について検討する。
我々の最善のアプローチは、スクリーニング時に得られる情報に基づいて実用的であるだけでなく、最終タイトルと同等の効果を持つ。
関連論文リスト
- JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Dense Retrieval with Continuous Explicit Feedback for Systematic Review Screening Prioritisation [28.80089773616623]
体系的なレビューにおいて優先順位付けをスクリーニングする目的は、関連文書を高いリコールで識別し、レビューの早い段階でランク付けすることである。
近年の研究では、ニューラルモデルがこのタスクに有意なポテンシャルがあることが示されているが、それらの時間を要する微調整と推論は、優先順位付けのスクリーニングに広く使用されることを妨げている。
ニューラルモデルに引き続き依存する代替アプローチを提案するが、高密度表現と関連フィードバックを活用してスクリーニングの優先順位付けを強化する。
論文 参考訳(メタデータ) (2024-06-30T09:25:42Z) - Fine-Grained Distillation for Long Document Retrieval [86.39802110609062]
ロングドキュメント検索は、大規模コレクションからクエリ関連ドキュメントを取得することを目的としている。
知識蒸留は、異質だが強力なクロスエンコーダを模倣することによって、レトリバーを改善するために事実上のものである。
本稿では, 長期文書検索のための新たな学習フレームワークFGDを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:00:36Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Neural Rankers for Effective Screening Prioritisation in Medical
Systematic Review Literature Search [31.797257552928336]
本稿では,事前学習した言語モデルを,体系的なレビュー文書ランキングタスクに適用する。
経験的分析は、このタスクの従来の方法と比較して、ニューラルネットワークがいかに効果的かを比較する。
以上の結果から,BERTをベースとしたランカは,現在のスクリーニング方法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-18T05:26:40Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - CODER: An efficient framework for improving retrieval through
COntextualized Document Embedding Reranking [11.635294568328625]
本稿では,最小計算コストで広範囲の検索モデルの性能を向上させるためのフレームワークを提案する。
ベース密度検索法により抽出された事前計算された文書表現を利用する。
実行時に第一段階のメソッドの上に無視可能な計算オーバーヘッドを発生させ、最先端の高密度検索手法と簡単に組み合わせられるようにする。
論文 参考訳(メタデータ) (2021-12-16T10:25:26Z) - Automating Document Classification with Distant Supervision to Increase
the Efficiency of Systematic Reviews [18.33687903724145]
体系的なレビューは高価で、時間的需要があり、労働集約的です。
文書のレビュー作業を大幅に削減するための自動文書分類アプローチを提案します。
論文 参考訳(メタデータ) (2020-12-09T22:45:40Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。