論文の概要: Generating Natural Language Queries for More Effective Systematic Review
Screening Prioritisation
- arxiv url: http://arxiv.org/abs/2309.05238v3
- Date: Thu, 23 Nov 2023 05:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 03:28:50.432548
- Title: Generating Natural Language Queries for More Effective Systematic Review
Screening Prioritisation
- Title(参考訳): より効果的な体系的レビューのための自然言語クエリの生成
- Authors: Shuai Wang, Harrisen Scells, Martin Potthast, Bevan Koopman, Guido
Zuccon
- Abstract要約: 現在の技術状況では、レビューの最終タイトルをクエリとして、BERTベースのニューラルランクラを使用してドキュメントのランク付けに使用しています。
本稿では,ChatGPT や Alpaca などの命令ベース大規模言語モデルによって生成される文書の検索に使用される Boolean クエリやクエリなど,スクリーニングを優先するクエリの代替源について検討する。
私たちのベストアプローチは、スクリーニング時に利用可能な情報に基づいて実現されるだけでなく、最終タイトルと同じような効果があります。
- 参考スコア(独自算出の注目度): 53.77226503675752
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Screening prioritisation in medical systematic reviews aims to rank the set
of documents retrieved by complex Boolean queries. Prioritising the most
important documents ensures that subsequent review steps can be carried out
more efficiently and effectively. The current state of the art uses the final
title of the review as a query to rank the documents using BERT-based neural
rankers. However, the final title is only formulated at the end of the review
process, which makes this approach impractical as it relies on ex post facto
information. At the time of screening, only a rough working title is available,
with which the BERT-based ranker performs significantly worse than with the
final title. In this paper, we explore alternative sources of queries for
prioritising screening, such as the Boolean query used to retrieve the
documents to be screened and queries generated by instruction-based generative
large-scale language models such as ChatGPT and Alpaca. Our best approach is
not only viable based on the information available at the time of screening,
but also has similar effectiveness to the final title.
- Abstract(参考訳): 医学的体系的レビューにおける優先順位付けは、複雑なブールクエリによって検索された文書の集合をランク付けすることを目的としている。
最も重要な文書の優先順位付けにより、その後のレビュー手順をより効率的に効果的に行うことができる。
現在の技術状況では、レビューの最終タイトルをクエリとして、BERTベースのニューラルランキングを使用して文書をランク付けする。
しかし、最終タイトルはレビュープロセスの終了時にのみ定式化されるため、このアプローチはポストファクト情報に依存しているため、現実的ではない。
スクリーニングの時点では、最終タイトルよりもbertベースのランク付けが著しく悪くなるような大雑把な作業タイトルしか提供されていない。
本稿では,ChatGPT や Alpaca のような命令ベースで生成した大規模言語モデルによって生成される文書の検索に使用される Boolean クエリなど,スクリーニングを優先するクエリの代替源を検討する。
私たちのベストアプローチは、スクリーニング時に利用可能な情報に基づいて実現されるだけでなく、最終タイトルと同じような効果があります。
関連論文リスト
- Fine-Grained Distillation for Long Document Retrieval [86.39802110609062]
ロングドキュメント検索は、大規模コレクションからクエリ関連ドキュメントを取得することを目的としている。
知識蒸留は、異質だが強力なクロスエンコーダを模倣することによって、レトリバーを改善するために事実上のものである。
本稿では, 長期文書検索のための新たな学習フレームワークFGDを提案する。
論文 参考訳(メタデータ) (2022-12-20T17:00:36Z) - CAPSTONE: Curriculum Sampling for Dense Retrieval with Document
Expansion [68.19934563919192]
本稿では,学習中に擬似クエリを利用して,生成したクエリと実際のクエリとの関係を徐々に向上させるカリキュラムサンプリング戦略を提案する。
ドメイン内およびドメイン外両方のデータセットに対する実験結果から,本手法が従来の高密度検索モデルより優れていることが示された。
論文 参考訳(メタデータ) (2022-12-18T15:57:46Z) - Neural Rankers for Effective Screening Prioritisation in Medical
Systematic Review Literature Search [31.797257552928336]
本稿では,事前学習した言語モデルを,体系的なレビュー文書ランキングタスクに適用する。
経験的分析は、このタスクの従来の方法と比較して、ニューラルネットワークがいかに効果的かを比較する。
以上の結果から,BERTをベースとしたランカは,現在のスクリーニング方法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-18T05:26:40Z) - BERT Rankers are Brittle: a Study using Adversarial Document
Perturbations [3.6704226968275258]
BERTに基づくコンテキストランキングモデルは、幅広いパスと文書ランキングタスクに対して十分に確立されている。
我々は、BERT-rankersは、検索された文書をターゲットとした敵攻撃には無害であると主張している。
論文 参考訳(メタデータ) (2022-06-23T14:16:48Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - CODER: An efficient framework for improving retrieval through
COntextualized Document Embedding Reranking [11.635294568328625]
本稿では,最小計算コストで広範囲の検索モデルの性能を向上させるためのフレームワークを提案する。
ベース密度検索法により抽出された事前計算された文書表現を利用する。
実行時に第一段階のメソッドの上に無視可能な計算オーバーヘッドを発生させ、最先端の高密度検索手法と簡単に組み合わせられるようにする。
論文 参考訳(メタデータ) (2021-12-16T10:25:26Z) - Automating Document Classification with Distant Supervision to Increase
the Efficiency of Systematic Reviews [18.33687903724145]
体系的なレビューは高価で、時間的需要があり、労働集約的です。
文書のレビュー作業を大幅に削減するための自動文書分類アプローチを提案します。
論文 参考訳(メタデータ) (2020-12-09T22:45:40Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z) - Pre-training Tasks for Embedding-based Large-scale Retrieval [68.01167604281578]
本稿では,大規模クエリ文書検索問題について考察する。
クエリ(例えば質問)が与えられたら、関連するドキュメントのセットを大きなドキュメントコーパスから返します。
本稿では, 組込み型トランスフォーマーモデルの学習の鍵となる要素が, 事前学習作業のセットであることを示す。
論文 参考訳(メタデータ) (2020-02-10T16:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。