論文の概要: Combining Counting Processes and Classification Improves a Stopping Rule
for Technology Assisted Review
- arxiv url: http://arxiv.org/abs/2312.03171v1
- Date: Tue, 5 Dec 2023 22:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 16:41:10.070143
- Title: Combining Counting Processes and Classification Improves a Stopping Rule
for Technology Assisted Review
- Title(参考訳): カウントプロセスと分類の組み合わせによる技術支援レビューの停止ルールの改善
- Authors: Reem Bin-Hezam and Mark Stevenson
- Abstract要約: 技術支援レビュー(TAR)の停止規則は、関連性のある文書を手作業で評価するコストを削減することを目的としている。
本稿では、追加のアノテーションを必要とせずにトレーニングできるテキスト分類器から得られる情報を用いて、効果的な停止ルールを拡張する。
- 参考スコア(独自算出の注目度): 11.028520416752325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Technology Assisted Review (TAR) stopping rules aim to reduce the cost of
manually assessing documents for relevance by minimising the number of
documents that need to be examined to ensure a desired level of recall. This
paper extends an effective stopping rule using information derived from a text
classifier that can be trained without the need for any additional annotation.
Experiments on multiple data sets (CLEF e-Health, TREC Total Recall, TREC Legal
and RCV1) showed that the proposed approach consistently improves performance
and outperforms several alternative methods.
- Abstract(参考訳): technology assisted review (tar) stop rulesは、必要なリコールレベルを確保するために、検査すべき文書の数を最小にすることで、関連のある文書を手動で評価するコストを削減することを目的としている。
本稿では,追加のアノテーションを必要とせずに学習できるテキスト分類器の情報を用いて,効果的な停止ルールを拡張する。
複数データセット(CLEF e-Health, TREC Total Recall, TREC Legal, RCV1)の実験により, 提案手法は一貫して性能を向上し, いくつかの代替手法を上回る性能を示した。
関連論文リスト
- Relevance feedback strategies for recall-oriented neural information
retrieval [0.0]
本研究は、レビューの労力を削減するための、よりリコール指向のアプローチを提案する。
具体的には、ユーザのフィードバックに基づいて、関連性ランキングを反復的にランク付けする。
その結果,本手法はベースラインアプローチに比べて17.85%から59.04%のレビュー工数を削減できることがわかった。
論文 参考訳(メタデータ) (2023-11-25T19:50:41Z) - Active Learning for Abstractive Text Summarization [50.79416783266641]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。
ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文 参考訳(メタデータ) (2023-01-09T10:33:14Z) - Socratic Pretraining: Question-Driven Pretraining for Controllable
Summarization [89.04537372465612]
ソクラティック事前訓練は、要約タスクにおける制御性を改善するために設計された、質問駆動で教師なし事前訓練の目的である。
以上の結果から,Socraticプレトレーニングはタスク固有のラベル付きデータ要件を半分に削減することがわかった。
論文 参考訳(メタデータ) (2022-12-20T17:27:10Z) - Questions Are All You Need to Train a Dense Passage Retriever [123.13872383489172]
ARTは、ラベル付きトレーニングデータを必要としない高密度検索モデルをトレーニングするための、新しいコーパスレベルのオートエンコーディングアプローチである。
そこで,(1) 入力質問を用いて証拠文書の集合を検索し,(2) 文書を用いて元の質問を再構築する確率を計算する。
論文 参考訳(メタデータ) (2022-06-21T18:16:31Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - CODER: An efficient framework for improving retrieval through
COntextualized Document Embedding Reranking [11.635294568328625]
本稿では,最小計算コストで広範囲の検索モデルの性能を向上させるためのフレームワークを提案する。
ベース密度検索法により抽出された事前計算された文書表現を利用する。
実行時に第一段階のメソッドの上に無視可能な計算オーバーヘッドを発生させ、最先端の高密度検索手法と簡単に組み合わせられるようにする。
論文 参考訳(メタデータ) (2021-12-16T10:25:26Z) - Value Retrieval with Arbitrary Queries for Form-like Documents [50.5532781148902]
フォーム状文書に対する任意のクエリを用いた値検索を提案する。
本手法は,フォームのレイアウトやセマンティクスの理解に基づいて,任意のクエリのターゲット値を予測する。
本稿では,大規模モデル事前学習における文書理解を改善するためのシンプルな文書言語モデリング (simpleDLM) 戦略を提案する。
論文 参考訳(メタデータ) (2021-12-15T01:12:02Z) - A Training-free and Reference-free Summarization Evaluation Metric via
Centrality-weighted Relevance and Self-referenced Redundancy [60.419107377879925]
トレーニング不要かつ参照不要な要約評価指標を提案する。
我々の測定基準は、集中度重み付き関連度スコアと自己参照冗長度スコアからなる。
提案手法は,複数文書と単一文書の要約評価において,既存の手法よりも大幅に優れる。
論文 参考訳(メタデータ) (2021-06-26T05:11:27Z) - Heuristic Stopping Rules For Technology-Assisted Review [7.513733974830772]
技術支援レビュー (Technology-Assisted Review, TAR) とは、大規模なコレクションに関連文書を見つけるためのループ内アクティブラーニングである。
本研究では,調査研究から得られたモデルに基づく推定手法に基づいて,QuantCIとQuantCIの2つの新しい停止規則を提案する。
論文 参考訳(メタデータ) (2021-06-18T02:14:20Z) - Automating Document Classification with Distant Supervision to Increase
the Efficiency of Systematic Reviews [18.33687903724145]
体系的なレビューは高価で、時間的需要があり、労働集約的です。
文書のレビュー作業を大幅に削減するための自動文書分類アプローチを提案します。
論文 参考訳(メタデータ) (2020-12-09T22:45:40Z) - SueNes: A Weakly Supervised Approach to Evaluating Single-Document
Summarization via Negative Sampling [25.299937353444854]
本研究は,参照要約の存在を伴わない,弱教師付き要約評価手法に対する概念実証研究である。
既存の要約データセットの大量データは、文書と破損した参照要約とのペアリングによってトレーニングのために変換される。
論文 参考訳(メタデータ) (2020-05-13T15:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。