論文の概要: Yes, BM25 is a Strong Baseline for Legal Case Retrieval
- arxiv url: http://arxiv.org/abs/2105.05686v1
- Date: Mon, 26 Apr 2021 18:33:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-14 11:30:07.061669
- Title: Yes, BM25 is a Strong Baseline for Legal Case Retrieval
- Title(参考訳): BM25は、訴訟検索のための強力なベースライン
- Authors: Guilherme Moraes Rosa, Ruan Chaves Rodrigues, Roberto Lotufo, Rodrigo
Nogueira
- Abstract要約: 我々はCOLIEE 2021のタスク1への単一提出について述べる。
私たちのバニラBM25は、2位を獲得しました。
- 参考スコア(独自算出の注目度): 2.604227467422371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe our single submission to task 1 of COLIEE 2021. Our vanilla BM25
got second place, well above the median of submissions. Code is available at
https://github.com/neuralmind-ai/coliee.
- Abstract(参考訳): 我々はCOLIEE 2021のタスク1への単一提出について述べる。
バニラBM25が2位となり、応募の中央値を大きく上回った。
コードはhttps://github.com/neuralmind-ai/colieeで入手できる。
関連論文リスト
- BM25S: Orders of magnitude faster lexical search via eager sparse scoring [0.0]
BM25Sは、NumpyとScipyのみに依存する、効率的なPythonベースのBM25の実装である。
最も人気のあるPythonベースのフレームワークと比較して最大500倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2024-07-04T04:01:05Z) - GroundNLQ @ Ego4D Natural Language Queries Challenge 2023 [73.12670280220992]
映像を正確にグラウンドするには、効果的なエゴセントリック特徴抽出器と強力なグラウンドモデルが必要である。
我々は,2段階の事前学習戦略を利用して,ビデオナレーションにおけるエゴセントリックな特徴抽出器とグラウンドングモデルを訓練する。
さらに,マルチモーダルなマルチスケールグラウンドモジュールを用いた新しいグラウンドグラウンドモデル GroundNLQ を提案する。
論文 参考訳(メタデータ) (2023-06-27T07:27:52Z) - 1st Place Solution of The Robust Vision Challenge (RVC) 2022 Semantic
Segmentation Track [67.56316745239629]
本報告では,ECCV 2022におけるロバストビジョンチャレンジのセマンティックセグメンテーション課題に対する勝利解について述べる。
本手法では,エンコーダとしてFAN-B-Hybridモデルを採用し,セグメンテーションフレームワークとしてSegformerを使用している。
提案手法は,マルチドメインセグメンテーションタスクの強力なベースラインとして機能し,今後の作業に役立てることができる。
論文 参考訳(メタデータ) (2022-10-23T20:52:22Z) - Tackling Long Code Search with Splitting, Encoding, and Aggregating [67.02322603435628]
長いコード検索のための新しいベースラインSEA(Split, Encode, Aggregate)を提案する。
長いコードをコードブロックに分割し、これらのブロックを埋め込みにエンコードし、それらを集約して包括的な長いコード表現を得る。
エンコーダとしてGraphCodeBERTを使用すると、SEAはコードSearchNetベンチマークでGraphCodeBERTよりも10.1%高い0.785という総合的な平均逆ランキングスコアを達成する。
論文 参考訳(メタデータ) (2022-08-24T02:27:30Z) - MIA 2022 Shared Task Submission: Leveraging Entity Representations,
Dense-Sparse Hybrids, and Fusion-in-Decoder for Cross-Lingual Question
Answering [5.837881923712393]
複数言語情報アクセス(MIA)2022のための2段階システムについて述べる。
第1段階は多言語通訳検索とハイブリッド密集型スパース検索戦略からなる。
第2段は、第1段によって返される上位通路から回答を出力する読者で構成される。
論文 参考訳(メタデータ) (2022-07-05T10:27:17Z) - Synthetic Target Domain Supervision for Open Retrieval QA [24.48364368847857]
Dense Passage Retriever(DPR)を、新型コロナウイルス(COVID-19)などの閉鎖的かつ特殊なターゲットドメインでストレステストする。
DPRは、この重要な現実世界設定において、標準BM25より遅れている。
実験では、このうるさいが完全に自動化されたターゲットドメインの監視により、DPRはBM25よりも大きな利点がある。
論文 参考訳(メタデータ) (2022-04-20T06:28:13Z) - VLDB 2021: Designing a Hybrid Conference [32.06949074708552]
本稿では,VLDB 2021のハイブリッドフォーマットを重要な設計決定を通じてどのように定義したかを説明する。
私たちの目標は、この知識を、ハイブリッドなカンファレンスフォーマットをターゲットにしたカンファレンスオーガナイザたちと共有することにあります。
論文 参考訳(メタデータ) (2022-01-26T15:39:10Z) - Establishing Strong Baselines for TripClick Health Retrieval [7.911344873839031]
我々は最近リリースされたTripClickヘルス・アドホック検索コレクションに対して,トランスフォーマーをベースとした強力なリグレードと高密度検索ベースラインを提示する。
従来のベースラインでは達成できなかったTripClickのリグレードタスクにおいて,BM25よりも大幅に向上した。
論文 参考訳(メタデータ) (2022-01-02T15:03:19Z) - USACv20: robust essential, fundamental and homography matrix estimation [68.65610177368617]
最新のRANSACのような仮説と検証の堅牢な推定器をレビューします。
最高のパフォーマンスは、Universal Sample Consensus (USAC)アルゴリズムの最先端バージョンを作成するために組み合わせられる。
提案手法であるUSACv20は、公開された8つの実世界のデータセットでテストされる。
論文 参考訳(メタデータ) (2021-04-11T16:27:02Z) - Joint COCO and Mapillary Workshop at ICCV 2019: COCO Instance
Segmentation Challenge Track [87.90450014797287]
MegDetV2は2パス方式で動作し、まずインスタンスを検出し、次にセグメンテーションを取得する。
COCO-2019 検出/インスタンス分割テスト-dev データセットでは,2018 年の勝率それぞれ 5.0/4.2 を上回った 61.0/53.1 mAP を達成した。
論文 参考訳(メタデータ) (2020-10-06T04:49:37Z) - Rapidly Bootstrapping a Question Answering Dataset for COVID-19 [88.86456834766288]
我々は、新型コロナウイルスに特化して設計された質問応答データセットの始まりであるCovidQAを紹介する。
これは、そのタイプの最初の公開リソースであり、より実質的な評価資源が利用可能になるまで研究を導くためのストップギャップとして意図されている。
論文 参考訳(メタデータ) (2020-04-23T17:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。