論文の概要: Artifact Sharing for Information Retrieval Research
- arxiv url: http://arxiv.org/abs/2505.05434v1
- Date: Thu, 08 May 2025 17:23:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.980102
- Title: Artifact Sharing for Information Retrieval Research
- Title(参考訳): 情報検索研究のためのアーティファクト共有
- Authors: Sean MacAvaney,
- Abstract要約: トレーニングされたモデルや事前構築されたインデックス、それを使用するコードなどのアーティファクトの共有は、研究者が中間ステップを検証できるように努力する上で役立ちます。
構築されたインデックスなど、他の種類のアーティファクトを共有するためのコンセンサスはありません。
このデモでは、情報検索研究のためのアーティファクトを共有するフレキシブルで相互運用可能な方法を紹介している。
- 参考スコア(独自算出の注目度): 19.588416229443254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sharing artifacts -- such as trained models, pre-built indexes, and the code to use them -- aids in reproducibility efforts by allowing researchers to validate intermediate steps and improves the sustainability of research by allowing multiple groups to build off one another's prior computational work. Although there are de facto consensuses on how to share research code (through a git repository linked to from publications) and trained models (via HuggingFace Hub), there is no consensus for other types of artifacts, such as built indexes. Given the practical utility of using shared indexes, researchers have resorted to self-hosting these resources or performing ad hoc file transfers upon request, ultimately limiting the artifacts' discoverability and reuse. This demonstration introduces a flexible and interoperable way to share artifacts for Information Retrieval research, improving both their accessibility and usability.
- Abstract(参考訳): トレーニングされたモデル、事前構築されたインデックス、それらを使用するコードなどのアーティファクトの共有は、研究者が中間的なステップを検証することを可能にし、複数のグループが互いに以前の計算作業を構築できるようにすることで研究の持続性を向上させることで再現性の向上を支援する。
研究コードを(出版物からリンクされたgitリポジトリを通じて)共有する方法や(HuggingFace Hubを通じて)訓練されたモデルについて、事実上のコンセンサスがあるが、ビルトインデックスのような他の種類のアーティファクトに対してはコンセンサスがない。
共有インデックスの使用の実用性を考えると、研究者はこれらのリソースを自己ホストしたり、要求に応じてアドホックなファイル転送を行おうとしており、最終的にはアーティファクトの発見可能性と再利用を制限している。
このデモでは、情報検索研究のためのアーティファクトを共有するフレキシブルで相互運用可能な方法を導入し、アクセシビリティとユーザビリティの両方を改善した。
関連論文リスト
- PairDistill: Pairwise Relevance Distillation for Dense Retrieval [35.067998820937284]
本稿ではペアワイズレバレンス蒸留(Pairwise Relevance Distillation, PairDistill)を導入する。
類似した文書間の微妙な区別を提供し、密集した検索モデルの訓練を強化する。
実験の結果、PairDistillは既存の手法よりも優れており、複数のベンチマークで最新の結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-10-02T09:51:42Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Towards Multi-User Activity Recognition through Facilitated Training
Data and Deep Learning for Human-Robot Collaboration Applications [2.3274633659223545]
本研究では、シングルユーザに関するデータを収集し、後処理でそれらをマージすることで、マルチユーザアクティビティに関するデータを集める方法を提案する。
同じ設定で記録されたユーザのグループに関するトレーニングデータを使用する場合と比較して、この方法で収集されたデータをHRC設定のペアに使用し、同様のパフォーマンスを得ることができる。
論文 参考訳(メタデータ) (2023-02-11T19:27:07Z) - Retrieval Augmentation for Commonsense Reasoning: A Unified Approach [64.63071051375289]
検索強化コモンセンス推論(RACo)の統一的枠組みを提案する。
提案するRACoは,他の知識強化手法よりも優れる。
論文 参考訳(メタデータ) (2022-10-23T23:49:08Z) - Benchopt: Reproducible, efficient and collaborative optimization
benchmarks [67.29240500171532]
Benchoptは、機械学習で最適化ベンチマークを自動化、再生、公開するためのフレームワークである。
Benchoptは実験を実行、共有、拡張するための既製のツールを提供することで、コミュニティのベンチマークを簡単にする。
論文 参考訳(メタデータ) (2022-06-27T16:19:24Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - DRIFT: A Toolkit for Diachronic Analysis of Scientific Literature [0.7349727826230862]
DRIFTをオープンソースとして公開し、研究者が長年の研究動向と開発を追跡できるようにしました。
分析手法は、よく暗唱された研究成果と照合され、我々のいくつかの方法が良い測定のために追加されている。
本ツールの有用性と有効性を示すため,arXivリポジトリのcs.CLコーパスのケーススタディを行い,解析手法から推論を行う。
論文 参考訳(メタデータ) (2021-07-02T17:33:25Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。