論文の概要: The Landscape of Data Reuse in Interactive Information Retrieval: Motivations, Sources, and Evaluation of Reusability
- arxiv url: http://arxiv.org/abs/2411.15430v1
- Date: Sat, 23 Nov 2024 03:15:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:18:05.572962
- Title: The Landscape of Data Reuse in Interactive Information Retrieval: Motivations, Sources, and Evaluation of Reusability
- Title(参考訳): インタラクティブ情報検索におけるデータ再利用のランドスケープ:モチベーション,ソース,再利用性の評価
- Authors: Tianji Jiang, Wenqi Li, Jiqun Liu,
- Abstract要約: 本研究では,対話型情報検索(Interactive Information Retrieval:IIR)研究分野の経験者を対象に,データ再利用の実践について検討した。
我々は、データ再利用に関するモチベーション、経験、懸念について、人口統計学的背景、制度、キャリアの段階から、21の半構造化内面のインタビューを行った。
- 参考スコア(独自算出の注目度): 5.257245308437576
- License:
- Abstract: Sharing and reusing research data can effectively reduce redundant efforts in data collection and curation, especially for small labs and research teams conducting human-centered system research, and enhance the replicability of evaluation experiments. Building a sustainable data reuse process and culture relies on frameworks that encompass policies, standards, roles, and responsibilities, all of which must address the diverse needs of data providers, curators, and reusers. To advance the knowledge and accumulate empirical understandings on data reuse, this study investigated the data reuse practices of experienced researchers from the area of Interactive Information Retrieval (IIR) studies, where data reuse has been strongly advocated but still remains a challenge. To enhance the knowledge on data reuse behavior and reusability assessment strategies within IIR community, we conducted 21 semi-structured in-depth interviews with IIR researchers from varying demographic backgrounds, institutions, and stages of careers on their motivations, experiences, and concerns over data reuse. We uncovered the reasons, strategies of reusability assessments, and challenges faced by data reusers within the field of IIR as they attempt to reuse researcher data in their studies. The empirical finding improves our understanding of researchers' motivations for reusing data, their approaches to discovering reusable research data, as well as their concerns and criteria for assessing data reusability, and also enriches the on-going discussions on evaluating user-generated data and research resources and promoting community-level data reuse culture and standards.
- Abstract(参考訳): 研究データの共有と再利用は、特に人間中心のシステム研究を行う小さな研究室や研究チームにおいて、データ収集とキュレーションにおける余分な労力を効果的に削減し、評価実験の複製性を高めることができる。
持続可能なデータ再利用プロセスと文化の構築は、ポリシー、標準、役割、責任を含むフレームワークに依存している。
本研究は,データ再利用に関する知識の蓄積と経験的理解の蓄積を目的として,インタラクティブ情報検索(Interactive Information Retrieval:IIR)研究分野の経験者によるデータ再利用の実践について検討した。
IIRコミュニティにおけるデータ再利用行動と再利用可能性評価戦略の知識を高めるため、さまざまな人口統計学的背景、機関、キャリアの段階から21の半構造化内面のインタビューを行い、データ再利用に対する動機づけ、経験、懸念について検討した。
我々は, IIR分野における研究者データ再利用の理由, 再利用可能性評価の戦略, およびデータ再利用者による課題を明らかにした。
この経験的発見は、データ再利用に対する研究者の動機、再利用可能な研究データを発見するためのアプローチ、およびデータ再利用可能性を評価するための懸念と基準の理解を改善し、また、ユーザ生成データや研究資源の評価やコミュニティレベルのデータ再利用文化や標準の推進に関する議論を活発化させる。
関連論文リスト
- The State of Data Curation at NeurIPS: An Assessment of Dataset Development Practices in the Datasets and Benchmarks Track [1.5993707490601146]
この研究は、データキュレーションのレンズを通してNeurIPSにおけるデータセット開発プラクティスの分析を提供する。
本稿では,ルーブリックとツールキットからなるデータセットドキュメンテーションの評価フレームワークを提案する。
結果は、環境のフットプリント、倫理的考慮、データ管理に関するドキュメントの必要性がさらに高まっていることを示している。
論文 参考訳(メタデータ) (2024-10-29T19:07:50Z) - Synthetic Data Generation with Large Language Models for Personalized Community Question Answering [47.300506002171275]
既存のデータセットであるSE-PQAに基づいてSy-SE-PQAを構築します。
以上の結果から,LCMはユーザのニーズに合わせてデータを生成する可能性が高いことが示唆された。
合成データは、たとえ生成されたデータが誤った情報を含むとしても、人書きのトレーニングデータを置き換えることができる。
論文 参考訳(メタデータ) (2024-10-29T16:19:08Z) - Reproducibility Needs Reshape Scientific Data Governance [0.0]
データガバナンスは、研究ライフサイクル全体を通してデータの有用性を最大化するのを優先すべきである。
積極的な分析とデータガバナンスは、研究ライフサイクル管理の不可欠な、相互接続されたコンポーネントである。
論文 参考訳(メタデータ) (2024-09-29T22:13:19Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - ClimRetrieve: A Benchmarking Dataset for Information Retrieval from Corporate Climate Disclosures [3.348779089844034]
本研究は,持続可能性分析の典型的な課題を,気候に関する詳細な16の質問を含む30のサステナビリティレポートを用いてシミュレートする。
異なるレベルの関連性によってラベル付けされた8.5K以上のユニークな質問ソースと回答のペアを持つデータセットを得る。
本研究は,知識を組み込んだ情報検索における専門家の知識の統合を検討するために,データセットを用いたユースケースを開発する。
論文 参考訳(メタデータ) (2024-06-14T08:21:42Z) - Lazy Data Practices Harm Fairness Research [49.02318458244464]
本稿では,公正な機械学習データセットを包括的に分析し,不反射的手法がアルゴリズム的公正度発見の到達度と信頼性をいかに妨げているかを示す。
本分析では,(1)データと評価における特定の保護属性の表現のテクスブフラック,(2)データ前処理におけるマイノリティの広汎なテキストbf,(3)フェアネス研究の一般化を脅かすテキストbfopaqueデータ処理の3つの分野について検討した。
この研究は、公正なMLにおけるデータプラクティスの批判的な再評価の必要性を強調し、データセットのソーシングと使用の両方を改善するための指針を提供する。
論文 参考訳(メタデータ) (2024-04-26T09:51:24Z) - From Data Creator to Data Reuser: Distance Matters [0.847136673632881]
オープンサイエンスの政策は再利用よりもデータ共有に重点を置いている。
データ再利用の価値は、クリエータと再利用者の関係にあります。
我々は,データ作成者とデータ再使用者の間の距離の理論的構成を開発する。
論文 参考訳(メタデータ) (2024-02-05T18:16:04Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Subdivisions and Crossroads: Identifying Hidden Community Structures in
a Data Archive's Citation Network [1.6631602844999724]
本稿では学術出版物に引用されるデータセットの権威ネットワークのコミュニティ構造を解析する。
共有データを用いた社会科学データセットと研究分野のコミュニティを同定する。
本研究は、データ再利用の隠れ構造を明らかにし、学際的な研究コミュニティがデータセットを共有科学的なインプットとして構成する方法を実証する。
論文 参考訳(メタデータ) (2022-05-17T14:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。