論文の概要: APS Explorer: Navigating Algorithm Performance Spaces for Informed Dataset Selection
- arxiv url: http://arxiv.org/abs/2508.19399v1
- Date: Tue, 26 Aug 2025 19:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.413694
- Title: APS Explorer: Navigating Algorithm Performance Spaces for Informed Dataset Selection
- Title(参考訳): APS Explorer: インフォームドデータセット選択のためのアルゴリズムパフォーマンス空間のナビゲート
- Authors: Tobias Vente, Michael Heep, Abdullah Abbas, Theodor Sperle, Joeran Beel, Bart Goethals,
- Abstract要約: ACM RecSys 2024論文の86%は、データセットの選択を正当化していない。
Amazon (38%)、MovieLens (34%)、Yelp (15%)、Gowalla (12%)の4つのデータセットに依存している。
- 参考スコア(独自算出の注目度): 0.046180371154032895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dataset selection is crucial for offline recommender system experiments, as mismatched data (e.g., sparse interaction scenarios require datasets with low user-item density) can lead to unreliable results. Yet, 86\% of ACM RecSys 2024 papers provide no justification for their dataset choices, with most relying on just four datasets: Amazon (38\%), MovieLens (34\%), Yelp (15\%), and Gowalla (12\%). While Algorithm Performance Spaces (APS) were proposed to guide dataset selection, their adoption has been limited due to the absence of an intuitive, interactive tool for APS exploration. Therefore, we introduce the APS Explorer, a web-based visualization tool for interactive APS exploration, enabling data-driven dataset selection. The APS Explorer provides three interactive features: (1) an interactive PCA plot showing dataset similarity via performance patterns, (2) a dynamic meta-feature table for dataset comparisons, and (3) a specialized visualization for pairwise algorithm performance.
- Abstract(参考訳): データセットの選択はオフラインのレコメンデータシステム実験にとって不可欠である。ミスマッチしたデータ(例えば、疎結合のシナリオでは、ユーザイテム密度の低いデータセットを必要とする)は信頼性の低い結果をもたらす可能性がある。
しかし、ACM RecSys 2024論文の86\%は、データセットの選択を正当化するものではない。ほとんどは、Amazon (38\%)、MovieLens (34\%)、Yelp (15\%)、Gowalla (12\%)の4つのデータセットに頼っている。
Algorithm Performance Spaces (APS) はデータセットの選択をガイドするために提案されているが、APS探索のための直感的でインタラクティブなツールがないため、採用は制限されている。
そこで我々は、データ駆動型データセット選択を可能にする対話型APS探索のためのWebベースの可視化ツールであるAPSエクスプローラーを紹介した。
APSエクスプローラーは、(1)パフォーマンスパターンによるデータセット類似性を示す対話型PCAプロット、(2)データセット比較のための動的メタ機能テーブル、(3)ペアワイズアルゴリズムのパフォーマンスを専門的に視覚化する3つのインタラクティブな特徴を提供する。
関連論文リスト
- COLLAGE: Adaptive Fusion-based Retrieval for Augmented Policy Learning [19.173177969412656]
数発の模倣学習において,COLLAGEはCOLLective Data AGgrEgationの手法である。
Collageは適応的なレイトフュージョン機構を使用して、複数のキューのタスク固有の組み合わせに基づいて、関連するデモの選択をガイドする。
コラージュは最先端の検索とマルチタスク学習の手法を10タスクで5.1%、現実世界では6タスクで16.6%上回っている。
論文 参考訳(メタデータ) (2025-08-02T01:23:09Z) - Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。
我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文 参考訳(メタデータ) (2025-05-07T11:37:23Z) - Group-Level Data Selection for Efficient Pretraining [49.18903821780051]
Group-MATESは、言語モデル事前訓練の速度品質フロンティアを最適化する効率的なグループレベルのデータ選択手法である。
Group-MATESは、リレーショナルデータの影響モデルを用いてコストの高いグループレベルの選択をパラメータ化する。
論文 参考訳(メタデータ) (2025-02-20T16:34:46Z) - TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.059907173437114]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。
提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文 参考訳(メタデータ) (2024-12-25T11:07:04Z) - UP-DP: Unsupervised Prompt Learning for Data Pre-Selection with
Vision-Language Models [24.50445616970387]
我々は、データ事前選択に視覚言語モデルを適用する、シンプルで効果的な教師なしのプロンプト学習手法UP-DPを導入する。
具体的には,BLIP-2パラメータを凍結することにより,テキストプロンプトをトレーニングして,表現性の向上による関節特徴の抽出を行う。
提案手法を,異なる設定の7つのベンチマークデータセットを用いて,最先端の手法と比較し,最大20%の性能向上を実現した。
論文 参考訳(メタデータ) (2023-07-20T20:45:13Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - DataLab: A Platform for Data Analysis and Intervention [96.75253335629534]
DataLabは統一されたデータ指向プラットフォームであり、ユーザはデータの特徴をインタラクティブに分析することができる。
ツールネームには、データセットレコメンデーションとグローバルビジョン分析のための機能がある。
これまでのところ、DataLabは1,715のデータセットと3,583の変換バージョンをカバーしている。
論文 参考訳(メタデータ) (2022-02-25T18:32:19Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。