論文の概要: Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch
- arxiv url: http://arxiv.org/abs/2505.09364v1
- Date: Wed, 14 May 2025 13:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.465447
- Title: Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch
- Title(参考訳): 拡散レコメンダモデルと進行のイライラ:再現性と概念ミスマッチに関する考察
- Authors: Michael Benigni, Maurizio Ferrari Dacrema, Dietmar Jannach,
- Abstract要約: 我々は,最新のデノイング拡散確率モデルを推薦システムに適用することによって報告された最新の進歩を再現する。
本研究は, 持続的な方法論的問題を明らかにすることを目的としている。
拡散モデルの特徴と従来のエンフェップ-nレコメンデーションタスクとの主なミスマッチを同定する。
- 参考スコア(独自算出の注目度): 12.339884639594626
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Countless new machine learning models are published every year and are reported to significantly advance the state-of-the-art in \emph{top-n} recommendation. However, earlier reproducibility studies indicate that progress in this area may be quite limited. Specifically, various widespread methodological issues, e.g., comparisons with untuned baseline models, have led to an \emph{illusion of progress}. In this work, our goal is to examine whether these problems persist in today's research. To this end, we aim to reproduce the latest advancements reported from applying modern Denoising Diffusion Probabilistic Models to recommender systems, focusing on four models published at the top-ranked SIGIR conference in 2023 and 2024. Our findings are concerning, revealing persistent methodological problems. Alarmingly, through experiments, we find that the latest recommendation techniques based on diffusion models, despite their computational complexity and substantial carbon footprint, are consistently outperformed by simpler existing models. Furthermore, we identify key mismatches between the characteristics of diffusion models and those of the traditional \emph{top-n} recommendation task, raising doubts about their suitability for recommendation. We also note that, in the papers we analyze, the generative capabilities of these models are constrained to a minimum. Overall, our results and continued methodological issues call for greater scientific rigor and a disruptive change in the research and publication culture in this area.
- Abstract(参考訳): 多数の新しい機械学習モデルが毎年発行され、 \emph{top-n}レコメンデーションの最先端を著しく前進させると報告されている。
しかし、初期の再現性の研究は、この地域の進歩が非常に限られていることを示している。
特に、修正されていないベースラインモデルとの比較など、様々な方法論上の問題により、進歩のemph{illusion of progress}が導かれた。
本研究の目的は,今日の研究において,これらの問題が継続するかどうかを検討することである。
この目的は,2023年と2024年のSIGIRカンファレンスで発表された4つのモデルに着目し,最新のデノイング拡散確率モデルを適用した最新の進歩をレコメンデーションシステムに適用することである。
本研究は, 持続的な方法論的問題を明らかにすることを目的としている。
実験を通じて、計算複雑性と炭素フットプリントがかなり大きいにもかかわらず、拡散モデルに基づく最新の推奨技術は、より単純な既存モデルによって一貫して上回っていることがわかった。
さらに,拡散モデルの特徴と従来のemph{top-n}レコメンデーションタスクとの主なミスマッチを同定し,それらのレコメンデーションに対する適合性に疑問を呈する。
また、分析した論文では、これらのモデルの生成能力は最小限に制限されていることに留意する。
本研究の結果と今後の方法論的課題は,この領域の科学的厳密さと研究・出版文化の破壊的な変化を訴えるものである。
関連論文リスト
- Diffusion Model Quantization: A Review [36.22019054372206]
近年の大規模テキスト・画像モデルの成功は、生成タスクにおける拡散モデルの例外的な性能を裏付けている。
拡散モデル量子化は、圧縮と加速の双方にとって重要な手法である。
論文 参考訳(メタデータ) (2025-05-08T13:09:34Z) - A Worrying Reproducibility Study of Intent-Aware Recommendation Models [12.339884639594626]
我々は、トップレベルのアウトレットで発行された5つの現代IARSモデルを再現しようと試みている。
従来の非神経レコメンデーションモデルと比較した。
さらに悪いことに、検討されたすべてのIARSアプローチは、少なくとも1つの伝統的なモデルによって一貫して性能が向上していることがわかった。
論文 参考訳(メタデータ) (2025-01-17T12:11:46Z) - Alignment of Diffusion Models: Fundamentals, Challenges, and Future [28.64041196069495]
拡散モデルは生成モデルの主要なパラダイムとして登場し、様々な応用に優れています。
彼らの成功にもかかわらず、これらのモデルは、しばしば人間の意図に反し、テキストのプロンプトと一致しない、あるいは望ましい特性を持たない出力を生成する。
大規模言語モデルの調整におけるアライメントの成功に触発された最近の研究は、人間の期待や嗜好と拡散モデルの整合性について研究している。
論文 参考訳(メタデータ) (2024-09-11T13:21:32Z) - Diffusion Models in Low-Level Vision: A Survey [82.77962165415153]
拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文 参考訳(メタデータ) (2024-06-17T01:49:27Z) - Predictive Churn with the Set of Good Models [61.00058053669447]
本稿では,予測的不整合という2つの無関係な概念の関連性について考察する。
予測多重性(英: predictive multiplicity)は、個々のサンプルに対して矛盾する予測を生成するモデルである。
2つ目の概念である予測チャーン(英: predictive churn)は、モデル更新前後の個々の予測の違いを調べるものである。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Demystifying Variational Diffusion Models [23.601173340762074]
我々は、有向なグラフィカルモデリングと変分ベイズ原理を用いた拡散モデルについて、より簡単に紹介する。
我々の展示は、深い潜伏変数モデルのような基本的な概念から、連続時間拡散に基づくモデリングの最近の進歩まで、包括的な技術的レビューを構成する。
我々は、新しい表記の導入を避けつつ、理解を助けるために、可能な限り精巧な作品で省略された追加の数学的洞察を提供する。
論文 参考訳(メタデータ) (2024-01-11T22:37:37Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。