論文の概要: HI-Series Algorithms A Hybrid of Substance Diffusion Algorithm and Collaborative Filtering
- arxiv url: http://arxiv.org/abs/2503.01305v1
- Date: Mon, 03 Mar 2025 08:43:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 18:50:37.89783
- Title: HI-Series Algorithms A Hybrid of Substance Diffusion Algorithm and Collaborative Filtering
- Title(参考訳): HI系列アルゴリズム - 物質拡散アルゴリズムと協調フィルタリングのハイブリッド-
- Authors: Yu Peng, Ya-Hui An,
- Abstract要約: 本稿では ItemCF と拡散に基づくアプローチを統合する HI-Series アルゴリズムを提案する。
MovieLens、Netflix、RYMデータセットの実験では、HIシリーズアルゴリズムがベースモデルよりも大幅に優れていることが示されている。
- 参考スコア(独自算出の注目度): 2.584380721735094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recommendation systems face the challenge of balancing accuracy and diversity, as traditional collaborative filtering (CF) and network-based diffusion algorithms exhibit complementary limitations. While item-based CF (ItemCF) enhances diversity through item similarity, it compromises accuracy. Conversely, mass diffusion (MD) algorithms prioritize accuracy by favoring popular items but lack diversity. To address this trade-off, we propose the HI-series algorithms, hybrid models integrating ItemCF with diffusion-based approaches (MD, HHP, BHC, BD) through a nonlinear combination controlled by parameter $\epsilon$. This hybridization leverages ItemCF's diversity and MD's accuracy, extending to advanced diffusion models (HI-HHP, HI-BHC, HI-BD) for enhanced performance. Experiments on MovieLens, Netflix, and RYM datasets demonstrate that HI-series algorithms significantly outperform their base counterparts. In sparse data ($20\%$ training), HI-MD achieves a $0.8\%$-$4.4\%$ improvement in F1-score over MD while maintaining higher diversity (Diversity@20: 459 vs. 396 on MovieLens). For dense data ($80\%$ training), HI-BD improves F1-score by $2.3\%$-$5.2\%$ compared to BD, with diversity gains up to $18.6\%$. Notably, hybrid models consistently enhance novelty in sparse settings and exhibit robust parameter adaptability. The results validate that strategic hybridization effectively breaks the accuracy-diversity trade-off, offering a flexible framework for optimizing recommendation systems across data sparsity levels.
- Abstract(参考訳): 従来の協調フィルタリング(CF)とネットワークベースの拡散アルゴリズムは相補的な制限を示すため、勧告システムは精度と多様性のバランスをとるという課題に直面している。
アイテムベースのCF(ItemCF)はアイテムの類似性を通じて多様性を高めるが、正確性を損なう。
逆に、大量拡散(MD)アルゴリズムは人気アイテムを優先して精度を優先するが、多様性は欠如している。
このトレードオフに対処するために、パラメータ$\epsilon$で制御される非線形結合によりItemCFと拡散に基づくアプローチ(MD, HHP, BHC, BD)を統合するハイブリッドモデルHI系列アルゴリズムを提案する。
このハイブリダイゼーションはItemCFの多様性とMDの精度を活用し、高度な拡散モデル(HI-HHP、HI-BHC、HI-BD)に拡張して性能を向上させる。
MovieLens、Netflix、RYMデータセットの実験では、HIシリーズアルゴリズムがベースモデルよりも大幅に優れていることが示されている。
sparse data (20 %$ training) では、HI-MD は F1-score を MD よりも高い多様性を維持しながら 0.8 %$-$4.4 %$ 改善している(Diversity@20: 459 vs. 396 on MovieLens)。
高密度データ(80 % のトレーニング)の場合、HI-BD は F1 スコアを 2.3 %$-5.2 %$ に改善し、ダイバーシティは 18.6 %$ まで上昇する。
特に、ハイブリッドモデルはスパース設定における新規性を一貫して強化し、堅牢なパラメータ適応性を示す。
その結果、戦略的ハイブリダイゼーションが精度と多様性のトレードオフを効果的に破り、データの分散レベルを越えてレコメンデーションシステムを最適化するためのフレキシブルなフレームワークを提供することがわかった。
関連論文リスト
- A Hybrid Mixture of $t$-Factor Analyzers for Clustering High-dimensional Data [0.07673339435080444]
本稿では,$t$-factor Analysisr (MtFA) の混合モデルを推定するための新しいハイブリッド手法を開発する。
提案手法の有効性は,従来の手法と比較して計算効率が優れていることを示すシミュレーションによって実証される。
本手法はガンマ線バーストのクラスタリングに応用され,ガンマ線バーストが不均質なサブ集団を持つという文献のいくつかの主張を補強し,推定群の特徴を与える。
論文 参考訳(メタデータ) (2025-04-29T18:59:58Z) - Combatting Dimensional Collapse in LLM Pre-Training Data via Diversified File Selection [65.96556073745197]
DiverSified File selection algorithm (DiSF) は特徴空間における最も非相関なテキストファイルを選択するために提案される。
DiSFは590万のトレーニングファイルの98.5%をSlimPajamaに保存し、50Bのトレーニング予算内でのデータ事前トレーニングを上回っている。
論文 参考訳(メタデータ) (2025-04-29T11:13:18Z) - Multi-modal Iterative and Deep Fusion Frameworks for Enhanced Passive DOA Sensing via a Green Massive H2AD MIMO Receiver [28.483741082998446]
グリーンマルチモーダル(MM)融合DOAフレームワークは,より実用的で低コストで高時間効率なDOA推定を実現するために提案されている。
より効率的なクラスタリング手法として, GMaxCS(Global maximum cos_similarity clustering)とGMinD(Global minimum distance clustering)がある。
論文 参考訳(メタデータ) (2024-11-11T12:32:18Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Decoding-Time Language Model Alignment with Multiple Objectives [116.42095026960598]
既存の手法は主に、1つの報酬関数に対してLMを最適化することに集中し、それらの適応性は様々な目的に制限される。
本稿では,予測の線形結合から次のトークンを出力する復号時間アルゴリズムである$textbfmulti-objective decoding (MOD)$を提案する。
提案手法は, 自然条件下であっても, 既存のアプローチが準最適であることを示すとともに, 提案手法の最適性を保証する。
論文 参考訳(メタデータ) (2024-06-27T02:46:30Z) - Efficient Integrators for Diffusion Generative Models [22.01769257075573]
拡散モデルは、推論時に遅いサンプル生成に悩まされる。
事前学習モデルにおけるサンプル生成を高速化するための2つの補完的フレームワークを提案する。
本稿では,拡張空間における拡散モデルにおける最良報告性能を実現するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T21:04:42Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - FIXED: Frustratingly Easy Domain Generalization with Mixup [53.782029033068675]
ドメイン一般化(Domain Generalization, DG)は、複数のトレーニングドメインから一般化可能なモデルを学ぶことを目的としている。
一般的な戦略は、Mixupcitezhang 2018mixupのようなメソッドによる一般化のためにトレーニングデータを拡張することである。
我々は、MixupベースのDG、すなわちドメイン不変の特徴mIXup(FIX)の簡易かつ効果的な拡張を提案する。
提案手法は,9つの最先端手法よりも優れており,試験精度の面では,ベースラインの平均6.5%を上回っている。
論文 参考訳(メタデータ) (2022-11-07T09:38:34Z) - Harnessing Hard Mixed Samples with Decoupled Regularizer [69.98746081734441]
Mixupは、決定境界を混合データで滑らかにすることで、ニューラルネットワークの一般化を改善する効率的なデータ拡張アプローチである。
本稿では,非結合型正規化器(Decoupled Mixup, DM)を用いた効率的な混合目標関数を提案する。
DMは、ミキシングの本来の滑らかさを損なうことなく、硬質混合試料を適応的に利用して識別特性をマイニングすることができる。
論文 参考訳(メタデータ) (2022-03-21T07:12:18Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - Genetic CFL: Optimization of Hyper-Parameters in Clustered Federated
Learning [4.710427287359642]
Federated Learning(FL)は、クライアントサーバアーキテクチャ、エッジコンピューティング、リアルタイムインテリジェンスを統合した、ディープラーニングのための分散モデルである。
FLは機械学習(ML)に革命を起こす能力を持っているが、技術的制限、通信オーバーヘッド、非IID(独立で同一の分散データ)、プライバシー上の懸念による実装の実践性に欠ける。
本稿では,遺伝的クラスタ化FL(Genetic CFL)と呼ばれるハイブリッドアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-15T10:16:05Z) - Hybrid Federated Learning: Algorithms and Implementation [61.0640216394349]
Federated Learning(FL)は、分散データセットとプライベートデータセットを扱う分散機械学習パラダイムである。
ハイブリッドFLのためのモデルマッチングに基づく新しい問題定式化を提案する。
次に,グローバルモデルとローカルモデルを協調して学習し,完全かつ部分的な特徴量を扱う効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-22T23:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。