論文の概要: Multi-convex Programming for Discrete Latent Factor Models Prototyping
- arxiv url: http://arxiv.org/abs/2504.01431v1
- Date: Wed, 02 Apr 2025 07:33:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:17:55.907831
- Title: Multi-convex Programming for Discrete Latent Factor Models Prototyping
- Title(参考訳): 離散遅延因子モデルプロトタイピングのためのマルチ凸プログラミング
- Authors: Hao Zhu, Shengchao Yan, Jasper Hoffmann, Joschka Boedecker,
- Abstract要約: 本稿では,CVXPYをベースとした汎用フレームワークを提案する。
我々のフレームワークはフレキシブルで、DLFMパラメータや潜在要因に対する正規化用語と制約の統合を本質的にサポートしています。
- 参考スコア(独自算出の注目度): 8.322623345761961
- License:
- Abstract: Discrete latent factor models (DLFMs) are widely used in various domains such as machine learning, economics, neuroscience, psychology, etc. Currently, fitting a DLFM to some dataset relies on a customized solver for individual models, which requires lots of effort to implement and is limited to the targeted specific instance of DLFMs. In this paper, we propose a generic framework based on CVXPY, which allows users to specify and solve the fitting problem of a wide range of DLFMs, including both regression and classification models, within a very short script. Our framework is flexible and inherently supports the integration of regularization terms and constraints on the DLFM parameters and latent factors, such that the users can easily prototype the DLFM structure according to their dataset and application scenario. We introduce our open-source Python implementation and illustrate the framework in several examples.
- Abstract(参考訳): 離散潜在因子モデル(DLFM)は、機械学習、経済学、神経科学、心理学など、様々な領域で広く使われている。
現在、DLFMをデータセットに適合させるには、個々のモデルのカスタマイズされたソルバに依存しており、実装には多くの労力が必要で、DLFMのターゲットとする特定のインスタンスに限られている。
本稿では,CVXPYをベースとした汎用フレームワークを提案する。このフレームワークでは,回帰モデルと分類モデルを含む幅広いDLFMの適合問題を,非常に短いスクリプトで特定し,解決することができる。
当社のフレームワークはフレキシブルで,DLFMパラメータや潜在要因に対する正規化用語や制約の統合を本質的にサポートしています。
オープンソースPythonの実装を紹介し、いくつかの例でフレームワークを説明します。
関連論文リスト
- Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - FDM-Bench: A Comprehensive Benchmark for Evaluating Large Language Models in Additive Manufacturing Tasks [2.473350840334717]
複雑なパラメータの管理とFused Deposition Modelingにおける印刷欠陥の解決は依然として困難である。
大きな言語モデル(LLM)は、FDMにおけるこれらの課題に対処する可能性を提供します。
FDM-Benchは、FDM固有のタスク上でLLMを評価するために設計されたベンチマークデータセットである。
論文 参考訳(メタデータ) (2024-12-13T03:16:14Z) - xGen-MM (BLIP-3): A Family of Open Large Multimodal Models [157.44696790158784]
本稿では,LMM(Large Multimodal Models)を開発するためのフレームワークであるxGen-MMを紹介する。
このフレームワークは、慎重にキュレートされたデータセット、トレーニングレシピ、モデルアーキテクチャ、結果のLMMスイートで構成されている。
私たちのモデルは、シングルイメージとマルチイメージのベンチマークを含む、さまざまなタスクにわたって厳格な評価を受けています。
論文 参考訳(メタデータ) (2024-08-16T17:57:01Z) - PARAFAC2-based Coupled Matrix and Tensor Factorizations with Constraints [1.0519027757362966]
AO(Alternating Optimization)とADMM(Alternating Direction Method of Multipliers)を用いたPARAFAC2ベースのCMTFモデルに適合するフレキシブルなアルゴリズムフレームワークを提案する。
様々なシミュレーションと実際のデータセットの実験は、提案したフレームワークの有用性と汎用性を示している。
論文 参考訳(メタデータ) (2024-06-18T07:05:31Z) - VANER: Leveraging Large Language Model for Versatile and Adaptive Biomedical Named Entity Recognition [3.4923338594757674]
大型言語モデル(LLM)は、様々な種類のエンティティを抽出できるモデルを訓練するために使用することができる。
本稿では,オープンソースのLLM LLaMA2をバックボーンモデルとして利用し,異なるタイプのエンティティとデータセットを区別するための具体的な命令を設計する。
我々のモデルVANERは、パラメータの小さな分割で訓練され、従来のLLMモデルよりも大幅に優れており、LLMをベースとしたモデルとして初めて、従来の最先端のBioNERシステムの大部分を上回りました。
論文 参考訳(メタデータ) (2024-04-27T09:00:39Z) - Model Composition for Multimodal Large Language Models [71.5729418523411]
本稿では,既存のMLLMのモデル構成による新しいパラダイムを提案する。
我々の基本的な実装であるNaiveMCは、モダリティエンコーダを再利用し、LLMパラメータをマージすることで、このパラダイムの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-20T06:38:10Z) - FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing [88.6654909354382]
本稿では,顔のアンチ・スプーフィングのためのフレキシブル・モーダル・ビジョン・トランス (FM-ViT) と呼ばれる,純粋なトランスフォーマーベースのフレームワークを提案する。
FM-ViTは、利用可能なマルチモーダルデータの助けを借りて、任意の単一モーダル(すなわちRGB)攻撃シナリオを柔軟にターゲットすることができる。
実験により、FM-ViTに基づいてトレーニングされた単一モデルは、異なるモーダルサンプルを柔軟に評価できるだけでなく、既存のシングルモーダルフレームワークよりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-05-05T04:28:48Z) - Optimal Event Monitoring through Internet Mashup over Multivariate Time
Series [77.34726150561087]
このフレームワークは、モデル定義、クエリ、パラメータ学習、モデル評価、データ監視、決定レコメンデーション、Webポータルのサービスをサポートする。
さらに、MTSAデータモデルとクエリ言語を拡張して、学習、監視、レコメンデーションのサービスにおいて、この種の問題をサポートする。
論文 参考訳(メタデータ) (2022-10-18T16:56:17Z) - Learning Structured Latent Factors from Dependent Data:A Generative
Model Framework from Information-Theoretic Perspective [18.88255368184596]
本稿では,潜在空間における様々な基盤構造を持つ生成モデル学習のための新しいフレームワークを提案する。
我々のモデルは、様々なタイプの望まれる構造を反映した意味論的に意味のある潜在因子の集合を学習するための原則化されたアプローチを提供する。
論文 参考訳(メタデータ) (2020-07-21T06:59:29Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。