論文の概要: An Empirical Study on Feature Discretization
- arxiv url: http://arxiv.org/abs/2004.12602v1
- Date: Mon, 27 Apr 2020 06:50:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 04:55:02.112013
- Title: An Empirical Study on Feature Discretization
- Title(参考訳): 特徴の離散化に関する実証的研究
- Authors: Qiang Liu and Zhaocheng Liu and Haoli Zhang
- Abstract要約: そこで我々はローカルリニアと呼ばれる新しい離散化手法を提案する。
2つの数値データセットの実験により、LLEはモデルパラメータをはるかに少なくして従来の離散化法より優れていることが示された。
- 参考スコア(独自算出の注目度): 8.900900745767869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When dealing with continuous numeric features, we usually adopt feature
discretization. In this work, to find the best way to conduct feature
discretization, we present some theoretical analysis, in which we focus on
analyzing correctness and robustness of feature discretization. Then, we
propose a novel discretization method called Local Linear Encoding (LLE).
Experiments on two numeric datasets show that, LLE can outperform conventional
discretization method with much fewer model parameters.
- Abstract(参考訳): 連続的な数値化を扱う場合、通常、特徴の離散化を採用する。
本研究では,特徴離散化を行う最善の方法を見つけるために,特徴離散化の正しさと堅牢性を分析することに焦点を当てた理論的解析を行う。
そこで我々はLLE(Local Linear Encoding)と呼ばれる新しい離散化手法を提案する。
2つの数値データセットに関する実験は、lleが従来の離散化法をはるかに少ないモデルパラメータで上回ることを示した。
関連論文リスト
- Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。
本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文 参考訳(メタデータ) (2024-05-18T15:59:41Z) - Convergence Analysis of Discrete Diffusion Model: Exact Implementation
through Uniformization [17.535229185525353]
連続マルコフ連鎖の均一化を利用したアルゴリズムを導入し、ランダムな時間点の遷移を実装した。
我々の結果は、$mathbbRd$における拡散モデルの最先端の成果と一致し、さらに$mathbbRd$設定と比較して離散拡散モデルの利点を浮き彫りにする。
論文 参考訳(メタデータ) (2024-02-12T22:26:52Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - Restoration-Degradation Beyond Linear Diffusions: A Non-Asymptotic
Analysis For DDIM-Type Samplers [90.45898746733397]
本研究では拡散生成モデルに用いる決定論的サンプリング器の非漸近解析のためのフレームワークを開発する。
確率フローODEに沿った1ステップは,1) 条件付き対数線上を無限に先行して上昇する回復ステップ,2) 雑音を現在の勾配に向けて前向きに進行する劣化ステップの2段階で表すことができる。
論文 参考訳(メタデータ) (2023-03-06T18:59:19Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Discrete-Continuous Smoothing and Mapping [8.90077503980675]
本稿では,ロボット工学の応用においてよく見られる離散連続因子グラフのクラスによるスムース化とマッピングに関する一般的なアプローチについて述べる。
我々は,因子グラフから離散連続モデルの設定まで,既存の最適化ツールであるDC-SAMを提供する。
論文 参考訳(メタデータ) (2022-04-25T19:31:44Z) - Measuring dissimilarity with diffeomorphism invariance [94.02751799024684]
DID(DID)は、幅広いデータ空間に適用可能なペアワイズな相似性尺度である。
我々は、DIDが理論的研究と実用に関係のある特性を享受していることを証明する。
論文 参考訳(メタデータ) (2022-02-11T13:51:30Z) - Binary Independent Component Analysis via Non-stationarity [7.283533791778359]
本稿では,バイナリデータの独立成分分析について考察する。
まず,線形混合モデルを連続値の潜在空間に仮定し,次に2値の観測モデルを仮定する。
連続値の場合とは対照的に、観測変数が少ないモデルの非識別性を証明する。
論文 参考訳(メタデータ) (2021-11-30T14:23:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。