論文の概要: Geometry-Aware Tabular Diffusion
- arxiv url: http://arxiv.org/abs/2606.02607v1
- Date: Sat, 23 May 2026 17:59:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-07 20:42:22.587344
- Title: Geometry-Aware Tabular Diffusion
- Title(参考訳): 幾何学的タブラル拡散
- Authors: David Turtora Zagardo,
- Abstract要約: タブラル合成は、プライバシー保護の共有と拡張に重要であるが、拡散モデルはカラム間の関係をキャプチャするための暗黙のメカニズムに依存している。
カラム値の差から計算した2つの角度と長さで表層拡散デノイザを拡大するGATD(Geometry-Aware Tabular Diffusion)を導入する。
我々のインスタンス化は、平均3.5倍のパラメータを使用しながら、最先端のベンチマーク性能を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tabular synthesis is critical for privacy-preserving sharing and augmentation, yet diffusion models rely on implicit mechanisms to capture inter-column relationships. We introduce Geometry-Aware Tabular Diffusion (GATD), which augments tabular diffusion denoisers with pairwise angles and lengths computed from column value differences and used as inputs and auxiliary targets. Our MLP instantiation achieves state-of-the-art benchmark performance while using 3.5x fewer parameters on average (up to 25x for classification tasks): on ten datasets, it wins 8/10 Shape, 7/10 Trend, and 9/10 downstream utility (F1/RMSE), reducing Shape and Trend error by 27% and 20%. Default loss weights transfer to GNN and Transformer denoisers, improving Shape on 27/30 and Trend on 25/30 architecture-dataset cells. A matched ablation shows supervision (not extra inputs or capacity) drives the gain. This shows explicit relational supervision is a portable inductive bias for tabular diffusion.
- Abstract(参考訳): タブラル合成は、プライバシー保護の共有と拡張に重要であるが、拡散モデルはカラム間の関係をキャプチャするための暗黙のメカニズムに依存している。
本稿では,一対の角度と長さを列値の差から計算し,入力や補助目標として用いる表層拡散デノイザを加味するGeometry-Aware Tabular Diffusion (GATD)を提案する。
MLPインスタンス化は、平均3.5倍のパラメータ(分類タスクの25倍)を使用しながら、最先端のベンチマーク性能を実現します。10のデータセットでは、8/10のシェープ、7/10のトレンド、9/10の下流ユーティリティ(F1/RMSE)を勝ち取り、形状とトレンドエラーを27%、20%削減します。
デフォルトの損失重量はGNNとTransformer Denoisersに転送され、27/30のShapeと25/30アーキテクチャデータセットのTrendが改善された。
マッチしたアブレーションは、監督(追加の入力やキャパシティではない)が利得を駆動することを示している。
これは、表層拡散に対する可搬的帰納的バイアスとして、明示的な関係性監督が示される。
関連論文リスト
- LimiX-2M: Mitigating Low-Rank Collapse and Attention Bottlenecks in Tabular Foundation Models [56.999481798138625]
LimiX-2Mは2Mパラメータモデルであり、広く使われているベンチマークでTabPFN-v2とTabICLのベースラインを上回っている。
本稿では,強力なタブラル基礎モデル(TFM)のための統一トークン化・ルートフレームワークを提案する。
その結果、TFMにおける精度-効率トレードオフを改善するキーレバーとして、バリューアウェアトークン化とリードアウト整列ルーティングが強調された。
論文 参考訳(メタデータ) (2026-06-03T06:07:33Z) - When Generative Augmentation Hurts: A Benchmark Study of GAN and Diffusion Models for Bias Correction in AI Classification Systems [0.6875312133832079]
生成モデルは、AIトレーニングパイプラインのクラス不均衡を補うために広く使用されている。
FastGAN拡張は、非常に低いトレーニングセットサイズで性能が劣るだけでなく、バイアスを積極的に増加させる。
低ランク適応による安定拡散は全体として最良の結果を得た。
論文 参考訳(メタデータ) (2026-03-17T05:37:17Z) - Decoupled Diffusion Sampling for Inverse Problems on Function Spaces [73.52103661482242]
既存のプラグ・アンド・プレイ拡散後サンプリングは係数ジョイント・ソリューション・モデリングを通じて物理を暗黙的に表現する。
逆PDE問題に対する関数空間における物理認識型生成フレームワークを提案する。
我々の解答拡散逆ソルバー(DDIS)は、非条件拡散が事前に係数を学習し、ニューラル演算子はガイダンスのためにフォワードPDEを明示的にモデル化する。
論文 参考訳(メタデータ) (2026-01-30T18:54:49Z) - LINA: Linear Autoregressive Image Generative Models with Continuous Tokens [56.80443965097921]
連続トークンを持つ自己回帰モデルは、特にテキスト・トゥ・イメージ(T2I)合成において、視覚生成に有望なパラダイムを形成する。
このフレームワーク内での計算効率のよい線形アテンションの設計法について検討する。
LINAは、線形注意に基づくシンプルで計算効率の良いT2Iモデルであり、ユーザ命令から高忠実度1024x1024画像を生成することができる。
論文 参考訳(メタデータ) (2026-01-30T06:44:33Z) - TensorLens: End-to-End Transformer Analysis via High-Order Attention Tensors [53.891337639229285]
高次アテンション・インタラクション接続を通して表現された入力依存線形演算子として変換器全体をキャプチャする新しい定式化である attentionLens を導入する。
本実験は,注目テンソルが,解釈可能性とモデル理解を目的としたツール開発のための強力な基盤となることを実証した。
論文 参考訳(メタデータ) (2026-01-25T19:21:25Z) - Latent Diffusion Inversion Requires Understanding the Latent Space [3.742113529511043]
エンコーダ/デコーダペアと対応する潜在符号は、潜在空間生成モデルに適用された反転技術によって無視されている。
拡散モデルは,高歪み領域にあるサンプルに過度に適合する傾向があり,非均一な暗記を示すことを示す。
そこで本研究では,デコーダのプルバック距離に対する1次元の寄与により,遅延次元をランク付けする原理的手法を提案する。
論文 参考訳(メタデータ) (2025-11-25T18:21:33Z) - Boosting Predictive Performance on Tabular Data through Data Augmentation with Latent-Space Flow-Based Diffusion [1.4035356761907611]
本稿では,マイノリティオーバサンプリングのための木駆動拡散法を提案する。
PCAForest、EmbedForest、AttentionForestの3つのバリエーションを紹介します。
最寄り距離比と最近距離記録によるプライバシー評価は、フォレスト拡散ベースラインと同等かそれ以上である。
論文 参考訳(メタデータ) (2025-11-20T17:28:32Z) - How Learnable Grids Recover Fine Detail in Low Dimensions: A Neural Tangent Kernel Analysis of Multigrid Parametric Encodings [106.3726679697804]
フーリエ特徴符号化(FFE)とマルチグリッドパラメトリック符号化(MPE)の2つの手法を比較した。
MPEは低次元マッピングの標準と見なされるが、MPEはそれらを上回り、高解像度で詳細な表現を学習することが多い。
我々は,MPEが学習可能な埋め込みではなく,グリッド構造を通じてネットワークの性能を向上させることを証明した。
論文 参考訳(メタデータ) (2025-04-18T02:18:08Z) - Tabular data generation with tensor contraction layers and transformers [0.35998666903987897]
テンソル縮退層と変圧器を用いて,データ生成に埋め込み表現を用いることの可能性を検討する。
OpenML CC18スイートの複数のデータセットを対象に実施した実証的研究では,密度推定モデルと機械学習効率指標を比較した。
この結果から得られた主な特徴は、テンソル収縮層の助けを借りて埋め込み表現を利用することで密度推定の指標が向上するが、機械学習効率の観点からは競合性能は維持できるということである。
論文 参考訳(メタデータ) (2024-12-06T19:34:13Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - DiffEnc: Variational Diffusion with a Learned Encoder [14.045374947755922]
拡散過程にデータと深度に依存した平均関数を導入し,拡散損失を改良した。
提案するフレームワークであるDiffEncは,CIFAR-10の確率を統計的に有意に向上させる。
論文 参考訳(メタデータ) (2023-10-30T17:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。