論文の概要: Hybrid Autoencoders for Tabular Data: Leveraging Model-Based Augmentation in Low-Label Settings
- arxiv url: http://arxiv.org/abs/2511.06961v1
- Date: Mon, 10 Nov 2025 11:08:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.211921
- Title: Hybrid Autoencoders for Tabular Data: Leveraging Model-Based Augmentation in Low-Label Settings
- Title(参考訳): タブラルデータのためのハイブリッドオートエンコーダ:低ラベル設定におけるモデルベース拡張の活用
- Authors: Erel Naor, Ofir Lindenbaum,
- Abstract要約: 本稿では,ニューラルエンコーダと難解なソフト決定木(OSDT)エンコーダを組み合わせたハイブリッドオートエンコーダを提案する。
提案手法は,多種多様なデータセットにまたがる低ラベル分類と回帰において一貫した向上を実現し,深部および木に基づく教師付きベースラインを向上する。
- 参考スコア(独自算出の注目度): 13.591018807414484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks often under-perform on tabular data due to their sensitivity to irrelevant features and a spectral bias toward smooth, low-frequency functions. These limitations hinder their ability to capture the sharp, high-frequency signals that often define tabular structure, especially under limited labeled samples. While self-supervised learning (SSL) offers promise in such settings, it remains challenging in tabular domains due to the lack of effective data augmentations. We propose a hybrid autoencoder that combines a neural encoder with an oblivious soft decision tree (OSDT) encoder, each guided by its own stochastic gating network that performs sample-specific feature selection. Together, these structurally different encoders and model-specific gating networks implement model-based augmentation, producing complementary input views tailored to each architecture. The two encoders, trained with a shared decoder and cross-reconstruction loss, learn distinct yet aligned representations that reflect their respective inductive biases. During training, the OSDT encoder (robust to noise and effective at modeling localized, high-frequency structure) guides the neural encoder toward representations more aligned with tabular data. At inference, only the neural encoder is used, preserving flexibility and SSL compatibility. Spectral analysis highlights the distinct inductive biases of each encoder. Our method achieves consistent gains in low-label classification and regression across diverse tabular datasets, outperforming deep and tree-based supervised baselines.
- Abstract(参考訳): ディープニューラルネットワークは、無関係な特徴に対する感受性と、スムーズで低周波な機能に対するスペクトルバイアスにより、しばしば表層データに過小評価される。
これらの制限は、特に限られたラベル付きサンプルの下で、しばしば表構造を定義するシャープで高周波の信号を捕捉する能力を妨げている。
自己教師付き学習(SSL)はそのような設定で保証を提供するが、効果的なデータ拡張が欠如しているため、表形式のドメインでは依然として困難である。
本稿では,ニューラルエンコーダと難解なソフト決定木(OSDT)エンコーダを組み合わせるハイブリッドオートエンコーダを提案する。
これらの構造的に異なるエンコーダとモデル固有のゲーティングネットワークはモデルベースの拡張を実装し、それぞれのアーキテクチャに合わせて補完的な入力ビューを生成する。
2つのエンコーダは、共有デコーダとクロスコンストラクション損失で訓練され、それぞれの帰納バイアスを反映する異なるが整合した表現を学習する。
トレーニング中、OSDTエンコーダ(ノイズに悪影響し、ローカライズされた高周波構造をモデル化するのに効果的)は、ニューラルネットワークを表データとより整合した表現へと導く。
推論では、柔軟性とSSL互換性を保持するニューラルエンコーダのみが使用される。
スペクトル分析では、各エンコーダの異なる帰納バイアスが強調される。
本手法は,多種多様な表層データセットにまたがる低ラベル分類と回帰において一貫した向上を達成し,深部および木に基づく教師付きベースラインを上回った。
関連論文リスト
- Diffusion Autoencoders with Perceivers for Long, Irregular and Multimodal Astronomical Sequences [47.1547360356314]
パーシーバー付き拡散オートエンコーダ(deep)について紹介する。
daepは異種の測定をトークン化し、Perceiverエンコーダで圧縮し、Perceiver-IO拡散デコーダで再構成する。
様々な分光学的および測光的な天文学的なデータセットにわたって、ディープは低い再構成誤差を達成し、より差別的な潜在空間を生成し、より微細な構造を保存している。
論文 参考訳(メタデータ) (2025-10-23T14:21:01Z) - Locality-Aware Generalizable Implicit Neural Representation [54.93702310461174]
一般化可能な暗黙的ニューラル表現(INR)は、単一の連続関数が複数のデータインスタンスを表現することを可能にする。
本稿では、変換器エンコーダと局所性を考慮したINRデコーダを組み合わせた一般化可能なINRのための新しいフレームワークを提案する。
我々のフレームワークは、従来の一般化可能なINRよりも大幅に優れており、下流タスクにおける局所性を考慮した潜在能力の有効性を検証している。
論文 参考訳(メタデータ) (2023-10-09T11:26:58Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Latent Code-Based Fusion: A Volterra Neural Network Approach [21.25021807184103]
最近導入されたVolterra Neural Networks(VNN)を用いた深層構造エンコーダを提案する。
提案手法は,cnnベースのオートエンコーダに対して,より頑健な分類性能を持つサンプル複雑性を示す。
論文 参考訳(メタデータ) (2021-04-10T18:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。