論文の概要: Table2Image: Interpretable Tabular Data Classification with Realistic Image Transformations
- arxiv url: http://arxiv.org/abs/2412.06265v2
- Date: Thu, 23 Jan 2025 06:59:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-24 15:56:08.662306
- Title: Table2Image: Interpretable Tabular Data Classification with Realistic Image Transformations
- Title(参考訳): Table2 Image: Realistic Image Transformationsを用いた解釈可能なタブラリデータ分類
- Authors: Seungeun Lee, Il-Youp Kwak, Kihwan Lee, Subin Bae, Sangjun Lee, Seulbin Lee, Seungsang Oh,
- Abstract要約: 本稿では,表形式のデータをリアルかつ多様な画像表現に変換する新しいフレームワークであるTable2Imageを紹介する。
また、元のデータとその変換された画像表現からの洞察を統合する、解釈可能性フレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.62508658491325
- License:
- Abstract: Recent advancements in deep learning for tabular data have shown promise, but challenges remain in achieving interpretable and lightweight models. This paper introduces Table2Image, a novel framework that transforms tabular data into realistic and diverse image representations, enabling deep learning methods to achieve competitive classification performance. To address multicollinearity in tabular data, we propose a variance inflation factor (VIF) initialization, which enhances model stability and robustness by incorporating statistical feature relationships. Additionally, we present an interpretability framework that integrates insights from both the original tabular data and its transformed image representations, by leveraging Shapley additive explanations (SHAP) and methods to minimize distributional discrepancies. Experiments on benchmark datasets demonstrate the efficacy of our approach, achieving superior accuracy, area under the curve, and interpretability compared to recent leading deep learning models. Our lightweight method provides a scalable and reliable solution for tabular data classification.
- Abstract(参考訳): 表形式のデータに対するディープラーニングの進歩は、将来性を示しているが、解釈可能で軽量なモデルを実現する上ではまだ課題が残っている。
本稿では,表形式のデータをリアルかつ多様な画像表現に変換する新しいフレームワークであるTable2Imageを紹介する。
本稿では,統計的特徴関係を組み込んだモデル安定性とロバスト性を向上させる分散インフレーション係数(VIF)の初期化を提案する。
さらに、Shapley加法的説明(SHAP)と分散の相違を最小化する手法を利用して、元の表データと変換された画像表現の両方からの洞察を統合する解釈可能性フレームワークを提案する。
ベンチマークデータセットを用いた実験は、我々のアプローチの有効性を示し、精度、曲線下の面積、そして最近の先進的なディープラーニングモデルと比較して解釈可能性を実現している。
我々の軽量な手法は、表データの分類にスケーラブルで信頼性の高いソリューションを提供する。
関連論文リスト
- Tab2Visual: Overcoming Limited Data in Tabular Data Classification Using Deep Learning with Visual Representations [0.09999629695552192]
異種表データを視覚表現に変換する新しい手法であるTab2Visualを提案する。
提案手法を多種多様なデータセットに対して広範囲に評価し,その性能を幅広い機械学習アルゴリズムと比較した。
論文 参考訳(メタデータ) (2025-02-11T02:12:29Z) - TabDPT: Scaling Tabular Foundation Models [20.00390825519329]
実データによる性能向上と一般化の方法を示す。
本モデルでは,CC18(分類)およびCTR23(回帰)ベンチマークの最先端性能を実現する。
TabDPTはまた、モデルのサイズと利用可能なデータの量の両方が増加するにつれて、強力なスケーリングを示す。
論文 参考訳(メタデータ) (2024-10-23T18:00:00Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - Flow Factorized Representation Learning [109.51947536586677]
本稿では、異なる入力変換を定義する潜在確率パスの別個のセットを規定する生成モデルを提案する。
本モデルは,ほぼ同変モデルに近づきながら,標準表現学習ベンチマークにおいて高い確率を達成することを示す。
論文 参考訳(メタデータ) (2023-09-22T20:15:37Z) - Continual Vision-Language Representation Learning with Off-Diagonal
Information [112.39419069447902]
CLIPのようなマルチモーダルなコントラスト学習フレームワークは通常、トレーニングに大量の画像テキストサンプルを必要とする。
本稿では,ストリーミングデータを用いた連続CLIPトレーニングの実現可能性について論じる。
論文 参考訳(メタデータ) (2023-05-11T08:04:46Z) - PTab: Using the Pre-trained Language Model for Modeling Tabular Data [5.791972449406902]
近年の研究では、ニューラルネットワークモデルがタブラルデータの文脈表現の学習に有効であることが示されている。
本稿では,事前学習言語モデルを用いて,タブラルデータをモデル化する新しいフレームワークPTabを提案する。
提案手法は,最先端のベースラインに比べて,教師付き設定における平均AUCスコアが向上した。
論文 参考訳(メタデータ) (2022-09-15T08:58:42Z) - Robust Cross-Modal Representation Learning with Progressive
Self-Distillation [7.676408770854477]
CLIPの視覚言語アプローチの学習目的は、Webハーベスト画像キャプションデータセットに見られるノイズの多い多対多対応を効果的に考慮していない。
本研究では、進行的な自己蒸留とソフトな画像テキストアライメントを用いて、雑音の多いデータから頑健な表現をより効率的に学習するクロスモーダルコントラスト学習に基づく新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-10T03:28:18Z) - Lightweight Data Fusion with Conjugate Mappings [11.760099863897835]
本稿では,構造化確率的グラフィカルモデルの解釈可能性とニューラルネットワークの柔軟性を組み合わせたデータ融合手法を提案する。
提案手法は,2種類の情報を用いた遅延変数の後方解析を重視した軽量データ融合(LDF)である。
論文 参考訳(メタデータ) (2020-11-20T19:47:13Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。