論文の概要: Table2Image: Interpretable Tabular data Classification with Realistic Image Transformations
- arxiv url: http://arxiv.org/abs/2412.06265v1
- Date: Mon, 09 Dec 2024 07:24:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:53:49.801110
- Title: Table2Image: Interpretable Tabular data Classification with Realistic Image Transformations
- Title(参考訳): Table2 Image: Realistic Image Transformationsを用いた解釈可能なタブラリデータ分類
- Authors: Seungeun Lee, Seungsang Oh,
- Abstract要約: 本稿では,表形式のデータをリアルな画像表現に変換するための解釈可能なフレームワークであるTable2Imageを紹介する。
ベンチマークデータセットの実験では、競合する分類精度、曲線下領域(AUC)、解釈可能性の改善、スケーラブルで信頼性の高いソリューションが示されている。
- 参考スコア(独自算出の注目度): 1.7034813545878589
- License:
- Abstract: Recent advancements in deep learning for tabular data have demonstrated promising performance, yet interpretable models remain limited, with many relying on complex and large-scale architectures. This paper introduces Table2Image, an interpretable framework that transforms tabular data into realistic image representations for classification, achieving competitive performance with relatively lightweight models. Additionally, we propose variance inflation factor (VIF) initialization, which reflects the statistical properties of the data, and a novel interpretability framework that integrates insights from both the original tabular data and its image transformations. By leveraging Shapley additive explanations (SHAP) with methods to minimize distributional discrepancies, our approach combines tabular and image-based representations. Experiments on benchmark datasets showcase competitive classification accuracy, area under the curve (AUC), and improved interpretability, offering a scalable and reliable solution. Our code is available at https://github.com/duneag2/table2image.
- Abstract(参考訳): 表形式のデータに対するディープラーニングの最近の進歩は、有望な性能を示しているが、解釈可能なモデルはまだ限られており、その多くは複雑で大規模なアーキテクチャに依存している。
本稿では,表形式のデータを分類のためのリアルな画像表現に変換するための解釈可能なフレームワークであるTable2Imageを紹介し,比較的軽量なモデルとの競合性能を実現する。
さらに、データの統計的特性を反映した分散インフレーション係数(VIF)の初期化と、元の表データと画像変換の両方からの洞察を統合する新しい解釈可能性フレームワークを提案する。
分布の相違を最小限に抑える手法としてShapley additive explanations (SHAP) を利用することにより,本手法は表と画像に基づく表現を組み合わせる。
ベンチマークデータセットの実験では、競合する分類精度、曲線下領域(AUC)、解釈可能性の改善、スケーラブルで信頼性の高いソリューションが示されている。
私たちのコードはhttps://github.com/duneag2/table2image.comから入手可能です。
関連論文リスト
- Tab2Visual: Overcoming Limited Data in Tabular Data Classification Using Deep Learning with Visual Representations [0.09999629695552192]
異種表データを視覚表現に変換する新しい手法であるTab2Visualを提案する。
提案手法を多種多様なデータセットに対して広範囲に評価し,その性能を幅広い機械学習アルゴリズムと比較した。
論文 参考訳(メタデータ) (2025-02-11T02:12:29Z) - TabDPT: Scaling Tabular Foundation Models [20.00390825519329]
実データによる性能向上と一般化の方法を示す。
本モデルでは,CC18(分類)およびCTR23(回帰)ベンチマークの最先端性能を実現する。
TabDPTはまた、モデルのサイズと利用可能なデータの量の両方が増加するにつれて、強力なスケーリングを示す。
論文 参考訳(メタデータ) (2024-10-23T18:00:00Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - Flow Factorized Representation Learning [109.51947536586677]
本稿では、異なる入力変換を定義する潜在確率パスの別個のセットを規定する生成モデルを提案する。
本モデルは,ほぼ同変モデルに近づきながら,標準表現学習ベンチマークにおいて高い確率を達成することを示す。
論文 参考訳(メタデータ) (2023-09-22T20:15:37Z) - Continual Vision-Language Representation Learning with Off-Diagonal
Information [112.39419069447902]
CLIPのようなマルチモーダルなコントラスト学習フレームワークは通常、トレーニングに大量の画像テキストサンプルを必要とする。
本稿では,ストリーミングデータを用いた連続CLIPトレーニングの実現可能性について論じる。
論文 参考訳(メタデータ) (2023-05-11T08:04:46Z) - PTab: Using the Pre-trained Language Model for Modeling Tabular Data [5.791972449406902]
近年の研究では、ニューラルネットワークモデルがタブラルデータの文脈表現の学習に有効であることが示されている。
本稿では,事前学習言語モデルを用いて,タブラルデータをモデル化する新しいフレームワークPTabを提案する。
提案手法は,最先端のベースラインに比べて,教師付き設定における平均AUCスコアが向上した。
論文 参考訳(メタデータ) (2022-09-15T08:58:42Z) - Robust Cross-Modal Representation Learning with Progressive
Self-Distillation [7.676408770854477]
CLIPの視覚言語アプローチの学習目的は、Webハーベスト画像キャプションデータセットに見られるノイズの多い多対多対応を効果的に考慮していない。
本研究では、進行的な自己蒸留とソフトな画像テキストアライメントを用いて、雑音の多いデータから頑健な表現をより効率的に学習するクロスモーダルコントラスト学習に基づく新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-10T03:28:18Z) - Lightweight Data Fusion with Conjugate Mappings [11.760099863897835]
本稿では,構造化確率的グラフィカルモデルの解釈可能性とニューラルネットワークの柔軟性を組み合わせたデータ融合手法を提案する。
提案手法は,2種類の情報を用いた遅延変数の後方解析を重視した軽量データ融合(LDF)である。
論文 参考訳(メタデータ) (2020-11-20T19:47:13Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。