論文の概要: Deep Learning within Tabular Data: Foundations, Challenges, Advances and Future Directions
- arxiv url: http://arxiv.org/abs/2501.03540v1
- Date: Tue, 07 Jan 2025 05:23:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:50:25.800000
- Title: Deep Learning within Tabular Data: Foundations, Challenges, Advances and Future Directions
- Title(参考訳): タブラルデータにおけるディープラーニング - 基礎,課題,進歩,今後の方向性
- Authors: Weijieying Ren, Tianxiang Zhao, Yuqing Huang, Vasant Honavar,
- Abstract要約: タブラルデータはまだ、さまざまな現実世界のアプリケーションで広く使われているデータタイプのひとつだ。
しかし、この領域の効果的な表現学習は、不規則なパターン、不均一な特徴分布、複雑なカラム間の依存関係など、ユニークな課題を生んでいる。
- 参考スコア(独自算出の注目度): 4.795774784702568
- License:
- Abstract: Tabular data remains one of the most prevalent data types across a wide range of real-world applications, yet effective representation learning for this domain poses unique challenges due to its irregular patterns, heterogeneous feature distributions, and complex inter-column dependencies. This survey provides a comprehensive review of state-of-the-art techniques in tabular data representation learning, structured around three foundational design elements: training data, neural architectures, and learning objectives. Unlike prior surveys that focus primarily on either architecture design or learning strategies, we adopt a holistic perspective that emphasizes the universality and robustness of representation learning methods across diverse downstream tasks. We examine recent advances in data augmentation and generation, specialized neural network architectures tailored to tabular data, and innovative learning objectives that enhance representation quality. Additionally, we highlight the growing influence of self-supervised learning and the adaptation of transformer-based foundation models for tabular data. Our review is based on a systematic literature search using rigorous inclusion criteria, encompassing 127 papers published since 2020 in top-tier conferences and journals. Through detailed analysis and comparison, we identify emerging trends, critical gaps, and promising directions for future research, aiming to guide the development of more generalizable and effective tabular data representation methods.
- Abstract(参考訳): タブラルデータはこの領域における効果的な表現学習は、不規則なパターン、不均一な特徴分布、複雑なカラム間の依存関係など、ユニークな課題を生んでいる。
この調査は、トレーニングデータ、ニューラルアーキテクチャ、学習目標の3つの基本設計要素を中心に構築された、表形式のデータ表現学習における最先端技術に関する包括的なレビューを提供する。
アーキテクチャ設計や学習戦略に重点を置く以前の調査とは異なり、さまざまな下流タスクにおける表現学習手法の普遍性と堅牢性を強調する全体論的な視点を採用する。
データ拡張と生成の最近の進歩、表型データに適した特殊なニューラルネットワークアーキテクチャ、表現品質を高める革新的な学習目標について検討する。
さらに、自己教師型学習の影響の増大と、表データに対するトランスフォーマーベース基礎モデルの適応を強調した。
本稿は,厳格な包括的基準を用いた体系的な文献検索に基づいて,2020年以降の117の論文をトップレベルの会議や雑誌に掲載した。
より詳細な分析と比較を通じて、より一般化可能で効果的な表型データ表現法の開発を導くことを目的として、今後の研究に向けた新たなトレンド、批判的ギャップ、有望な方向性を特定する。
関連論文リスト
- A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective [23.25829868360603]
タブラルデータ(Tabular data)は、バイオインフォマティクス、医療、マーケティングなど、さまざまな領域で広く使われているデータフォーマットの1つである。
本調査では,データ空間を精製するための基本技術として,強化学習(RL)と特徴選択と特徴生成のための生成的アプローチについて検討する。
我々は,既存の課題を要約し,今後の研究の方向性について論じ,この分野の継続的なイノベーションを促進する洞察を提供することを目的とする。
論文 参考訳(メタデータ) (2025-02-12T22:34:50Z) - Towards Data-Centric AI: A Comprehensive Survey of Traditional, Reinforcement, and Generative Approaches for Tabular Data Transformation [37.43210238341124]
この調査では、データ空間の洗練に欠かせない技術として、特徴選択と特徴生成を強調し、データ中心型AIの重要な側面について検討する。
本稿では、最も関連性の高いデータ属性を識別・保持する機能選択手法の体系的なレビューと、複雑なデータパターンのキャプチャーを容易にする新機能を作成する機能生成アプローチについて述べる。
論文 参考訳(メタデータ) (2025-01-17T21:05:09Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Learning Representations without Compositional Assumptions [79.12273403390311]
本稿では,特徴集合をグラフノードとして表現し,それらの関係を学習可能なエッジとして表現することで,特徴集合の依存関係を学習するデータ駆動型アプローチを提案する。
また,複数のビューから情報を動的に集約するために,より小さな潜在グラフを学習する新しい階層グラフオートエンコーダLEGATOを導入する。
論文 参考訳(メタデータ) (2023-05-31T10:36:10Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Deep Neural Networks and Tabular Data: A Survey [6.940394595795544]
この研究は、表形式のデータに対する最先端のディープラーニング手法の概要を提供する。
データ変換、特殊なアーキテクチャ、正規化モデルという3つのグループに分類することから始めます。
次に、各グループの主なアプローチについて概観する。
論文 参考訳(メタデータ) (2021-10-05T09:22:39Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。