論文の概要: Deep Neural Networks and Tabular Data: A Survey
- arxiv url: http://arxiv.org/abs/2110.01889v1
- Date: Tue, 5 Oct 2021 09:22:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 14:06:57.784369
- Title: Deep Neural Networks and Tabular Data: A Survey
- Title(参考訳): 深層ニューラルネットワークと表データ:調査
- Authors: Vadim Borisov, Tobias Leemann, Kathrin Se{\ss}ler, Johannes Haug,
Martin Pawelczyk, Gjergji Kasneci
- Abstract要約: この研究は、表形式のデータに対する最先端のディープラーニング手法の概要を提供する。
データ変換、特殊なアーキテクチャ、正規化モデルという3つのグループに分類することから始めます。
次に、各グループの主なアプローチについて概観する。
- 参考スコア(独自算出の注目度): 6.940394595795544
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Heterogeneous tabular data are the most commonly used form of data and are
essential for numerous critical and computationally demanding applications. On
homogeneous data sets, deep neural networks have repeatedly shown excellent
performance and have therefore been widely adopted. However, their application
to modeling tabular data (inference or generation) remains highly challenging.
This work provides an overview of state-of-the-art deep learning methods for
tabular data. We start by categorizing them into three groups: data
transformations, specialized architectures, and regularization models. We then
provide a comprehensive overview of the main approaches in each group. A
discussion of deep learning approaches for generating tabular data is
complemented by strategies for explaining deep models on tabular data. Our
primary contribution is to address the main research streams and existing
methodologies in this area, while highlighting relevant challenges and open
research questions. To the best of our knowledge, this is the first in-depth
look at deep learning approaches for tabular data. This work can serve as a
valuable starting point and guide for researchers and practitioners interested
in deep learning with tabular data.
- Abstract(参考訳): 不均一な表型データは最も一般的に使用されるデータ形式であり、多くの臨界および計算に要求されるアプリケーションに必須である。
均一データセットでは、ディープニューラルネットワークは繰り返し優れた性能を示しており、広く採用されている。
しかし、表データ(推論や生成)のモデリングへの応用は依然として非常に難しい。
本研究は,表データに対する最先端のディープラーニング手法の概要を提供する。
データ変換、特殊なアーキテクチャ、正規化モデルという3つのグループに分類することから始めます。
次に、各グループにおける主要なアプローチの概要を説明します。
表型データを生成するための深層学習手法に関する議論は,表型データ上での深層モデルを説明する戦略によって補完される。
私たちの主な貢献は、この分野の主要な研究の流れと既存の方法論に対処し、関連する課題とオープンリサーチの質問に焦点をあてることです。
私たちの知る限りでは、これは表データに対するディープラーニングアプローチを詳細に見る最初の方法です。
この研究は、表データの深層学習に関心のある研究者や実践者にとって、貴重な出発点となり得る。
関連論文リスト
- A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - DataFinder: Scientific Dataset Recommendation from Natural Language
Descriptions [100.52917027038369]
我々は、短い自然言語記述を与えられたデータセットを推奨するタスクを運用する。
この作業を容易にするために、我々は、より大規模な自動構築トレーニングセットと、より少ない専門家によるアノテート評価セットからなるDataFinderデータセットを構築した。
このシステムは、DataFinderデータセットに基づいてトレーニングされ、既存のサードパーティのデータセット検索エンジンよりも関連性の高い検索結果を見つける。
論文 参考訳(メタデータ) (2023-05-26T05:22:36Z) - Graph Neural Network contextual embedding for Deep Learning on Tabular
Data [0.45880283710344055]
ディープラーニング(DL)は、自然言語処理のような人間のスキルに関連する分野において、AIにとって大きなブレークスルーとなっている。
本稿では,グラフニューラルネットワーク(GNN)を用いた新しいDLモデル,特にインタラクションネットワーク(IN)を提案する。
この結果は、最近発表された5つの公開データセットに基づいたDLベンチマークによる調査よりも優れており、増木ソリューションと比較しても競争力のある結果が得られている。
論文 参考訳(メタデータ) (2023-03-11T17:13:24Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Are Deep Image Embedding Clustering Methods Effective for Heterogeneous
Tabular Data? [0.0]
本稿では,画像データセットに対して提案した6つの最先端ベースライン手法を用いて,7つのデータセットのディープ埋め込みクラスタリングに関する最初の研究の1つを実行する。
従来のグラフデータのクラスタリングは8つのメソッドのうち2位にランクされ、最も深いクラスタリングベースラインよりも優れている。
論文 参考訳(メタデータ) (2022-12-28T22:29:10Z) - Why do tree-based models still outperform deep learning on tabular data? [0.0]
木をベースとしたモデルが中規模データの最先端のままであることを示す。
木系モデルとニューラルネットワーク(NN)の異なる帰納バイアスに関する実証的研究を行う。
論文 参考訳(メタデータ) (2022-07-18T08:36:08Z) - Transfer Learning with Deep Tabular Models [66.67017691983182]
上流データにより、グラフニューラルネットワークはGBDTモデルよりも決定的な優位性を示す。
そこで本研究では,表在化学習のための現実的な診断ベンチマークを提案する。
上流と下流の特徴セットが異なる場合の擬似特徴法を提案する。
論文 参考訳(メタデータ) (2022-06-30T14:24:32Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - A Survey of Deep Learning for Scientific Discovery [13.372738220280317]
私たちは、ディープラーニングにおけるコア問題における根本的なブレークスルーを、主にディープニューラルネットワークの進歩によって見てきた。
幅広い科学領域で収集されるデータの量は、サイズと複雑さの両方で劇的に増加しています。
これは、科学的な設定でディープラーニングを応用するための多くのエキサイティングな機会を示唆している。
論文 参考訳(メタデータ) (2020-03-26T06:16:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。