論文の概要: Unraveling the graph structure of tabular datasets through Bayesian and
spectral analysis
- arxiv url: http://arxiv.org/abs/2110.01421v1
- Date: Mon, 4 Oct 2021 12:51:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 15:11:21.655596
- Title: Unraveling the graph structure of tabular datasets through Bayesian and
spectral analysis
- Title(参考訳): ベイズ解析とスペクトル解析による表状データセットのグラフ構造解明
- Authors: Bruno Messias F. de Resende, Eric K. Tokuda, Luciano da Fontoura Costa
- Abstract要約: ネストブロックモデル(nSBM)によって得られた階層的モジュラー構造の推論は,特徴のクラスを特定し,非自明な関係を解くのに役立つことを示す。
ブラジルの学生を対象に実施した社会経済調査: PeNSE 調査について分析した。
- 参考スコア(独自算出の注目度): 3.128267020893596
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In the big-data age tabular datasets are being generated and analyzed
everywhere. As a consequence, finding and understanding the relationships
between the features of these datasets are of great relevance. Here, to
encompass these relationships we propose a methodology that maps an entire
tabular dataset or just an observation into a weighted directed graph using the
Shapley additive explanations technique. With this graph of relationships, we
show that the inference of the hierarchical modular structure obtained by the
nested stochastic block model (nSBM) as well as the study of the spectral space
of the magnetic Laplacian can help us identify the classes of features and
unravel non-trivial relationships. As a case study, we analyzed a socioeconomic
survey conducted with students in Brazil: the PeNSE survey. The spectral
embedding of the columns suggested that questions related to physical
activities form a separate group. The application of the nSBM approach,
corroborated with that and allowed complementary findings about the modular
structure: some groups of questions showed a high adherence with the divisions
qualitatively defined by the designers of the survey. However, questions from
the class \textit{Safety} were partly grouped by our method in the class
\textit{Drugs}. Surprisingly, by inspecting these questions, we observed that
they were related to both these topics, suggesting an alternative
interpretation of these questions. Our method can provide guidance for tabular
data analysis as well as the design of future surveys.
- Abstract(参考訳): ビッグデータ時代のグラフデータセットは、至る所で生成され分析されている。
その結果、これらのデータセットの特徴間の関係を見つけ、理解することは、非常に有益である。
そこで,これらの関係を包含するために,表型データセット全体や観測をシェープリー加法で重み付け有向グラフにマッピングする手法を提案する。
この関係のグラフを用いて,nested stochastic block model (nsbm) によって得られた階層的モジュラー構造の推論と磁気ラプラシアンのスペクトル空間の研究は,特徴のクラスを同定し,非自明な関係を解き放つのに役立つことを示す。
ブラジルの学生を対象に実施した社会経済調査: PeNSE 調査を事例として分析した。
カラムのスペクトル埋め込みは、物理的活動に関連する質問が別々のグループを形成することを示唆した。
nsbmアプローチの適用は、それと一致し、モジュラー構造の相補的な発見を可能にした: いくつかの質問群は、調査の設計者によって定性的に定義された分割との密着度が高いことを示した。
しかし、クラス \textit{Safety} からの質問は、クラス \textit{Drugs} のメソッドによって部分的にグループ化された。
驚いたことに、これらの質問を検査することで、これらの質問はどちらも関連しており、これらの質問の代替解釈が提案されている。
本手法は,表型データ解析のガイダンスと今後の調査の設計を提供することができる。
関連論文リスト
- Survey on Semantic Interpretation of Tabular Data: Challenges and Directions [2.324913904215885]
本調査は,セマンティックテーブル解釈の全体像を概観することを目的としている。
まず31の属性の分類を使ってアプローチを分類し、比較と評価を可能にします。
また、利用可能なツールを調べ、12の基準に基づいて評価する。
論文 参考訳(メタデータ) (2024-11-07T14:28:56Z) - Dissecting embedding method: learning higher-order structures from data [0.0]
データ学習のための幾何学的深層学習法は、しばしば特徴空間の幾何学に関する仮定のセットを含む。
これらの仮定と、データが離散的で有限であるという仮定は、いくつかの一般化を引き起こし、データとモデルの出力の間違った解釈を生み出す可能性がある。
論文 参考訳(メタデータ) (2024-10-14T08:19:39Z) - Integrating Large Language Models with Graph-based Reasoning for Conversational Question Answering [58.17090503446995]
我々は,テキストや知識グラフ,テーブル,インフォボックスといった異質な情報源から収集された証拠について,文脈における質問の理解と推論の課題を組み合わせた会話型質問応答タスクに着目する。
提案手法はグラフ構造表現を用いて質問とその文脈に関する情報を集約する。
論文 参考訳(メタデータ) (2024-06-14T13:28:03Z) - Geometric Relational Embeddings: A Survey [39.57716353191535]
本研究では,データ表現に使用される埋め込みジオメトリに基づいて,幾何的リレーショナル埋め込みを下位に調査し,それらを分類する。
埋め込みの各種類の所望の特性(すなわち帰納バイアス)を特定し、潜在的な将来の研究について議論する。
論文 参考訳(メタデータ) (2023-04-24T09:33:30Z) - Modeling Relational Patterns for Logical Query Answering over Knowledge Graphs [29.47155614953955]
そこで我々は,複雑な空間における回転により,クエリ領域を幾何学的円錐と代数的クエリ演算子として定義する新しいクエリ埋め込み手法RoConEを開発した。
いくつかのベンチマークデータセットに対する実験結果から,論理的問合せ処理の強化のための関係パターンの利点が確認された。
論文 参考訳(メタデータ) (2023-03-21T13:59:15Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - INFOTABS: Inference on Tables as Semi-structured Data [39.84930221015755]
我々は,ウィキペディアのインフォボックスから抽出されたテーブルである前提に基づいて,人間によるテキスト仮説からなるINFOTABSという新しいデータセットを導入する。
解析の結果,半構造的,多領域的,異種的の性質は複雑で多面的推論を許容していることがわかった。
実験の結果、人間アノテータはテーブル-仮説のペア間の関係について合意する一方で、いくつかの標準的なモデリング戦略はそのタスクにおいて失敗していることがわかった。
論文 参考訳(メタデータ) (2020-05-13T02:07:54Z) - A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。
モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。
DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文 参考訳(メタデータ) (2020-04-20T13:26:45Z) - Relational Message Passing for Knowledge Graph Completion [78.47976646383222]
本稿では,知識グラフ補完のためのリレーショナルメッセージパッシング手法を提案する。
エッジ間でリレーショナルメッセージを反復的に送信し、近隣情報を集約する。
その結果,本手法は最先端の知識完成手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2020-02-17T03:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。