論文の概要: Stratified Data Integration
- arxiv url: http://arxiv.org/abs/2105.09432v1
- Date: Wed, 19 May 2021 23:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 22:51:33.215779
- Title: Stratified Data Integration
- Title(参考訳): 階層データ統合
- Authors: Fausto Giunchiglia, Alessio Zamboni, Mayukh Bagchi and Simone Bocca
- Abstract要約: 本稿では,意味的不均一性の問題を表現多様性の問題として論じる。
提案する階層化されたデータ表現と,まず対象データに変換するプロセスについて述べる。
提案手法は, 各種試験事例および産業データ統合問題において評価されている。
- 参考スコア(独自算出の注目度): 3.8902657229395907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel approach to the problem of semantic heterogeneity where
data are organized into a set of stratified and independent representation
layers, namely: conceptual(where a set of unique alinguistic identifiers are
connected inside a graph codifying their meaning), language(where sets of
synonyms, possibly from multiple languages, annotate concepts), knowledge(in
the form of a graph where nodes are entity types and links are properties), and
data(in the form of a graph of entities populating the previous knowledge
graph). This allows us to state the problem of semantic heterogeneity as a
problem of Representation Diversity where the different types of heterogeneity,
viz. Conceptual, Language, Knowledge, and Data, are uniformly dealt within each
single layer, independently from the others. In this paper we describe the
proposed stratified representation of data and the process by which data are
first transformed into the target representation, then suitably integrated and
then, finally, presented to the user in her preferred format. The proposed
framework has been evaluated in various pilot case studies and in a number of
industrial data integration problems.
- Abstract(参考訳): We propose a novel approach to the problem of semantic heterogeneity where data are organized into a set of stratified and independent representation layers, namely: conceptual(where a set of unique alinguistic identifiers are connected inside a graph codifying their meaning), language(where sets of synonyms, possibly from multiple languages, annotate concepts), knowledge(in the form of a graph where nodes are entity types and links are properties), and data(in the form of a graph of entities populating the previous knowledge graph).
これにより、意味的不均一性(semantic heterogeneity)の問題を表現多様性(Representation Diversity)の問題として記述することができる。
概念、言語、知識、データは、他のものと独立して、各レイヤ内で一様に処理されます。
本稿では,提案した階層化されたデータ表現と,まずデータを対象の表現に変換し,それを適切に統合し,最後にユーザの好みのフォーマットで提示するプロセスについて述べる。
提案フレームワークは様々なパイロットケーススタディやいくつかの産業データ統合問題で評価されている。
関連論文リスト
- Graph-Dictionary Signal Model for Sparse Representations of Multivariate Data [49.77103348208835]
グラフの有限集合がラプラシアンの重み付き和を通してデータ分布の関係を特徴付けるグラフ辞書信号モデルを定義する。
本稿では,観測データからグラフ辞書表現を推論するフレームワークを提案する。
我々は,脳活動データに基づく運動画像復号作業におけるグラフ辞書表現を利用して,従来の手法よりも想像的な動きをよりよく分類する。
論文 参考訳(メタデータ) (2024-11-08T17:40:43Z) - Federated Graph Semantic and Structural Learning [54.97668931176513]
本稿では,ノードレベルのセマンティクスとグラフレベルの構造の両方によって局所的なクライアントの歪みがもたらされることを示す。
構造的グラフニューラルネットワークは、固有の隣接関係のため、隣人に類似性を持っていると仮定する。
我々は、隣接関係を類似度分布に変換し、グローバルモデルを利用して関係知識を局所モデルに蒸留する。
論文 参考訳(メタデータ) (2024-06-27T07:08:28Z) - Disentangled Hyperbolic Representation Learning for Heterogeneous Graphs [29.065531121422204]
本稿では,分散ハイパーボリックなヘテロジニアスグラフ畳み込みネットワークである$textDis-H2textGCN$を提案する。
提案した$textDis-H2textGCN$を実世界の5つの異種グラフデータセット上で評価した。
論文 参考訳(メタデータ) (2024-06-14T18:50:47Z) - Comparing the information content of probabilistic representation spaces [3.7277730514654555]
確率的表現空間は、データセットに関する情報を伝達し、トレーニング損失やネットワークアーキテクチャなどの要因の影響を理解するために、そのような空間の情報内容を比較する。
ここでは、ポイントベースの比較尺度に基づいて構築する代わりに、ハードクラスタリングに関する文献から古典的な手法に基づいて構築する。
本稿では,データセットのサンプルを用いて表現空間をフィンガープリントする手法を提案する。
論文 参考訳(メタデータ) (2024-05-31T17:33:07Z) - Flexible inference in heterogeneous and attributed multilayer networks [21.349513661012498]
我々は任意の種類の情報を持つ多層ネットワークで推論を行う確率的生成モデルを開発した。
インド農村部における社会支援ネットワークにおける様々なパターンを明らかにする能力を示す。
論文 参考訳(メタデータ) (2024-05-31T15:21:59Z) - A Novel Multidimensional Reference Model For Heterogeneous Textual
Datasets Using Context, Semantic And Syntactic Clues [4.453735522794044]
本研究の目的は、異種データセットのカテゴリを用いた新しい多次元参照モデルを作ることである。
MRMの主な貢献は、シノニム、アントロニム、フォーマル、語彙語順、共起といった言語カテゴリーの索引付けに基づいて各用語でそれぞれのトークンをチェックすることである。
論文 参考訳(メタデータ) (2023-11-10T17:02:25Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - VAE-CE: Visual Contrastive Explanation using Disentangled VAEs [3.5027291542274357]
変分自己エンコーダに基づくコントラスト説明(VAE-CE)
本研究では,各次元をアンタングル化するための新しい教師付き手法で拡張した,アンタングル付きVAEを用いたモデルを構築した。
合成データとMNISTの分析は、解離と説明の両方へのアプローチが他の方法よりも有利であることを示している。
論文 参考訳(メタデータ) (2021-08-20T13:15:24Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。