論文の概要: Stratified Data Integration
- arxiv url: http://arxiv.org/abs/2105.09432v1
- Date: Wed, 19 May 2021 23:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 22:51:33.215779
- Title: Stratified Data Integration
- Title(参考訳): 階層データ統合
- Authors: Fausto Giunchiglia, Alessio Zamboni, Mayukh Bagchi and Simone Bocca
- Abstract要約: 本稿では,意味的不均一性の問題を表現多様性の問題として論じる。
提案する階層化されたデータ表現と,まず対象データに変換するプロセスについて述べる。
提案手法は, 各種試験事例および産業データ統合問題において評価されている。
- 参考スコア(独自算出の注目度): 3.8902657229395907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel approach to the problem of semantic heterogeneity where
data are organized into a set of stratified and independent representation
layers, namely: conceptual(where a set of unique alinguistic identifiers are
connected inside a graph codifying their meaning), language(where sets of
synonyms, possibly from multiple languages, annotate concepts), knowledge(in
the form of a graph where nodes are entity types and links are properties), and
data(in the form of a graph of entities populating the previous knowledge
graph). This allows us to state the problem of semantic heterogeneity as a
problem of Representation Diversity where the different types of heterogeneity,
viz. Conceptual, Language, Knowledge, and Data, are uniformly dealt within each
single layer, independently from the others. In this paper we describe the
proposed stratified representation of data and the process by which data are
first transformed into the target representation, then suitably integrated and
then, finally, presented to the user in her preferred format. The proposed
framework has been evaluated in various pilot case studies and in a number of
industrial data integration problems.
- Abstract(参考訳): We propose a novel approach to the problem of semantic heterogeneity where data are organized into a set of stratified and independent representation layers, namely: conceptual(where a set of unique alinguistic identifiers are connected inside a graph codifying their meaning), language(where sets of synonyms, possibly from multiple languages, annotate concepts), knowledge(in the form of a graph where nodes are entity types and links are properties), and data(in the form of a graph of entities populating the previous knowledge graph).
これにより、意味的不均一性(semantic heterogeneity)の問題を表現多様性(Representation Diversity)の問題として記述することができる。
概念、言語、知識、データは、他のものと独立して、各レイヤ内で一様に処理されます。
本稿では,提案した階層化されたデータ表現と,まずデータを対象の表現に変換し,それを適切に統合し,最後にユーザの好みのフォーマットで提示するプロセスについて述べる。
提案フレームワークは様々なパイロットケーススタディやいくつかの産業データ統合問題で評価されている。
関連論文リスト
- HiGPT: Heterogeneous Graph Language Model [28.763621400020128]
不均一グラフ学習は、異種グラフ内のエンティティ間の複雑な関係や多様な意味を捉えることを目的としている。
異種グラフ学習のための既存のフレームワークは、多種多様な異種グラフデータセットをまたいだ一般化に制限がある。
異種グラフ命令チューニングパラダイムを用いた一般的なグラフモデルであるHiGPTを提案する。
論文 参考訳(メタデータ) (2024-02-25T08:07:22Z) - A Novel Multidimensional Reference Model For Heterogeneous Textual
Datasets Using Context, Semantic And Syntactic Clues [4.453735522794044]
本研究の目的は、異種データセットのカテゴリを用いた新しい多次元参照モデルを作ることである。
MRMの主な貢献は、シノニム、アントロニム、フォーマル、語彙語順、共起といった言語カテゴリーの索引付けに基づいて各用語でそれぞれのトークンをチェックすることである。
論文 参考訳(メタデータ) (2023-11-10T17:02:25Z) - KMF: Knowledge-Aware Multi-Faceted Representation Learning for Zero-Shot
Node Classification [75.95647590619929]
Zero-Shot Node Classification (ZNC)は、グラフデータ分析において、新しく重要なタスクである。
ラベルセマンティクスの豊かさを向上する知識認識型多面的フレームワーク(KMF)を提案する。
ノード情報集約によるプロトタイプドリフトの問題を軽減するために,新しい幾何学的制約を開発した。
論文 参考訳(メタデータ) (2023-08-15T02:38:08Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Towards Understanding and Mitigating Dimensional Collapse in
Heterogeneous Federated Learning [114.32726625370258]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Heterogeneous Graph Neural Network with Multi-view Representation
Learning [16.31723570596291]
異種グラフ埋め込みのための多視点表現学習(MV-HetGNN)を用いた異種グラフニューラルネットワークを提案する。
提案手法は, ノード特徴変換, ビュー固有エゴグラフ符号化, 自動多視点融合により, 包括的ノード表現を生成する複雑な構造情報と意味情報を完全に学習する。
3つの実世界の異種グラフデータセットに対する大規模な実験により、提案されたMV-HetGNNモデルは、様々な下流タスクにおいて、最先端のGNNベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2021-08-31T07:18:48Z) - VAE-CE: Visual Contrastive Explanation using Disentangled VAEs [3.5027291542274357]
変分自己エンコーダに基づくコントラスト説明(VAE-CE)
本研究では,各次元をアンタングル化するための新しい教師付き手法で拡張した,アンタングル付きVAEを用いたモデルを構築した。
合成データとMNISTの分析は、解離と説明の両方へのアプローチが他の方法よりも有利であることを示している。
論文 参考訳(メタデータ) (2021-08-20T13:15:24Z) - Variational Selective Autoencoder: Learning from Partially-Observed
Heterogeneous Data [45.23338389559936]
本研究では,部分観測された異種データから表現を学習するための変分選択型オートエンコーダ(VSAE)を提案する。
vsaeは、観測データ、観測されていないデータ、およびインプテーションマスクの合同分布をモデル化することで、異種データの潜在依存関係を学習する。
その結果、データ生成や計算を含むさまざまな下流タスクの統一モデルが実現される。
論文 参考訳(メタデータ) (2021-02-25T04:39:13Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z) - Building powerful and equivariant graph neural networks with structural
message-passing [74.93169425144755]
本稿では,2つのアイデアに基づいた,強力かつ同変なメッセージパッシングフレームワークを提案する。
まず、各ノードの周囲の局所的コンテキスト行列を学習するために、特徴に加えてノードの1ホット符号化を伝搬する。
次に,メッセージのパラメトリゼーション手法を提案する。
論文 参考訳(メタデータ) (2020-06-26T17:15:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。