論文の概要: Unsupervised Heterogeneous Coupling Learning for Categorical
Representation
- arxiv url: http://arxiv.org/abs/2007.10720v1
- Date: Tue, 21 Jul 2020 11:23:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:12:53.260343
- Title: Unsupervised Heterogeneous Coupling Learning for Categorical
Representation
- Title(参考訳): カテゴリー表現のための教師なし不均一結合学習
- Authors: Chengzhang Zhu, Longbing Cao, and Jianping Yin
- Abstract要約: この研究は、結合間の相互作用を解き放ち、結合したカテゴリデータを表現するためのUNTIE(UNsupervised heTerogeneous couplIng lEarning)アプローチを導入する。
UNTIEは、ヘテロジニアスおよび階層的値-オブジェクト結合の教師なし表現学習のために、カーネルk平均目的関数を効率よく最適化する。
UNTIEで学習した表現は、最先端のカテゴリ表現やディープ表現モデルに対して大幅な性能改善を行う。
- 参考スコア(独自算出の注目度): 50.1603042640492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Complex categorical data is often hierarchically coupled with heterogeneous
relationships between attributes and attribute values and the couplings between
objects. Such value-to-object couplings are heterogeneous with complementary
and inconsistent interactions and distributions. Limited research exists on
unlabeled categorical data representations, ignores the heterogeneous and
hierarchical couplings, underestimates data characteristics and complexities,
and overuses redundant information, etc. The deep representation learning of
unlabeled categorical data is challenging, overseeing such value-to-object
couplings, complementarity and inconsistency, and requiring large data,
disentanglement, and high computational power. This work introduces a shallow
but powerful UNsupervised heTerogeneous couplIng lEarning (UNTIE) approach for
representing coupled categorical data by untying the interactions between
couplings and revealing heterogeneous distributions embedded in each type of
couplings. UNTIE is efficiently optimized w.r.t. a kernel k-means objective
function for unsupervised representation learning of heterogeneous and
hierarchical value-to-object couplings. Theoretical analysis shows that UNTIE
can represent categorical data with maximal separability while effectively
represent heterogeneous couplings and disclose their roles in categorical data.
The UNTIE-learned representations make significant performance improvement
against the state-of-the-art categorical representations and deep
representation models on 25 categorical data sets with diversified
characteristics.
- Abstract(参考訳): 複雑な分類データは、しばしば属性と属性値の不均一な関係とオブジェクト間の結合と階層的に結合される。
このような値対対象結合は相補的かつ矛盾した相互作用や分布と不均一である。
ラベルのないカテゴリデータ表現、異種および階層的な結合を無視する、データ特性と複雑さを過小評価する、冗長な情報を過大に活用する、限定的な研究がある。
ラベルのない分類データの深い表現学習は困難であり、そのような値対オブジェクトの結合、相補性と矛盾を監督し、大きなデータ、絡み合い、高い計算力を必要とする。
本研究は,結合間の相互作用を解き明かし,結合の種類に埋め込まれた不均一分布を明らかにすることにより,結合するカテゴリデータを表現するためのUNTIEアプローチを導入する。
UNTIEは、ヘテロジニアスおよび階層的値-オブジェクト結合の教師なし表現学習のためのカーネルk平均目的関数を効率的に最適化する。
理論的解析により、UNTIEは分類データを最大分離性で表すことができ、不均一な結合を効果的に表現し、その役割を分類データで明らかにすることができる。
untie-learned表現は、多様化した特性を持つ25のカテゴリデータセット上の最先端のカテゴリ表現とディープ表現モデルに対して、大幅にパフォーマンスが向上する。
関連論文リスト
- Enhancing Missing Data Imputation through Combined Bipartite Graph and Complete Directed Graph [18.06658040186476]
BCGNN(Bipartite and Complete Directed Graph Neural Network)という新しいフレームワークを導入する。
BCGNN内では、観察と特徴は2つの異なるノードタイプとして区別され、観察された特徴の値はそれらをリンクする属性付きエッジに変換される。
並行して、完全な有向グラフセグメントは、機能間の複雑な相互依存性を網羅し、伝達する。
論文 参考訳(メタデータ) (2024-11-07T17:48:37Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Jointprop: Joint Semi-supervised Learning for Entity and Relation
Extraction with Heterogeneous Graph-based Propagation [13.418617500641401]
共同半教師付きエンティティと関係抽出のための不均一グラフに基づく伝搬フレームワークであるJointpropを提案する。
我々は、エンティティと関係候補から統一されたスパンベースのヘテロジニアスグラフを構築し、信頼度スコアに基づいてクラスラベルを伝搬する。
我々はNERおよびREタスクにおける最先端の半教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-25T09:07:04Z) - HiURE: Hierarchical Exemplar Contrastive Learning for Unsupervised
Relation Extraction [60.80849503639896]
非教師なし関係抽出は、関係範囲や分布に関する事前情報のない自然言語文からエンティティ間の関係を抽出することを目的としている。
本稿では,階層間注目を用いた階層的特徴空間から階層的信号を導出する機能を持つ,HiUREという新しいコントラスト学習フレームワークを提案する。
2つの公開データセットの実験結果は、最先端モデルと比較した場合の教師なし関係抽出におけるHiUREの有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-05-04T17:56:48Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Layer-stacked Attention for Heterogeneous Network Embedding [0.0]
レイヤスタックATTention Embedding (LATTE)は、各レイヤで上位のメタ関係を自動的に分解するアーキテクチャである。
LATTEは、異なる近傍範囲の異なるタイプのノードに対して、より解釈可能なアグリゲーションスキームを提供する。
帰納的ノード分類タスクと帰納的ノード分類タスクの両方において、LATTEは既存のアプローチと比較して最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2020-09-17T05:13:41Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。