論文の概要: Propositionalization and Embeddings: Two Sides of the Same Coin
- arxiv url: http://arxiv.org/abs/2006.04410v1
- Date: Mon, 8 Jun 2020 08:33:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 00:33:23.665331
- Title: Propositionalization and Embeddings: Two Sides of the Same Coin
- Title(参考訳): 命題化と埋め込み:同一硬貨の2つの側面
- Authors: Nada Lavra\v{c} and Bla\v{z} \v{S}krlj and Marko Robnik-\v{S}ikonja
- Abstract要約: 本稿では,リレーショナル学習におけるデータ処理技術について概説する。
それは命題化とデータ変換のアプローチの埋め込みに焦点を当てている。
統一手法の2つの効率的な実装を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data preprocessing is an important component of machine learning pipelines,
which requires ample time and resources. An integral part of preprocessing is
data transformation into the format required by a given learning algorithm.
This paper outlines some of the modern data processing techniques used in
relational learning that enable data fusion from different input data types and
formats into a single table data representation, focusing on the
propositionalization and embedding data transformation approaches. While both
approaches aim at transforming data into tabular data format, they use
different terminology and task definitions, are perceived to address different
goals, and are used in different contexts. This paper contributes a unifying
framework that allows for improved understanding of these two data
transformation techniques by presenting their unified definitions, and by
explaining the similarities and differences between the two approaches as
variants of a unified complex data transformation task. In addition to the
unifying framework, the novelty of this paper is a unifying methodology
combining propositionalization and embeddings, which benefits from the
advantages of both in solving complex data transformation and learning tasks.
We present two efficient implementations of the unifying methodology: an
instance-based PropDRM approach, and a feature-based PropStar approach to data
transformation and learning, together with their empirical evaluation on
several relational problems. The results show that the new algorithms can
outperform existing relational learners and can solve much larger problems.
- Abstract(参考訳): データ前処理は、十分な時間とリソースを必要とする機械学習パイプラインの重要なコンポーネントである。
事前処理の不可欠な部分は、与えられた学習アルゴリズムが必要とする形式へのデータ変換である。
本稿では,データ変換手法の命題化と組込みに焦点をあて,異なる入力データ型やフォーマットから単一のテーブルデータ表現へのデータ融合を可能にする,リレーショナルラーニングにおけるデータ処理手法について概説する。
どちらのアプローチもデータを表形式のデータに変換することを目標としているが、異なる用語とタスク定義を使い、異なる目標に対処し、異なるコンテキストで使用される。
本稿では,これら2つのデータ変換手法の統一的定義を提示し,それらの類似点と相違点を複合データ変換タスクの変種として説明することにより,これらの2つのデータ変換手法の理解を向上する一元化フレームワークを提案する。
この統一フレームワークに加えて,提案法と埋め込み法を組み合わせた統一手法として,複雑なデータ変換と学習タスクの解法という利点を生かした新しい手法を提案する。
本稿では、インスタンスベースのPropDRMアプローチと、データ変換と学習のための機能ベースのPropStarアプローチの2つの効率的な実装と、いくつかのリレーショナル問題に対する経験的評価について述べる。
その結果,新しいアルゴリズムは既存の関係学習者より優れており,さらに大きな問題を解くことができることがわかった。
関連論文リスト
- What is different between these datasets? [23.271594219577185]
同じドメイン内の2つの同等のデータセットは、異なる分布を持つ可能性がある。
本稿では,2つのデータセットを比較するための解釈可能な手法(ツールボックス)を提案する。
我々の手法は、説明品質と正確性の観点から比較および関連するアプローチよりも優れているだけでなく、データセットの違いを効果的に理解し軽減するための実用的な補完的な洞察を提供する。
論文 参考訳(メタデータ) (2024-03-08T19:52:39Z) - Few-Shot Data-to-Text Generation via Unified Representation and
Multi-Source Learning [114.54944761345594]
本稿では,既存の手法の限界に対処する構造化データ・テキスト生成手法を提案する。
提案手法は,マルチタスクトレーニング,ゼロショット,少数ショットシナリオの性能向上を目的としている。
論文 参考訳(メタデータ) (2023-08-10T03:09:12Z) - Style Transfer as Data Augmentation: A Case Study on Named Entity
Recognition [17.892385961143173]
本稿では,テキストを高リソース領域から低リソース領域へ変換する手法を提案する。
我々は、データ選択のための重要な要素のセットとともに制約付き復号アルゴリズムを設計し、有効かつ一貫性のあるデータの生成を保証する。
我々のアプローチはデータの不足に対する実用的な解決策であり、他のNLPタスクに適用できることを期待しています。
論文 参考訳(メタデータ) (2022-10-14T16:02:03Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - GEDI: A Graph-based End-to-end Data Imputation Framework [3.5478302034537705]
提案手法はトランスフォーマーネットワークとグラフ構造学習を用いて,観測における特徴と類似点間の文脈的関係を反復的に洗練する。
メタラーニングフレームワークを使用して、下流の予測タスクに影響を及ぼす機能を選択する。
実世界の大規模データセットで実験を行い,提案した計算プロセスが一貫して計算性能とラベル予測性能を向上させることを示す。
論文 参考訳(メタデータ) (2022-08-13T05:16:40Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Towards a Flexible Embedding Learning Framework [15.604564543883122]
本稿では,学習表現に組み込むことができる関係性の観点から柔軟な埋め込み学習フレームワークを提案する。
サンプリング機構は、入力と出力埋め込みによって捕捉された情報との直接接続を確立するために慎重に設計される。
実験の結果,提案するフレームワークは,関連エンティティ・リレーショナル・マトリクスのセットと合わせて,様々なデータマイニングタスクにおける既存の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-09-23T08:00:56Z) - On Compositions of Transformations in Contrastive Self-Supervised
Learning [66.15514035861048]
本稿では,コントラスト学習をより広範な変換集合に一般化する。
特定の変換に不変であり、他の変換に特有であることは、効果的なビデオ表現の学習に不可欠である。
論文 参考訳(メタデータ) (2020-03-09T17:56:49Z) - Provable Meta-Learning of Linear Representations [114.656572506859]
我々は、複数の関連するタスクから共通の機能の集合を学習し、その知識を新しい未知のタスクに転送する、という2つの課題に対処する、高速でサンプル効率のアルゴリズムを提供する。
また、これらの線形特徴を学習する際のサンプルの複雑さに関する情報理論の下限も提供する。
論文 参考訳(メタデータ) (2020-02-26T18:21:34Z) - Multi-Objective Genetic Programming for Manifold Learning: Balancing
Quality and Dimensionality [4.4181317696554325]
最先端の多様体学習アルゴリズムはこの変換の実行方法において不透明である。
多様体の品質と次元の競合する目的を自動的にバランスさせる多目的アプローチを導入する。
提案手法は,基礎および最先端の多様体学習手法と競合する。
論文 参考訳(メタデータ) (2020-01-05T23:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。