論文の概要: Feature Ranking for Semi-supervised Learning
- arxiv url: http://arxiv.org/abs/2008.03937v1
- Date: Mon, 10 Aug 2020 07:50:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:19:31.798457
- Title: Feature Ranking for Semi-supervised Learning
- Title(参考訳): 半教師付き学習のための特徴ランキング
- Authors: Matej Petkovi\'c, Sa\v{s}o D\v{z}eroski, Dragi Kocev
- Abstract要約: 特徴ランクの半教師付き学習を提案する。
我々の知る限りでは、半教師付き構造的出力予測コンテキストにおける特徴ランク付けのタスクを取り扱うのはこれが初めてである。
ランダムフォレストは分類のようなタスクでベスト、回帰のようなタスクではエクストラPCTがベストです。
- 参考スコア(独自算出の注目度): 3.1380888953704984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The data made available for analysis are becoming more and more complex along
several directions: high dimensionality, number of examples and the amount of
labels per example. This poses a variety of challenges for the existing machine
learning methods: coping with dataset with a large number of examples that are
described in a high-dimensional space and not all examples have labels
provided. For example, when investigating the toxicity of chemical compounds
there are a lot of compounds available, that can be described with information
rich high-dimensional representations, but not all of the compounds have
information on their toxicity. To address these challenges, we propose
semi-supervised learning of feature ranking. The feature rankings are learned
in the context of classification and regression as well as in the context of
structured output prediction (multi-label classification, hierarchical
multi-label classification and multi-target regression). To the best of our
knowledge, this is the first work that treats the task of feature ranking
within the semi-supervised structured output prediction context. More
specifically, we propose two approaches that are based on tree ensembles and
the Relief family of algorithms. The extensive evaluation across 38 benchmark
datasets reveals the following: Random Forests perform the best for the
classification-like tasks, while for the regression-like tasks Extra-PCTs
perform the best, Random Forests are the most efficient method considering
induction times across all tasks, and semi-supervised feature rankings
outperform their supervised counterpart across a majority of the datasets from
the different tasks.
- Abstract(参考訳): 分析用に作成されるデータは、高次元性、サンプルの数、サンプルあたりのラベルの量など、さまざまな方向にますます複雑になっています。
これは既存の機械学習手法に様々な課題をもたらしている。 データセットに高次元空間で記述され、すべての例にラベルが提供されているわけではない多数の例を扱う。
例えば、化学物質の毒性を調べる際には、情報豊富な高次元表現で説明できる多くの化合物が存在するが、全ての化合物がその毒性に関する情報を持っているわけではない。
これらの課題に対処するため,我々は,機能ランキングの半教師付き学習を提案する。
特徴ランキングは、分類と回帰の文脈だけでなく、構造化された出力予測(複数ラベル分類、階層的多ラベル分類、多ターゲット回帰)の文脈でも学習される。
我々の知る限りでは、半教師付き構造的出力予測コンテキストにおける特徴ランク付けのタスクを取り扱うのはこれが初めてである。
具体的には,木アンサンブルとReliefのアルゴリズム群に基づく2つのアプローチを提案する。
ランダムフォレストは分類のようなタスクでベスト、レグレッションのようなタスクではエクストラPCTがベスト、ランダムフォレストはすべてのタスクでインジェクションタイムを考慮した最も効率的な方法であり、半教師付きフィーチャーランキングは、異なるタスクからほとんどのデータセットで監督されたタスクよりも優れています。
関連論文リスト
- Generating Hierarchical Structures for Improved Time Series
Classification Using Stochastic Splitting Functions [0.0]
本研究では,階層分類(HC)による多クラスデータセットの分類性能を高めるために,分割関数(SSF)を用いた新しい階層分割クラスタリング手法を提案する。
この方法は、明示的な情報を必要とせずに階層を生成するユニークな能力を持ち、階層の事前の知識を欠いたデータセットに適している。
論文 参考訳(メタデータ) (2023-09-21T10:34:50Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - Semi-supervised Predictive Clustering Trees for (Hierarchical) Multi-label Classification [2.706328351174805]
本稿では,予測クラスタリング木の半教師付き学習に基づく階層型マルチラベル分類手法を提案する。
また,この手法をアンサンブル学習に拡張し,ランダムな森林アプローチに基づく手法を提案する。
論文 参考訳(メタデータ) (2022-07-19T12:49:00Z) - Simple multi-dataset detection [83.9604523643406]
複数の大規模データセット上で統合検出器を訓練する簡単な方法を提案する。
データセット固有のアウトプットを共通の意味分類に自動的に統合する方法を示す。
私たちのアプローチは手動の分類学の調整を必要としません。
論文 参考訳(メタデータ) (2021-02-25T18:55:58Z) - Abstractive Query Focused Summarization with Query-Free Resources [60.468323530248945]
本稿では,汎用的な要約リソースのみを利用して抽象的なqfsシステムを構築する問題を考える。
本稿では,要約とクエリのための新しい統一表現からなるMasked ROUGE回帰フレームワークであるMargeを提案する。
最小限の監視から学習したにもかかわらず,遠隔管理環境において最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-12-29T14:39:35Z) - Deep tree-ensembles for multi-output prediction [0.0]
そこで我々は,木埋め込みに基づく表現学習コンポーネントを用いて,各層が元の特徴集合を豊かにする,新しいディープツリーアンサンブル(DTE)モデルを提案する。
具体的には、2つの構造化された出力予測タスク、すなわちマルチラベル分類とマルチターゲット回帰に焦点を当てる。
論文 参考訳(メタデータ) (2020-11-03T16:25:54Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z) - Efficient strategies for hierarchical text classification: External
knowledge and auxiliary tasks [3.5557219875516655]
我々は、あるクラス分類の上位から下位まで、文書のカテゴリを予測するための一連の推論手順を実行する。
効率的なアプローチでは、よく知られた2つの英語データセットにおいて、パラメータを劇的に減らし、過去の研究を上回りました。
論文 参考訳(メタデータ) (2020-05-05T20:22:18Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。