論文の概要: A New Approach to Multilabel Stratified Cross Validation with
Application to Large and Sparse Gene Ontology Datasets
- arxiv url: http://arxiv.org/abs/2109.01425v1
- Date: Fri, 3 Sep 2021 10:34:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-06 18:37:49.797641
- Title: A New Approach to Multilabel Stratified Cross Validation with
Application to Large and Sparse Gene Ontology Datasets
- Title(参考訳): 大規模かつスパースな遺伝子オントロジーデータセットを用いたマルチラベル階層型クロスバリデーションの新手法
- Authors: Henri Tiittanen, Liisa Holm and Petri T\"or\"onen
- Abstract要約: 文献で広く使われている評価尺度の弱点を示す。
本手法の改良版と,クロスバリデーションの分割を最適化するための一般手法オピシプリットを提案する。
我々は、Optiisplitが既存のメソッドよりも優れたクロスバリデーション分割を生成し、大きなGene Ontologyデータセットで使用するのに十分高速であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multilabel learning is an important topic in machine learning research.
Evaluating models in multilabel settings requires specific cross validation
methods designed for multilabel data. In this article, we show a weakness in an
evaluation metric widely used in literature and we present improved versions of
this metric and a general method, optisplit, for optimising cross validations
splits. We present an extensive comparison of various types of cross validation
methods in which we show that optisplit produces better cross validation splits
than the existing methods and that it is fast enough to be used on big Gene
Ontology (GO) datasets
- Abstract(参考訳): マルチラベル学習は機械学習研究において重要なトピックである。
マルチラベル設定でモデルを評価するには、特定のクロスバリデーション手法が必要である。
本稿では,文献で広く用いられている評価尺度の弱点を示し,その改良版と,クロス検証分割を最適化するための一般的な手法であるオピスプリットを提案する。
我々は、optisplitが既存の手法よりも優れたクロス検証分割を生成し、big gene ontology(go)データセットで使用するのに十分であることを示す、様々なタイプのクロス検証手法を広範囲に比較した。
関連論文リスト
- LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Dual-Decoupling Learning and Metric-Adaptive Thresholding for Semi-Supervised Multi-Label Learning [81.83013974171364]
半教師付きマルチラベル学習(SSMLL)は、正確なマルチラベルアノテーションを収集するコストを削減するために、ラベルのないデータを活用する強力なフレームワークである。
半教師付き学習とは異なり、インスタンスに含まれる複数のセマンティクスのため、SSMLLの擬似ラベルとして最も確率の高いラベルを選択することはできない。
本稿では,高品質な擬似ラベルを生成するための二重パースペクティブ手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T09:33:53Z) - CrossMatch: Enhance Semi-Supervised Medical Image Segmentation with Perturbation Strategies and Knowledge Distillation [7.6057981800052845]
CrossMatchは、ラベル付きデータとラベルなしデータの両方からモデルの学習を改善するために、知識蒸留とデュアル戦略レベルの機能レベルを統合する新しいフレームワークである。
本手法は,ラベル付きデータとラベルなしデータのトレーニングのギャップを効果的に最小化することにより,標準ベンチマークにおける他の最先端技術を大幅に超えている。
論文 参考訳(メタデータ) (2024-05-01T07:16:03Z) - Multi-Label Feature Selection Using Adaptive and Transformed Relevance [0.0]
本稿では,ATRと呼ばれる情報理論に基づく新しい多ラベル特徴選択手法を提案する。
ATRは、個々のラベルと抽象的なラベル空間の識別能力を考慮している。
提案実験は,広範囲な特徴空間とラベル空間を特徴とするベンチマークにおけるATRのスケーラビリティを実証するものである。
論文 参考訳(メタデータ) (2023-09-26T09:01:38Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Retrieval-augmented Multi-label Text Classification [20.100081284294973]
マルチラベルテキスト分類は、大きなラベルセットの設定において難しい課題である。
Retrieval augmentationは、分類モデルのサンプル効率を改善することを目的としている。
本手法は,法および生物医学領域の4つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2023-05-22T14:16:23Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Efficient Classification of Long Documents Using Transformers [13.927622630633344]
様々なベースラインと多様なデータセットに対して測定された相対的有効性を評価する。
結果として、より複雑なモデルは、単純なベースラインを上回り、データセット間で一貫性のないパフォーマンスを得ることができないことがしばしば示される。
論文 参考訳(メタデータ) (2022-03-21T18:36:18Z) - Multiway sparse distance weighted discrimination [3.574492630046327]
距離重み付き識別(DWD)は、多方向コンテキストに拡張された一般的な高次元分類法である。
我々は,任意の次元および任意の空間範囲に適用可能なマルチウェイ分類のための一般的なフレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-11T16:11:04Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。