論文の概要: Simple Weak Coresets for Non-Decomposable Classification Measures
- arxiv url: http://arxiv.org/abs/2312.09885v1
- Date: Fri, 15 Dec 2023 15:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 15:03:52.302000
- Title: Simple Weak Coresets for Non-Decomposable Classification Measures
- Title(参考訳): 非可逆分類測度のための単純弱コア集合
- Authors: Jayesh Malaviya, Anirban Dasgupta and Rachit Chhaya
- Abstract要約: また,一様サンプリングに基づくコアセットは,理論的保証による実証性能にも優れることを示した。
我々はF1スコアとマシューズ相関係数に焦点をあて、最適化し難い2つの広く使われている非分解対象関数を最適化し、一様コアセットがコアセットサイズに対して低い境界に達することを示す。
- 参考スコア(独自算出の注目度): 3.5819148482955514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While coresets have been growing in terms of their application, barring few
exceptions, they have mostly been limited to unsupervised settings. We consider
supervised classification problems, and non-decomposable evaluation measures in
such settings. We show that stratified uniform sampling based coresets have
excellent empirical performance that are backed by theoretical guarantees too.
We focus on the F1 score and Matthews Correlation Coefficient, two widely used
non-decomposable objective functions that are nontrivial to optimize for and
show that uniform coresets attain a lower bound for coreset size, and have good
empirical performance, comparable with ``smarter'' coreset construction
strategies.
- Abstract(参考訳): coresetsはアプリケーションの観点から成長を続けており、例外は少ないが、ほとんどは教師なしの設定に限られている。
本稿では, 教師付き分類問題と非分解性評価対策について考察する。
階層化された一様サンプリングに基づくコアセットは,理論的な保証によっても裏付けられる優れた実験性能を有することを示す。
F1スコアとマシューズ相関係数(英語版)は、最適化が簡単でない2つの広く使われている非分解対象関数であり、一様コアセットがコアセットサイズに対して低い境界に達し、‘smarter’のコアセット構築戦略に匹敵する優れた経験的性能を持つことを示す。
関連論文リスト
- Refined Coreset Selection: Towards Minimal Coreset Size under Model
Performance Constraints [69.27190330994635]
コアセットの選択は、計算コストの削減とディープラーニングアルゴリズムのデータ処理の高速化に強力である。
本稿では,モデル性能とコアセットサイズに対する最適化優先順序を維持する革新的な手法を提案する。
実験的に、広範な実験によりその優位性が確認され、しばしばより小さなコアセットサイズでモデル性能が向上する。
論文 参考訳(メタデータ) (2023-11-15T03:43:04Z) - Coverage-centric Coreset Selection for High Pruning Rates [11.18635356469467]
ワンショットコアセット選択は、プルーニング率からトレーニングデータのサブセットを選択することを目的としており、その後、そのサブセットでのみトレーニングされたモデルに対して高い精度を達成することができる。
最先端のコアセット選択方法は通常、各例に重要スコアを割り当て、コアセットを形成する上で最も重要な例を選択する。
しかし、高い刈り取り速度では、破滅的な精度の低下に悩まされ、ランダムなコアセットの選択よりもパフォーマンスが悪くなっていることが判明した。
論文 参考訳(メタデータ) (2022-10-28T00:14:00Z) - Optimizing Partial Area Under the Top-k Curve: Theory and Practice [151.5072746015253]
トップk曲線下部分領域(AUTKC)と呼ばれる新しい計量法を開発した。
AUTKCはより優れた識別能力を持ち、ベイズ最適スコア関数は条件付き確率に対して正しいトップKランクを与えることができる。
提案手法を最適化するために,実証的なサロゲートリスク最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-03T11:09:13Z) - An Empirical Evaluation of $k$-Means Coresets [4.45709593827781]
利用可能な$k$-meansコアセットの品質を比較する作業はありません。
我々はコアセットの計算が困難であると主張するベンチマークを提案する。
我々は理論と実践から最もよく使われるコアセットアルゴリズムの徹底的な評価を行う。
論文 参考訳(メタデータ) (2022-07-03T06:47:53Z) - A Unified Approach to Coreset Learning [24.79658173754555]
与えられたデータセットと損失関数のコアセットは、通常、与えられたクエリの集合からの全てのクエリの損失を近似する小さな重み付きセットである。
コアセット構築のための一般学習型アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-04T17:48:05Z) - Bend-Net: Bending Loss Regularized Multitask Learning Network for Nuclei
Segmentation in Histopathology Images [65.47507533905188]
重なり合う核を正確に分離するために、曲げ損失正規化器を備えた新しいマルチタスク学習ネットワークを提案する。
新たに提案されたマルチタスク学習アーキテクチャは、3つのタスクから共有表現を学習することで一般化を促進する。
提案した曲げ損失は,輪郭点を大きな曲率で囲むために高いペナルティを定義し,小さな曲率で凸輪郭点に小さなペナルティを適用した。
論文 参考訳(メタデータ) (2021-09-30T17:29:44Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - A Statistical Perspective on Coreset Density Estimation [26.023056426554415]
コアセットは、元の観測の小さなサブセットを選択してデータを要約する強力なツールとして登場した。
実効的なコアセットカーネル密度推定器は、H"古いスムース密度の大規模なクラスに対して、極小に近い最適値を示す。
論文 参考訳(メタデータ) (2020-11-10T05:18:43Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - Coresets via Bilevel Optimization for Continual Learning and Streaming [86.67190358712064]
濃度制約付き二レベル最適化による新しいコアセット構成を提案する。
我々のフレームワークがディープニューラルネットワークのコアセットを効率的に生成できることを示し、連続学習やストリーミング設定における経験的メリットを示す。
論文 参考訳(メタデータ) (2020-06-06T14:20:25Z) - Unifying Few- and Zero-Shot Egocentric Action Recognition [3.1368611610608848]
オープンセット分類の評価が可能なEPIC-KITCHENSデータセットから新たな分割セットを提案する。
従来の直交ベースラインにメトリクス学習損失を加えることで、ゼロショット分類を最大10%改善できることを示す。
論文 参考訳(メタデータ) (2020-05-27T02:23:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。