論文の概要: Parameter Selection: Why We Should Pay More Attention to It
- arxiv url: http://arxiv.org/abs/2107.05393v1
- Date: Thu, 8 Jul 2021 12:55:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 13:50:12.446854
- Title: Parameter Selection: Why We Should Pay More Attention to It
- Title(参考訳): パラメータ選択:なぜもっと注意を払うべきなのか
- Authors: Jie-Jyun Liu, Tsung-Han Yang, Si-An Chen, Chih-Jen Lin
- Abstract要約: この意見書では、本質が一般に認識されるものを超えていることが指摘されている。
医療コード予測のためのマルチラベル分類の話題では、ある影響力のある論文がセット上で適切なパラメータ選択を行ったが、頻繁に発生するラベルのサブセットに移行すると、著者たちは別のチューニングなしで同じパラメータを使用した。
これらの研究の結果のほとんどは、当時パラメータチューニングが実施されていた場合、元の論文のアプローチを超えることはできない。
- 参考スコア(独自算出の注目度): 5.138318678631688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The importance of parameter selection in supervised learning is well known.
However, due to the many parameter combinations, an incomplete or an
insufficient procedure is often applied. This situation may cause misleading or
confusing conclusions. In this opinion paper, through an intriguing example we
point out that the seriousness goes beyond what is generally recognized. In the
topic of multi-label classification for medical code prediction, one
influential paper conducted a proper parameter selection on a set, but when
moving to a subset of frequently occurring labels, the authors used the same
parameters without a separate tuning. The set of frequent labels became a
popular benchmark in subsequent studies, which kept pushing the state of the
art. However, we discovered that most of the results in these studies cannot
surpass the approach in the original paper if a parameter tuning had been
conducted at the time. Thus it is unclear how much progress the subsequent
developments have actually brought. The lesson clearly indicates that without
enough attention on parameter selection, the research progress in our field can
be uncertain or even illusive.
- Abstract(参考訳): 教師あり学習におけるパラメータ選択の重要性はよく知られている。
しかし、多くのパラメータの組み合わせのため、不完全または不十分な手順がしばしば適用される。
この状況は誤解を招くか、紛らわしい結論をもたらす可能性がある。
本論では,興味深い例を通して,重大性は一般に認識されているものを超えていることを指摘する。
医療コード予測のためのマルチラベル分類の話題では、ある影響力のある論文がセット上で適切なパラメータ選択を行ったが、頻繁に発生するラベルのサブセットに移行する際には、別のチューニングなしで同じパラメータを使用した。
頻繁なラベルのセットはその後の研究で人気のあるベンチマークとなり、芸術の状態を推し進めた。
しかし,当時パラメータチューニングが行われていた場合,これらの研究結果のほとんどが,原論文のアプローチに勝るものではないことが判明した。
そのため、その後の開発がどの程度進展したのかは不明である。
この教訓は、パラメータ選択に十分な注意を払わずに、我々の分野における研究の進展が不確実であるか、さらには説明可能であることを示している。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Ranking Distillation for Open-Ended Video Question Answering with Insufficient Labels [31.063490654998617]
本稿では,ビデオ関連質問に対する応答として,大きめの回答から正しい回答を見つけることを目的とした,オープンなビデオ質問応答に焦点を当てた。
アノテーションのコストのため、既存のベンチマークのラベルは常に極めて不十分であり、典型的には1つの答えである。
そこで本研究では,手作業によるアノテーションを伴わずにこの問題を軽減するため,簡易かつ効果的なランキング蒸留フレームワーク (RADI) を提案する。
論文 参考訳(メタデータ) (2024-03-21T14:37:50Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - The Pitfalls of Sample Selection: A Case Study on Lung Nodule
Classification [13.376247652484274]
肺結節分類では, LIDCデータセットについて多くの研究結果が報告されており, 理論的には, 提案手法の性能を直接比較し, 個人の貢献が与える影響を評価することが期待できる。
それぞれが異なるデータ選択プロセスを採用しており,良性と悪性の症例の総数と比率が大きく異なることが判明した。
特定の選択がデータ分布に深刻な影響を与える可能性があることを示し、あるサンプル分布において優れた性能を達成できるが、別のサンプル分布では達成できない可能性があることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:07:07Z) - Finding the Ground-Truth from Multiple Labellers: Why Parameters of the
Task Matter [0.0]
雇用労働者の合意を集め、地道なラベルを確立する方法が推奨された。
パラメータには、労働者の数、労働者の専門知識、分類におけるラベルの数、およびサンプルサイズが含まれます。
期待の最大化とCrowdTruthは、特定のパラメータ条件下での多数決よりも有利になる可能性が高い。
論文 参考訳(メタデータ) (2021-02-16T22:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。