論文の概要: Error Discovery by Clustering Influence Embeddings
- arxiv url: http://arxiv.org/abs/2312.04712v1
- Date: Thu, 7 Dec 2023 21:42:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 16:59:15.182279
- Title: Error Discovery by Clustering Influence Embeddings
- Title(参考訳): クラスタリングインフルエントによるエラー検出
- Authors: Fulton Wang, Julius Adebayo, Sarah Tan, Diego Garcia-Olano, Narine
Kokhlikyan
- Abstract要約: 本稿では,モデルが性能の低いテスト例群(スライス)を識別する手法を提案する。
我々はコヒーレンスを任意のスライス発見法が満たすべき重要な特性として定式化する。
InfEmbedという新しいスライス発見手法を考案し、トレーニングデータに類似した影響を受けているスライスを返却することでコヒーレンスを満足する。
- 参考スコア(独自算出の注目度): 7.27282591214364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a method for identifying groups of test examples -- slices -- on
which a model under-performs, a task now known as slice discovery. We formalize
coherence -- a requirement that erroneous predictions, within a slice, should
be wrong for the same reason -- as a key property that any slice discovery
method should satisfy. We then use influence functions to derive a new slice
discovery method, InfEmbed, which satisfies coherence by returning slices whose
examples are influenced similarly by the training data. InfEmbed is simple, and
consists of applying K-Means clustering to a novel representation we deem
influence embeddings. We show InfEmbed outperforms current state-of-the-art
methods on 2 benchmarks, and is effective for model debugging across several
case studies.
- Abstract(参考訳): そこで本研究では,現在スライス発見と呼ばれる課題であるモデルアンダーパフォーマンスの試験例群(スライス)を同定する手法を提案する。
我々は、スライス発見メソッドが満たすべき重要な特性として、コヒーレンス(コヒーレンス) -- スライス内の誤った予測が同じ理由で間違っているという要件を定式化します。
次に、インフルエンス関数を用いて新しいスライス探索法InfEmbedを導出し、トレーニングデータに類似した影響を受けているスライスを返却することでコヒーレンスを満たす。
InfEmbed は単純で、K-Means クラスタリングを新しい表現に適用することで構成される。
2つのベンチマークで現在の最先端メソッドを上回っており、いくつかのケーススタディでモデルのデバッグに有効である。
関連論文リスト
- Error Slice Discovery via Manifold Compactness [47.57891946791078]
事前に定義されたスライスラベルのような余分な情報に頼ることなく、スライスコヒーレンスの適切なメトリックは存在しない。
本稿では,データ幾何特性を設計に組み込むことにより,余分な情報に依存しないコヒーレンス計量である多様体コンパクト性を提案する。
そこで我々は,リスクとコヒーレンスを直接最適化対象とする新しいアルゴリズムであるManifold Compactness based error Slice Discovery (MCSD)を開発した。
論文 参考訳(メタデータ) (2025-01-31T11:02:07Z) - Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition [34.4463059961465]
MAR(Micro-Action Recognition)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担っているため、注目を集めている。
現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。
我々は,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(textbfPCAN)を提案する。
論文 参考訳(メタデータ) (2024-12-19T10:41:24Z) - Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.755154033324374]
データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。
本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。
対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文 参考訳(メタデータ) (2024-12-18T03:03:15Z) - Scalable Influence and Fact Tracing for Large Language Model Pretraining [14.598556308631018]
トレーニングデータ属性(TDA)メソッドは、特定のトレーニング例にモデル出力を振り返ることを目的としている。
我々は,既存の勾配法を改良し,大規模に効果的に機能させる。
我々は、インプロンプトセットとモデルアウトプットをWebベースの可視化ツールとともにリリースし、影響力のある例を探索します。
論文 参考訳(メタデータ) (2024-10-22T20:39:21Z) - Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。
既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。
アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文 参考訳(メタデータ) (2024-03-19T18:57:53Z) - Where Does My Model Underperform? A Human Evaluation of Slice Discovery
Algorithms [24.127380328812855]
新しいスライス発見アルゴリズムは、データの一貫性と高いエラーのサブセットをグループ化することを目的としている。
2つの最先端スライス探索アルゴリズムによって出力される40個のスライスをユーザに示し、オブジェクト検出モデルに関する仮説を作成するよう依頼する。
以上の結果から,これらのツールが素直なベースラインよりも有益であることを示すとともに,仮説形成段階においてユーザが直面する課題にも光を当てることができた。
論文 参考訳(メタデータ) (2023-06-13T22:44:53Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Smoothed Embeddings for Certified Few-Shot Learning [63.68667303948808]
我々はランダムな平滑化を数ショットの学習モデルに拡張し、入力を正規化された埋め込みにマッピングする。
この結果は、異なるデータセットの実験によって確認される。
論文 参考訳(メタデータ) (2022-02-02T18:19:04Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z) - Contrastive Prototype Learning with Augmented Embeddings for Few-Shot
Learning [58.2091760793799]
拡張埋め込み(CPLAE)モデルを用いた新しいコントラスト型プロトタイプ学習を提案する。
クラスプロトタイプをアンカーとして、CPLは、同じクラスのクエリサンプルを、異なるクラスのサンプルを、さらに遠くに引き出すことを目的としている。
いくつかのベンチマークによる大規模な実験により,提案したCPLAEが新たな最先端を実現することが示された。
論文 参考訳(メタデータ) (2021-01-23T13:22:44Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。