論文の概要: Reproducibility in Multiple Instance Learning: A Case For Algorithmic
Unit Tests
- arxiv url: http://arxiv.org/abs/2310.17867v1
- Date: Fri, 27 Oct 2023 03:05:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-30 14:56:01.941056
- Title: Reproducibility in Multiple Instance Learning: A Case For Algorithmic
Unit Tests
- Title(参考訳): 複数インスタンス学習における再現性:アルゴリズムユニットテストの場合
- Authors: Edward Raff, James Holt
- Abstract要約: 多重インスタンス学習(MIL)は、正と負のラベルと入力の「バグ」を持つ分類問題のサブドメインである。
本研究では,最も顕著な深層MILモデルの5つについて検討し,いずれも標準MILの仮定を尊重していないことを明らかにする。
提案した"アルゴリズムユニットテスト"によってこの問題を特定し,実証する。そこでは,MILを尊重するモデルによって解決可能な,合成データセットを作成する。
- 参考スコア(独自算出の注目度): 59.623267208433255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multiple Instance Learning (MIL) is a sub-domain of classification problems
with positive and negative labels and a "bag" of inputs, where the label is
positive if and only if a positive element is contained within the bag, and
otherwise is negative. Training in this context requires associating the
bag-wide label to instance-level information, and implicitly contains a causal
assumption and asymmetry to the task (i.e., you can't swap the labels without
changing the semantics). MIL problems occur in healthcare (one malignant cell
indicates cancer), cyber security (one malicious executable makes an infected
computer), and many other tasks. In this work, we examine five of the most
prominent deep-MIL models and find that none of them respects the standard MIL
assumption. They are able to learn anti-correlated instances, i.e., defaulting
to "positive" labels until seeing a negative counter-example, which should not
be possible for a correct MIL model. We suspect that enhancements and other
works derived from these models will share the same issue. In any context in
which these models are being used, this creates the potential for learning
incorrect models, which creates risk of operational failure. We identify and
demonstrate this problem via a proposed "algorithmic unit test", where we
create synthetic datasets that can be solved by a MIL respecting model, and
which clearly reveal learning that violates MIL assumptions. The five evaluated
methods each fail one or more of these tests. This provides a model-agnostic
way to identify violations of modeling assumptions, which we hope will be
useful for future development and evaluation of MIL models.
- Abstract(参考訳): MIL(Multiple Instance Learning)は、正のラベルと負のラベルを持つ分類問題のサブドメインであり、そのラベルが正であることと、正の要素がバッグ内に含まれており、そうでなければ負の値である場合に限る。
この文脈でのトレーニングでは、バッグワイドなラベルをインスタンスレベルの情報に関連付け、暗黙的にタスクに因果的な仮定と非対称性を含む必要があります。
MILの問題は、医療(悪性細胞はがんを示す)、サイバーセキュリティ(悪意のある実行可能ファイルが感染するコンピュータを作る)、その他多くのタスクで発生する。
本研究では,最も顕著な深層MILモデルの5つについて検討し,いずれも標準MILの仮定を尊重していないことを明らかにする。
彼らは、正のMILモデルでは不可能な負の反例を見るまで「正」ラベルをデフォルトとする反相関のインスタンスを学習することができる。
これらのモデルから派生した拡張やその他の作業が、同じ問題を共有するのではないかと考えています。
これらのモデルが使用されている状況において、これは誤ったモデルを学ぶ可能性を生み出し、運用上の失敗のリスクを生じさせる。
提案した「アルゴリズム単体テスト」によってこの問題を特定し実証し、MILを尊重するモデルで解決可能な合成データセットを作成し、MILの仮定に反する学習を明らかにする。
評価された5つのメソッドはそれぞれ1つ以上のテストに失敗します。
これは、モデリング前提の違反を特定するためのモデルに依存しない方法であり、将来のMILモデルの開発と評価に役立ちたいと考えています。
関連論文リスト
- Mitigating Reversal Curse in Large Language Models via Semantic-aware Permutation Training [57.771940716189114]
我々は、大きな言語モデル(LLM)が「逆の呪い」に苦しむことを示す。
逆の呪いの根本原因は、訓練と推論の段階で異なる単語順にある。
この問題に対処するために,SPT(Semantic-Aware Permutation Training)を提案する。
論文 参考訳(メタデータ) (2024-03-01T18:55:20Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Multiple Instance Learning Framework with Masked Hard Instance Mining
for Whole Slide Image Classification [11.996318969699296]
マスケードハードインスタンスマイニング(MHIM-MIL)について紹介する。
MHIM-MILは、潜在的なハードインスタンスを探索するために一貫性のある制約を持つシームズ構造(Teacher-Student)を使用する。
CAMELYON-16およびTCGA肺がんデータセットの実験結果は、MHIM-MILがパフォーマンスとトレーニングコストの点で他の最新の方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-07-28T01:40:04Z) - ProMIL: Probabilistic Multiple Instance Learning for Medical Imaging [13.355864185650745]
マルチインスタンスラーニング(MIL)は、ひとつのラベルがインスタンスの袋全体に割り当てられる弱い教師付き問題である。
本稿では,深層ニューラルネットワークとBernstein推定に基づく,ProMILと呼ばれる専用インスタンスベースの手法を提案する。
実世界の医療応用において, ProMIL は標準的なインスタンスベースの MIL よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-18T11:56:52Z) - Unbiased Multiple Instance Learning for Weakly Supervised Video Anomaly
Detection [74.80595632328094]
弱監視ビデオ異常検出(WSVAD)における多重インスタンス学習(MIL)の優位性
We propose a new MIL framework: Unbiased MIL (UMIL) to learn unbiased anomaly features that improve WSVAD。
論文 参考訳(メタデータ) (2023-03-22T08:11:22Z) - Feature Re-calibration based MIL for Whole Slide Image Classification [7.92885032436243]
全スライド画像(WSI)分類は疾患の診断と治療の基本的な課題である。
本稿では,WSI バッグ (インスタンス) の分布を,最大インスタンス (クリティカル) 特性の統計値を用いて再校正することを提案する。
位置符号化モジュール(PEM)を用いて空間・形態情報をモデル化し,マルチヘッド自己アテンション(PSMA)をトランスフォーマーエンコーダでプーリングする。
論文 参考訳(メタデータ) (2022-06-22T07:00:39Z) - Model Agnostic Interpretability for Multiple Instance Learning [7.412445894287708]
MIL(Multiple Instance Learning)では、モデルはインスタンスのバッグを使用してトレーニングされる。
本研究では,MILモデルを解釈するための重要な要件を確立する。
そして、これらの要件を満たすいくつかのモデルに依存しないアプローチを開発します。
論文 参考訳(メタデータ) (2022-01-27T17:55:32Z) - CIL: Contrastive Instance Learning Framework for Distantly Supervised
Relation Extraction [52.94486705393062]
我々は、典型的なマルチインスタンス学習(MIL)フレームワークを超えて、新しいコントラッシブ・インスタンス学習(CIL)フレームワークを提案する。
具体的には、初期MILをリレーショナルトリプルエンコーダと各インスタンスに対する負のペアに対する制約正のペアとみなす。
提案手法の有効性を実験的に検証し, 提案手法をNYT10, GDS, KBPで比較検討した。
論文 参考訳(メタデータ) (2021-06-21T04:51:59Z) - Dual-stream Multiple Instance Learning Network for Whole Slide Image
Classification with Self-supervised Contrastive Learning [16.84711797934138]
スライド画像全体分類(WSI)の課題に対処する。
WSI分類は、スライドレベルラベルのみが利用可能である場合、多重インスタンス学習(MIL)問題としてキャストすることができる。
局所アノテーションを必要としないWSI分類と腫瘍検出のためのMILベースの手法を提案する。
論文 参考訳(メタデータ) (2020-11-17T20:51:15Z) - Weakly-Supervised Action Localization with Expectation-Maximization
Multi-Instance Learning [82.41415008107502]
弱教師付きアクションローカライゼーションでは、ビデオレベルアクションラベルのみを与えられたビデオ内のアクションセグメントをローカライズするモデルをトレーニングする必要がある。
バッグ(ビデオ)には複数のインスタンス(アクションセグメント)が含まれている。
我々のEM-MILアプローチは、学習目標とMIL仮定の両方をより正確にモデル化することを示します。
論文 参考訳(メタデータ) (2020-03-31T23:36:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。