論文の概要: Maximum Matching Accuracy: An Instance Segmentation Evaluation Metric Utilizing Globally Optimal Matching
- arxiv url: http://arxiv.org/abs/2606.10107v1
- Date: Mon, 08 Jun 2026 19:36:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.158913
- Title: Maximum Matching Accuracy: An Instance Segmentation Evaluation Metric Utilizing Globally Optimal Matching
- Title(参考訳): 最大マッチング精度:グローバル最適マッチングを利用したインスタンスセグメンテーション評価指標
- Authors: Kaden Stillwagon, Alexandra D. VandeLoo, Craig R. Forest,
- Abstract要約: 本研究では,予測された真理オブジェクトと地上の真理オブジェクトの1対1の大域的最適マッチングを求める閾値フリー連続計量を提案する。
MMAは既存の代替品よりも安定で、感度が高く、解釈しやすいスコアを生成する。
- 参考スコア(独自算出の注目度): 39.3098730337656
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable evaluation of instance segmentation models requires metrics that accurately and consistently reflect segmentation quality. However, the metrics most widely used in biological imaging carry fundamental mathematical weaknesses: hard Intersection-over-Union (IoU) thresholds that produce discontinuous, low sensitivity scoring; per-object normalization that distorts scores under object size variation; and greedy or one-to-many matching procedures that yield non-optimal, order-dependent correspondences. Together, these properties produce unintuitive and unreliable model rankings under common failure modes such as split cells, merged cells, and cell boundary imprecision. We propose Maximum Matching Accuracy (MMA), a threshold-free continuous metric that finds a globally optimal one-to-one matching between predicted and ground truth objects and aggregates total overlap using per-pixel normalization. We evaluate MMA against AP@50, PQ, SEG, and AJI across three experiments: synthetic failure cases, progressive corruption tests, and a model ranking comparison. MMA produces scores that are more stable, more sensitive, and more interpretable than existing alternatives, providing a principled foundation for fair instance segmentation benchmarking in biological cell imaging.
- Abstract(参考訳): インスタンスセグメンテーションモデルの信頼性評価には、セグメンテーションの品質を正確かつ一貫して反映するメトリクスが必要である。
しかしながら、生体イメージングで最も広く使われている指標は、不連続で感度の低いスコアを生成する硬いインターセクション・オーバー・ユニオン(IoU)閾値、オブジェクトサイズの変化の下でスコアを歪ませるオブジェクトごとの正規化、最適でない順序に依存しない対応をもたらすグレディまたは1対多のマッチング手順である。
これらの特性は、分割された細胞、マージされた細胞、および細胞の境界不整合といった共通の障害モードの下で、直感的で信頼性の低いモデルランキングを生成する。
我々は,予測された真理オブジェクトと地上の真理オブジェクト間の大域的に最適な1対1マッチングを見つけ,ピクセル当たりの正規化を用いて総重なり合いを集約する閾値のない連続計量である最大マッチング精度(MMA)を提案する。
我々は,AP@50,PQ,SEG,AJIに対するMMAを,合成故障事例,プログレッシブ汚職検査,モデルランキング比較の3つの実験で評価した。
MMAは、既存の代替品よりも安定で、より感度が高く、解釈可能なスコアを生成し、生物学的な細胞イメージングにおける公正なインスタンスセグメンテーションベンチマークの基盤となる。
関連論文リスト
- When Metrics Disagree: A Meta-Analysis of Knowledge-Graph-Completion Model Benchmarking [0.0]
本稿では, 整合性, クロスデータセット安定性, 距離独立性, 雑音下での頑健性, 一般化性という, 5つのテストにまたがる7つのアグリゲータのメタ分析について述べる。
Across tail $(h,r,?)$ and relation $(h,?,t)$ prediction, Z-score is the most balanced aggregator, which rank of DualE highest for tail prediction, FMS highest for relation prediction。
このフレームワークは、評価の不整合を解消し、KGCにおけるアグリゲータの選択とモデルベンチマークのためのエビデンスベースのガイダンスを提供する。
論文 参考訳(メタデータ) (2026-06-09T01:20:43Z) - Efficient Detection of Bad Benchmark Items with Novel Scalability Coefficients [3.058685580689604]
異方性回帰に基づく非パラメトリックな拡張係数の新たなファミリを導入する。
中心的な寄与は符号付きイソトニック$R2$であり、これは説明可能な1つの項目における分散の最大比率を測定する。
符号付き等方性$R2$は単調予測器の中で極端であることを示す。
論文 参考訳(メタデータ) (2026-03-26T03:47:49Z) - Revisiting OmniAnomaly for Anomaly Detection: performance metrics and comparison with PCA-based models [0.08155575318208629]
この研究は、MSSADの広く使われているリカレントモデルであるOmniAnomalyを再検討し、主成分分析に基づく単純な線形ベースラインと比較する。
どちらの手法もしきい値と評価手順で評価され、データセット内の28台のマシン毎に100回のラン毎に実験が繰り返される。
その結果,OmniAnomalyに匹敵する性能を達成でき,点調整が適用されない場合にも性能が向上することを示した。
論文 参考訳(メタデータ) (2026-03-19T14:54:38Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Model-based clustering of partial records [11.193504036335503]
観測値の限界密度を用いたモデルベースの手法でクラスタリング手法を開発しています。
提案アルゴリズムは,不完全データセットの欠落値を考慮した,対応する全期待最大化(EM)手法と比較する。
シミュレーション研究により,本手法は実クラスタ分割の回復に有利であることが示された。
論文 参考訳(メタデータ) (2021-03-30T13:30:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。