論文の概要: Application of Ideal Observer for Thresholded Data in Search Task
- arxiv url: http://arxiv.org/abs/2601.07976v1
- Date: Mon, 12 Jan 2026 20:18:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.935049
- Title: Application of Ideal Observer for Thresholded Data in Search Task
- Title(参考訳): 探索作業における閾値データに対する理想オブザーバの適用
- Authors: Hongwei Lin, Howard C. Gifford,
- Abstract要約: この研究は、人為的な閾値付きビジュアルサーチモデルオブザーバを開発することにより、タスクベースの画像品質評価を推し進める。
このモデルは、人間の視覚システムにインスパイアされた閾値付きデータに対する理想的なオブザーバーであり、高精細な特徴を選択的に処理することで、識別性能を向上させることができる。
- 参考スコア(独自算出の注目度): 2.657021668387188
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study advances task-based image quality assessment by developing an anthropomorphic thresholded visual-search model observer. The model is an ideal observer for thresholded data inspired by the human visual system, allowing selective processing of high-salience features to improve discrimination performance. By filtering out irrelevant variability, the model enhances diagnostic accuracy and computational efficiency. The observer employs a two-stage framework: candidate selection and decision-making. Using thresholded data during candidate selection refines regions of interest, while stage-specific feature processing optimizes performance. Simulations were conducted to evaluate the effects of thresholding on feature maps, candidate localization, and multi-feature scenarios. Results demonstrate that thresholding improves observer performance by excluding low-salience features, particularly in noisy environments. Intermediate thresholds often outperform no thresholding, indicating that retaining only relevant features is more effective than keeping all features. Additionally, the model demonstrates effective training with fewer images while maintaining alignment with human performance. These findings suggest that the proposed novel framework can predict human visual search performance in clinically realistic tasks and provide solutions for model observer training with limited resources. Our novel approach has applications in other areas where human visual search and detection tasks are modeled such as in computer vision, machine learning, defense and security image analysis.
- Abstract(参考訳): 本研究は,人為的なしきい値付きビジュアルサーチモデルオブザーバを開発することにより,タスクベースの画像品質評価を推し進める。
このモデルは、人間の視覚システムにインスパイアされた閾値付きデータに対する理想的なオブザーバーであり、高精細な特徴を選択的に処理することで、識別性能を向上させることができる。
無関係な変数をフィルタリングすることにより、モデルは診断精度と計算効率を向上させる。
オブザーバは、候補の選択と意思決定という2段階のフレームワークを採用している。
候補選択中にしきい値データを使用すると、興味のある領域が洗練され、ステージ固有の特徴処理がパフォーマンスを最適化する。
特徴マップ,候補位置化,多機能シナリオに対するしきい値設定の効果を評価するためにシミュレーションを行った。
その結果,特に騒音環境下では,低濃度の特徴を排除して観測性能が向上することが示された。
中間のしきい値はしばしばしきい値よりも優れており、関連する特徴のみを保持することは、すべての特徴を維持するよりも効果的であることを示している。
さらに、このモデルは、人間のパフォーマンスとの整合性を保ちながら、少ない画像で効果的なトレーニングを実演する。
これらの結果から,本提案フレームワークは,臨床的に現実的なタスクにおける人間の視覚的探索性能を予測し,限られたリソースでモデルオブザーバトレーニングを行うためのソリューションを提供する可能性が示唆された。
我々の新しいアプローチは、コンピュータビジョン、機械学習、防衛、セキュリティ画像解析など、人間の視覚検索と検出タスクがモデル化される他の分野にも応用されている。
関連論文リスト
- Likelihood ratio for a binary Bayesian classifier under a noise-exclusion model [0.0]
我々は,最小抽出可能な画像特徴にしきい値を置くことで,全体論的視覚探索(gist)処理を行う新しい統計的理想オブザーバモデルを開発した。
この新しいフレームワークの応用は、医用画像認識、コンピュータビジョン、ベンチマーク性能、特徴選択/評価を可能にすることである。
論文 参考訳(メタデータ) (2026-01-12T20:25:12Z) - Human Scanpath Prediction in Target-Present Visual Search with Semantic-Foveal Bayesian Attention [49.99728312519117]
SemBA-FASTは、ターゲットの視覚検索における人間の視覚的注意を予測するためのトップダウンフレームワークである。
我々は、COCO-Search18ベンチマークデータセット上でSemBA-FASTを評価し、その性能を他のスキャンパス予測モデルと比較した。
これらの知見は、人間のような注意モデリングのためのセマンティック・フレーバー・確率的フレームワークの能力に関する貴重な知見を提供する。
論文 参考訳(メタデータ) (2025-07-24T15:19:23Z) - Benchmarking pig detection and tracking under diverse and challenging conditions [1.865175170209582]
オブジェクト検出のためのPigDetectと、マルチオブジェクト追跡のためのPigTrackの2つのデータセットをキュレートした。
対象物検出では,ランダムなサンプル画像のみを用いて達成可能なものよりも,困難なトレーニング画像により検出が向上することを示す。
マルチオブジェクト追跡において,SORTに基づく手法は,エンドツーエンドのトレーニング可能なモデルに比べて優れた検出性能が得られることを示した。
論文 参考訳(メタデータ) (2025-07-22T14:36:51Z) - Anomaly Detection Using Computer Vision: A Comparative Analysis of Class Distinction and Performance Metrics [0.0]
本研究は,OpenCVとディープラーニング技術を組み合わせたクラス区別と性能評価に焦点を当てた。
この制度は、権限のある人(管理者)、侵入者、非人間的存在の3つの階級を効果的に区別する。
論文 参考訳(メタデータ) (2025-03-24T19:36:47Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.067146460271466]
視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文 参考訳(メタデータ) (2024-12-10T18:52:39Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Automated Deception Detection from Videos: Using End-to-End Learning
Based High-Level Features and Classification Approaches [0.0]
深層学習と識別モデルを組み合わせたマルチモーダル手法を提案する。
我々は畳み込み学習を用いて、視線、頭ポーズ、表情を解析する。
提案手法は, 経済要因による新しいローリングディース実験を含む5つのデータセットで評価される。
論文 参考訳(メタデータ) (2023-07-13T08:45:15Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。