論文の概要: Predicting Region of Interest in Human Visual Search Based on Statistical Texture and Gabor Features
- arxiv url: http://arxiv.org/abs/2601.07998v1
- Date: Mon, 12 Jan 2026 21:06:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.94655
- Title: Predicting Region of Interest in Human Visual Search Based on Statistical Texture and Gabor Features
- Title(参考訳): 統計的テクスチャとガバー特徴に基づく人間の視覚検索における関心領域の予測
- Authors: Hongwei Lin, Diego Andrade, Mini Das, Howard C. Gifford,
- Abstract要約: 初期視覚探索行動のモデル化において,Gabor-based features と Grag-level co-occurrence matrix (GLCM) based texture features の関係について検討した。
GaborとGLCMの機能を統合するために,2つの機能結合パイプラインが提案されている。
- 参考スコア(独自算出の注目度): 2.444076158087882
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding human visual search behavior is a fundamental problem in vision science and computer vision, with direct implications for modeling how observers allocate attention in location-unknown search tasks. In this study, we investigate the relationship between Gabor-based features and gray-level co-occurrence matrix (GLCM) based texture features in modeling early-stage visual search behavior. Two feature-combination pipelines are proposed to integrate Gabor and GLCM features for narrowing the region of possible human fixations. The pipelines are evaluated using simulated digital breast tomosynthesis images. Results show qualitative agreement among fixation candidates predicted by the proposed pipelines and a threshold-based model observer. A strong correlation is observed between GLCM mean and Gabor feature responses, indicating that these features encode related image information despite their different formulations. Eye-tracking data from human observers further suggest consistency between predicted fixation regions and early-stage gaze behavior. These findings highlight the value of combining structural and texture-based features for modeling visual search and support the development of perceptually informed observer models.
- Abstract(参考訳): 人間の視覚的な探索行動を理解することは、視覚科学とコンピュータビジョンの基本的な問題であり、観察者が位置不明の探索タスクにどのように注意を割り当てるかのモデリングに直接的な意味を持つ。
本研究では,早期視覚探索行動のモデル化において,ガボルの特徴とグレーレベル共起行列(GLCM)のテクスチャ特徴との関係について検討した。
GaborとGLCMの機能を統合するために,2つの機能結合パイプラインが提案されている。
シミュレーションされた乳房トモシンセシス画像を用いてパイプラインの評価を行った。
提案したパイプラインとしきい値に基づくモデルオブザーバによって予測される固定候補間の定性的な一致を示す。
GLCM平均値とGabor特徴値との間には強い相関関係がみられ,これらの特徴が異なる定式化にもかかわらず関連画像情報をエンコードしていることを示す。
人間の観察者による視線追跡データは、予測された固定領域と早期の視線行動との整合性をさらに示唆している。
これらの知見は,視覚探索をモデル化するための構造的特徴とテクスチャ的特徴を組み合わせることの価値を強調し,知覚情報に基づくオブザーバモデルの開発を支援する。
関連論文リスト
- Human Scanpath Prediction in Target-Present Visual Search with Semantic-Foveal Bayesian Attention [49.99728312519117]
SemBA-FASTは、ターゲットの視覚検索における人間の視覚的注意を予測するためのトップダウンフレームワークである。
我々は、COCO-Search18ベンチマークデータセット上でSemBA-FASTを評価し、その性能を他のスキャンパス予測モデルと比較した。
これらの知見は、人間のような注意モデリングのためのセマンティック・フレーバー・確率的フレームワークの能力に関する貴重な知見を提供する。
論文 参考訳(メタデータ) (2025-07-24T15:19:23Z) - Out-of-Distribution Detection on Graphs: A Survey [58.47395497985277]
グラフアウト・オブ・ディストリビューション(GOOD)検出は、トレーニング中に見られる分布から逸脱するグラフデータを特定することに焦点を当てる。
既存の手法を,拡張ベース,再構築ベース,情報伝達ベース,分類ベースという4つのタイプに分類する。
本稿では,グラフデータによるユニークな課題を浮き彫りにして,実践的応用と理論的基礎について論じる。
論文 参考訳(メタデータ) (2025-02-12T04:07:12Z) - GazeFusion: Saliency-Guided Image Generation [50.37783903347613]
拡散モデルは、テキストプロンプトだけを前提として、前例のない画像生成能力を提供する。
本稿では,人間の視覚的注意機構のデータ先行を生成プロセスに組み込むためのサリエンシ誘導フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-16T21:01:35Z) - The Paradox of Motion: Evidence for Spurious Correlations in
Skeleton-based Gait Recognition Models [4.089889918897877]
本研究は、視覚に基づく歩行認識が主に動きパターンに依存しているという一般的な仮定に挑戦する。
高さ情報の除去が顕著な性能低下につながることを比較分析により示す。
本研究では,時間的情報を無視して個々のポーズを処理する空間変換器モデルを提案する。
論文 参考訳(メタデータ) (2024-02-13T09:33:12Z) - Relational Prior Knowledge Graphs for Detection and Instance
Segmentation [24.360473253478112]
本稿では,先行値を用いたオブジェクト機能拡張グラフを提案する。
COCOの実験的評価は、リレーショナル先行で拡張されたシーングラフの利用は、オブジェクト検出とインスタンスセグメンテーションの利点をもたらすことを示している。
論文 参考訳(メタデータ) (2023-10-11T15:15:05Z) - Knowledge Propagation over Conditional Independence Graphs [2.2721854258621064]
条件独立(CI)グラフは特徴間の依存をキャプチャする。
本稿では,CIグラフ上で知識伝達を行うアルゴリズムを提案する。
実験により,我々の技術は一般公開されたColaおよびPubMedデータセットの最先端性の向上を実証した。
論文 参考訳(メタデータ) (2023-08-10T21:06:18Z) - Message Intercommunication for Inductive Relation Reasoning [49.731293143079455]
我々はMINESと呼ばれる新しい帰納的関係推論モデルを開発した。
隣り合う部分グラフにメッセージ通信機構を導入する。
我々の実験は、MINESが既存の最先端モデルより優れていることを示している。
論文 参考訳(メタデータ) (2023-05-23T13:51:46Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - Causal Discovery in Physical Systems from Videos [123.79211190669821]
因果発見は人間の認知の中心にある。
本研究では,ビデオの因果発見の課題を,地層構造を監督せずにエンドツーエンドで検討する。
論文 参考訳(メタデータ) (2020-07-01T17:29:57Z) - A Meta-Bayesian Model of Intentional Visual Search [0.0]
本稿では,分類的知覚とササード計画の根底にある神経機構のベイズ的解釈を取り入れたビジュアルサーチの計算モデルを提案する。
擬似行動と人的行動の有意義な比較を可能にするため、参加者は視線に追従する窓から隠蔽されたMNIST桁を分類する必要がある。
本モデルは,観察された人間の行動から主観的パラメータを回収し,高い解釈可能性を維持しながら,分類精度などの人間の行動指標を再カプセル化することができる。
論文 参考訳(メタデータ) (2020-06-05T16:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。