論文の概要: Measuring and Predicting Where and When Pathologists Focus their Visual Attention while Grading Whole Slide Images of Cancer
- arxiv url: http://arxiv.org/abs/2508.01668v1
- Date: Sun, 03 Aug 2025 08:53:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.997673
- Title: Measuring and Predicting Where and When Pathologists Focus their Visual Attention while Grading Whole Slide Images of Cancer
- Title(参考訳): がん全スライド画像の撮影中に病理医が視力に焦点をあてる場所と時期を計測・予測する
- Authors: Souradeep Chakraborty, Ruoyu Xue, Rajarsi Gupta, Oksana Yaskiv, Constantin Friedman, Natallia Sheuka, Dana Perez, Paul Friedman, Won-Tak Choi, Waqas Mahmud, Beatrice Knudsen, Gregory Zelinsky, Joel Saltz, Dimitris Samaras,
- Abstract要約: 本研究は,前立腺癌のスライディング画像を評価することによって,病理学者の注意の動きを予測する手法を開発した。
このモデルから開発されたツールは、病理研修生が専門家のように読書中に注意を配るのを助けることができる。
- 参考スコア(独自算出の注目度): 15.910358358714165
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to predict the attention of expert pathologists could lead to decision support systems for better pathology training. We developed methods to predict the spatio-temporal (where and when) movements of pathologists' attention as they grade whole slide images (WSIs) of prostate cancer. We characterize a pathologist's attention trajectory by their x, y, and m (magnification) movements of a viewport as they navigate WSIs using a digital microscope. This information was obtained from 43 pathologists across 123 WSIs, and we consider the task of predicting the pathologist attention scanpaths constructed from the viewport centers. We introduce a fixation extraction algorithm that simplifies an attention trajectory by extracting fixations in the pathologist's viewing while preserving semantic information, and we use these pre-processed data to train and test a two-stage model to predict the dynamic (scanpath) allocation of attention during WSI reading via intermediate attention heatmap prediction. In the first stage, a transformer-based sub-network predicts the attention heatmaps (static attention) across different magnifications. In the second stage, we predict the attention scanpath by sequentially modeling the next fixation points in an autoregressive manner using a transformer-based approach, starting at the WSI center and leveraging multi-magnification feature representations from the first stage. Experimental results show that our scanpath prediction model outperforms chance and baseline models. Tools developed from this model could assist pathology trainees in learning to allocate their attention during WSI reading like an expert.
- Abstract(参考訳): 専門的な病理医の注意を予測できる能力は、より良い病理学訓練のための意思決定支援システムに繋がる可能性がある。
前立腺癌のスライス画像全体(WSI)を解析し,病理医の注意の時空間移動を予測する手法を開発した。
我々は、デジタル顕微鏡を用いてWSIをナビゲートするビューポートのx, y, mの動きによって、病理医の注意軌跡を特徴づける。
この情報は,123のWSIを横断する43人の病理学者から得られたものであり,ビューポートセンターから構築された病理学者の注意スキャンパスを予測する作業について考察した。
本稿では,病理医の視線から注意線を抽出し,意味情報を保存しながら注意線を簡易化する固定抽出アルゴリズムを導入し,これらの前処理データを用いて2段階モデルのトレーニングとテストを行い,WSI読影時の注意線の動的(走査)配分を中間注意熱マップ予測を介して予測する。
第1段階では、トランスフォーマーベースのサブネットワークが、異なる倍率間での注意熱マップ(静的アテンション)を予測する。
第2段階では,WSIセンターから開始するトランスフォーマー方式を用いて,次の固定点を連続的に自己回帰的にモデル化し,第1段階から複数画像の特徴表現を活用することにより,注目走査パスを予測する。
実験結果から,我々のスキャンパス予測モデルは,確率モデルやベースラインモデルよりも優れていた。
このモデルから開発されたツールは、病理研修生が専門家のようにWSIを読んでいる間に注意を配るのを助けることができる。
関連論文リスト
- Human Scanpath Prediction in Target-Present Visual Search with Semantic-Foveal Bayesian Attention [49.99728312519117]
SemBA-FASTは、ターゲットの視覚検索における人間の視覚的注意を予測するためのトップダウンフレームワークである。
我々は、COCO-Search18ベンチマークデータセット上でSemBA-FASTを評価し、その性能を他のスキャンパス予測モデルと比較した。
これらの知見は、人間のような注意モデリングのためのセマンティック・フレーバー・確率的フレームワークの能力に関する貴重な知見を提供する。
論文 参考訳(メタデータ) (2025-07-24T15:19:23Z) - Semantic Segmentation for Preoperative Planning in Transcatheter Aortic Valve Replacement [61.573750959726475]
経カテーテル大動脈弁置換術(TAVR)の術前計画のための医療ガイドラインを考察し,セマンティックセグメンテーションモデルを用いて支援できる課題を同定する。
まず, 細粒度のTAVR関連擬似ラベルを, 粗粒度の解剖学的情報から抽出し, セグメンテーションモデルを訓練し, スキャンでこれらの構造がどれだけよく見つかるかを定量化する。
論文 参考訳(メタデータ) (2025-07-22T13:24:45Z) - EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.66329903007869]
本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。
解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。
200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文 参考訳(メタデータ) (2025-04-17T16:19:05Z) - PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - Multimodal Learning and Cognitive Processes in Radiology: MedGaze for Chest X-ray Scanpath Prediction [10.388541520456714]
提案システムは,放射線学報告やCXR画像から視線シーケンスを予測することを目的としている。
本モデルでは, 医用スキャンパス予測において重要な固定座標と期間を予測し, コンピュータビジョンコミュニティにおける既存モデルよりも優れていた。
放射線学者の評価に基づいて、MedGazeは関連する領域に焦点をあてたヒトのような視線配列を生成することができる。
論文 参考訳(メタデータ) (2024-06-28T06:38:58Z) - Self-Contrastive Weakly Supervised Learning Framework for Prognostic Prediction Using Whole Slide Images [3.6330373579181927]
予測は、基底の真理ラベルが本質的に弱いため、独特な挑戦となる。
そこで本研究では, ネットワークを用いた組織分割アルゴリズムを用いて, 関心領域の抽出を行う新しい3部フレームワークを提案する。
AUCは再発率0.721, 再発率0.678, 治療成績予測は0.678であった。
論文 参考訳(メタデータ) (2024-05-24T06:45:36Z) - Decoding the visual attention of pathologists to reveal their level of expertise [20.552161727506235]
本研究は, がん検診における注意の配分方法に基づいて, 病理医の専門知識を分類する手法を提案する。
読み上げ中の病理学者の注意のみに基づいて、我々のモデルは75.3%、56.1%、77.2%の精度で彼らの専門知識のレベルを予測することができた。
論文 参考訳(メタデータ) (2024-03-25T23:03:51Z) - An Inter-observer consistent deep adversarial training for visual
scanpath prediction [66.46953851227454]
本稿では,軽量なディープニューラルネットワークによるスキャンパス予測のための,サーバ間一貫した対向トレーニング手法を提案する。
我々は、最先端の手法に関して、我々のアプローチの競争力を示す。
論文 参考訳(メタデータ) (2022-11-14T13:22:29Z) - End-to-end Learning for Image-based Detection of Molecular Alterations
in Digital Pathology [1.916179040410189]
デジタル病理学におけるスライド画像全体(WSI)の分類への現在のアプローチは、主に2段階学習パイプラインを利用している。
このようなアプローチの大きな欠点は、臨床ルーチンで取得されていないタスク固有の補助ラベルの要件である。
本稿では,WSI分類のための新しい学習パイプラインを提案する。
論文 参考訳(メタデータ) (2022-06-30T20:30:33Z) - Scanpath Prediction on Information Visualisations [19.591855190022667]
本稿では,情報視覚化における視覚的満足度とスキャンパスの予測を学習するモデルを提案する。
一般的なMASSVISデータセット上で,様々な情報可視化要素に対する視線行動の詳細な解析を行う。
論文 参考訳(メタデータ) (2021-12-04T13:59:52Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。