論文の概要: Discovering Salient Anatomical Landmarks by Predicting Human Gaze
- arxiv url: http://arxiv.org/abs/2001.08188v1
- Date: Wed, 22 Jan 2020 18:17:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:32:16.176033
- Title: Discovering Salient Anatomical Landmarks by Predicting Human Gaze
- Title(参考訳): 人間の視線予測による解剖学的特徴の発見
- Authors: Richard Droste, Pierre Chatelain, Lior Drukker, Harshita Sharma, Aris
T. Papageorghiou, J. Alison Noble
- Abstract要約: 医用画像中の解剖学的特徴を自動的に発見し,局所化する手法を提案する。
具体的には、人間の視覚的注意を引き付けるランドマークについて検討する。
得られたランドマークは, 胎児頭部長軸長の4.1%から10.9%の間で平均的なランドマークアライメント誤差を有するアフィン画像登録内で使用することができることを示す。
- 参考スコア(独自算出の注目度): 4.297988192695949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anatomical landmarks are a crucial prerequisite for many medical imaging
tasks. Usually, the set of landmarks for a given task is predefined by experts.
The landmark locations for a given image are then annotated manually or via
machine learning methods trained on manual annotations. In this paper, in
contrast, we present a method to automatically discover and localize anatomical
landmarks in medical images. Specifically, we consider landmarks that attract
the visual attention of humans, which we term visually salient landmarks. We
illustrate the method for fetal neurosonographic images. First, full-length
clinical fetal ultrasound scans are recorded with live sonographer
gaze-tracking. Next, a convolutional neural network (CNN) is trained to predict
the gaze point distribution (saliency map) of the sonographers on scan video
frames. The CNN is then used to predict saliency maps of unseen fetal
neurosonographic images, and the landmarks are extracted as the local maxima of
these saliency maps. Finally, the landmarks are matched across images by
clustering the landmark CNN features. We show that the discovered landmarks can
be used within affine image registration, with average landmark alignment
errors between 4.1% and 10.9% of the fetal head long axis length.
- Abstract(参考訳): 解剖学的ランドマークは多くの医療画像のタスクにとって重要な前提条件である。
通常、与えられたタスクのランドマークのセットは専門家によって事前に定義されます。
与えられた画像のランドマーク位置は、手動または手動のアノテーションでトレーニングされた機械学習メソッドを介して注釈付けされる。
本稿では,医療画像中の解剖学的ランドマークを自動的に発見し,局所化する手法を提案する。
具体的には、人間の視覚的な注意を引くランドマークを考察し、それを視覚的にサルエントランドマークと呼ぶ。
胎児神経超音波画像診断法について述べる。
第1に, ライブソノグラフィーによる視線追跡を行い, 胎児超音波検査を行った。
次に、畳み込みニューラルネットワーク(cnn)を訓練し、走査ビデオフレーム上のソノグラフの視線分布(saliency map)を予測する。
その後、cnnは未発見の胎児の神経超音波画像の塩分マップを予測し、これらの塩分マップの局所的な最大値としてランドマークを抽出する。
最後に、ランドマークは、ランドマークCNN機能をクラスタリングすることで、画像間で一致します。
検出されたランドマークはアフィン画像登録内で使用でき、平均的なランドマークアライメント誤差は胎児の頭部長軸長の4.1%から10.9%である。
関連論文リスト
- Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images [0.8793721044482612]
本研究では,拡散確率モデル(DDPM)をランドマーク検出タスクに適用する新しい手法を提案する。
私たちの重要なイノベーションは、ランドマーク検出における自己教師付き事前トレーニングにDDPMを活用することです。
この方法は、最小限の注釈付きトレーニングデータで正確なランドマーク検出を可能にする。
論文 参考訳(メタデータ) (2024-07-25T15:32:59Z) - Robust vertebra identification using simultaneous node and edge
predicting Graph Neural Networks [0.0]
U-Netで標準的な予測を取り入れた単純なパイプラインを導入し、続いて1つのグラフニューラルネットワークで脊椎を完全な向きで関連付け、分類する。
我々の方法は、正しい体とペダルのランドマークを正確に関連付けることができ、偽陽性を無視し、脊椎を単純で完全に訓練可能なパイプラインで分類することができる。
論文 参考訳(メタデータ) (2023-07-27T09:10:27Z) - Live image-based neurosurgical guidance and roadmap generation using
unsupervised embedding [53.992124594124896]
本稿では,注釈付き脳外科ビデオの大規模なデータセットを活用するライブ画像のみのガイダンスを提案する。
生成されたロードマップは、トレーニングセットの手術で取られた一般的な解剖学的パスをエンコードする。
166例の腹腔鏡下腺摘出術を施行し,本法の有効性について検討した。
論文 参考訳(メタデータ) (2023-03-31T12:52:24Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - SQUID: Deep Feature In-Painting for Unsupervised Anomaly Detection [76.01333073259677]
無線画像からの異常検出のための空間認識型メモリキューを提案する(略してSQUID)。
SQUIDは, 微細な解剖学的構造を逐次パターンに分類でき, 推測では画像中の異常(見えない/修正されたパターン)を識別できる。
論文 参考訳(メタデータ) (2021-11-26T13:47:34Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Voice-assisted Image Labelling for Endoscopic Ultrasound Classification
using Neural Networks [48.732863591145964]
本稿では,臨床医が提示した生音声からのEUS画像にラベルを付けるマルチモーダル畳み込みニューラルネットワークアーキテクチャを提案する。
その結果,5つのラベルを持つデータセットにおいて,画像レベルでの予測精度は76%であった。
論文 参考訳(メタデータ) (2021-10-12T21:22:24Z) - Deep Learning-based Biological Anatomical Landmark Detection in
Colonoscopy Videos [21.384094148149003]
大腸内視鏡画像における生物学的な解剖学的ランドマークを検出するための,新しい深層学習に基づくアプローチを提案する。
平均検出精度は99.75%に達し、平均IoUは0.91であり、予測されるランドマーク周期と地上の真実との高い類似性を示している。
論文 参考訳(メタデータ) (2021-08-06T05:52:32Z) - Deep Learning-Based Regression and Classification for Automatic Landmark
Localization in Medical Images [6.853644471421005]
完全畳み込みニューラルネットワーク(FCNN)を用いたグローバル・ローカル・ローカライゼーション手法を用いる。
グローバルなローカライゼーションでローカライズされた各ランドマークに対して、ローカライズを行う。
特殊なFCNNは、局所的なサブイメージを同様の方法で分析することで、グローバルなランドマークの場所を洗練します。
論文 参考訳(メタデータ) (2020-07-10T10:46:18Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。