論文の概要: You Only Learn Once: Universal Anatomical Landmark Detection
- arxiv url: http://arxiv.org/abs/2103.04657v1
- Date: Mon, 8 Mar 2021 10:38:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:34:17.415197
- Title: You Only Learn Once: Universal Anatomical Landmark Detection
- Title(参考訳): 一度しか学ばない:普遍解剖学的ランドマーク検出
- Authors: Heqin Zhu, Qingsong Yao, Li Xiao, S. Kevin Zhou
- Abstract要約: 複数のランドマーク検出タスクを実現するための普遍的解剖学的ランドマーク検出モデルを開発した。
モデルは、ローカルネットワークとグローバルネットワークで構成されています。
我々は,頭部,手,胸部に1,588枚の画像のX線データセットを用いたYOLOモデルの評価を行い,62件のランドマークを収集した。
- 参考スコア(独自算出の注目度): 8.116895827446088
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Detecting anatomical landmarks in medical images plays an essential role in
understanding the anatomy and planning automated processing. In recent years, a
variety of deep neural network methods have been developed to detect landmarks
automatically. However, all of those methods are unary in the sense that a
highly specialized network is trained for a single task say associated with a
particular anatomical region. In this work, for the first time, we investigate
the idea of "You Only Learn Once (YOLO)" and develop a universal anatomical
landmark detection model to realize multiple landmark detection tasks with
end-to-end training based on mixed datasets. The model consists of a local
network and a global network: The local network is built upon the idea of
universal UNet to learn multi-domain local features and the global network is a
parallelly-duplicated sequential of dilated convolutions that extract global
features to further disambiguate the landmark locations. It is worth mentioning
that the new model design requires fewer parameters than models with standard
convolutions to train. We evaluate our YOLO model on three X-ray datasets of
1,588 images on the head, hand, and chest, collectively contributing 62
landmarks. The experimental results show that our proposed universal model
behaves largely better than any previous models trained on multiple datasets.
It even beats the performance of the model that is trained separately for every
single dataset.
- Abstract(参考訳): 医療画像における解剖学的ランドマークの検出は、解剖学の理解と自動処理の計画に不可欠な役割を担います。
近年、ランドマークを自動的に検出する様々なディープニューラルネットワーク手法が開発されている。
しかしながら、これらのメソッドはすべて、高度に専門化されたネットワークが、特定の解剖学的領域に関連する単一のタスクに対して訓練されているという意味で、非定常である。
本研究では,"You Only Learn Once (YOLO)"のアイデアを初めて検討し,複合データセットに基づくエンドツーエンドのトレーニングにより,複数のランドマーク検出タスクを実現するユニバーサルな解剖学的ランドマーク検出モデルを開発した。
ローカルネットワークは、マルチドメインのローカルな特徴を学習するためのユニバーサルUNetのアイデアに基づいて構築され、グローバルネットワークは、グローバルな特徴を抽出し、ランドマークの場所をさらに曖昧にする、拡張された畳み込みの並列化シーケンスである。
新しいモデル設計は、トレーニングに標準的な畳み込みを持つモデルよりも少ないパラメータを必要とすることに言及する価値があります。
我々は,頭部,手,胸部に1,588枚の画像のX線データセットを用いたYOLOモデルの評価を行い,62件のランドマークを収集した。
実験の結果,提案するユニバーサルモデルは,複数のデータセットでトレーニングされたどのモデルよりもよく振る舞うことがわかった。
さらに、データセット毎に個別にトレーニングされたモデルのパフォーマンスも上回っている。
関連論文リスト
- Predicting Infant Brain Connectivity with Federated Multi-Trajectory
GNNs using Scarce Data [54.55126643084341]
既存のディープラーニングソリューションには,3つの大きな制限がある。
我々はフェデレートグラフベースの多軌道進化ネットワークであるFedGmTE-Net++を紹介する。
フェデレーションの力を利用して、限られたデータセットを持つ多種多様な病院の地域学習を集約する。
論文 参考訳(メタデータ) (2024-01-01T10:20:01Z) - Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks [19.639533220155965]
本稿では,畳み込み型ニューラルネットワークのマルチモーダルな騙し検出への応用について検討する。
2つのトピックについて104人の被験者にインタビューして構築したデータセットを使用します。
論文 参考訳(メタデータ) (2023-11-18T02:44:33Z) - A Domain Generalization Approach for Out-Of-Distribution 12-lead ECG
Classification with Convolutional Neural Networks [3.1372269816123994]
本稿では,12誘導心電図(ECG)の異常を,Deep Neural Networkのアーキテクチャ全体にわたって抽出した情報を活用することによって分類する手法を提案する。
我々は4つのソースから利用可能なECGデータセットを採用し、それらを別々のドメインとして扱う。
実世界の環境における分布シフトをシミュレートするために、ドメインのサブセット上でモデルをトレーニングし、残りのドメインを除外する。
論文 参考訳(メタデータ) (2022-08-20T10:58:31Z) - Learning Signal-Agnostic Manifolds of Neural Fields [50.066449953522685]
ニューラルネットワークを利用して、画像、形状、オーディオ、およびモーダル・オーディオヴィジュアル領域の基盤となる構造を捉える。
GEMの基底多様体を横切ることで、信号領域に新しいサンプルを生成できることが示される。
論文 参考訳(メタデータ) (2021-11-11T18:57:40Z) - Feature Aggregation and Refinement Network for 2D AnatomicalLandmark
Detection [0.0]
本稿では,解剖学的ランドマークの自動検出のための,特徴集約・改善ネットワーク(FARNet)を提案する。
我々のネットワークは3つの公開解剖学的ランドマーク検出データセットで評価されている。
論文 参考訳(メタデータ) (2021-11-01T02:16:13Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Universal Undersampled MRI Reconstruction [12.731566667990315]
下検体MRI再構成のための汎用深部ニューラルネットワークの学習フレームワークを提案する。
具体的には、統計シフトを補償し、新しいデータセットに容易に一般化できる解剖学的特異なインスタンス正規化を提案する。
実験の結果, 提案するユニバーサルモデルは, 高画質で脳と膝の画像を再構成できることがわかった。
論文 参考訳(メタデータ) (2021-03-09T04:25:22Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - An Ensemble of Knowledge Sharing Models for Dynamic Hand Gesture
Recognition [1.7158296436650335]
本稿では,人間と機械の相互作用の文脈における動的ジェスチャー認識に着目した。
本稿では,2つのサブネットワーク,変圧器,命令ニューロン,長期記憶型リカレントニューラルネットワーク(RNN)からなるモデルを提案する。
提案された知識共有モデルのアンサンブルは、骨格情報のみを使用して全体の86.11%の精度を示す。
論文 参考訳(メタデータ) (2020-08-13T07:37:27Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。