論文の概要: A two-stream network with global-local feature fusion for bone age assessment
- arxiv url: http://arxiv.org/abs/2512.18331v1
- Date: Sat, 20 Dec 2025 11:56:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.293082
- Title: A two-stream network with global-local feature fusion for bone age assessment
- Title(参考訳): 骨年齢評価のための局所的特徴融合を用いた2ストリームネットワーク
- Authors: Qiong Lou, Han Yang, Fang Lu,
- Abstract要約: 本研究では,2ストリームの深層学習アーキテクチャに基づく骨年齢自動評価システムの開発を目的とする。
グローバルな特徴抽出チャネルとローカルな特徴抽出チャネルを組み合わせたBoNet+モデルを提案する。
提案手法は,北米放射線学会 (RSNA) とRHPE (Radiological Hand Pose Estimation) テストデータセットで検証されている。
- 参考スコア(独自算出の注目度): 4.471820141535545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bone Age Assessment (BAA) is a widely used clinical technique that can accurately reflect an individual's growth and development level, as well as maturity. In recent years, although deep learning has advanced the field of bone age assessment, existing methods face challenges in efficiently balancing global features and local skeletal details. This study aims to develop an automated bone age assessment system based on a two-stream deep learning architecture to achieve higher accuracy in bone age assessment. We propose the BoNet+ model incorporating global and local feature extraction channels. A Transformer module is introduced into the global feature extraction channel to enhance the ability in extracting global features through multi-head self-attention mechanism. A RFAConv module is incorporated into the local feature extraction channel to generate adaptive attention maps within multiscale receptive fields, enhancing local feature extraction capabilities. Global and local features are concatenated along the channel dimension and optimized by an Inception-V3 network. The proposed method has been validated on the Radiological Society of North America (RSNA) and Radiological Hand Pose Estimation (RHPE) test datasets, achieving mean absolute errors (MAEs) of 3.81 and 5.65 months, respectively. These results are comparable to the state-of-the-art. The BoNet+ model reduces the clinical workload and achieves automatic, high-precision, and more objective bone age assessment.
- Abstract(参考訳): 骨年齢評価(BAA)は、個人の成長と発達のレベルを正確に反映し、成熟度を反映できる、広く用いられている臨床技術である。
近年、深層学習は骨年齢評価の分野で進歩しているが、既存の手法では、グローバルな特徴と局所的な骨格の細部を効率的にバランスさせることが困難になっている。
本研究では,2ストリームの深層学習アーキテクチャに基づく骨年齢自動評価システムを開発し,骨年齢評価の精度を高めることを目的とする。
グローバルな特徴抽出チャネルとローカルな特徴抽出チャネルを組み合わせたBoNet+モデルを提案する。
トランスフォーマーモジュールがグローバル機能抽出チャネルに導入され,マルチヘッド自己保持機構によるグローバル機能抽出能力が向上する。
RFAConvモジュールをローカル特徴抽出チャネルに組み込んで、マルチスケールの受容領域内でアダプティブアテンションマップを生成し、局所特徴抽出能力を向上する。
グローバルおよびローカル機能はチャネル次元に沿って連結され、Inception-V3ネットワークによって最適化される。
提案手法は,北米放射線学会 (RSNA) とRHPE (Radiological Hand Pose Estimation) のテストデータセットでそれぞれ3.81および5.65ヶ月の平均絶対誤差 (MAE) を達成した。
これらの結果は最先端技術に匹敵する。
BoNet+モデルは、臨床作業量を削減し、自動的、高精度、より客観的な骨年齢評価を実現する。
関連論文リスト
- UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Asynchronous Feedback Network for Perceptual Point Cloud Quality Assessment [18.65004981045047]
非同期フィードバック品質予測ネットワーク(AFQ-Net)を提案する。
AFQ-Netは人間の視覚知覚機構に動機付けられ、グローバルな特徴や局所的な特徴を扱うために二重ブランチ構造を採用している。
3つのデータセットに関する総合的な実験を行い、最先端のアプローチよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-07-13T08:52:44Z) - Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields [19.71033340093199]
本稿では,医療画像のセグメンテーションの限界を克服する新しいアーキテクチャであるspective+Unetを提案する。
このフレームワークは ENLTB という名前の効率的な非局所トランスフォーマーブロックを組み込んでおり、これはカーネル関数近似を利用して、効率的な長距離依存性キャプチャを行う。
ACDCとデータセットに関する実験結果から,提案したパースペクティブ+Unetの有効性が示された。
論文 参考訳(メタデータ) (2024-06-20T07:17:39Z) - FedSoup: Improving Generalization and Personalization in Federated
Learning via Selective Model Interpolation [32.36334319329364]
クロスサイロフェデレーション学習(FL)は、データセンタに分散したデータセット上での機械学習モデルの開発を可能にする。
近年の研究では、現在のFLアルゴリズムは、分布シフトに直面した場合、局所的な性能とグローバルな性能のトレードオフに直面している。
地域とグローバルのパフォーマンスのトレードオフを最適化する新しいフェデレーションモデルスープ手法を提案する。
論文 参考訳(メタデータ) (2023-07-20T00:07:29Z) - Federated and Generalized Person Re-identification through Domain and
Feature Hallucinating [88.77196261300699]
人物再識別(re-ID)におけるフェデレーションドメイン一般化(FedDG)の問題について検討する。
一般化された局所的・グローバルなモデルを学ぶための多様な特徴を創出する手法として,DFH (Domain and Feature Hallucinating) を提案する。
提案手法は4つの大規模re-IDベンチマークにおいてFedDGの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-05T09:15:13Z) - Automated Olfactory Bulb Segmentation on High Resolutional T2-Weighted
MRI [0.0]
神経画像解析のコミュニティは、嗅覚機能において重要な役割を担っているにもかかわらず、嗅覚球(OB)の自動化セグメンテーションを無視している。
サブミリT2ミリ(T2w)全脳MR画像上にOB組織を正確に分割するための,新しい,高速かつ完全自動深層学習パイプラインを導入する。
Rhineland Studyの203名の参加者を対象に, OBパイプラインは, 境界線, OB局在, 体積推定の点で高い性能を示す。
論文 参考訳(メタデータ) (2021-08-09T18:03:25Z) - Improve bone age assessment by learning from anatomical local regions [18.6439159025423]
本稿では,解剖学的局所認識ネットワーク(ALA-Net)と呼ばれる骨年齢自動評価モデルを提案する。
我々のモデルは解剖学的ROIを検出し、骨年齢をエンドツーエンドに推定することができる。
論文 参考訳(メタデータ) (2020-05-27T16:08:30Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。