論文の概要: Innovative Tooth Segmentation Using Hierarchical Features and Bidirectional Sequence Modeling
- arxiv url: http://arxiv.org/abs/2602.21712v1
- Date: Wed, 25 Feb 2026 09:20:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.772053
- Title: Innovative Tooth Segmentation Using Hierarchical Features and Bidirectional Sequence Modeling
- Title(参考訳): 階層的特徴と双方向配列モデリングを用いた歯の革新的セグメンテーション
- Authors: Xinxin Zhao, Jian Jiang, Yan Tian, Liqin Wu, Zhaocheng Xu, Teddy Yang, Yunuo Zou, Xun Wang,
- Abstract要約: 歯像のセグメンテーションは歯のデジタル化の基礎となる。
従来の画像エンコーダは固定解像度の特徴マップに依存しており、しばしば不連続なセグメンテーションに繋がる。
歯科画像のスケール適応情報を取得するために,階層的特徴表現を備えた3段階エンコーダを提案する。
- 参考スコア(独自算出の注目度): 7.5575201946019845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tooth image segmentation is a cornerstone of dental digitization. However, traditional image encoders relying on fixed-resolution feature maps often lead to discontinuous segmentation and poor discrimination between target regions and background, due to insufficient modeling of environmental and global context. Moreover, transformer-based self-attention introduces substantial computational overhead because of its quadratic complexity (O(n^2)), making it inefficient for high-resolution dental images. To address these challenges, we introduce a three-stage encoder with hierarchical feature representation to capture scale-adaptive information in dental images. By jointly leveraging low-level details and high-level semantics through cross-scale feature fusion, the model effectively preserves fine structural information while maintaining strong contextual awareness. Furthermore, a bidirectional sequence modeling strategy is incorporated to enhance global spatial context understanding without incurring high computational cost. We validate our method on two dental datasets, with experimental results demonstrating its superiority over existing approaches. On the OralVision dataset, our model achieves a 1.1% improvement in mean intersection over union (mIoU).
- Abstract(参考訳): 歯像のセグメンテーションは歯のデジタル化の基礎となる。
しかし、固定解像度の特徴マップに依存する従来の画像エンコーダは、環境・グローバルコンテキストのモデリングが不十分なため、不連続なセグメンテーションや、対象地域と背景の識別が不十分になることが多い。
さらに、トランスを用いた自己アテンションは、その二次的な複雑さ(O(n^2))のため、かなりの計算オーバーヘッドをもたらすため、高解像度の歯科画像では非効率である。
これらの課題に対処するために,歯像のスケール適応情報を取得するために,階層的特徴表現を備えた3段階エンコーダを導入する。
低レベルの詳細と高レベルのセマンティクスをクロススケールな特徴融合を通じて共同で活用することにより、強い文脈認識を維持しながら、構造情報を効果的に保存する。
さらに、高い計算コストを伴わずに、グローバルな空間的コンテキスト理解を強化するために、双方向シーケンスモデリング戦略が組み込まれている。
本手法を2つの歯科用データセットで検証し,既存のアプローチよりも優れていることを示す実験結果を得た。
OralVisionデータセットでは,平均交叉率(mIoU)が1.1%向上した。
関連論文リスト
- Prior-guided Hierarchical Instance-pixel Contrastive Learning for Ultrasound Speckle Noise Suppression [2.7777929779304955]
本稿では,先行誘導型階層型インスタンス・ピクセルコントラスト学習モデルを提案する。
統計誘導型画素レベルのコントラスト学習戦略を導入し,ノイズとクリーンな画素間の分布差を増大させる。
グローバルコンテキストモデリングのためのTransformer-CNNアーキテクチャを,微細な解剖構造復元に最適化されたCNNベースのデコーダと組み合わせ,ハイブリッドトランスフォーマー-CNNアーキテクチャを採用する。
論文 参考訳(メタデータ) (2026-02-14T16:01:58Z) - High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-10-14T02:49:23Z) - Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields [19.71033340093199]
本稿では,医療画像のセグメンテーションの限界を克服する新しいアーキテクチャであるspective+Unetを提案する。
このフレームワークは ENLTB という名前の効率的な非局所トランスフォーマーブロックを組み込んでおり、これはカーネル関数近似を利用して、効率的な長距離依存性キャプチャを行う。
ACDCとデータセットに関する実験結果から,提案したパースペクティブ+Unetの有効性が示された。
論文 参考訳(メタデータ) (2024-06-20T07:17:39Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。
我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。
皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-31T21:28:46Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Decomposing and Coupling Saliency Map for Lesion Segmentation in
Ultrasound Images [10.423431415758655]
超音波画像の複雑なシナリオは、隣接する組織が類似の強度を共有し、よりリッチなテクスチャパターンを含むことで、正確な病変のセグメンテーションに固有の課題をもたらす。
この研究はDC-Netと呼ばれる分解結合ネットワークを示し、(地上背景)サリエンシマップのアンタングルメント・フュージョン方式でこの問題に対処する。
提案手法は2つの超音波病変セグメンテーションタスクで評価され,既存の最先端手法よりも顕著な性能向上を示す。
論文 参考訳(メタデータ) (2023-08-02T05:02:30Z) - SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.79344668998054]
正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。
その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-23T20:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。