Fugu-MT 論文翻訳(概要): Generalizable Self-supervised Monocular Depth Estimation with Mixture of Low-Rank Experts for Diverse Endoscopic Scenes

論文の概要: Generalizable Self-supervised Monocular Depth Estimation with Mixture of Low-Rank Experts for Diverse Endoscopic Scenes

arxiv url: http://arxiv.org/abs/2509.01206v1
Date: Mon, 01 Sep 2025 07:45:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-04 15:17:03.582108
Title: Generalizable Self-supervised Monocular Depth Estimation with Mixture of Low-Rank Experts for Diverse Endoscopic Scenes
Title（参考訳）: 横型内視鏡シーンにおける低ランクエキスパートの混合による総括的自己監督型単眼深度推定
Authors: Liangjing Shao, Benshuang Chen, Chenkang Du, Xueli Liu, Xinrong Chen,
Abstract要約: 様々な内視鏡シーンにおける単眼深度推定のための自己監督型フレームワークを提案する。提案手法は, 最小侵襲計測および手術において, 正確な内視鏡的知覚に寄与する可能性がある。
参考スコア（独自算出の注目度）: 3.9727779638306484
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Self-supervised monocular depth estimation is a significant task for low-cost and efficient three-dimensional scene perception in endoscopy. The variety of illumination conditions and scene features is still the primary challenge for generalizable depth estimation in endoscopic scenes. In this work, a self-supervised framework is proposed for monocular depth estimation in various endoscopy. Firstly, due to various features in endoscopic scenes with different tissues, a novel block-wise mixture of dynamic low-rank experts is proposed to efficiently finetuning the foundation model for endoscopic depth estimation. In the proposed module, based on the input feature, different experts with a small amount of trainable parameters are adaptively selected for weighted inference, from various mixture of low-rank experts which are allocated based on the training quality of each block. Moreover, a novel self-supervised training framework is proposed to jointly cope with the inconsistency of brightness and reflectance. The proposed method outperform state-of-the-art works on both realistic and simulated endoscopic datasets. Furthermore, the proposed network also achieves the best generalization based on zero-shot depth estimation on diverse endoscopic scenes. The proposed method could contribute to accurate endoscopic perception for minimally invasive measurement and surgery. The code will be released upon acceptance, while the demo video can be found on here: https://endo-gede.netlify.app/.
Abstract（参考訳）: 自己監督型単眼深度推定は内視鏡における低コストで効率的な3次元シーン認識のための重要な課題である。様々な照明条件とシーンの特徴が、内視鏡的シーンにおける一般化可能な深さ推定の最大の課題である。本研究では,種々の内視鏡における単分子深度推定のための自己監督型フレームワークを提案する。まず, 異なる組織を有する内視鏡的シーンの様々な特徴から, 動的低ランクの専門家によるブロックワイドな混合が提案され, 内視鏡的深度推定の基礎モデルを効率的に微調整する。提案モジュールは,入力特徴に基づいて,各ブロックのトレーニング品質に基づいて,各ブロックのトレーニング品質に基づいて割り当てられる各種の低ランク専門家から,少量のトレーニング可能なパラメータを持つ異なる専門家を適応的に重み付き推論に選択する。さらに,明るさと反射率の不整合に対処するために,新たな自己指導型トレーニングフレームワークを提案する。提案手法は,現実的およびシミュレートされた内視鏡的データセットの両面において,最先端の作業よりも優れている。さらに,多様な内視鏡シーンのゼロショット深度推定にもとづいて,最適な一般化を実現している。提案手法は, 最小侵襲計測および手術において, 正確な内視鏡的知覚に寄与する可能性がある。コードは受理時にリリースされ、デモビデオはこちらで見ることができる。

関連論文リスト

EndoUFM: Utilizing Foundation Models for Monocular depth estimation of endoscopic images [7.350425834778092]
EndoUFMは、教師なしの単眼深度推定フレームワークである。強力な事前学習先を活用することにより、深さ推定性能を向上させる。この研究は、最小侵襲の手術において、外科医の空間的知覚を増大させるのに寄与する。
論文参考訳（メタデータ） (2025-08-25T11:33:05Z)
EndoMUST: Monocular Depth Estimation for Robotic Endoscopy via End-to-end Multi-step Self-supervised Training [0.7499722271664147]
本研究では,多段効率のファインタニングを施した新しいフレームワークを提案する。基礎モデルに基づくパラメータ効率の微調整に基づいて,提案手法は最先端の性能を実現する。
論文参考訳（メタデータ） (2025-06-19T04:31:59Z)
Occlusion-Aware Self-Supervised Monocular Depth Estimation for Weak-Texture Endoscopic Images [1.1084686909647639]
内視鏡的シーンに適した自己教師付き単眼深度推定ネットワークを提案する。既存の方法は正確ではあるが、通常は一貫した照明を仮定する。これらの変化は、誤った幾何学的解釈と信頼できない自己監督信号をもたらす。
論文参考訳（メタデータ） (2025-04-24T14:12:57Z)
Multi-view Reconstruction via SfM-guided Monocular Depth Estimation [92.89227629434316]
マルチビュー幾何再構成のための新しい手法を提案する。深度推定プロセスに、より強力なマルチビューであるSfM情報を組み込む。本手法は, 従来の単分子深度推定法と比較して, 深度推定の精度を著しく向上させる。
論文参考訳（メタデータ） (2025-03-18T17:54:06Z)
EndoDepth: A Benchmark for Assessing Robustness in Endoscopic Depth Prediction [1.7243216387069678]
本研究では,単眼深度予測モデルのロバスト性を評価するための評価フレームワークであるEndoDepthベンチマークを提案する。本稿では,内視鏡的シナリオにおけるモデルの堅牢性を評価するために,一貫した,特に設計された評価手法を提案する。
論文参考訳（メタデータ） (2024-09-30T04:18:14Z)
Advancing Depth Anything Model for Unsupervised Monocular Depth Estimation in Endoscopy [2.906891207990726]
本稿では,Depth Anything Modelのための新しい微調整戦略を提案する。本手法は本態性に基づく教師なし単眼深度推定フレームワークと統合する。提案手法は,トレーニング可能なパラメータ数を最小化しつつ,最先端性能を実現する。
論文参考訳（メタデータ） (2024-09-12T03:04:43Z)
ToDER: Towards Colonoscopy Depth Estimation and Reconstruction with Geometry Constraint Adaptation [67.22294293695255]
そこで本稿では,ToDERという双方向適応アーキテクチャを用いて,高精度な深度推定を行う新しいパイプラインを提案する。以上の結果から,本手法は実写および合成大腸内視鏡ビデオの深度マップを精度良く予測できることが示唆された。
論文参考訳（メタデータ） (2024-07-23T14:24:26Z)
ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文参考訳（メタデータ） (2024-07-11T05:11:56Z)
Robust Geometry-Preserving Depth Estimation Using Differentiable Rendering [93.94371335579321]
我々は、余分なデータやアノテーションを必要とせずに、幾何学保存深度を予測するためにモデルを訓練する学習フレームワークを提案する。包括的な実験は、我々のフレームワークの優れた一般化能力を強調します。我々の革新的な損失関数は、ドメイン固有のスケール・アンド・シフト係数を自律的に復元するモデルを可能にします。
論文参考訳（メタデータ） (2023-09-18T12:36:39Z)
SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文参考訳（メタデータ） (2022-11-07T16:17:47Z)
Depth Estimation Matters Most: Improving Per-Object Depth Estimation for Monocular 3D Detection and Tracking [47.59619420444781]
検出・追跡を含む単眼的3D知覚へのアプローチは、LiDARベースの手法と比較して性能が劣ることが多い。本稿では,オブジェクト(トラックレット)の複数のフレームに異なる表現(RGBと擬似LiDAR)と時間情報を組み合わせた多層融合手法を提案する。
論文参考訳（メタデータ） (2022-06-08T03:37:59Z)
Learnable Patchmatch and Self-Teaching for Multi-Frame Depth Estimation in Monocular Endoscopy [16.233423010425355]
教師なしマルチフレーム単眼深度推定モデルを提案する。提案モデルでは、学習可能なパッチマッチモジュールを統合し、低次および均質なテクスチャを持つ領域における識別能力を適応的に向上させる。自己学習パラダイムの副産物として,テスト時により多くのフレームが入力されたときの深度予測を改善することができる。
論文参考訳（メタデータ） (2022-05-30T12:11:03Z)
SelfTune: Metrically Scaled Monocular Depth Estimation through Self-Supervised Learning [53.78813049373321]
本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
論文参考訳（メタデータ） (2022-03-10T12:28:42Z)
Adversarial Domain Feature Adaptation for Bronchoscopic Depth Estimation [111.89519571205778]
そこで本研究では,深度推定のためのドメイン適応手法を提案する。提案する2段階構造は,まず,ラベル付き合成画像を用いた深度推定ネットワークを教師付きで訓練する。実験の結果,提案手法は実画像上でのネットワーク性能をかなりの差で向上させることがわかった。
論文参考訳（メタデータ） (2021-09-24T08:11:34Z)
Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文参考訳（メタデータ） (2020-09-16T14:35:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。