論文の概要: ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments
- arxiv url: http://arxiv.org/abs/2508.21096v1
- Date: Wed, 27 Aug 2025 22:23:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.821536
- Title: ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments
- Title(参考訳): ROBUST-MIPS:腹腔鏡下手術器具用骨格電位とインスタンスセグメンテーションデータセット
- Authors: Zhe Han, Charlie Budd, Gongyu Zhang, Huanyu Tian, Christos Bergeles, Tom Vercauteren,
- Abstract要約: 手術器具の局所化はコンピュータ支援介入技術のためのビルディングブロックである。
骨格的ポーズアノテーションは外科的ツールのより効率的なアノテーションアプローチである,と我々は主張する。
ツールポーズとツールインスタンスセグメンテーションデータセットを組み合わせたROBUST-MIPSを提案する。
- 参考スコア(独自算出の注目度): 8.024055417738227
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Localisation of surgical tools constitutes a foundational building block for computer-assisted interventional technologies. Works in this field typically focus on training deep learning models to perform segmentation tasks. Performance of learning-based approaches is limited by the availability of diverse annotated data. We argue that skeletal pose annotations are a more efficient annotation approach for surgical tools, striking a balance between richness of semantic information and ease of annotation, thus allowing for accelerated growth of available annotated data. To encourage adoption of this annotation style, we present, ROBUST-MIPS, a combined tool pose and tool instance segmentation dataset derived from the existing ROBUST-MIS dataset. Our enriched dataset facilitates the joint study of these two annotation styles and allow head-to-head comparison on various downstream tasks. To demonstrate the adequacy of pose annotations for surgical tool localisation, we set up a simple benchmark using popular pose estimation methods and observe high-quality results. To ease adoption, together with the dataset, we release our benchmark models and custom tool pose annotation software.
- Abstract(参考訳): 外科的ツールの局所化は、コンピュータ支援介入技術の基盤となるビルディングブロックを構成する。
この分野での作業は通常、セグメンテーションタスクを実行するためのディープラーニングモデルのトレーニングに重点を置いています。
学習に基づくアプローチのパフォーマンスは、さまざまな注釈付きデータの可用性によって制限される。
我々は、骨格的なポーズアノテーションは、より効率的なアノテーションアプローチであり、意味情報の豊かさとアノテーションの容易さのバランスを崩し、利用可能なアノテーションデータの成長を加速できると主張している。
このアノテーションスタイルの採用を促進するため,既存のROBUST-MISデータセットから派生したツールポーズとツールインスタンスセグメンテーションデータセットであるROBUST-MIPSを提案する。
本稿では,この2つのアノテーションスタイルを共同で研究し,様々な下流タスクの頭と頭の比較を可能にする。
外科的ツールローカライゼーションのためのポーズアノテーションの有効性を示すために,一般的なポーズ推定手法を用いて簡単なベンチマークを作成し,高品質な結果を得た。
採用を容易にするため、データセットとともに、ベンチマークモデルとカスタムツールのアノテーションソフトウェアをリリースしています。
関連論文リスト
- Foundation X: Integrating Classification, Localization, and Segmentation through Lock-Release Pretraining Strategy for Chest X-ray Analysis [3.874753046352665]
nFoundation Xは、さまざまな専門家レベルのアノテーションを使用して基礎モデルをトレーニングするエンドツーエンドフレームワークである。
11個の胸部X線データセットを用いてモデルを訓練し、分類、局所化、セグメンテーションタスクのアノテーションをカバーした。
実験結果から,ファウンデーションXは広範囲なアノテーション利用によって顕著な性能向上を達成できることが示唆された。
論文 参考訳(メタデータ) (2025-03-12T21:45:13Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits [2.045596350476764]
この作業は、データセット分割のインタラクティブな探索を可能にする、公開データ可視化ツールを提供する。
位相、位相遷移、楽器、計器の組み合わせの発生を可視化することに焦点を当てている。
結果: 一般的なColec80データセット分割の解析を行い, いずれかの集合に表現されていない相転移と組み合わせを明らかにすることができた。
論文 参考訳(メタデータ) (2023-06-29T12:02:16Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Self-Attention Neural Bag-of-Features [103.70855797025689]
我々は最近導入された2D-Attentionの上に構築し、注意学習方法論を再構築する。
本稿では,関連情報を強調した2次元目視マスクを学習する機能・時間的アテンション機構を提案する。
論文 参考訳(メタデータ) (2022-01-26T17:54:14Z) - Simulation-to-Real domain adaptation with teacher-student learning for
endoscopic instrument segmentation [1.1047993346634768]
注釈付きシミュレーションデータとラベルのない実データから共同学習する教師学習手法を紹介します。
3つのデータセットの実証結果は、提案したフレームワークの有効性を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-02T09:30:28Z) - ISINet: An Instance-Based Approach for Surgical Instrument Segmentation [0.0]
ロボット支援手術シーンにおける手術器具の意味的セグメンテーションの課題について検討する。
我々は、インスタンスベースのセグメンテーションの観点から、このタスクに対処するISINetを提案する。
以上の結果から, ISINetは最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-07-10T16:20:56Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。