論文の概要: Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits
- arxiv url: http://arxiv.org/abs/2306.16879v2
- Date: Tue, 31 Oct 2023 15:16:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 23:14:07.033474
- Title: Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits
- Title(参考訳): 手術段階と計器認識:適切なデータセットの分割の同定法
- Authors: Georgii Kostiuchik, Lalith Sharan, Benedikt Mayer, Ivo Wolf, Bernhard
Preim, Sandy Engelhardt
- Abstract要約: この作業は、データセット分割のインタラクティブな探索を可能にする、公開データ可視化ツールを提供する。
位相、位相遷移、楽器、計器の組み合わせの発生を可視化することに焦点を当てている。
結果: 一般的なColec80データセット分割の解析を行い, いずれかの集合に表現されていない相転移と組み合わせを明らかにすることができた。
- 参考スコア(独自算出の注目度): 2.045596350476764
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Purpose: Machine learning models can only be reliably evaluated if training,
validation, and test data splits are representative and not affected by the
absence of classes of interest. Surgical workflow and instrument recognition
tasks are complicated in this manner, because of heavy data imbalances
resulting from different lengths of phases and their erratic occurrences.
Furthermore, the issue becomes difficult as sub-properties that help define
phases, like instrument (co-)occurrence, are usually not considered when
defining the split. We argue that such sub-properties must be equally
considered.
Methods: This work presents a publicly available data visualization tool that
enables interactive exploration of dataset splits for surgical phase and
instrument recognition. It focuses on the visualization of the occurrence of
phases, phase transitions, instruments, and instrument combinations across
sets. Particularly, it facilitates the assessment and identification of
sub-optimal dataset splits.
Results: We performed an analysis of common Cholec80 dataset splits using the
proposed application and were able to uncover phase transitions and
combinations of instruments that were not represented in one of the sets.
Additionally, we outlined possible improvements to the splits. A user study
with ten participants demonstrated the ability of participants to solve a
selection of data exploration tasks using the proposed application.
Conclusion: In highly unbalanced class distributions, special care should be
taken with respect to the selection of an appropriate dataset split. Our
interactive data visualization tool presents a promising approach for the
assessment of dataset splits for surgical phase and instrument recognition.
Evaluation results show that it can enhance the development of machine learning
models. The application is available at https://cardio-ai.github.io/endovis-ml/ .
- Abstract(参考訳): 目的: マシンラーニングモデルは、トレーニング、検証、テストデータの分割が代表的であり、関心のあるクラスがない場合にのみ確実に評価できる。
手術ワークフローと機器認識タスクは、位相の異なる長さと不規則な発生から生じる重いデータ不均衡のため、この方法で複雑である。
さらに、スプリットを定義する際には、楽器(co-)の出現のようなフェーズを定義するサブプロパティが考慮されないため、問題は難しくなる。
このようなサブプロペラティは等しく考慮されなければならない。
方法:本研究は,手術段階と器具認識のためのデータセット分割のインタラクティブな探索を可能にする,公開データ可視化ツールを提案する。
位相、位相遷移、楽器、計器の組み合わせの発生を可視化することに焦点を当てている。
特に、サブ最適データセット分割の評価と識別を容易にする。
結果: 提案手法を用いたcholec80データセットの分割解析を行い, その1つでは表現されていない楽器の相転移と組み合わせを明らかにすることができた。
さらに、分割に対する改善の可能性についても概説した。
10名の被験者によるユーザスタディでは,提案したアプリケーションを用いてデータ探索タスクの選択を解く能力を示した。
結論: 高度に不均衡なクラス分布では、適切なデータセットの分割の選択に関して特別な注意を払わなければならない。
インタラクティブなデータ可視化ツールは,手術段階と器具認識のためのデータセット分割の評価に有望なアプローチを提供する。
評価結果は,機械学習モデルの開発を促進できることを示している。
アプリケーションはhttps://cardio-ai.github.io/endovis-ml/で入手できる。
関連論文リスト
- Matched Machine Learning: A Generalized Framework for Treatment Effect
Inference With Learned Metrics [87.05961347040237]
我々は、機械学習ブラックボックスの柔軟性とマッチングの解釈可能性を組み合わせたフレームワークであるMatched Machine Learningを紹介する。
我々のフレームワークは機械学習を用いて、一致した単位を学習し、結果を推定する最適な指標を学習する。
一致機械学習のインスタンスはブラックボックスの機械学習手法と同等に動作し、類似した問題に対する既存のマッチング手法よりも優れていることを実証的に示す。
論文 参考訳(メタデータ) (2023-04-03T19:32:30Z) - A classification performance evaluation measure considering data
separability [6.751026374812737]
本稿では,データ符号化率に基づく新たな分離可能性尺度を提案する。
実データセットから構築したマルチタスクシナリオにおいて,提案手法と認識精度の正の相関性を示す。
論文 参考訳(メタデータ) (2022-11-10T09:18:26Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - Data-Centric Machine Learning in the Legal Domain [0.2624902795082451]
本稿では,データセットの変化がモデルの性能に与える影響について考察する。
法律ドメインから公開されている3つのデータセットを用いて,そのサイズ,列車/テストの分割,および人間のラベル付け精度がパフォーマンスに与える影響について検討する。
観察された効果は、特にクラスごとのパフォーマンスを考慮した場合、驚くほど顕著である。
論文 参考訳(メタデータ) (2022-01-17T23:05:14Z) - Learning from Partially Overlapping Labels: Image Segmentation under
Annotation Shift [68.6874404805223]
腹部臓器分節の文脈におけるラベルの重複から学ぶためのいくつかの方法を提案する。
半教師付きアプローチと適応的クロスエントロピー損失を組み合わせることで、不均一な注釈付きデータをうまく活用できることが判明した。
論文 参考訳(メタデータ) (2021-07-13T09:22:24Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Data Separability for Neural Network Classifiers and the Development of
a Separability Index [17.49709034278995]
データセットの分離性を測定するために、DSI(Distance-based Separability Index)を作成しました。
DSIは、異なるクラスに属するデータに類似した分布があるかどうかを示す。
また、データサイエンス、機械学習、ディープラーニングの分野におけるDSIの応用の可能性についても論じている。
論文 参考訳(メタデータ) (2020-05-27T01:49:19Z) - Semi-supervised lung nodule retrieval [2.055949720959582]
コンテンツベース画像検索(CBIR)システムは、クエリ画像と類似度でランク付けされた一連の画像を出力する。
データセット要素間の類似性(例えばnodules間の類似性)に関する基礎的な真実は、容易には利用できない。
本研究は,(1)部分ラベル付きデータセットの自動アノテーション,(2)述語アノテーションに基づく意味的類似度距離空間の学習,という2つのステップを含む半教師付きアプローチを提案する。
LIDCデータセットを用いて肺結節検索を行い,予測された評価値から埋め込みを学習することが可能であることを示す。
論文 参考訳(メタデータ) (2020-05-04T19:26:14Z) - To Split or Not to Split: The Impact of Disparate Treatment in
Classification [8.325775867295814]
異なる処理は、機械学習モデルが機密属性に基づいて個人に対して異なる決定を下すときに発生する。
本稿では,分類器の分割による性能改善の定量化のための分割処理の利点を紹介する。
我々は,小規模凸プログラムを解くことで効率よく計算できる分割利益の等価表現を証明した。
論文 参考訳(メタデータ) (2020-02-12T04:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。