論文の概要: Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits
- arxiv url: http://arxiv.org/abs/2306.16879v1
- Date: Thu, 29 Jun 2023 12:02:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-30 13:37:50.381193
- Title: Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits
- Title(参考訳): 手術段階と計器認識:適切なデータセットの分割の同定法
- Authors: Georgii Kostiuchik, Lalith Sharan, Benedikt Mayer, Ivo Wolf, Bernhard
Preim, Sandy Engelhardt
- Abstract要約: 本稿では,データセット分割のインタラクティブな探索を可能にするWebアプリケーションを提案する。
提案するビジュアルフレームワークは,外科的ワークフロー認識のためのデータセット分割の評価を容易にする。
ソフトウェアを用いて,各セットに表現されていない手術器具の位相,位相遷移,組み合わせを同定することができた。
- 参考スコア(独自算出の注目度): 2.4515179886912315
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Purpose: The development of machine learning models for surgical workflow and
instrument recognition from temporal data represents a challenging task due to
the complex nature of surgical workflows. In particular, the imbalanced
distribution of data is one of the major challenges in the domain of surgical
workflow recognition. In order to obtain meaningful results, careful
partitioning of data into training, validation, and test sets, as well as the
selection of suitable evaluation metrics are crucial. Methods: In this work, we
present an openly available web-based application that enables interactive
exploration of dataset partitions. The proposed visual framework facilitates
the assessment of dataset splits for surgical workflow recognition, especially
with regard to identifying sub-optimal dataset splits. Currently, it supports
visualization of surgical phase and instrument annotations. Results: In order
to validate the dedicated interactive visualizations, we use a dataset split of
the Cholec80 dataset. This dataset split was specifically selected to reflect a
case of strong data imbalance. Using our software, we were able to identify
phases, phase transitions, and combinations of surgical instruments that were
not represented in one of the sets. Conclusion: In order to obtain meaningful
results in highly unbalanced class distributions, special care should be taken
with respect to the selection of an appropriate split. Interactive data
visualization represents a promising approach for the assessment of machine
learning datasets. The source code is available at
https://github.com/Cardio-AI/endovis-ml
- Abstract(参考訳): 目的:手術ワークフローの複雑な性質から,手術ワークフローと時間データからの機器認識のための機械学習モデルの開発が困難な課題である。
特に、データの不均衡分布は、外科的ワークフロー認識の領域における大きな課題の1つである。
有意義な結果を得るためには,データのトレーニング,検証,テストセットへの注意深く分割することや,適切な評価指標の選択が不可欠である。
方法:本稿では,データセット分割のインタラクティブな探索を可能にするオープンウェブアプリケーションを提案する。
提案するビジュアルフレームワークは,外科的ワークフロー認識のためのデータセット分割の評価を容易にする。
現在、手術段階の可視化と器具のアノテーションをサポートしている。
結果: cholec80データセットのデータセット分割を用いて,インタラクティブな可視化の検証を行う。
このデータセット分割は、強いデータ不均衡のケースを反映して特別に選択された。
ソフトウェアを用いて,各セットに表現されていない手術器具の位相,位相遷移,組み合わせを同定することができた。
結論: 高度に不均衡なクラス分布において有意義な結果を得るためには, 適切な分割の選択に関して特別な注意が必要である。
インタラクティブなデータ可視化は、マシンラーニングデータセットの評価に有望なアプローチである。
ソースコードはhttps://github.com/Cardio-AI/endovis-mlで入手できる。
関連論文リスト
- Matched Machine Learning: A Generalized Framework for Treatment Effect
Inference With Learned Metrics [87.05961347040237]
我々は、機械学習ブラックボックスの柔軟性とマッチングの解釈可能性を組み合わせたフレームワークであるMatched Machine Learningを紹介する。
我々のフレームワークは機械学習を用いて、一致した単位を学習し、結果を推定する最適な指標を学習する。
一致機械学習のインスタンスはブラックボックスの機械学習手法と同等に動作し、類似した問題に対する既存のマッチング手法よりも優れていることを実証的に示す。
論文 参考訳(メタデータ) (2023-04-03T19:32:30Z) - A classification performance evaluation measure considering data
separability [6.751026374812737]
本稿では,データ符号化率に基づく新たな分離可能性尺度を提案する。
実データセットから構築したマルチタスクシナリオにおいて,提案手法と認識精度の正の相関性を示す。
論文 参考訳(メタデータ) (2022-11-10T09:18:26Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - Data-Centric Machine Learning in the Legal Domain [0.2624902795082451]
本稿では,データセットの変化がモデルの性能に与える影響について考察する。
法律ドメインから公開されている3つのデータセットを用いて,そのサイズ,列車/テストの分割,および人間のラベル付け精度がパフォーマンスに与える影響について検討する。
観察された効果は、特にクラスごとのパフォーマンスを考慮した場合、驚くほど顕著である。
論文 参考訳(メタデータ) (2022-01-17T23:05:14Z) - Learning from Partially Overlapping Labels: Image Segmentation under
Annotation Shift [68.6874404805223]
腹部臓器分節の文脈におけるラベルの重複から学ぶためのいくつかの方法を提案する。
半教師付きアプローチと適応的クロスエントロピー損失を組み合わせることで、不均一な注釈付きデータをうまく活用できることが判明した。
論文 参考訳(メタデータ) (2021-07-13T09:22:24Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Data Separability for Neural Network Classifiers and the Development of
a Separability Index [17.49709034278995]
データセットの分離性を測定するために、DSI(Distance-based Separability Index)を作成しました。
DSIは、異なるクラスに属するデータに類似した分布があるかどうかを示す。
また、データサイエンス、機械学習、ディープラーニングの分野におけるDSIの応用の可能性についても論じている。
論文 参考訳(メタデータ) (2020-05-27T01:49:19Z) - Semi-supervised lung nodule retrieval [2.055949720959582]
コンテンツベース画像検索(CBIR)システムは、クエリ画像と類似度でランク付けされた一連の画像を出力する。
データセット要素間の類似性(例えばnodules間の類似性)に関する基礎的な真実は、容易には利用できない。
本研究は,(1)部分ラベル付きデータセットの自動アノテーション,(2)述語アノテーションに基づく意味的類似度距離空間の学習,という2つのステップを含む半教師付きアプローチを提案する。
LIDCデータセットを用いて肺結節検索を行い,予測された評価値から埋め込みを学習することが可能であることを示す。
論文 参考訳(メタデータ) (2020-05-04T19:26:14Z) - To Split or Not to Split: The Impact of Disparate Treatment in
Classification [8.325775867295814]
異なる処理は、機械学習モデルが機密属性に基づいて個人に対して異なる決定を下すときに発生する。
本稿では,分類器の分割による性能改善の定量化のための分割処理の利点を紹介する。
我々は,小規模凸プログラムを解くことで効率よく計算できる分割利益の等価表現を証明した。
論文 参考訳(メタデータ) (2020-02-12T04:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。