論文の概要: Evaluating Interactive 2D Visualization as a Sample Selection Strategy for Biomedical Time-Series Data Annotation
- arxiv url: http://arxiv.org/abs/2603.26592v1
- Date: Fri, 27 Mar 2026 16:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.604034
- Title: Evaluating Interactive 2D Visualization as a Sample Selection Strategy for Biomedical Time-Series Data Annotation
- Title(参考訳): バイオメディカル時系列データアノテーションのサンプル選択戦略としてのインタラクティブ2次元可視化の評価
- Authors: Einari Vaaras, Manu Airaksinen, Okko Räsänen,
- Abstract要約: アルゴリズムによるサンプル選択はアノテーションをサポートするが、実際の人間のアノテーションに関する研究の証拠は乏しい。
アノテーションのサンプル選択方法として, ランダムサンプリング(RND), 最遠次トラバーサル(FAFT), グラフィカルユーザインタフェースに基づく3つの手法を比較した。
幼児運動評価(IMA)と音声感情認識(SER)の4つの分類課題における方法の評価を行った。
- 参考スコア(独自算出の注目度): 6.2881477729677115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable machine-learning models in biomedical settings depend on accurate labels, yet annotating biomedical time-series data remains challenging. Algorithmic sample selection may support annotation, but evidence from studies involving real human annotators is scarce. Consequently, we compare three sample selection methods for annotation: random sampling (RND), farthest-first traversal (FAFT), and a graphical user interface-based method enabling exploration of complementary 2D visualizations (2DVs) of high-dimensional data. We evaluated the methods across four classification tasks in infant motility assessment (IMA) and speech emotion recognition (SER). Twelve annotators, categorized as experts or non-experts, performed data annotation under a limited annotation budget, and post-annotation experiments were conducted to evaluate the sampling methods. Across all classification tasks, 2DV performed best when aggregating labels across annotators. In IMA, 2DV most effectively captured rare classes, but also exhibited greater annotator-to-annotator label distribution variability resulting from the limited annotation budget, decreasing classification performance when models were trained on individual annotators' labels; in these cases, FAFT excelled. For SER, 2DV outperformed the other methods among expert annotators and matched their performance for non-experts in the individual-annotator setting. A failure risk analysis revealed that RND was the safest choice when annotator count or annotator expertise was uncertain, whereas 2DV had the highest risk due to its greater label distribution variability. Furthermore, post-experiment interviews indicated that 2DV made the annotation task more interesting and enjoyable. Overall, 2DV-based sampling appears promising for biomedical time-series data annotation, particularly when the annotation budget is not highly constrained.
- Abstract(参考訳): バイオメディカルセッティングにおける信頼性の高い機械学習モデルは正確なラベルに依存するが、バイオメディカル時系列データの注釈付けは依然として難しい。
アルゴリズムによるサンプル選択はアノテーションをサポートするが、実際の人間のアノテーションに関する研究の証拠は乏しい。
その結果、アノテーションのサンプル選択方法として、乱数サンプリング(RND)、ファストファーストトラバーサル(FAFT)、高次元データの相補的な2次元ビジュアライゼーション(2DV)の探索を可能にするグラフィカルユーザインタフェースに基づく3つの手法を比較した。
幼児運動評価(IMA)と音声感情認識(SER)の4つの分類課題にまたがる手法について検討した。
専門家または非専門家に分類された12のアノテーションは,限られたアノテーション予算の下でデータアノテーションを行い,サンプリング手法を評価するための後アノテーション実験を行った。
すべての分類タスクにおいて、2DVはアノテータ間でラベルを集約する際に最もよく機能した。
IMAでは、2DVが最も効果的に捕獲されたレアクラスであるが、アノテーション予算の制限によるアノテータとアノテータのラベルの分布のばらつきが大きく、個々のアノテータのラベルをモデルとした場合の分類性能が低下し、FAFTは優れていた。
SERでは、2DVはエキスパートアノテータの他の手法よりも優れており、個々のアノテータ設定における非専門家のパフォーマンスと一致した。
失敗リスク分析の結果、RNDはアノテーター数やアノテーターの専門知識が不確実であった場合に最も安全な選択であった。
さらに,実験後のインタビューでは,2DVがアノテーションタスクをより面白く楽しいものにしたことが示唆された。
総じて、2DVベースのサンプリングは、特にアノテーション予算の制約が厳しくない場合に、生物医学的な時系列データアノテーションに期待できる。
関連論文リスト
- EviATTA: Evidential Active Test-Time Adaptation for Medical Segment Anything Models [26.560028123695517]
Evidential Active Test-Time Adaptation (EviATTA, Evidential Active Test-Time Adaptation) を提案する。
具体的には,ディリクレに基づくエビデンシャル・モデリングを用いて,分布の不確実性とデータの不確実性に全体的予測の不確実性を分解する。
EviATTAはバッチワイドとインスタンスワイドの両方のテスト時間適応設定の下で,最小限のエキスパートフィードバックで適応信頼性を継続的に向上することを示す。
論文 参考訳(メタデータ) (2026-03-15T23:46:31Z) - Optimizing Resources for On-the-Fly Label Estimation with Multiple Unknown Medical Experts [2.904892426557913]
本稿では,受信データのオンザフライラベリングをサポートするリアルタイムアノテーションに対する適応的アプローチを提案する。
我々は,3つのマルチアノテーション分類データセットに対するアプローチを,異なるモードで評価した。
論文 参考訳(メタデータ) (2025-10-04T21:41:26Z) - Prior2Former -- Evidential Modeling of Mask Transformers for Assumption-Free Open-World Panoptic Segmentation [74.55677741919035]
顕在学習に根ざしたセグメンテーション・ビジョン・トランスフォーマの最初のアプローチである Prefer2Former (P2F) を提案する。
P2Fは、ピクセル単位のバイナリマスク割り当てにおいて、モデル不確実性を計算するためのベータを組み込むことで、マスクビジョントランスフォーマーアーキテクチャを拡張している。
未知のクラスに対処するほとんどのセグメンテーションモデルとは異なり、P2FはOODデータサンプルへのアクセスや、ヴォイド(ラベルなし)クラスに対する対照的なトレーニングなしで動作する。
論文 参考訳(メタデータ) (2025-04-07T08:53:14Z) - DEUCE: Dual-diversity Enhancement and Uncertainty-awareness for Cold-start Active Learning [54.35107462768146]
コールドスタートアクティブラーニング(CSAL)は、手動アノテーションのためのラベルなしデータセットから貴重なインスタンスを選択する。
既存のCSAL手法は、弱いクラスと強い代表例を見落とし、バイアス学習をもたらす。
本稿ではCSALのための新しい二変量拡張および不確実性認識フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-01T04:00:03Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Disentangling Human Error from the Ground Truth in Segmentation of
Medical Images [12.009437407687987]
本稿では,純粋にノイズの多い観測のみから,個々のアノテータの信頼性,真のセグメンテーションラベル分布まで,共同学習手法を提案する。
本手法は,必要ならばシミュレートした3つの医用画像セグメンテーションデータセットと実際の多彩なアノテーションに対して有効であることを示す。
論文 参考訳(メタデータ) (2020-07-31T11:03:12Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - Semi-supervised lung nodule retrieval [2.055949720959582]
コンテンツベース画像検索(CBIR)システムは、クエリ画像と類似度でランク付けされた一連の画像を出力する。
データセット要素間の類似性(例えばnodules間の類似性)に関する基礎的な真実は、容易には利用できない。
本研究は,(1)部分ラベル付きデータセットの自動アノテーション,(2)述語アノテーションに基づく意味的類似度距離空間の学習,という2つのステップを含む半教師付きアプローチを提案する。
LIDCデータセットを用いて肺結節検索を行い,予測された評価値から埋め込みを学習することが可能であることを示す。
論文 参考訳(メタデータ) (2020-05-04T19:26:14Z) - Do Public Datasets Assure Unbiased Comparisons for Registration
Evaluation? [96.53940048041248]
画像誘導神経外科医の登録をベンチマークするために、2つのデータセットで手動で注釈付けされたランドマークをスクリーニングするために、ヴァリグラムを使用します。
Variograms を用いて, 潜在的に有意な症例を同定し, 経験者により検討した。
論文 参考訳(メタデータ) (2020-03-20T20:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。