論文の概要: Semi-Supervised Learning for Eye Image Segmentation
- arxiv url: http://arxiv.org/abs/2103.09369v1
- Date: Wed, 17 Mar 2021 00:05:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-18 12:59:47.437663
- Title: Semi-Supervised Learning for Eye Image Segmentation
- Title(参考訳): 眼画像分割のための半教師付き学習
- Authors: Aayush K. Chaudhary, Prashnna K. Gyawali, Linwei Wang, Jeff B. Pelz
- Abstract要約: 最近の外観ベースモデルの進歩により、難しいシナリオでの視線追跡性能が向上している。
精度の向上は、しばしば巨大なデータセットをラベル付けするコストが伴う。
本研究は,ラベルなし画像を利用したアイパート識別のための半教師付き学習フレームワークを2つ提示する。
- 参考スコア(独自算出の注目度): 7.084953573199144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in appearance-based models have shown improved eye tracking
performance in difficult scenarios like occlusion due to eyelashes, eyelids or
camera placement, and environmental reflections on the cornea and glasses. The
key reason for the improvement is the accurate and robust identification of eye
parts (pupil, iris, and sclera regions). The improved accuracy often comes at
the cost of labeling an enormous dataset, which is complex and time-consuming.
This work presents two semi-supervised learning frameworks to identify
eye-parts by taking advantage of unlabeled images where labeled datasets are
scarce. With these frameworks, leveraging the domain-specific augmentation and
novel spatially varying transformations for image segmentation, we show
improved performance on various test cases. For instance, for a model trained
on just 48 labeled images, these frameworks achieved an improvement of 0.38%
and 0.65% in segmentation performance over the baseline model, which is trained
only with the labeled dataset.
- Abstract(参考訳): 近年の外観モデルによる視線追跡性能の向上は、眼炎、まぶた、カメラ装着による閉塞、角膜や眼鏡の環境反射などによる難易度が向上している。
改善の鍵となる理由は、目の部分(毛虫、虹彩、硬化領域)の正確で堅牢な識別である。
精度の向上は、複雑で時間がかかる巨大なデータセットをラベル付けするコストがかかることが少なくありません。
本研究は,ラベル付きデータセットが不足している未ラベル画像を活用することにより,アイパートを識別するための,半教師付き学習フレームワークを2つ提示する。
これらのフレームワークでは、領域固有の拡張と空間的変化の新たな変換を活用し、様々なテストケースの性能向上を示す。
例えば、48のラベル付きイメージでトレーニングされたモデルでは、これらのフレームワークはベースラインモデルよりも0.38%と0.65%のセグメンテーション性能の向上を達成した。
関連論文リスト
- Synergy and Diversity in CLIP: Enhancing Performance Through Adaptive Backbone Ensembling [58.50618448027103]
コントラスト言語-画像事前学習(CLIP)は画像表現学習において顕著な手法である。
本稿では,CLIPを訓練した視覚バックボーンの違いについて検討する。
方法によって、最高の単一のバックボーンよりも39.1%の精度が著しく向上する。
論文 参考訳(メタデータ) (2024-05-27T12:59:35Z) - Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Weakly supervised segmentation with point annotations for histopathology
images via contrast-based variational model [7.021021047695508]
病理組織像のセグメンテーション結果を生成するためのコントラストモデルを提案する。
本手法は,病理組織像における対象領域の共通特性を考察し,エンドツーエンドで訓練することができる。
より地域的に一貫性があり、スムーズな境界セグメンテーションを生成することができ、未ラベルの新規領域に対してより堅牢である。
論文 参考訳(メタデータ) (2023-04-07T10:12:21Z) - Learning Customized Visual Models with Retrieval-Augmented Knowledge [104.05456849611895]
我々は、ターゲットドメイン用にカスタマイズされたビジュアルモデルを構築するための、関連するWeb知識を取得するためのフレームワークであるREACTを提案する。
我々は、Webスケールデータベースから最も関連性の高い画像テキストペアを外部知識として検索し、元の重みをすべて凍結しながら、新しいモジュール化されたブロックをトレーニングするだけで、モデルをカスタマイズすることを提案する。
REACTの有効性は、ゼロ、少数、フルショット設定を含む分類、検索、検出、セグメンテーションタスクに関する広範な実験を通じて実証される。
論文 参考訳(メタデータ) (2023-01-17T18:59:06Z) - Towards Automated Polyp Segmentation Using Weakly- and Semi-Supervised
Learning and Deformable Transformers [8.01814397869811]
ポリープセグメンテーションは大腸癌のコンピュータ診断への重要なステップである。
ポリプセグメンテーションの手法の多くは、ピクセル単位のアノテートデータセットを必要とする。
本稿では,弱い注釈付き画像のみを用いて,ラベルなし画像の活用によりトレーニング可能な新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-21T20:44:12Z) - EllSeg-Gen, towards Domain Generalization for head-mounted eyetracking [19.913297057204357]
このようなアーティファクトの存在にもかかわらず、畳み込みネットワークは視線特徴の抽出に優れていることを示す。
複数のデータセットでトレーニングされた単一モデルのパフォーマンスを、個々のデータセットでトレーニングされたモデルのプールと比較する。
その結果, 眼球画像を用いたモデルでは, マルチセットトレーニングにより, 外観の多様性が向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-04T08:35:52Z) - Unsupervised Domain Adaptation with Contrastive Learning for OCT
Segmentation [49.59567529191423]
本稿では,新しい未ラベル領域からのボリューム画像のセグメンテーションのための,新しい半教師付き学習フレームワークを提案する。
教師付き学習とコントラスト学習を併用し、3次元の近傍スライス間の類似性を利用したコントラストペア方式を導入する。
論文 参考訳(メタデータ) (2022-03-07T19:02:26Z) - Towards End-to-end Video-based Eye-Tracking [50.0630362419371]
画像のみから視線を推定することは、観察不可能な人固有の要因のために難しい課題である。
本稿では,これらの意味的関係と時間的関係を明確に学習することを目的とした,新しいデータセットとアタッチメント手法を提案する。
視覚刺激からの情報と視線画像の融合が,文献に記録された人物と同じような性能を達成することにつながることを実証した。
論文 参考訳(メタデータ) (2020-07-26T12:39:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。