論文の概要: EllSeg-Gen, towards Domain Generalization for head-mounted eyetracking
- arxiv url: http://arxiv.org/abs/2205.01947v1
- Date: Wed, 4 May 2022 08:35:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 16:23:57.373872
- Title: EllSeg-Gen, towards Domain Generalization for head-mounted eyetracking
- Title(参考訳): エルセグゲン : ヘッドマウントアイトラッキングの領域一般化に向けて
- Authors: Rakshit S. Kothari, Reynold J. Bailey, Christopher Kanan, Jeff B.
Pelz, Gabriel J. Diaz
- Abstract要約: このようなアーティファクトの存在にもかかわらず、畳み込みネットワークは視線特徴の抽出に優れていることを示す。
複数のデータセットでトレーニングされた単一モデルのパフォーマンスを、個々のデータセットでトレーニングされたモデルのプールと比較する。
その結果, 眼球画像を用いたモデルでは, マルチセットトレーニングにより, 外観の多様性が向上することが示唆された。
- 参考スコア(独自算出の注目度): 19.913297057204357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The study of human gaze behavior in natural contexts requires algorithms for
gaze estimation that are robust to a wide range of imaging conditions. However,
algorithms often fail to identify features such as the iris and pupil centroid
in the presence of reflective artifacts and occlusions. Previous work has shown
that convolutional networks excel at extracting gaze features despite the
presence of such artifacts. However, these networks often perform poorly on
data unseen during training. This work follows the intuition that jointly
training a convolutional network with multiple datasets learns a generalized
representation of eye parts. We compare the performance of a single model
trained with multiple datasets against a pool of models trained on individual
datasets. Results indicate that models tested on datasets in which eye images
exhibit higher appearance variability benefit from multiset training. In
contrast, dataset-specific models generalize better onto eye images with lower
appearance variability.
- Abstract(参考訳): 自然文脈における人間の視線行動の研究は、幅広い撮像条件にロバストな視線推定のためのアルゴリズムを必要とする。
しかし、アルゴリズムは反射的アーティファクトやオクルージョンの存在下で虹彩や瞳孔のような特徴を識別できないことが多い。
これまでの研究では、このような人工物が存在するにもかかわらず、畳み込みネットワークは視線の特徴を抽出することに優れていた。
しかし、これらのネットワークは訓練中は見当たらないデータではよく機能しない。
この研究は、複数のデータセットで畳み込みネットワークを共同で訓練する直感に従って、目の部分の一般化表現を学ぶ。
複数のデータセットでトレーニングされた単一モデルのパフォーマンスを、個々のデータセットでトレーニングされたモデルのプールと比較する。
その結果, 眼球画像を用いたモデルでは, マルチセットトレーニングによる視認性の向上が期待できることがわかった。
対照的に、データセット固有のモデルは、外観の多様性が低い眼画像に対してより一般化される。
関連論文リスト
- SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Image change detection with only a few samples [7.5780621370948635]
画像変化検出タスクの最大の障害は、さまざまな場面をカバーする大きな注釈付きデータセットの欠如である。
本稿では,合成データを生成するための単純な画像処理手法を提案する。
次に、対象検出に基づく初期の融合ネットワークを設計し、シアムニューラルネットを上回ります。
論文 参考訳(メタデータ) (2023-11-07T07:01:35Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Assessing Dataset Bias in Computer Vision [0.0]
偏見は、訓練するモデルに伝播する傾向があり、しばしば少数派ではパフォーマンスが劣る。
UTKFaceデータセットのサンプルに、アンダーサンプリング、幾何変換、可変オートエンコーダ(VAE)、生成逆ネットワーク(GAN)など、いくつかの拡張手法を適用する。
FairFaceモデルと比較して、複数のデータセット上の年齢と民族の分類において、我々のモデルが全体的なパフォーマンスと一貫性を向上できることを示しました。
論文 参考訳(メタデータ) (2022-05-03T22:45:49Z) - A Systematic Evaluation of Domain Adaptation in Facial Expression
Recognition [0.0]
本稿では,表情認識における領域適応の体系的評価について述べる。
我々は、最先端のトランスファー学習技術と、6つの一般的な顔表情データセットを使用する。
その結果,移動学習の精度は高くなく,目的のデータセットと慣用的に異なることがわかった。
論文 参考訳(メタデータ) (2021-06-29T14:41:19Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Sparse data to structured imageset transformation [0.0]
スパースデータセットを含む機械学習の問題は、サンプルと特徴の数が非常に大きい場合、畳み込みニューラルネットワークの使用の恩恵を受ける可能性がある。
このようなデータセットをイメージセットに変換し、畳み込みニューラルネットワークで使用可能な各イメージ構造を与えようとする。
論文 参考訳(メタデータ) (2020-05-07T20:36:59Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。