論文の概要: Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality
- arxiv url: http://arxiv.org/abs/2408.01895v2
- Date: Thu, 26 Sep 2024 14:57:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 13:07:08.087513
- Title: Computational Trichromacy Reconstruction: Empowering the Color-Vision Deficient to Recognize Colors Using Augmented Reality
- Title(参考訳): コンピュータトリクロマシー再構成 : 拡張現実による色認識に欠く色覚の強化
- Authors: Yuhao Zhu, Ethan Chen, Colin Hascup, Yukang Yan, Gaurav Sharma,
- Abstract要約: 色覚障害(CVD)患者が色を認識・識別する支援技術を提案する。
ディクロマトリクスの色知覚は、通常のトリクロマトリクスの3次元色(3D)知覚の2次元部分集合の縮小である。
提案システムを用いて、CVD個人は、計算色空間変換により、異なる色に異なる変化を誘発することができる。
- 参考スコア(独自算出の注目度): 12.77228283953913
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose an assistive technology that helps individuals with Color Vision Deficiencies (CVD) to recognize/name colors. A dichromat's color perception is a reduced two-dimensional (2D) subset of a normal trichromat's three dimensional color (3D) perception, leading to confusion when visual stimuli that appear identical to the dichromat are referred to by different color names. Using our proposed system, CVD individuals can interactively induce distinct perceptual changes to originally confusing colors via a computational color space transformation. By combining their original 2D precepts for colors with the discriminative changes, a three dimensional color space is reconstructed, where the dichromat can learn to resolve color name confusions and accurately recognize colors. Our system is implemented as an Augmented Reality (AR) interface on smartphones, where users interactively control the rotation through swipe gestures and observe the induced color shifts in the camera view or in a displayed image. Through psychophysical experiments and a longitudinal user study, we demonstrate that such rotational color shifts have discriminative power (initially confusing colors become distinct under rotation) and exhibit structured perceptual shifts dichromats can learn with modest training. The AR App is also evaluated in two real-world scenarios (building with lego blocks and interpreting artistic works); users all report positive experience in using the App to recognize object colors that they otherwise could not.
- Abstract(参考訳): 色覚障害(CVD)患者が色を認識・識別する支援技術を提案する。
ディクロマトリクスの色知覚は、通常のトリクロマトリクスの3次元色(3D)知覚の2次元(2次元)部分集合であり、ディクロマトリクスと同一に見える視覚刺激が異なる色名によって参照されるときに混乱を引き起こす。
提案システムを用いて、CVD個人は、コンピュータカラー空間変換により、異なる知覚的変化を誘発し、本来の混乱色へと導出することができる。
色に対する元の2D規範と識別的変化を組み合わせることで、3次元の色空間を再構成し、ディクロマトグラフィーは色名の混乱を解消し、色を正確に認識することができる。
本システムはスマートフォンのARインタフェースとして実装されており、ユーザーはスワイプジェスチャーで回転をインタラクティブに制御し、カメラビューや表示画像内の色変化を観察することができる。
心理物理学実験と縦断的ユーザスタディを通じて、このような回転色シフトが識別力を持つ(初期は、回転下で色が区別される)ことを示し、ディクロマトリクスが適度なトレーニングで学習できる構造化された知覚色シフトを示す。
ARアプリは、2つの現実世界のシナリオ(レゴブロックで構築し、芸術作品の解釈)で評価されている。
関連論文リスト
- A Computational Framework for Modeling Emergence of Color Vision in the Human Brain [9.10623460958915]
脳がどのようにして色覚を受信した視神経信号から純粋にデコードするかは謎である。
眼と大脳皮質の両方をシミュレートすることで、人間の色覚の出現をモデル化するための計算フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-29T21:27:06Z) - THOR2: Leveraging Topological Soft Clustering of Color Space for Human-Inspired Object Recognition in Unseen Environments [1.9950682531209158]
本研究では,RGB-D画像から生成された点群に対する3次元形状と色に基づく記述子TOPS2と,それに付随する認識フレームワークTHOR2を提案する。
TOPS2ディスクリプタは、TOPSディスクリプタから3D形状のスライシングに基づくトポロジカル表現を保持することにより、人間の認知機構であるオブジェクト単位を具現化する。
合成データを用いてトレーニングされたTHOR2は、3D形状をベースとしたTHORに比べて認識精度が著しく向上した。
論文 参考訳(メタデータ) (2024-08-02T21:24:14Z) - Color Equivariant Convolutional Networks [50.655443383582124]
CNNは、偶然に記録された条件によって導入された色の変化の間にデータ不均衡がある場合、苦労する。
カラースペクトル間の形状特徴共有を可能にする新しいディープラーニングビルディングブロックであるカラー等変畳み込み(CEConvs)を提案する。
CEConvsの利点は、様々なタスクに対するダウンストリーム性能と、列車-テストの分散シフトを含む色の変化に対するロバスト性の改善である。
論文 参考訳(メタデータ) (2023-10-30T09:18:49Z) - ColorSense: A Study on Color Vision in Machine Visual Recognition [57.916512479603064]
視覚認識ベンチマークから,前景や背景色ラベルの非自明なアノテーション110,000点を収集する。
色識別のレベルがマシン認識モデルの性能に与える影響を実証することにより、データセットの使用を検証した。
その結果,分類や局所化などの物体認識タスクは,色覚バイアスの影響を受けやすいことが示唆された。
論文 参考訳(メタデータ) (2022-12-16T18:51:41Z) - Name Your Colour For the Task: Artificially Discover Colour Naming via
Colour Quantisation Transformer [62.75343115345667]
そこで本研究では,色空間を定量化しつつ,画像上での認識を維持しつつ,色空間を定量化する新しい色量子化変換器CQFormerを提案する。
人工色システムと人間の言語における基本色用語との一貫性のある進化パターンを観察する。
我々のカラー量子化法は、画像記憶を効果的に圧縮する効率的な量子化法も提供する。
論文 参考訳(メタデータ) (2022-12-07T03:39:18Z) - Learning to Structure an Image with Few Colors and Beyond [59.34619548026885]
カラー量子化ネットワークであるColorCNNを提案し、分類損失を最小限に抑えて、限られた色空間で画像を構成することを学習する。
複数の色空間サイズ構成をサポートするColorCNN+を導入し、大色空間における認識精度の低下と望ましくない視覚的忠実度に関する過去の問題に対処する。
潜在的な応用として、ネットワーク認識のための画像圧縮手法としてColorCNNが利用可能であることを示す。
論文 参考訳(メタデータ) (2022-08-17T17:59:15Z) - Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。
本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。
提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文 参考訳(メタデータ) (2022-04-23T01:54:06Z) - The Utility of Decorrelating Colour Spaces in Vector Quantised
Variational Autoencoders [1.7792264784100689]
ネットワーク学習構造表現を強制するカラー空間変換を提案する。
入力が1つの色空間のイメージであり、出力が別の色空間のイメージであるVQ-VAEのいくつかの例を訓練した。
論文 参考訳(メタデータ) (2020-09-30T07:44:01Z) - Semantic-driven Colorization [78.88814849391352]
最近の着色は、白黒画像の着色を学習しながら意味情報を暗黙的に予測する。
そこで本研究では,まず,人間の動作をシミュレートして,画像の理解を学習し,色づけする。
論文 参考訳(メタデータ) (2020-06-13T08:13:30Z) - Nonparametric Data Analysis on the Space of Perceived Colors [0.0]
本稿では、Resnikoff 3D同質空間モデル上でランダムな物体と見なされる知覚色について述べる。
機械ビジョンにおける色分化の2つの応用を統計的手法として提案した。
論文 参考訳(メタデータ) (2020-04-05T17:43:33Z) - Investigating the Importance of Shape Features, Color Constancy, Color
Spaces and Similarity Measures in Open-Ended 3D Object Recognition [4.437005770487858]
オープンエンド3次元物体認識における形状情報,色濃度,色空間,および様々な類似度尺度の重要性について検討した。
実験結果から, 色と形状のテクスタイピングは, テクスタイピングのみのアプローチ, テクスタイピングのみのアプローチよりも大幅に改善されていることが明らかとなった。
論文 参考訳(メタデータ) (2020-02-10T14:24:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。