論文の概要: Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges
- arxiv url: http://arxiv.org/abs/2408.03303v1
- Date: Tue, 6 Aug 2024 17:09:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-08-07 13:28:25.015799
- Title: Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges
- Title(参考訳): Blindのユーザによるオブジェクト認識エラーの扱い方 - 戦略と課題
- Authors: Jonggi Hong, Hernisa Kacorri,
- Abstract要約: 本稿では,視覚障害者と物体認識システムとのインタラクションの理解を目的とした,誤りの特定と回避を目的とした研究について述べる。
視覚障害者12名を対象に,視覚障害者12名を対象に調査を行った。
我々は、カメラベースの補助技術やオブジェクト認識システムにおいて、エラーを特定するためのユーザエクスペリエンス、課題、戦略に関する洞察を得た。
- 参考スコア(独自算出の注目度): 10.565823004989817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object recognition technologies hold the potential to support blind and low-vision people in navigating the world around them. However, the gap between benchmark performances and practical usability remains a significant challenge. This paper presents a study aimed at understanding blind users' interaction with object recognition systems for identifying and avoiding errors. Leveraging a pre-existing object recognition system, URCam, fine-tuned for our experiment, we conducted a user study involving 12 blind and low-vision participants. Through in-depth interviews and hands-on error identification tasks, we gained insights into users' experiences, challenges, and strategies for identifying errors in camera-based assistive technologies and object recognition systems. During interviews, many participants preferred independent error review, while expressing apprehension toward misrecognitions. In the error identification task, participants varied viewpoints, backgrounds, and object sizes in their images to avoid and overcome errors. Even after repeating the task, participants identified only half of the errors, and the proportion of errors identified did not significantly differ from their first attempts. Based on these insights, we offer implications for designing accessible interfaces tailored to the needs of blind and low-vision users in identifying object recognition errors.
- Abstract(参考訳): 物体認識技術は、周囲の世界をナビゲートする盲人や低視野の人々を支援する可能性を秘めている。
しかし、ベンチマークパフォーマンスと実用的なユーザビリティのギャップは依然として大きな課題である。
本稿では,視覚障害者と物体認識システムとのインタラクションの理解を目的とした,誤りの特定と回避を目的とした研究について述べる。
既存の物体認識システムURCamを応用し,12名の視覚障害者と低ビジョン参加者を対象としたユーザスタディを行った。
カメラベースの補助技術やオブジェクト認識システムにおけるエラーを識別するためのユーザエクスペリエンス,課題,戦略について,詳細なインタビューや手動のエラー識別タスクを通じて洞察を得た。
インタビュー中、多くの参加者は独立したエラーレビューを好み、誤認識に対する理解を表明していた。
エラー識別タスクでは、参加者は画像内の視点、背景、オブジェクトサイズを変化させ、エラーを回避し、克服する。
タスクを繰り返すと、被験者はエラーの半数しか特定できず、同定されたエラーの割合は、最初の試みと大きく異なるものではなかった。
これらの知見に基づき、物体認識の誤りを識別する際、視覚障害者や低ビジョン利用者のニーズに合わせて、アクセス可能なインターフェースを設計するための意味を提供する。
関連論文リスト
- Collaborative Knowledge Infusion for Low-resource Stance Detection [83.88515573352795]
姿勢検出モデルを支援するために、ターゲット関連の知識がしばしば必要である。
低リソース姿勢検出タスクに対する協調的知識注入手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T08:32:14Z) - Assessing the Efficacy of Deep Learning Approaches for Facial Expression Recognition in Individuals with Intellectual Disabilities [0.7124736158080939]
我々は、知的障害者の表情を認識するために、異なるアプローチで12の畳み込みニューラルネットワークを訓練する。
本研究は,ユーザ固有の訓練手法を用いて,この集団内での表情認識の必要性を示唆するものである。
論文 参考訳(メタデータ) (2024-01-22T12:02:40Z) - Visual Hindsight Self-Imitation Learning for Interactive Navigation [18.02337761240743]
本稿では,視覚的ハイビジョン・セルフ・イミテーション・ラーニング(VHS)を提案する。
VHSはインタラクティブなビジュアルナビゲーションタスクにおいて、既存の技術よりも優れています。
論文 参考訳(メタデータ) (2023-12-05T05:34:12Z) - When Measures are Unreliable: Imperceptible Adversarial Perturbations
toward Top-$k$ Multi-Label Learning [83.8758881342346]
新しい損失関数は、視覚的および測定的不受容性を両立できる敵の摂動を生成するために考案された。
大規模ベンチマークデータセットを用いた実験により,提案手法が最上位の$kのマルチラベルシステムを攻撃する際の優位性を実証した。
論文 参考訳(メタデータ) (2023-07-27T13:18:47Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Gait Recognition Based on Deep Learning: A Survey [1.731119436110423]
バイオメトリに基づく制御システムは、適切な操作を行うために、個々の期待する行動や協調に依存しない。
いくつかの研究は、歩行認識アプローチによってこの問題に対処することを提案している。
ディープラーニングベースのアプローチは、ほぼあらゆる画像やコンピュータビジョンに関連する問題に対処する、堅牢なツールセットとして最近登場した。
論文 参考訳(メタデータ) (2022-01-10T12:44:42Z) - Unsupervised Person Re-Identification: A Systematic Survey of Challenges
and Solutions [64.68497473454816]
教師なしのRe-IDは、Re-ID担当者のスケーラビリティ問題に対処する可能性に注目が集まっている。
教師なしのRe-IDは、主に人物の特徴学習を監督するアイデンティティラベルが欠如しているため、難しい。
本調査では,課題と解決の観点から,教師なしのRe-IDに関する最近の研究を概観する。
論文 参考訳(メタデータ) (2021-09-01T00:01:35Z) - Harnessing Unrecognizable Faces for Face Recognition [87.80037162457427]
本稿では,顔画像の認識可能性の尺度を提案し,主に認識可能なアイデンティティを用いて訓練されたディープニューラルネットワークによって実現された。
FAR=1e-5において,認識可能性を考慮した場合,単画像認識の誤り率を58%減少させることを示す。
論文 参考訳(メタデータ) (2021-06-08T05:25:03Z) - Masked Contrastive Learning for Anomaly Detection [10.499890749386676]
マスク型コントラスト学習という,タスク固有のコントラスト学習のバリエーションを提案する。
また,自己アンサンブル推論と呼ばれる新しい推論手法を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:27:02Z) - More Than Accuracy: Towards Trustworthy Machine Learning Interfaces for
Object Recognition [0.0]
本稿では,画像中の物体を認識する機械学習(ML)システムのユーザエクスペリエンスについて検討する。
MLの背景を持つユーザを,異なるレベルの精度で3つのシステムの3つのビジュアライゼーションに公開しました。
インタビューでは,ユーザが使用するシステムの精度を評価する上で,可視化がいかに役立ったか,システムの可視化と精度が信頼と信頼にどのように影響するかを調べた。
論文 参考訳(メタデータ) (2020-08-05T07:56:37Z) - Learning to Detect Important People in Unlabelled Images for
Semi-supervised Important People Detection [85.91577271918783]
本稿では,部分的に注釈付けされた画像から重要な人物を検出することを提案する。
提案手法では,未注釈画像の個人に対して擬似ラベルを割り当てることが反復的に学習される。
評価のために2つの大規模データセットを収集した。
論文 参考訳(メタデータ) (2020-04-16T10:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。