論文の概要: Situated Cameras, Situated Knowledges: Towards an Egocentric
Epistemology for Computer Vision
- arxiv url: http://arxiv.org/abs/2307.00064v1
- Date: Fri, 30 Jun 2023 18:07:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 18:22:29.000378
- Title: Situated Cameras, Situated Knowledges: Towards an Egocentric
Epistemology for Computer Vision
- Title(参考訳): 位置カメラと位置認識 : コンピュータビジョンのための自己中心認識論に向けて
- Authors: Samuel Goree and David Crandall
- Abstract要約: 1988年の影響力のある論文『Situated Knowledges』で、ドナ・ハラウェイは科学知識を議論するための比喩として視点と視点を使用している。
今日、エゴセントリックなコンピュータビジョンは、リテラルな視覚コンテキストを除いて、同じ問題の多くを論じている。
- 参考スコア(独自算出の注目度): 4.051523221722475
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In her influential 1988 paper, Situated Knowledges, Donna Haraway uses vision
and perspective as a metaphor to discuss scientific knowledge. Today,
egocentric computer vision discusses many of the same issues, except in a
literal vision context. In this short position paper, we collapse that
metaphor, and explore the interactions between feminist epistemology and
egocentric CV as "Egocentric Epistemology." Using this framework, we argue for
the use of qualitative, human-centric methods as a complement to performance
benchmarks, to center both the literal and metaphorical perspective of human
crowd workers in CV.
- Abstract(参考訳): 1988年の影響力のある論文『Situated Knowledges』で、ドナ・ハラウェイは科学的知識を議論するメタファーとして視覚と視点を使用している。
今日、エゴセントリックなコンピュータビジョンは、リテラルな視覚コンテキストを除いて、同じ問題の多くを論じている。
本稿では,そのメタファーを崩壊させ,フェミニストの認識論とエゴセントリックなCVの相互作用を「エゴセントリックな認識論」として探求する。
この枠組みを用いることで、CVにおける人群衆労働者のリテラルと比喩的視点を両立させるため、パフォーマンスベンチマークを補完する定性的、人間中心の手法を用いることを議論する。
関連論文リスト
- When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Lookism: The overlooked bias in computer vision [11.306732956100213]
ルックリズムはコンピュータビジョンでは探索されていないが、深い意味を持つ可能性がある。
本稿では,コンピュータビジョンモデルにおける重要なバイアスとして,ルックリズムの体系的研究を提唱する。
論文 参考訳(メタデータ) (2024-08-21T09:07:20Z) - For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.418398936676879]
この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。
FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。
このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文 参考訳(メタデータ) (2024-07-03T16:57:38Z) - And Then the Hammer Broke: Reflections on Machine Ethics from Feminist Philosophy of Science [0.0]
視覚は知識の倫理的、政治的問題において重要な比喩である。
コンピュータビジョンの技術を具体化して認識する材料として理解するための事例である。
アプローチはコンピュータビジョン研究、現象学、フェミニスト理論のパラダイムに基づいている。
論文 参考訳(メタデータ) (2024-03-09T05:50:32Z) - Assistant, Parrot, or Colonizing Loudspeaker? ChatGPT Metaphors for
Developing Critical AI Literacies [0.9012198585960443]
本研究は,AIシステムの理解を形作るフレームの認識を構築する上で,AIのメタファの議論がいかに役立つかを考察する。
様々な情報源からメタファーを分析し、7つの質問に答えて個別に反映した。
我々は、それが人為的形態化を促進するかどうかの次元に沿って、それぞれの比喩を探索し、そのような比喩がどの程度AIがセンシティブであるかを示唆した。
論文 参考訳(メタデータ) (2024-01-15T15:15:48Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - MetaCLUE: Towards Comprehensive Visual Metaphors Research [43.604408485890275]
本稿では,視覚的メタファの視覚的タスクであるMetaCLUEを紹介する。
我々は、アノテーションに基づいて、視覚と言語における最先端モデルの包括的分析を行う。
この研究が、人間のようなクリエイティブな能力を持つAIシステムを開発するための具体的なステップを提供することを期待している。
論文 参考訳(メタデータ) (2022-12-19T22:41:46Z) - EgoTaskQA: Understanding Human Tasks in Egocentric Videos [89.9573084127155]
EgoTaskQAベンチマークは、現実世界のエゴセントリックなビデオに対する質問回答を通じて、タスク理解の重要な次元を提供する。
我々は,(1)行動依存と効果,(2)意図と目標,(3)エージェントの他者に対する信念の理解を念頭に設計する。
我々は、我々のベンチマークで最先端のビデオ推論モデルを評価し、複雑なゴール指向のエゴセントリックなビデオを理解する上で、人間の間に大きなギャップがあることを示します。
論文 参考訳(メタデータ) (2022-10-08T05:49:05Z) - Metaphor Generation with Conceptual Mappings [58.61307123799594]
我々は、関連する動詞を置き換えることで、リテラル表現を与えられた比喩文を生成することを目指している。
本稿では,認知領域間の概念マッピングを符号化することで生成過程を制御することを提案する。
教師なしCM-Lexモデルは,近年のディープラーニングメタファ生成システムと競合することを示す。
論文 参考訳(メタデータ) (2021-06-02T15:27:05Z) - Bongard-LOGO: A New Benchmark for Human-Level Concept Learning and
Reasoning [78.13740873213223]
ボナード問題(BP)は、インテリジェントシステムにおける視覚認知へのインスピレーションとして導入された。
我々は人間レベルの概念学習と推論のための新しいベンチマークBongard-LOGOを提案する。
論文 参考訳(メタデータ) (2020-10-02T03:19:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。