論文の概要: Visual Chirality
- arxiv url: http://arxiv.org/abs/2006.09512v1
- Date: Tue, 16 Jun 2020 20:48:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 21:15:21.188518
- Title: Visual Chirality
- Title(参考訳): 視覚的キラリティー
- Authors: Zhiqiu Lin, Jin Sun, Abe Davis, Noah Snavely
- Abstract要約: 視覚データの統計が反射によってどのように変化するかを検討する。
我々の研究は、データ強化、自己教師付き学習、画像鑑定に影響を及ぼす。
- 参考スコア(独自算出の注目度): 51.685596116645776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How can we tell whether an image has been mirrored? While we understand the
geometry of mirror reflections very well, less has been said about how it
affects distributions of imagery at scale, despite widespread use for data
augmentation in computer vision. In this paper, we investigate how the
statistics of visual data are changed by reflection. We refer to these changes
as "visual chirality", after the concept of geometric chirality - the notion of
objects that are distinct from their mirror image. Our analysis of visual
chirality reveals surprising results, including low-level chiral signals
pervading imagery stemming from image processing in cameras, to the ability to
discover visual chirality in images of people and faces. Our work has
implications for data augmentation, self-supervised learning, and image
forensics.
- Abstract(参考訳): 画像がミラー化されているかどうか、どうすればわかるのか?
ミラー反射の形状はよく理解されているが、コンピュータビジョンでデータ拡張が広く使われているにもかかわらず、大規模な画像の分布にどのように影響するかについてはあまり語られていない。
本稿では,視覚データの統計が反射によってどのように変化するかを検討する。
これらの変化を「視覚的キラリティ」と呼び、幾何学的キラリティの概念(鏡像とは異なる物体の概念)の後である。
視覚キラリティーの分析から、カメラの画像処理から生じる低レベルのキラル信号や、人と顔の画像における視覚キラリティーの発見など、驚くべき結果が得られた。
我々の研究は、データ強化、自己教師付き学習、画像鑑定に影響を及ぼす。
関連論文リスト
- When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - For a semiotic AI: Bridging computer vision and visual semiotics for computational observation of large scale facial image archives [3.418398936676879]
この研究は、ソーシャルメディアプラットフォームにおける画像の社会的・文化的影響を大規模に調査するためのフレームワークであるFRESCOを提示する。
FRESCOは、最新のコンピュータビジョン技術を用いて、画像を数値変数と分類変数に分解する。
このフレームワークは、線や色のような基本的な視覚的特徴を含むプラスティックレベル、特定の実体や概念を表す図形レベル、特にオブザーバーとオブザーバーの視点を構築することに焦点を当てた啓示レベルという3つのレベルにわたって画像を分析する。
論文 参考訳(メタデータ) (2024-07-03T16:57:38Z) - DreamSim: Learning New Dimensions of Human Visual Similarity using
Synthetic Data [43.247597420676044]
現在の知覚的類似度メトリクスは、ピクセルとパッチのレベルで動作します。
これらのメトリクスは、低レベルの色やテクスチャの観点から画像を比較するが、画像レイアウト、オブジェクトポーズ、セマンティック内容の中間レベルの類似点や相違点をキャプチャできない。
我々は,画像の全体的評価を行う知覚的指標を開発した。
論文 参考訳(メタデータ) (2023-06-15T17:59:50Z) - Prune and distill: similar reformatting of image information along rat
visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。
ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。
我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文 参考訳(メタデータ) (2022-05-27T08:06:40Z) - LFW-Beautified: A Dataset of Face Images with Beautification and
Augmented Reality Filters [53.180678723280145]
いくつかの操作を含む顔画像のデータベースにコントリビュートする。
画像強調フィルター(コントラストや稲妻を主に修正する)や、動物の鼻や眼鏡などのアイテムを組み込んだ拡張現実フィルターが含まれている。
各データセットには、64×64の4,324枚の画像があり、合計34,592枚の画像がある。
論文 参考訳(メタデータ) (2022-03-11T17:05:10Z) - Dissecting Image Crops [22.482090207522358]
収穫の基本的な操作は、ほぼ全てのコンピュータビジョンシステムに根ざしている。
本稿では,本操作で導入された微妙な痕跡について考察する。
本研究では,これらの痕跡の検出方法と,収穫が画像分布に与える影響について検討する。
論文 参考訳(メタデータ) (2020-11-24T01:33:47Z) - Unsupervised Deep Metric Learning with Transformed Attention Consistency
and Contrastive Clustering Loss [28.17607283348278]
教師なしのメートル法学習のための既存のアプローチは、入力画像自体の自己超越情報を探索することに焦点を当てている。
我々は、画像を分析する際、人間の目は個々の画像を調べるのではなく、互いに画像を比較することが多いことを観察した。
本研究では,画像間の自己超越情報に基づいてネットワークを学習する,教師なし深度学習のための新しいアプローチを開発する。
論文 参考訳(メタデータ) (2020-08-10T19:33:47Z) - Unsupervised Landmark Learning from Unpaired Data [117.81440795184587]
教師なしランドマーク学習の最近の試みは、外観は似ているがポーズでは異なる合成画像対を活用する。
本稿では,2回スワッピング・リコンストラクション・ストラテジーを適用して最終監視を行うクロスイメージ・サイクル整合性フレームワークを提案する。
提案するフレームワークは,強いベースラインを大きなマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-06-29T13:57:20Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。