論文の概要: Object Recognition as Classification of Visual Properties
- arxiv url: http://arxiv.org/abs/2112.10531v1
- Date: Mon, 20 Dec 2021 13:50:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-21 22:13:18.007462
- Title: Object Recognition as Classification of Visual Properties
- Title(参考訳): 視覚特性の分類としての物体認識
- Authors: Fausto Giunchiglia, Mayukh Bagchi
- Abstract要約: 本稿では,Ranganathanの4段階の顔付き知識組織プロセスに基づく物体認識プロセスを提案する。
我々は,オブジェクト認識リソースの構築を目的とした,現在進行中のMultiMedia UKCを紹介した。
- 参考スコア(独自算出の注目度): 5.1652563977194434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We base our work on the teleosemantic modelling of concepts as abilities
implementing the distinct functions of recognition and classification.
Accordingly, we model two types of concepts - substance concepts suited for
object recognition exploiting visual properties, and classification concepts
suited for classification of substance concepts exploiting linguistically
grounded properties. The goal in this paper is to demonstrate that object
recognition can be construed as classification of visual properties, as
distinct from work in mainstream computer vision. Towards that, we present an
object recognition process based on Ranganathan's four-phased faceted knowledge
organization process, grounded in the teleosemantic distinctions of substance
concept and classification concept. We also briefly introduce the ongoing
project MultiMedia UKC, whose aim is to build an object recognition resource
following our proposed process
- Abstract(参考訳): 我々は、認識と分類の異なる機能を実装する能力としての概念の遠隔モデリングに基づく。
したがって、視覚特性を利用した物体認識に適した物質概念と、言語的に接地された特性を利用した物質概念の分類に適した分類概念の2つの概念をモデル化する。
本稿では,物体認識を視覚特性の分類として,主流コンピュータビジョンの作業とは別物として解釈できることを実証する。
そこで本研究では, 物質概念と分類概念のテレオーセマンティックな区別に基づく, ランガナサンの四相顔知識組織プロセスに基づく物体認識プロセスを提案する。
我々はまた,提案プロセスに従ってオブジェクト認識リソースを構築することを目的とした,進行中のMultiMedia UKCを紹介した。
関連論文リスト
- ECOR: Explainable CLIP for Object Recognition [4.385998292803586]
本稿では,カテゴリと合理性の連立確率分布に基づくオブジェクト認識タスクにおける説明可能性の数学的定義を提案する。
本手法は,説明可能な分類における最先端性能を示す。
この進歩は、説明可能なオブジェクト認識を改善し、多様なアプリケーションに対する信頼を高める。
論文 参考訳(メタデータ) (2024-04-19T12:20:49Z) - Advancing Ante-Hoc Explainable Models through Generative Adversarial Networks [24.45212348373868]
本稿では,視覚的分類タスクにおけるモデル解釈可能性と性能を向上させるための新しい概念学習フレームワークを提案する。
本手法では, 教師なし説明生成器を一次分類器ネットワークに付加し, 対角訓練を利用する。
この研究は、タスク整合概念表現を用いた本質的に解釈可能なディープビジョンモデルを構築するための重要なステップを示す。
論文 参考訳(メタデータ) (2024-01-09T16:16:16Z) - CLiC: Concept Learning in Context [54.81654147248919]
本稿では,視覚概念学習の最近の進歩に基づく。
ソースイメージから視覚概念を取得し、その後ターゲットイメージ内のオブジェクトに適用する。
概念学習のローカライズには,マスク内の概念と周囲の画像領域の両方を含むソフトマスクを用いる。
論文 参考訳(メタデータ) (2023-11-28T01:33:18Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Building a visual semantics aware object hierarchy [0.0]
視覚的意味論を意識したオブジェクト階層を構築するための新しい教師なし手法を提案する。
この論文の直感は、概念が階層的に組織化されている現実世界の知識表現から来ています。
評価は2つの部分から構成され、まず、構築された階層をオブジェクト認識タスクに適用し、その上で、視覚的階層と既存の語彙階層を比較して、提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-02-26T00:10:21Z) - Visual Ground Truth Construction as Faceted Classification [4.7590051176368915]
アプローチの主な新規性は、視覚的種分化を利用した視覚特性から分類階層を構築するという事実にある。
提案手法は、音楽実験のImageNet階層に関する一連の実験によって検証される。
論文 参考訳(メタデータ) (2022-02-17T08:35:23Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Translational Concept Embedding for Generalized Compositional Zero-shot
Learning [73.60639796305415]
一般合成ゼロショット学習は、ゼロショット方式で属性オブジェクト対の合成概念を学習する手段である。
本稿では,これら2つの課題を統一的なフレームワークで解決するために,翻訳概念の埋め込み(translational concept embedded)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-20T21:27:51Z) - Classifying concepts via visual properties [5.1652563977194434]
本稿では,物質概念のレキシコ・セマンティック階層を構築するための一般的な手法を紹介する。
重要なノベルティは、階層構造が物質概念の視覚的性質を利用するように構築されていることである。
アプローチの有効性は、進行中のプロジェクトのハイライトを提供することによって実証されます。
論文 参考訳(メタデータ) (2021-05-19T22:24:30Z) - Interpretable Visual Reasoning via Induced Symbolic Space [75.95241948390472]
視覚的推論における概念誘導の問題,すなわち,画像に関連付けられた質問応答対から概念とその階層的関係を同定する。
我々はまず,オブジェクトレベルの視覚的特徴を持つ視覚的推論タスクを実行するために,オブジェクト指向合成注意モデル(OCCAM)という新しいフレームワークを設計する。
そこで我々は,対象の視覚的特徴と質問語の間の注意パターンから手がかりを用いて,対象と関係の概念を誘導する手法を考案した。
論文 参考訳(メタデータ) (2020-11-23T18:21:49Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。