論文の概要: Relative coordinates are crucial for Ulam's "trick to the train of
thought"
- arxiv url: http://arxiv.org/abs/2303.08969v1
- Date: Wed, 15 Mar 2023 22:39:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 17:40:45.536937
- Title: Relative coordinates are crucial for Ulam's "trick to the train of
thought"
- Title(参考訳): 相対座標は ulam の "trick to the train of thought" にとって重要である。
- Authors: Weibo Gong, Chirag S. Trasikar and Bradley Zylstra
- Abstract要約: 空間信号処理アルゴリズムは、しばしば画素位置のラベル付けに事前の座標系を使用する。
視覚信号処理のための座標系に依存しないアルゴリズムは、動物の視覚だけでなく、概念形成にも重要であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial signal processing algorithms often use pre-given coordinate systems
to label pixel positions. These processing algorithms are thus burdened by an
external reference grid, making the acquisition of relative, intrinsic features
difficult. This is in contrast to animal vision and cognition: animals
recognize features without an external coordinate system. We show that a
coordinate system-independent algorithm for visual signal processing is not
only important for animal vision, but also fundamental for concept formation.
In this paper we start with a visual object deformation transfer experiment. We
then formulate an algorithm that achieves deformation-invariance with relative
coordinates. The paper concludes with implications for general concept
formation.
- Abstract(参考訳): 空間信号処理アルゴリズムは、しばしば画素位置のラベル付けに事前の座標系を用いる。
これらの処理アルゴリズムは外部参照グリッドによって負担され、相対的固有の特徴の取得が困難になる。
これは動物の視覚や認知とは対照的で、動物は外部の座標系なしで特徴を認識する。
視覚信号処理のための座標系に依存しないアルゴリズムは、動物の視覚だけでなく、概念形成にも重要であることを示す。
本稿では,視覚物体の変形伝達実験から始める。
次に,相対座標との変形不変性を実現するアルゴリズムを定式化する。
論文は、一般的な概念形成への含意で締めくくる。
関連論文リスト
- Regressing Transformers for Data-efficient Visual Place Recognition [10.156432076272475]
この研究は、レグレッション問題としての場所認識をフレーミングすることで、新しい視点を導入する。
画像ディスクリプタをグレード付き類似ラベルと直接整合するように最適化することにより、高価な再ランク付けなしでランキング機能を向上させる。
論文 参考訳(メタデータ) (2024-01-29T17:04:32Z) - Parsing is All You Need for Accurate Gait Recognition in the Wild [51.206166843375364]
本稿では,GPS(Gait Parsing Sequence)という新しい歩行表現を提案する。
GPSは、ビデオフレームから抽出された微細な人間のセグメンテーションのシーケンスなので、より高い情報エントロピーを持つ。
また,ParsingGaitという,新しいパーシングに基づく歩行認識フレームワークを提案する。
実験結果から,GPS表現による精度の向上とParsingGaitの優越性が示唆された。
論文 参考訳(メタデータ) (2023-08-31T13:57:38Z) - Coordinate Quantized Neural Implicit Representations for Multi-view
Reconstruction [28.910183274743872]
量子化座標を用いたニューラル暗黙表現を導入し、最適化時のフィールドの不確かさとあいまいさを低減する。
我々は離散座標とその位置符号化を用いてボリュームレンダリングを通して暗黙の関数を学習する。
広く使用されているベンチマークによる評価は、最先端技術よりも優位性を示している。
論文 参考訳(メタデータ) (2023-08-21T20:27:33Z) - Automated mapping of virtual environments with visual predictive coding [0.9591674293850556]
本稿では,エージェントが視覚的予測コーディングをしながら仮想環境をナビゲートするフレームワークを提案する。
次の画像予測タスクを学習しながら、エージェントは、距離を定量的に反映する環境の内部表現を自動的に構築する。
内部マップにより、エージェントは視覚情報のみを使用してランドマークに対して位置を特定できる。
論文 参考訳(メタデータ) (2023-08-20T22:29:16Z) - Solving Visual Analogies Using Neural Algorithmic Reasoning [22.384921045720752]
我々は,記号空間から導出される分散表現を操作する基本的ニューラルネットワーク変換の系列を探索する。
形状や位置が不明瞭な画像に対して,我々の神経推論アプローチが一般化する範囲を評価する。
論文 参考訳(メタデータ) (2021-11-19T18:48:16Z) - Learning 3D Dense Correspondence via Canonical Point Autoencoder [108.20735652143787]
同一カテゴリの3次元形状間の密接な対応を予測できる標準点オートエンコーダ(CPAE)を提案する。
オートエンコーダは、2つの重要な機能を実行する: (a) 任意に順序付けられた点雲を標準プリミティブに符号化し、 (b) プリミティブを元の入力インスタンス形状に復号する。
論文 参考訳(メタデータ) (2021-07-10T15:54:48Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Learning Graph Embeddings for Compositional Zero-shot Learning [73.80007492964951]
合成ゼロショット学習では、観察された視覚的原始状態の見えない構成を認識することが目的である。
本稿では,画像特徴と視覚的プリミティブの潜在表現をエンドツーエンドに学習するCGEという新しいグラフ定式化を提案する。
概念間のセマンティクスを符号化する共同互換性を学習することにより、WordNetのような外部知識ベースに頼ることなく、構成を見えないように一般化することができる。
論文 参考訳(メタデータ) (2021-02-03T10:11:03Z) - Binding and Perspective Taking as Inference in a Generative Neural
Network Model [1.0323063834827415]
生成エンコーダ・デコーダアーキテクチャはその観点に適応し、振り返り推論によって特徴を結合する。
得られた勾配に基づく推論プロセスは、既知の生体運動パターンに対する視点の取扱いと結合の問題を解く。
論文 参考訳(メタデータ) (2020-12-09T16:43:26Z) - Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-05-25T17:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。