論文の概要: Enhancing Local Feature Learning for 3D Point Cloud Processing using
Unary-Pairwise Attention
- arxiv url: http://arxiv.org/abs/2203.00172v1
- Date: Tue, 1 Mar 2022 01:43:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 14:18:03.815403
- Title: Enhancing Local Feature Learning for 3D Point Cloud Processing using
Unary-Pairwise Attention
- Title(参考訳): Unary-Pairwise Attention を用いた3Dポイントクラウド処理のための局所特徴学習の強化
- Authors: Haoyi Xiu, Xin Liu, Weiming Wang, Kyoung-Sook Kim, Takayuki Shinohara,
Qiong Chang, Masashi Matsuoka
- Abstract要約: 我々は,3次元点雲間の関係をモデル化するために,UPA (unary-pairwise attention) というシンプルだが効果的な注意を提示する。
我々の考えは、グローバルに運用されている標準的な自己注意(SA)が、異なるクエリ位置に対してほぼ同じ注意マップを生成する傾向にある、という分析に動機づけられている。
SAとは対照的に、UPAはローカル操作によるクエリ依存を保証する。
- 参考スコア(独自算出の注目度): 11.335128858656958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a simple but effective attention named the unary-pairwise
attention (UPA) for modeling the relationship between 3D point clouds. Our idea
is motivated by the analysis that the standard self-attention (SA) that
operates globally tends to produce almost the same attention maps for different
query positions, revealing difficulties for learning query-independent and
query-dependent information jointly. Therefore, we reformulate the SA and
propose query-independent (Unary) and query-dependent (Pairwise) components to
facilitate the learning of both terms. In contrast to the SA, the UPA ensures
query dependence via operating locally. Extensive experiments show that the UPA
outperforms the SA consistently on various point cloud understanding tasks
including shape classification, part segmentation, and scene segmentation.
Moreover, simply equipping the popular PointNet++ method with the UPA even
outperforms or is on par with the state-of-the-art attention-based approaches.
In addition, the UPA systematically boosts the performance of both standard and
modern networks when it is integrated into them as a compositional module.
- Abstract(参考訳): 我々は,3次元点雲間の関係をモデル化するために,UPA (unary-pairwise attention) という単純な注意を提示する。
提案手法は,グローバルに運用される標準セルフアテンション(sa)が,異なるクエリ位置に対してほぼ同じアテンションマップを生成する傾向にあり,クエリ非依存情報とクエリ依存情報を同時に学習することが困難であることを示す。
そこで我々は,SAを再編成し,問合せに依存しない(ユニタリ)コンポーネントと問合せに依存しない(ペアワイズ)コンポーネントを提案する。
SAとは対照的に、UPAはローカル操作によるクエリ依存を保証する。
大規模な実験により、UPAは、形状分類、部分分割、シーンセグメンテーションを含む様々な点雲理解タスクにおいて、SAを一貫して上回ります。
さらに、人気のある PointNet++ メソッドを UPA に組み込むことは、最先端の注目ベースのアプローチよりも優れているか、あるいは同等である。
さらに、UPAは、合成モジュールとして統合された場合、標準ネットワークと近代ネットワークの両方の性能を体系的に向上させる。
関連論文リスト
- Improving Open Information Extraction with Large Language Models: A
Study on Demonstration Uncertainty [52.72790059506241]
オープン情報抽出(OIE)タスクは、構造化されていないテキストから構造化された事実を抽出することを目的としている。
一般的なタスク解決手段としてChatGPTのような大きな言語モデル(LLM)の可能性にもかかわらず、OIEタスクの最先端(教師付き)メソッドは遅れている。
論文 参考訳(メタデータ) (2023-09-07T01:35:24Z) - Improving Video Violence Recognition with Human Interaction Learning on
3D Skeleton Point Clouds [88.87985219999764]
我々は骨格点の新たな視点からビデオ暴力認識法を開発した。
まず、ビデオから抽出した人間の配列から3Dスケルトン点雲を定式化する。
そして、これらの3Dスケルトン点雲上で相互作用学習を行う。
論文 参考訳(メタデータ) (2023-08-26T12:55:18Z) - CARE: Co-Attention Network for Joint Entity and Relation Extraction [0.0]
本稿では,共同エンティティと関係抽出のためのコ・アテンション・ネットワークを提案する。
提案手法では,サブタスク毎に異なる表現を学習するための並列符号化方式を採用する。
このアプローチのコアとなるのは,2つのサブタスク間の双方向のインタラクションをキャプチャするコアテンションモジュールです。
論文 参考訳(メタデータ) (2023-08-24T03:40:54Z) - SARF: Aliasing Relation Assisted Self-Supervised Learning for Few-shot
Relation Reasoning [43.59319243928048]
知識グラフ (FS-KGR) に基づく一括関係推論は, 長期データと不適切な関係を推定することを目的としている。
本稿では, Aliasing Relations を利用して, SARF と呼ばれる FS-KGR を支援する新しい自己教師付き学習モデルを提案する。
論文 参考訳(メタデータ) (2023-04-20T13:24:59Z) - Active Self-Supervised Learning: A Few Low-Cost Relationships Are All
You Need [34.013568381942775]
Self-Supervised Learning (SSL)は、ラベルのないデータから転送可能な表現を学習する選択肢のソリューションとして登場した。
本研究では,この原理を正のアクティブラーニング(PAL)によって形式化し,一般化する。
まず、SSLを超えて理論的に基礎を成す学習フレームワークを公開し、類似性グラフに基づいて、採用するオラクルに応じて教師付きおよび半教師付き学習に取り組むように拡張する。
第二に、事前知識、例えばいくつかのラベルをトレーニングパイプラインの変更なしにSSL損失に組み込むための一貫したアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-03-27T14:44:39Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - SANCL: Multimodal Review Helpfulness Prediction with Selective Attention
and Natural Contrastive Learning [41.92038829041499]
MRHP(Multimodal Review Helpfulness Prediction)は、製品レビューを予測された有用度スコアに従ってソートすることを目的としている。
この課題のこれまでの研究は、注意に基づくモダリティ融合、情報統合、関係モデリングに重点を置いていた。
MRHPのためのSANCL: Selective Attention and Natural Contrastive Learningを提案する。
論文 参考訳(メタデータ) (2022-09-12T06:31:13Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - Learning from Extrinsic and Intrinsic Supervisions for Domain
Generalization [95.73898853032865]
ドメイン間を同時に一般化する方法を学ぶための新しいドメイン一般化フレームワークを提案する。
提案手法の有効性を2つの標準オブジェクト認識ベンチマークで示す。
論文 参考訳(メタデータ) (2020-07-18T03:12:24Z) - Multi-Granularity Reference-Aided Attentive Feature Aggregation for
Video-based Person Re-identification [98.7585431239291]
ビデオベースの人物再識別は、同じ人物をビデオクリップ間でマッチングすることを目的としている。
本稿では,マルチグラニュラリティ参照属性集約モジュールMG-RAFAを提案する。
本フレームワークは,3つのベンチマークデータセット上での最先端のアブレーション性能を実現する。
論文 参考訳(メタデータ) (2020-03-27T03:49:21Z) - Bi-Directional Attention for Joint Instance and Semantic Segmentation in
Point Clouds [9.434847591440485]
バックボーンニューラルネットワーク上にバイディレクショナル・アテンション・モジュールを構築し、3Dポイント・クラウド・インセプションを実現する。
これは、あるタスクの特徴から測定された類似度行列を使用して、他のタスクの非ローカル情報を集約する。
S3DISデータセットとPartNetデータセットに関する総合実験とアブレーション研究から,本手法の優位性を検証した。
論文 参考訳(メタデータ) (2020-03-11T17:16:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。