論文の概要: LidarNAS: Unifying and Searching Neural Architectures for 3D Point
Clouds
- arxiv url: http://arxiv.org/abs/2210.05018v1
- Date: Mon, 10 Oct 2022 21:21:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 16:04:23.059122
- Title: LidarNAS: Unifying and Searching Neural Architectures for 3D Point
Clouds
- Title(参考訳): LidarNAS: 3Dポイントクラウドのためのニューラルネットワークの統合と検索
- Authors: Chenxi Liu, Zhaoqi Leng, Pei Sun, Shuyang Cheng, Charles R. Qi, Yin
Zhou, Mingxing Tan, Dragomir Anguelov
- Abstract要約: 本稿では,3次元点雲内の物体を理解するニューラルモデルを構築するための統一的なフレームワークを提案する。
このフレームワークが,具体的なニューラルアーキテクチャ探索(NAS)空間に容易に実現可能であることを示す。
また、NASが車と歩行者の両方で同じマクロレベルのアーキテクチャの概念を発見する傾向があるという興味深い発見を報告した。
- 参考スコア(独自算出の注目度): 45.90990954551895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing neural models that accurately understand objects in 3D point
clouds is essential for the success of robotics and autonomous driving.
However, arguably due to the higher-dimensional nature of the data (as compared
to images), existing neural architectures exhibit a large variety in their
designs, including but not limited to the views considered, the format of the
neural features, and the neural operations used. Lack of a unified framework
and interpretation makes it hard to put these designs in perspective, as well
as systematically explore new ones. In this paper, we begin by proposing a
unified framework of such, with the key idea being factorizing the neural
networks into a series of view transforms and neural layers. We demonstrate
that this modular framework can reproduce a variety of existing works while
allowing a fair comparison of backbone designs. Then, we show how this
framework can easily materialize into a concrete neural architecture search
(NAS) space, allowing a principled NAS-for-3D exploration. In performing
evolutionary NAS on the 3D object detection task on the Waymo Open Dataset, not
only do we outperform the state-of-the-art models, but also report the
interesting finding that NAS tends to discover the same macro-level
architecture concept for both the vehicle and pedestrian classes.
- Abstract(参考訳): 3dポイントクラウドでオブジェクトを正確に理解するニューラルモデルの開発は、ロボティクスと自動運転の成功に不可欠である。
しかし、おそらくはデータの高次元性(画像と比較して)のため、既存のニューラルアーキテクチャは、考慮されたビュー、ニューラルネットワークの特徴の形式、使用されるニューラル操作など、その設計に大きな多様性を示す。
統一されたフレームワークと解釈の欠如は、これらの設計を視点に置いて、体系的に新しい設計を探求することを難しくする。
本稿では,ニューラルネットワークを一連のビュー変換とニューラルネットワーク層に分解する,統一的なフレームワークの提案から始める。
このモジュラーフレームワークは、バックボーン設計を公平に比較しながら、様々な既存の作品を再現できることを実証する。
次に,このフレームワークが具体的なニューラルネットワーク探索(NAS)空間に容易に実現可能であることを示し,NAS-for-3D探索の原理を示す。
waymo open dataset上の3dオブジェクト検出タスクで進化nasを実行するとき、我々は最先端のモデルを上回るだけでなく、nasが車両と歩行者の両方のクラスで同じマクロレベルのアーキテクチャ概念を発見する傾向があるという興味深い発見を報告します。
関連論文リスト
- DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features [65.8738034806085]
DistillNeRFは、自動運転シーンにおける3D環境を理解するための自己教師型学習フレームワークである。
本手法は,スパースで単一フレームのマルチビューカメラ入力からリッチなニューラルシーン表現を予測する一般化可能なフィードフォワードモデルである。
論文 参考訳(メタデータ) (2024-06-17T21:15:13Z) - DNA Family: Boosting Weight-Sharing NAS with Block-Wise Supervisions [121.05720140641189]
蒸留型ニューラルアーキテクチャ(DNA)技術を用いたモデル群を開発した。
提案するDNAモデルでは,アルゴリズムを用いてサブサーチ空間にのみアクセス可能な従来の手法とは対照的に,すべてのアーキテクチャ候補を評価できる。
当社のモデルでは,モバイルコンボリューションネットワークと小型ビジョントランスフォーマーにおいて,ImageNet上で78.9%,83.6%の最先端トップ1精度を実現している。
論文 参考訳(メタデータ) (2024-03-02T22:16:47Z) - NASiam: Efficient Representation Learning using Neural Architecture
Search for Siamese Networks [76.8112416450677]
シームズネットワークは、自己教師付き視覚表現学習(SSL)を実現するための最も傾向のある方法の1つである。
NASiamは、初めて微分可能なNASを使用して、多層パーセプトロンプロジェクタと予測器(エンコーダ/予測器ペア)を改善する新しいアプローチである。
NASiamは、小規模(CIFAR-10/CIFAR-100)と大規模(画像Net)画像分類データセットの両方で競合性能を達成し、わずか数GPU時間しかかからない。
論文 参考訳(メタデータ) (2023-01-31T19:48:37Z) - Noisy Heuristics NAS: A Network Morphism based Neural Architecture
Search using Heuristics [11.726528038065764]
本稿では,Nuisy Heuristics NASというネットワークモルフィズムに基づくNASを提案する。
新しいニューロンをランダムに追加し、最も適したニューロンのみを選択するために、いくつかのニューロンをプルーニングします。
本手法は,おもちゃのデータセットとMNIST, CIFAR-10, CIFAR-100などの実世界のデータセットの両方を一般化する。
論文 参考訳(メタデータ) (2022-07-10T13:58:21Z) - Neural Architecture Search for Dense Prediction Tasks in Computer Vision [74.9839082859151]
ディープラーニングは、ニューラルネットワークアーキテクチャエンジニアリングに対する需要の高まりにつながっている。
ニューラルネットワーク検索(NAS)は、手動ではなく、データ駆動方式でニューラルネットワークアーキテクチャを自動設計することを目的としている。
NASはコンピュータビジョンの幅広い問題に適用されている。
論文 参考訳(メタデータ) (2022-02-15T08:06:50Z) - 3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。
学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文 参考訳(メタデータ) (2021-07-08T17:49:37Z) - Evolutionary Architecture Search for Graph Neural Networks [23.691915813153496]
本稿では,大規模グラフニューラルネットワーク(GNN)アーキテクチャ空間における個々のモデルの進化を通じて,新しいAutoMLフレームワークを提案する。
我々の知る限りでは、GNNモデルの進化的アーキテクチャ探索を導入し、評価する最初の試みである。
論文 参考訳(メタデータ) (2020-09-21T22:11:53Z) - NAS-Bench-NLP: Neural Architecture Search Benchmark for Natural Language
Processing [12.02718579660613]
我々は自然言語処理(NLP)の中核である言語モデリングタスクを活用することで、コンピュータビジョン領域の外部へ踏み出す。
テキストデータセット上にリカレントニューラルネットワークの検索スペースを提供し、その内部に14kのアーキテクチャをトレーニングしました。
我々は,意味的関連性および言語理解評価のためのデータセットを用いて,訓練されたモデルの内在的および外在的評価を行った。
論文 参考訳(メタデータ) (2020-06-12T12:19:06Z) - Modeling Neural Architecture Search Methods for Deep Networks [9.561123408923489]
本稿では,ニューラルアーキテクチャ探索法(NAS)の一般化モデルを提案する。
重要な関心領域を分類し識別するための異なる設計アプローチを比較することが可能である。
論文 参考訳(メタデータ) (2019-12-31T05:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。