論文の概要: Convolutional Neural Nets: Foundations, Computations, and New
Applications
- arxiv url: http://arxiv.org/abs/2101.04869v1
- Date: Wed, 13 Jan 2021 04:20:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-03 20:53:45.351730
- Title: Convolutional Neural Nets: Foundations, Computations, and New
Applications
- Title(参考訳): 畳み込みニューラルネットワークの基礎,計算,新しい応用
- Authors: Shengli Jiang and Victor M. Zavala
- Abstract要約: CNNは、グリッドデータから予測(回帰と分類)を行う機能を強調する強力な機械学習モデルです。
よくある誤解は、cnnは画像やビデオデータしか処理できないということだ。
本稿では,CNNを最適制御,フロー,モニタリング,分子シミュレーションといった新しいタイプのアプリケーションに適用する方法を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We review mathematical foundations of convolutional neural nets (CNNs) with
the goals of: i) highlighting connections with techniques from statistics,
signal processing, linear algebra, differential equations, and optimization,
ii) demystifying underlying computations, and iii) identifying new types of
applications. CNNs are powerful machine learning models that highlight features
from grid data to make predictions (regression and classification). The grid
data object can be represented as vectors (in 1D), matrices (in 2D), or tensors
(in 3D or higher dimensions) and can incorporate multiple channels (thus
providing high flexibility in the input data representation). For example, an
image can be represented as a 2D grid data object that contains red, green, and
blue (RBG) channels (each channel is a 2D matrix). Similarly, a video can be
represented as a 3D grid data object (two spatial dimensions plus time) with
RGB channels (each channel is a 3D tensor). CNNs highlight features from the
grid data by performing convolution operations with different types of
operators. The operators highlight different types of features (e.g., patterns,
gradients, geometrical features) and are learned by using optimization
techniques. In other words, CNNs seek to identify optimal operators that best
map the input data to the output data. A common misconception is that CNNs are
only capable of processing image or video data but their application scope is
much wider; specifically, datasets encountered in diverse applications can be
expressed as grid data. Here, we show how to apply CNNs to new types of
applications such as optimal control, flow cytometry, multivariate process
monitoring, and molecular simulations.
- Abstract(参考訳): 我々は,畳み込みニューラルネット(CNN)の数学的基礎を,統計学,信号処理,線形代数,微分方程式,最適化,基礎となる計算のデミスティフィケーション,および新しいタイプの応用の特定といった技術との連携を強調した。
CNNは、グリッドデータから予測(回帰と分類)を行う特徴を強調する強力な機械学習モデルである。
グリッドデータオブジェクトはベクトル(1D)、行列(2D)、テンソル(3D以上)として表現することができ、複数のチャネル(入力データ表現に高い柔軟性を提供するため)を組み込むことができる。
例えば、画像は赤、緑、青(RBG)チャネルを含む2Dグリッドデータオブジェクトとして表現することができる(各チャネルは2Dマトリックスである)。
同様に、ビデオはRGBチャンネル(各チャンネルは3Dテンソル)を持つ3Dグリッドデータオブジェクト(空間次元と時間)として表現することができる。
CNNは、異なるタイプの演算子で畳み込み操作を実行することで、グリッドデータから特徴を強調する。
演算子は異なるタイプの特徴(例えばパターン、勾配、幾何学的特徴)を強調し、最適化手法を用いて学習する。
言い換えれば、CNNは入力データを出力データに最もよくマッピングする最適な演算子を見つけ出そうとする。
よくある誤解は、cnnは画像やビデオのデータしか処理できないが、アプリケーションの範囲は広く、特に多様なアプリケーションで発生するデータセットはグリッドデータとして表現できるということである。
本稿では,CNNを最適制御,フローサイトメトリー,多変量プロセスモニタリング,分子シミュレーションといった新しいタイプのアプリケーションに適用する方法を示す。
関連論文リスト
- Topology-Agnostic Graph U-Nets for Scalar Field Prediction on Unstructured Meshes [2.4306216325375196]
TAG U-Netはグラフ畳み込みネットワークで、任意のメッシュやグラフ構造を入力できるようにトレーニングすることができる。
モデルは、各入力グラフの粗いバージョンを構築し、元のグラフ上のノードワイズ出力を予測するために、一連の畳み込みとプーリング操作を実行する。
論文 参考訳(メタデータ) (2024-10-08T22:27:35Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - CNN Filter DB: An Empirical Investigation of Trained Convolutional
Filters [2.0305676256390934]
モデル事前学習は、サイズと分散条件を満たす場合、任意のデータセットで成功することを示す。
事前学習された多くのモデルには、劣化したフィルタが含まれており、それによって、より堅牢で、ターゲットアプリケーションの微調整に適さないことが示される。
論文 参考訳(メタデータ) (2022-03-29T08:25:42Z) - SpectralNET: Exploring Spatial-Spectral WaveletCNN for Hyperspectral
Image Classification [0.0]
畳み込みニューラルネットワーク(CNN)を用いたハイパースペクトル画像(HSI)分類は,現在の文献に広く見られる。
マルチ解像度HSI分類のための2次元CNNのバリエーションであるウェーブレットCNNであるSpectralNETを提案する。
論文 参考訳(メタデータ) (2021-04-01T08:45:15Z) - Spherical Transformer: Adapting Spherical Signal to CNNs [53.18482213611481]
Spherical Transformerは、球状信号を標準CNNで直接処理できるベクトルに変換できます。
我々は,球面MNIST認識,3次元オブジェクト分類,全方向画像セマンティックセグメンテーションの課題に対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-01-11T12:33:16Z) - 2D or not 2D? Adaptive 3D Convolution Selection for Efficient Video
Recognition [84.697097472401]
Ada3Dは、インスタンス固有の3D利用ポリシーを学び、3Dネットワークで使用するフレームと畳み込み層を決定する条件付き計算フレームワークです。
本手法は,最先端の3dモデルと同様の精度を実現し,異なるデータセット間での計算量を20%-50%削減できることを実証する。
論文 参考訳(メタデータ) (2020-12-29T21:40:38Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - Deep Polynomial Neural Networks [77.70761658507507]
$Pi$Netsは拡張に基づいた関数近似の新しいクラスである。
$Pi$Netsは、画像生成、顔検証、および3Dメッシュ表現学習という3つの困難なタスクで、最先端の結果を生成する。
論文 参考訳(メタデータ) (2020-06-20T16:23:32Z) - Emotion Recognition on large video dataset based on Convolutional
Feature Extractor and Recurrent Neural Network [0.2855485723554975]
我々のモデルは、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)を組み合わせて、ビデオデータ上での次元的感情を予測する。
実験は、最新のAff-Wild2データベースを含む、公開データセットで実施されている。
論文 参考訳(メタデータ) (2020-06-19T14:54:13Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - CNNTOP: a CNN-based Trajectory Owner Prediction Method [1.3793594968500604]
軌道所有者予測は、パーソナライズされたレコメンデーションや都市計画など、多くの応用の基盤となっている。
既存の手法は主にRNNを用いて軌道を意味的にモデル化する。
CNNに基づくトラジェクトリオーナ予測(CNNTOP)手法を提案する。
論文 参考訳(メタデータ) (2020-01-05T07:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。