論文の概要: From data to functa: Your data point is a function and you should treat
it like one
- arxiv url: http://arxiv.org/abs/2201.12204v1
- Date: Fri, 28 Jan 2022 15:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-31 15:36:39.814305
- Title: From data to functa: Your data point is a function and you should treat
it like one
- Title(参考訳): データからfuncta: データポイントは関数であり、それを関数として扱うべきです
- Authors: Emilien Dupont, Hyunjik Kim, S. M. Ali Eslami, Danilo Rezende, Dan
Rosenbaum
- Abstract要約: 菌類データの深層学習のためのフレームワークを提案する。
この見解は、データからfunctaへの効率的な変換に関して、多くの課題を提示している。
これらの課題を克服し、幅広いデータモダリティに適用するためのレシピを概説する。
- 参考スコア(独自算出の注目度): 18.55139634143589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is common practice in deep learning to represent a measurement of the
world on a discrete grid, e.g. a 2D grid of pixels. However, the underlying
signal represented by these measurements is often continuous, e.g. the scene
depicted in an image. A powerful continuous alternative is then to represent
these measurements using an implicit neural representation, a neural function
trained to output the appropriate measurement value for any input spatial
location. In this paper, we take this idea to its next level: what would it
take to perform deep learning on these functions instead, treating them as
data? In this context we refer to the data as functa, and propose a framework
for deep learning on functa. This view presents a number of challenges around
efficient conversion from data to functa, compact representation of functa, and
effectively solving downstream tasks on functa. We outline a recipe to overcome
these challenges and apply it to a wide range of data modalities including
images, 3D shapes, neural radiance fields (NeRF) and data on manifolds. We
demonstrate that this approach has various compelling properties across data
modalities, in particular on the canonical tasks of generative modeling, data
imputation, novel view synthesis and classification.
- Abstract(参考訳): ディープラーニングでは、例えばピクセルの2dグリッドのように、離散格子上の世界の測定を表すのが一般的である。
しかし、これらの測定で表される基盤となる信号はしばしば連続的であり、例えば画像に表されるシーンなどである。
次に、強力な連続的な代替手段として、暗黙の神経表現(入力空間位置の適切な測定値を出力するように訓練された神経関数)を用いてこれらの測定を表現することが挙げられる。
この論文では、このアイデアを次のレベルに上げている。これらの関数をデータとして扱う代わりに、ディープラーニングを実行するのに何が必要か?
この文脈では、データを functa と呼び、 functa の深層学習のためのフレームワークを提案する。
この見解は、データからfunctaへの効率的な変換、functaのコンパクト表現、functaのダウンストリームタスクの効果的解決に関する多くの課題を示している。
本稿では,これらの課題を克服するためのレシピを概説し,画像,3次元形状,ニューラル放射場(NeRF),多様体上のデータなど,幅広いデータモダリティに適用する。
提案手法は,データモダリティ,特に生成モデル,データ計算,新しいビュー合成,分類の標準的タスクにおいて,様々な魅力的な特性を有することを示す。
関連論文リスト
- A Resolution Independent Neural Operator [0.0]
我々は、DeepONetを非依存にするためのフレームワークを提供するRINOを紹介します。
RINOにより、DeepONetは任意に、しかし十分に微妙に識別された入力関数を処理できる。
任意の(しかし十分にリッチな)サンプル入力および出力関数の処理におけるRINOの堅牢性と適用性を示す。
論文 参考訳(メタデータ) (2024-07-17T21:03:21Z) - Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文 参考訳(メタデータ) (2024-06-25T10:20:44Z) - IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.4538089115248]
シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文 参考訳(メタデータ) (2024-03-30T07:17:37Z) - Functional data learning using convolutional neural networks [0.0]
本稿では、回帰学習や分類学習において、畳み込みニューラルネットワークがどのように使用できるかを示す。
我々は、畳み込みニューラルネットワークの特定のが典型的なアーキテクチャを使って、すべての回帰演習を行います。
この手法は単純ではあるが精度が高く、将来は工学や医学への応用が期待できる。
論文 参考訳(メタデータ) (2023-10-05T04:46:52Z) - Learning Representations on the Unit Sphere: Investigating Angular
Gaussian and von Mises-Fisher Distributions for Online Continual Learning [7.145581090959242]
本稿では,新たな損失関数を備えたメモリベース表現学習手法を提案する。
提案手法は,タスク境界がぼやけた標準的な評価シナリオと現実的なシナリオの両方において,現状の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-06T02:38:01Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Learning sparse features can lead to overfitting in neural networks [9.2104922520782]
機能学習は遅延トレーニングよりもパフォーマンスが良くないことを示す。
空間性は異方性データの学習に不可欠であることが知られているが、対象関数が一定あるいは滑らかな場合に有害である。
論文 参考訳(メタデータ) (2022-06-24T14:26:33Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - UNIPoint: Universally Approximating Point Processes Intensities [125.08205865536577]
学習可能な関数のクラスが任意の有効な強度関数を普遍的に近似できることを示す。
ニューラルポイントプロセスモデルであるUNIPointを実装し,各イベントの基底関数の和をパラメータ化するために,リカレントニューラルネットワークを用いた。
論文 参考訳(メタデータ) (2020-07-28T09:31:56Z) - 3D Point Cloud Feature Explanations Using Gradient-Based Methods [11.355723874379317]
我々は、3Dデータを扱うために画像データに作用することが示されているサリエンシ手法を拡張した。
3Dデータは本質的に疎いという洞察に基づいて、ボクセルベースの分類ネットワークによって学習された特徴を可視化する。
以上の結果から,Voxception-ResNetモデルではパラメータの5%まで精度を損なうことが可能であることが示唆された。
論文 参考訳(メタデータ) (2020-06-09T23:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。