論文の概要: Lego Sketch: A Scalable Memory-augmented Neural Network for Sketching Data Streams
- arxiv url: http://arxiv.org/abs/2505.19561v1
- Date: Mon, 26 May 2025 06:23:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.209213
- Title: Lego Sketch: A Scalable Memory-augmented Neural Network for Sketching Data Streams
- Title(参考訳): Lego Sketch: データストリームをスケッチするためのスケーラブルなメモリ拡張ニューラルネットワーク
- Authors: Yuan Feng, Yukun Cao, Hairu Wang, Xike Xie, S Kevin Zhou,
- Abstract要約: スケーラブルなMANNアーキテクチャを導入し、レゴのスケッチを生かし、スケーラビリティと正確性に優れた斬新なスケッチを紹介します。
レゴのスケッチは、モジュール式レゴブロックで作るのと同じように、複数のメモリブロックを動的に調整して、さまざまな宇宙予算やさまざまなデータドメインに適応させる。
我々の理論的分析は高いスケーラビリティを保証し、ニューラルスケッチに最初のエラーバウンドを提供する。
- 参考スコア(独自算出の注目度): 19.447729423696096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sketches, probabilistic structures for estimating item frequencies in infinite data streams with limited space, are widely used across various domains. Recent studies have shifted the focus from handcrafted sketches to neural sketches, leveraging memory-augmented neural networks (MANNs) to enhance the streaming compression capabilities and achieve better space-accuracy trade-offs.However, existing neural sketches struggle to scale across different data domains and space budgets due to inflexible MANN configurations. In this paper, we introduce a scalable MANN architecture that brings to life the {\it Lego sketch}, a novel sketch with superior scalability and accuracy. Much like assembling creations with modular Lego bricks, the Lego sketch dynamically coordinates multiple memory bricks to adapt to various space budgets and diverse data domains. Our theoretical analysis guarantees its high scalability and provides the first error bound for neural sketch. Furthermore, extensive experimental evaluations demonstrate that the Lego sketch exhibits superior space-accuracy trade-offs, outperforming existing handcrafted and neural sketches. Our code is available at https://github.com/FFY0/LegoSketch_ICML.
- Abstract(参考訳): 無限データストリームにおけるアイテムの周波数を有限空間で推定する確率的構造であるスケッチは、様々な領域で広く使われている。
近年の研究は、手描きのスケッチからニューラルスケッチへと焦点を移し、メモリ拡張ニューラルネットワーク(MANN)を活用してストリーミング圧縮能力を強化し、宇宙精度のトレードオフを改善しているが、既存のニューラルスケッチは、柔軟性のないMANN構成のためにさまざまなデータドメインとスペース予算をスケールするのに苦労している。
本稿では,スケーラブルなMANNアーキテクチャを導入し,より優れたスケーラビリティと正確性を備えた新しいスケッチである "it Lego sketch}" を生かした。
レゴのスケッチは、モジュール式レゴブロックで作るのと同じように、複数のメモリブロックを動的に調整して、さまざまな宇宙予算やさまざまなデータドメインに適応させる。
我々の理論的分析は高いスケーラビリティを保証し、ニューラルスケッチに最初のエラーバウンドを提供する。
さらに、広範な実験的な評価により、レゴのスケッチはより優れた宇宙精度のトレードオフを示し、既存の手工芸品やニューラルスケッチよりも優れていることが示されている。
私たちのコードはhttps://github.com/FFY0/LegoSketch_ICMLで利用可能です。
関連論文リスト
- SwiftSketch: A Diffusion Model for Image-to-Vector Sketch Generation [57.47730473674261]
我々は,画像条件付きベクトルスケッチ生成モデルであるSwiftSketchを紹介した。
SwiftSketchは、ガウス分布からサンプリングされたストローク制御ポイントを段階的に復調することによって動作する。
ControlSketchは、深度認識制御ネットを通じて正確な空間制御を組み込むことで、SDSベースの技術を強化する方法である。
論文 参考訳(メタデータ) (2025-02-12T18:57:12Z) - Self Supervised Networks for Learning Latent Space Representations of Human Body Scans and Motions [6.165163123577484]
本稿では,3次元人体解析・処理の分野におけるいくつかの基本的な問題に対処するために,自己教師型ニューラルネットワークモデルを提案する。
身体形状とポーズの潜在空間表現を検索するための新しいアーキテクチャであるVariShaPEを提案する。
第二に、潜時空間の幾何学を学習するフレームワークであるMoGeNで潜時符号の推定を補完する。
論文 参考訳(メタデータ) (2024-11-05T19:59:40Z) - MegaScenes: Scene-Level View Synthesis at Scale [69.21293001231993]
NVS (Scene-level novel view synthesis) は多くの視覚やグラフィックスの応用に基礎を置いている。
MegaScenesと呼ばれるインターネット写真コレクションから大規模なシーンレベルのデータセットを作成し、世界中の動き(SfM)から100K以上の構造を復元する。
我々は、最先端NVS手法の故障事例を分析し、生成一貫性を大幅に改善する。
論文 参考訳(メタデータ) (2024-06-17T17:55:55Z) - Kick Back & Relax++: Scaling Beyond Ground-Truth Depth with SlowTV &
CribsTV [50.616892315086574]
本稿では,SlowTV と CribsTV の2つの新しいデータセットを提案する。
これらは、一般公開されているYouTubeビデオから収集された大規模なデータセットで、合計200万のトレーニングフレームが含まれている。
我々はこれらのデータセットを活用し、ゼロショット一般化の難しい課題に取り組む。
論文 参考訳(メタデータ) (2024-03-03T17:29:03Z) - DifferSketching: How Differently Do People Sketch 3D Objects? [78.44544977215918]
3Dオブジェクトの描画方法を理解するために,複数のスケッチデータセットが提案されている。
これらのデータセットは、しばしば小さなスケールで、オブジェクトやカテゴリの小さなセットをカバーする。
本研究では,空間的特徴と時間的特性の両面から,収集したデータをスケッチレベル,ストロークレベル,ピクセルレベルという3つのレベルで解析する。
論文 参考訳(メタデータ) (2022-09-19T06:52:18Z) - Abstracting Sketches through Simple Primitives [53.04827416243121]
人間は、オブジェクト情報を素早く通信する必要があるゲームにおいて、高いレベルの抽象化能力を示す。
本稿では,プリミティブをベースとしたスケッチ抽象化タスクを提案する。
我々のPrimitive-Matching Network(PMN)は、スケッチの解釈可能な抽象化を自己管理的に学習する。
論文 参考訳(メタデータ) (2022-07-27T14:32:39Z) - MOST-Net: A Memory Oriented Style Transfer Network for Face Sketch
Synthesis [41.80739104463557]
顔のスケッチ合成はマルチメディアエンターテイメントや法執行機関で広く使われている。
現在の画像から画像への変換に基づく顔のスケッチ合成は、小規模なデータセットでは過度に適合する問題に頻繁に遭遇する。
限られたデータで高忠実なスケッチを生成することができる顔スケッチ合成のためのエンドツーエンドメモリ指向スタイル転送ネットワーク(MOST-Net)を提案する。
論文 参考訳(メタデータ) (2022-02-08T01:51:24Z) - Improved Brain Age Estimation with Slice-based Set Networks [18.272915375351914]
本稿では,脳波予測のための新しいアーキテクチャを提案する。
提案アーキテクチャは, ディープ2D-CNNモデルを用いて, それぞれの2次元スライスをMRIで符号化することによって機能する。
次に、セットネットワークまたは置換不変層を用いて、これらの2Dスライス符号化の情報を組み合わせる。
英国のBiobankデータセットを用いたBrainAGE予測問題の実験では、置換不変層を持つモデルは、他の最先端のアプローチと比較して、より高速にトレーニングし、より良い予測を提供することが示された。
論文 参考訳(メタデータ) (2021-02-08T18:54:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。