Fugu-MT 論文翻訳(概要): 2D Neural Fields with Learned Discontinuities

論文の概要: 2D Neural Fields with Learned Discontinuities

arxiv url: http://arxiv.org/abs/2408.00771v1
Date: Mon, 15 Jul 2024 21:55:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-19 05:28:21.276815
Title: 2D Neural Fields with Learned Discontinuities
Title（参考訳）: 学習した不連続性を持つ2次元ニューラルネットワーク
Authors: Chenxi Liu, Siqi Wang, Matthew Fisher, Deepali Aneja, Alec Jacobson,
Abstract要約: 本稿では,対象画像と協調的に近似し,不連続性を回復する新たな不連続性ニューラルネットワークモデルを提案する。また,本モデルでは,ムンフォード-シャフ法を上回り,不連続性を正確に把握し,チャンファーを真相に近づけた。
参考スコア（独自算出の注目度）: 39.49492874634648
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Effective representation of 2D images is fundamental in digital image processing, where traditional methods like raster and vector graphics struggle with sharpness and textural complexity respectively. Current neural fields offer high-fidelity and resolution independence but require predefined meshes with known discontinuities, restricting their utility. We observe that by treating all mesh edges as potential discontinuities, we can represent the magnitude of discontinuities with continuous variables and optimize. Based on this observation, we introduce a novel discontinuous neural field model that jointly approximate the target image and recovers discontinuities. Through systematic evaluations, our neural field demonstrates superior performance in denoising and super-resolution tasks compared to InstantNGP, achieving improvements of over 5dB and 10dB, respectively. Our model also outperforms Mumford-Shah-based methods in accurately capturing discontinuities, with Chamfer distances 3.5x closer to the ground truth. Additionally, our approach shows remarkable capability in handling complex artistic drawings and natural images.
Abstract（参考訳）: 2次元画像の効果的な表現は、ラスタやベクトルグラフィックスといった従来の手法がそれぞれシャープさとテクスチャの複雑さに苦しむデジタル画像処理において基本となる。現在のニューラルネットワークは、高忠実度と解像度の独立性を提供するが、既知の不連続性を持つ事前定義されたメッシュを必要とし、その実用性を制限する。すべてのメッシュエッジを潜在的な不連続性として扱うことで、連続変数による不連続性の規模を表現し、最適化することができる。そこで,本研究では,対象画像と協調的に近似し,不連続性を回復する新たな不連続性ニューラルネットワークモデルを提案する。 InstantNGPと比較して,本研究の脳野は,5dB以上と10dB以上の改善を実現した。我々のモデルはムンフォード・シャー法を上回り、不連続性を正確に把握し、チャンファー距離は地上の真理に3.5倍近い。さらに,本手法は複雑な芸術的図面や自然画像を扱う際,顕著な能力を示す。

関連論文リスト

BokehDiff: Neural Lens Blur with One-Step Diffusion [53.11429878683807]
ボケフディフ(BokehDiff)は、物理的に正確で視覚的に魅力的な結果が得られるレンズボウ描画法である。提案手法では, 画像形成プロセスと整合する自己認識モジュールを物理に着想を得た。付加雑音を導入することなく1ステップの推論方式に拡散モデルを適応させ,高品質で忠実な結果を得る。
論文参考訳（メタデータ） (2025-07-24T03:23:19Z)
LatentINDIGO: An INN-Guided Latent Diffusion Algorithm for Image Restoration [19.74964267336191]
本研究では,ウェーブレットにインスパイアされたインバータブルニューラルネットワーク(INN)を導入し,フォワード変換により劣化をシミュレートし,逆変換により失われた詳細を再構成する。提案アルゴリズムは, 合成および実世界の低画質画像に対して, 最先端の性能を達成し, 任意の出力サイズに容易に適応できる。
論文参考訳（メタデータ） (2025-05-19T10:17:16Z)
Uncertainty-Aware Diffusion Guided Refinement of 3D Scenes [34.19578921335553]
1枚の画像から3Dシーンを再構築することは、問題の本質が過小評価されているため、基本的に不適切な作業である。本研究では,既存の画像から3D画像へのフィードフォワードネットワークにおいて,これらの制約に対処する。入力画像の視界を超えた情報不足による性能低下を軽減するため、事前学習された潜伏映像拡散モデルを用いて、強い生成前を活用できる。
論文参考訳（メタデータ） (2025-03-19T23:14:27Z)
LensDFF: Language-enhanced Sparse Feature Distillation for Efficient Few-Shot Dexterous Manipulation [7.5860067778283335]
数発のデモから巧妙な操作を学ぶことは、先進的なロボットシステムにとって重要な課題である。本稿では,LensDFF(Language-ENhanced Sparse Distilled Feature Field)を提案する。デモにグリッププリミティブを組み込んだ数発のデクスタラスな操作フレームワークを導入し,安定かつ高デクスタラスなグリップを生成する。
論文参考訳（メタデータ） (2025-03-05T20:46:30Z)
InpDiffusion: Image Inpainting Localization via Conditional Diffusion Models [10.213390634031049]
現在のIIL法は2つの大きな課題に直面している。拡散モデルを用いた条件付きマスク生成タスクとしてIILを扱う新しいパラダイムを提案する。我々の手法であるInpDiffusionは、画像意味条件の統合によって強化された復調過程を利用して、予測を段階的に洗練する。
論文参考訳（メタデータ） (2025-01-06T07:32:12Z)
One-shot Human Motion Transfer via Occlusion-Robust Flow Prediction and Neural Texturing [21.613055849276385]
マルチスケールな特徴ワーピングとニューラルテクスチャマッピングを組み合わせて、2Dの外観と2.5D形状を復元する統合フレームワークを提案する。このモデルでは,複数モーダルを共同でトレーニングし,融合させることで,幾何的誤差に対処する頑健な神経テクスチャ特性を実現する。
論文参考訳（メタデータ） (2024-12-09T03:14:40Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
RIGI: Rectifying Image-to-3D Generation Inconsistency via Uncertainty-aware Learning [27.4552892119823]
マルチビュースナップショットの不整合は、しばしばオブジェクト境界に沿ってノイズやアーティファクトを導入し、3D再構成プロセスを損なう。 3次元ガウススプラッティング(3DGS)を3次元再構成に利用し,不確実性認識学習を再現プロセスに統合する。適応的な画素単位の損失重み付けを適用してモデルを正規化し、不確実領域における再構成強度を低減させる。
論文参考訳（メタデータ） (2024-11-28T02:19:28Z)
Gear-NeRF: Free-Viewpoint Rendering and Tracking with Motion-aware Spatio-Temporal Sampling [70.34875558830241]
本研究では,シーンをレンダリングする動的領域の階層化モデリングを可能にする意味的セマンティックギアに基づく,時間的(4D)埋め込みの学習方法を提案する。同時に、ほぼ無償で、当社のトラッキングアプローチは、既存のNeRFベースのメソッドでまだ達成されていない機能である、自由視点(free-view of interest)を可能にします。
論文参考訳（メタデータ） (2024-06-06T03:37:39Z)
Robust CLIP-Based Detector for Exposing Diffusion Model-Generated Images [13.089550724738436]
拡散モデル(DM)は画像生成に革命をもたらし、様々な分野にまたがる高品質な画像を生成する。超現実的画像を作成する能力は、現実的コンテンツと合成的コンテンツを区別する上で大きな課題となる。この研究は、CLIPモデルによって抽出された画像とテキストの特徴をMLP(Multilayer Perceptron)分類器と統合する堅牢な検出フレームワークを導入する。
論文参考訳（メタデータ） (2024-04-19T14:30:41Z)
Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。 CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。 DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文参考訳（メタデータ） (2023-10-11T12:46:11Z)
Neural Point-based Volumetric Avatar: Surface-guided Neural Points for Efficient and Photorealistic Volumetric Head Avatar [62.87222308616711]
ニューラルポイント表現とニューラルボリュームレンダリングプロセスを採用したフルネーム(名前)を提案する。具体的には、ニューラルポイントは高分解能UV変位マップを介してターゲット表現の表面を戦略的に拘束する。設計上は,アバターをアニメーションする際の正確な表現制御を確保しつつ,地形的に変化する領域や細い構造を扱えるように設計されている。
論文参考訳（メタデータ） (2023-07-11T03:40:10Z)
NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D Human Pose and Shape Estimation [53.25973084799954]
両方向誤差をモデル化したNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。 NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
論文参考訳（メタデータ） (2023-05-15T12:13:24Z)
Photo-realistic Neural Domain Randomization [37.42597274391271]
ニューラルレンダリングの最近の進歩は、フォトリアリスティック・ニューラルドメインランダム化(PNDR)と呼ばれる新しい統一アプローチを可能にしていることを示す。我々のアプローチはモジュラーであり、材料、照明、レンダリングのための異なるニューラルネットワークで構成されており、異なるキー画像生成コンポーネントを異なるパイプラインでランダム化することが可能である。実験の結果,PNDRを用いたトレーニングにより,新たなシーンへの一般化が可能であり,実世界移動の面では芸術の状況を大きく上回っていることがわかった。
論文参考訳（メタデータ） (2022-10-23T09:45:27Z)
RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文参考訳（メタデータ） (2022-05-14T05:35:35Z)
AE-NeRF: Auto-Encoding Neural Radiance Fields for 3D-Aware Object Manipulation [24.65896451569795]
我々は,AE-NeRF(Auto-Aware Neural Radiance Fields)と呼ばれる3次元物体操作のための新しいフレームワークを提案する。我々のモデルは自動エンコーダアーキテクチャで定式化され、画像から3次元形状、外観、カメラポーズなどの不整形3D属性を抽出する。歪み生成ニューラルレージアンスフィールド(NeRF)による特性から高品質な画像が描画される
論文参考訳（メタデータ） (2022-04-28T11:50:18Z)
RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文参考訳（メタデータ） (2022-03-24T06:24:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。