Fugu-MT 論文翻訳(概要): Multi-view Image-based Hand Geometry Refinement using Differentiable Monte Carlo Ray Tracing

論文の概要: Multi-view Image-based Hand Geometry Refinement using Differentiable Monte Carlo Ray Tracing

arxiv url: http://arxiv.org/abs/2107.05509v1
Date: Mon, 12 Jul 2021 15:35:20 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-13 18:08:09.919917
Title: Multi-view Image-based Hand Geometry Refinement using Differentiable Monte Carlo Ray Tracing
Title（参考訳）: 微分可能なモンテカルロ線トレーシングを用いた多視点画像を用いた手形状再構成
Authors: Giorgos Karvounas, Nikolaos Kyriazis, Iason Oikonomidis, Aggeliki Tsoli, Antonis A. Argyros
Abstract要約: 我々は、不完全な地上真実のアノテーションを改善するために、公開されているマルチカメラのハンドデータセット(InterHand2.6M)を使用している。画像ベースの精細化はレイトレーシングによって達成されるが、これは関連する問題にはまだ使われていない方法である。信頼できる地上事実の欠如に対処するために、我々は現実的な合成データを利用する。
参考スコア（独自算出の注目度）: 10.30411841978176
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The amount and quality of datasets and tools available in the research field of hand pose and shape estimation act as evidence to the significant progress that has been made. We find that there is still room for improvement in both fronts, and even beyond. Even the datasets of the highest quality, reported to date, have shortcomings in annotation. There are tools in the literature that can assist in that direction and yet they have not been considered, so far. To demonstrate how these gaps can be bridged, we employ such a publicly available, multi-camera dataset of hands (InterHand2.6M), and perform effective image-based refinement to improve on the imperfect ground truth annotations, yielding a better dataset. The image-based refinement is achieved through raytracing, a method that has not been employed so far to relevant problems and is hereby shown to be superior to the approximative alternatives that have been employed in the past. To tackle the lack of reliable ground truth, we resort to realistic synthetic data, to show that the improvement we induce is indeed significant, qualitatively, and quantitatively, too.
Abstract（参考訳）: ハンドポーズと形状推定の研究分野で利用可能なデータセットとツールの量と品質は、これまでに行われた重要な進歩の証拠となる。両方の面で、さらにはその先でも改善の余地があることが分かっています。これまで報告された最高の品質のデータセットでさえ、アノテーションに欠点がある。文献にはその方向性を支援するツールがあるが、今のところ検討されていない。これらのギャップをいかに橋渡しできるかを実証するため、我々は、公開可能な手のマルチカメラデータセット(interhand2.6m)を採用し、不完全な基底真理アノテーションを改善するために効果的なイメージベースの改良を行い、より良いデータセットを得る。画像に基づく精細化は,これまで問題に対して用いられていなかったレイトラック法によって達成されており,過去に採用されてきた近似的な代替法よりも優れていることが示されている。信頼性のある地上の真実の欠如に対処するため、我々は現実的な合成データを活用し、我々が誘導する改善が確かに有意義で質的かつ定量的であることを示す。

関連論文リスト

Leveraging Contrastive Learning for a Similarity-Guided Tampered Document Data Generation Pipeline [6.066442015301665]
高品質な文書画像を生成するための新しい手法を提案する。まず、テキスト作物の比較のための補助的ネットワークをトレーニングし、対照的な学習と、正のペアと対応する負のペアを定義するための新しい戦略を活用する。慎重に設計した生成パイプラインを用いて、多種多様な高品質な文書画像を生成することができるフレームワークを導入する。
論文参考訳（メタデータ） (2026-02-19T12:39:38Z)
Benchmarking pig detection and tracking under diverse and challenging conditions [1.865175170209582]
オブジェクト検出のためのPigDetectと、マルチオブジェクト追跡のためのPigTrackの2つのデータセットをキュレートした。対象物検出では,ランダムなサンプル画像のみを用いて達成可能なものよりも,困難なトレーニング画像により検出が向上することを示す。マルチオブジェクト追跡において,SORTに基づく手法は,エンドツーエンドのトレーニング可能なモデルに比べて優れた検出性能が得られることを示した。
論文参考訳（メタデータ） (2025-07-22T14:36:51Z)
Leveraging 2D Masked Reconstruction for Domain Adaptation of 3D Pose Estimation [8.365430750061506]
RGBベースの3Dポーズ推定手法はディープラーニングの開発で成功している。既存のほとんどの手法は、トレーニングデータとは程遠い分布のイメージをテストするためにうまく動作しない。本稿では,3次元ポーズ推定のための教師なし領域適応フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-14T19:56:43Z)
Rethinking Score Distillation as a Bridge Between Image Distributions [97.27476302077545]
提案手法は, 劣化した画像(ソース)を自然画像分布(ターゲット)に転送することを目的としている。本手法は,複数の領域にまたがって容易に適用可能であり,特殊な手法の性能のマッチングや評価を行うことができる。テキストから2D、テキストベースのNeRF最適化、絵画を実画像に変換すること、光学錯視生成、および3Dスケッチから実画像に変換することにおいて、その実用性を実証する。
論文参考訳（メタデータ） (2024-06-13T17:59:58Z)
SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文参考訳（メタデータ） (2024-03-25T10:30:22Z)
Rethinking Transformers Pre-training for Multi-Spectral Satellite Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文参考訳（メタデータ） (2024-03-08T16:18:04Z)
RenderIH: A Large-scale Synthetic Dataset for 3D Interacting Hand Pose Estimation [19.840282327688776]
本稿では、手と正確なポーズアノテーションを相互作用する大規模な合成データセットRenderIHを提案する。データセットには、背景、視点、手のテクスチャの異なる100万枚の写真リアル画像が含まれている。より正確なポーズ推定を行うために,トランスHandというトランスフォーマーベースのポーズ推定ネットワークを導入する。
論文参考訳（メタデータ） (2023-09-17T15:30:58Z)
Modeling Entities as Semantic Points for Visual Information Extraction in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文参考訳（メタデータ） (2023-03-23T08:21:16Z)
Cross-domain Compositing with Pretrained Diffusion Models [34.98199766006208]
我々は,背景シーンから抽出した文脈情報で注入対象を注入する局所的反復的精錬方式を採用する。本手法では,アノテーションやトレーニングを必要とせず,高品質で現実的な結果が得られる。
論文参考訳（メタデータ） (2023-02-20T18:54:04Z)
Metric Based Few-Shot Graph Classification [18.785949422663233]
少ないショットの学習では、有効性を放棄することなく、不足するデータレシエーションに現代的なディープラーニングモデルを採用することができる。本研究では,最先端グラフ埋め込みを用いた単純な距離メトリック学習ベースラインにより,タスクの競合的な結果が得られることを示す。また,MixUpをベースとしたオンラインデータ拡張手法を提案する。
論文参考訳（メタデータ） (2022-06-08T06:29:46Z)
Deep Quantized Representation for Enhanced Reconstruction [33.337794852677035]
本研究では,シロイヌナズナのShoot Apical Meristem(SAM)における高品質画像再構成のためのデータ駆動型Deep Quantized Latent Representation(DQLR)手法を提案する。提案フレームワークは,zスタック内の複数の連続スライスを用いて低次元の潜伏空間を学習し,それを量子化し,次いで量子化表現を用いて再構成し,よりシャープな画像を得る。
論文参考訳（メタデータ） (2021-07-29T23:22:27Z)
Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文参考訳（メタデータ） (2021-04-20T17:16:41Z)
Accurate and Robust Feature Importance Estimation under Distribution Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-09-30T05:29:01Z)
Pose Proposal Critic: Robust Pose Refinement by Learning Reprojection Errors [17.918364675642998]
我々は、ポーズの洗練に焦点をあて、部分閉塞の場合の最先端をどう進めるかを示す。提案手法は,CNNを訓練し,観測画像と描画画像の間の再投影誤差を推定する簡易学習課題を利用する。 Occlusion LINEMODベンチマークの3つの指標のうち2つは、現在の最先端の結果よりも優れています。
論文参考訳（メタデータ） (2020-05-13T11:46:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。