Fugu-MT 論文翻訳(概要): Survey on Modeling of Human-made Articulated Objects

論文の概要: Survey on Modeling of Human-made Articulated Objects

arxiv url: http://arxiv.org/abs/2403.14937v2
Date: Fri, 18 Oct 2024 23:59:09 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:31.511344
Title: Survey on Modeling of Human-made Articulated Objects
Title（参考訳）: 人工装具のモデル化に関する調査研究
Authors: Jiayi Liu, Manolis Savva, Ali Mahdavi-Amiri,
Abstract要約: 3Dモデリングはコンピュータビジョン、グラフィックス、ロボット工学における研究課題である。本調査は, 調音物体の3次元モデリングにおける現状について概観する。
参考スコア（独自算出の注目度）: 15.296495542958496
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D modeling of articulated objects is a research problem within computer vision, graphics, and robotics. Its objective is to understand the shape and motion of the articulated components, represent the geometry and mobility of object parts, and create realistic models that reflect articulated objects in the real world. This survey provides a comprehensive overview of the current state-of-the-art in 3D modeling of articulated objects, with a specific focus on the task of articulated part perception and articulated object creation (reconstruction and generation). We systematically review and discuss the relevant literature from two perspectives: geometry modeling (i.e., structure and shape of articulated parts) and articulation modeling (i.e., dynamics and motion of parts). Through this survey, we highlight the substantial progress made in these areas, outline the ongoing challenges, and identify gaps for future research. Our survey aims to serve as a foundational reference for researchers and practitioners in computer vision and graphics, offering insights into the complexities of articulated object modeling.
Abstract（参考訳）: 3Dモデリングはコンピュータビジョン、グラフィックス、ロボット工学における研究課題である。その目的は、調音された部品の形状と動きを理解し、対象部品の形状と移動性を表現し、実世界の調音された物体を反映する現実的なモデルを作成することである。本調査は,3次元物体の3次元モデリングにおける現状を包括的に概観するものであり,特に明瞭な部分知覚と明瞭な物体生成(再構成と生成)の課題に焦点をあてている。我々は,幾何学的モデリング(調音部分の構造と形状)と調音モデル(調音部分の力学と運動)という2つの観点から,関連文献を体系的にレビューし,議論する。本調査では,これらの領域における実質的な進歩を概説し,現在進行中の課題を概説し,今後の研究のギャップを明らかにする。本調査は,コンピュータビジョンとグラフィックスの研究者や実践者に対する基礎的な参考資料として機能することを目的としており,音声オブジェクトモデリングの複雑さに関する洞察を提供する。

関連論文リスト

TeHOR: Text-Guided 3D Human and Object Reconstruction with Textures [53.21603129469796]
単一の画像から3次元の人間と物体を共同で再構成することは、ロボット工学やデジタルコンテンツ制作において重要な応用例となる、活発な研究領域である。既存のアプローチは物理的接触情報に大きく依存しており、非接触的な人間と物体の相互作用を捉えることはできない。本稿では,2つのコア設計に基づくフレームワークTeHORを紹介する。まず,人間とオブジェクトの相互作用のテキスト記述を活用し,セマンティックアライメントを強制する。第2に、3次元人間と物体の外観の手がかりをアライメントプロセスに組み込んで、全体的文脈情報をキャプチャする。
論文参考訳（メタデータ） (2026-02-23T10:22:52Z)
3D Shape Generation: A Survey [0.6445605125467574]
近年のディープラーニングの進歩は、3次元形状生成の分野に変化をもたらした。本調査では, 形状表現, 生成的モデリングアプローチ, 評価プロトコルの3つのコアコンポーネントに関する議論をまとめる。オープンな課題を特定し、制御可能で効率的で高品質な3D形状生成の進展を促す将来の研究方向を概説する。
論文参考訳（メタデータ） (2025-06-27T23:06:06Z)
SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories [124.24041272390954]
手動物体の相互作用をモデル化することは、ロボットと具体化されたAIシステムを前進させる大きな可能性を秘めている。 SIGHTは、1つの画像から現実的で物理的に妥当な3Dハンドオブジェクトインタラクショントラジェクトリを生成することに焦点を当てた,新しいタスクである。 SIGHT-Fusionは,データベースから最もよく似た3Dオブジェクトメッシュを抽出し,この課題に対処する,新しい拡散型画像文条件付き生成モデルを提案する。
論文参考訳（メタデータ） (2025-03-28T20:53:20Z)
Aether: Geometric-Aware Unified World Modeling [49.33579903601599]
Aetherは、世界モデルにおける幾何学的推論を可能にする統一されたフレームワークである。本フレームワークは,動作追従タスクと再構成タスクの両方においてゼロショットの一般化を実現する。私たちの研究がコミュニティに、物理的に理にかなった世界モデリングにおける新たなフロンティアを探求させることを期待しています。
論文参考訳（メタデータ） (2025-03-24T17:59:51Z)
Generative Physical AI in Vision: A Survey [78.07014292304373]
遺伝子人工知能(AI)は、コンピュータビジョンの分野を急速に進歩させ、機械が前例のない高度なビジュアルデータを作成し、解釈できるようにする。この変換は、現実的な画像、ビデオ、および3D/4Dコンテンツを生成するための生成モデルの基礎の上に構築されている。生成モデルが進化して物理リアリズムと動的シミュレーションを統合するにつれ、「世界シミュレータ」として機能する可能性が拡大する。
論文参考訳（メタデータ） (2025-01-19T03:19:47Z)
Collaborative Learning for 3D Hand-Object Reconstruction and Compositional Action Recognition from Egocentric RGB Videos Using Superquadrics [31.819336585007104]
境界ボックスに対する3次元オブジェクト表現の代替としてスーパークワッドリックを活用することを提案する。テンプレートレスオブジェクト再構成とアクション認識の両タスクで有効性を示す。また,動詞と名詞の訓練組み合わせがテスト分割と重複しない,より困難な課題を考慮し,行動の構成性についても検討した。
論文参考訳（メタデータ） (2025-01-13T07:26:05Z)
PhysPart: Physically Plausible Part Completion for Interactable Objects [28.91080122885566]
我々は、相互作用可能なオブジェクトに対する物理的に妥当な部分補完の問題に取り組む。幾何学的条件付けを利用した拡散型部分生成モデルを提案する。また、3Dプリンティング、ロボット操作、シーケンシャル部分生成にも応用しています。
論文参考訳（メタデータ） (2024-08-25T04:56:09Z)
Unsupervised Dynamics Prediction with Object-Centric Kinematics [22.119612406160073]
本稿では,オブジェクト中心表現を利用した動的予測フレームワークであるOcK(Object-Centric Kinematics)を提案する。 OCKは、物体の位置、速度、加速度の低レベルな構造化状態で構成されている。本モデルは,多種多様なオブジェクト属性と動的動きを特徴とする複雑なシーンにおけるオブジェクトと背景の扱いにおいて,優れた性能を示す。
論文参考訳（メタデータ） (2024-04-29T04:47:23Z)
REACTO: Reconstructing Articulated Objects from a Single Video [64.89760223391573]
関節の柔軟な変形を維持しつつ各部の剛性を向上する新しい変形モデルを提案する。提案手法は, 従来よりも高忠実度な3D再構成を実現する上で, 従来の手法よりも優れていた。
論文参考訳（メタデータ） (2024-04-17T08:01:55Z)
Scalable Scene Modeling from Perspective Imaging: Physics-based Appearance and Geometry Inference [3.2229099973277076]
論文は3Dシーンモデリングをその最先端に進める貢献のごく一部を提示する。一般的なディープラーニング手法とは対照的に、この論文は第一原理に従うアルゴリズムの開発を目的としている。
論文参考訳（メタデータ） (2024-04-01T17:09:40Z)
Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文参考訳（メタデータ） (2023-07-25T17:59:18Z)
3D objects and scenes classification, recognition, segmentation, and reconstruction using 3D point cloud data: A review [5.85206759397617]
3次元(3D)点雲解析は、現実的な画像やマシンビジョンにおいて魅力的な対象の1つとなっている。最近、ディープラーニングモデルのような様々な技術を用いて、新しい戦略の開発に多大な努力が注がれている。オブジェクトやシーンの検出,認識,セグメンテーション,再構築など,3Dポイントで行うさまざまなタスクについて検討した。
論文参考訳（メタデータ） (2023-06-09T15:45:23Z)
Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。 CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。 HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文参考訳（メタデータ） (2022-12-20T19:50:54Z)
MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文参考訳（メタデータ） (2022-12-13T19:30:03Z)
State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文参考訳（メタデータ） (2022-10-27T17:59:53Z)
Finding Fallen Objects Via Asynchronous Audio-Visual Integration [89.75296559813437]
本稿では,3次元仮想環境におけるマルチモーダルオブジェクトのローカライゼーションについて検討する。カメラとマイクを装備したロボットエージェントは、音声と視覚信号を基礎となる物理学の知識と組み合わせることで、どの物体が落下したか(そしてどこにあるか)を判断しなければならない。このデータセットは、物理ベースの衝撃音と、フォトリアリスティックな設定でオブジェクト間の複雑な物理的相互作用をシミュレートする3DWorldプラットフォームを使用している。
論文参考訳（メタデータ） (2022-07-07T17:59:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。