論文の概要: PostureObjectstitch: Anomaly Image Generation Considering Assembly Relationships in Industrial Scenarios
- arxiv url: http://arxiv.org/abs/2604.13863v1
- Date: Wed, 15 Apr 2026 13:29:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.558294
- Title: PostureObjectstitch: Anomaly Image Generation Considering Assembly Relationships in Industrial Scenarios
- Title(参考訳): PostureObjectstitch:産業シナリオにおける集合関係を考慮した異常画像生成
- Authors: Zebei Tong, Hongchang Chen, Yujie Lei, Gang Chen, Yushi Liu, Zhi Zheng, Hao Chen, Jieming Zhang, Ying Li, Dongpu Cao,
- Abstract要約: 既存の生成技術は、組立における産業部品のポーズと方向性をほとんど考慮しない。
本稿では,産業集積の要求を満たすための正確な生成を実現するために,PostureStitchObjectと呼ばれる新しい画像合成手法を提案する。
- 参考スコア(独自算出の注目度): 20.34512791415563
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image generation technology can synthesize condition-specific images to supplement real-world industrial anomaly data and enhance anomaly detection model performance. Existing generation techniques rarely account for the pose and orientation of industrial components in assembly, making the generated images difficult to utilize for downstream application. To solve this, we propose a novel image synthesis approach, called PostureObjectStitch, that achieves accurate generation to meet the requirement of industrial assembly. A condition decoupling approach is introduced to separate input multi-view images into high-frequency, texture, and RGB features. The feature temporal modulation mechanism adapts these features across diffusion model time-steps, enabling progressive generation from coarse to fine details while maintaining consistency. To ensure semantic accuracy, we introduce a conditional loss that enhances critical industrial elements and a geometric prior that guides component positioning for correct assembly relationships. Comprehensive experimental results on the MureCom dataset, our newly contributed DreamAssembly dataset, and the downstream application validate the outstanding performance of our method.
- Abstract(参考訳): 画像生成技術は、条件固有画像を合成し、実世界の産業異常データを補完し、異常検出モデルの性能を向上させる。
既存の生成技術は、組立における産業部品の姿勢や方向性をほとんど考慮しておらず、生成した画像は下流での利用が困難である。
そこで本研究では,産業組立の要件を満たすための正確な生成を実現する,PostureObjectStitchと呼ばれる新しい画像合成手法を提案する。
入力されたマルチビュー画像を高周波・テクスチャ・RGB特徴に分離する条件デカップリング手法を提案する。
特徴時間変調機構は、これらの特徴を拡散モデル時間ステップに適応させ、一貫性を維持しながら粗い状態から細部まで進行的に生成することができる。
セマンティックな精度を確保するために、重要な産業要素を強化する条件付き損失と、正しい組立関係のためのコンポーネント位置決めを導く幾何学的先行を導入する。
MureComデータセット、新たに提供したDreamAssemblyデータセット、およびダウンストリームアプリケーションに関する総合的な実験結果により、本手法の優れた性能が検証された。
関連論文リスト
- Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet [39.58317527488534]
画像合成は、オリジナルおよび現実的な画像を作成することができるインテリジェントモデルの設計を通じて、制限に対処することを目的としている。
本稿では,新しい安定拡散モデル制御ネットに基づくContRailフレームワークを提案する。
我々は,鉄道固有の課題における性能を改善するために,合成鉄道画像生成の課題を実験した。
論文 参考訳(メタデータ) (2024-12-09T18:34:49Z) - AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks [23.041812897803034]
任意の種類の合成データを生成可能な統合フレームワークであるAny Synthを提案する。
我々は、Few-shot Object Detection、クロスドメインオブジェクト検出、Zero-shot Image Retrieval、Multi-modal Image Perception and Groundingなど、さまざまなタスクでフレームワークの性能を検証する。
論文 参考訳(メタデータ) (2024-11-24T04:49:07Z) - Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis [43.481539150288434]
この作品は新しい家族を紹介します。
因子グラフ拡散モデル(FG-DM)
FG-DMは結合分布をモデル化する。
イメージやコンディショニング変数、例えばセマンティック、スケッチなどです。
因子グラフ分解による 奥行きや正常な地図です
論文 参考訳(メタデータ) (2024-10-29T00:54:00Z) - AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0]
製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文 参考訳(メタデータ) (2024-08-05T01:50:09Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - CoDi: Conditional Diffusion Distillation for Higher-Fidelity and Faster
Image Generation [49.3016007471979]
大規模な生成拡散モデルは、テキスト・ツー・イメージ生成に革命をもたらし、条件付き生成タスクに大きな可能性を秘めている。
しかし、彼らの普及は高い計算コストによって妨げられ、リアルタイムの応用が制限される。
本稿では,事前学習した潜伏拡散モデルに付加的な画像条件入力を適応させるCoDiという新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T17:59:18Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。