論文の概要: ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet
- arxiv url: http://arxiv.org/abs/2412.06742v1
- Date: Mon, 09 Dec 2024 18:34:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:57:27.059724
- Title: ContRail: A Framework for Realistic Railway Image Synthesis using ControlNet
- Title(参考訳): ContRail: ControlNetを用いたリアル鉄道画像合成フレームワーク
- Authors: Andrei-Robert Alexandrescu, Razvan-Gabriel Petec, Alexandru Manole, Laura-Silvia Diosan,
- Abstract要約: 画像合成は、オリジナルおよび現実的な画像を作成することができるインテリジェントモデルの設計を通じて、制限に対処することを目的としている。
本稿では,新しい安定拡散モデル制御ネットに基づくContRailフレームワークを提案する。
我々は,鉄道固有の課題における性能を改善するために,合成鉄道画像生成の課題を実験した。
- 参考スコア(独自算出の注目度): 39.58317527488534
- License:
- Abstract: Deep Learning became an ubiquitous paradigm due to its extraordinary effectiveness and applicability in numerous domains. However, the approach suffers from the high demand of data required to achieve the potential of this type of model. An ever-increasing sub-field of Artificial Intelligence, Image Synthesis, aims to address this limitation through the design of intelligent models capable of creating original and realistic images, endeavour which could drastically reduce the need for real data. The Stable Diffusion generation paradigm recently propelled state-of-the-art approaches to exceed all previous benchmarks. In this work, we propose the ContRail framework based on the novel Stable Diffusion model ControlNet, which we empower through a multi-modal conditioning method. We experiment with the task of synthetic railway image generation, where we improve the performance in rail-specific tasks, such as rail semantic segmentation by enriching the dataset with realistic synthetic images.
- Abstract(参考訳): ディープ・ラーニングは多くの領域で異常な有効性と適用性のために、ユビキタスなパラダイムとなった。
しかし、このアプローチは、この種のモデルの可能性を達成するために必要なデータの高要求に悩まされる。
人工知能のサブフィールドである画像合成は、オリジナルでリアルなイメージを作成できるインテリジェントなモデルの設計を通じて、この制限に対処することを目的としている。
安定拡散生成パラダイムは、最近、すべての以前のベンチマークを超える最先端のアプローチを推進した。
本研究では,マルチモーダルコンディショニング手法を用いて,新しい安定拡散モデル制御ネットに基づくContRailフレームワークを提案する。
本研究では,レールセマンティックセグメンテーションなどの鉄道固有のタスクにおいて,現実的な合成画像でデータセットを豊かにすることにより,その性能を向上させるための合成鉄道画像生成の課題を実験的に検討する。
関連論文リスト
- Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.696575161583618]
本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文 参考訳(メタデータ) (2024-10-30T07:11:41Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Diversify, Don't Fine-Tune: Scaling Up Visual Recognition Training with
Synthetic Images [37.29348016920314]
そこで本研究では,既製の生成モデルを利用して合成訓練画像を生成する新しいフレームワークを提案する。
クラス名の曖昧さ、ナイーブなプロンプトの多様性の欠如、ドメインシフトに対処する。
我々のフレームワークは、より合成データによる認識モデルの性能を一貫して向上させる。
論文 参考訳(メタデータ) (2023-12-04T18:35:27Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z) - IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。
我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。
本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-17T17:07:36Z) - DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder [73.1010640692609]
本稿では,拡散デコーダ(DiVAE)を用いたVQ-VAEアーキテクチャモデルを提案する。
我々のモデルは最先端の成果を達成し、さらに多くのフォトリアリスティックな画像を生成する。
論文 参考訳(メタデータ) (2022-06-01T10:39:12Z) - Towards a Unified Approach to Single Image Deraining and Dehazing [16.383099109400156]
降雨効果の新しい物理モデルを開発し,その均一な連続限界として,ヘイズ効果のよく知られた大気散乱モデル(ASM)が自然に現れることを示した。
また,デレーシングとデヘイジングの両方に適した,密集したスケール接続型注意ネットワーク (dscan) を提案する。
論文 参考訳(メタデータ) (2021-03-26T01:35:43Z) - Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。
合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文 参考訳(メタデータ) (2021-01-29T22:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。