論文の概要: Stable Rivers: A Case Study in the Application of Text-to-Image
Generative Models for Earth Sciences
- arxiv url: http://arxiv.org/abs/2312.07833v1
- Date: Wed, 13 Dec 2023 01:40:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-14 16:55:56.922252
- Title: Stable Rivers: A Case Study in the Application of Text-to-Image
Generative Models for Earth Sciences
- Title(参考訳): 安定河川:地球科学におけるテキストから画像への生成モデルの適用事例
- Authors: C Kupferschmidt, A.D. Binns, K.L. Kupferschmidt, and G.W Taylor
- Abstract要約: テキスト・ツー・イメージ(TTI)生成モデルは、与えられたテキストストリング入力から画像を生成するために使用できる。
安定拡散のトレーニングデータとモデル性能における被検領域比のバイアスについて検討した。
その結果, 有名な河川や滝などの景観を過度に表現し, 形態的・環境的条件の過度に表現できることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-image (TTI) generative models can be used to generate photorealistic
images from a given text-string input. These models offer great potential to
mitigate challenges to the uptake of machine learning in the earth sciences.
However, the rapid increase in their use has raised questions about fairness
and biases, with most research to-date focusing on social and cultural areas
rather than domain-specific considerations. We conducted a case study for the
earth sciences, focusing on the field of fluvial geomorphology, where we
evaluated subject-area specific biases in the training data and downstream
model performance of Stable Diffusion (v1.5). In addition to perpetuating
Western biases, we found that the training data over-represented scenic
locations, such as famous rivers and waterfalls, and showed serious under- and
over-representation of many morphological and environmental terms. Despite
biased training data, we found that with careful prompting, the Stable
Diffusion model was able to generate photorealistic synthetic river images
reproducing many important environmental and morphological characteristics.
Furthermore, conditional control techniques, such as the use of condition maps
with ControlNet were effective for providing additional constraints on output
images. Despite great potential for the use of TTI models in the earth sciences
field, we advocate for caution in sensitive applications, and advocate for
domain-specific reviews of training data and image generation biases to
mitigate perpetuation of existing biases.
- Abstract(参考訳): テキスト・ツー・イメージ(TTI)生成モデルは、与えられたテキストストリング入力からフォトリアリスティックな画像を生成するために使用できる。
これらのモデルは、地球科学における機械学習の取り込みの課題を軽減する大きな可能性を秘めている。
しかし、彼らの使用の急速な増加は公正さとバイアスに関する疑問を提起し、多くの研究はドメイン固有の考慮よりも、社会的、文化的領域に焦点を当てている。
地球科学のケーススタディとして, フラビアル地形学の分野に着目し, 訓練データにおける対象領域固有の偏りと安定拡散の下流モデル性能を評価した(v1.5)。
西洋の偏見の持続性に加えて,有名な河川や滝などの名勝地を過度に表現し,多くの形態・環境条件の過度な下・過度な表現を示した。
偏りのある訓練データにもかかわらず, 安定拡散モデルでは, 重要な環境・形態特性を再現したフォトリアリスティックな合成河川画像を生成することができた。
さらに,ControlNetを用いた条件マップなどの条件制御技術は,出力画像に付加的な制約を与えるのに有効であった。
地球科学分野でのTTIモデルの利用の可能性は大きいが、我々は敏感な応用に注意を払い、既存のバイアスを緩和するためにトレーニングデータと画像生成バイアスのドメイン固有のレビューを提唱する。
関連論文リスト
- Comparative Analysis of Generative Models: Enhancing Image Synthesis with VAEs, GANs, and Stable Diffusion [0.0]
本稿では,変分オートエンコーダ(VAE),GAN(Generative Adversarial Networks),安定拡散(Stable Diffusion)の3つの主要な生成モデルについて検討する。
論文 参考訳(メタデータ) (2024-08-16T13:50:50Z) - YaART: Yet Another ART Rendering Technology [119.09155882164573]
そこで本研究では,ヒトの嗜好に適合する新しい生産段階のテキスト・ツー・イメージ拡散モデルYaARTを紹介した。
これらの選択がトレーニングプロセスの効率と生成された画像の品質にどのように影響するかを分析する。
高品質な画像の小さなデータセットでトレーニングされたモデルが、より大きなデータセットでトレーニングされたモデルとうまく競合できることを実証する。
論文 参考訳(メタデータ) (2024-04-08T16:51:19Z) - Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Rapid Training Data Creation by Synthesizing Medical Images for
Classification and Localization [10.506584969668792]
本稿では,この問題を解決するために,任意のディープニューラルネットワークをトレーニングするための実データ変換手法を提案する。
弱教師付きモデルでは,生成したデータを用いて局所化精度が著しく向上することを示す。
後者のモデルでは、生成した画像でトレーニングされた精度は、完全に注釈付けされた実画像でトレーニングされた精度と密接に一致している。
論文 参考訳(メタデータ) (2023-08-09T03:49:12Z) - A Comparative Study on Generative Models for High Resolution Solar
Observation Imaging [59.372588316558826]
本研究は、観測された太陽活動状態の背後にあるデータ分布を正確に捉えるために、現在の最先端生成モデルの能力について検討する。
スーパーコンピュータ上での分散トレーニングを用いて、人間の専門家が区別できない高品質なサンプルを生成する、最大1024x1024解像度の生成モデルを訓練することができる。
論文 参考訳(メタデータ) (2023-04-14T14:40:32Z) - Trade-offs in Fine-tuned Diffusion Models Between Accuracy and
Interpretability [5.865936619867771]
生成拡散モデルにおける従来の計測値とモデル解釈可能性による画像の忠実度との間に連続的なトレードオフが生じる。
我々は、真に解釈可能な生成モデルを開発するための設計原則のセットを提示する。
論文 参考訳(メタデータ) (2023-03-31T09:11:26Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - Generating Physically-Consistent Satellite Imagery for Climate Visualizations [53.61991820941501]
我々は,将来的な洪水や森林再生イベントの合成衛星画像を作成するために,生成的敵ネットワークを訓練する。
純粋なディープラーニングベースのモデルでは、洪水の可視化を生成することができるが、洪水の影響を受けない場所では幻覚的な洪水が発生する。
我々は,地球観測におけるセグメンテーションガイドによる画像と画像の変換のためのコードとデータセットを公開している。
論文 参考訳(メタデータ) (2021-04-10T15:00:15Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。