論文の概要: A Misleading Gallery of Fluid Motion by Generative Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2405.15406v1
- Date: Fri, 24 May 2024 10:17:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 15:01:48.403753
- Title: A Misleading Gallery of Fluid Motion by Generative Artificial Intelligence
- Title(参考訳): ジェネレーティブ人工知能による流体運動のミスリーディングギャラリー
- Authors: Ali Kashefi,
- Abstract要約: 本稿では、よく知られた生成人工知能(AI)アプリケーションからの出力の精度について検討する。
これらのアプリケーションによって生成された画像と実験室実験と数値ソフトウェアによる実画像を比較した。
以上の結果から,これらの生成AIモデルは流体力学画像において十分に訓練されていないことが示唆された。
- 参考スコア(独自算出の注目度): 1.90365714903665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this technical report, we extensively investigate the accuracy of outputs from well-known generative artificial intelligence (AI) applications in response to prompts describing common fluid motion phenomena familiar to the fluid mechanics community. We examine a range of applications, including Midjourney, Dall-E, Runway ML, Microsoft Designer, Gemini, Meta AI, and Leonardo AI, introduced by prominent companies such as Google, OpenAI, Meta, and Microsoft. Our text prompts for generating images or videos include examples such as "Von Karman vortex street", "flow past an airfoil", "Kelvin-Helmholtz instability", "shock waves on a sharp-nosed supersonic body", etc. We compare the images generated by these applications with real images from laboratory experiments and numerical software. Our findings indicate that these generative AI models are not adequately trained in fluid dynamics imagery, leading to potentially misleading outputs. Beyond text-to-image/video generation, we further explore the transition from image/video to text generation using these AI tools, aiming to investigate the accuracy of their descriptions of fluid motion phenomena. This report serves as a cautionary note for educators in academic institutions, highlighting the potential for these tools to mislead students. It also aims to inform researchers at these renowned companies, encouraging them to address this issue. We conjecture that a primary reason for this shortcoming is the limited access to copyright-protected fluid motion images from scientific journals.
- Abstract(参考訳): 本稿では,流体力学コミュニティに親しむ一般的な流体運動現象を説明するプロンプトに応答して,よく知られた生成人工知能(AI)アプリケーションからの出力の精度を広範囲に調査する。
私たちは、Google、OpenAI、Meta、Microsoftといった著名な企業が導入した、Midjourney、Dall-E、Runway ML、Microsoft Designer、Gemini、Meta AI、Leonardo AIなど、さまざまなアプリケーションを調べます。
Von Karman vortex Street, "flow past a airfoil", "Kelvin-Helmholtz instability", "shock wave on a sharp-nosed supersonic body"などです。
これらのアプリケーションによって生成された画像と実験室実験と数値ソフトウェアによる実画像を比較した。
以上の結果から,これらの生成AIモデルは流体力学画像において十分な訓練を受けていないことが示唆された。
テキスト・画像・映像生成以外にも、これらのAIツールを用いた画像・映像からテキスト生成への移行についても検討し、流体運動現象の記述の正確性について検討する。
本報告は、教育機関の教育者に対して、これらのツールが学生を誤解させる可能性があることを強調した注意書きとして機能する。
また、これらの著名な企業の研究者に、この問題に対処するよう促すことも目標としている。
この欠点の主な理由は、科学雑誌から著作権保護された流体動画像へのアクセスが制限されていることであると推測する。
関連論文リスト
- DejAIvu: Identifying and Explaining AI Art on the Web in Real-Time with Saliency Maps [0.0]
DejAIvuは、リアルタイムAI生成画像検出と唾液度に基づく説明性を組み合わせたChrome Webエクステンションである。
当社のアプローチでは、効率的なブラウザ内推論、勾配に基づく唾液度分析、シームレスなユーザエクスペリエンスを統合し、AI検出が透過的かつ解釈可能であることを保証しています。
論文 参考訳(メタデータ) (2025-02-12T22:24:49Z) - Moto: Latent Motion Token as the Bridging Language for Robot Manipulation [66.18557528695924]
我々はMotoを紹介する。Motoは、映像コンテンツをラテントモーションTokenizerでラテントモーションTokenシーケンスに変換する。
我々は、モーショントークンによるMoto-GPTの事前学習を行い、多様な視覚的動きの知識を捉えることができる。
実際のロボット動作に先立って学習した動きを転送するために、潜伏した動きのトークン予測と実際のロボット制御をシームレスにブリッジするコファインチューニング戦略を実装した。
論文 参考訳(メタデータ) (2024-12-05T18:57:04Z) - Motion Prompting: Controlling Video Generation with Motion Trajectories [57.049252242807874]
スパースもしくは高密度なビデオ軌跡を条件とした映像生成モデルを訓練する。
ハイレベルなユーザリクエストを,詳細なセミセンスな動作プロンプトに変換する。
我々は、カメラや物体の動き制御、画像との「相互作用」、動画転送、画像編集など、様々な応用を通してアプローチを実証する。
論文 参考訳(メタデータ) (2024-12-03T18:59:56Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Synthetic Photography Detection: A Visual Guidance for Identifying Synthetic Images Created by AI [0.0]
合成写真は、広範囲の脅威俳優によって悪用されることがある。
生成した画像中の可視人工物は、その合成原点を訓練された眼に示している。
これらのアーティファクトを分類し、例を示し、検出する上での課題について議論し、我々の研究の実践的応用を提案し、今後の研究方向性を概説する。
論文 参考訳(メタデータ) (2024-08-12T08:58:23Z) - Invisible Relevance Bias: Text-Image Retrieval Models Prefer AI-Generated Images [67.18010640829682]
我々は,AI生成画像がテキスト画像検索モデルに目に見えない関連性バイアスをもたらすことを示す。
検索モデルのトレーニングデータにAI生成画像を含めると、目に見えない関連性バイアスが増す。
本研究では,目に見えない関連バイアスを軽減するための効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-11-23T16:22:58Z) - State of the Art on Diffusion Models for Visual Computing [191.6168813012954]
本稿では,拡散モデルの基本数学的概念,実装の詳細,および一般的な安定拡散モデルの設計選択を紹介する。
また,拡散に基づく生成と編集に関する文献の急速な発展を概観する。
利用可能なデータセット、メトリクス、オープンな課題、社会的意味について議論する。
論文 参考訳(メタデータ) (2023-10-11T05:32:29Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Constructing Dreams using Generative AI [23.344751807278044]
ジェネレーティブAIツールは、若者のための新しい、そしてアクセス可能なメディア作成形式を導入します。
彼らは、偽メディアの生成、データ保護、プライバシー、AI生成アートの所有権に関する倫理的懸念を提起している。
我々は,学生が想像する未来のアイデンティティを表現して生成的AI学習を促進する。
論文 参考訳(メタデータ) (2023-05-19T21:56:12Z) - The Entoptic Field Camera as Metaphor-Driven Research-through-Design
with AI Technologies [28.81674106342742]
本稿では,Entoptic Field Cameraの作成と利用を通じて,画像生成の手段とモードの変化を探求するResearch-through-Designプロジェクトについて述べる。
我々は、AI技術におけるデータとモデルの物質的相互作用が、現実の人間の体験をいかに形作るかを研究するメタファーとして、エントロピーという用語を使用している。
論文 参考訳(メタデータ) (2023-01-23T17:03:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。