Fugu-MT 論文翻訳(概要): Jigsaw: Supporting Designers in Prototyping Multimodal Applications by Assembling AI Foundation Models

論文の概要: Jigsaw: Supporting Designers in Prototyping Multimodal Applications by Assembling AI Foundation Models

arxiv url: http://arxiv.org/abs/2310.08574v1
Date: Thu, 12 Oct 2023 17:57:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-14 08:12:40.088988
Title: Jigsaw: Supporting Designers in Prototyping Multimodal Applications by Assembling AI Foundation Models
Title（参考訳）: jigsaw: ai foundationモデルの組み立てによるマルチモーダルアプリケーションのプロトタイプ作成支援
Authors: David Chuan-En Lin, Nikolas Martelaro
Abstract要約: Jigsawは、基礎モデルを表現するメタファーとしてパズルピースを使用するプロトタイプシステムである。設計者は、互換性のあるパズルを組み立てることで、様々なモダリティで異なる基礎モデル機能を組み合わせることができる。
参考スコア（独自算出の注目度）: 5.239589676872304
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent advancements in AI foundation models have made it possible for them to be utilized off-the-shelf for creative tasks, including ideating design concepts or generating visual prototypes. However, integrating these models into the creative process can be challenging as they often exist as standalone applications tailored to specific tasks. To address this challenge, we introduce Jigsaw, a prototype system that employs puzzle pieces as metaphors to represent foundation models. Jigsaw allows designers to combine different foundation model capabilities across various modalities by assembling compatible puzzle pieces. To inform the design of Jigsaw, we interviewed ten designers and distilled design goals. In a user study, we showed that Jigsaw enhanced designers' understanding of available foundation model capabilities, provided guidance on combining capabilities across different modalities and tasks, and served as a canvas to support design exploration, prototyping, and documentation.
Abstract（参考訳）: aiファウンデーションモデルの最近の進歩により、デザインコンセプトの考案やビジュアルプロトタイプの作成など、既製の創造的なタスクに使用できるようになりました。しかし、これらのモデルを創造的なプロセスに統合することは、特定のタスクに適したスタンドアロンアプリケーションとしてしばしば存在するため、難しい。この課題に対処するため,基礎モデルを表現するメタファーとしてパズルピースを用いたプロトタイプシステムであるJigsawを紹介した。 Jigsawは、互換性のあるパズルを組み立てることで、さまざまなモダリティでさまざまな基礎モデル機能を組み合わせることができる。 Jigsawの設計を知らせるために、私たちは10人のデザイナと設計目標についてインタビューしました。ユーザスタディでは、Jigsawが利用可能な基盤モデル機能に対するデザイナの理解を強化し、さまざまなモダリティやタスクにまたがる機能の組み合わせに関するガイダンスを提供し、デザイン探索、プロトタイピング、ドキュメンテーションをサポートするキャンバスとして機能することを示しました。

関連論文リスト

Rethinking Layered Graphic Design Generation with a Top-Down Approach [76.33538798060326]
図形デザインは、アイデアやメッセージを伝えるのに不可欠である。デザイナーは通常、編集を簡単にするために、オブジェクト、背景、ベクトル化されたテキスト層に作業を整理する。 GenAI方式の登場により、ピクセルフォーマットにおける高品質なグラフィックデザインの無限の供給がよりアクセスしやすくなってきた。これにもかかわらず、非層型設計は人間の設計を刺激し、レイアウトやテキストスタイルの選択に影響を与え、最終的に層型設計を導いた。本稿では,AI生成したデザインを編集可能な階層化設計に変換する最初の試みとして,グラフィックデザイン生成フレームワークであるAccordionを提案する。
論文参考訳（メタデータ） (2025-07-08T02:26:08Z)
From Idea to CAD: A Language Model-Driven Multi-Agent System for Collaborative Design [0.06749750044497731]
本稿では,このチーム構造を視覚言語モデル(VLM)に基づくマルチエージェントシステムで再現する手法を提案する。モデルはスケッチやテキスト記述から自動的に生成される。得られたモデルは、ユーザとの反復的検証ループで協調的に洗練することができる。
論文参考訳（メタデータ） (2025-03-06T13:21:27Z)
Bridging Design Gaps: A Parametric Data Completion Approach With Graph Guided Diffusion Models [9.900586490845694]
本研究では, グラフ注意ネットワークと表層拡散モデルを利用して, 工学設計におけるパラメトリックデータの欠落を解消する生成的計算モデルを提案する。提案手法は従来の手法,例えばMissForest, HotDeck, PPCA, TabCSDI よりも精度と多様性に優れていた。グラフモデルは、設計問題の鍵となるアセンブリグラフから複雑なパラメトリック相互依存性を正確にキャプチャし、インプットするのに役立つ。
論文参考訳（メタデータ） (2024-06-17T16:03:17Z)
Automatic Layout Planning for Visually-Rich Documents with Instruction-Following Models [81.6240188672294]
グラフィックデザインでは、プロでないユーザは、限られたスキルとリソースのために視覚的に魅力的なレイアウトを作成するのに苦労することが多い。レイアウト計画のための新しいマルチモーダル・インストラクション・フォロー・フレームワークを導入し、視覚的要素をカスタマイズしたレイアウトに簡単に配置できるようにする。本手法は,非専門職の設計プロセスを単純化するだけでなく,数ショット GPT-4V モデルの性能を上回り,mIoU は Crello で 12% 向上する。
論文参考訳（メタデータ） (2024-04-23T17:58:33Z)
Geometric Deep Learning for Computer-Aided Design: A Survey [76.3325417461511]
幾何学的深層学習技術は、コンピュータ支援設計の分野における変革の原動力となっている。幾何データで表されるCAD設計を処理し、それらの符号化された特徴を解析することで、類似性を識別することができる。本調査は, コンピュータ支援設計における学習手法の総合的な概要を, 様々なカテゴリーにまたがって紹介する。
論文参考訳（メタデータ） (2024-02-27T17:11:35Z)
Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。 N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文参考訳（メタデータ） (2024-01-24T01:33:39Z)
Visual Instruction Tuning towards General-Purpose Multimodal Model: A Survey [59.95153883166705]
従来のコンピュータビジョンは、モデルアーキテクチャで暗黙的に設計されたタスク命令を持つ専用モデルによって、個々のタスクを独立して解決する。近年,視覚インストラクション・チューニング (VIT) の研究が盛んに行われている。本研究の目的は,(1)コンピュータビジョンタスクのパラダイムとVIT開発を提示する背景,(2)一般的に使用されるネットワークアーキテクチャ,視覚的命令チューニングフレームワークと目的を導入したVITの基礎,および,設定とタスクの評価,(3)視覚的命令チューニングと評価において一般的に使用されるデータセットの体系的レビューを提供することである。
論文参考訳（メタデータ） (2023-12-27T14:54:37Z)
DesignGPT: Multi-Agent Collaboration in Design [4.6272626111555955]
DesignGPTは人工知能エージェントを使用して、デザイン会社におけるさまざまなポジションの役割をシミュレートし、人間のデザイナーが自然言語で協力できるようにする。実験の結果、DesignGPTはAIツールを別々に比較すると、デザイナのパフォーマンスが向上することがわかった。
論文参考訳（メタデータ） (2023-11-20T08:05:52Z)
ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model Reuse [59.500060790983994]
本稿では、PyTorchバックエンドを利用して、モデル再利用のための包括的でユーザフレンドリなツールボックスであるZhiJianを紹介する。 ZhiJianは、PTMによるターゲットアーキテクチャ構築、PTMによるターゲットモデルチューニング、およびPTMに基づく推論を含む、モデル再利用に関するさまざまな視点を統一する新しいパラダイムを提示している。
論文参考訳（メタデータ） (2023-08-17T19:12:13Z)
LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer [80.61492265221817]
グラフィックレイアウトデザインは視覚コミュニケーションにおいて重要な役割を担っている。しかし、手作りのレイアウトデザインは、スキルを要求し、時間がかかり、バッチプロダクションではスケールできない。ジェネレーティブモデルは、設計自動化をスケーラブルにするために出現するが、デザイナの欲求に沿うデザインを作成することは、未だに容易ではない。
論文参考訳（メタデータ） (2022-12-19T21:57:35Z)
AI Art in Architecture [0.6853165736531939]
最近の拡散ベースのAIアートプラットフォームは、単純なテキスト記述から印象的なイメージを作成することができる。これはアーキテクチャ設計の初期段階にも当てはまり、アイデア、スケッチ、モデリングの段階が複数ある。アーキテクチャ設計における一連の一般的なユースケースに対して,Midjourney,DALL-E 2,StableDiffusionの各プラットフォームの適用性について検討する。
論文参考訳（メタデータ） (2022-12-19T12:24:14Z)
Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.09649785009528]
本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文参考訳（メタデータ） (2022-03-25T05:27:28Z)
CreativeGAN: Editing Generative Adversarial Networks for Creative Design Synthesis [1.933681537640272]
本論文では,新しいデザインを作成するための自動手法であるCreativeGANを提案する。デザインをユニークなものにするコンポーネントを識別し、GANモデルを変更することで、識別されたユニークなコンポーネントでデザインを生成する可能性が高まる。自転車デザインのデータセットを用いて,ユニークなフレームとハンドル,および幅広いデザインの珍しいノベルティを備えた新しい自転車デザインを作成できることを実証した。
論文参考訳（メタデータ） (2021-03-10T18:22:35Z)
Designing Machine Learning Toolboxes: Concepts, Principles and Patterns [0.0]
AIモデリングツールボックスの設計における重要なパターンについて概説する。我々の分析では、既存のツールボックスの設計だけでなく、新しいツールボックスの開発も説明できます。
論文参考訳（メタデータ） (2021-01-13T08:55:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。