Fugu-MT 論文翻訳(概要): Expanding the Generative AI Design Space through Structured Prompting and Multimodal Interfaces

論文の概要: Expanding the Generative AI Design Space through Structured Prompting and Multimodal Interfaces

arxiv url: http://arxiv.org/abs/2504.14320v1
Date: Sat, 19 Apr 2025 14:57:32 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-30 01:27:18.789845
Title: Expanding the Generative AI Design Space through Structured Prompting and Multimodal Interfaces
Title（参考訳）: 構造化プロンプティングとマルチモーダルインタフェースによる生成AI設計空間の拡大
Authors: Nimisha Karnatak, Adrien Baranes, Rob Marchant, Huinan Zeng, Tríona Butler, Kristen Olson,
Abstract要約: ACAI(AI Co-Creation for Advertising and Inspiration)は、初心者デザイナーを支援するためのツールである。 ACAIは、ブランディングパネル(Branding Panel)、オーディエンス・アンド・ゴールズパネル(Audience & Goals Panel)、インスピレーションボードパネル(Inspiration Board Panel)の3つのモジュールからなる、構造化されたパネルベースのインタフェースを備えている。この研究は、構造化インターフェイスがユーザ定義コンテキストをフォアグラウンドし、初心者のアライメントとアクセラビリティの両方を改善する方法を示すことによって、生成システムに関するHCI研究に寄与する。
参考スコア（独自算出の注目度）: 1.051328497890725
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Text-based prompting remains the dominant interaction paradigm in generative AI, yet it often results in a high-friction experience for novice users, such as small business owners (SBOs), attempting to articulate creative or domain-specific goals for advertising. To investigate this challenge, we conducted a study with six SBOs in the United Kingdom, focusing on their advertising practices and perceptions and usage of AI tools in this context. Our findings surfaced two persistent breakdowns in current generative AI systems: first, the cognitive burden of prompt engineering, as users struggled to translate abstract creative goals into effective textual inputs; and second, the frequent generation of generic outputs that failed to align with users' articulated brand vision. To address these issues, we developed ACAI (AI Co-Creation for Advertising and Inspiration), a multimodal, GenAI-powered advertisement creation tool designed to support novice designers by reimagining the prompt interface. ACAI features a structured, panel-based interface composed of three modules: the Branding Panel, the Audience & Goals Panel, and the Inspiration Board Panel to provide SBOs with outputs that align with their creative vision by reducing prompt ambiguity. This work contributes to HCI research on generative systems by showing how structured interfaces can foreground user-defined context to improve both alignment and promptability in novice workflows.
Abstract（参考訳）: テキストベースのプロンプトは、生成AIにおける主要な相互作用パラダイムであり続けているが、小さなビジネスオーナー(SBO)のような初心者ユーザーにとって、創造的あるいはドメイン固有の広告目標を明確にしようとする高い摩擦体験をもたらすことが多い。この課題を調査するため、英国6つのSBOで調査を行い、この文脈におけるAIツールの広告実践と認識と利用に焦点を当てた。ひとつは、ユーザーが抽象的な創造目標を効果的なテキスト入力に変換するのに苦労しているときの、迅速なエンジニアリングの認知的負担、もうひとつは、ユーザの明瞭なブランドビジョンと一致しなかった、一般的なアウトプットの頻繁な生成である。これらの課題に対処するため,我々は,初歩的なインタフェースを再現して初心者デザイナーを支援するためのマルチモーダルなGenAIベースの広告作成ツールであるACAI(AI Co-Creation for Advertising and Inspiration)を開発した。 ACAIは、ブランディングパネル、オーディエンス・アンド・ゴールズパネル、インスピレーションボードパネルの3つのモジュールからなる構成されたパネルベースのインターフェースを備えており、迅速な曖昧さを低減し、創造的なビジョンに沿った出力を提供する。この研究は、構造化インターフェイスが、初心者ワークフローにおけるアライメントとアクセラビリティの両方を改善するために、ユーザ定義コンテキストをフォアグラウンドにする方法を示すことによって、生成システムに関するHCI研究に寄与する。

関連論文リスト

Generative Interfaces for Language Models [70.25765232527762]
ユーザインタフェース(UI)を積極的に生成することにより,大規模言語モデル(LLM)がユーザクエリに応答するパラダイムを提案する。本フレームワークは,ユーザクエリをタスク固有のUIに変換するために,構造化インターフェース固有の表現と反復的洗練を活用している。その結果、生成的インタフェースは人間の嗜好を最大72%改善し、会話的インタフェースよりも一貫して優れていた。
論文参考訳（メタデータ） (2025-08-26T17:43:20Z)
ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation [49.805992099208595]
ThematicPlaneは,ユーザが高レベルのセマンティック概念をナビゲートし操作できるシステムである。このインターフェースは、暗黙の創造意図とシステム制御のギャップを埋める。
論文参考訳（メタデータ） (2025-08-08T06:57:14Z)
PromptCanvas: Composable Prompting Workspaces Using Dynamic Widgets for Exploration and Iteration in Creative Writing [25.41215417987532]
PromptCanvasは、無限のキャンバス上で構成可能なウィジェットベースのエクスペリエンスに、プロンプトを変換する概念である。ユーザは、テキストのさまざまな面を表すインタラクティブなウィジェットを生成し、カスタマイズし、アレンジすることができる。
論文参考訳（メタデータ） (2025-06-04T09:13:51Z)
POET: Supporting Prompting Creativity and Personalization with Automated Expansion of Text-to-Image Generation [31.886910258606875]
最先端のビジュアル生成AIツールは、クリエイティブなタスクの初期のアイデア段階において、ユーザーを支援する大きな可能性を秘めている。多くの大規模テキスト・ツー・イメージシステムは幅広い適用性のために設計されており、創造的な探索を制限するような従来の出力が得られる。テキストから画像への生成モデルにおいて,同質性の次元を自動的に検出するリアルタイム対話型ツールPOETを紹介する。
論文参考訳（メタデータ） (2025-04-18T00:54:36Z)
Piece it Together: Part-Based Concepting with IP-Priors [52.01640707131325]
ユーザが提供するビジュアルコンポーネントの一部集合をシームレスにコヒーレントな構成に統合する生成フレームワークを導入する。提案手法は,IP-Adapter+から抽出した,強力で過小評価された表現空間に基づいている。また、与えられたタスクに対するIP-Adapter+のプロンプトアテンデンスを大幅に改善するLoRAベースの微調整戦略を提案する。
論文参考訳（メタデータ） (2025-03-13T13:46:10Z)
ACAI for SBOs: AI Co-creation for Advertising and Inspiration for Small Business Owners [1.114004309769802]
スモールビジネスオーナー(SBO)は、しばしば高品質の広告を作るのに必要な資源と設計経験を欠いている。我々は,GenAIを利用したマルチモーダル広告作成ツールであるACAI(AI Co-Creation for Advertising and Inspiration)を開発した。ロンドンで16名のSBOを対象に,広告制作におけるACAIの認識と相互作用について調査を行った。
論文参考訳（メタデータ） (2025-03-09T19:00:36Z)
GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文参考訳（メタデータ） (2024-11-18T10:04:10Z)
Survey of User Interface Design and Interaction Techniques in Generative AI Applications [79.55963742878684]
我々は,デザイナやディベロッパの参照として使用できる,さまざまなユーザインタラクションパターンのコンペレーションを作ることを目指している。また、生成AIアプリケーションの設計についてもっと学ぼうとする人たちの参入障壁を低くしようと努力しています。
論文参考訳（メタデータ） (2024-10-28T23:10:06Z)
A Novel Idea Generation Tool using a Structured Conversational AI (CAI) System [0.0]
本稿では、初心者デザイナーを支援する創造的アイデア生成ツールとして、対話型AIを活用したアクティブなアイデア生成インタフェースを提案する。これは動的でインタラクティブで文脈に応答するアプローチであり、人工知能(AI)における自然言語処理(NLP)の領域から大きな言語モデル(LLM)を積極的に巻き込む。このようなAIモデルとアイデアの統合は、連続的な対話ベースのインタラクション、コンテキストに敏感な会話、多彩なアイデア生成の促進に役立つ、アクティブな理想化(Active Ideation)シナリオと呼ばれるものを生み出します。
論文参考訳（メタデータ） (2024-09-09T16:02:27Z)
Constraining Participation: Affordances of Feedback Features in Interfaces to Large Language Models [49.74265453289855]
大規模言語モデル(LLM)は、コンピュータ、Webブラウザ、ブラウザベースのインターフェースによるインターネット接続を持つ人なら誰でも利用できるようになった。本稿では,ChatGPTインタフェースにおける対話型フィードバック機能の可能性について検討し,ユーザ入力の形状やイテレーションへの参加について分析する。
論文参考訳（メタデータ） (2024-08-27T13:50:37Z)
Empowering Visual Creativity: A Vision-Language Assistant to Image Editing Recommendations [109.65267337037842]
IER(Image Editing Recommendation)の課題を紹介する。 IERは、入力画像から多様なクリエイティブな編集命令を自動生成し、ユーザの未指定の編集目的を表すシンプルなプロンプトを作成することを目的としている。本稿では,Creative-Vision Language Assistant(Creativity-VLA)を紹介する。
論文参考訳（メタデータ） (2024-05-31T18:22:29Z)
How Human-Centered Explainable AI Interface Are Designed and Evaluated: A Systematic Survey [48.97104365617498]
Em Explainable Interfaces (EIs) の登場する領域は,XAI のユーザインターフェースとユーザエクスペリエンス設計に重点を置いている。本稿では,人間とXAIの相互作用の現在の動向と,EI設計・開発に向けた将来的な方向性を明らかにするために,53の出版物を体系的に調査する。
論文参考訳（メタデータ） (2024-03-21T15:44:56Z)
Towards More Unified In-context Visual Understanding [74.55332581979292]
マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文参考訳（メタデータ） (2023-12-05T06:02:21Z)
The role of interface design on prompt-mediated creativity in Generative AI [0.0]
2つのジェネレーティブAIプラットフォームから145,000以上のプロンプトを分析します。その結果,利用者は以前訪れた概念の活用よりも,新たなトピックを探求する傾向にあることがわかった。
論文参考訳（メタデータ） (2023-11-30T22:33:34Z)
How to Prompt? Opportunities and Challenges of Zero- and Few-Shot Learning for Human-AI Interaction in Creative Applications of Generative Models [29.420160518026496]
我々は,人間-AIインタラクションの新しいパラダイムとしてプロンプトを利用するインタラクティブなクリエイティブアプリケーションのための機会と課題について論じる。本分析に基づき,プロンプトをサポートするユーザインタフェースの設計目標を4つ提案する。これらは、クリエイティブな記述のユースケースに焦点を当てた、具体的なUIデザインスケッチで説明します。
論文参考訳（メタデータ） (2022-09-03T10:16:34Z)
Multimodal Dialog Systems with Dual Knowledge-enhanced Generative Pretrained Language Model [63.461030694700014]
マルチモーダルなタスク指向対話システム(DKMD)のための新しい二元的知識強化型事前学習言語モデルを提案する。提案したDKMDは,2つの知識選択,2つの知識強調型文脈学習,知識強調型応答生成という3つの重要なコンポーネントから構成される。パブリックデータセットの実験は、最先端の競合相手よりも提案されたDKMDの優位性を検証する。
論文参考訳（メタデータ） (2022-07-16T13:02:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。