論文の概要: DrawTalking: Building Interactive Worlds by Sketching and Speaking
- arxiv url: http://arxiv.org/abs/2401.05631v2
- Date: Sat, 3 Feb 2024 01:23:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 03:19:14.641620
- Title: DrawTalking: Building Interactive Worlds by Sketching and Speaking
- Title(参考訳): DrawTalking: スケッチと講演によるインタラクティブな世界の構築
- Authors: Karl Toby Rosenberg, Rubaiat Habib Kazi, Li-Yi Wei, Haijun Xia, Ken
Perlin
- Abstract要約: 我々はDrawTalkingを紹介した。DrawTalkingは、ユーザがスケッチや講演によってインタラクティブな世界を構築することを可能にするための、プロトタイプシステムである。
このアプローチはユーザコントロールと柔軟性を強調し、コードを必要としないプログラミングのような機能を提供する。
- 参考スコア(独自算出の注目度): 20.836365837419873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce DrawTalking, a prototype system enabling an approach that
empowers users to build interactive worlds by sketching and speaking. The
approach emphasizes user control and flexibility, and gives programming-like
capability without requiring code. An early open-ended study shows the
mechanics resonate and are applicable to many creative-exploratory use cases,
with the potential to inspire and inform research in future natural interfaces
for creative exploration and authoring.
- Abstract(参考訳): 本稿では,対話的な世界をスケッチ・アンド・スポーキングによって構築するアプローチを可能にするプロトタイプシステムであるdrawtalkingを紹介する。
このアプローチはユーザコントロールと柔軟性を強調し、コードを必要としないプログラミングのような機能を提供する。
初期の公開研究は、機械が共鳴し、多くの創造的探索的ユースケースに適用可能であり、将来の自然インターフェイスにおける創造的探索とオーサリングの研究を刺激し、知らせる可能性を秘めている。
関連論文リスト
- SketchAgent: Language-Driven Sequential Sketch Generation [34.96339247291013]
SketchAgentは言語駆動でシーケンシャルなスケッチ生成方法である。
テキスト内例を通してモデルに導入した直感的なスケッチ言語を提案する。
脳卒中をストロークで描くことで、スケッチに固有の進化的でダイナミックな性質を捉えます。
論文 参考訳(メタデータ) (2024-11-26T18:32:06Z) - Sketch2Code: Evaluating Vision-Language Models for Interactive Web Design Prototyping [55.98643055756135]
初歩的なスケッチのWebページプロトタイプへの変換を自動化する上で,最先端のビジョン言語モデル(VLM)を評価するベンチマークであるSketch2Codeを紹介した。
我々は、既存のVLMではSketch2Codeが困難であることを示す10の商用およびオープンソースモデルを分析した。
UI/UXの専門家によるユーザ調査では、受動的フィードバックの受信よりも、積極的に質問を行うのがかなり好まれている。
論文 参考訳(メタデータ) (2024-10-21T17:39:49Z) - Introducing Brain-like Concepts to Embodied Hand-crafted Dialog Management System [1.178527785547223]
本稿では,グラフィカル言語を用いた手作りモデルに基づく混合イニシアティブダイアログとアクション生成を実現するニューラル・ビヘイビア・エンジンを提案する。
このような脳のようなアーキテクチャのユーザビリティのデモは、セミパブリック空間で動作する仮想レセプタリストアプリケーションを通じて記述される。
論文 参考訳(メタデータ) (2024-06-13T10:54:03Z) - SketchDreamer: Interactive Text-Augmented Creative Sketch Ideation [111.2195741547517]
画像の画素表現に基づいて訓練されたテキスト条件付き拡散モデルを用いて,制御されたスケッチを生成する手法を提案する。
我々の目標は、プロでないユーザにスケッチを作成させ、一連の最適化プロセスを通じて物語をストーリーボードに変換することです。
論文 参考訳(メタデータ) (2023-08-27T19:44:44Z) - Spellburst: A Node-based Interface for Exploratory Creative Coding with
Natural Language Prompts [7.074738009603178]
Spellburstは、LLM(Big Language Model)を利用したクリエイティブコーディング環境である。
Spellburstは、アーティストが生成アートを作成し、分岐とマージ操作を通じてバリエーションを探索することを可能にする。
論文 参考訳(メタデータ) (2023-08-07T21:54:58Z) - PromptCrafter: Crafting Text-to-Image Prompt through Mixed-Initiative
Dialogue with LLM [2.2894985490441377]
本稿では,テキスト・ツー・イメージ・プロンプトのステップ・バイ・ステップ作成を可能にする新しい混合開始システムであるPromptCrafterを紹介する。
反復的なプロセスを通じて、ユーザーはモデルの能力を効率的に探求し、その意図を明らかにすることができる。
PromptCrafterはまた、大きな言語モデルによって生成された質問を明確にするために、さまざまな応答に答えることで、プロンプトを洗練できるようにする。
論文 参考訳(メタデータ) (2023-07-18T05:51:00Z) - ChatPLUG: Open-Domain Generative Dialogue System with Internet-Augmented
Instruction Tuning for Digital Human [76.62897301298699]
ChatPLUGは、デジタルヒューマンアプリケーションのための中国のオープンドメイン対話システムである。
モデルネームは, 自動評価と人的評価の両方において, 最先端の中国語対話システムより優れていることを示す。
高速な推論でスマートスピーカーやインスタントメッセージアプリケーションのような実世界のアプリケーションにモデルネームをデプロイします。
論文 参考訳(メタデータ) (2023-04-16T18:16:35Z) - Generative Agents: Interactive Simulacra of Human Behavior [86.1026716646289]
生成エージェントを導入し,人間の振る舞いをシミュレートする計算ソフトウェアエージェントについて紹介する。
エージェントの経験の完全な記録を格納するために,大規模言語モデルを拡張するアーキテクチャについて述べる。
The Simsにインスパイアされた対話型サンドボックス環境に生成エージェントを投入する。
論文 参考訳(メタデータ) (2023-04-07T01:55:19Z) - Teachable Reality: Prototyping Tangible Augmented Reality with Everyday
Objects by Leveraging Interactive Machine Teaching [4.019017835137353]
Teachable Realityは、任意の日常オブジェクトでインタラクティブな有形ARアプリケーションを作成するための拡張現実(AR)プロトタイプツールである。
オンデマンドコンピュータビジョンモデルを用いて、ユーザ定義の有形および外見的相互作用を識別する。
当社のアプローチは,ARプロトタイプ作成の障壁を低くすると同時に,フレキシブルで汎用的なプロトタイピング体験を可能にする。
論文 参考訳(メタデータ) (2023-02-21T23:03:49Z) - A Case Study in Engineering a Conversational Programming Assistant's
Persona [72.47187215119664]
会話能力は、既存のコード流大言語モデルを使用することで達成された。
プロンプトの進化に関する議論は、既存の基礎モデルを特定のアプリケーションに望ましい方法で振る舞う方法に関するケーススタディを提供する。
論文 参考訳(メタデータ) (2023-01-13T14:48:47Z) - I Know What You Draw: Learning Grasp Detection Conditioned on a Few
Freehand Sketches [74.63313641583602]
そこで本研究では,スケッチ画像に関連のある潜在的な把握構成を生成する手法を提案する。
私たちのモデルは、現実世界のアプリケーションで簡単に実装できるエンドツーエンドで訓練され、テストされています。
論文 参考訳(メタデータ) (2022-05-09T04:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。