論文の概要: Unpacking Human-AI interactions: From interaction primitives to a design
space
- arxiv url: http://arxiv.org/abs/2401.05115v1
- Date: Wed, 10 Jan 2024 12:27:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 14:41:46.020307
- Title: Unpacking Human-AI interactions: From interaction primitives to a design
space
- Title(参考訳): 人間とAIの相互作用を解き放つ:インタラクションプリミティブからデザイン空間へ
- Authors: Kostas Tsiakas and Dave Murray-Rust
- Abstract要約: これらのプリミティブを相互作用パターンの集合にどのように組み合わせるかを示す。
この背景にある動機は、既存のプラクティスのコンパクトな一般化を提供することである。
我々は,人間-AIインタラクションの設計空間に対して,このアプローチをどのように利用できるかについて議論する。
- 参考スコア(独自算出の注目度): 6.778055454461106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper aims to develop a semi-formal design space for Human-AI
interactions, by building a set of interaction primitives which specify the
communication between users and AI systems during their interaction. We show
how these primitives can be combined into a set of interaction patterns which
can provide an abstract specification for exchanging messages between humans
and AI/ML models to carry out purposeful interactions. The motivation behind
this is twofold: firstly, to provide a compact generalisation of existing
practices, that highlights the similarities and differences between systems in
terms of their interaction behaviours; and secondly, to support the creation of
new systems, in particular by opening the space of possibilities for
interactions with models. We present a short literature review on frameworks,
guidelines and taxonomies related to the design and implementation of HAI
interactions, including human-in-the-loop, explainable AI, as well as hybrid
intelligence and collaborative learning approaches. From the literature review,
we define a vocabulary for describing information exchanges in terms of
providing and requesting particular model-specific data types. Based on this
vocabulary, a message passing model for interactions between humans and models
is presented, which we demonstrate can account for existing systems and
approaches. Finally, we build this into design patterns as mid-level constructs
that capture common interactional structures. We discuss how this approach can
be used towards a design space for Human-AI interactions that creates new
possibilities for designs as well as keeping track of implementation issues and
concerns.
- Abstract(参考訳): 本稿では,ユーザとAIシステム間のインタラクションを規定するインタラクションプリミティブのセットを構築することで,人間-AIインタラクションのための半形式的な設計空間を構築することを目的とする。
これらのプリミティブを、人間とai/mlモデル間のメッセージ交換のための抽象的な仕様を提供し、目的のあるインタラクションを実行するための一連のインタラクションパターンに組み合わせる方法を示します。
第一に、既存のプラクティスのコンパクトな一般化を提供することで、システム間の相互作用行動の類似性と相違を強調すること、第二に、特にモデルとのインタラクションの可能性の空間を開くことによって、新しいシステムの作成をサポートすることである。
本稿では,ヒューマン・イン・ザ・ループ,説明可能なAI,ハイブリッド・インテリジェンスと協調学習アプローチなど,HAIインタラクションの設計と実装に関連するフレームワーク,ガイドライン,分類に関する短い文献レビューを紹介する。
文献レビューから,特定のモデル固有のデータ型の提供と要求という観点から情報交換を記述する語彙を定義する。
この語彙に基づき、人間とモデル間のインタラクションのためのメッセージパッシングモデルが提示され、既存のシステムとアプローチを説明することができる。
最後に、これを共通の相互作用構造をキャプチャする中間層構造として設計パターンに組み込む。
我々は,この手法が人間とAIのインタラクションのための設計空間にどのように適用され,設計の新たな可能性を生み出し,実装上の問題や関心事の追跡を行うかについて議論する。
関連論文リスト
- HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using
Diffusion Models [45.16955053939174]
ひとつのモデルではなく,モジュール化された設計を採用して,複雑なタスクをシンプルなサブタスクに分解する,というのが私たちの重要な洞察です。
まず、入力テキストに条件付けされた人間と物体の両方の動きを生成するための二重分岐拡散モデル(HOI-DM)を開発する。
また,人間と物体の接触領域を予測するためのアベイランス予測拡散モデル(APDM)を開発した。
論文 参考訳(メタデータ) (2023-12-11T17:41:17Z) - Detecting Any Human-Object Interaction Relationship: Universal HOI
Detector with Spatial Prompt Learning on Foundation Models [55.20626448358655]
本研究では,ビジョン・ランゲージ(VL)基礎モデルと大規模言語モデル(LLM)を用いて,オープンワールド環境におけるユニバーサルインタラクション認識について検討する。
我々の設計にはHO Prompt-guided Decoder (HOPD) が含まれており、基礎モデルにおける高次関係表現と画像内の様々なHOペアとの結合を容易にする。
オープンカテゴリの対話認識では,対話文と解釈文の2つのタイプがサポートされている。
論文 参考訳(メタデータ) (2023-11-07T08:27:32Z) - A Grammatical Compositional Model for Video Action Detection [24.546886938243393]
典型的なAnd-Orグラフに基づく行動検出のための新しい文法合成モデル(GCM)を提案する。
本モデルは,文法モデルの構成性とDNNのリッチな特徴を表現する能力の両面を活用するために,階層的な動作の固有構造と潜時的関係を利用する。
論文 参考訳(メタデータ) (2023-10-04T15:24:00Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Collective Relational Inference for learning heterogeneous interactions [8.215734914005845]
本稿では,従来の手法と比較して2つの特徴を持つ関係推論の確率的手法を提案する。
提案手法を複数のベンチマークデータセットで評価し,既存の手法よりも精度良く対話型を推定できることを実証した。
全体として、提案モデルはデータ効率が高く、より小さなシステムで訓練された場合、大規模システムに対して一般化可能である。
論文 参考訳(メタデータ) (2023-04-30T19:45:04Z) - InterGen: Diffusion-based Multi-human Motion Generation under Complex
Interactions [52.67456181120208]
動作拡散プロセスに人間と人間の相互作用を組み込んだ効果的な拡散ベースアプローチであるInterGenを提案する。
我々はまず、InterHumanという名前のマルチモーダルデータセットをコントリビュートする。これは、様々な2人インタラクションのための約107Mフレームで構成され、正確な骨格運動と23,337の自然言語記述を持つ。
本稿では,世界規模での2人のパフォーマーのグローバルな関係を明示的に定式化した対話拡散モデルにおける動作入力の表現を提案する。
論文 参考訳(メタデータ) (2023-04-12T08:12:29Z) - RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection [40.65483058890176]
最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)
論文 参考訳(メタデータ) (2021-04-30T14:03:10Z) - Interactive Teaching for Conversational AI [2.5259192787433706]
現在の会話型AIシステムは、事前設計された要求のセットを理解し、関連するアクションを実行することを目的としている。
子どもが大人と対話する最初の言語を学習する方法に触発された本論文では、新しいTeachable AIシステムについて述べる。
インタラクティブな授業セッションを使ってエンドユーザーから直接、概念と呼ばれる新しい言語ナゲットを学ぶことができる。
論文 参考訳(メタデータ) (2020-12-02T04:08:49Z) - Adaptive Interaction Modeling via Graph Operations Search [109.45125932109454]
相互作用モデリングのための適応型構造を学習するために,構造設計のプロセスを自動化する。
アーキテクチャ探索フレームワークが適応的な相互作用モデリング構造を構築することを実験的に実証した。
本手法は最先端技術との競合性能を実現する。
論文 参考訳(メタデータ) (2020-05-05T13:01:09Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。