論文の概要: AI Alignment in the Design of Interactive AI: Specification Alignment,
Process Alignment, and Evaluation Support
- arxiv url: http://arxiv.org/abs/2311.00710v1
- Date: Mon, 23 Oct 2023 14:33:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-05 13:29:50.898450
- Title: AI Alignment in the Design of Interactive AI: Specification Alignment,
Process Alignment, and Evaluation Support
- Title(参考訳): インタラクティブAI設計におけるAIアライメント:仕様アライメント、プロセスアライメント、評価サポート
- Authors: Michael Terry, Chinmay Kulkarni, Martin Wattenberg, Lucas Dixon,
Meredith Ringel Morris
- Abstract要約: AIアライメントは、AIが望ましい結果をもたらすことを保証するという全体的な問題を、望ましくない副作用なしに考慮している。
本稿では、AIアライメントの概念を基本的な3ステップのインタラクションサイクルにマッピングする。
対話的なアライメント機構を提供するインターフェースが,質的に異なるユーザエクスペリエンスを実現する方法を示す。
- 参考スコア(独自算出の注目度): 32.828851258409216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI alignment considers the overall problem of ensuring an AI produces desired
outcomes, without undesirable side effects. While often considered from the
perspectives of safety and human values, AI alignment can also be considered in
the context of designing and evaluating interfaces for interactive AI systems.
This paper maps concepts from AI alignment onto a basic, three step interaction
cycle, yielding a corresponding set of alignment objectives: 1) specification
alignment: ensuring the user can efficiently and reliably communicate
objectives to the AI, 2) process alignment: providing the ability to verify and
optionally control the AI's execution process, and 3) evaluation support:
ensuring the user can verify and understand the AI's output. We also introduce
the concepts of a surrogate process, defined as a simplified, separately
derived, but controllable representation of the AI's actual process; and the
notion of a Process Gulf, which highlights how differences between human and AI
processes can lead to challenges in AI control. To illustrate the value of this
framework, we describe commercial and research systems along each of the three
alignment dimensions, and show how interfaces that provide interactive
alignment mechanisms can lead to qualitatively different and improved user
experiences.
- Abstract(参考訳): AIアライメントは、AIが望ましい結果をもたらすことを保証するという全体的な問題を、望ましくない副作用なしに考慮している。
安全と人的価値の観点から考えることが多いが、AIアライメントは、対話型AIシステムのためのインターフェースの設計と評価の文脈でも考慮できる。
本稿では,AIアライメントの概念を基本的3段階のインタラクションサイクルにマッピングし,アライメント目標のセットを生成する。
1) 仕様の整合性: ユーザがAIに目的を効率的に確実に伝達できるようにすること。
2) プロセスアライメント:AIの実行プロセスを検証し、任意に制御する機能を提供する。
3) 評価サポート: ユーザがAIのアウトプットを検証して理解できるようにすること。
また、AIの実際のプロセスの単純化された、分離された、しかし制御可能な表現として定義された代理プロセスの概念や、人間とAIプロセスの違いがAI制御の課題にどのように影響するかを強調するプロセスガルフの概念も導入する。
このフレームワークの価値を説明するために,3つのアライメント次元のそれぞれに沿って,商業的および研究的なシステムを記述し,対話的なアライメント機構を提供するインターフェースが,質的に異なるユーザエクスペリエンスをもたらすことを示す。
関連論文リスト
- Survey of User Interface Design and Interaction Techniques in Generative AI Applications [79.55963742878684]
我々は,デザイナやディベロッパの参照として使用できる,さまざまなユーザインタラクションパターンのコンペレーションを作ることを目指している。
また、生成AIアプリケーションの設計についてもっと学ぼうとする人たちの参入障壁を低くしようと努力しています。
論文 参考訳(メタデータ) (2024-10-28T23:10:06Z) - Constraining Participation: Affordances of Feedback Features in Interfaces to Large Language Models [49.74265453289855]
大規模言語モデル(LLM)は、コンピュータ、Webブラウザ、ブラウザベースのインターフェースによるインターネット接続を持つ人なら誰でも利用できるようになった。
本稿では,ChatGPTインタフェースにおける対話型フィードバック機能の可能性について検討し,ユーザ入力の形状やイテレーションへの参加について分析する。
論文 参考訳(メタデータ) (2024-08-27T13:50:37Z) - Measuring User Understanding in Dialogue-based XAI Systems [2.4124106640519667]
XAIの最先端は、単発、非個人化、一方通行の説明が特徴である。
本稿では,ユーザが学習しているモデルの予測をシミュレートして,3段階のユーザ理解を計測する。
我々は、高い理解率と低い理解率の集団間の相互作用のパターンを明らかにするために、データを分析した。
論文 参考訳(メタデータ) (2024-08-13T15:17:03Z) - Interrogating AI: Characterizing Emergent Playful Interactions with ChatGPT [10.907980864371213]
本研究では,人気のAI技術であるChatGPTのユーザによる遊び的なインタラクションに焦点を当てた。
ユーザ談話の半数以上(54%)が遊び心のあるインタラクションを中心に展開していることがわかった。
これらのインタラクションが、AIのエージェンシーを理解し、人間とAIの関係を形作り、AIシステムを設計するための洞察を提供する上で、どのように役立つかを検討する。
論文 参考訳(メタデータ) (2024-01-16T14:44:13Z) - An Interactive UI to Support Sensemaking over Collections of Parallel
Texts [15.401895433726558]
大量の論文のコーパスでは、相互に比較し、相互に比較することが認知的に求められています。
AVTALERは、人々のユニークなスキル、文脈認識、知識を、自動化の強みと組み合わせて提示する。
論文 参考訳(メタデータ) (2023-03-11T01:04:25Z) - AI Alignment Dialogues: An Interactive Approach to AI Alignment in
Support Agents [3.0731004832223796]
本稿では,AIアライメントに対する新たなアプローチとして,ユーザとエージェントが対話を通じてアライメントを実現し,維持しようとするアライメント対話を提案する。
我々は、アライメント・ダイアログはデータ駆動アプローチと比較して多くの利点があると主張している。
アライメントダイアログの利点は、ユーザーがエージェントに直接高度な概念を伝達できるようにすること、エージェントをより透明で信頼性の高いものにすることである。
論文 参考訳(メタデータ) (2023-01-16T13:19:53Z) - Evaluating Human-Language Model Interaction [79.33022878034627]
我々は,対話型システムのコンポーネントを定義する,HALIE(Human-AI Language-based Interaction Evaluation)という新しいフレームワークを開発した。
ソーシャル対話,質問応答,クロスワードパズル,要約,メタファ生成という,対話のさまざまな形態をカバーする5つのタスクを設計する。
より優れた非対話的性能は、必ずしもより良い人間とLMの相互作用に必ずしも変換されない。
論文 参考訳(メタデータ) (2022-12-19T18:59:45Z) - User Response and Sentiment Prediction for Automatic Dialogue Evaluation [69.11124655437902]
本稿では,次のユーザ発話の感情をターンレベル評価やダイアログレベル評価に利用することを提案する。
実験により,本モデルによる音声対話データセットと音声対話データセットの両方において,既存の自動評価指標よりも優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-16T22:19:17Z) - Optimizing Interactive Systems via Data-Driven Objectives [70.3578528542663]
本稿では,観察されたユーザインタラクションから直接目的を推測する手法を提案する。
これらの推論は、事前の知識によらず、様々な種類のユーザー行動にまたがって行われる。
本稿では,これらの推定対象を最適化するために利用する新しいアルゴリズムであるInteractive System(ISO)を紹介する。
論文 参考訳(メタデータ) (2020-06-19T20:49:14Z) - A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。
このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文 参考訳(メタデータ) (2020-03-02T10:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。