論文の概要: An Affective-Taxis Hypothesis for Alignment and Interpretability
- arxiv url: http://arxiv.org/abs/2505.17024v1
- Date: Sat, 03 May 2025 04:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-01 23:16:01.361838
- Title: An Affective-Taxis Hypothesis for Alignment and Interpretability
- Title(参考訳): アライメントと解釈可能性に対するAffective-Taxis仮説
- Authors: Eli Sennesh, Maxwell Ramstead,
- Abstract要約: AIアライメントは、エージェントが常に人間のオペレーターの目標と価値に沿って振る舞うようにすることを目的としている。
本稿では,アライメント問題に対する感情主義的アプローチを提案する。
我々は,AIアライメントにおける情緒的なタクシーの役割について論じる。
- 参考スコア(独自算出の注目度): 0.9471093245585006
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: AI alignment is a field of research that aims to develop methods to ensure that agents always behave in a manner aligned with (i.e. consistently with) the goals and values of their human operators, no matter their level of capability. This paper proposes an affectivist approach to the alignment problem, re-framing the concepts of goals and values in terms of affective taxis, and explaining the emergence of affective valence by appealing to recent work in evolutionary-developmental and computational neuroscience. We review the state of the art and, building on this work, we propose a computational model of affect based on taxis navigation. We discuss evidence in a tractable model organism that our model reflects aspects of biological taxis navigation. We conclude with a discussion of the role of affective taxis in AI alignment.
- Abstract(参考訳): AIアライメント(AIアライメント、英: AI alignment)とは、エージェントが常に人間のオペレーターの目標や価値観と整合して行動することを保証する手法を開発することを目的とした研究分野である。
本稿では、アライメント問題に対する感情主義的アプローチを提案し、感情的なタクシーという観点から目標と価値の概念を再検討し、近年の進化発達型・計算型神経科学の研究に訴えて、感情的価値の出現を説明する。
本稿では,その現状を概観し,タクシーのナビゲーションに基づく感情の計算モデルを提案する。
我々は, 生体タクシーナビゲーションの側面を反映した, トラクタブルモデル生物のエビデンスについて論じる。
我々は,AIアライメントにおける情緒的なタクシーの役割について論じる。
関連論文リスト
- Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Social Interaction-Aware Dynamical Models and Decision Making for
Autonomous Vehicles [20.123965317836106]
IAAD(Interaction-Aware Autonomous Driving)は、急速に成長する研究分野である。
それは、人間の道路利用者と安全かつ効率的に対話できる自動運転車の開発に焦点を当てている。
これは、自動運転車が人間の道路利用者の行動を理解し予測できることを要求するため、困難な作業である。
論文 参考訳(メタデータ) (2023-10-29T03:43:50Z) - The Integration of Prediction and Planning in Deep Learning Automated Driving Systems: A Review [43.30610493968783]
我々は、最先端のディープラーニングベースの計画システムについてレビューし、どのように予測を統合するかに焦点を当てる。
異なる統合原則の意味、強み、限界について論じる。
論文 参考訳(メタデータ) (2023-08-10T17:53:03Z) - Vehicle Motion Forecasting using Prior Information and Semantic-assisted
Occupancy Grid Maps [6.99274104609965]
運動は、センサーデータの不確実性、未来の非決定論的性質、複雑な振る舞いによって、自動運転車にとって困難なタスクである。
本稿では,シーンを動的占有グリッドマップ(DOGM)として表現することで,この問題に対処する。
本研究では,車両の挙動を予測するための時間的および確率的アプローチを組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-08T14:49:44Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - Active Inference in Robotics and Artificial Agents: Survey and
Challenges [51.29077770446286]
我々は、状態推定、制御、計画、学習のためのアクティブ推論の最先端理論と実装についてレビューする。
本稿では、適応性、一般化性、堅牢性の観点から、その可能性を示す関連する実験を紹介する。
論文 参考訳(メタデータ) (2021-12-03T12:10:26Z) - Grounded Relational Inference: Domain Knowledge Driven Explainable Autonomous Driving [47.22329993674051]
我々は、人間のドメイン知識とモデル固有の因果関係の両方に整合した説明を生成する説明可能なモデルを開発することを目的とする。
特に、自律運転における重要なビルディングブロック、マルチエージェントインタラクションモデリングに焦点を当てる。
シミュレーションと実環境設定の両方で対話的な交通シナリオをモデル化できることを実証する。
論文 参考訳(メタデータ) (2021-02-23T19:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。