Fugu-MT 論文翻訳(概要): Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions

論文の概要: Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions

arxiv url: http://arxiv.org/abs/2406.09264v2
Date: Mon, 17 Jun 2024 16:58:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-19 01:41:06.332990
Title: Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions
Title（参考訳）: 双方向AIアライメントに向けて: 明確化, 枠組み, 今後の方向性の体系的レビュー
Authors: Hua Shen, Tiffany Knearem, Reshmi Ghosh, Kenan Alkiek, Kundan Krishna, Yachuan Liu, Ziqiao Ma, Savvas Petridis, Yi-Hao Peng, Li Qiwei, Sushrita Rakshit, Chenglei Si, Yutong Xie, Jeffrey P. Bigham, Frank Bentley, Joyce Chai, Zachary Lipton, Qiaozhu Mei, Rada Mihalcea, Michael Terry, Diyi Yang, Meredith Ringel Morris, Paul Resnick, David Jurgens,
Abstract要約: 近年のAIの進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。人間のAIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の共同作業を妨げる、大きな障害となる。
参考スコア（独自算出の注目度）: 101.67121669727354
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent advancements in general-purpose AI have highlighted the importance of guiding AI systems towards the intended goals, ethical principles, and values of individuals and groups, a concept broadly recognized as alignment. However, the lack of clarified definitions and scopes of human-AI alignment poses a significant obstacle, hampering collaborative efforts across research domains to achieve this alignment. In particular, ML- and philosophy-oriented alignment research often views AI alignment as a static, unidirectional process (i.e., aiming to ensure that AI systems' objectives match humans) rather than an ongoing, mutual alignment problem [429]. This perspective largely neglects the long-term interaction and dynamic changes of alignment. To understand these gaps, we introduce a systematic review of over 400 papers published between 2019 and January 2024, spanning multiple domains such as Human-Computer Interaction (HCI), Natural Language Processing (NLP), Machine Learning (ML), and others. We characterize, define and scope human-AI alignment. From this, we present a conceptual framework of "Bidirectional Human-AI Alignment" to organize the literature from a human-centered perspective. This framework encompasses both 1) conventional studies of aligning AI to humans that ensures AI produces the intended outcomes determined by humans, and 2) a proposed concept of aligning humans to AI, which aims to help individuals and society adjust to AI advancements both cognitively and behaviorally. Additionally, we articulate the key findings derived from literature analysis, including discussions about human values, interaction techniques, and evaluations. To pave the way for future studies, we envision three key challenges for future directions and propose examples of potential future solutions.
Abstract（参考訳）: 汎用AIの最近の進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。しかしながら、人間-AIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の協調作業を妨げる重要な障害となる。特に、MLと哲学指向のアライメント研究は、AIアライメントを、進行中の相互アライメント問題(429)ではなく、静的で一方向のプロセス(つまり、AIシステムの目的が人間と一致することを保証すること)とみなすことが多い。この観点は、長期の相互作用とアライメントの動的変化を無視している。これらのギャップを理解するために、2019年から2024年1月までに発行された400以上の論文を体系的にレビューし、ヒューマン・コンピュータ・インタラクション(HCI)、自然言語処理(NLP)、機械学習(ML)など複数のドメインにまたがる調査を行った。人間のAIアライメントを特徴づけ、定義し、スコープ化します。そこで本研究では,「双方向型AIアライメント」の概念的枠組みを提示し,文学を人間中心の視点から整理する。このフレームワークは両方を包含する 1)AIを人間に合わせる従来の研究は、AIが人間によって決定された結果を生み出すことを確実にしている。 2) 個人や社会が認知的・行動的にAIの進歩に適応することを支援することを目的として,人間をAIに整合させる概念を提案する。さらに,人的価値,インタラクション技術,評価に関する議論など,文献分析から得られた重要な知見を述べる。今後の研究の道を開くために,今後の方向性に関する3つの重要な課題を思いつき,今後の解決策の例を提案する。

関連論文リスト

Human-AI Interaction Alignment: Designing, Evaluating, and Evolving Value-Centered AI For Reciprocal Human-AI Futures [27.995784716141767]
生成AIを日々の生活に迅速に統合することは、一方向アライメントモデルを超えて動く必要性を浮き彫りにする。このワークショップは、双方向のヒューマン-AIアライメント、人間とAIが相互作用、評価、価値中心の設計を通じて協調する動的な相互プロセスに焦点を当てている。
論文参考訳（メタデータ） (2025-12-25T07:45:38Z)
Understanding the Process of Human-AI Value Alignment [1.6799377888527687]
計算機科学研究における価値アライメントは、人工知能を人間と整合させる過程を指すことが多いが、そのフレーズの使い方は正確性に欠けることが多い。我々は、人工知能における価値アライメントの理解を促進するために、体系的な文献レビューを行う。
論文参考訳（メタデータ） (2025-09-17T09:39:38Z)
Exploring Societal Concerns and Perceptions of AI: A Thematic Analysis through the Lens of Problem-Seeking [0.0]
本研究では,AIとは対照的に人間の知能の特徴を明らかにするために,問題解決から問題解決を区別する新しい概念的枠組みを提案する。このフレームワークは、AIは効率と最適化において優れているが、接地と人間の認識に固有のエンボディメントの柔軟性から派生したオリエンテーションは欠如している、と強調している。
論文参考訳（メタデータ） (2025-05-29T18:24:34Z)
Research on Superalignment Should Advance Now with Parallel Optimization of Competence and Conformity [30.24208064228573]
スーパーアライメントは達成可能であり、その研究はすぐに進むべきだと我々は主張する。この研究は、価値に整合した次世代AIを開発するための実践的なアプローチに光を当てている。
論文参考訳（メタデータ） (2025-03-08T04:10:11Z)
The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment [33.27140396561271]
大規模言語モデル(LLMs)の出現は、人工超知能(ASI)の可能性を引き起こしている。 Superalignmentは2つの主要な目標 – 高品質なガイダンスシグナルを提供するための監視のスケーラビリティと、人間の価値との整合性を確保するための堅牢なガバナンス – に対処することを目指している。具体的には、ASIの概念、それらがもたらす課題、そしてスーパーアライメント問題に対処する際の現在のアライメントパラダイムの限界について検討する。
論文参考訳（メタデータ） (2024-12-21T03:51:04Z)
Aligning Generalisation Between Humans and Machines [74.120848518198]
近年のAIの進歩は、科学的発見と意思決定支援において人間を支援できる技術をもたらしたが、民主主義と個人を妨害する可能性がある。 AIの責任ある使用は、ますます人間とAIのチームの必要性を示している。これらの相互作用の重要かつしばしば見落とされがちな側面は、人間と機械が一般化する異なる方法である。
論文参考訳（メタデータ） (2024-11-23T18:36:07Z)
ValueCompass: A Framework of Fundamental Values for Human-AI Alignment [15.35489011078817]
本稿では,心理学的理論と体系的レビューに基づく基本的価値の枠組みであるバリューを紹介する。本研究では,人間と言語モデル(LM)の価値アライメントを測定するために,実世界の4つのヴィグネットに価値を適用した。以下に示すのは、人間とLMの危険な相違を明らかにすることであり、例えば、LMは人間によってほとんど意見が一致しない「自己のゴール」のような価値観と一致している。
論文参考訳（メタデータ） (2024-09-15T02:13:03Z)
Beyond Prompts: Learning from Human Communication for Enhanced AI Intent Alignment [30.93897332124916]
人間のコミュニケーションにおける意図的仕様のための人的戦略について検討する。本研究は,人間中心型AIシステムに向けて,AIシステム設計のためのヒューマンコミュニケーション戦略をまとめることを目的としている。
論文参考訳（メタデータ） (2024-05-09T11:10:29Z)
Human-AI collaboration is not very collaborative yet: A taxonomy of interaction patterns in AI-assisted decision making from a systematic review [6.013543974938446]
意思決定支援システムにおける人工知能の活用は、技術的進歩に不相応に焦点を合わせてきた。人間中心の視点は、既存のプロセスとのシームレスな統合のためにAIソリューションを設計することで、この懸念を緩和しようとする。
論文参考訳（メタデータ） (2023-10-30T17:46:38Z)
AI Alignment: A Comprehensive Survey [70.35693485015659]
AIアライメントは、AIシステムが人間の意図や価値観に沿って振る舞うようにすることを目的としている。 AIアライメントの重要な目的として、ロバストネス、解釈可能性、制御可能性、倫理という4つの原則を特定します。我々は、現在のアライメント研究を、前方アライメントと後方アライメントの2つの重要なコンポーネントに分解する。
論文参考訳（メタデータ） (2023-10-30T15:52:15Z)
Next Steps for Human-Centered Generative AI: A Technical Perspective [107.74614586614224]
我々はHuman-centered Generative AI(HGAI)の次のステップを提案する。これらの次のステップを特定することで、HGAIにおける創発的なアイデアの一貫性を追求するため、学際的な研究チームを引き出すつもりです。
論文参考訳（メタデータ） (2023-06-27T19:54:30Z)
Human-AI Coevolution [48.74579595505374]
Coevolution AIは、人間とAIアルゴリズムが相互に連続的に影響を及ぼすプロセスである。本稿では,AIと複雑性科学の交点における新たな研究分野の基盤として,Coevolution AIを紹介した。
論文参考訳（メタデータ） (2023-06-23T18:10:54Z)
Artificial intelligence in government: Concepts, standards, and a unified framework [0.0]
人工知能(AI)の最近の進歩は、政府の変革を約束している。新しいAIシステムは、社会の規範的な期待に沿うように振る舞うことが重要である。
論文参考訳（メタデータ） (2022-10-31T10:57:20Z)
Fairness in Agreement With European Values: An Interdisciplinary Perspective on AI Regulation [61.77881142275982]
この学際的立場の論文は、AIにおける公平性と差別に関する様々な懸念を考察し、AI規制がそれらにどう対処するかについて議論する。私たちはまず、法律、(AI)産業、社会技術、そして(道徳)哲学のレンズを通して、AIと公正性に注目し、様々な視点を提示します。我々は、AI公正性の懸念の観点から、AI法の取り組みを成功に導くために、AIレギュレーションが果たす役割を特定し、提案する。
論文参考訳（メタデータ） (2022-06-08T12:32:08Z)
On some Foundational Aspects of Human-Centered Artificial Intelligence [52.03866242565846]
人間中心人工知能(Human Centered Artificial Intelligence)の意味については明確な定義はない。本稿では,AIコンポーネントを備えた物理・ソフトウェア計算エージェントを指すHCAIエージェントについて紹介する。 HCAIエージェントの概念は、そのコンポーネントや機能とともに、人間中心のAIに関する技術的および非技術的議論を橋渡しする手段であると考えています。
論文参考訳（メタデータ） (2021-12-29T09:58:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。