論文の概要: Scopes of Alignment
- arxiv url: http://arxiv.org/abs/2501.12405v1
- Date: Wed, 15 Jan 2025 03:06:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-26 02:12:17.755247
- Title: Scopes of Alignment
- Title(参考訳): 配向のスコープ
- Authors: Kush R. Varshney, Zahra Ashktorab, Djallel Bouneffouf, Matthew Riemer, Justin D. Weisz,
- Abstract要約: AIアライメントに焦点をあてた研究の多くは、大きな言語モデルを、有用性、無害性、誠実性の一般的な価値に合わせることを目指している。
本稿では,このような限られた概念を超えて進む必要がある理由を動機付け,それを行うための3つの次元を提案する。
- 参考スコア(独自算出の注目度): 38.65920343856857
- License:
- Abstract: Much of the research focus on AI alignment seeks to align large language models and other foundation models to the context-less and generic values of helpfulness, harmlessness, and honesty. Frontier model providers also strive to align their models with these values. In this paper, we motivate why we need to move beyond such a limited conception and propose three dimensions for doing so. The first scope of alignment is competence: knowledge, skills, or behaviors the model must possess to be useful for its intended purpose. The second scope of alignment is transience: either semantic or episodic depending on the context of use. The third scope of alignment is audience: either mass, public, small-group, or dyadic. At the end of the paper, we use the proposed framework to position some technologies and workflows that go beyond prevailing notions of alignment.
- Abstract(参考訳): AIアライメントに焦点を合わせる研究の多くは、大きな言語モデルや他の基礎モデルと、有用性、無害性、誠実さというコンテキストレスで一般的な価値を一致させようとしている。
フロンティアモデルプロバイダも、モデルとこれらの値の整合化に努めている。
本稿では,このような限られた概念を超えて進む必要がある理由を動機付け,それを行うための3つの次元を提案する。
知識、スキル、行動 モデルは意図した目的のために有用でなければならない。
第2のアライメントの範囲はトランジェンスであり、意味論またはエピソディクスは使用状況によって異なる。
第3のアライメント範囲は、大衆、公共、小グループ、またはディヤドである。
論文の最後には、提案されたフレームワークを使用して、アライメントという一般的な概念を超えて、いくつかの技術とワークフローを配置します。
関連論文リスト
- Dynamic Normativity: Necessary and Sufficient Conditions for Value Alignment [0.0]
我々は,人的目標と価値を人工システムで従うことができるような方法で表現する上での課題に,不必要な敵意を伴わない「調整」の問題を見出した。
この研究は、AIシステム開発に規範的理論をもたらす、しっかりとした哲学的基礎と実践的な実装を必要とする技術的哲学的問題としてのアライメントに対処する。
論文 参考訳(メタデータ) (2024-06-16T18:37:31Z) - Alignment Studio: Aligning Large Language Models to Particular Contextual Regulations [61.141986747544024]
アプリケーション開発者が、特定の価値、社会的規範、法律、その他の規則にモデルをチューニングできるようにするアプローチを提案する。
私たちは、アライメントスタジオアーキテクチャの主要な3つのコンポーネント、フレーム、インストラクタ、そしてオーディタをレイアウトしました。
論文 参考訳(メタデータ) (2024-03-08T21:26:49Z) - On the Essence and Prospect: An Investigation of Alignment Approaches
for Big Models [77.86952307745763]
ビッグデータはAIの分野で画期的なブレークスルーを達成したが、潜在的な懸念を生じさせるかもしれない。
このような懸念に対処するため、これらのモデルを人間の嗜好や価値観に適合させるアライメント技術が導入された。
過去1年間にかなりの進歩があったにもかかわらず、最適アライメント戦略の確立には様々な課題がある。
論文 参考訳(メタデータ) (2024-03-07T04:19:13Z) - Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment [103.12563033438715]
人工知能におけるアライメントは、モデル応答と人間の好みと値の一貫性を追求する。
既存のアライメント技術は、主に一方向であり、様々な目的に対して、最適以下のトレードオフと柔軟性の低下につながる。
制御可能な選好最適化(CPO)を導入し、異なる目的に対する選好スコアを明確に指定する。
論文 参考訳(メタデータ) (2024-02-29T12:12:30Z) - AI Alignment: A Comprehensive Survey [70.35693485015659]
AIアライメントは、AIシステムが人間の意図や価値観に沿って振る舞うようにすることを目的としている。
AIアライメントの重要な目的として、ロバストネス、解釈可能性、制御可能性、倫理という4つの原則を特定します。
我々は、現在のアライメント研究を、前方アライメントと後方アライメントの2つの重要なコンポーネントに分解する。
論文 参考訳(メタデータ) (2023-10-30T15:52:15Z) - The Empty Signifier Problem: Towards Clearer Paradigms for
Operationalising "Alignment" in Large Language Models [18.16062736448993]
本稿では,大規模言語モデル(LLM)における「アライメント」の概念を,ポスト構造主義社会政治理論のレンズを通して論じる。
1) モデル行動のどの次元が重要か,2) 意味と定義がこれらの次元にどのように分類されるか,といったことを議論する枠組みを提案する。
透明性と批判的評価の文化を育成し,LLMと人間集団の整合性の複雑さをコミュニティがナビゲートするのを支援することを目的としている。
論文 参考訳(メタデータ) (2023-10-03T22:02:17Z) - Grounded Entity-Landmark Adaptive Pre-training for Vision-and-Language
Navigation [23.94546957057613]
クロスモーダルアライメントはビジョン・アンド・ランゲージ・ナビゲーション(VLN)の鍵となる課題である
本稿では,VLNタスクの事前学習パラダイムとして,GELA(Gunded Entity-Landmark Adaptive)を提案する。
論文 参考訳(メタデータ) (2023-08-24T06:25:20Z) - From Instructions to Intrinsic Human Values -- A Survey of Alignment
Goals for Big Models [48.326660953180145]
既存の作業におけるさまざまなアライメント目標の調査を行い、その進化経路を辿り、最も重要な目標を特定するのに役立ちます。
分析の結果,基本能力から価値指向への目標転換が明らかとなり,拡張LDMのアライメント目標として本質的な人的価値の可能性が示唆された。
論文 参考訳(メタデータ) (2023-08-23T09:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。