論文の概要: Foundational Challenges in Assuring Alignment and Safety of Large Language Models
- arxiv url: http://arxiv.org/abs/2404.09932v1
- Date: Mon, 15 Apr 2024 16:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-17 21:37:46.221271
- Title: Foundational Challenges in Assuring Alignment and Safety of Large Language Models
- Title(参考訳): 大規模言語モデルのアライメントと安全性確保における基礎的課題
- Authors: Usman Anwar, Abulhair Saparov, Javier Rando, Daniel Paleka, Miles Turpin, Peter Hase, Ekdeep Singh Lubana, Erik Jenner, Stephen Casper, Oliver Sourbut, Benjamin L. Edelman, Zhaowei Zhang, Mario Günther, Anton Korinek, Jose Hernandez-Orallo, Lewis Hammond, Eric Bigelow, Alexander Pan, Lauro Langosco, Tomasz Korbak, Heidi Zhang, Ruiqi Zhong, Seán Ó hÉigeartaigh, Gabriel Recchia, Giulio Corsi, Alan Chan, Markus Anderljung, Lilian Edwards, Yoshua Bengio, Danqi Chen, Samuel Albanie, Tegan Maharaj, Jakob Foerster, Florian Tramer, He He, Atoosa Kasirzadeh, Yejin Choi, David Krueger,
- Abstract要約: この研究は、大規模言語モデル(LLM)のアライメントと安全性の確保における18の基本的な課題を特定する。
特定された課題に基づいて、200ドル以上の具体的な研究質問を投げかけます。
- 参考スコア(独自算出の注目度): 130.41187105992017
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work identifies 18 foundational challenges in assuring the alignment and safety of large language models (LLMs). These challenges are organized into three different categories: scientific understanding of LLMs, development and deployment methods, and sociotechnical challenges. Based on the identified challenges, we pose $200+$ concrete research questions.
- Abstract(参考訳): この研究は、大規模言語モデル(LLM)のアライメントと安全性を確保する上で、18の基本的な課題を特定する。
これらの課題は, LLMの科学的理解, 開発と展開の方法, 社会工学的課題の3つのカテゴリに分類される。
特定された課題に基づいて、200ドル以上の具体的な研究質問を投げかけます。
関連論文リスト
- Overview of AI-Debater 2023: The Challenges of Argument Generation Tasks [62.443665295250035]
第2023回中国影響コンピューティング会議(CCAC 2023)におけるAI-Debater 2023チャレンジの結果を提示する。
合計で32のチームがチャレンジに登録し、そこから11の応募をもらいました。
論文 参考訳(メタデータ) (2024-07-20T10:13:54Z) - V3Det Challenge 2024 on Vast Vocabulary and Open Vocabulary Object Detection: Methods and Results [142.5704093410454]
V3Det Challenge 2024は、オブジェクト検出研究の境界を推し進めることを目的としている。
Vast Vocabulary Object DetectionとOpen Vocabulary Object Detectionの2つのトラックで構成されている。
我々は,広い語彙とオープン語彙のオブジェクト検出において,今後の研究の方向性を刺激することを目指している。
論文 参考訳(メタデータ) (2024-06-17T16:58:51Z) - Defining Requirements Strategies in Agile: A Design Science Research Study [4.110602799032192]
調査によると、現在アジャイル開発で直面している課題の多くは、要件エンジニアリングに関連している。
本稿では、未定義の要求戦略からアジャイル開発で生じる重要な課題について考察する。
論文 参考訳(メタデータ) (2024-05-29T07:57:32Z) - Puzzle Solving using Reasoning of Large Language Models: A Survey [1.9939549451457024]
本稿では,Large Language Models (LLMs) のパズル解法における能力について検討する。
以上の結果から,LLM能力と人為的推論の相違が明らかとなった。
この調査は、LLMのパズル解決能力を向上させるために、新しい戦略とよりリッチなデータセットの必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-17T14:19:38Z) - Competition-Level Problems are Effective LLM Evaluators [121.15880285283116]
本稿では,Codeforcesにおける最近のプログラミング問題の解決において,大規模言語モデル(LLM)の推論能力を評価することを目的とする。
まず,問題の発生時間,難易度,遭遇したエラーの種類など,様々な側面を考慮して,GPT-4の望ましくないゼロショット性能を総合的に評価する。
驚くべきことに、GPT-4のTheThoughtivedのパフォーマンスは、2021年9月以降、あらゆる困難と種類の問題に対して一貫して問題が減少するような崖を経験している。
論文 参考訳(メタデータ) (2023-12-04T18:58:57Z) - The Robust Semantic Segmentation UNCV2023 Challenge Results [99.97867942388486]
本稿では,ICCV 2023で実施されたMUAD不確実性定量化問題に対処するために用いられる勝利解について概説する。
この課題は、都市環境におけるセマンティックセグメンテーションを中心に、特に自然の敵対的なシナリオに焦点を当てた。
本報告では, 最先端の不確実性定量化手法からインスピレーションを得た19件の論文を提示する。
論文 参考訳(メタデータ) (2023-09-27T08:20:03Z) - Some challenges of calibrating differentiable agent-based models [0.0]
エージェントベースモデル(ABM)は複雑なシステムのモデリングと推論に有望なアプローチである。
それらの応用は、その複雑さ、離散的性質、パラメータ推論と最適化タスクの実行の難しさによって妨げられている。
論文 参考訳(メタデータ) (2023-07-03T15:07:10Z) - An investigation of challenges encountered when specifying training data
and runtime monitors for safety critical ML applications [5.553426007439564]
機械学習(ML)モデルを含むクリティカルソフトウェアの開発と運用には、厳格さと確立されたプロセスが必要である。
重要なMLモデルに対するトレーニングデータとランタイム監視の指定方法に大きな不確実性が見られる。
論文 参考訳(メタデータ) (2023-01-31T08:56:40Z) - Retrospectives on the Embodied AI Workshop [238.302290980995]
CVPRのEmbodied AI Workshopで発表された13の課題に注目します。
これらの課題は,(1)視覚ナビゲーション,(2)再構成,(3)視覚と言語を具現化した3つのテーマに分類される。
本稿では,各テーマにおける支配的データセット,課題評価指標,最先端モデルの性能について論じる。
論文 参考訳(メタデータ) (2022-10-13T09:00:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。