Fugu-MT 論文翻訳(概要): Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives?

論文の概要: Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives?

arxiv url: http://arxiv.org/abs/2407.17482v1
Date: Tue, 2 Jul 2024 08:07:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-28 18:09:38.409302
Title: Reinforcement Learning from Human Feedback: Whose Culture, Whose Values, Whose Perspectives?
Title（参考訳）: 人間からのフィードバックからの強化学習:誰が文化、誰が価値、誰がパースペクティブか?
Authors: Kristian González Barman, Simon Lohse, Henk de Regt,
Abstract要約: 大規模言語モデル(LLM)の文脈におけるRL(Reinforcement from Human Feedback)における多元主義の倫理的優位性について論じる。社会と多元主義の哲学に基づいて、RHLFをより人間のニーズに反応させる方法と、その過程での課題にどう対処できるかを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We argue for the epistemic and ethical advantages of pluralism in Reinforcement Learning from Human Feedback (RLHF) in the context of Large Language Models (LLM). Drawing on social epistemology and pluralist philosophy of science, we suggest ways in which RHLF can be made more responsive to human needs and how we can address challenges along the way. The paper concludes with an agenda for change, i.e. concrete, actionable steps to improve LLM development.
Abstract（参考訳）: 我々は,LLHF(Reinforcement Learning from Human Feedback)における多元主義の認識的・倫理的優位性を,Large Language Models(LLM)の文脈で論じる。社会認識学と科学の多元主義哲学に基づいて、RHLFをより人間のニーズに反応させる方法と、その過程での課題にどう対処できるかを提案する。本稿は, LLM 開発を改善するための具体的, 実用的なステップ, 変化の議題で締めくくっている。

関連論文リスト

Because we have LLMs, we Can and Should Pursue Agentic Interpretability [22.10895793309226]
大規模言語モデル(LLM)は、ユーザのメンタルモデルの開発と活用によって、人間の理解を積極的に支援する。エージェント的解釈性は、特に評価において、私たちが「ループの絡み合い」と呼ぶ性質のために、課題をもたらす。エージェントの解釈可能性の約束は、人間がLLMの潜在的な欺く概念を学ぶのを助けることである。
論文参考訳（メタデータ） (2025-06-13T18:13:58Z)
PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文参考訳（メタデータ） (2024-07-17T08:13:22Z)
LLM Theory of Mind and Alignment: Opportunities and Risks [0.0]
大きな言語モデル (LLM) が心の理論 (ToM) を持つかどうかに注目が集まっている。本稿では,LLM ToMが人間:LLMの相互作用に現れる重要な領域を個人およびグループレベルで同定する。それは、潜在的な意味を幅広い範囲で明らかにし、将来の研究の最も急進的な領域を示唆している。
論文参考訳（メタデータ） (2024-05-13T19:52:16Z)
RLHF Deciphered: A Critical Analysis of Reinforcement Learning from Human Feedback for LLMs [49.386699863989335]
大きな言語モデル(LLM)を訓練し、人間の効果的なアシスタントとして機能させるには、慎重に検討する必要がある。有望なアプローチとして、人間からのフィードバック(RLHF)からの強化学習がある。本稿では、強化学習原理のレンズを通してRLHFを分析し、その基礎を理解する。
論文参考訳（メタデータ） (2024-04-12T15:54:15Z)
Should We Fear Large Language Models? A Structural Analysis of the Human Reasoning System for Elucidating LLM Capabilities and Risks Through the Lens of Heidegger's Philosophy [0.0]
本研究では,Large Language Models(LLM)の能力とリスクについて検討する。 LLM内の単語関係の統計的パターンと、Martin Heidegger氏の概念である"ready-to-hand"と"present-at-hand"の間には、革新的な並列性がある。以上の結果から, LLMには直接的説明推論と擬似論理推論の能力があるが, 真理的推論に乏しく, 創造的推論能力がないことが明らかとなった。
論文参考訳（メタデータ） (2024-03-05T19:40:53Z)
How do Large Language Models Navigate Conflicts between Honesty and Helpfulness? [14.706111954807021]
人間の振る舞いを特徴付けるための心理モデルと実験を用いて、大きな言語モデルを分析する。人間のフィードバックからの強化学習は、誠実さと有用性の両方を改善している。 GPT-4 Turboは、会話のフレーミングやリスナーの判断コンテキストに対する感度を含む人間的な応答パターンを実証する。
論文参考訳（メタデータ） (2024-02-11T19:13:26Z)
How should the advent of large language models affect the practice of science? [51.62881233954798]
大規模言語モデルの出現は科学の実践にどのように影響を与えるべきか? 我々は4つの科学者グループを招待し、この質問を反映し、彼らの見解を共有し、議論をおこなった。
論文参考訳（メタデータ） (2023-12-05T10:45:12Z)
Think Twice: Perspective-Taking Improves Large Language Models' Theory-of-Mind Capabilities [63.90227161974381]
SimToMは、シミュレーション理論の視点取りの概念にインスパイアされた、新しいプロンプトフレームワークである。我々のアプローチは、追加のトレーニングや最小限のプロンプトチューニングを必要とせず、既存の手法よりも大幅に改善されている。
論文参考訳（メタデータ） (2023-11-16T22:49:27Z)
DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback [61.28463542324576]
本稿では,大規模言語モデルから自然言語フィードバック(NLF)を革新的に活用する大規模視覚言語モデル(LVLM)であるDRESSを紹介する。我々は,NLFの新たな分類法を2つの重要なタイプに分類する。実験の結果、DRESSはより有用な(9.76%)、正直な(11.52%)、無害な(21.03%)を生成できることが示された。
論文参考訳（メタデータ） (2023-11-16T18:37:29Z)
Think Before You Speak: Cultivating Communication Skills of Large Language Models via Inner Monologue [73.69510478736483]
大規模言語モデル(LLM)は、流動的で一貫性があり多様な応答を生成する。しかし、それらは重要な能力、コミュニケーションスキルを欠いている。本稿は,内的モノローグによるLLMのコミュニケーション能力向上を目的としている。実験の結果,提案したCSIM戦略はバックボーンモデルを改善し,ベースラインよりも優れていた。
論文参考訳（メタデータ） (2023-11-13T16:19:42Z)
Large Human Language Models: A Need and the Challenges [24.617133254643637]
大規模人文言語モデル(LHLM)の創出に向けた3つの立場を提唱する。第一に、LMトレーニングには人間の文脈を含めるべきである。第二に、LHLMは、人々が自分のグループ以上であることを認識すべきである。第3に、LHLMは人間の文脈の動的かつ時間的に依存する性質を説明できるべきである。
論文参考訳（メタデータ） (2023-11-09T00:27:28Z)
Violation of Expectation via Metacognitive Prompting Reduces Theory of Mind Prediction Error in Large Language Models [0.0]
大規模言語モデル(LLM)は、心の理論(ToM)タスクにおいて、魅力的な習熟度を示す。この、観察不能な精神状態を他人に伝える能力は、人間の社会的認知に不可欠であり、人間と人工知能(AI)の主観的関係において同様に重要であることが証明される。
論文参考訳（メタデータ） (2023-10-10T20:05:13Z)
Value Kaleidoscope: Engaging AI with Pluralistic Human Values, Rights, and Duties [68.66719970507273]
価値多元性とは、複数の正しい値が互いに緊張して保持されるという考え方である。統計的学習者として、AIシステムはデフォルトで平均に適合する。 ValuePrismは、218kの値、権利、義務の大規模なデータセットで、31kの人間が記述した状況に関連付けられています。
論文参考訳（メタデータ） (2023-09-02T01:24:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。