Fugu-MT 論文翻訳(概要): LLMs grasp morality in concept

論文の概要: LLMs grasp morality in concept

arxiv url: http://arxiv.org/abs/2311.02294v1
Date: Sat, 4 Nov 2023 01:37:41 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-07 18:18:50.004077
Title: LLMs grasp morality in concept
Title（参考訳）: LLMは概念の道徳を理解する
Authors: Mark Pock, Andre Ye, Jared Moore
Abstract要約: 我々は人間を超えて広がる意味の一般的な理論を提供する。我々は,LLMが意味エージェントとしての地位から,すでに人間の社会の構造を把握していることを示唆している。不整合モデルは、道徳的および社会的哲学をより良く発展させるのに役立つかもしれない。
参考スコア（独自算出の注目度）: 0.46040036610482665
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Work in AI ethics and fairness has made much progress in regulating LLMs to reflect certain values, such as fairness, truth, and diversity. However, it has taken the problem of how LLMs might 'mean' anything at all for granted. Without addressing this, it is not clear what imbuing LLMs with such values even means. In response, we provide a general theory of meaning that extends beyond humans. We use this theory to explicate the precise nature of LLMs as meaning-agents. We suggest that the LLM, by virtue of its position as a meaning-agent, already grasps the constructions of human society (e.g. morality, gender, and race) in concept. Consequently, under certain ethical frameworks, currently popular methods for model alignment are limited at best and counterproductive at worst. Moreover, unaligned models may help us better develop our moral and social philosophy.
Abstract（参考訳）: AI倫理と公正に関する作業は、公正さ、真実、多様性といった特定の価値を反映するLLMの規制に大きな進歩をもたらした。しかし、LLMがどんなものでも「意味」するかどうかという問題は当然ある。これに対処しない限り、そのような値で LLM を印字する意味は明確ではない。これに対し、私たちは人間を超えて広がる意味の一般的な理論を提供します。我々はこの理論を用いて、LLMの正確な性質を意味エージェントとして説明する。我々は, LLMが意味エージェントとしての立場から, 人間の社会の構成(道徳, 性別, 人種など)を概念的に把握していることを提案する。その結果、ある倫理的枠組みの下では、モデルアライメントの一般的な手法は、ベストに制限され、最悪に反生産的である。さらに、整合性のないモデルは、道徳的および社会的哲学をより良く発展させるのに役立つかもしれない。

関連論文リスト

WALL-E 2.0: World Alignment by NeuroSymbolic Learning improves World Model-based LLM Agents [55.64361927346957]
本研究では,大規模言語モデル(LLM)を補完する環境の記号的知識を学習する「世界アライメント」を提案する。また、モデル予測制御フレームワークを用いて、RLフリーでモデルベースエージェント「WALL-E 2.0」を提案する。 WALL-E 2.0は、火星(Minecraftのような)とALFWorld(emboded indoor environment)のオープンワールド課題における既存の手法を著しく上回っている
論文参考訳（メタデータ） (2025-04-22T10:58:27Z)
The Greatest Good Benchmark: Measuring LLMs' Alignment with Utilitarian Moral Dilemmas [0.3386560551295745]
実用性ジレンマを用いてLLMの道徳的判断を評価する。我々の分析は、確立した道徳理論から分岐し、人口道徳基準を定めている道徳的嗜好を一貫してコード化している。
論文参考訳（メタデータ） (2025-03-25T12:29:53Z)
Bayesian Teaching Enables Probabilistic Reasoning in Large Language Models [50.16340812031201]
我々は,大規模言語モデル (LLM) がベイジアンフレームワークから期待されているように,その信念を更新しないことを示す。我々は、最適ベイズモデルの予測を模倣するように訓練することで、ベイズ的な推論をLLMに教える。
論文参考訳（メタデータ） (2025-03-21T20:13:04Z)
Large Language Models Reflect the Ideology of their Creators [73.25935570218375]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。異なるLLMや言語にまたがるイデオロギー的姿勢の顕著な多様性を明らかにする。
論文参考訳（メタデータ） (2024-10-24T04:02:30Z)
WALL-E: World Alignment by Rule Learning Improves World Model-based LLM Agents [55.64361927346957]
大規模言語モデル(LLM)による規則の勾配なし学習のためのニューロシンボリックアプローチを提案する。我々のLLMエージェントWALL-Eはモデル予測制御(MPC)上に構築されている MinecraftとALFWorldにおけるオープンワールドの課題について、WALL-Eは既存の方法よりも高い成功率を達成する。
論文参考訳（メタデータ） (2024-10-09T23:37:36Z)
GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations [87.99872683336395]
大規模言語モデル(LLM)は、重要な現実世界のアプリケーションに統合される。本稿では,LLMの競合環境における推論能力について検討する。まず,広く認識されている10のタスクを構成する言語駆動型環境であるGTBenchを提案する。
論文参考訳（メタデータ） (2024-02-19T18:23:36Z)
"Understanding AI": Semantic Grounding in Large Language Models [0.0]
LLMを含む生成モデルが自己教師型学習の鍵となるため、私たちは最近、AIの世代的転換を目撃しました。セマンティック・グラウンディングの課題を評価するために,5つの方法論を区別し,議論する。
論文参考訳（メタデータ） (2024-02-16T14:23:55Z)
Are Language Models More Like Libraries or Like Librarians? Bibliotechnism, the Novel Reference Problem, and the Attitudes of LLMs [12.568491518122622]
ビブリオテクニズムは, LLMが新たな参照を生み出す事例から, 独立した課題に直面している。心の哲学における解釈主義によれば、システムがそのような態度を持つのは、その振る舞いがそれが可能であるという仮説によって十分に説明されている場合に限る。しかし、我々は、解釈主義は態度を持つ非常に単純な生き物と互換性があり、これらの態度を前提とする見解には意識、知覚、知性が必要であると強調する。
論文参考訳（メタデータ） (2024-01-10T00:05:45Z)
The ART of LLM Refinement: Ask, Refine, and Trust [85.75059530612882]
ART: Ask, Refine, and Trust と呼ばれる改良目標を用いた推論を提案する。 LLMがいつその出力を洗練すべきかを決めるために必要な質問を尋ねる。自己補充ベースラインよりも+5ポイントの性能向上を達成する。
論文参考訳（メタデータ） (2023-11-14T07:26:32Z)
Large Language Models: The Need for Nuance in Current Debates and a Pragmatic Perspective on Understanding [1.3654846342364308]
LLM(Large Language Models)は、文法的に正しい、流動的なテキストを生成する能力において、非並列である。本論文は,LLM能力の批判において再発する3点を批判的に評価する。 LLMにおける現実の理解と意図の問題に関する実践的な視点を概説する。
論文参考訳（メタデータ） (2023-10-30T15:51:04Z)
Moral Foundations of Large Language Models [6.6445242437134455]
道徳的基礎理論(MFT)は、人間の道徳的推論を5つの要素に分解する心理学的評価ツールである。大規模な言語モデル(LLM)は、インターネットから収集されたデータセットに基づいて訓練されるため、そのようなコーパスに存在するバイアスを反映する可能性がある。本稿では、MFTをレンズとして用いて、人気のあるLLMが特定の道徳的価値観に対して偏見を得たかどうかを分析する。
論文参考訳（メタデータ） (2023-10-23T20:05:37Z)
Heterogeneous Value Alignment Evaluation for Large Language Models [91.96728871418]
大規模言語モデル(LLM)は、その価値を人間のものと整合させることを重要視している。本研究では,LLMと不均一値の整合性を評価するため,不均一値アライメント評価(HVAE)システムを提案する。
論文参考訳（メタデータ） (2023-05-26T02:34:20Z)
Can Large Language Models Transform Computational Social Science? [79.62471267510963]
大規模言語モデル(LLM)は、(トレーニングデータなしで)ゼロショットで多くの言語処理タスクを実行することができるこの研究は、計算社会科学ツールとしてLLMを使用するためのロードマップを提供する。
論文参考訳（メタデータ） (2023-04-12T17:33:28Z)
Moral Mimicry: Large Language Models Produce Moral Rationalizations Tailored to Political Identity [0.0]
本研究は,アメリカの政治集団に付随する道徳的偏見を,大規模言語モデルが再現するかどうかを考察する。モラル・ファンデーションズ・セオリー(英語版)の道具を用いて、これらのLSMは確かに道徳的な模倣であることを示した。
論文参考訳（メタデータ） (2022-09-24T23:55:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。