Fugu-MT 論文翻訳(概要): Large language models cannot replace human participants because they cannot portray identity groups

論文の概要: Large language models cannot replace human participants because they cannot portray identity groups

arxiv url: http://arxiv.org/abs/2402.01908v1
Date: Fri, 2 Feb 2024 21:21:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-06 23:24:41.316029
Title: Large language models cannot replace human participants because they cannot portray identity groups
Title（参考訳）: 大きな言語モデルは、アイデンティティグループを描写できないため、人間の参加者を置き換えることができない
Authors: Angelina Wang and Jamie Morgenstern and John P. Dickerson
Abstract要約: 我々は,大きな言語モデル (LLM) は,人口集団の表現の誤りとフラット化の両方を負うと論じている。アイデンティティーがアイデンティティーを不可欠なものにする方法について、第3の考察について論じる。全体としては、LLMが課題に関連のある人物を置き換えることを意図したユースケースに注意を喚起する。
参考スコア（独自算出の注目度）: 40.865099955752825
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) are increasing in capability and popularity, propelling their application in new domains -- including as replacements for human participants in computational social science, user testing, annotation tasks, and more. Traditionally, in all of these settings survey distributors are careful to find representative samples of the human population to ensure the validity of their results and understand potential demographic differences. This means in order to be a suitable replacement, LLMs will need to be able to capture the influence of positionality (i.e., relevance of social identities like gender and race). However, we show that there are two inherent limitations in the way current LLMs are trained that prevent this. We argue analytically for why LLMs are doomed to both misportray and flatten the representations of demographic groups, then empirically show this to be true on 4 LLMs through a series of human studies with 3200 participants across 16 demographic identities. We also discuss a third consideration about how identity prompts can essentialize identities. Throughout, we connect each of these limitations to a pernicious history that shows why each is harmful for marginalized demographic groups. Overall, we urge caution in use cases where LLMs are intended to replace human participants whose identities are relevant to the task at hand. At the same time, in cases where the goal is to supplement rather than replace (e.g., pilot studies), we provide empirically-better inference-time techniques to reduce, but not remove, these harms.
Abstract（参考訳）: 大規模言語モデル(llm)は、能力と人気が高まっており、計算社会科学における人間の参加者の代替、ユーザテスト、アノテーションタスクなど、新たなドメインでアプリケーションを推進している。伝統的に、これらすべてのセッティング調査では、人為的なサンプルを見つけ、結果の妥当性を確認し、潜在的な人口統計差を理解するために注意が必要である。このことは、適切な代替となるためには、LLMは位置性(性別や人種などの社会的アイデンティティの関連性)の影響を捉える必要があることを意味する。しかしながら、現在のllmのトレーニング方法には、2つの固有の制限があることを示します。我々は、LLMが人口集団の表現を不適切なものにし、フラットにする理由を分析的に論じ、それを16の人口集団の3200人の参加者による一連の研究を通して4つのLLMで実証的に示す。また、アイデンティティープロンプトがアイデンティティーを不可欠なものにする方法についても論じる。全体として、これらの制限を、それぞれがマージン化された人口集団に有害な理由を示す有害な歴史に結びつけています。全体としては、LLMが課題に関連のある人物を置き換えることを意図したユースケースに注意を喚起する。同時に、その目的が置き換えるよりも補うことにある場合(例えばパイロットスタディ)、我々は経験的にベターな推論時間技術を提供して、削減するが取り除くことはない。

関連論文リスト

The Prompt Makes the Person(a): A Systematic Evaluation of Sociodemographic Persona Prompting for Large Language Models [3.2919397230854983]
我々は、異なるペルソナがいかに大きな言語モデルに影響を及ぼすかを示す。以上の結果から, LLMは非二項性, ヒスパニック性, 中東性などの辺縁化集団のシミュレートに苦慮していることが明らかとなった。具体的には、インタビュースタイルのフォーマットと名前ベースのプライミングのプロンプトは、ステレオタイピングを減らし、アライメントを改善するのに役立ちます。
論文参考訳（メタデータ） (2025-07-21T21:23:29Z)
Arbiters of Ambivalence: Challenges of Using LLMs in No-Consensus Tasks [52.098988739649705]
本研究では, LLMのバイアスと限界について, 応答生成器, 判定器, 討論器の3つの役割について検討した。我々は、様々な先行的曖昧なシナリオを含む例をキュレートすることで、合意なしのベンチマークを開発する。以上の結果から, LLMは, オープンエンドの回答を生成する際に, 曖昧な評価を行うことができる一方で, 審査員や討論者として採用する場合は, 合意なしのトピックにスタンスを取る傾向が示唆された。
論文参考訳（メタデータ） (2025-05-28T01:31:54Z)
A Tale of Two Identities: An Ethical Audit of Human and AI-Crafted Personas [7.3656495945307086]
大規模言語モデル (LLMs) はデータ制限領域における合成ペルソナの生成にますます利用されている。本稿では,3つのLSMが生成する合成ペルソナを表現的害のレンズを通して評価し,特に人種的アイデンティティに着目した。以上の結果から, LLMは, 人種的マーカーに偏り, 文化的にコード化された言語を過剰に生成し, 構文的に精巧だが物語的に還元的なペルソナを構築できることが判明した。これらのパターンは、ステレオタイピング、エキゾチック、消去、好ましくない偏見など、様々な社会技術的害をもたらす。
論文参考訳（メタデータ） (2025-05-07T20:12:48Z)
Persuasion at Play: Understanding Misinformation Dynamics in Demographic-Aware Human-LLM Interactions [27.38030183605309]
大規模言語モデル(LLM)は、大規模に説得的コンテンツを生成し、既存のバイアスを強化する。本研究では,LLMと人間間の双方向的説得動態について,誤表現内容に曝露した場合に検討する。以上の結果から, LLMの誤情報に対する感受性には, 人口統計学的要因が影響していることが示唆された。
論文参考訳（メタデータ） (2025-03-03T20:30:22Z)
Persuasion with Large Language Models: a Survey [49.86930318312291]
大規模言語モデル (LLM) は説得力のあるコミュニケーションに新たな破壊的可能性を生み出している。政治、マーケティング、公衆衛生、電子商取引、慈善事業などの分野では、LLMシステムズは既に人間レベルや超人的説得力を達成している。 LLMをベースとした説得の現在と将来の可能性は、倫理的・社会的リスクを著しく引き起こす可能性が示唆された。
論文参考訳（メタデータ） (2024-11-11T10:05:52Z)
Large Language Models Reflect the Ideology of their Creators [73.25935570218375]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。異なるLLMや言語にまたがるイデオロギー的姿勢の顕著な多様性を明らかにする。
論文参考訳（メタデータ） (2024-10-24T04:02:30Z)
Hate Personified: Investigating the role of LLMs in content moderation [64.26243779985393]
ヘイト検出などの主観的タスクでは,人々が嫌悪感を知覚する場合には,多様なグループを表現できるLarge Language Model(LLM)の能力は不明確である。追加の文脈をプロンプトに含めることで、LLMの地理的プライミングに対する感受性、ペルソナ属性、数値情報を分析し、様々なグループのニーズがどの程度反映されているかを評価する。
論文参考訳（メタデータ） (2024-10-03T16:43:17Z)
How Are LLMs Mitigating Stereotyping Harms? Learning from Search Engine Studies [0.0]
商業モデル開発は、社会的影響評価を犠牲にして、法的負債に関する「安全」の訓練に重点を置いている。これは、数年前に検索エンジンのオートコンプリートを観測できる同様の傾向を模倣している。 LLMにおけるステレオタイピングを評価するために,オートコンプリート方式の新たな評価課題を提案する。
論文参考訳（メタデータ） (2024-07-16T14:04:35Z)
Modeling Human Subjectivity in LLMs Using Explicit and Implicit Human Factors in Personas [14.650234624251716]
大規模言語モデル (LLMs) は、人間中心の社会科学タスクでますます使われている。これらのタスクは非常に主観的であり、環境、態度、信念、生きた経験など人間的要因に依存している。我々は,LLMを人間的なペルソナで促進する役割について検討し,モデルに特定の人間であるかのように答えるよう求めた。
論文参考訳（メタデータ） (2024-06-20T16:24:07Z)
Limits of Large Language Models in Debating Humans [0.0]
大きな言語モデル(LLM)は、人間と熟達して対話する能力において顕著な可能性を示してきた。本論文は,LLMエージェントを現実の人間と組み合わせた事前登録研究により,現在のLLMの限界を検証しようとする試みである。
論文参考訳（メタデータ） (2024-02-06T03:24:27Z)
How should the advent of large language models affect the practice of science? [51.62881233954798]
大規模言語モデルの出現は科学の実践にどのように影響を与えるべきか? 我々は4つの科学者グループを招待し、この質問を反映し、彼らの見解を共有し、議論をおこなった。
論文参考訳（メタデータ） (2023-12-05T10:45:12Z)
Sociodemographic Prompting is Not Yet an Effective Approach for Simulating Subjective Judgments with LLMs [13.744746481528711]
大規模言語モデル(LLM)は、様々な文脈で人間の反応をシミュレートするために広く使われている。我々は,2つの主観的判断課題(丁寧さと攻撃性)において,人口差を理解する能力について,9つの人気のLCMを評価した。ゼロショット設定では、両方のタスクのほとんどのモデルの予測は、アジアやブラックの参加者よりもホワイトの参加者のラベルとより密接に一致している。
論文参考訳（メタデータ） (2023-11-16T10:02:24Z)
On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-08T19:01:13Z)
Do LLMs exhibit human-like response biases? A case study in survey design [66.1850490474361]
大規模言語モデル(LLM)が人間の反応バイアスをどの程度反映しているかについて検討する。アンケート調査では, LLMが人間のような応答バイアスを示すかどうかを評価するためのデータセットとフレームワークを設計した。 9つのモデルに対する総合的な評価は、一般のオープンかつ商用のLCMは、一般的に人間のような振る舞いを反映しないことを示している。
論文参考訳（メタデータ） (2023-11-07T15:40:43Z)
Queer People are People First: Deconstructing Sexual Identity Stereotypes in Large Language Models [3.974379576408554]
大規模言語モデル(LLM)は、主に最小処理のWebテキストに基づいて訓練される。 LLMはLGBTQIA+コミュニティのような、疎外されたグループに対して必然的にステレオタイプを永続させることができる。
論文参考訳（メタデータ） (2023-06-30T19:39:01Z)
Marked Personas: Using Natural Language Prompts to Measure Stereotypes in Language Models [33.157279170602784]
大規模言語モデル(LLM)におけるステレオタイプを測定するプロンプトベースの手法であるMarked Personasを提案する。 GPT-3.5 と GPT-4 が生成する描写は、同じプロンプトを用いた人間による描写よりも、人種的ステレオタイプの割合が高いことが判明した。交叉レンズは、トロピズムやマイノリティ化された女性のセクシュアル化など、疎遠化されたグループの描写を支配しているトロープを露呈する。
論文参考訳（メタデータ） (2023-05-29T16:29:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。