論文の概要: Investigating social alignment via mirroring in a system of interacting language models
- arxiv url: http://arxiv.org/abs/2412.06834v2
- Date: Sat, 15 Feb 2025 23:16:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:06:59.517783
- Title: Investigating social alignment via mirroring in a system of interacting language models
- Title(参考訳): 対話型言語モデルにおけるミラーリングによる社会的アライメントの検討
- Authors: Harvey McGuinness, Tianyu Wang, Carey E. Priebe, Hayden Helm,
- Abstract要約: マルチエージェントシステムにおけるミラーリングがアライメントに及ぼす影響について検討する。
このフレームワークで大規模言語モデルと対話するシステムをシミュレートする。
システム行動は各エージェントの通信範囲に強く影響されている。
- 参考スコア(独自算出の注目度): 16.304359423423648
- License:
- Abstract: Alignment is a social phenomenon wherein individuals share a common goal or perspective. Mirroring, or mimicking the behaviors and opinions of another individual, is one mechanism by which individuals can become aligned. Large scale investigations of the effect of mirroring on alignment have been limited due to the scalability of traditional experimental designs in sociology. In this paper, we introduce a simple computational framework that enables studying the effect of mirroring behavior on alignment in multi-agent systems. We simulate systems of interacting large language models in this framework and characterize overall system behavior and alignment with quantitative measures of agent dynamics. We find that system behavior is strongly influenced by the range of communication of each agent and that these effects are exacerbated by increased rates of mirroring. We discuss the observed simulated system behavior in the context of known human social dynamics.
- Abstract(参考訳): アライメント(Alignment)は、個人が共通の目標や視点を共有する社会現象である。
ミラーリング(英: Mirroring, or mimicing the behaviors and opinion of another individual)は、個人が協調できるメカニズムである。
社会学における従来の実験設計のスケーラビリティのため、ミラーリングがアライメントに与える影響に関する大規模な研究は限られている。
本稿では,マルチエージェントシステムにおけるミラーリング動作がアライメントに与える影響を研究するための簡単な計算フレームワークを提案する。
我々は,このフレームワークで大規模言語モデルと対話するシステムをシミュレートし,システム全体の挙動とエージェントダイナミクスの定量的尺度との整合性を特徴付ける。
システム行動は,各エージェントの通信範囲に強く影響され,ミラーリングの速度の増大により,これらの効果が悪化することが判明した。
我々は、既知の人間の社会力学の文脈で観察されたシミュレートされたシステムの挙動について論じる。
関連論文リスト
- Exploring the Impact of Reflexivity Theory and Cognitive Social Structures on the Dynamics of Doctor-Patient Social System [0.0]
医師-患者システムのための2つの異なるモデルを作成します。
1つは確立された仮定を維持し、もう1つは反射論と認知社会構造の理論を取り入れている。
両モデルにおける医師および患者エージェントの挙動を最適化するために,微生物遺伝アルゴリズムを用いた。
論文 参考訳(メタデータ) (2024-11-08T23:23:13Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Behavior-Inspired Neural Networks for Relational Inference [3.7219180084857473]
最近の研究は、エージェント間の関係を、その身体行動の観察に基づいて分類することを学ぶ。
エージェントの観測可能な振る舞いと,その動作を決定する潜在カテゴリの抽象化レベルを導入する。
エージェントの身体的近さと嗜好を非線形意見力学モデルに統合し、相互排他的潜在カテゴリを特定し、エージェントの時間的進化を予測し、エージェントの身体的挙動を制御するメカニズムを提供する。
論文 参考訳(メタデータ) (2024-06-20T21:36:54Z) - SocialCircle: Learning the Angle-based Social Interaction Representation for Pedestrian Trajectory Prediction [19.075215661355486]
我々は,ソーシャルインタラクションのコンテキストを継続的に反映する,新しいアングルベースのトレーニング可能なソーシャルインタラクション表現であるSocialCircleを構築した。
提案するSocialCircleの効果を,新たにリリースされたトラジェクトリ予測モデルとともにトレーニングすることで検証する。
実験によると、SocialCircleは予測性能を定量的に改善するだけでなく、質的にも社会的相互作用をシミュレートするのに役立つ。
論文 参考訳(メタデータ) (2023-10-09T02:59:21Z) - Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View [60.80731090755224]
本稿では,理論的洞察を用いた実用実験により,現代NLPシステム間の協調機構を解明する。
我々は, LLMエージェントからなる4つの独特な社会をつくり, それぞれのエージェントは, 特定の特性(容易性, 過信性)によって特徴づけられ, 異なる思考パターン(議論, ふりかえり)と協調する。
以上の結果から, LLMエージェントは, 社会心理学理論を反映した, 適合性やコンセンサスリーディングといった人間的な社会的行動を示すことが明らかとなった。
論文 参考訳(メタデータ) (2023-10-03T15:05:52Z) - Training Socially Aligned Language Models on Simulated Social
Interactions [99.39979111807388]
AIシステムにおける社会的アライメントは、確立された社会的価値に応じてこれらのモデルが振舞うことを保証することを目的としている。
現在の言語モデル(LM)は、トレーニングコーパスを独立して厳格に複製するように訓練されている。
本研究は,シミュレートされた社会的相互作用からLMを学習することのできる,新しい学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:17:36Z) - Attacks in Adversarial Machine Learning: A Systematic Survey from the
Life-cycle Perspective [69.25513235556635]
敵対的機械学習(英: Adversarial Machine Learning、AML)は、機械学習の逆行現象を研究する。
機械学習システムの異なる段階で発生するこの敵対現象を探求するために、いくつかのパラダイムが最近開発された。
既存の攻撃パラダイムをカバーするための統一的な数学的枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-19T02:12:21Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Models we Can Trust: Toward a Systematic Discipline of (Agent-Based)
Model Interpretation and Validation [0.0]
我々は、モデルから情報を取り出すための相互作用の分野の開発を提唱する。
このような分野の発展に向けたいくつかの方向性を概説する。
論文 参考訳(メタデータ) (2021-02-23T10:52:22Z) - Modelling Cooperation in Network Games with Spatio-Temporal Complexity [11.665246332943058]
複雑なグリッドワールドドメインにおける自己組織化協調の出現について検討する。
マルチエージェント深層強化学習を用いて,エージェント・ソサエティの多種多様なメカニズムをシミュレートした。
本手法は,人間および人工エージェントシステムにおける機構設計に影響を及ぼす。
論文 参考訳(メタデータ) (2021-02-13T12:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。