論文の概要: Success and Cost Elicit Convention Formation for Efficient Communication
- arxiv url: http://arxiv.org/abs/2510.24023v1
- Date: Tue, 28 Oct 2025 03:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.730771
- Title: Success and Cost Elicit Convention Formation for Efficient Communication
- Title(参考訳): 効率的なコミュニケーションのための成功とコスト削減
- Authors: Saujas Vaduguru, Yilun Hua, Yoav Artzi, Daniel Fried,
- Abstract要約: 本稿では,大規模なマルチモーダルモデルを訓練してコンベンションを形成する手法を提案する。
提案手法はモデル間の参照ゲームを用いており,人為的なデータを必要としない。
人間のリスナーは、コンベンションを形成するモデルと対話する際に、より速く反応します。
- 参考スコア(独自算出の注目度): 37.346772283057554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans leverage shared conversational context to become increasingly successful and efficient at communicating over time. One manifestation of this is the formation of ad hoc linguistic conventions, which allow people to coordinate on short, less costly utterances that are understood using shared conversational context. We present a method to train large multimodal models to form conventions, enabling efficient communication. Our approach uses simulated reference games between models, and requires no additional human-produced data. In repeated reference games involving photographs and tangram images, our method enables models to communicate efficiently with people: reducing the message length by up to 41% while increasing success by 15% over the course of the interaction. Human listeners respond faster when interacting with our model that forms conventions. We also show that training based on success or cost alone is insufficient - both are necessary to elicit convention formation.
- Abstract(参考訳): 人間は会話のコンテキストを共有化して、コミュニケーションの時間とともにますます成功し、効率的になる。
このことの1つがアドホックな言語慣習の形成であり、これは人々が会話のコンテキストを共有することで理解される短い、よりコストのかかる発話を調整できるようにするものである。
本稿では,大規模なマルチモーダルモデルを訓練してコンベンションを形成する手法を提案する。
提案手法はモデル間の参照ゲームを用いており,人為的なデータを必要としない。
写真やタングラム画像を含む繰り返し参照ゲームにおいて,本手法は,対話の過程で成功率を15%増加させながら,メッセージ長を最大41%削減するモデルを実現する。
人間のリスナーは、コンベンションを形成するモデルと対話する際に、より速く反応します。
また、成功やコストのみに基づくトレーニングが不十分であることも示しています。
関連論文リスト
- Chain-of-Thought Training for Open E2E Spoken Dialogue Systems [57.77235760292348]
エンド・ツー・エンド(E2E)音声対話システムは完全な識別性を保ち、非音声情報をキャプチャする。
我々は,多モーダル言語モデルと密接に一致した会話データによる学習を確実にするためのチェーン・オブ・シント(CoT)の定式化を提案する。
提案手法はベースラインよりも1.5ROUGE-1の改善を実現し,一般公開された人間と人間の会話データセット上で音声対話システムの訓練に成功している。
論文 参考訳(メタデータ) (2025-05-31T21:43:37Z) - Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models [49.22720751953838]
本研究では,子どもの言語習得に触発された対話型環境で言語モデルを訓練する手法を提案する。
この設定では、話者は1ターンの対話でリスナーに何らかの情報を伝達しようと試み、コミュニケーションの成功が達成されれば報酬を受け取る。
論文 参考訳(メタデータ) (2025-05-09T11:48:36Z) - Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning [31.196865401472664]
自然言語の環境に関する生産的な議論を人間による実演なしで行うように、言語モデルを訓練する。
我々はエージェントの目標を利用して、コミュニケーションを誘導する高密度報酬信号として、世界の有用な情報を予測する。
我々は、容疑者の告発や証拠提供など、我々の技術による創発的行動を分析し、強力な議論を可能にすることを発見した。
論文 参考訳(メタデータ) (2025-02-09T22:44:45Z) - Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文 参考訳(メタデータ) (2023-05-24T14:06:27Z) - Sentence Level Curriculum Learning for Improved Neural Conversational
Models [0.0]
我々は、人間と会話するための機械知能の設計方法を研究する。
私たちのゴールは、各セグメントのコーパスが長い文対で構成されているように、トレーニングをセグメントに分けることです。
これは、人間の学習の望ましい"ビルドアップ"コンポーネントを模倣します。
論文 参考訳(メタデータ) (2023-05-15T17:28:59Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。