論文の概要: "Yeah Right!" -- Do LLMs Exhibit Multimodal Feature Transfer?
- arxiv url: http://arxiv.org/abs/2501.04138v1
- Date: Tue, 07 Jan 2025 20:57:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-09 14:56:16.833721
- Title: "Yeah Right!" -- Do LLMs Exhibit Multimodal Feature Transfer?
- Title(参考訳): 「はーい!」―LLMはマルチモーダル・フィーチャー・トランスファーを禁止しているのか?
- Authors: Benjamin Reichman, Kartik Talamadupula,
- Abstract要約: 本研究では,人間同士の会話に特化して訓練された音声+テキストモデルとテキストモデルを用いて,このスキルを伝達する能力を評価する。
具体的には,これらのモデルを用いて,隠蔽型偽装コミュニケーションを検知する能力について検証する。
- 参考スコア(独自算出の注目度): 7.380268236646204
- License:
- Abstract: Human communication is a multifaceted and multimodal skill. Communication requires an understanding of both the surface-level textual content and the connotative intent of a piece of communication. In humans, learning to go beyond the surface level starts by learning communicative intent in speech. Once humans acquire these skills in spoken communication, they transfer those skills to written communication. In this paper, we assess the ability of speech+text models and text models trained with special emphasis on human-to-human conversations to make this multimodal transfer of skill. We specifically test these models on their ability to detect covert deceptive communication. We find that with no special prompting speech+text LLMs have an advantage over unimodal LLMs in performing this task. Likewise, we find that human-to-human conversation-trained LLMs are also advantaged in this skill.
- Abstract(参考訳): ヒューマンコミュニケーションは多面的かつマルチモーダルなスキルである。
コミュニケーションには、表面レベルのテキストの内容と、コミュニケーションの意図の両方を理解する必要がある。
人間では、表面レベルを超えて進むことを学ぶことは、音声におけるコミュニケーション意図を学ぶことから始まる。
人間がこれらのスキルを音声通信で取得すると、それらのスキルは手書きのコミュニケーションに転送される。
本稿では,人対人会話に特化して訓練された音声+テキストモデルとテキストモデルを用いて,このマルチモーダルなスキル伝達能力を評価する。
具体的には,これらのモデルを用いて,隠蔽型偽装コミュニケーションを検知する能力について検証する。
音声とテキストのLLMが特別なプロンプトを伴わない場合、この処理を行う際には、一助的LLMよりも有利であることがわかった。
同様に、人間同士の会話を学習するLLMも、この技術に活用されている。
関連論文リスト
- Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model [5.505013339790826]
本稿では,多様な社会的文脈を基盤とした,ミンドのスキル・オブ・アノテートされた会話データセットを提案する。
モデルサイズは1B, 3B, 8B である。
広範な実験により、これらのモデルはミルドのスキル・オブ・ミンド・プロセスの実証に成功し、強力な一般化性を示す。
論文 参考訳(メタデータ) (2024-11-07T07:46:06Z) - Trying to be human: Linguistic traces of stochastic empathy in language models [0.2638512174804417]
大規模言語モデル(LLM)は、コンピュータ生成コンテンツの質向上を支える重要な要因である。
私たちの研究は、2つの重要な要因が人間とAIの人種にどのように貢献するかをテストする。
論文 参考訳(メタデータ) (2024-10-02T15:46:40Z) - Rel-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance [73.19687314438133]
インタラクションの文脈的特徴が依存に与える影響について検討する。
文脈特性が人間の信頼行動に大きく影響していることが判明した。
これらの結果から,キャリブレーションと言語品質だけでは人間とLMの相互作用のリスクを評価するには不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-07-10T18:00:05Z) - Think Before You Speak: Cultivating Communication Skills of Large Language Models via Inner Monologue [73.69510478736483]
大規模言語モデル(LLM)は、流動的で一貫性があり多様な応答を生成する。
しかし、それらは重要な能力、コミュニケーションスキルを欠いている。
本稿は,内的モノローグによるLLMのコミュニケーション能力向上を目的としている。
実験の結果,提案したCSIM戦略はバックボーンモデルを改善し,ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-11-13T16:19:42Z) - BotChat: Evaluating LLMs' Capabilities of Having Multi-Turn Dialogues [72.65163468440434]
本報告では,人間型マルチターンチャットのための既存大規模言語モデルの予備的評価を行う。
そこで我々は,ChatSEEDに基づくマルチターン対話を発話によって生成する大規模言語モデル(LLM)を提案する。
GPT-4は優れた品質の人型多元対話を生成できるが、その性能は著しく上回っている。
論文 参考訳(メタデータ) (2023-10-20T16:53:51Z) - Let Models Speak Ciphers: Multiagent Debate through Embeddings [84.20336971784495]
この問題を解決するためにCIPHER(Communicative Inter-Model Protocol Through Embedding Representation)を導入する。
自然言語から逸脱することで、CIPHERはモデルの重みを変更することなく、より広い範囲の情報を符号化する利点を提供する。
このことは、LLM間の通信における代替の"言語"としての埋め込みの優越性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-10-10T03:06:38Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。