論文の概要: Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models
- arxiv url: http://arxiv.org/abs/2605.15365v1
- Date: Thu, 14 May 2026 19:45:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.075186
- Title: Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models
- Title(参考訳): 人間の語彙制約下での言語生産とリソース・レーショナルモデル
- Authors: Thomas Hikaru Clark, Sihan Chen, Laura Nicolae,
- Abstract要約: 可変語彙制限下での質問に対するヒトの反応について検討し,最も制限的な単語は250語に過ぎなかった。
逐次モンテカルロ推定法を大規模言語モデルと比較した。
本研究は,リソース・レーショナル認知,心理言語学,L2コミュニケーション,言語障害に対する結果とそれらの広範な意味について論じる。
- 参考スコア(独自算出の注目度): 6.407877420659298
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Communicating using only a limited vocabulary is a common but challenging cognitive phenomenon, requiring an ideal communicator to plan carefully to optimize for intelligibility while circumventing a constrained lexicon. In this work, we investigate how humans respond to a broad array of questions under variable vocabulary limitations, consisting of only 250 highly frequent words at the most restrictive. We provide theoretically motivated comparisons to greedy and globally optimal sampling algorithms using Sequential Monte Carlo inference with large language models. Humans generally resemble greedy sampling more than globally optimal sampling, though more skilled humans are more likely to backtrack and revise -- a non-greedy behavior. An observed human pattern of leaning on semantically light words in high-constraint settings falls out of both greedy and globally optimal sampling. We discuss the results and their broader implications for resource-rational cognition, psycholinguistics, L2 communication, and language impairments.
- Abstract(参考訳): 限られた語彙のみを用いたコミュニケーションは、一般的なが困難な認知現象であり、制約された語彙を回避しつつ、知性の最適化を慎重に計画する必要がある。
本研究では,変化語彙制限下での質問に対するヒトの反応について検討し,最も制限的な単語は250語に過ぎなかった。
我々は,大規模言語モデルを用いたSequential Monte Carlo推論を用いて,グリーディと大域的最適サンプリングアルゴリズムとの比較を行った。
人間は一般的に、地球規模の最適なサンプリング以上のグリージーサンプリングに似ているが、より熟練した人間は、非グリージーな振る舞いである、バックトラックと修正の可能性が高い。
高制約設定における意味的に軽い単語に傾く人間の観察パターンは、欲求と世界的最適サンプリングの両方から生じる。
本研究は,リソース・レーショナル認知,心理言語学,L2コミュニケーション,言語障害に対する結果とそれらの広範な意味について論じる。
関連論文リスト
- UNcommonsense Reasoning: Abductive Reasoning about Uncommon Situations [62.71847873326847]
異常、予期せぬ、そしてありそうもない状況をモデル化する能力について検討する。
予期せぬ結果のコンテキストが与えられた場合、このタスクは説明を生成するために故意に推論する必要がある。
私たちはUNcommonsenseという新しい英語コーパスをリリースします。
論文 参考訳(メタデータ) (2023-11-14T19:00:55Z) - Structured, flexible, and robust: benchmarking and improving large
language models towards more human-like behavior in out-of-distribution
reasoning tasks [39.39138995087475]
言語単独で統計的パターンを学習することで、どの程度の人間的な思考を捉えることができるのかを問う。
本ベンチマークは2つの問題解決領域(計画と説明生成)を含み,一般化を必要とするように設計されている。
このベンチマークでは、人間はLSMよりもはるかに堅牢であることが分かりました。
論文 参考訳(メタデータ) (2022-05-11T18:14:33Z) - Testing the limits of natural language models for predicting human
language judgments [0.27309692684728604]
諸言語モデルのモデルと人間の一貫性を、議論を呼んでいる文対を用いて比較した。
議論文ペアは、モデル失敗を明らかにするのに非常に効果的であることが証明された。
最も人間一貫性のあるモデルは GPT-2 であったが、実験では人間の知覚との整合性の重大な欠点も明らかにした。
論文 参考訳(メタデータ) (2022-04-07T17:12:57Z) - Locally Typical Sampling [84.62530743899025]
我々は、今日の確率的言語ジェネレータが、一貫性と流動性のあるテキストを生成する際に不足していることを示します。
本稿では,確率モデルから生成する際の,この基準を強制するための簡易かつ効率的な手順を提案する。
論文 参考訳(メタデータ) (2022-02-01T18:58:45Z) - Allocating Large Vocabulary Capacity for Cross-lingual Language Model
Pre-training [59.571632468137075]
最近の言語間言語モデルでは,語彙の容量が限られているため,多くの言語が不足していることがわかった。
本稿では,各言語の語彙能力を決定するアルゴリズムであるVoCapを提案する。
この問題に対処するために,k-NNに基づくターゲットサンプリングを提案し,コストの高いソフトマックスを高速化する。
論文 参考訳(メタデータ) (2021-09-15T14:04:16Z) - Neural Abstructions: Abstractions that Support Construction for Grounded
Language Learning [69.1137074774244]
言語の相互作用を効果的に活用するには、言語基底に対する2つの最も一般的なアプローチの制限に対処する必要がある。
本稿では,ラベル条件付き生成モデルの推論手順に対する制約のセットであるニューラル・アブストラクションの考え方を紹介する。
この手法により,マインクラフトにおけるオープンエンドハウスタスクのセマンティックな変更をユーザ人口が構築できることが示される。
論文 参考訳(メタデータ) (2021-07-20T07:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。