Fugu-MT 論文翻訳(概要): BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM

論文の概要: BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM

arxiv url: http://arxiv.org/abs/2406.11418v1
Date: Mon, 17 Jun 2024 11:08:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-18 15:11:33.152106
Title: BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM
Title（参考訳）: BAMBINO-LM:(バイリンガル-)Human-Inspired Continual Pretraining of BabyLM
Authors: Zhewen Shen, Aditya Joshi, Ruey-Cheng Chen,
Abstract要約: 本研究では,親イタリアモデルから誘導される交代とPPOに基づくパープレクシリティ報酬を組み合わせたBabyLMの継続事前学習戦略であるBAMBINO-LMを紹介する。我々のアブレーション分析は、この効果を得る上で、変更戦略とPPOに基づくモデリングの両方を活用することが重要であることを示している。副作用として, 提案手法は, 人間の子どもが同等の学習シナリオで持つようなL1の有効性の低下につながる。
参考スコア（独自算出の注目度）: 3.329407751651262
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Children from bilingual backgrounds benefit from interactions with parents and teachers to re-acquire their heritage language. In this paper, we investigate how this insight from behavioral study can be incorporated into the learning of small-scale language models. We introduce BAMBINO-LM, a continual pretraining strategy for BabyLM that uses a novel combination of alternation and PPO-based perplexity reward induced from a parent Italian model. Upon evaluation on zero-shot classification tasks for English and Italian, BAMBINO-LM improves the Italian language capability of a BabyLM baseline. Our ablation analysis demonstrates that employing both the alternation strategy and PPO-based modeling is key to this effectiveness gain. We also show that, as a side effect, the proposed method leads to similar degradation in L1 effectiveness as human children would have had in an equivalent learning scenario.
Abstract（参考訳）: バイリンガルの背景を持つ子供たちは、両親や教師との交流によって、彼らの遺産言語を再取得する恩恵を受ける。本稿では,この行動学習からの洞察を,小規模言語モデルの学習に組み込む方法について検討する。本研究では,親イタリアモデルから誘導される交代とPPOに基づくパープレクシリティ報酬を組み合わせたBabyLMの継続事前学習戦略であるBAMBINO-LMを紹介する。英語とイタリア語のゼロショット分類タスクを評価すると、BAMBINO-LMはBabyLMベースラインのイタリア語能力を向上させる。我々のアブレーション分析は、この効果を得る上で、変更戦略とPPOに基づくモデリングの両方を活用することが重要であることを示している。また, 副作用として, 提案手法は, 人間の子どもが同等の学習シナリオで持つようなL1の有効性の低下につながることを示した。

関連論文リスト

Reinforcement World Model Learning for LLM-based Agents [60.65003139516272]
強化世界モデル学習(Reinforcement World Model Learning, RWML)は、LDMをベースとしたエージェントのための行動教師付き世界モデルを学ぶ自己条件付き手法である。本手法は, モデルが生成したシミュレーションされた次の状態と, 環境から観測された次の状態とを一致させる。本手法をALFWorldと2ドルのBenchで評価し,完全に自己管理されているにもかかわらず,ベースモデルに対する大幅な利得を観測した。
論文参考訳（メタデータ） (2026-02-05T16:30:08Z)
PATS: Personality-Aware Teaching Strategies with Large Language Model Tutors [66.56586559631516]
大型言語モデル (LLM) は教育教師としての可能性を秘めている。しかし、異なる学習戦略は、異なる学生の個性に利益をもたらす。それにもかかわらず、現在のLLM教育システムは生徒の性格特性を考慮に入れていない。
論文参考訳（メタデータ） (2026-01-13T10:17:26Z)
LANPO: Bootstrapping Language and Numerical Feedback for Reinforcement Learning in LLMs [73.27182315028021]
LANPOは、フィードバックの役割をきれいに分離するフレームワークである。我々の研究は、歴史体験をLLM RLループに統合する堅牢な方法を提供し、より効果的でデータ効率のよい学習エージェントを作成します。
論文参考訳（メタデータ） (2025-10-18T15:51:19Z)
Talking with Oompa Loompas: A novel framework for evaluating linguistic acquisition of LLM agents [1.2802720336459552]
大規模言語モデルがパターン認識と対話的フィードバックによって言語を習得できるかどうかを評価する。以上の結果から, LLMエージェントは100応答以内の会話の確立に失敗した。その結果,インタラクティブなフィードバックからより効果的に学習する設計をモデル化するための評価ベンチマークとオープンパスの新たな方向性が示唆された。
論文参考訳（メタデータ） (2025-09-09T05:09:27Z)
BAMBI: Developing Baby Language Models for Italian [45.36413940519089]
本稿では,5歳児のイタリア語話者の言語入力を模倣したデータに基づいて学習したBAMBI(Baby Language Models Boostrapped for Italian)について述べる。 BAMBIモデルは、受信したモデルのトレーニング入力量を考慮して、言語モデルを評価するために特別に設計されたベンチマークを使用してテストされる。
論文参考訳（メタデータ） (2025-03-12T15:36:50Z)
Benchmarking LLMs for Mimicking Child-Caregiver Language in Interaction [4.109949110722246]
LLMは人間のような対話を生成できるが、初期の子どもと大人の交流をシミュレートする能力はほとんど解明されていない。現状のLSMは、単語と発話レベルにおいて、子どもと介護者の対話を近似することができるが、子どもと介護者の分散パターンの再現に苦慮し、アライメントを誇張し、人間によって示される多様性のレベルに到達できなかった。
論文参考訳（メタデータ） (2024-12-12T14:43:03Z)
The Rise and Down of Babel Tower: Investigating the Evolution Process of Multilingual Code Large Language Model [59.357993924917]
本研究では,大規模言語モデル(LLM)における事前学習過程における多言語機能の進化について検討する。本稿では,LLMが新たな言語能力を習得する過程全体を記述したBabel Tower仮説を提案する。本論文では,多言語コードLLMのための事前学習コーパスを最適化する新しい手法を提案する。
論文参考訳（メタデータ） (2024-12-10T08:28:57Z)
Improving Bilingual Capabilities of Language Models to Support Diverse Linguistic Practices in Education [3.799331337558008]
大規模言語モデル(LLM)は、教育コンテンツの生成、インストラクターのフィードバックの提供、アセスメントにおける教師の作業量の削減を約束する。本研究では,多言語大言語モデル(MLLM)がモノリンガル(英語のみ,スペイン語のみ)とバイリンガル(スパングリッシュ)にまたがって有効であることを示す。
論文参考訳（メタデータ） (2024-11-06T23:16:25Z)
Less is More: Pre-Training Cross-Lingual Small-Scale Language Models with Cognitively-Plausible Curriculum Learning Strategies [2.6684726101845]
よりきめ細かいカリキュラム学習戦略を特定するために言語習得理論を利用できるかを評価する。我々は、SSLMと取得インスパイアされたキュリキュラを言語横断的に実装するために、4つの言語家族のための年齢順コーパスを作成した。
論文参考訳（メタデータ） (2024-10-30T10:31:54Z)
Exploring Natural Language-Based Strategies for Efficient Number Learning in Children through Reinforcement Learning [0.0]
本稿では,強化学習(RL)の枠組みを用いて,子どもが数を学ぶ方法を検討する。最先端の強化学習モデルを用いて,様々な言語命令が数獲得に与える影響をシミュレートし,解析する。
論文参考訳（メタデータ） (2024-10-10T19:49:13Z)
MoE-CT: A Novel Approach For Large Language Models Training With Resistance To Catastrophic Forgetting [53.77590764277568]
ベースモデルの学習を多言語拡張プロセスから分離する新しいMoE-CTアーキテクチャを提案する。我々の設計では、元のLLMパラメータを凍結し、高リソース言語のパフォーマンスを保護しますが、様々な言語データセットに基づいてトレーニングされたMoEモジュールは、低リソース言語の習熟度を向上します。
論文参考訳（メタデータ） (2024-06-25T11:03:45Z)
CLIMB: Curriculum Learning for Infant-inspired Model Building [6.4766496232839685]
本稿では,BabyLM ChallengeのSTRICT-SMALLトラックへのチームの貢献について述べる。課題は、1000万ワードの比較的小さなトレーニングデータセットを使用して、言語モデルをゼロからトレーニングすることである。認知に動機づけられたカリキュラム学習の3つの変種を実験し,そのモデルの性能に及ぼす影響を解析した。
論文参考訳（メタデータ） (2023-11-15T11:48:16Z)
Computational Language Acquisition with Theory of Mind [84.2267302901888]
我々は、心の理論(ToM)を備えた言語学習エージェントを構築し、その学習過程への影響を測定する。重み付けされたToMリスナーコンポーネントを用いた学習話者は,画像参照ゲームの設定において,性能向上につながることがわかった。
論文参考訳（メタデータ） (2023-03-02T18:59:46Z)
LERT: A Linguistically-motivated Pre-trained Language Model [67.65651497173998]
本稿では,3種類の言語特徴を学習する事前学習型言語モデルLERTを提案する。我々は,中国における10のNLUタスクについて広範な実験を行い,LERTが大きな改善をもたらすことを示す実験結果を得た。
論文参考訳（メタデータ） (2022-11-10T05:09:16Z)
Towards Lifelong Learning of Multilingual Text-To-Speech Synthesis [87.75833205560406]
本研究は,多言語テキスト音声(TTS)システムを学習するための生涯学習手法を提案する。すべての言語からプールされたデータを必要としないため、ストレージと計算の負担が軽減される。
論文参考訳（メタデータ） (2021-10-09T07:00:38Z)
Word Acquisition in Neural Language Models [0.38073142980733]
ニューラルネットワークモデルは,学習中に個々の単語を習得し,学習曲線を抽出し,600以上の単語の獲得年齢を推定する。子どもや言語モデルでは, 具体性, 単語長, 語彙クラスの影響が顕著に異なることがわかった。
論文参考訳（メタデータ） (2021-10-05T23:26:16Z)
Mixed-Lingual Pre-training for Cross-lingual Summarization [54.4823498438831]
言語間の要約は、ソース言語の記事に対する対象言語の要約を作成することを目的としている。本稿では,翻訳のような言語間タスクと,マスク付き言語モデルのようなモノリンガルタスクの両方を活用する混合言語事前学習に基づくソリューションを提案する。本モデルでは,2.82(中国語)と1.15(中国語,英語)のROUGE-1スコアを最先端の結果に対して改善する。
論文参考訳（メタデータ） (2020-10-18T00:21:53Z)
Dynamic Data Selection and Weighting for Iterative Back-Translation [116.14378571769045]
本稿では,反復的バックトランスレーションモデルのためのカリキュラム学習戦略を提案する。我々は、ドメイン適応、低リソース、高リソースMT設定に関するモデルを評価する。実験の結果,提案手法は競争基準値よりも最大1.8 BLEU点の改善を達成できた。
論文参考訳（メタデータ） (2020-04-07T19:49:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。