論文の概要: Age Recommendation from Texts and Sentences for Children
- arxiv url: http://arxiv.org/abs/2308.10586v1
- Date: Mon, 21 Aug 2023 09:40:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 14:08:32.902066
- Title: Age Recommendation from Texts and Sentences for Children
- Title(参考訳): 児童用テキスト・文章からの年齢推薦
- Authors: Rashedur Rahman, Gw\'enol\'e Lecorv\'e, Nicolas B\'echet
- Abstract要約: 本稿では, 年齢推薦課題の最近の進歩について述べる。
我々は、年齢推薦を回帰タスクとみなし、最先端の機械学習モデル、すなわちトランスフォーマーの使用について検討する。
結果も専門家による推薦と比較した。
- 参考スコア(独自算出の注目度): 0.09208007322096533
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Children have less text understanding capability than adults. Moreover, this
capability differs among the children of different ages. Hence, automatically
predicting a recommended age based on texts or sentences would be a great
benefit to propose adequate texts to children and to help authors writing in
the most appropriate way. This paper presents our recent advances on the age
recommendation task. We consider age recommendation as a regression task, and
discuss the need for appropriate evaluation metrics, study the use of
state-of-the-art machine learning model, namely Transformers, and compare it to
different models coming from the literature. Our results are also compared with
recommendations made by experts. Further, this paper deals with preliminary
explainability of the age prediction model by analyzing various linguistic
features. We conduct the experiments on a dataset of 3, 673 French texts (132K
sentences, 2.5M words). To recommend age at the text level and sentence level,
our best models achieve MAE scores of 0.98 and 1.83 respectively on the test
set. Also, compared to the recommendations made by experts, our sentence-level
recommendation model gets a similar score to the experts, while the text-level
recommendation model outperforms the experts by an MAE score of 1.48.
- Abstract(参考訳): 子供は大人より文章の理解能力が低い。
また、この能力は年齢の異なる子供によって異なる。
したがって、テキストや文章に基づいて推奨年齢を自動的に予測することは、子供に適切なテキストを提案し、著者が最も適切な方法で書くのを助ける大きな利点となる。
本稿では,年齢推薦課題の最近の進歩について述べる。
年齢の推薦を回帰課題として検討し,適切な評価指標の必要性,最先端機械学習モデル,すなわちトランスフォーマーの利用について検討し,文献から得られた異なるモデルと比較する。
また,専門家による推奨結果と比較した。
さらに,様々な言語的特徴を解析し,年齢予測モデルの予備的説明可能性について論じる。
3,673のフランス語テキスト(132k文,2.5m単語)のデータセットで実験を行った。
テキストレベルと文レベルでの年齢を推奨するために、テストセットでそれぞれ0.98と1.83のMAEスコアを得る。
また, 専門家の推薦と比べ, 文章レベルの推薦モデルは専門家と同等のスコアを得る一方, テキストレベルの推薦モデルはMAEのスコア1.48で専門家を上回ります。
関連論文リスト
- KidLM: Advancing Language Models for Children -- Early Insights and Future Directions [7.839083566878183]
本研究では,子供用,時には子供用のコーパスを収集し,検証する,ユーザ中心のデータ収集パイプラインを提案する。
本研究では,ドメイン固有の児童言語データに基づいてマスキング確率を動的に調整する新たな学習目標であるStratified Maskingを提案する。
実験により,本モデルは下級テキストの理解に優れ,ステレオタイプを避けて安全性を維持し,子どもの独特な嗜好を捉えていることが示された。
論文 参考訳(メタデータ) (2024-10-04T19:35:44Z) - Fine-grained Controllable Text Generation through In-context Learning with Feedback [57.396980277089135]
本稿では,依存度などの非自明な言語的特徴の特定の値に一致させるために,入力文を書き換える手法を提案する。
従来の研究とは対照的に、本手法は微調整ではなく文脈内学習を用いており、データが少ないユースケースに適用できる。
論文 参考訳(メタデータ) (2024-06-17T08:55:48Z) - Automatic Annotation of Grammaticality in Child-Caregiver Conversations [7.493963534076502]
この研究は、子どもの言語習得を大規模に研究する上で、最先端のNLP手法の適用に関する文献の増大に寄与する。
本稿では,文脈依存型文法の符号化手法を提案し,大規模な会話コーパスから4,000以上の発話を注釈付けする。
以上の結果から,微調整トランスフォーマーを用いたモデルでは,人間間のアノテーション合意レベルを達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2024-03-21T08:00:05Z) - INSTRUCTSCORE: Explainable Text Generation Evaluation with Finegrained
Feedback [80.57617091714448]
テキスト生成のための説明可能な評価指標であるInstructScoreを提案する。
LLaMAに基づいてテキスト評価基準を微調整し、生成されたテキストのスコアと人間の可読性診断レポートを生成する。
論文 参考訳(メタデータ) (2023-05-23T17:27:22Z) - AI, write an essay for me: A large-scale comparison of human-written
versus ChatGPT-generated essays [66.36541161082856]
ChatGPTや同様の生成AIモデルは、何億人ものユーザーを惹きつけている。
本研究は,ChatGPTが生成した議論的学生エッセイと比較した。
論文 参考訳(メタデータ) (2023-04-24T12:58:28Z) - Exploring the Use of Large Language Models for Reference-Free Text
Quality Evaluation: An Empirical Study [63.27346930921658]
ChatGPTは、参照なしで様々な視点からテキスト品質を効果的に評価することができる。
ChatGPTを用いてテキスト品質を測定するExplicit Scoreは、3つの手法の中で最も効果的で信頼性の高い方法である。
論文 参考訳(メタデータ) (2023-04-03T05:29:58Z) - On the Limitations of Reference-Free Evaluations of Generated Text [64.81682222169113]
基準のないメトリクスは本質的にバイアスがあり、生成したテキストを評価する能力に制限があることを示す。
機械翻訳や要約といったタスクの進捗を計測するために使用するべきではない、と我々は主張する。
論文 参考訳(メタデータ) (2022-10-22T22:12:06Z) - How Adults Understand What Young Children Say [1.416276307599112]
子供の初期のスピーチは、形や内容において大人のスピーチとほとんど似ていないことが多いが、介護者は幼児の発話で意味を見出すことが多い。
早期コミュニケーションの成功は,子どもの言語知識の増大だけでなく,大人の高度な推論にも依存すると考えられる。
論文 参考訳(メタデータ) (2022-06-15T20:37:32Z) - Training Language Models with Natural Language Feedback [51.36137482891037]
3段階学習アルゴリズムを用いてモデル出力の言語フィードバックから学習する。
合成実験において、まず言語モデルがフィードバックを正確に組み込んで改良を行うかどうかを評価する。
人間の手書きフィードバックのサンプルは100程度しかなく, 学習アルゴリズムはGPT-3モデルを微調整し, ほぼ人間レベルの要約を行う。
論文 参考訳(メタデータ) (2022-04-29T15:06:58Z) - A Comparative Study of Feature Types for Age-Based Text Classification [3.867363075280544]
年齢によるフィクションテキストの分類作業における言語的特徴の多種多様性の比較を行った。
その結果,文書レベルでテキストを記述する特徴は,機械学習モデルの品質を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-09-24T18:41:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。