Fugu-MT 論文翻訳(概要): Free-text Rationale Generation under Readability Level Control

論文の概要: Free-text Rationale Generation under Readability Level Control

arxiv url: http://arxiv.org/abs/2407.01384v1
Date: Mon, 1 Jul 2024 15:34:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-03 21:00:48.344352
Title: Free-text Rationale Generation under Readability Level Control
Title（参考訳）: 可読性レベル制御による自由文ラジエーレ生成
Authors: Yi-Sheng Hsu, Nils Feldhus, Sherzod Hakimov,
Abstract要約: 本研究では,可読性レベル制御の影響下で,大規模言語モデル (LLM) が自然言語説明 (NLE) のタスクをどのように実行するかを検討する。説明書はそのような命令に適応するが、要求された可読性は、しばしば測定されたテキストの複雑さと一致しない。
参考スコア（独自算出の注目度）: 6.338124510580766
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Free-text rationales justify model decisions in natural language and thus become likable and accessible among approaches to explanation across many tasks. However, their effectiveness can be hindered by misinterpretation and hallucination. As a perturbation test, we investigate how large language models (LLMs) perform the task of natural language explanation (NLE) under the effects of readability level control, i.e., being prompted for a rationale targeting a specific expertise level, such as sixth grade or college. We find that explanations are adaptable to such instruction, but the requested readability is often misaligned with the measured text complexity according to traditional readability metrics. Furthermore, the quality assessment shows that LLMs' ratings of rationales across text complexity exhibit a similar pattern of preference as observed in natural language generation (NLG). Finally, our human evaluation suggests a generally satisfactory impression on rationales at all readability levels, with high-school-level readability being most commonly perceived and favored.
Abstract（参考訳）: 自由文理理性は自然言語におけるモデル決定を正当化し、多くのタスクをまたいだ説明のアプローチにおいて、自由でアクセスしやすいものとなる。しかし、その効果は誤解や幻覚によって妨げられる。摂動試験として,第6学年や大学など,特定の専門的レベルを対象とする理論的根拠を求めて,可読性レベル制御の影響下で,大規模言語モデル(LLM)が自然言語説明(NLE)のタスクをどのように実行するかを検討する。説明書はそのような命令に適応するが、要求される可読性は、従来の可読性指標に従って、測定されたテキストの複雑さと不一致であることが多い。さらに,LLMのテキスト複雑性に対する有理性評価は,自然言語生成(NLG)と類似した嗜好パターンを示す。最後に、人間の評価から、すべての可読性レベルにおける理性に対する概ね満足な印象が示唆され、高校レベルの可読性が最も認識され、好まれる。

関連論文リスト

Hierarchical Ranking Neural Network for Long Document Readability Assessment [2.160803573421694]
本稿では,テキスト中のリッチな意味情報を持つ領域を特定するために,コンテキスト情報をキャプチャする双方向可読性評価機構を提案する。これらの文レベルのラベルは、ドキュメントの全体的な可読性レベルを予測するのに使用される。ラベルサブトラクションによる可読性レベル間の順序関係をモデル化するために、ペアワイズソートアルゴリズムを導入する。
論文参考訳（メタデータ） (2025-11-26T15:05:22Z)
Towards Ontology-Based Descriptions of Conversations with Qualitatively-Defined Concepts [2.748993665644782]
この研究はオントロジーに基づくアプローチを提案し、通常は質的な会話の特徴を定性的に定義する。本稿では,CEFR言語習熟度を事例として,会話における習熟度制御の課題に適用する。実験結果から,提案手法は一貫性と説明可能な熟練度レベルの定義を提供し,対話型AIにおける透明性の向上を図っている。
論文参考訳（メタデータ） (2025-09-05T08:44:27Z)
A Controllable Examination for Long-Context Language Models [62.845852724511964]
本研究では,長文言語モデルを評価するベンチマークである$textbfLongBioBenchを紹介する。その結果,ほとんどのモデルでは,検索結果に対する意味的理解や基礎的推論が不足していることが判明した。我々のさらなる分析は、文脈的非コヒーレンスなど、既存の合成ベンチマークで採用されているいくつかの設計選択を示している。
論文参考訳（メタデータ） (2025-06-03T14:23:06Z)
AGENT-X: Adaptive Guideline-based Expert Network for Threshold-free AI-generated teXt detection [44.66668435489055]
Agent-Xは、AI生成テキスト検出のためのゼロショットマルチエージェントフレームワークである。我々は,検出ガイドラインを意味的,スタイリスティック,構造的次元に整理し,それぞれが専門的な言語エージェントによって独立に評価される。メタエージェントは、信頼を意識したアグリゲーションを通じてこれらのアセスメントを統合し、しきい値のない解釈可能な分類を可能にする。多様なデータセットの実験により、Agent-Xは精度、解釈可能性、一般化において最先端の教師付きおよびゼロショットアプローチを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2025-05-21T08:39:18Z)
Beyond One-Size-Fits-All Summarization: Customizing Summaries for Diverse Users [1.3812010983144802]
テキストデータの可読性を制御することは、異なるオーディエンスのための要約を作成する上で重要な要素である。私たちは独自のカスタムデータセットを作成し、カスタムアーキテクチャでモデルをトレーニングします。本手法は,精度とコヒーレンスを維持しつつ,可読性レベルを効果的に制御することを保証する。
論文参考訳（メタデータ） (2025-03-10T19:08:36Z)
Eye Tracking Based Cognitive Evaluation of Automatic Readability Assessment Measures [1.2062053320259833]
本稿では,視線追跡に基づく認知フレームワークを提案する。我々は,この枠組みを用いて,教育に広く用いられている2つのシステムを含む,幅広い可読性の評価を行う。分析の結果,既存の可読性尺度は読みやすさや読みやすさの予測因子に乏しいことが示唆された。
論文参考訳（メタデータ） (2025-02-16T14:51:44Z)
Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文参考訳（メタデータ） (2024-09-30T12:36:25Z)
Evaluating Human Alignment and Model Faithfulness of LLM Rationale [66.75309523854476]
大規模言語モデル(LLM)が,その世代を理論的にどのように説明するかを考察する。提案手法は帰属に基づく説明よりも「偽り」が少ないことを示す。
論文参考訳（メタデータ） (2024-06-28T20:06:30Z)
Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文参考訳（メタデータ） (2023-10-16T17:46:26Z)
More Than Words: Towards Better Quality Interpretations of Text Classifiers [16.66535643383862]
MLモデルの入力インタフェースを考えると、トークンベースの解釈性は便利な第1選択であるが、あらゆる状況において最も効果的ではないことを示す。 1)ランダム化テストにより測定されるほど頑健であり,2)SHAPのような近似に基づく手法を用いた場合の変動性が低く,3)言語的コヒーレンスがより高い水準にある場合の人間には理解できない。
論文参考訳（メタデータ） (2021-12-23T10:18:50Z)
Plot-guided Adversarial Example Construction for Evaluating Open-domain Story Generation [23.646133241521614]
学習可能な評価指標は、人間の判断との相関性を高めることで、より正確な評価を約束しています。以前の作品は、可能なシステムの欠点を模倣するために、テキスト理論的に操作可能な実例に依存していた。本研究では,ストーリー生成に使用する制御可能な要因の構造化された表現であるエムプロットを用いて,より包括的でわかりにくいストーリーの集合を生成することで,これらの課題に対処することを提案する。
論文参考訳（メタデータ） (2021-04-12T20:19:24Z)
Lexically-constrained Text Generation through Commonsense Knowledge Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。生成したテキストの意味的正しさを高めるための戦略を提案する。
論文参考訳（メタデータ） (2020-12-19T23:23:40Z)
Curious Case of Language Generation Evaluation Metrics: A Cautionary Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文参考訳（メタデータ） (2020-10-26T13:57:20Z)
Measuring Association Between Labels and Free-Text Rationales [60.58672852655487]
解釈可能なNLPでは、説明された例に対するモデルの意思決定プロセスを反映した忠実な理性が必要です。情報抽出型タスクに対する忠実な抽出合理化のための既存のモデルであるパイプラインは、自由テキスト合理化を必要とするタスクに確実に拡張されないことを示す。我々は、信頼が確立されていない自由文合理化のための、広く使われている高性能モデルのクラスである、共同予測と合理化のモデルに目を向ける。
論文参考訳（メタデータ） (2020-10-24T03:40:56Z)
A Controllable Model of Grounded Response Generation [122.7121624884747]
現在のエンドツーエンドのニューラルネットワークモデルは、応答生成プロセスにセマンティックコントロールを課す柔軟性を本質的に欠いている。我々は制御可能な接地応答生成(CGRG)と呼ばれるフレームワークを提案する。このフレームワークを用いることで、会話のようなRedditデータセットでトレーニングされた、新しいインダクティブアテンション機構を備えたトランスフォーマーベースのモデルが、強力な生成ベースラインを上回っていることを示す。
論文参考訳（メタデータ） (2020-05-01T21:22:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。