論文の概要: Towards Empowering Consumers through Sentence-level Readability Scoring in German ESG Reports
- arxiv url: http://arxiv.org/abs/2603.29861v1
- Date: Tue, 31 Mar 2026 15:19:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.740609
- Title: Towards Empowering Consumers through Sentence-level Readability Scoring in German ESG Reports
- Title(参考訳): ドイツのESGレポートにおけるセンテンスレベルの可読性評価による消費者のエンパワーメントを目指して
- Authors: Benjamin Josef Schüßler, Jakob Prange,
- Abstract要約: 我々は,既存のドイツ語ESGレポートの文レベルデータセットをクラウドソースの可読性アノテーションで拡張する。
一般に、ネイティブ話者はESGレポートの文章を読みやすいほど読みやすいと認識しているが、読みやすさは主観的である。
解析の結果, LLMプロンプトは, 読み難い文と区別できる可能性があるが, 小型の微調整トランスフォーマーは, 人間の読みやすさを最小の誤差で予測できることがわかった。
- 参考スコア(独自算出の注目度): 2.4693829414013546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the ever-growing urgency of sustainability in the economy and society, and the massive stream of information that comes with it, consumers need reliable access to that information. To address this need, companies began publishing so called Environmental, Social, and Governance (ESG) reports, both voluntarily and forced by law. To serve the public, these reports must be addressed not only to financial experts but also to non-expert audiences. But are they written clearly enough? In this work, we extend an existing sentence-level dataset of German ESG reports with crowdsourced readability annotations. We find that, in general, native speakers perceive sentences in ESG reports as easy to read, but also that readability is subjective. We apply various readability scoring methods and evaluate them regarding their prediction error and correlation with human rankings. Our analysis shows that, while LLM prompting has potential for distinguishing clear from hard-to-read sentences, a small finetuned transformer predicts human readability with the lowest error. Averaging predictions of multiple models can slightly improve the performance at the cost of slower inference.
- Abstract(参考訳): 経済と社会の持続可能性の急激な急激さと、それに伴う膨大な情報の流れにより、消費者はその情報に信頼できるアクセスを必要としている。
このニーズに対処するため、企業は「環境、社会、ガバナンス(ESG)」と呼ばれる報告書を自発的に、そして法によって強制的に発行し始めた。
一般向けには、これらのレポートは財務の専門家だけでなく、専門家でない聴衆にも対処する必要がある。
しかし、それらは十分に明確に書かれていますか?
本研究では,既存のドイツ語ESGレポートの文レベルデータセットをクラウドソースの可読性アノテーションで拡張する。
一般に、ネイティブ話者はESGレポートの文章を読みやすいほど読みやすいと認識しているが、読みやすさは主観的である。
様々な可読性評価手法を適用し,その予測誤差と人格との相関について評価する。
解析の結果, LLMプロンプトは, 読み難い文と区別できる可能性があるが, 小型の微調整トランスフォーマーは, 人間の読みやすさを最小の誤差で予測できることがわかった。
複数のモデルの予測を平均すると、推論が遅いコストでパフォーマンスがわずかに向上する。
関連論文リスト
- ClaimPT: A Portuguese Dataset of Annotated Claims in News Articles [6.3071668118252076]
ClaimPTは、事実主張に注釈を付けたヨーロッパのポルトガルのニュース記事のデータセットである。
2つの訓練されたアノテーションは各記事にラベルを付け、キュレーターは新しく提案されたスキームに従ってすべてのアノテーションを検証する。
クレーム検出のためのベースラインモデルを提供し、初期ベンチマークを確立し、将来のNLPおよびIRアプリケーションを可能にする。
論文 参考訳(メタデータ) (2026-01-27T11:22:00Z) - Understanding Structured Financial Data with LLMs: A Case Study on Fraud Detection [17.04809129025246]
FinFRE-RAGは、数値・分類属性のコンパクトなサブセットを自然言語にシリアライズするために重要誘導特徴量削減を適用した2段階のアプローチである。
LLMは人間の読みやすい説明を作成し、特徴分析を促進することができるため、詐欺分析者の手作業の負担を軽減できる可能性がある。
論文 参考訳(メタデータ) (2025-12-15T07:09:11Z) - From Reviewers' Lens: Understanding Bug Bounty Report Invalid Reasons with LLMs [1.8652189113472575]
私たちは、9,942件のバグ報奨金を公表したデータセットを集めました。
我々は、最先端の大規模言語モデルが無効なレポートを識別できるかどうかを評価する。
我々は情報開示の脆弱性の理由の分類を作成し、それを検索強化された生成フレームワークに組み込む。
論文 参考訳(メタデータ) (2025-11-23T20:27:54Z) - Profiling News Media for Factuality and Bias Using LLMs and the Fact-Checking Methodology of Human Experts [29.95198868148809]
本稿では,プロのファクトチェッカーがアウトレット全体の事実と政治的偏見を評価するために使用する基準をエミュレートする新しい手法を提案する。
メディアの人気と地域がモデル性能に与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2025-06-14T15:49:20Z) - Misspellings in Natural Language Processing: A survey [47.47407737542483]
デジタル通信では ミススペルがユビキタスになりました
我々は科学的な問題としてミススペルの歴史を再構築する。
NLPにおけるミススペル問題に対処するための最新の進歩について論じる。
論文 参考訳(メタデータ) (2025-01-28T10:26:04Z) - Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。
結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。
実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文 参考訳(メタデータ) (2024-09-30T12:36:25Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - White Men Lead, Black Women Help? Benchmarking and Mitigating Language Agency Social Biases in LLMs [58.27353205269664]
社会的バイアスは、Large Language Model(LLM)生成コンテンツにおいて言語エージェンシーに現れる。
LLMのバイアスを包括的に評価するLanguage Agency Bias Evaluationベンチマークを導入する。
LABEを用いて,近年の3つのLLM(ChatGPT,Llama3,Mistral)における言語エージェントの社会的バイアスを明らかにした。
論文 参考訳(メタデータ) (2024-04-16T12:27:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。