論文の概要: Granuscore: A Reference-Free Measure of Granularity for Text Analysis and Question Answering
- arxiv url: http://arxiv.org/abs/2605.26620v1
- Date: Tue, 26 May 2026 06:59:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.711645
- Title: Granuscore: A Reference-Free Measure of Granularity for Text Analysis and Question Answering
- Title(参考訳): Granuscore: テキスト分析と質問応答のための基準自由度測定
- Authors: Lukas Ellinger, Alexander Fichtl, Miriam Anschütz, Georg Groh,
- Abstract要約: グラナスコア(Granuscore)は、階層的な埋め込み空間の構造特性を利用する、参照なしの粒度の尺度である。
また,全領域にわたって,Granuscoreは文長を超えた文特異性の非線形変動を説明できることを示した。
Granuscoreを4つの質問回答ベンチマークに適用し、質問やゴールド回答、モデルアウトプットの粒度の違いを分析する。
- 参考スコア(独自算出の注目度): 42.335047771799786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural language conveys information at varying levels of granularity, from fine-grained references to broad descriptions. While granularity is fundamental to human communication, existing measures mostly capture surface detail or sentence specificity. We introduce Granuscore, a reference-free measure of granularity that leverages structural properties of a hierarchical embedding space. Granuscore reliably recovers hierarchical orderings on the Granola-EQ dataset and captures expected differences in granularity across discourse contexts. Across domains, we further show that Granuscore explains non-linear variation in sentence specificity beyond sentence length. Finally, we apply Granuscore to four question-answering benchmarks and analyze how granularity differs for questions, gold answers, and model outputs across response outcomes. The analysis reveals consistent differences in model behavior and provides a principled lens for characterizing the difficulty of QA datasets. Together, the results position Granuscore as a scalable, broadly applicable tool for analyzing granularity in text.
- Abstract(参考訳): 自然言語は、きめ細かい参照から幅広い記述まで、様々なレベルの粒度で情報を伝達する。
人間のコミュニケーションには粒度が不可欠だが、既存の計測手法は表面の細部や文の特異性を主に捉えている。
我々は、階層的な埋め込み空間の構造特性を利用する、参照不要な粒度の尺度であるGranuscoreを紹介する。
Granuscoreは、Granola-EQデータセットの階層的順序付けを確実に回復し、談話コンテキスト間の粒度の違いをキャプチャする。
さらに,全領域にわたって,Granuscoreは文長以外の文特異性の非線形変動を説明できることを示した。
最後に、Granuscoreを4つの質問回答ベンチマークに適用し、回答結果における質問、金の回答、モデル出力の粒度の違いを分析する。
この分析は、モデルの振る舞いに一貫した違いを明らかにし、QAデータセットの難易度を特徴付けるための原理化されたレンズを提供する。
その結果、Granuscoreはテキストの粒度を解析するためのスケーラブルで広く適用可能なツールとして位置づけられた。
関連論文リスト
- Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [60.83579255387347]
幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文 参考訳(メタデータ) (2025-04-14T10:06:27Z) - GBFRS: Robust Fuzzy Rough Sets via Granular-ball Computing [48.33779268699777]
ファジィ粗セット理論は複雑な属性を持つデータセットを処理するのに有効である。
既存のモデルのほとんどは最も細かい粒度で動作しており、非効率でノイズに敏感である。
本稿では,多粒度グラニュラーボール計算をファジィ粗集合理論に統合し,サンプル点の代替としてグラニュラーボールを提案する。
論文 参考訳(メタデータ) (2025-01-30T15:09:26Z) - Unifying the Scope of Bridging Anaphora Types in English: Bridging Annotations in ARRAU and GUM [10.942182034424714]
我々は,GUM,GENTLE,ARRAUコーパスに注釈付けされたブリッジインスタンスについて,ガイドラインと解釈可能な予測モデルを用いて比較を行った。
我々は,GUM,GENTLE,ARRAU Wall Street Journalの各テストセットの調和したサブカテゴリ化バージョンを公開し,ドメイン間のブリッジ解像度の有意義で信頼性の高い評価を促進する。
論文 参考訳(メタデータ) (2024-10-02T01:56:28Z) - Are we describing the same sound? An analysis of word embedding spaces
of expressive piano performance [4.867952721052875]
表現力のあるピアノ演奏の特徴の領域における不確実性について検討する。
5つの埋め込みモデルとその類似性構造を基礎的真理に対応するために検証する。
埋め込みモデルの品質は、このタスクに対して大きなばらつきを示している。
論文 参考訳(メタデータ) (2023-12-31T12:20:03Z) - MGDoc: Pre-training with Multi-granular Hierarchy for Document Image
Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。
既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。
MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文 参考訳(メタデータ) (2022-11-27T22:47:37Z) - Ensemble Creation via Anchored Regularization for Unsupervised Aspect
Extraction [1.8591803874887636]
教師なしのアスペクトベースの感情分析により、ラベルの生成に時間や資金を投資することなく洞察を生成できる。
我々が改善したモデルの1つは、文をその中に存在するアスペクト項の線形結合として再構成するABAEである。
本研究では、他の教師なしモデルからの情報をABAEの正規化に活用し、パフォーマンスを向上させる方法について検討する。
論文 参考訳(メタデータ) (2022-10-13T08:23:56Z) - Continuous Decomposition of Granularity for Neural Paraphrase Generation [26.05252697808379]
ニューラルパラフレーズ生成のための粒度連続分解法(C-DNPG)を提案する。
C-DNPGは、多頭部自己注意を拡張した粒度認識機構(GA-Attention)を導入している。
Quoraの質問ペアとTwitterのURLを含む2つのベンチマークの実験では、C-DNPGがベースラインモデルを上回っていることが示されている。
論文 参考訳(メタデータ) (2022-09-05T05:02:42Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z) - ClarQ: A large-scale and diverse dataset for Clarification Question
Generation [67.1162903046619]
そこで我々は,スタックエクスチェンジから抽出したポストコメンデーションに基づいて,多様な,大規模な明確化質問データセットの作成を支援する,新しいブートストラップフレームワークを考案した。
質問応答の下流タスクに適用することで,新たに作成したデータセットの有用性を定量的に示す。
我々はこのデータセットを公開し、ダイアログと質問応答システムの拡張という大きな目標を掲げて、質問生成の分野の研究を促進する。
論文 参考訳(メタデータ) (2020-06-10T17:56:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。