論文の概要: Evaluation of Automatically Constructed Word Meaning Explanations
- arxiv url: http://arxiv.org/abs/2302.13625v1
- Date: Mon, 27 Feb 2023 09:47:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 16:03:59.130647
- Title: Evaluation of Automatically Constructed Word Meaning Explanations
- Title(参考訳): 自動構築された単語意味説明の評価
- Authors: Marie Star\'a and Pavel Rychl\'y and Ale\v{s} Hor\'ak
- Abstract要約: 非常に大規模なコーパスからの集合情報に基づいて,説明を自動的に導き出す新しいツールを提案する。
提案手法は,約90%のケースにおいて,単語の意味を理解するのに有用なデータを含む説明を作成できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Preparing exact and comprehensive word meaning explanations is one of the key
steps in the process of monolingual dictionary writing. In standard
methodology, the explanations need an expert lexicographer who spends a
substantial amount of time checking the consistency between the descriptive
text and corpus evidence. In the following text, we present a new tool that
derives explanations automatically based on collective information from very
large corpora, particularly on word sketches. We also propose a quantitative
evaluation of the constructed explanations, concentrating on explanations of
nouns. The methodology is to a certain extent language independent; however,
the presented verification is limited to Czech and English. We show that the
presented approach allows to create explanations that contain data useful for
understanding the word meaning in approximately 90% of cases. However, in many
cases, the result requires post-editing to remove redundant information.
- Abstract(参考訳): 正確かつ包括的な単語の意味説明の準備は、単言語辞書作成の過程における重要なステップの1つである。
標準的な方法論では、説明には、記述テキストとコーパス証拠の一貫性を確認するのにかなりの時間を費やす専門家の辞書作成者が必要である。
以下のテキストでは,非常に大きなコーパス,特に単語スケッチからの集団情報に基づいて,説明を自動的に導出する新しいツールを提案する。
また, 名詞の説明に焦点をあて, 構築された説明の定量的評価も提案する。
その方法論はある程度独立した言語であるが、提示された検証はチェコ語と英語に限られている。
提案手法は,単語の意味を理解するのに有用なデータを含む説明を約90%のケースで作成できることを示す。
しかし多くの場合、結果として余分な情報が削除される。
関連論文リスト
- Evaluation of Machine Translation Based on Semantic Dependencies and Keywords [7.240399904675839]
本稿では,参照翻訳に基づく機械翻訳の意味的正当性を評価するための計算手法を提案する。
Harbin Institute of TechnologyのSocial Computing and Information Retrieval Research Centerが開発した言語技術プラットフォームを使用する。
論文 参考訳(メタデータ) (2024-04-20T04:14:28Z) - Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Measuring Information in Text Explanations [23.929076318334047]
情報理論の枠組みに説明を配置することで、2つの一般的なテキスト説明手法の評価を統一することができると論じる。
これらのチャネルを流れる情報の流れを定量化し、説明特性の評価を容易にする。
我々の研究は、説明可能なAIの急速に発展する分野において、厳格で標準化された評価基準を確立するための継続的な努力に貢献している。
論文 参考訳(メタデータ) (2023-10-06T19:46:51Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - Explanation Selection Using Unlabeled Data for Chain-of-Thought
Prompting [80.9896041501715]
非専門家によって書かれたオフ・ザ・シェルフの説明のように、タスクのために"チューニング"されていない説明は、中途半端なパフォーマンスをもたらす可能性がある。
本稿では,ブラックボックス方式で説明拡散プロンプトを最適化する方法の課題に対処する。
論文 参考訳(メタデータ) (2023-02-09T18:02:34Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Human Interpretation of Saliency-based Explanation Over Text [65.29015910991261]
テキストデータ上でのサリエンシに基づく説明について検討する。
人はしばしば説明を誤って解釈する。
本稿では,過度知覚と過小認識のモデル推定に基づいて,サリエンシを調整する手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T15:20:32Z) - Explaining Latent Representations with a Corpus of Examples [72.50996504722293]
本稿では,サンプルベースの説明を自由に選択されたサンプル集合を参照して提供するユーザ中心の手法であるSimplExを提案する。
SimplExは、ポストホックな説明で潜伏空間に対するユーザの理解を改善するためにコーパスを使用する。
SimplExは,モデル表現を説明するコーパス内の関連パターンを強調表示することで,ユーザを力づけることを示す。
論文 参考訳(メタデータ) (2021-10-28T17:59:06Z) - ReSCo-CC: Unsupervised Identification of Key Disinformation Sentences [3.7405995078130148]
本稿では,信頼できない文書に含まれる重要な偽情報を含む文を識別する新規な教師なしタスクを提案する。
そこで我々は,まず,タスク用に設計された特徴空間内に文を埋め込むことから始まる,3段階の統計的NLPソリューションを設計する。
本手法は, コア情報の同定を効果的に行うことができることを示す。
論文 参考訳(メタデータ) (2020-10-21T08:53:36Z) - Extending Text Informativeness Measures to Passage Interestingness
Evaluation (Language Model vs. Word Embedding) [1.2998637003026272]
本稿では、インフォマティヴネスの概念をインフォマティヴネスの一般化として定義する。
次に、この一般化に対応するために、アートインフォーマティヴネス対策の状態を調査する。
CLEF-INEX Tweet Contextualization 2012 Logarithm similarity measure が最適であることを示す。
論文 参考訳(メタデータ) (2020-04-14T18:22:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。