論文の概要: Annotating Scientific Uncertainty: A comprehensive model using linguistic patterns and comparison with existing approaches
- arxiv url: http://arxiv.org/abs/2503.11376v1
- Date: Fri, 14 Mar 2025 13:21:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:08:56.465643
- Title: Annotating Scientific Uncertainty: A comprehensive model using linguistic patterns and comparison with existing approaches
- Title(参考訳): 科学的不確かさの注釈:言語パターンを用いた包括的モデルと既存手法との比較
- Authors: Panggih Kusuma Ningrum, Philipp Mayr, Nina Smirnova, Iana Atanassova,
- Abstract要約: UnScientifyは学術的な全文で科学的不確実性を検出するように設計されたシステムである。
UnScientifyの中核となる方法論は、スパンパターンマッチング、複雑な文解析、著者参照チェックを統合した多面的パイプラインに基づいている。
評価結果は,現代大言語モデル(LLM)とUnScientifyシステムとのトレードオフを浮き彫りにした。
- 参考スコア(独自算出の注目度): 1.9627519910539217
- License:
- Abstract: UnScientify, a system designed to detect scientific uncertainty in scholarly full text. The system utilizes a weakly supervised technique to identify verbally expressed uncertainty in scientific texts and their authorial references. The core methodology of UnScientify is based on a multi-faceted pipeline that integrates span pattern matching, complex sentence analysis and author reference checking. This approach streamlines the labeling and annotation processes essential for identifying scientific uncertainty, covering a variety of uncertainty expression types to support diverse applications including information retrieval, text mining and scientific document processing. The evaluation results highlight the trade-offs between modern large language models (LLMs) and the UnScientify system. UnScientify, which employs more traditional techniques, achieved superior performance in the scientific uncertainty detection task, attaining an accuracy score of 0.808. This finding underscores the continued relevance and efficiency of UnScientify's simple rule-based and pattern matching strategy for this specific application. The results demonstrate that in scenarios where resource efficiency, interpretability, and domain-specific adaptability are critical, traditional methods can still offer significant advantages.
- Abstract(参考訳): UnScientify - 学術的な全文で科学的不確実性を検出するように設計されたシステム。
このシステムは、科学的テキストとその権威的参照において言語的に表現された不確実性を特定するために、弱い教師付き技術を利用する。
UnScientifyの中核となる方法論は、スパンパターンマッチング、複雑な文解析、著者参照チェックを統合した多面的パイプラインに基づいている。
このアプローチは、情報検索、テキストマイニング、科学文書処理を含む様々な用途をサポートするために、様々な不確実性表現タイプをカバーし、科学的不確実性を特定するのに不可欠なラベル付けとアノテーションプロセスの合理化を図っている。
評価結果は,現代大言語モデル(LLM)とUnScientifyシステムとのトレードオフを浮き彫りにした。
従来の手法を駆使したUnScientifyは、科学的不確実性検出タスクにおいて優れた性能を達成し、精度は0.808に達した。
この発見は、UnScientifyのこの特定のアプリケーションに対する単純なルールベースおよびパターンマッチング戦略の継続的な妥当性と効率を裏付けるものである。
その結果、リソース効率、解釈可能性、ドメイン固有の適応性が重要なシナリオでは、従来の手法が依然として大きな利点をもたらすことが示される。
関連論文リスト
- Detecting Statements in Text: A Domain-Agnostic Few-Shot Solution [1.3654846342364308]
最先端のアプローチは通常、作成にコストがかかる大規模な注釈付きデータセット上の微調整モデルを含む。
本稿では,クレームに基づくテキスト分類タスクの共通パラダイムとして,定性的で多目的な少ショット学習手法の提案とリリースを行う。
本手法は,気候変動対策,トピック/スタンス分類,うつ病関連症状検出の3つの課題の文脈で説明する。
論文 参考訳(メタデータ) (2024-05-09T12:03:38Z) - Towards Controlled Table-to-Text Generation with Scientific Reasoning [46.87189607486007]
本稿では,科学的文書分析の自動化を目的とした,科学的データに対するユーザの嗜好に合致する,流動的で論理的な記述を生成するための新しいタスクを提案する。
学術文献から抽出したテーブル記述ペアからなる新しい挑戦的データセットSciTabを構築し,強調されたセルとそれに対応するドメイン固有知識ベースを構築した。
その結果、大規模なモデルでは、ユーザの好みに合わせて正確なコンテンツを生成するのに苦労していることがわかりました。
論文 参考訳(メタデータ) (2023-12-08T22:57:35Z) - Testing the Consistency of Performance Scores Reported for Binary
Classification Problems [0.0]
報告された性能スコアの整合性を評価する数値的手法と推定された実験装置を紹介する。
本研究では,提案手法が不整合を効果的に検出し,研究分野の整合性を保護する方法を示す。
科学コミュニティの利益を得るために、一貫性テストはオープンソースのPythonパッケージで利用可能にしました。
論文 参考訳(メタデータ) (2023-10-19T07:04:29Z) - UnScientify: Detecting Scientific Uncertainty in Scholarly Full Text [5.318135784473086]
UnScientifyは学術的な全文における科学的不確実性を検出するために設計されたインタラクティブシステムである。
このシステムのパイプラインは、パターンマッチング、複雑な文チェック、著者参照チェックの組み合わせを含む。
UnScientifyは、テキストにおける科学的不確実性の特定事例の理解を支援する、解釈可能な結果を提供する。
論文 参考訳(メタデータ) (2023-07-26T15:04:24Z) - Cognitive Semantic Communication Systems Driven by Knowledge Graph:
Principle, Implementation, and Performance Evaluation [74.38561925376996]
単一ユーザと複数ユーザのコミュニケーションシナリオに対して,認知意味コミュニケーションフレームワークが2つ提案されている。
知識グラフから推論規則をマイニングすることにより,効果的な意味補正アルゴリズムを提案する。
マルチユーザ認知型セマンティックコミュニケーションシステムにおいて,異なるユーザのメッセージを識別するために,メッセージ復元アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-15T12:01:43Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Expressing High-Level Scientific Claims with Formal Semantics [0.8258451067861932]
我々は、すべての分野の科学論文のサンプルから主要な主張を分析する。
それらの意味論は RDF や OWL のような形式論の直接的な応用よりも複雑である。
ここでは、このスーパーパターンの5つのスロットのインスタンス化が、高階論理における厳密に定義されたステートメントにどのように導かれるかを示す。
論文 参考訳(メタデータ) (2021-09-27T09:52:49Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Improving Scholarly Knowledge Representation: Evaluating BERT-based
Models for Scientific Relation Classification [5.8962650619804755]
領域固有の事前学習コーパスは,Bertに基づく分類モデルにより,科学的関係のタイプを特定することができることを示す。
1回に1つの関係を予測する戦略は高い分類精度を達成するが、後者の戦略は、大小のアノテーションでコーパス内でより一貫した性能を示す。
論文 参考訳(メタデータ) (2020-04-13T18:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。