論文の概要: Part & Whole Extraction: Towards A Deep Understanding of Quantitative
Facts for Percentages in Text
- arxiv url: http://arxiv.org/abs/2110.13505v1
- Date: Tue, 26 Oct 2021 09:00:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 15:02:32.427021
- Title: Part & Whole Extraction: Towards A Deep Understanding of Quantitative
Facts for Percentages in Text
- Title(参考訳): パート&全体抽出:テキスト中のパーセンテージの量的事実の深い理解に向けて
- Authors: Lei Fang and Jian-Guang Lou
- Abstract要約: 本稿では,テキストの量的事実抽出の問題について検討する。
配列タグ付け問題として部分と全体抽出を定式化する。
我々はシーケンスモデリングにおけるスキップ機構を導入し、我々のタスクとCoNLL-2003の名前付きエンティティ認識タスクの両方で改善された性能を実現した。
- 参考スコア(独自算出の注目度): 19.651664266966343
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We study the problem of quantitative facts extraction for text with
percentages. For example, given the sentence "30 percent of Americans like
watching football, while 20% prefer to watch NBA.", our goal is to obtain a
deep understanding of the percentage numbers ("30 percent" and "20%") by
extracting their quantitative facts: part ("like watching football" and "prefer
to watch NBA") and whole ("Americans). These quantitative facts can empower new
applications like automated infographic generation. We formulate part and whole
extraction as a sequence tagging problem. Due to the large gap between
part/whole and its corresponding percentage, we introduce skip mechanism in
sequence modeling, and achieved improved performance on both our task and the
CoNLL-2003 named entity recognition task. Experimental results demonstrate that
learning to skip in sequence tagging is promising.
- Abstract(参考訳): テキストの量的事実抽出の問題点について検討した。
例えば、「アメリカ人の30%がサッカーが好きであり、20%がNBAを好んでいる」という文を考えると、我々のゴールは、その量的事実を抽出することで、その割合(「30%」と「20%」)を深く理解することである。
これらの定量的事実は、自動インフォグラフィック生成のような新しい応用に役立つ。
シーケンスタギング問題として,部分抽出と全体抽出を定式化する。
パーシャル/ホールと対応するパーセンテージとの間に大きなギャップがあるため、シーケンスモデリングにおけるスキップ機構を導入し、我々のタスクとCoNLL-2003の名前付きエンティティ認識タスクの両方で性能改善を実現した。
実験の結果,シーケンスタギングをスキップする学習が有望であることが判明した。
関連論文リスト
- Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement [12.058303459124003]
ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
本稿では,人体方向の角度と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・スキーム(ADRS)を提案する。
論文 参考訳(メタデータ) (2024-06-03T06:35:11Z) - A Modular Approach for Multimodal Summarization of TV Shows [55.20132267309382]
分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文 参考訳(メタデータ) (2024-03-06T16:10:01Z) - Benchmarking the Generation of Fact Checking Explanations [19.363672064425504]
我々は、正当化の生成(クレームが真か偽かのどちらかに分類される理由をテキストで説明する)に焦点を当て、新しいデータセットと高度なベースラインでベンチマークする。
その結果,生産要約の正当性はクレーム情報から得られることがわかった。
クロスデータセット実験は性能劣化に悩まされるが、2つのデータセットの組み合わせでトレーニングされたユニークなモデルは、スタイル情報を効率的に保持することができる。
論文 参考訳(メタデータ) (2023-08-29T10:40:46Z) - Analyzing Vietnamese Legal Questions Using Deep Neural Networks with
Biaffine Classifiers [3.116035935327534]
我々は深層ニューラルネットワークを用いてベトナムの法的問題から重要な情報を抽出することを提案する。
自然言語で法的疑問が与えられた場合、その疑問に答えるために必要な情報を含む全てのセグメントを抽出することが目的である。
論文 参考訳(メタデータ) (2023-04-27T18:19:24Z) - Crawling the Internal Knowledge-Base of Language Models [53.95793060766248]
本稿では,言語モデルの内部知識ベースである「クローリング」の手順について述べる。
我々は、数十のシードエンティティから始まるグラフのクローリングに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-01-30T12:03:36Z) - Graph-based Semantical Extractive Text Analysis [0.0]
本研究では,テキストの部分間の意味的類似性を組み込むことで,TextRankアルゴリズムの結果を改善する。
キーワード抽出とテキスト要約とは別に,本フレームワークに基づくトピッククラスタリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-12-19T18:30:26Z) - Summarization with Graphical Elements [55.5913491389047]
本稿では,グラフィカル要素による要約という新しい課題を提案する。
タスクの研究を支援するために,高品質なラベル付きデータセットを収集する。
論文 参考訳(メタデータ) (2022-04-15T17:16:41Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - MovieCuts: A New Dataset and Benchmark for Cut Type Recognition [114.57935905189416]
本稿では,マルチモーダル情報のモデリングを必要とするカット型認識タスクを提案する。
10種類のカットタイプにラベル付けされた170万以上のビデオクリップを含む大規模なデータセット、MovieCutsを構築した。
我々の最良のモデルは45.7%のmAPを達成しており、これはタスクが困難であり、高精度なカット型認識がオープンな研究課題であることを示している。
論文 参考訳(メタデータ) (2021-09-12T17:36:55Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Extending Text Informativeness Measures to Passage Interestingness
Evaluation (Language Model vs. Word Embedding) [1.2998637003026272]
本稿では、インフォマティヴネスの概念をインフォマティヴネスの一般化として定義する。
次に、この一般化に対応するために、アートインフォーマティヴネス対策の状態を調査する。
CLEF-INEX Tweet Contextualization 2012 Logarithm similarity measure が最適であることを示す。
論文 参考訳(メタデータ) (2020-04-14T18:22:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。