論文の概要: "Covid vaccine is against Covid but Oxford vaccine is made at Oxford!"
Semantic Interpretation of Proper Noun Compounds
- arxiv url: http://arxiv.org/abs/2210.13039v1
- Date: Mon, 24 Oct 2022 08:48:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 16:43:06.042524
- Title: "Covid vaccine is against Covid but Oxford vaccine is made at Oxford!"
Semantic Interpretation of Proper Noun Compounds
- Title(参考訳): 「コビッドワクチンはコビッドワクチンだがオックスフォードワクチンはオックスフォードで作れ!」プロパー名詞のセマンティック解釈
- Authors: Keshav Kolluru and Gabriel Stanovsky and Mausam
- Abstract要約: 22.5Kの固有名詞化合物と自由形式の意味解釈からなる新しいデータセットProNCIをリリースする。
固有名詞化合物から意味論的解釈を自動生成するための様々なニューラルモデルの実験を行った。
対象とする知識,特に共通名詞を付加すると,パフォーマンスが2.8%向上することがわかった。
- 参考スコア(独自算出の注目度): 28.05771911116034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proper noun compounds, e.g., "Covid vaccine", convey information in a
succinct manner (a "Covid vaccine" is a "vaccine that immunizes against the
Covid disease"). These are commonly used in short-form domains, such as news
headlines, but are largely ignored in information-seeking applications. To
address this limitation, we release a new manually annotated dataset, ProNCI,
consisting of 22.5K proper noun compounds along with their free-form semantic
interpretations. ProNCI is 60 times larger than prior noun compound datasets
and also includes non-compositional examples, which have not been previously
explored. We experiment with various neural models for automatically generating
the semantic interpretations from proper noun compounds, ranging from few-shot
prompting to supervised learning, with varying degrees of knowledge about the
constituent nouns. We find that adding targeted knowledge, particularly about
the common noun, results in performance gains of upto 2.8%. Finally, we
integrate our model generated interpretations with an existing Open IE system
and observe an 7.5% increase in yield at a precision of 85%. The dataset and
code are available at https://github.com/dair-iitd/pronci.
- Abstract(参考訳): 適切な名詞化合物、例えば「共発ワクチン」は簡潔な方法で情報を伝達する(「共発ワクチン」は「新型コロナウイルスに対して免疫するワクチン」である)。
これらはニュース見出しなどのショートフォームドメインで一般的に使用されるが、情報検索アプリケーションでは無視されている。
この制限に対処するため、我々は22.5Kの固有名詞化合物と自由形式の意味解釈からなる新しい手動注釈付きデータセットProNCIをリリースする。
ProNCIは、以前の名詞複合データセットの60倍の大きさであり、以前にも調査されていない非合成例も含んでいる。
構成名詞に関する知識の多様さを生かして,適切な名詞成分から意味的解釈を自動的に生成するために,様々なニューラルモデルを用いて実験を行った。
対象とする知識,特に共通名詞を付加すると,パフォーマンスが2.8%向上することがわかった。
最後に,既存のオープンieシステムとモデル生成解釈を統合し,85%の精度で7.5%の収率向上を観測した。
データセットとコードはhttps://github.com/dair-iitd/pronciで入手できる。
関連論文リスト
- Graph Adversarial Immunization for Certifiable Robustness [63.58739705845775]
グラフニューラルネットワーク(GNN)は敵の攻撃に対して脆弱である。
既存の防衛は、敵の訓練やモデル修正の開発に重点を置いている。
本稿では,グラフ構造の一部を接種するグラフ対人免疫法を提案し,定式化する。
論文 参考訳(メタデータ) (2023-02-16T03:18:43Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Doctors vs. Nurses: Understanding the Great Divide in Vaccine Hesitancy
among Healthcare Workers [64.1526243118151]
医者は新型コロナウイルスワクチンに対して全体的に陽性であることがわかりました。
医師は新型ワクチンよりもワクチンの有効性を懸念している。
看護婦は子供に対する潜在的な副作用にもっと注意を払う。
論文 参考訳(メタデータ) (2022-09-11T14:22:16Z) - Classifying COVID-19 vaccine narratives [7.784326429148358]
政府の情報キャンペーンや世界保健機関(WHO)の努力にもかかわらず、ワクチンの行き詰まりは広範囲に及んでいる。
本稿では,新型コロナウイルスワクチンを7つのカテゴリの1つに分類する新しいワクチン物語分類タスクを紹介する。
また,クロスバリデーション条件下での精度を84%に向上させるニューラルワクチン物語分類器も提案した。
論文 参考訳(メタデータ) (2022-07-18T11:37:47Z) - Identifying the Adoption or Rejection of Misinformation Targeting
COVID-19 Vaccines in Twitter Discourse [0.0]
ソーシャルメディアで宣伝する新型コロナウイルスワクチンに関する誤報は、ワクチン接種への執着を促していると考えられている。
本稿では,誤情報に対する態度を,態度の整合性とその特性に頼って識別する新しい枠組みについて述べる。
実験は、CoVaxLiesと呼ばれる新型コロナウイルスワクチンに対する誤情報の新しいデータセット上で行われ、最近のTwitterの談話から収集された。
論文 参考訳(メタデータ) (2022-02-18T22:01:49Z) - Insta-VAX: A Multimodal Benchmark for Anti-Vaccine and Misinformation
Posts Detection on Social Media [32.252687203366605]
ソーシャルメディア上の抗ワクチンポストは、混乱を招き、ワクチンに対する大衆の信頼を低下させることが示されている。
Insta-VAXは、ヒトワクチンに関連する64,957のInstagram投稿のサンプルからなる、新しいマルチモーダルデータセットである。
論文 参考訳(メタデータ) (2021-12-15T20:34:57Z) - Automatic Detection of COVID-19 Vaccine Misinformation with Graph Link
Prediction [2.0625936401496237]
新型コロナウイルス(COVID-19)ワクチンに関するソーシャルメディアの誤報によって引き起こされたワクチンのヘシタシーは、大きなハードルとなった。
CoVaxLiesは、新型コロナウイルスワクチンに関するいくつかの誤報のターゲットに関連する、新しいツイートのデータセットである。
本手法は,誤情報検出をグラフリンク予測問題として用いた誤情報知識グラフにCoVaxLiesを整理する。
論文 参考訳(メタデータ) (2021-08-04T23:27:10Z) - Classifying vaccine sentiment tweets by modelling domain-specific
representation and commonsense knowledge into context-aware attentive GRU [9.8215089151757]
ワクチンのヘシタシーと拒絶はワクチン接種率の低いクラスターを生じさせ、ワクチン接種プログラムの有効性を低下させる。
ソーシャルメディアは、地理的な位置を含み、ワクチンに関する懸念を詳述することで、ワクチンの受け入れに対する新たなリスクを見積もる機会を提供する。
ワクチン関連ツイートなどのソーシャルメディア投稿を分類する手法では、一般的なドメインテキストで訓練された言語モデル(LM)を使用する。
本稿では、ワクチン関連ツイートで訓練されたドメイン固有LMを用いて相互接続されたコンポーネントで構成された新しいエンドツーエンドフレームワークについて、コンテキスト対応の双方向ゲート再帰ネットワーク(CK-BiGRU)にコモンセンス知識をモデル化する。
論文 参考訳(メタデータ) (2021-06-17T15:16:08Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。