論文の概要: QuoteKG: A Multilingual Knowledge Graph of Quotes
- arxiv url: http://arxiv.org/abs/2207.09562v1
- Date: Tue, 19 Jul 2022 21:32:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 14:03:02.453318
- Title: QuoteKG: A Multilingual Knowledge Graph of Quotes
- Title(参考訳): QuoteKG:Quotesの多言語知識グラフ
- Authors: Tin Kuculo, Simon Gottschalk and Elena Demidova
- Abstract要約: 引用の最初の多言語知識グラフであるQuoteKGを提示する。
Wikiquoteから引用を抽出するQuoteKG生成パイプラインを提案する。
QuoteKGには55ドルの言語で100万近い引用が含まれている。
- 参考スコア(独自算出の注目度): 3.093890460224435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quotes of public figures can mark turning points in history. A quote can
explain its originator's actions, foreshadowing political or personal decisions
and revealing character traits. Impactful quotes cross language barriers and
influence the general population's reaction to specific stances, always facing
the risk of being misattributed or taken out of context. The provision of a
cross-lingual knowledge graph of quotes that establishes the authenticity of
quotes and their contexts is of great importance to allow the exploration of
the lives of important people as well as topics from the perspective of what
was actually said. In this paper, we present QuoteKG, the first multilingual
knowledge graph of quotes. We propose the QuoteKG creation pipeline that
extracts quotes from Wikiquote, a free and collaboratively created collection
of quotes in many languages, and aligns different mentions of the same quote.
QuoteKG includes nearly one million quotes in $55$ languages, said by more than
$69,000$ people of public interest across a wide range of topics. QuoteKG is
publicly available and can be accessed via a SPARQL endpoint.
- Abstract(参考訳): 多数の人物が歴史のターンポイントをマークすることができる。
引用は原作者の行動を説明し、政治的あるいは個人的な決定を先導し、性格的特徴を明らかにすることができる。
インパクトフルな引用は言語の壁を越え、特定のスタンスに対する一般大衆の反応に影響を与える。
引用文とその文脈の真正性を確立する引用文の言語間知識グラフの提供は、重要人物の生活や、実際に言われたことの観点からの話題の探索を可能にするために非常に重要である。
本稿では,引用の多言語知識グラフであるquotkgを提案する。
我々は、Wikiquoteから引用を抽出するQuoteKG生成パイプラインを提案する。これは、多くの言語で自由かつ協調的に作成された引用のコレクションであり、同じ引用の異なる参照を一致させる。
QuoteKGには55ドルの言語で100万近い引用が含まれている。
QuoteKGは公開されており、SPARQLエンドポイント経由でアクセスすることができる。
関連論文リスト
- QUILL: Quotation Generation Enhancement of Large Language Models [45.385109352200196]
大規模言語モデル(LLM)は優れた筆記アシスタントとなったが、引用生成に苦戦している。
これは、事実的な引用を提供するときに幻覚を与えるか、人間の期待を超える引用を与えるのに失敗するためである。
まず,引用生成タスクの総合的かつ自動評価システムを構築し,それぞれが対応する自動測定値を持つ5つの基準から構成される。
次に、スコープが広く次元が豊富なバイリンガル知識ベースを構築し、最大32,022個の引用を含む。
論文 参考訳(メタデータ) (2024-11-06T05:24:09Z) - XAMPLER: Learning to Retrieve Cross-Lingual In-Context Examples [64.79218405438871]
XAMPLER: 言語横断学習の課題に対処するための手法であるクロス言語実例検索法を紹介する。
XAMPLERは最初、英語の肯定的な例と否定的な例を用いて、多言語小言語モデルGlot500に基づいてレトリバーを訓練する。
ターゲット言語の文脈内学習の例として、英語の例を直接検索することができる。
論文 参考訳(メタデータ) (2024-05-08T15:13:33Z) - MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Detecting Contextomized Quotes in News Headlines by Contrastive Learning [9.90130000354593]
引用マークに囲われた直接的な引用は、強い視覚的魅力を持ち、信頼できる引用の兆候である。
残念なことに、このジャーナリズムの実践は厳密には続かず、見出しの引用は「文脈化」されることが多い。
このような引用は、話者の意図を変える方法で文脈から単語を使い、ボディテキストに意味的に一致する引用がないようにする。
ドメイン駆動の正と負のサンプルに基づいて、ニュース引用の埋め込みを表現する、対照的な学習フレームワークQuoteCSEを提案する。
論文 参考訳(メタデータ) (2023-02-09T07:04:11Z) - Quote Erat Demonstrandum: A Web Interface for Exploring the Quotebank
Corpus [11.863216366085105]
本稿では,ニュースから引用した膨大なコレクションであるQuotebankを検索するための適応Webインターフェースを提案する。
記事はニュース記事の概念、受容、分析において中心的な役割を果たす。
論文 参考訳(メタデータ) (2022-07-07T21:41:03Z) - QuoteR: A Benchmark of Quote Recommendation for Writing [80.83859760380616]
QuoteRと呼ばれる大規模かつ完全にオープンな引用レコメンデーションデータセットを構築します。
我々はQuoteR上で既存の引用レコメンデーション手法を広範囲に評価する。
提案手法は,QuoteRの3つの部分すべてにおいて,従来の手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-02-26T14:01:44Z) - DirectQuote: A Dataset for Direct Quotation Extraction and Attribution
in News Articles [6.006936459950188]
本稿では,オンラインメディアから手動で注釈付けされた19,760段落と10,279の直接引用を含むコーパスであるDirectQuoteを紹介する。
提案手法は,複数のシーケンスラベリングモデルをベースラインとして提案し,提案手法をエンド・ツー・エンドで同時抽出・属性付けする手法である。
論文 参考訳(メタデータ) (2021-10-15T02:50:09Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。