論文の概要: The URW-KG: a Resource for Tackling the Underrepresentation of
non-Western Writers
- arxiv url: http://arxiv.org/abs/2212.13104v1
- Date: Wed, 21 Dec 2022 07:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 14:08:45.255441
- Title: The URW-KG: a Resource for Tackling the Underrepresentation of
non-Western Writers
- Title(参考訳): URW-KG:非西洋作家の表現不足に対処するためのリソース
- Authors: Marco Antonio Stranisci, Giuseppe Spillo, Cataldo Musto, Viviana
Patti, Rossana Damiano
- Abstract要約: 我々は、この表現の欠如を探求し、おそらく修正するために設計されたリソースであるUnder-Represented Writers Knowledge Graph (URW-KG)を提示する。
このグラフにエンコードされた統合された情報により、学者やユーザーは非西洋の文学作品や著者に容易に露出できる。
- 参考スコア(独自算出の注目度): 2.983639510410386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital media have enabled the access to unprecedented literary knowledge.
Authors, readers, and scholars are now able to discover and share an increasing
amount of information about books and their authors. Notwithstanding, digital
archives are still unbalanced: writers from non-Western countries are less
represented, and such a condition leads to the perpetration of old forms of
discrimination. In this paper, we present the Under-Represented Writers
Knowledge Graph (URW-KG), a resource designed to explore and possibly amend
this lack of representation by gathering and mapping information about works
and authors from Wikidata and three other sources: Open Library, Goodreads, and
Google Books. The experiments based on KG embeddings showed that the integrated
information encoded in the graph allows scholars and users to be more easily
exposed to non-Western literary works and authors with respect to Wikidata
alone. This opens to the development of fairer and effective tools for author
discovery and exploration.
- Abstract(参考訳): デジタルメディアは前例のない文学的知識へのアクセスを可能にした。
著者、読者、学者は、書籍とその著者に関する情報を発見、共有できるようになった。
にもかかわらず、デジタルアーカイブはいまだにバランスがとれていない:非西洋諸国の作家は表現が低く、そのような状況は古い差別の形式を繰り返すことになる。
本稿では,wikidata や,open library,goodreads,google books の3つのソースからの作品や著者に関する情報を収集し,マッピングすることで,この表現の欠如を探索し,修正するためのリソースである,未表示の writer knowledge graph (urw-kg) を提案する。
kg埋め込みに基づく実験は、グラフにエンコードされた統合情報により、学者や利用者がウィキデータのみに対して、非西洋文学作品や著者により簡単に露出できることを示した。
これにより、著者の発見と探索のためのより公平で効果的なツールの開発が開かれる。
関連論文リスト
- On the culture of open access: the Sci-hub paradox [0.0]
シャドウ・ライブラリー(シャドウ・ライブラリー)は、著作権所有者の許可なく無料で公開されている著作権出版物のオンラインコレクションである。
本研究は、全OA雑誌を含むOA出版物が、サブスクリプションベースの出版物よりも多くの引用を受け取ることを示している。
サブスクリプションベースでScihubプラットフォームを介してアクセス可能かどうかを区別することは、その利用の一般化がOAパブリッシングの肯定的な効果をキャンセルすることを示唆している。
論文 参考訳(メタデータ) (2023-08-30T07:50:56Z) - The World Literature Knowledge Graph [2.9441626898733153]
世界文学知識グラフは、194,346人の著者と965,210の著作を含むセマンティックリソースである。
知識グラフは、読者の3つの異なるコミュニティから集められた文学作品の受信に関する情報を統合する。
論文 参考訳(メタデータ) (2023-07-31T13:41:31Z) - PubGraph: A Large-Scale Scientific Knowledge Graph [11.240833731512609]
PubGraphは、大規模な知識グラフの形式を取り入れた、科学的進歩を研究するための新しいリソースである。
PubGraphはWikidata、OpenAlex、Semantic Scholarなど、さまざまなソースからのデータを包括的に統合している。
知識グラフ補完のコアタスクとしてPubGraphから抽出した大規模ベンチマークを複数作成する。
論文 参考訳(メタデータ) (2023-02-04T20:03:55Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Bridger: Toward Bursting Scientific Filter Bubbles and Boosting
Innovation via Novel Author Discovery [22.839876884227536]
ブリッジャー(Bridger)は、学者とその研究の発見を促進するシステムである。
論文から抽出した情報と推論されたペルソナを用いて著者の顔表現を構築する。
我々は、科学者間の共通点とコントラストを見つけるアプローチを開発する。
論文 参考訳(メタデータ) (2021-08-12T11:24:23Z) - How to Train Your Agent to Read and Write [52.24605794920856]
研究論文の読み書きは、資格のある研究者が習得すべき最も特権のある能力の1つである。
読者が論文を読み、要約できるようにインテリジェントなエージェントを訓練し、おそらく新しい論文を書くための潜在的な知識の手がかりを発見し、活用できれば、それは魅力的です。
本研究では,入力段落から知識グラフ(KG)を抽出して潜在的な知識を発見できるtextitReader,新規段落を生成するgraph-to-text TextitWriter,およびtextitから構成されるDeep ReAder-Writer(DRAW)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-01-04T12:22:04Z) - MedLatinEpi and MedLatinLit: Two Datasets for the Computational
Authorship Analysis of Medieval Latin Texts [72.16295267480838]
我々は、中世ラテン文字の2つのデータセットであるMedLatinEpiとMedLatinLitを、計算オーサシップ分析の研究に使用し、利用可能にしている。
MedLatinEpi と MedLatinLit はそれぞれ 294 と 30 のキュレートされたテキストで構成されており、MedLatinEpi のテキストはエピストリー的な性質を持ち、MedLatinLit のテキストは文学的なコメントと様々な主題に関する論文で構成されている。
論文 参考訳(メタデータ) (2020-06-22T14:22:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。