論文の概要: Improving random walk rankings with feature selection and imputation
- arxiv url: http://arxiv.org/abs/2111.15635v1
- Date: Mon, 29 Nov 2021 01:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-12-02 08:38:38.773299
- Title: Improving random walk rankings with feature selection and imputation
- Title(参考訳): 特徴選択とインプテーションによるランダムウォークランキングの改善
- Authors: Ngoc Mai Tran, Yangxinyu Xie
- Abstract要約: Science4castコンペティションは、セマンティックネットワークにおける新しいリンクを予測することで構成される。
チーム・ハッシュ・ブラウンの最終提出であるエマフェ5aはテストセットで0.92738のスコアを獲得した。
本稿では,我々のモデル,その直観,およびテストセットのバリエーションの性能について詳述する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Science4cast Competition consists of predicting new links in a semantic
network, with each node representing a concept and each edge representing a
link proposed by a paper relating two concepts. This network contains
information from 1994-2017, with a discretization of days (which represents the
publication date of the underlying papers). Team Hash Brown's final submission,
\emph{ee5a}, achieved a score of 0.92738 on the test set. Our team's score
ranks \emph{second place}, 0.01 below the winner's score. This paper details
our model, its intuition, and the performance of its variations in the test
set.
- Abstract(参考訳): Science4castコンペティションはセマンティックネットワークにおける新しいリンクを予測し、各ノードは概念を表し、各エッジは2つの概念に関する論文によって提案されたリンクを表す。
このネットワークには1994年から2017年までの情報が含まれており、日数(基礎となる論文の発行日を表す)を区別している。
team hash brownの最終的な提案である \emph{ee5a} は、テストセットで0.92738のスコアを達成した。
私たちのチームの得点は、勝者のスコアより0.01低い2位である。
本稿では,我々のモデル,その直観,およびテストセットのバリエーションの性能について詳述する。
関連論文リスト
- A Text-based Approach For Link Prediction on Wikipedia Articles [1.9567015559455132]
本稿では,ウィキペディア記事のリンク予測に関するDSAA 2023 Challengeで紹介する。
POSタグ(part-of-speechタグ)を備えた従来の機械学習モデルを使用して、2つのノードにリンクがあるかどうかを予測する分類モデルをトレーニングする。
F1スコアは0.99999で,競技では7位となった。
論文 参考訳(メタデータ) (2023-09-01T08:00:43Z) - Link Prediction for Wikipedia Articles as a Natural Language Inference
Task [1.1842520528140819]
本稿では、自然言語推論(NLI)タスクとして定式化することで、ウィキペディアの記事の予測をリンクする手法を提案する。
ウィキペディア記事タスクのリンク予測のための文ペア分類に基づくシステムを実装した。
当システムでは,公開テストセットとプライベートテストセットでそれぞれ0.99996 Macro F1スコアと1.00000 Macro F1スコアを達成した。
論文 参考訳(メタデータ) (2023-08-31T05:25:04Z) - SimMatchV2: Semi-Supervised Learning with Graph Consistency [53.31681712576555]
半教師付き学習アルゴリズムSimMatchV2を導入する。
グラフの観点からラベル付きデータとラベルなしデータの間の様々な一貫性の規則化を定式化する。
SimMatchV2は、複数の半教師付き学習ベンチマークで検証されている。
論文 参考訳(メタデータ) (2023-08-13T05:56:36Z) - Evaluating Graph Neural Networks for Link Prediction: Current Pitfalls
and New Benchmarking [66.83273589348758]
リンク予測は、グラフのエッジの一部のみに基づいて、目に見えないエッジが存在するかどうかを予測しようとする。
近年,この課題にグラフニューラルネットワーク(GNN)を活用すべく,一連の手法が導入されている。
これらの新しいモデルの有効性をよりよく評価するために、新しい多様なデータセットも作成されている。
論文 参考訳(メタデータ) (2023-06-18T01:58:59Z) - Rethinking Explaining Graph Neural Networks via Non-parametric Subgraph
Matching [68.35685422301613]
そこで我々はMatchExplainerと呼ばれる新しい非パラメトリックな部分グラフマッチングフレームワークを提案し、説明的部分グラフを探索する。
ターゲットグラフと他のインスタンスを結合し、ノードに対応する距離を最小化することで最も重要な結合部分構造を識別する。
合成および実世界のデータセットの実験は、最先端のパラメトリックベースラインをかなりのマージンで上回り、MatchExplainerの有効性を示す。
論文 参考訳(メタデータ) (2023-01-07T05:14:45Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Czech News Dataset for Semantic Textual Similarity [0.0]
本稿では,意味的類似性アノテーションを用いた文からなる新しいデータセットについて述べる。
このデータは、チェコ語におけるジャーナリストの領域に由来する。
データセットには、138,556人のアノテーションが列車とテストセットに分割されている。
論文 参考訳(メタデータ) (2021-08-19T14:20:17Z) - Are Missing Links Predictable? An Inferential Benchmark for Knowledge
Graph Completion [79.07695173192472]
InferWikiは推論能力、仮定、パターンの既存のベンチマークを改善している。
各テストサンプルは、トレーニングセットの支持データで予測可能である。
実験では,大きさや構造が異なるInferWikiの2つの設定をキュレートし,比較データセットとしてCoDExに構築プロセスを適用する。
論文 参考訳(メタデータ) (2021-08-03T09:51:15Z) - MIDAS at SemEval-2020 Task 10: Emphasis Selection using Label
Distribution Learning and Contextual Embeddings [46.973153861604416]
本稿では,文章による強調選択に関するSemEval 2020 - Task 10への提出について述べる。
我々は、この強調選択問題を、文脈埋め込みモデルで基礎となるテキストを表現するシーケンスラベリングタスクとしてアプローチする。
私たちの最高のパフォーマンスアーキテクチャは、さまざまなモデルの集合体で、全体的なマッチングスコアは0.783で、31チーム中15位です。
論文 参考訳(メタデータ) (2020-09-06T00:15:33Z) - Inno at SemEval-2020 Task 11: Leveraging Pure Transformer for
Multi-Class Propaganda Detection [0.701955947252181]
本稿では,SEMEVAL 2020タスク11「ニュース記事におけるプロパガンダ技術の検出」に対するチーム"Inno"のソリューションを提案する。
第2サブタスクの目的は、ニュース記事データセットで与えられた18のプロパガンダ技法の1つに対応するテキストセグメントを分類することである。
論文 参考訳(メタデータ) (2020-08-26T14:42:14Z) - Deep Learning Brasil -- NLP at SemEval-2020 Task 9: Overview of
Sentiment Analysis of Code-Mixed Tweets [0.2294014185517203]
本稿では、コード混在のつぶやき(ヒンズー・イングリッシュ)における感情を予測する手法について述べる。
CodaLabのVerissimo.manoelというチームが、4つのモデルのアンサンブルに基づいたアプローチを開発しました。
最終分類アルゴリズムは、これらの4つのモデルから得られる全てのソフトマックス値のいくつかの予測の集合である。
論文 参考訳(メタデータ) (2020-07-28T16:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。