論文の概要: The Solution for The PST-KDD-2024 OAG-Challenge
- arxiv url: http://arxiv.org/abs/2407.12827v1
- Date: Tue, 2 Jul 2024 14:15:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 08:37:51.484068
- Title: The Solution for The PST-KDD-2024 OAG-Challenge
- Title(参考訳): PST-KDD-2024 OAG-Challengeの解法
- Authors: Shupeng Zhong, Xinger Li, Shushan Jin, Yang Yang,
- Abstract要約: 我々は KDD-2024 OAG-Challenge 紙のソーストレーストラックに第2位の解を導入する。
提案手法は主にBERTとGCNの2つの手法に基づいており,最終提案におけるBERTとGCNの推論結果を組み合わせたものである。
最終的に,我々の解法は,競技において顕著なスコア0.47691を達成した。
- 参考スコア(独自算出の注目度): 3.0116058513816224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce the second-place solution in the KDD-2024 OAG-Challenge paper source tracing track. Our solution is mainly based on two methods, BERT and GCN, and combines the reasoning results of BERT and GCN in the final submission to achieve complementary performance. In the BERT solution, we focus on processing the fragments that appear in the references of the paper, and use a variety of operations to reduce the redundant interference in the fragments, so that the information received by BERT is more refined. In the GCN solution, we map information such as paper fragments, abstracts, and titles to a high-dimensional semantic space through an embedding model, and try to build edges between titles, abstracts, and fragments to integrate contextual relationships for judgment. In the end, our solution achieved a remarkable score of 0.47691 in the competition.
- Abstract(参考訳): 本稿では,KDD-2024 OAG-Challenge紙のソーストレーストラックにおける第2位解について紹介する。
提案手法は主にBERTとGCNの2つの手法に基づいており,最終提案におけるBERTとGCNの推論結果を組み合わせて補完性能を実現する。
BERTソリューションでは、論文の参照に現れるフラグメントの処理に集中し、さまざまな操作を用いてフラグメントの冗長な干渉を低減することにより、BERTが受信した情報をより洗練する。
GCNソリューションでは,紙の断片や要約,タイトルなどの情報を埋め込みモデルを通じて高次元の意味空間にマッピングし,タイトル,抽象,フラグメント間のエッジを構築して判断の文脈的関係を統合する。
最終的に,我々の解法は,競技において顕著なスコア0.47691を達成した。
関連論文リスト
- TocBERT: Medical Document Structure Extraction Using Bidirectional Transformers [1.2343981093497332]
TocBERTは、意味表現からタイトルとサブタイトルを検出することを訓練された教師付きソリューションである。
この手法は、MIMIC-IIIデータセットの放電サマリーを分割するためにBio-ClinicalBERTモデルを微調整した医療用テキストセグメンテーションのユースケースに適用されている。
F1スコアは線形テキストセグメンテーション問題で84.6%、階層テキストセグメンテーション問題で72.8%に達した。
論文 参考訳(メタデータ) (2024-06-27T20:56:57Z) - Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - Theoretically Achieving Continuous Representation of Oriented Bounding Boxes [64.15627958879053]
本論文は,オブジェクト指向境界ボックス表現における不連続性を完全に解決しようとする試みである。
本研究では,既存の検出器に容易に統合可能なCOBB(Continuous OBB)という新しい表現法を提案する。
OOD評価のためのオープンソースのディープラーニングフレームワークJittorの検出ツールボックスJDetをベースとした,モジュール化されたベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-29T09:27:40Z) - Cross-Domain Few-Shot Segmentation via Iterative Support-Query
Correspondence Mining [81.09446228688559]
Cross-Domain Few-Shots (CD-FSS) は、限定された例のみを用いて、異なるドメインから新しいカテゴリを分割するという課題を提起する。
本稿では,CD-FSSの課題に対処する新しいクロスドメイン微調整手法を提案する。
論文 参考訳(メタデータ) (2024-01-16T14:45:41Z) - Modeling Uncertainty and Using Post-fusion as Fallback Improves Retrieval Augmented Generation with LLMs [80.74263278847063]
検索されたパスと大きな言語モデル(LLM)の統合は、オープンドメインの質問応答の改善に大きく貢献している。
本稿では,検索したパスをLLMと組み合わせて回答生成を向上させる方法について検討する。
論文 参考訳(メタデータ) (2023-08-24T05:26:54Z) - EFaR 2023: Efficient Face Recognition Competition [51.77649060180531]
バイオメトリックス国際会議(IJCB 2023)における効率的な顔認識コンペティション(EFaR)の概要について述べる。
この競技会は6つの異なるチームから17の応募を受けた。
提案したソリューションは、様々なベンチマークで達成された検証精度の重み付けスコアと、浮動小数点演算数とモデルサイズによって与えられるデプロイ可能性に基づいてランク付けされる。
論文 参考訳(メタデータ) (2023-08-08T09:58:22Z) - Improving Few-shot and Zero-shot Entity Linking with Coarse-to-Fine
Lexicon-based Retriever [30.096395104683193]
少数ショットとゼロショットのエンティティリンクは、テールと新興エンティティに重点を置いている。
本稿では,エンティティ候補を効果的に検索する粗大なレキシコンベースレトリバーを提案する。
NLPCC 2023では,中国のFew-shotとZero-shot Entity Linkingで第1位にランクインしている。
論文 参考訳(メタデータ) (2023-08-07T07:39:43Z) - iMETRE: Incorporating Markers of Entity Types for Relation Extraction [0.0]
文レベルの関係抽出は、文脈文が与えられた2つのエンティティ間の関係を特定することを目的としている。
本稿では,金融データセットREFinDにおける関係抽出の課題にアプローチする。
論文 参考訳(メタデータ) (2023-06-30T20:54:41Z) - GDB: Gated convolutions-based Document Binarization [0.0]
我々は、ゲーティング値の学習としてテキスト抽出を定式化し、不正確なストロークエッジ抽出の問題を解決するために、エンドツーエンドのゲート畳み込みネットワーク(GDB)を提案する。
提案するフレームワークは,2つの段階から構成される。第1に,事前マスクとエッジを供給して,より正確な特徴マップを得るために,エッジブランチを付加した粗いサブネットワークを訓練する。
第2に、シャープエッジに基づくゲート畳み込みにより第1ステージの出力を洗練させるために、精製サブネットワークをカスケードする。
論文 参考訳(メタデータ) (2023-02-04T02:56:40Z) - DecoupleNet: Decoupled Network for Domain Adaptive Semantic Segmentation [78.30720731968135]
セマンティックセグメンテーションにおける教師なしドメイン適応は、高価なピクセル単位のアノテーションへの依存を軽減するために提起されている。
我々は、ソースドメインのオーバーフィットを軽減し、最終的なモデルをセグメント化タスクに集中できるようにするDecoupleNetを提案する。
我々はまた、自己識別(SD)を推進し、擬似ラベルでより識別可能なターゲットドメイン特徴を学習するための補助分類器を導入した。
論文 参考訳(メタデータ) (2022-07-20T15:47:34Z) - AlignSeg: Feature-Aligned Segmentation Networks [109.94809725745499]
本稿では,機能集約プロセスにおける誤アライメント問題に対処するために,特徴適応型ネットワーク(AlignSeg)を提案する。
我々のネットワークは、それぞれ82.6%と45.95%という新しい最先端のmIoUスコアを達成している。
論文 参考訳(メタデータ) (2020-02-24T10:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。