論文の概要: BOND: Bootstrapping From-Scratch Name Disambiguation with Multi-task Promoting
- arxiv url: http://arxiv.org/abs/2404.08322v1
- Date: Fri, 12 Apr 2024 08:28:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-15 15:35:59.536666
- Title: BOND: Bootstrapping From-Scratch Name Disambiguation with Multi-task Promoting
- Title(参考訳): BOND:マルチタスクプロモートによるボトムスクラッチ名の曖昧化
- Authors: Yuqing Cheng, Bo Chen, Fanjin Zhang, Jie Tang,
- Abstract要約: 本稿では,ローカルおよびグローバルな情報伝達信号をブートストラップして,エンドツーエンドで相互にプロモートするBONDを提案する。
実験結果は、BONDの優位性を確立し、他の先進的なベースラインよりもかなりの差で上回った。
アンサンブルとポストマッチのテクニックを取り入れたボンド+は、WhoIsWhoコンペティションのトップメソッドと競合する。
- 参考スコア(独自算出の注目度): 13.410082351513623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: From-scratch name disambiguation is an essential task for establishing a reliable foundation for academic platforms. It involves partitioning documents authored by identically named individuals into groups representing distinct real-life experts. Canonically, the process is divided into two decoupled tasks: locally estimating the pairwise similarities between documents followed by globally grouping these documents into appropriate clusters. However, such a decoupled approach often inhibits optimal information exchange between these intertwined tasks. Therefore, we present BOND, which bootstraps the local and global informative signals to promote each other in an end-to-end regime. Specifically, BOND harnesses local pairwise similarities to drive global clustering, subsequently generating pseudo-clustering labels. These global signals further refine local pairwise characterizations. The experimental results establish BOND's superiority, outperforming other advanced baselines by a substantial margin. Moreover, an enhanced version, BOND+, incorporating ensemble and post-match techniques, rivals the top methods in the WhoIsWho competition.
- Abstract(参考訳): 学界プラットフォームのための信頼性の高い基盤を確立するためには,学名の曖昧さが不可欠である。
これは、同一人物によって書かれた文書を、異なる実生活の専門家を表すグループに分割することを含む。
典型的には、このプロセスは2つの分離されたタスクに分けられる: 文書間のペアの類似性を局所的に推定し、その後グローバルにこれらの文書を適切なクラスタにグループ化する。
しかし、このような分離されたアプローチは、しばしばこれらの相互接続されたタスク間の最適な情報交換を阻害する。
そこで本研究では,ローカルおよびグローバルな情報伝達信号をブートストラップして,エンドツーエンドで相互にプロモートするBONDを提案する。
具体的には、BONDは局所的なペアの類似性を利用してグローバルクラスタリングを駆動し、その後擬似クラスタリングラベルを生成する。
これらのグローバル信号は、さらに局所的なペアワイズ特性を洗練させる。
実験結果は、BONDの優位性を確立し、他の先進的なベースラインよりもかなりの差で上回った。
さらに、アンサンブルとポストマッチのテクニックを取り入れた拡張版であるBOND+は、WhoIsWhoコンペティションのトップメソッドと競合する。
関連論文リスト
- FedCCL: Federated Dual-Clustered Feature Contrast Under Domain Heterogeneity [43.71967577443732]
フェデレートラーニング(FL)は、エッジクライアントと中央サーバとのコラボレーションを通じて、プライバシ保護のニューラルネットワークトレーニングパラダイムを促進する。
最近の研究は、単に正規化の形式として平均的な信号を使い、これらの非IID課題の1つの側面にのみ焦点をあてることに限られている。
マルチクラスタ機能を持つコントラストベースのFLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-14T13:56:30Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Towards Distribution-Agnostic Generalized Category Discovery [51.52673017664908]
データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文 参考訳(メタデータ) (2023-10-02T17:39:58Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Relational Proxies: Emergent Relationships as Fine-Grained
Discriminators [52.17542855760418]
本稿では,オブジェクトのグローバル部分とローカル部分の間の情報を利用してラベルを符号化する手法を提案する。
我々は、理論的な結果に基づいてプロキシを設計し、7つの挑戦的なきめ細かいベンチマークデータセットに基づいて評価する。
また、この理論を実験的に検証し、複数のベンチマークで一貫した結果を得る。
論文 参考訳(メタデータ) (2022-10-05T11:08:04Z) - Towards Federated Clustering: A Federated Fuzzy $c$-Means Algorithm
(FFCM) [0.0]
Federated Learning(FL)は、分散データを持つ複数のパーティが共同で機械学習(ML)モデルをトレーニングする環境である。
我々は、この研究領域が自分自身にどのように関心を持つか、また、非独立に特定された分散データ(すなわち、d.d.)のような問題にどのように対処するかを説明する。
本研究では,グローバルクラスタセンターを計算し,その挙動を数値実験により評価する2つの手法を提案する。
論文 参考訳(メタデータ) (2022-01-18T21:22:28Z) - A Proposition-Level Clustering Approach for Multi-Document Summarization [82.4616498914049]
クラスタリングアプローチを再検討し、より正確な情報アライメントの提案をグループ化します。
提案手法は,有意な命題を検出し,それらをパラフラスティックなクラスタに分類し,その命題を融合して各クラスタの代表文を生成する。
DUC 2004 とTAC 2011 データセットでは,従来の最先端 MDS 法よりも要約法が優れている。
論文 参考訳(メタデータ) (2021-12-16T10:34:22Z) - Local-Global Associative Frame Assemble in Video Re-ID [57.7470971197962]
ビデオ列から自動生成されたオブジェクト境界ボックスにおける雑音および非表現フレームは、ビデオ再識別(Re-ID)における識別表現の学習に困難をもたらす
既存の手法の多くは、局所的な部分アライメントまたはグローバルな外観相関によって、ビデオフレームの重要性を個別に評価することで、この問題に対処している。
本研究では,局所的なアライメントとグローバルな相関関係を共同で検討し,相互の促進・強化について考察する。
論文 参考訳(メタデータ) (2021-10-22T19:07:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。