論文の概要: From raw affiliations to organization identifiers
- arxiv url: http://arxiv.org/abs/2505.07577v1
- Date: Mon, 12 May 2025 13:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.416583
- Title: From raw affiliations to organization identifiers
- Title(参考訳): 生のアフィリエイトから組織識別子へ
- Authors: Myrto Kallipoliti, Serafeim Chatzopoulos, Miriam Baglioni, Eleni Adamidi, Paris Koloveas, Thanasis Vergoulis,
- Abstract要約: 既存のアプローチでは、複数の組織や外部情報の言及を含むアフィリエイト文字列の複雑さに対処できない。
本稿では,これらの課題に対処するための新しいアプローチであるAffRoについて紹介する。
その結果, 複雑なアフィリエイト文字列から組織を正確に同定する上で, AffRpの有効性が示された。
- 参考スコア(独自算出の注目度): 0.343054185715673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate affiliation matching, which links affiliation strings to standardized organization identifiers, is critical for improving research metadata quality, facilitating comprehensive bibliometric analyses, and supporting data interoperability across scholarly knowledge bases. Existing approaches fail to handle the complexity of affiliation strings that often include mentions of multiple organizations or extraneous information. In this paper, we present AffRo, a novel approach designed to address these challenges, leveraging advanced parsing and disambiguation techniques. We also introduce AffRoDB, an expert-curated dataset to systematically evaluate affiliation matching algorithms, ensuring robust benchmarking. Results demonstrate the effectiveness of AffRp in accurately identifying organizations from complex affiliation strings.
- Abstract(参考訳): アフィリエイト文字列を標準化された組織識別子にリンクする正確なアフィリエイトマッチングは、研究メタデータの品質向上、総合的な書誌分析の促進、学術知識ベース間のデータ相互運用性のサポートに重要である。
既存のアプローチでは、複数の組織や外部情報の言及を含むアフィリエイト文字列の複雑さに対処できない。
本稿では,これらの課題に対処するための新しいアプローチであるAffRoについて述べる。
AffRoDBは、アフィリエイトマッチングアルゴリズムを体系的に評価し、堅牢なベンチマークを保証する。
その結果, 複雑なアフィリエイト文字列から組織を正確に同定する上で, AffRpの有効性が示された。
関連論文リスト
- CORG: Generating Answers from Complex, Interrelated Contexts [57.213304718157985]
現実世界のコーパスでは、知識は文書間で頻繁に再帰するが、曖昧な命名、時代遅れの情報、エラーのためにしばしば矛盾を含む。
以前の研究では、言語モデルはこれらの複雑さに苦しむことが示されており、典型的には孤立した単一要因に焦点を当てている。
複数のコンテキストを個別に処理されたグループに整理するフレームワークであるContext Organizer (CORG)を紹介する。
論文 参考訳(メタデータ) (2025-04-25T02:40:48Z) - Anomaly Detection in Double-entry Bookkeeping Data by Federated Learning System with Non-model Sharing Approach [3.827294988616478]
異常検出は財務監査において不可欠であり、効果的な検出には複数の組織から大量のデータを取得する必要があることが多い。
本研究では,モデル学習を単一のコミュニケーションラウンドに合理化するために,データコラボレーション(DC)分析を用いた新しいフレームワークを提案する。
この結果は,人工知能による監査の大幅な進歩を示し,高セキュリティ領域におけるFL手法の可能性を強調した。
論文 参考訳(メタデータ) (2025-01-22T08:53:12Z) - Do You Know What You Are Talking About? Characterizing Query-Knowledge Relevance For Reliable Retrieval Augmented Generation [19.543102037001134]
言語モデル(LM)は幻覚や誤報に悩まされていることが知られている。
外部知識コーパスから検証可能な情報を検索する検索拡張生成(RAG)は、これらの問題に対する具体的な解決策を提供する。
RAG生成品質は、ユーザのクエリと検索したドキュメントの関連性に大きく依存する。
論文 参考訳(メタデータ) (2024-10-10T19:14:55Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - Learning Cross-modality Information Bottleneck Representation for
Heterogeneous Person Re-Identification [61.49219876388174]
Visible-Infrared person re-identification (VI-ReID)は、インテリジェントビデオ監視において重要かつ困難な課題である。
既存の手法は主に共有特徴空間の学習に重点を置いており、可視光と赤外光の相違を減らす。
本稿では,新しい相互情報・モダリティコンセンサスネットワーク,すなわちCMInfoNetを提案し,モダリティ不変な同一性の特徴を抽出する。
論文 参考訳(メタデータ) (2023-08-29T06:55:42Z) - A Framework for Verifiable and Auditable Federated Anomaly Detection [3.639790324866155]
フェデレート・リーン(Federated Leaning)は、機械学習タスクのソリューションのためのエージェントのグループ間の協力を管理する新しいアプローチである。
本稿では,異常検出の特定の場合において,この問題に対処する新しいアルゴリズムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-15T11:34:02Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。