論文の概要: From raw affiliations to organization identifiers
- arxiv url: http://arxiv.org/abs/2505.07577v1
- Date: Mon, 12 May 2025 13:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.416583
- Title: From raw affiliations to organization identifiers
- Title(参考訳): 生のアフィリエイトから組織識別子へ
- Authors: Myrto Kallipoliti, Serafeim Chatzopoulos, Miriam Baglioni, Eleni Adamidi, Paris Koloveas, Thanasis Vergoulis,
- Abstract要約: 既存のアプローチでは、複数の組織や外部情報の言及を含むアフィリエイト文字列の複雑さに対処できない。
本稿では,これらの課題に対処するための新しいアプローチであるAffRoについて紹介する。
その結果, 複雑なアフィリエイト文字列から組織を正確に同定する上で, AffRpの有効性が示された。
- 参考スコア(独自算出の注目度): 0.343054185715673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate affiliation matching, which links affiliation strings to standardized organization identifiers, is critical for improving research metadata quality, facilitating comprehensive bibliometric analyses, and supporting data interoperability across scholarly knowledge bases. Existing approaches fail to handle the complexity of affiliation strings that often include mentions of multiple organizations or extraneous information. In this paper, we present AffRo, a novel approach designed to address these challenges, leveraging advanced parsing and disambiguation techniques. We also introduce AffRoDB, an expert-curated dataset to systematically evaluate affiliation matching algorithms, ensuring robust benchmarking. Results demonstrate the effectiveness of AffRp in accurately identifying organizations from complex affiliation strings.
- Abstract(参考訳): アフィリエイト文字列を標準化された組織識別子にリンクする正確なアフィリエイトマッチングは、研究メタデータの品質向上、総合的な書誌分析の促進、学術知識ベース間のデータ相互運用性のサポートに重要である。
既存のアプローチでは、複数の組織や外部情報の言及を含むアフィリエイト文字列の複雑さに対処できない。
本稿では,これらの課題に対処するための新しいアプローチであるAffRoについて述べる。
AffRoDBは、アフィリエイトマッチングアルゴリズムを体系的に評価し、堅牢なベンチマークを保証する。
その結果, 複雑なアフィリエイト文字列から組織を正確に同定する上で, AffRpの有効性が示された。
関連論文リスト
- Full Triple Matcher: Integrating all triple elements between heterogeneous Knowledge Graphs [0.09471093245585005]
知識グラフ(KG)は構造化情報の表現と推論のための強力なツールである。
現在のアプローチは、多様で複雑なコンテキストを統合する必要があるシナリオでは不足する可能性がある。
ラベルマッチングと3重マッチングからなる新しいKG積分法を提案する。
論文 参考訳(メタデータ) (2025-07-20T07:46:55Z) - Leveraging Large Language Models for Tacit Knowledge Discovery in Organizational Contexts [0.4499833362998487]
本稿では,従業員とのインタラクションを通じて,データセット記述を反復的に再構築するエージェントベースのフレームワークを提案する。
本研究の結果から, 自己批判的フィードバックスコアは外部文献評論家のスコアと強く相関し, 94.9%の完全知識リコールが達成された。
これらの知見は、エージェントが組織的な複雑さをナビゲートし、そうでなければアクセスできないような断片化された知識をキャプチャする能力を強調している。
論文 参考訳(メタデータ) (2025-07-04T21:09:32Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - Cooperation of Experts: Fusing Heterogeneous Information with Large Margin [11.522412489437702]
CoE(Cooperation of Experts)フレームワークは、マルチタイプ情報を統一された異種多重ネットワークにエンコードする。
このフレームワークでは、専用のエンコーダがドメイン固有の専門家として機能し、それぞれが特定の意味空間における異なる関係パターンの学習に特化している。
論文 参考訳(メタデータ) (2025-05-27T08:04:32Z) - CORG: Generating Answers from Complex, Interrelated Contexts [57.213304718157985]
現実世界のコーパスでは、知識は文書間で頻繁に再帰するが、曖昧な命名、時代遅れの情報、エラーのためにしばしば矛盾を含む。
以前の研究では、言語モデルはこれらの複雑さに苦しむことが示されており、典型的には孤立した単一要因に焦点を当てている。
複数のコンテキストを個別に処理されたグループに整理するフレームワークであるContext Organizer (CORG)を紹介する。
論文 参考訳(メタデータ) (2025-04-25T02:40:48Z) - Anomaly Detection in Double-entry Bookkeeping Data by Federated Learning System with Non-model Sharing Approach [3.827294988616478]
異常検出は財務監査において不可欠であり、効果的な検出には複数の組織から大量のデータを取得する必要があることが多い。
本研究では,モデル学習を単一のコミュニケーションラウンドに合理化するために,データコラボレーション(DC)分析を用いた新しいフレームワークを提案する。
この結果は,人工知能による監査の大幅な進歩を示し,高セキュリティ領域におけるFL手法の可能性を強調した。
論文 参考訳(メタデータ) (2025-01-22T08:53:12Z) - Do You Know What You Are Talking About? Characterizing Query-Knowledge Relevance For Reliable Retrieval Augmented Generation [19.543102037001134]
言語モデル(LM)は幻覚や誤報に悩まされていることが知られている。
外部知識コーパスから検証可能な情報を検索する検索拡張生成(RAG)は、これらの問題に対する具体的な解決策を提供する。
RAG生成品質は、ユーザのクエリと検索したドキュメントの関連性に大きく依存する。
論文 参考訳(メタデータ) (2024-10-10T19:14:55Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - Learning Cross-modality Information Bottleneck Representation for
Heterogeneous Person Re-Identification [61.49219876388174]
Visible-Infrared person re-identification (VI-ReID)は、インテリジェントビデオ監視において重要かつ困難な課題である。
既存の手法は主に共有特徴空間の学習に重点を置いており、可視光と赤外光の相違を減らす。
本稿では,新しい相互情報・モダリティコンセンサスネットワーク,すなわちCMInfoNetを提案し,モダリティ不変な同一性の特徴を抽出する。
論文 参考訳(メタデータ) (2023-08-29T06:55:42Z) - A Framework for Verifiable and Auditable Federated Anomaly Detection [3.639790324866155]
フェデレート・リーン(Federated Leaning)は、機械学習タスクのソリューションのためのエージェントのグループ間の協力を管理する新しいアプローチである。
本稿では,異常検出の特定の場合において,この問題に対処する新しいアルゴリズムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-15T11:34:02Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。