論文の概要: ICE-ID: A Novel Historical Census Data Benchmark Comparing NARS against LLMs, \& a ML Ensemble on Longitudinal Identity Resolution
- arxiv url: http://arxiv.org/abs/2506.13792v1
- Date: Wed, 11 Jun 2025 13:46:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.142103
- Title: ICE-ID: A Novel Historical Census Data Benchmark Comparing NARS against LLMs, \& a ML Ensemble on Longitudinal Identity Resolution
- Title(参考訳): ICE-ID: NARS と LLMs, \& a ML を比較した新しい歴史国勢調査データベンチマーク
- Authors: Gonçalo Hora de Carvalho, Lazar S. Popov, Sander Kaatee, Kristinn R. Thórisson, Tangrui Li, Pétur Húni Björnsson, Jilles S. Dibangoye,
- Abstract要約: ICE-IDは、アイスランドの国勢調査記録の220年 (1703-1920) を含む、歴史的なアイデンティティ解決のための新しいベンチマークデータセットである。
ICE-IDは、複数の世代にわたる長手データにまたがり、名前のバリエーション、人口変動、豊富な系譜リンクをキャプチャする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce ICE-ID, a novel benchmark dataset for historical identity resolution, comprising 220 years (1703-1920) of Icelandic census records. ICE-ID spans multiple generations of longitudinal data, capturing name variations, demographic changes, and rich genealogical links. To the best of our knowledge, this is the first large-scale, open tabular dataset specifically designed to study long-term person-entity matching in a real-world population. We define identity resolution tasks (within and across census waves) with clearly documented metrics and splits. We evaluate a range of methods: handcrafted rule-based matchers, a ML ensemble as well as LLMs for structured data (e.g. transformer-based tabular networks) against a novel approach to tabular data called NARS (Non-Axiomatic Reasoning System) - a general-purpose AI framework designed to reason with limited knowledge and resources. Its core is Non-Axiomatic Logic (NAL), a term-based logic. Our experiments show that NARS is suprisingly simple and competitive with other standard approaches, achieving SOTA at our task. By releasing ICE-ID and our code, we enable reproducible benchmarking of identity resolution approaches in longitudinal settings and hope that ICE-ID opens new avenues for cross-disciplinary research in data linkage and historical analytics.
- Abstract(参考訳): アイスランドの国勢調査記録から220年 (1703-1920) を経た, 歴史的アイデンティティ解決のための新しいベンチマークデータセットICE-IDを紹介した。
ICE-IDは、複数の世代にわたる長手データにまたがり、名前のバリエーション、人口変動、豊富な系譜リンクをキャプチャする。
われわれの知る限りでは、これは現実世界の人口の長期的個人密度マッチングを研究するために特別に設計された、最初の大規模でオープンな表型データセットである。
我々は、(国勢調査波を通した)アイデンティティ解決タスクを、明確に文書化されたメトリクスと分割で定義する。
我々は、NARS(Non-Axiomatic Reasoning System)と呼ばれる表型データに対する新しいアプローチに対して、手作りのルールベースのマーカ、MLアンサンブル、構造化データ(例えば、トランスフォーマーベースの表型ネットワーク)のためのLLM、および限られた知識とリソースを推論するために設計された汎用AIフレームワークなど、様々な手法を評価した。
その中核は、項ベースの論理であるNon-Axiomatic Logic (NAL)である。
実験の結果,NARSは他の標準手法と非常にシンプルで競合し,SOTAを達成できた。
ICE-IDとコードのリリースにより、縦方向設定におけるアイデンティティ解決アプローチの再現可能なベンチマークを可能にし、データリンクと履歴解析の学際的な研究のための新たな道を開くことを期待する。
関連論文リスト
- GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models [75.25348392263676]
オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。
我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-26T08:18:33Z) - LANID: LLM-assisted New Intent Discovery [18.15557766598695]
新しいIntent Discovery(NID)は、既存のものを認識する能力を維持しながら、新しい意図を識別することを目的とした重要なタスクである。
TODSを新しい意図に適応しようとするこれまでの努力は、意味表現の不十分さに悩まされてきた。
我々は,大規模言語モデルを用いた軽量NIDエンコーダのセマンティック表現を強化するフレームワークであるLANIDを提案する。
論文 参考訳(メタデータ) (2025-03-31T05:34:32Z) - Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.37662915542603]
アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。
既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。
本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文 参考訳(メタデータ) (2025-02-15T15:25:38Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - BlendX: Complex Multi-Intent Detection with Blended Patterns [4.852816974803059]
BlendXは、前者よりも多様なパターンを特徴とする洗練されたデータセットのスイートです。
データセット構築には,ルールベースと生成ツール – OpenAIのChatGPT – の両方を使用します。
BlendXの実験によると、最先端のMIDモデルは、新しいデータセットがもたらす課題に苦戦している。
論文 参考訳(メタデータ) (2024-03-27T06:13:04Z) - Diverse Representation Embedding for Lifelong Person Re-Identification [10.824003066938234]
Lifelong Person Re-Identification (LReID)は、連続したデータストリームから継続的に学習し、複数のカメラで個人をマッチングすることを目的としている。
CNNのバックボーンに基づく既存のメソッドは、異なる視点から各インスタンスの表現を調べるには不十分である。
本稿では、まずLReIDのための純粋なトランスフォーマーを探索するDRE(Diverse Representations Embedding)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T04:22:37Z) - Evaluation of Faithfulness Using the Longest Supported Subsequence [52.27522262537075]
本稿では,文脈によって支持される請求項の最長不連続性を計算し,機械生成テキストの忠実さを評価する新しい手法を提案する。
新しい人間アノテーション付きデータセットを使用して、モデルを微調整してLongest Supported Subsequence(LSS)を生成する。
提案手法は,我々のデータセットの忠実度に対する最先端のメトリクスよりも18%向上していることを示す。
論文 参考訳(メタデータ) (2023-08-23T14:18:44Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。