論文の概要: Bridging History with AI A Comparative Evaluation of GPT 3.5, GPT4, and
GoogleBARD in Predictive Accuracy and Fact Checking
- arxiv url: http://arxiv.org/abs/2305.07868v1
- Date: Sat, 13 May 2023 08:58:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 19:08:12.392741
- Title: Bridging History with AI A Comparative Evaluation of GPT 3.5, GPT4, and
GoogleBARD in Predictive Accuracy and Fact Checking
- Title(参考訳): AIによるブリッジング履歴 : 予測精度とFact CheckingにおけるGPT3.5、GPT4、GoogleBARDの比較評価
- Authors: Davut Emre Tasar, Ceren Ocal Tasar
- Abstract要約: 本研究では,LLM 3.5,GPT 4,GoogleBARD の3つの大言語モデルの性能を,与えられたデータに基づいて過去の事象を予測・検証する文脈で評価する。
その結果, GPT 4は優れた性能を示すとともに, 歴史的研究におけるAIの潜在的な可能性を明らかにした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The rapid proliferation of information in the digital era underscores the
importance of accurate historical representation and interpretation. While
artificial intelligence has shown promise in various fields, its potential for
historical fact-checking and gap-filling remains largely untapped. This study
evaluates the performance of three large language models LLMs GPT 3.5, GPT 4,
and GoogleBARD in the context of predicting and verifying historical events
based on given data. A novel metric, Distance to Reality (DTR), is introduced
to assess the models' outputs against established historical facts. The results
reveal a substantial potential for AI in historical studies, with GPT 4
demonstrating superior performance. This paper underscores the need for further
research into AI's role in enriching our understanding of the past and bridging
historical knowledge gaps.
- Abstract(参考訳): デジタル時代の情報の急速な拡散は、正確な歴史的表現と解釈の重要性を強調している。
人工知能は様々な分野で有望だが、歴史的事実チェックやギャップフィリングの可能性を秘めている。
本研究では,LLM 3.5,GPT 4,GoogleBARD の3つの大言語モデルの性能を,与えられたデータに基づいて過去の事象を予測・検証する文脈で評価する。
DTR(Distance to Reality)と呼ばれる新しい指標を導入し、既存の歴史的事実からモデルのアウトプットを評価する。
その結果, GPT 4は優れた性能を示すとともに, 歴史的研究におけるAIの潜在的な可能性を明らかにした。
本稿では,過去の理解を深め,歴史知識のギャップを埋める上でのAIの役割について,さらなる研究の必要性を明らかにする。
関連論文リスト
- Exploring the Potential of the Large Language Models (LLMs) in Identifying Misleading News Headlines [2.0330684186105805]
本研究では、誤解を招くニュースの見出しと誤解を招くニュースの見出しを識別する上で、LLM(Large Language Models)の有効性について検討する。
解析の結果,ChatGPT-4の精度は良好であった。
論文 参考訳(メタデータ) (2024-05-06T04:06:45Z) - Local-Global History-aware Contrastive Learning for Temporal Knowledge
Graph Reasoning [25.497749629866757]
時間的知識グラフのためのブルーローカル・ブルーグロバル履歴対応ブルーコントラストブルーLモデル(ブルーLogCL)を提案する。
最初の課題として、LogCLは、ローカルおよびグローバルな歴史的事実エンコーダに適用されるエンティティ対応の注意機構を提案する。
後者の問題のために、LogCLは4つの歴史的クエリコントラストパターンを設計し、モデルの堅牢性を効果的に改善した。
論文 参考訳(メタデータ) (2023-12-04T03:27:01Z) - Black-Box Analysis: GPTs Across Time in Legal Textual Entailment Task [17.25356594832692]
本稿では,COLIEE Task 4 データセット上での GPT-3.5 (ChatGPT) と GPT-4 の性能解析を行う。
予備的な実験結果から,法的なテキスト・エンタテインメント・タスクの処理におけるモデルの強みや弱点に関する興味深い知見が得られた。
論文 参考訳(メタデータ) (2023-09-11T14:43:54Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - Assessing the Effectiveness of GPT-3 in Detecting False Political
Statements: A Case Study on the LIAR Dataset [0.0]
政治的偽の言明の検出は、情報の整合性を維持し、社会における誤報の拡散を防ぐために不可欠である。
歴史的に、最先端の機械学習モデルは、偽造文を検出する様々な方法を用いていた。
GPT-3のような大規模言語モデルの最近の進歩は、幅広いタスクにおいて最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-06-14T01:16:49Z) - Towards Reliable Misinformation Mitigation: Generalization, Uncertainty,
and GPT-4 [5.313670352036673]
GPT-4は,複数の設定や言語で先行手法より優れていることを示す。
本研究では,不可能な事例を検出し,その結果を強く改善する不確実性に対処する手法を提案する。
この研究は、偽情報と戦うために現実世界の進歩を促す将来のツールの基盤となる。
論文 参考訳(メタデータ) (2023-05-24T09:10:20Z) - Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1188263570629]
OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。
我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。
我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文 参考訳(メタデータ) (2023-03-22T16:51:28Z) - Prompting GPT-3 To Be Reliable [117.23966502293796]
この研究は信頼性を一般化可能性、公平性、校正性、事実性という4つの側面に分解する。
GPT-3はこれらすべての面において,より小型の教師付きモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-17T14:52:39Z) - Citation Trajectory Prediction via Publication Influence Representation
Using Temporal Knowledge Graph [52.07771598974385]
既存のアプローチは主に学術論文の時間的データとグラフデータのマイニングに依存している。
本フレームワークは,差分保存グラフ埋め込み,きめ細かい影響表現,学習に基づく軌道計算という3つのモジュールから構成される。
APSアカデミックデータセットとAIPatentデータセットの両方で実験を行った。
論文 参考訳(メタデータ) (2022-10-02T07:43:26Z) - Artificial Text Detection via Examining the Topology of Attention Maps [58.46367297712477]
トポロジカルデータ分析(TDA)に基づく3種類の解釈可能なトポロジカル特徴を提案する。
BERTモデルから派生した特徴が3つの共通データセットにおいて、カウントベースとニューラルベースベースラインを最大10%上回っていることを実証的に示す。
特徴の探索解析は表面に対する感度と構文的性質を明らかにしている。
論文 参考訳(メタデータ) (2021-09-10T12:13:45Z) - Pre-Trained Models: Past, Present and Future [126.21572378910746]
大規模事前訓練モデル(PTM)は近年大きな成功を収め、人工知能(AI)分野におけるマイルストーンとなった。
知識を巨大なパラメータに格納し、特定のタスクを微調整することで、巨大なパラメータに暗黙的にエンコードされた豊富な知識は、さまざまな下流タスクの恩恵を受けることができる。
AIコミュニティが、モデルをスクラッチから学習するのではなく、下流タスクのバックボーンとしてPTMを採用することは、今、コンセンサスになっている。
論文 参考訳(メタデータ) (2021-06-14T02:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。