論文の概要: Evaluation of GPT-4o & GPT-4o-mini's Vision Capabilities for Salt Evaporite Identification
- arxiv url: http://arxiv.org/abs/2412.10587v1
- Date: Fri, 13 Dec 2024 22:02:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:02:56.353557
- Title: Evaluation of GPT-4o & GPT-4o-mini's Vision Capabilities for Salt Evaporite Identification
- Title(参考訳): GPT-4oとGPT-4o-miniの塩気化物識別機能の評価
- Authors: Deven B. Dangi, Beni B. Dangi, Oliver Steinbock,
- Abstract要約: 本稿では, 染色画像から塩分を同定する手法として, OpenAI の視覚モデル (GPT-4o と GPT-4o-mini) の可能性について検討する。
GPT-4o モデルは 57% の精度と 0.52 F1 のスコアを達成し、ランダムチャンス (8%) と GPT-4o mini (1% の精度) の両方を著しく上回った。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Identifying salts from images of their 'stains' has diverse practical applications. While specialized AI models are being developed, this paper explores the potential of OpenAI's state-of-the-art vision models (GPT-4o and GPT-4o-mini) as an immediate solution. Testing with 12 different types of salts, the GPT-4o model achieved 57% accuracy and a 0.52 F1 score, significantly outperforming both random chance (8%) and GPT-4o mini (11% accuracy). Results suggest that current vision models could serve as an interim solution for salt identification from stain images.
- Abstract(参考訳): その「土」の画像から塩を同定することは、様々な応用がある。
専門的なAIモデルが開発されているが,本論文では,OpenAIの最先端ビジョンモデル(GPT-4oとGPT-4o-mini)が即時解である可能性について検討する。
12種類の塩を試験したところ、GPT-4oモデルは57%の精度と0.52 F1のスコアを達成し、ランダムな確率(8%)とGPT-4o mini(11%の精度)を著しく上回った。
その結果、現在の視覚モデルは、染色画像から塩分を識別するための中間解として機能する可能性が示唆された。
関連論文リスト
- UM_FHS at TREC 2024 PLABA: Exploration of Fine-tuning and AI agent approach for plain language adaptations of biomedical text [3.223303935767146]
TREC 2024 PLABA トラックへの投稿は,K8 レベルの学生 (13~14歳) を対象に, バイオメディカル・抽象化の簡易化を目的としている。
我々は,OpenAIのGPt-4oとGPt-4o-miniモデルを用いて,ベースラインプロンプトエンジニアリング,2AIエージェントアプローチ,微調整という3つのアプローチを検証した。
その結果、GPt-4o-miniモデルを用いた2エージェントアプローチとベースラインプロンプトエンジニアリングは質的性能が優れ、微調整モデルは精度と完全性に優れるが、より単純ではないことがわかった。
論文 参考訳(メタデータ) (2025-02-19T23:07:16Z) - Interpretable Droplet Digital PCR Assay for Trustworthy Molecular Diagnostics [6.936364565330349]
I2ddPCRは、GPT-4o Multimodal Large Language Model (MLLM)とフロントエンド予測モデル(ドロップレットのセグメンテーションと分類のための)を統合する包括的なフレームワークである。
このアプローチは最先端モデルを超え、信号-雑音比(SNR)の異なる複雑なddPCR画像を99.05%の精度で処理できる。
論文 参考訳(メタデータ) (2025-01-16T00:33:17Z) - Vision-Language and Large Language Model Performance in Gastroenterology: GPT, Claude, Llama, Phi, Mistral, Gemma, and Quantized Models [0.06555599394344236]
本研究では,大言語モデル (LLMs) と視覚言語モデル (VLMs) の胃腸科学における医学的推論性能を評価する。
我々は,300の胃腸科検査式多票質問紙を使用し,そのうち138は画像を含んでいた。
論文 参考訳(メタデータ) (2024-08-25T14:50:47Z) - SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation [54.31974179325654]
本稿では,テキスト・画像の高速生成を実現するために,SCott(Consistency Distillation)を提案する。
SCottは、事前訓練された教師モデルの通常の微分方程式解法に基づくサンプリングプロセスを学生に蒸留する。
MSCOCO-2017 5Kデータセットと安定拡散V1.5の教師は、SCottが22.1のFID(Frechet Inceptio Distance)を達成し、1ステップのInstaFlowの23.4を上回り、4ステップのUFOGenと一致する。
論文 参考訳(メタデータ) (2024-03-03T13:08:32Z) - How Easy is It to Fool Your Multimodal LLMs? An Empirical Analysis on Deceptive Prompts [54.07541591018305]
提案するMAD-Benchは,既存のオブジェクト,オブジェクト数,空間関係などの5つのカテゴリに分割した1000の試験サンプルを含むベンチマークである。
我々は,GPT-4v,Reka,Gemini-Proから,LLaVA-NeXTやMiniCPM-Llama3といったオープンソースモデルに至るまで,一般的なMLLMを包括的に分析する。
GPT-4oはMAD-Bench上で82.82%の精度を達成するが、実験中の他のモデルの精度は9%から50%である。
論文 参考訳(メタデータ) (2024-02-20T18:31:27Z) - Image and Data Mining in Reticular Chemistry Using GPT-4V [5.440238820637818]
GPT-4Vは、ChatGPTまたはAPIを通じてアクセス可能な、拡張された視覚機能を備えた大きな言語モデルである。
本研究は,GPT-4Vが金属-有機化合物の複雑なデータをナビゲートし,得ることができることを示す。
論文 参考訳(メタデータ) (2023-12-09T05:05:25Z) - Online Non-Destructive Moisture Content Estimation of Filter Media
During Drying Using Artificial Neural Networks [95.42181254494287]
粗いろ過媒体製品の乾燥工程において, 水分量 (MC) の推定が重要である。
人工ニューラルネットワーク(ANN)に基づく手法は、文献で報告されている最先端のMC推定手法と比較する。
実験結果から, ANNとオーブン設定データ, 乾燥時間, 製品温度を組み合わせることで, バルクフィルターメディア製品のMCを確実に推定できることがわかった。
論文 参考訳(メタデータ) (2023-03-27T19:37:53Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Improved Techniques for Training Score-Based Generative Models [104.20217659157701]
本研究では,高次元空間におけるスコアモデルからの学習とサンプリングに関する新しい理論的解析を行う。
スコアベースの生成モデルを前例のない解像度で画像に拡張することができる。
我々のスコアベースモデルは、様々な画像データセットで最良クラスGANに匹敵する高忠実度サンプルを生成することができる。
論文 参考訳(メタデータ) (2020-06-16T09:17:17Z) - Comparative analysis of machine learning models for Ammonia Capture of
Ionic Liquids [1.1988695717766686]
文献レビューを行い, ILのアンモニア溶解度を推定するための予測モデルについて考察した。
影響因子は分子量,臨界温度,ILの圧力であった。
この研究は、状態方程式がアンモニアの溶解度を正確に推定できないことを示しており、対照的に人工知能の手法は有望な結果を生み出している。
論文 参考訳(メタデータ) (2020-02-19T23:50:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。