論文の概要: EXAONE 4.5 Technical Report
- arxiv url: http://arxiv.org/abs/2604.08644v1
- Date: Thu, 09 Apr 2026 17:51:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.515444
- Title: EXAONE 4.5 Technical Report
- Title(参考訳): EXAONE 4.5テクニカルレポート
- Authors: Eunbi Choi, Kibong Choi, Sehyun Chun, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Ahra Jo, Hyunjik Jo, Yeonsik Jo, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Changhun Lee, Haeju Lee, Jinsik Lee, Kyungmin Lee, Sangha Park, Kwangrok Ryoo, Minju Seo, Sejong Yang, Heuiyeen Yeen, Hwan Chang, Stanley Jungkyu Choi, Yejin Choi, Kyubeen Han, Joonwon Jang, Kijeong Jeon, Geunyeong Jeong, Gerrard Jeongwon Jo, Jiyeon Jung, Daeseong Kim, Dohoon Kim, Dohyun Kim, Hyunseo Kim, Minu Kim, Myoungshin Kim, Youchul Kim, Byungoh Ko, Christopher Lee, Edward Hwayoung Lee, Honglak Lee, Jiyoung Lee, Sangeun Lee, Seungwon Lim, Woohyung Lim, Jueun Mun, Jaewoo Park, Jimin Park, Jinho Park, Yongmin Park, Wooseok Seo, Yongwoo Song, Sihyuk Yi, Kyungjae Yoo, Sangyeon Yoon,
- Abstract要約: 本報告では,LG AI Research による初のオープンウェイトビジョン言語モデル EXAONE 4.5 を紹介する。
EXAONE 4.5は、既存のEXAONE 4.0フレームワークに専用のビジュアルエンコーダを統合することで設計されている。
このモデルは、注意深いキュレーションを伴う大規模データ、特にドキュメント中心のコーパスを強調するために訓練されている。
- 参考スコア(独自算出の注目度): 74.37330398684594
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This technical report introduces EXAONE 4.5, the first open-weight vision language model released by LG AI Research. EXAONE 4.5 is architected by integrating a dedicated visual encoder into the existing EXAONE 4.0 framework, enabling native multimodal pretraining over both visual and textual modalities. The model is trained on large-scale data with careful curation, particularly emphasizing document-centric corpora that align with LG's strategic application domains. This targeted data design enables substantial performance gains in document understanding and related tasks, while also delivering broad improvements across general language capabilities. EXAONE 4.5 extends context length up to 256K tokens, facilitating long-context reasoning and enterprise-scale use cases. Comparative evaluations demonstrate that EXAONE 4.5 achieves competitive performance in general benchmarks while outperforming state-of-the-art models of similar scale in document understanding and Korean contextual reasoning. As part of LG's ongoing effort toward practical industrial deployment, EXAONE 4.5 is designed to be continuously extended with additional domains and application scenarios to advance AI for a better life.
- Abstract(参考訳): この技術レポートでは、LG AI Researchがリリースした最初のオープンウェイトビジョン言語モデルであるEXAONE 4.5を紹介する。
EXAONE 4.5は、既存のEXAONE 4.0フレームワークに専用のビジュアルエンコーダを統合することで設計されており、視覚とテキストの両方のモダリティに対してネイティブなマルチモーダル事前トレーニングを可能にする。
このモデルは、注意深いキュレーションを伴う大規模データ、特にLGの戦略的アプリケーションドメインと整合したドキュメント中心のコーパスを強調して訓練されている。
このターゲットデータ設計は、ドキュメント理解と関連するタスクにおいて、大幅なパフォーマンス向上を可能にすると同時に、汎用言語機能にわたって広範な改善を提供する。
EXAONE 4.5はコンテキスト長を256Kトークンまで拡張し、長いコンテキスト推論とエンタープライズ規模のユースケースを容易にします。
EXAONE 4.5は、文書理解や韓国の文脈推論において、類似のスケールの最先端モデルよりも優れた性能を示した。
LGの実践的産業展開に向けた継続的な取り組みの一環として、EXAONE 4.5は、AIをよりよい寿命に進めるために、追加のドメインとアプリケーションシナリオで継続的に拡張されるように設計されている。
関連論文リスト
- The Llama 4 Herd: Architecture, Training, Evaluation, and Deployment Notes [584.7162994485712]
この文書はMetas Llama 4モデルファミリーに関する技術詳細を公表している。
i) リリースされた亜種(Scout と Maverick)とより広い群れの文脈を要約する。
目標は、正確なソース支援の事実を必要とする研究者や実践者に対して、コンパクトな技術的参照を提供することだ。
論文 参考訳(メタデータ) (2026-01-15T21:06:38Z) - Contrastive Learning Using Graph Embeddings for Domain Adaptation of Language Models in the Process Industry [6.231880333264743]
本稿では,プロセス産業領域にSciNCLを適用する方法について検討する。
実験により, 言語モデルにグラフ埋め込み(GE)から派生した三重項を微調整することにより, 最先端のmE5テキストエンコーダよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2025-10-06T09:36:20Z) - EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes [42.31740630042654]
EXAONE 4.0は、EXAONE 3.5の優れた使いやすさとEXAONE Deepの高度な推論能力の両方を達成するために、非推論モードと推論モードを統合している。
EXAONE 4.0シリーズは、高性能に最適化された中型32Bモデルと、オンデバイスアプリケーション用に設計された小型1.2Bモデルである。
論文 参考訳(メタデータ) (2025-07-15T15:24:51Z) - Eka-Eval : A Comprehensive Evaluation Framework for Large Language Models in Indian Languages [1.1957520154275776]
EKA-evalは、9つの主要な評価カテゴリに35以上のベンチマークを統合する統合評価フレームワークである。
モジュールアーキテクチャによる11のコア機能、Hugging Faceとプロプライエタリなモデルとのシームレスな統合、プラグインとプレイのユーザビリティを提供する。
フレームワークはオープンソースで、https://github.com/lingo-iitgn/eka-eval.comで公開されている。
論文 参考訳(メタデータ) (2025-07-02T16:07:54Z) - The All-Seeing Project V2: Towards General Relation Comprehension of the Open World [58.40101895719467]
本稿では,画像のオブジェクト関係を理解するために設計された新しいモデルとデータセットであるAll-Seeing Project V2を紹介する。
本稿では,テキスト生成,オブジェクトローカライゼーション,関係理解の定式化を関係会話タスクに統合するAll-Seeing Model V2を提案する。
我々のモデルは、画像内の全ての物体を知覚・認識するだけでなく、それらの間の複雑な関係グラフの把握にも優れている。
論文 参考訳(メタデータ) (2024-02-29T18:59:17Z) - Translation and Fusion Improves Zero-shot Cross-lingual Information Extraction [18.926993352330797]
本稿では,低リソース言語データの英語翻訳をモデルに微調整したフレームワークであるTransFusionを提案する。
GoLLIE-TFは、IEタスクのための言語間命令チューニング LLM であり、ハイソース言語と低リソース言語のパフォーマンスギャップを埋めるように設計されている。
論文 参考訳(メタデータ) (2023-05-23T01:23:22Z) - Text Embeddings by Weakly-Supervised Contrastive Pre-training [98.31785569325402]
E5は最先端のテキスト埋め込みのファミリーであり、幅広いタスクにうまく転送される。
E5は、テキストの単一ベクトル表現を必要とするタスクに対して、汎用的な埋め込みモデルとして簡単に使用できる。
論文 参考訳(メタデータ) (2022-12-07T09:25:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。