論文の概要: Interpretability of Machine Learning: Recent Advances and Future
Prospects
- arxiv url: http://arxiv.org/abs/2305.00537v1
- Date: Sun, 30 Apr 2023 17:31:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 14:47:00.884706
- Title: Interpretability of Machine Learning: Recent Advances and Future
Prospects
- Title(参考訳): 機械学習の解釈可能性:最近の進歩と将来展望
- Authors: Lei Gao, and Ling Guan
- Abstract要約: 機械学習(ML)の普及は、様々なマルチメディアコンテンツの研究に前例のない関心を集めている。
現代のML、特にディープニューラルネットワーク(DNN)におけるブラックボックスの性質は、MLベースの表現学習において主要な課題となっている。
本稿では,MLの解釈可能性に関する最近の進歩と今後の展望について述べる。
- 参考スコア(独自算出の注目度): 21.68362950922772
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proliferation of machine learning (ML) has drawn unprecedented interest
in the study of various multimedia contents such as text, image, audio and
video, among others. Consequently, understanding and learning ML-based
representations have taken center stage in knowledge discovery in intelligent
multimedia research and applications. Nevertheless, the black-box nature of
contemporary ML, especially in deep neural networks (DNNs), has posed a primary
challenge for ML-based representation learning. To address this black-box
problem, the studies on interpretability of ML have attracted tremendous
interests in recent years. This paper presents a survey on recent advances and
future prospects on interpretability of ML, with several application examples
pertinent to multimedia computing, including text-image cross-modal
representation learning, face recognition, and the recognition of objects. It
is evidently shown that the study of interpretability of ML promises an
important research direction, one which is worth further investment in.
- Abstract(参考訳): 機械学習(ML)の普及は、テキスト、画像、オーディオ、ビデオなど、様々なマルチメディアコンテンツの研究に前例のない関心を集めている。
その結果、MLに基づく表現の理解と学習は、インテリジェントなマルチメディア研究と応用において、知識発見の中心を成している。
それでも、特にディープニューラルネットワーク(DNN)における現代MLのブラックボックスの性質は、MLベースの表現学習において大きな課題となっている。
このブラックボックス問題に対処するため、MLの解釈可能性の研究は近年、大きな関心を集めている。
本稿では,mlの解釈可能性に関する最近の進歩と今後の展望について,テキスト-画像クロスモーダル表現学習,顔認識,オブジェクト認識など,マルチメディアコンピューティングに関連するいくつかの応用例を紹介する。
MLの解釈可能性の研究は、さらなる投資に値する重要な研究方向性を約束していることが明らかである。
関連論文リスト
- Rethinking Interpretability in the Era of Large Language Models [76.1947554386879]
大規模言語モデル(LLM)は、幅広いタスクにまたがる顕著な機能を示している。
自然言語で説明できる能力により、LLMは人間に与えられるパターンのスケールと複雑さを拡大することができる。
これらの新しい機能は、幻覚的な説明や膨大な計算コストなど、新しい課題を提起する。
論文 参考訳(メタデータ) (2024-01-30T17:38:54Z) - Incorporating Visual Experts to Resolve the Information Loss in
Multimodal Large Language Models [121.83413400686139]
本稿では,MLLMの視覚知覚能力を向上させるために,知識の混合強化機構を提案する。
本稿では,マルチタスクエンコーダとビジュアルツールを既存のMLLM訓練と推論パイプラインに組み込む新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T02:02:34Z) - Taking the Next Step with Generative Artificial Intelligence: The
Transformative Role of Multimodal Large Language Models in Science Education [14.679589098673416]
MLLM(Multimodal Large Language Models)は、テキスト、音声、視覚入力を含むマルチモーダルデータを処理できる。
本稿では,科学教育の中心的な側面におけるMLLMの変革的役割について,模範的な革新的な学習シナリオを提示することによって考察する。
論文 参考訳(メタデータ) (2024-01-01T18:11:43Z) - Model-driven Engineering for Machine Learning Components: A Systematic
Literature Review [8.810090413018798]
MDE4ML の使用の背景にある主要な動機を明らかにするため,いくつかの分野の研究を分析した。
また,既存の文献のギャップについても論じ,今後の研究を推奨する。
論文 参考訳(メタデータ) (2023-11-01T04:29:47Z) - Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object
Detection [72.36017150922504]
教師の融合変換器から学生検出器へ学習した文脈知識を伝達するためのマルチモーダルな文脈知識蒸留フレームワーク MMC-Det を提案する。
多様なマルチモーダルマスキング言語モデリングは、従来のマルチモーダルマスキング言語モデリング(MLM)に基づくオブジェクト分散制約により実現される。
論文 参考訳(メタデータ) (2023-08-30T08:33:13Z) - Quantum-Inspired Machine Learning: a Survey [32.913044758923455]
量子インスパイアされた機械学習(QiML)は急成長する分野であり、研究者から世界的な注目を集めている。
本調査では,テンソルネットワークシミュレーションや復号化アルゴリズムなど,QiMLのさまざまな研究領域について調査する。
QiMLが進化を続けるにつれて、量子力学、量子コンピューティング、そして古典的な機械学習から引き出された、数多くの将来の発展が予想される。
論文 参考訳(メタデータ) (2023-08-22T08:29:09Z) - A Survey on Multimodal Large Language Models [56.754753799607585]
マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために、脳として強力な大規模言語モデルを使用する。
MLLMの驚くべき創発的能力、例えば画像に基づくストーリーの作成やOCRのない数学推論は、伝統的な手法ではまれである。
論文 参考訳(メタデータ) (2023-06-23T15:21:52Z) - Interpretability and accessibility of machine learning in selected food
processing, agriculture and health applications [0.0]
MLベースのシステムの解釈可能性の欠如は、これらの強力なアルゴリズムの普及の大きな障害である。
自動モデル設計によるMLアクセシビリティ向上のために、新たなテクニックが登場している。
本稿では,グローバル問題における機械学習の解釈可能性とアクセシビリティ向上に向けた取り組みについて概説する。
論文 参考訳(メタデータ) (2022-11-30T02:44:13Z) - Lost in Translation: Reimagining the Machine Learning Life Cycle in
Education [12.802237736747077]
機械学習(ML)技術は、教育においてますます普及している。
ML技術が長年の教育原則と目標をどのように支えているかを調べる必要がある。
本研究では,教育専門家へのインタビューから得られた質的な洞察をもとに,この複雑な景観を考察した。
論文 参考訳(メタデータ) (2022-09-08T17:14:01Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - Understanding the Usability Challenges of Machine Learning In
High-Stakes Decision Making [67.72855777115772]
機械学習(ML)は、多種多様な成長を続ける一連のドメインに適用されている。
多くの場合、MLやデータサイエンスの専門知識を持たないドメインの専門家は、ML予測を使用してハイステークな意思決定を行うように求められます。
児童福祉スクリーニングにおけるMLユーザビリティの課題について,児童福祉スクリーニング者との一連のコラボレーションを通じて検討する。
論文 参考訳(メタデータ) (2021-03-02T22:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。