Decentralized Transformers with Centralized Aggregation are Sample-Efficient Multi-Agent World Models [106.9] 本稿では,分散化された局所力学を拡張性のために学習するマルチエージェントRL(MARL)の新たな世界モデルを提案する。
また、集中表現アグリゲーションを可能にする効果的なソリューションとしてPerceiver Transformerを導入する。
Starcraft Multi-Agent Challenge (SMAC) の結果は、サンプル効率と全体的な性能の両方において、強力なモデルフリーアプローチと既存のモデルベース手法よりも優れていることを示している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:40:03 GMT)
Modular Pluralism: Pluralistic Alignment via Multi-LLM Collaboration [84.5] 大規模言語モデル(LLM)は、文化、人口統計、地域社会の様々な好みをモデル化するのに苦労する。
我々は多元的アライメントのためのマルチLLM協調に基づくモジュラーフレームワークであるモジュラー・プラナリズムを提案する。
我々は,6つのタスクと4つのデータセットによるモジュール型多元性の評価を行った。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:07:40 GMT)
Evaluating Large Vision-and-Language Models on Children's Mathematical Olympiads [74.5] ジョイントビジョンとテキスト推論のためのAI能力の体系的分析は、現在の科学文献に欠けている。
我々は,子どものオリンピアードからのビジュオ言語問題を用いて,その数学的およびアルゴリズム的推論能力に基づいて,最先端のLVLMを評価した。
以上の結果から,近代のLVLMは,高学年の問題解決において,より強力な推論能力を示す一方で,幼児向けの問題に正しく答える基盤が欠如していることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:04:39 GMT)
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions [72.6] Benchは、大規模言語モデルに対して、139のライブラリと7つのドメインから1,140のきめ細かいプログラミングタスクのためのツールとして、複数の関数呼び出しを実行するためのベンチマークである。
評価の結果,LLMは機能コールを正確に使用するための複雑な指示に従うことができず,スコアは最大60%,人的性能は97%と極めて低いことがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:52:04 GMT)
Localizing Events in Videos with Multimodal Queries [71.4] マルチモーダルクエリによるビデオ内のイベントのローカライズのための新しいベンチマークICQを導入する。
4種類の参照イメージと5種類のリファインメントテキストが含まれており、異なるドメインにわたるモデルパフォーマンスを探索することができます。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:53:40 GMT)
MOSSBench: Is Your Multimodal Language Model Oversensitive to Safe Queries? [70.8] 人間は認知の歪みに傾向があり、特定の刺激に対する過大な反応を引き起こす偏見のある思考パターンがある。
本稿では,高度マルチモーダル言語モデル (MLLM) が同様の傾向を示すことを示す。
既存のMLLMの過敏性を引き起こす3種類の刺激を同定する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:26:07 GMT)
Scaling Laws for Fact Memorization of Large Language Models [67.9] 我々は,大規模言語モデルにおける事実知識のスケーリング法則と,異なる種類の事実を記憶する行動について分析する。
LLMの事実知識能力は,モデルサイズや訓練のエポックと線形かつ負の指数法則関係を持つことがわかった。
本研究は,LLMのファクト・ナレッジ・ナレッジ・ラーニングの能力と特徴を明らかにし,LLMのファクト・ナレッジ・アジュメンテーションの方向性を示した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:32:09 GMT)
Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models [66.2] 従来のターンベースのチャットシステムは、ユーザが応答を生成している間に、システムが言葉で対話することを防ぐ。
これらの制限を克服するため,既存のLCMをユーザを聴きながら出力を生成し,ユーザに対して即時フィードバックを提供する。
クエリとレスポンスの時間スライスを交互に行うデータセットを構築し、インスタントインタラクションにおける典型的なフィードバックタイプをカバーする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:20:10 GMT)
The Perils of Optimizing Learned Reward Functions: Low Training Error Does Not Guarantee Low Regret [64.0] 強化学習では、意図したタスクをキャプチャする報酬関数を指定することが非常に難しい。
本稿では,報奨モデルの十分低いテスト誤差が,最悪の場合の後悔を保証できることを数学的に示す。
次に、RLHFのような手法でよく用いられるポリシー正則化手法を用いても、同様の問題が持続することを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:43:51 GMT)
The Music Maestro or The Musically Challenged, A Massive Music Evaluation Benchmark for Large Language Models [63.5] ZIQI-Evalは、大規模言語モデル(LLM)の音楽関連能力を評価するために設計されたベンチマークである。
ZIQI-Evalは10の主要なカテゴリと56のサブカテゴリをカバーし、14,000以上の精巧にキュレートされたデータエントリをカバーしている。
その結果,全てのLLMはZIQI-Evalベンチマークでは性能が悪く,音楽能力の向上の余地が示唆された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:24:42 GMT)
Aligning Text-to-Image Diffusion Models with Reward Backpropagation [62.5] 本稿では,報酬勾配のエンドツーエンドのバックプロパゲーションを用いて,拡散モデルを下流の報酬関数に整合させる手法であるAlignPropを提案する。
AlignPropは、選択肢よりも少ないトレーニングステップでより高い報酬を得るが、概念的にはシンプルである。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:26:18 GMT)
Long and Short Guidance in Score identity Distillation for One-Step Text-to-Image Generation [62.3] 拡散に基づくテキスト・画像生成モデルは、テキスト記述と整合した画像を生成する能力を示した。
我々は,事前学習した安定拡散モデルを効率よく抽出するために,Long and Short Classifier-free Guide (LSG)を開発した。
一段生成器で合成された偽画像のみを訓練することにより、LSGを備えたSiDはFIDとCLIPのスコアを急速に改善する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:48:56 GMT)
Complex Reasoning over Logical Queries on Commonsense Knowledge Graphs [61.8] 論理クエリをサンプリングして作成した新しいデータセットであるCOM2(COMplex COMmonsense)を提示する。
我々は、手書きのルールと大きな言語モデルを用いて、複数の選択とテキスト生成の質問に言語化します。
COM2でトレーニングされた言語モデルでは、複雑な推論能力が大幅に改善されている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:32:05 GMT)
Defection-Free Collaboration between Competitors in a Learning System [61.2] 協力によって収益を失うと、参加者がシステムから外れる競合相手となる協調学習システムについて検討する。
我々は、両社が利益を失わずに相互に共有する、より公平で*欠陥のない*スキームを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:29:45 GMT)
Learning to Use Tools via Cooperative and Interactive Agents [58.8] ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:00:56 GMT)
Mixture of Weak & Strong Experts on Graphs [56.9] 弱い、強い専門家の混ざり合い(マースト)
Mowstは最適化が容易で、強力な表現力を実現する。
4つのバックボーンGNNアーキテクチャでは、Mowstは6つの標準ノード分類ベンチマークで大幅な精度の向上を示している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:45:07 GMT)
SS-Bench: A Benchmark for Social Story Generation and Evaluation [53.4] 自閉症スペクトラム障害(ASD)を持つ子供たちは、しばしば社会的状況を誤解し、日々のルーチンに参加するのに苦労する。
ソーシャルストーリーは創造に費やされ、しばしば多様性とタイムラインに制限される。
ソーシャルストーリーを生成し評価するためのtextbfSocial textbfStory textbfBenchmark である textbfSS-Bench を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:14:48 GMT)
Prompt Optimization via Adversarial In-Context Learning [51.2] adv-ICLは、ジェネレータとディスクリミネータの間の2プレイヤーゲームとして実装される。
ジェネレータは、判別器を騙すのに十分な出力を生成する。
本稿では,Adv-ICLが最先端のプロンプト最適化技術を大幅に改善することを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:19:11 GMT)
Bridging Evolutionary Algorithms and Reinforcement Learning: A Comprehensive Survey on Hybrid Algorithms [50.9] 進化的強化学習(ERL)は進化的アルゴリズム(EA)と強化学習(RL)を統合して最適化する。
本調査では,ERLの多様な研究分野について概観する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:56:22 GMT)
RecExplainer: Aligning Large Language Models for Explaining Recommendation Models [50.7] 大規模言語モデル (LLM) は、理解、推論、指導において顕著な知性を示した。
本稿では, ブラックボックスレコメンデータモデルを説明するために, LLM を代理モデルとして利用することについて検討する。
効果的なアライメントを容易にするために,行動アライメント,意図アライメント,ハイブリッドアライメントという3つの手法を導入する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:34:47 GMT)
Automatic AI Model Selection for Wireless Systems: Online Learning via Digital Twinning [50.3] AIベースのアプリケーションは、スケジューリングや電力制御などの機能を実行するために、インテリジェントコントローラにデプロイされる。
コンテキストとAIモデルのパラメータのマッピングは、ゼロショット方式で理想的に行われる。
本稿では,AMSマッピングのオンライン最適化のための一般的な手法を紹介する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:17:50 GMT)
Visual Explanations of Image-Text Representations via Multi-Modal Information Bottleneck Attribution [49.8] 視覚言語モデルの解釈性を改善するために,マルチモーダル情報ボトルネック手法を提案する。
視覚言語事前学習モデルの帰属分析にM2IBを適用する方法を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:16:55 GMT)
A multitask learning framework for leveraging subjectivity of annotators to identify misogyny [47.2] 本研究では,誤識別システムの性能向上を目的としたマルチタスク学習手法を提案する。
6つのプロファイルグループにまたがる性別と年齢を考慮したモデル設計において,アノテータからさまざまな視点を取り入れた。
本研究は、コンテンツモデレーションを推進し、効果的なオンラインモデレーションシステムを構築するための多様な視点を受け入れることの重要性を強調している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:06:08 GMT)
Quality-guided Skin Tone Enhancement for Portrait Photography [46.6] 本稿では,画質評価の異なる画像の分布を画像強調モデルで学習できる品質誘導型画像強調パラダイムを提案する。
本手法では,異なる品質要件に応じて皮膚のトーンを調整できる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:36:30 GMT)
Probabilistic Programming with Programmable Variational Inference [45.6] 本稿では,構成プログラム変換に基づくPPLの変分推論を支援するための,よりモジュラーなアプローチを提案する。
我々の設計は、自動微分、密度、トレーシング、偏りのない勾配推定戦略の適用など、多くの相互作用する関心事に関するモジュラー推論を可能にする。
我々は、JAXで実装されたGen確率型プログラミングシステム(genjax.vi)の拡張として、我々のアプローチを実装し、いくつかの深い生成モデリングタスクを評価する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:49:37 GMT)
Revisiting Interpolation Augmentation for Speech-to-Text Generation [45.3] 音声テキスト生成システム(S2T)は、低リソースシナリオにおいてしばしば課題に直面している。
新たなソリューションのひとつは、入力とラベルを補間することで、仮想トレーニングサンプルを構築することだ。
本稿では,いくつかの重要な疑問に導かれる拡張性について考察する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:24:58 GMT)
Efficient Quantum Work Reservoirs at the Nanoscale [45.0] 本研究では, ランダウアーの制約下にある2段階の作業貯水池が, 計算中のエネルギー散逸を誤って示唆していることを示す。
対照的に、多層作業貯水池はランダウアーの境界を任意に低エントロピーを発生させながら達成できることを実証する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:43:29 GMT)
Large Language Models for Link Stealing Attacks Against Graph Neural Networks [43.1] グラフニューラルネットワーク(GNN)におけるリンク盗難攻撃を行うために,Large Language Models (LLMs)を導入している。
LLMはテキスト機能を効果的に統合し、強力な一般化性を示し、様々なデータセットにわたる多様なデータ次元を攻撃で処理することができる。
提案手法は,ホワイトボックスとブラックボックスの両方のシナリオにおいて,既存のリンク盗難攻撃タスクの性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:47:24 GMT)
Teaching LLMs to Abstain across Languages via Multilingual Feedback [40.8] 多言語フィードバックは,多様な言語,文化,コミュニティ間の知識ギャップを識別する上で有効であることを示す。
大規模な実験により、多言語フィードバックアプローチは、様々な強いベースラインよりも優れていることが示された。
さらに分析したところ、多言語フィードバックは多言語話者に役立てるための効果的かつ公平な回避戦略であることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:59:12 GMT)
Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills [40.8] 大規模言語モデル(LLM)は、インタラクティブ環境でのシーケンシャルな意思決定に最近使用されている。
トランスファー可能なスキルセットの構築と精細化を通じて,LLMアクターのパフォーマンスを向上させるためのスキルセット最適化(SSO)を提案する。
我々は,従来のビデオゲームNetHackとテキスト環境ScienceWorldで,SSOのスキルセットを最適化し,コンテキスト内ポリシーの改善を行う能力を実証するために,本手法を評価した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:58:09 GMT)
The Impact of Reasoning Step Length on Large Language Models [40.5] 思考の連鎖(CoT)は、大きな言語モデルの推論能力を改善する上で重要である。
プロンプトにおけるCoTの有効性と推論ステップの長さの相関について検討した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:18:48 GMT)
LLM-Powered Explanations: Unraveling Recommendations Through Subgraph Reasoning [40.5] 本稿では,Large Language Models (LLMs) とKGs (KGs) を相乗する新しいレコメンデータを紹介し,そのレコメンデーションを強化し,解釈可能な結果を提供する。
提案手法は,レコメンデータシステムの有効性と解釈性を両立させる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:14:03 GMT)
Semi-supervised variational autoencoder for cell feature extraction in multiplexed immunofluorescence images [40.2] 本稿では,教師付き変分オートエンコーダを用いた深層学習に基づくセル特徴抽出モデルを提案する。
乳がん患者の1,093個の組織マイクロアレイコアから抽出した44,000個以上の多重蛍光細胞像のコホートを用いて細胞表現型分類を行う。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:32:50 GMT)
Social Bias Probing: Fairness Benchmarking for Language Models [38.2] 本稿では,社会的偏見を考慮した言語モデル構築のための新しい枠組みを提案する。
既存のフェアネスコレクションの制限に対処するために設計された大規模なベンチマークであるSOFAをキュレートする。
既存のベンチマークと比較すると、言語モデル内のバイアスは認識されるよりもニュアンスが高いことが分かる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:57:21 GMT)
Integrating Attentional Factors and Spacing in Logistic Knowledge Tracing Models to Explore the Impact of Training Sequences on Category Learning [37.8] 本研究は,ロジスティック・ナレッジ・トレーシング(LKT)モデルに注意要素とスペーシングを取り入れた新しい手法を提案する。
その結果,AFM(Additive Factors Model)に注意要素とスペーシング特徴を組み込むことで,インターリービングとブロッキングの効果を捉える能力が著しく向上することが判明した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:22:19 GMT)
Ultra-High-Definition Restoration: New Benchmarks and A Dual Interaction Prior-Driven Solution [35.6] UHD-Snow と UHD-Rain という名の UHD 雪と降雨のベンチマークを構築した。
各ベンチマークには3200の分解/クリアイメージ対の4K解像度が含まれている。
モデル設計における勾配と正規項を考慮した効率的なUHD画像復元法を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:35:48 GMT)
Multi-source Unsupervised Domain Adaptation on Graphs with Transferability Modeling [35.4] 本稿では、グラフモデリングに基づくドメインセレクタ、サブグラフノードセレクタ、およびバイレベルアライメント目的を備えた、グラフのためのSelective Multi-source Adaptation for Graph(method)を提案する。
5つのグラフデータセットの結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:26:01 GMT)
Fine-grained Background Representation for Weakly Supervised Semantic Segmentation [35.3] 本稿では,多様なBGセマンティクスを発見し,表現するために,FBR法を提案する。
そこで本研究では,FG陰性線を抽出し,地中コントラスト学習を効果的に行うためのアクティブサンプリング戦略を提案する。
本手法は,Pascal Voc および MS COCO テストセットにおいて,73.2 mIoU と 45.6 mIoU のセグメンテーション結果を得る。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:45:25 GMT)
A Recipe for Improved Certifiable Robustness [35.0] 近年の研究は、リプシッツをベースとした、敵の攻撃に対して確実に堅牢なニューラルネットワークを訓練する手法の可能性を強調している。
リプシッツに基づく認証手法の可能性を明らかにするため、より包括的な評価を行う。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:17:15 GMT)
Unpacking Tokenization: Evaluating Text Compression and its Correlation with Model Performance [34.6] 我々は,0-gram言語モデリングとみなす圧縮の理論的重要性を論じる。
事前学習した言語モデルの下流での成功に対する圧縮の実証的重要性を示す。
本稿では,トークン化器の圧縮とモデル下流性能の相関関係を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:00:49 GMT)
Fast Tree-Field Integrators: From Low Displacement Rank to Topological Transformers [34.5] 重み付き木に定義されたテンソル場を統合するための高速多言語線形アルゴリズムのクラスを提案する。
結果の高速木野グラフ(FTFI)の応用として,グラフメトリクスと木メトリクスの近似,グラフ分類,メッシュ上のモデリングなどがある。
トポロジカルトランスフォーマーでは、トランスフォーマー層毎に3つの余分な学習可能なパラメータを持つ新しい相対位置符号化(RPE)マスキング機構を提案し、1.0-1.5%以上の精度向上を実現した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:05:34 GMT)
SimSMoE: Solving Representational Collapse via Similarity Measure [34.2] SMOE(Sparse mixed of experts)は、計算コストを一定に保ちながら、大きな言語モデルをスケールするための効果的なアプローチとして登場した。
本稿では、ニューラルネットワークアルゴリズムの新たな類似性であるSimSMoE(Simisity-based Sparse Mixture of Experts)を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:10:45 GMT)
Automated Statistical Model Discovery with Language Models [34.0] 本稿では,言語モデルを用いた自動統計モデル探索手法を提案する。
Boxのループの原則的なフレームワーク内に,自動手順を投入しました。
その結果,LM駆動型モデル発見の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:08:30 GMT)
Semantic Entropy Probes: Robust and Cheap Hallucination Detection in LLMs [32.9] 幻覚は、大規模言語モデルの導入において大きな課題となる。
Farquhar et al. (2024) による最近の研究はセマンティックエントロピー (SE) を提案している。
本稿では, 単一世代の隠蔽状態から直接SEを近似するSEPを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 19:46:06 GMT)
Identifying and Solving Conditional Image Leakage in Image-to-Video Diffusion Model [31.7] I2V拡散モデル(I2V-DM)は、ノイズの多い入力からクリーンな映像を予測する重要なタスクを無視して、条件付き画像に過度に依存する傾向にある。
我々は、I2V-DMの信頼性の低い遅延ステップを避けるために、早期段階から生成プロセスを開始するトレーニングフリー推論戦略を導入する。
本研究では,条件画像に対する時間依存性のノイズ分布を設計し,条件画像に十分な干渉を与えるため,大規模ステップでの高雑音レベルを優先する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:56:16 GMT)
Unified and Dynamic Graph for Temporal Character Grouping in Long Videos [31.2] ビデオ時間的キャラクタグループ化は、ビデオ内の主要なキャラクタの出現モーメントを、そのアイデンティティに応じて特定する。
最近の研究は、教師なしクラスタリングからグラフベースのクラスタリングへと進化してきた。
時間的文字グループ化のための統一動的グラフ(UniDG)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:35:09 GMT)
Credit Attribution and Stable Compression [30.6] 我々は、機械学習アルゴリズムによる信用属性の研究を行う。
我々は、$k$のデータポイントの指定されたサブセットに対する安定性保証を弱める新しい定義-差分プライバシーの緩和-を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:40:07 GMT)
Beyond the Doors of Perception: Vision Transformers Represent Relations Between Objects [30.1] ビジョントランス (ViT) は様々な環境で最先端のパフォーマンスを実現している。
しかし、視覚的関係を含むタスクを遂行する際、驚くべき失敗を経験する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:43:10 GMT)
Learning to Transfer for Evolutionary Multitasking [30.0] 進化的マルチタスク(EMT)は、マルチタスク最適化問題(MTOP)を解決するための新しいアプローチである。
暗黙のEMTにおける現在のアプローチは、限られた数の進化演算子を使用するため、適応性の課題に直面している。
本稿では,MTOPの効率的なKTポリシーを自動検出する新しいLearning to Transfer(L2T)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:46:50 GMT)
Large Language Model-driven Meta-structure Discovery in Heterogeneous Information Network [29.1] 進化過程に推論を統合するメタ構造探索フレームワークReStructを提案する。
ReStructは推薦タスクとノード分類タスクの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:03:30 GMT)
RuleR: Improving LLM Controllability by Rule-based Data Recycling [28.7] 大規模言語モデル(LLM)は、応答に対する微妙な制御性に欠ける。
制御性を改善するための監視された微調整(SFT)データセットは通常、人間の専門家やプロプライエタリなLLMに依存している。
本稿では,ルールに基づくデータリサイクリング(RuleR)を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:57:12 GMT)
Rethinking Entity-level Unlearning for Large Language Models [28.7] 本稿では,対象モデル内のエンティティ関連知識を完全に消去する,エンティティレベルの非学習という新しいタスクを提案する。
実験によると、現在の未学習アルゴリズムは効果的なエンティティレベルの未学習を達成するのに苦労している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:40:07 GMT)
Beyond the Field-of-View: Enhancing Scene Visibility and Perception with Clip-Recurrent Transformer [28.3] FlowLensアーキテクチャは、光学フローを明示的に採用し、特徴伝達のための新しいクリップリカレントトランスフォーマーを暗黙的に組み込んでいる。
本稿では,自律走行車における視野拡大を目的としたオンライン映像インペインティングの概念を提案する。
オフラインおよびオンラインビデオのインペイントを含む実験とユーザスタディ、さらにはFo-Vの知覚タスクは、Flowsが最先端のパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:12:43 GMT)
The Feature Speed Formula: a flexible approach to scale hyper-parameters of deep neural networks [27.7] 機能更新と後方パスの間の角度$theta_ell$を予測し、制御するための重要な概念を紹介します。
1つのGDステップ後の機能更新の規模は、任意のトレーニング時間において、単純で一般的なエンフェチュア・スピード・フォーミュラで表現できることが示される。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:04:12 GMT)
video-SALMONN: Speech-Enhanced Audio-Visual Large Language Models [27.5] Video-SALMONNは、視覚的なフレームシーケンス、オーディオイベント、音楽だけでなく、音声も理解できる。
Video-SALMONNは、他のav-LLMでは前例のないタスクに対して、驚くべきビデオ理解と推論能力を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:36:11 GMT)
Bidirectional Autoregressive Diffusion Model for Dance Generation [26.4] 本稿では,双方向自己回帰拡散モデル(BADM)を提案する。
生成したダンスが前方方向と後方方向の両方で調和することを強制するために、双方向エンコーダが構築される。
生成したダンス動作をよりスムーズにするため、局所運動強調のための局所情報デコーダを構築する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:19:45 GMT)
How to Learn More? Exploring Kolmogorov-Arnold Networks for Hyperspectral Image Classification [26.4] Kolmogorov-Arnold Networks (KANs) は視覚変換器 (ViTs) の代替として提案された。
本研究では,複雑なハイパースペクトル画像(HSI)データ分類におけるkansの有効性を評価する。
そこで我々は,1D,2D,3Dkanを用いたハイブリッドアーキテクチャを開発し,提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:31:02 GMT)
Self-Supervised Alignment Learning for Medical Image Segmentation [26.1] 医用画像セグメンテーションのためのニューラルネットワークを事前学習するための,新たな自己教師付きアライメント学習フレームワークを提案する。
提案するフレームワークは,新たな局所的なアライメント損失とグローバルな位置損失から構成される。
実験の結果,提案したアライメント学習は,既存のCTおよびMRIデータセットの自己教師付き事前学習手法と競合することが示された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:47:39 GMT)
Knowledge Conflicts for LLMs: A Survey [24.7] 調査では、コンテキストメモリ、コンテキスト間、メモリ内コンフリクトの3つのカテゴリに焦点が当てられている。
これらの対立は、大規模言語モデルの信頼性と性能に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:31:40 GMT)
MR-MLLM: Mutual Reinforcement of Multimodal Comprehension and Vision Perception [24.4] Mutually Reinforced Multimodal Large Language Model (MR-MLLM) は視覚知覚とマルチモーダル理解を高める新しいフレームワークである。
まず、視覚モデルからの詳細な視覚入力と言語モデルの言語深度を調和させるために、共有クエリ融合機構を提案する。
第2に、視覚知覚出力から新たなモダリティを取り入れた、知覚強化型クロスモーダル積分法を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:10:36 GMT)
Ctrl123: Consistent Novel View Synthesis via Closed-Loop Transcription [23.5] 新規ビュー合成(NVS)における画像拡散モデルによるゼロショット能力の実証
既存の拡散に基づくNVS法は、対応する真実のポーズや外観と正確に一致した新しいビューを生成するのに苦労する。
そこで我々はCtrl123を提案する。Ctrl123はクローズドループの転写に基づくNVS拡散法で、生成したビューとグラウンドの真実をポーズに敏感な特徴空間でアライメントする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:58:16 GMT)
Manipulating Embeddings of Stable Diffusion Prompts [22.1] 本稿では,プロンプトテキストの代わりにプロンプトの埋め込みを操作する新しい手法を提案し,解析する。
提案手法は退屈度が低く,結果のイメージが好まれることが多い。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:58:19 GMT)
Single-Temporal Supervised Learning for Universal Remote Sensing Change Detection [21.6] 広帯域リモートセンシングによる変化検出のための単一時間教師あり学習(STAR)を提案する。
Starは、未ペアラベル画像のみを使用して、高精度な変化検知器を訓練することを可能にする。
ChangeStar2は、8つのパブリックリモートセンシング変更検出データセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:03:21 GMT)
Regulating AI Adaptation: An Analysis of AI Medical Device Updates [21.5] FDAが承認したAI医療機器の更新頻度と性質を系統的に分析する。
新しいデータで再トレーニングした結果、全デバイスレポートの2%未満が更新されていることがわかった。
新たなサイトで評価すると,モデル性能は最大0.18AUC低下するが,サイト固有のデータで再トレーニングすることで,この性能低下を軽減できることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 19:44:47 GMT)
Are Language Models Actually Useful for Time Series Forecasting? [21.4] 大規模言語モデル(LLM)は時系列タスク、特に時系列予測に応用されている。
LLM成分を除去したり,基本的な注意層に置き換えたりしても,予測結果は劣化しないことがわかった。
また、事前訓練されたLLMは、スクラッチからトレーニングされたモデルに匹敵せず、時系列のシーケンシャルな依存関係を表現せず、数ショットの設定を補助していないこともわかりました。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:33:38 GMT)
OpticGAI: Generative AI-aided Deep Reinforcement Learning for Optical Networks Optimization [21.3] 光ネットワークのためのAI生成ポリシー設計パラダイムであるOpticGAIを紹介する。
具体的には、生成モデルを利用して最適なポリシーネットワークを学習する新しいDRLフレームワークとして実装されている。
以上の結果から, OpticGAI は RWA と RMSA の両問題において,最も高い報奨と最低ブロッキング率を達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:59:50 GMT)
I Experienced More than 10 DeFi Scams: On DeFi Users' Perception of Security Breaches and Countermeasures [20.8] 分散ファイナンス(DeFi)は、まったく新しい投資経験を提供する。
市場規模が急速に拡大し、アクティブなユーザーもDeFiを詐欺やハッキングのターゲットにしている。
本稿では,DeFi利用者のセキュリティ意識と広く採用されているプラクティスについて検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:22:52 GMT)
Next Level Message-Passing with Hierarchical Support Graphs [20.7] 階層型サポートグラフ(Hierarchical Support Graph, HSG)は、特定のMPNN層に依存しない、グラフ内の情報フローを強化するフレームワークである。
本稿では, HSGの理論的解析を行い, その経験的性能について検討し, 仮想ノードで拡張した他の手法よりもHSGの方が優れていることを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:57:09 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:40:14 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:27:13 GMT)
Understanding the Role of User Profile in the Personalization of Large Language Models [19.7] 本研究はまず,ユーザプロファイルの有効性が主に意味情報よりもパーソナライズ情報によるものであることを確認した。
ユーザプロファイル内では、LLMをパーソナライズする上で重要な役割を果たすユーザによって作成された、あるいは承認された歴史的なパーソナライズされた応答である。
本研究は,LLMのパーソナライズにおけるユーザプロファイルの役割を明らかにし,ユーザプロファイルの導入がパフォーマンスに与える影響を明らかにした。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:32:35 GMT)
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity [19.0] BIOSCAN-5Mは、500万以上の昆虫の標本のマルチモーダル情報を含む包括的データセットである。
マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:13:11 GMT)
All in One and One for All: A Simple yet Effective Method towards Cross-domain Graph Pretraining [19.0] 大規模言語モデル (LLM) はコンピュータビジョン (CV) と自然言語処理 (NLP) の分野に革命をもたらした。
LLMの最も注目すべき進歩の1つは、単一のモデルが複数のドメインにまたがる広範囲で多様なデータセットでトレーニングされていることである。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:29:36 GMT)
Speech Analysis of Language Varieties in Italy [18.5] 本研究は,イタリアの多様な言語品種から抽出された音声サンプルの地理的領域を自動的に同定することに焦点を当てる。
我々はまた、これらの多様だが密接に関連する品種間の関係に関する新たな洞察を明らかにすることを模索している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:19:51 GMT)
PointDreamer: Zero-shot 3D Textured Mesh Reconstruction from Colored Point Cloud by 2D Inpainting [18.4] 色のついたポイントクラウドからテクスチャ化されたメッシュを再構築することは、3Dグラフィックスとビジョンにおいて重要な課題である。
色付き点雲からテクスチャ化されたメッシュ再構築のための新しいフレームワークであるPointDreamerを提案する。
成熟した技術と2Dビジョンの膨大なデータを活用することにより、2D画像のインペイントにより、忠実さと明瞭さが向上したメッシュを生成する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:33:14 GMT)
Learning Molecular Representation in a Cell [18.2] 本稿では,細胞内情報ボトルネック法を用いて分子表現を学習するための情報アライメント(InfoAlign)手法を提案する。
我々は、分子と細胞応答データをノードとしてコンテキストグラフに統合し、化学、生物学的、計算基準に基づいて重み付けされたエッジと接続する。
十分性目的(sufficiency objective)は、コンテキストグラフ内の分子の近傍から異なる特徴空間と整合するように表現をデコードする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:50:05 GMT)
CaT-BENCH: Benchmarking Language Model Understanding of Causal and Temporal Dependencies in Plans [17.6] 本稿では,調理レシピ計画において,ステップの前後にステップが必ず発生する必要があるかどうかを検証した,ステップ順序予測のベンチマークであるCaT-Benchを紹介する。
我々はSOTA LLMが圧倒されていること(最もゼロショットはF1でわずか0.59)、より頻繁に依存を予測することに偏っていることを発見した。
人間による説明の評価と回答の正しさは、平均して人間はモデル推論と一致しないことを示している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:46:04 GMT)
Can LLMs Generate Visualizations with Dataless Prompts? [17.3] 本研究では,このようなクエリに応答して,大規模言語モデルが正確なデータと関連する視覚化を提供する能力について検討する。
具体的には、GPT-3とGPT-4がデータレスプロンプトでビジュアライゼーションを生成する能力について検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 22:59:09 GMT)
A multi-speaker multi-lingual voice cloning system based on vits2 for limmits 2024 challenge [16.8] この課題は,音声クローニング機能を備えた多言語多言語Indic Text-to-Speechシステムの構築である。
このシステムは、課題データを用いて訓練され、ターゲットスピーカー上で数発の音声クローンを行うための微調整が行われた。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:49:36 GMT)
Better, Not Just More: Data-Centric Machine Learning for Earth Observation [16.7] モデル中心の視点から補完的なデータ中心の視点へのシフトは、より正確性、一般化能力、そしてエンドユーザーアプリケーションへの影響を高めるために必要である。
本研究は、地理空間データに対する自動データ中心学習手法の正確な分類と概要と、その定義を提示する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:29:56 GMT)
Best of Many in Both Worlds: Online Resource Allocation with Predictions under Unknown Arrival Model [16.5] オンライン意思決定者は、到着や要求など、将来の変数に関する予測を得ることが多い。
意思決定者にとって予測精度は未知であるため、予測に盲目的に追従することは有害である。
我々は未知の予測精度に頑健な方法で予測を利用するアルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:24:15 GMT)
Graph Elicitation for Guiding Multi-Step Reasoning in Large Language Models [16.4] Chain-of-Thoughtはサブクエスト生成と応答を促進させ、多段階推論機能を強化した。
本稿では,GE-Reasoning法を提案する。
提案手法は,マルチホップ質問応答ベンチマークデータセットにおいて,従来のCoTプロンプト手法とその変種よりも優れていた。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:04:33 GMT)
Teach Better or Show Smarter? On Instructions and Exemplars in Automatic Prompt Optimization [16.0] 本稿では,多様な課題に対して,代表的IO技術とES技術の性能を総合的に比較する。
最近のIOに焦点が当てられているにも関わらず、どのように例えを選ぶかは、命令の最適化方法よりも優れていることが分かりました。
ESとIOの相乗効果を観察し,各コントリビューションを超越した最適な組み合わせを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:07:10 GMT)
Gaussian Control with Hierarchical Semantic Graphs in 3D Human Recovery [15.6] 高忠実度3次元再構成を実現するための階層型人ガウス制御(HUGS)フレームワークを提案する。
我々のアプローチは、幾何学的トポロジーの整合性を確保するために、身体部分の明示的な意味的先行性を活用することである。
本手法は, 人体再建における優れた性能, 特に表面の細部を向上し, 体部接合部を正確に再構築する上での優れた性能を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:07:40 GMT)
Unveiling and Harnessing Hidden Attention Sinks: Enhancing Large Language Models without Training through Attention Calibration [15.4] 我々は,大規模言語モデル(LLM)における注意シンクの存在をより深く理解することを目的としている。
本研究では,入力適応方式で推論中のハエの注意分布を自動的に最適化する訓練自由注意法(ACT)を提案する。
ACTは、Llama-30Bに適用した場合、異なるデータセット間で平均7.30%の精度向上を達成する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:00:43 GMT)
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation [15.2] 強化学習(RL)を用いた微調整一貫性モデルのためのフレームワークを提案する。
RLCM(Reinforcement Learning for Consistency Model)と呼ばれる我々のフレームワークは、一貫性モデルの反復推論プロセスをRLプロシージャとしてフレーム化します。
RL微調整拡散モデルと比較して、RCCMの列車は大幅に高速で、報奨目標に基づいて測定された生成の質を向上し、2段階の推論ステップで高品質な画像を生成することにより推論手順を高速化する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:07:39 GMT)
MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video [14.7] ワンビューの人間の再構築は、仮想現実の応用において中心的な位置を占めている。
現在の手法は、運動が表面の変形に与える影響をしばしば見落とし、その結果、表面は大域的な動きによって課される制約を欠いている。
運動に基づく3次元衣料合成 (MOSS) を導入し, 運動認識型ガウス分割を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:00:25 GMT)
Synergistic Deep Graph Clustering Network [14.6] 我々はSynC(Syngistic Deep Graph Clustering Network)というグラフクラスタリングフレームワークを提案する。
本稿では,構造拡張を導くための高品質な埋め込みを実現するために,TIGAE (Transform Input Graph Auto-Encoder) を設計する。
特に、表現学習と構造増強は重みを共有し、モデルパラメータの数を著しく減少させる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:40:34 GMT)
Language Models in Dialogue: Conversational Maxims for Human-AI Interactions [14.3] 我々は,人間とAIの会話を効果的に表現するために,量,品質,関連性,態度,慈悲,透明性のセットを提案する。
様々な言語モデルがこれらの最大値を理解することができる程度を評価し、モデルがそれらの最大値を正確に解釈する能力に大きな影響を与える原理の内的優先順位付けを持っていることを発見した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:17:38 GMT)
TP-DRSeg: Improving Diabetic Retinopathy Lesion Segmentation with Explicit Text-Prompts Assisted SAM [14.0] そこで本研究では,テキストプロンプト型糖尿病網膜症(DR)病変のセグメンテーションのためにSAMをカスタマイズする新しいフレームワークを提案する。
私たちの中核となる考え方は、医学的な事前知識を視覚のみのセグメンテーションネットワークに注入するために言語キューを活用することです。
具体的には、医療概念認識における視覚言語モデルの可能性を明らかにするために、明示的な事前エンコーダを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:00:35 GMT)
Mitigating Noisy Supervision Using Synthetic Samples with Soft Labels [13.3] ノイズラベルは、特にクラウドソーシングやWeb検索から派生した大規模データセットにおいて、現実世界のデータセットにおいてユビキタスである。
トレーニング中にノイズの多いラベルを過度に適合させる傾向にあるため、ノイズの多いデータセットでディープニューラルネットワークをトレーニングすることは難しい。
ノイズラベルの影響を軽減するために,新しい合成サンプルを用いてモデルを訓練するフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:49:39 GMT)
Shape2.5D: A Dataset of Texture-less Surfaces for Depth and Normals Estimation [13.2] シェープ2.5Dは、このギャップに対処するために設計された、新しい大規模データセットである。
2635の3Dモデルと48のユニークなオブジェクトからなる364kフレームで構成されたデータセットは、テクスチャレスオブジェクト再構成のための深さと表面の正常マップを提供する。
我々のベンチマークは、修正エンコーダデコーダネットワークを使用して実行され、RGB画像から深度と正常度を頑健に推定するアルゴリズムをサポートするデータセットの能力を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:24:49 GMT)
Rethinking the Diffusion Models for Numerical Tabular Data Imputation from the Perspective of Wasserstein Gradient Flow [13.1] Kernelized Negative Entropy-regularized Wasserstein gradient flow Imputation (KnewImp) と呼ばれる原理的アプローチを導入する。
我々の提案するKnewImpアプローチは,既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:59:32 GMT)
The Unlikely Duel: Evaluating Creative Writing in LLMs through a Unique Scenario [12.9] 我々は,最近の言語モデル(LLM)を,英語の創造的記述タスクに基づいて評価した。
Ignatius J. Reilly と pterodactyl のエピックな戦いに基づく)特殊に調整されたプロンプトを使用して、データの漏洩をトレーニングするリスクを最小限にする。
評価は、流派、スタイル、独創性、ユーモアといった様々な側面を含む詳細なルーリックを使用して人間によって行われる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:01:59 GMT)
SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches [12.8] スケッチベースのクエリインタフェースでビデオモーメントを検索するビデオデータベース管理システム(VDBMS)であるSketchQLを提案する。
このインターフェースでは、単純なマウスドラッグアンドドロップ操作でオブジェクトのトラジェクトリイベントを指定できる。
SketchQLは、ビデオ上の類似検索を実行し、ビジュアルクエリに最も近いクリップを特定することで、ゼロショットビデオモーメント検索を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:47:32 GMT)
RetinaGS: Scalable Training for Dense Scene Rendering with Billion-Scale 3D Gaussians [12.5] 我々は、適切なレンダリング方程式を用いた3DGSの一般的なモデル並列トレーニング手法であるRetinaGSを設計する。
本手法により,原始的な数を増やすと,視覚的品質が向上する傾向が明らかになる。
また、完全なMatrixCityデータセット上に10億以上のプリミティブを持つ3DGSモデルをトレーニングする最初の試みを実演する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:06:25 GMT)
Beyond Individual Facts: Investigating Categorical Knowledge Locality of Taxonomy and Meronomy Concepts in GPT Models [12.4] 個々の事実を異にするのではなく,知識の場所,概念や関連する情報の集合を考察する。
関連カテゴリは、類似の少ないカテゴリとは対照的に、類似した重要な領域を示す。
個々の圏部分集合の特定の領域への微粒な局在は明らかでない。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:12:57 GMT)
Predicting fluorescent labels in label-free microscopy images with pix2pix and adaptive loss in Light My Cells challenge [12.4] そこで本研究では,Light My Cells チャレンジのためのディープラーニングに基づくサイリコラベリング手法を提案する。
本手法は, シリカラベリングにおける有望な性能を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:10:23 GMT)
EDGE-LLM: Enabling Efficient Large Language Model Adaptation on Edge Devices via Layerwise Unified Compression and Adaptive Layer Tuning and Voting [12.0] 本稿では,エッジデバイス上での安価かつ効率的なLLM適応を実現するために,Edge-LLMと呼ばれる計算およびメモリ効率の高いLLMチューニングフレームワークを提案する。
具体的には,レイヤワイド統一圧縮(LUC)技術を用いて,レイヤワイドプルーニング空間と量子化ビット幅ポリシを生成して計算オーバーヘッドを削減する,(2)バックプロパゲーション深さを減らしてメモリオーバーヘッドを削減する適応層チューニングと投票方式,(3)LUCが導入した不規則な計算パターンと適応層チューニングを補完するハードウェアスケジューリング戦略,の3つのコアコンポーネントを特徴とする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:51:47 GMT)
Multimodal Physiological Signals Representation Learning via Multiscale Contrasting for Depression Recognition [11.7] 機能近赤外分光法(NIRS)や脳波法(EEG)などの生理的信号に基づく抑うつは大きな進歩を遂げている。
本稿では,抑うつ認識のためのマルチスケールコントラストを用いたアーキテクチャを用いたマルチモーダル生理学的信号表現学習フレームワークを提案する。
刺激タスクに関連する意味表現の学習を強化するために,意味コントラストモジュールを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:28:02 GMT)
Potential Societal Biases of ChatGPT in Higher Education: A Scoping Review [11.6] 生成人工知能(GAI)モデル(ChatGPTなど)は、広範なデータセットのトレーニングによって社会的バイアスを継承または増幅することができる。
高等教育機関(HEIs)における学生、教員、職員のGAI利用の増加に伴い、これらの技術に関連する倫理的問題や潜在的なバイアスについて検討することが急務である。
このスコーピングレビューは,近年の学術出版物において,GAIに関連するバイアスがどのように研究され,議論されているかを明らかにすることを目的としている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:37:05 GMT)
Learning Abstract World Model for Value-preserving Planning with Options [11.3] 所与の時間的拡張行動の構造を利用して抽象マルコフ決定過程(MDP)を学習する。
我々は、これらのスキルによる計画が、抽象MDPにおける軌跡をシミュレートすることによって、元のMDPにおける有界値損失のポリシーをもたらすことを確実にするために必要な状態抽象化を特徴付ける。
目標をベースとしたナビゲーション環境では,連続的な抽象状態の計画が成功し,抽象モデル学習が計画と学習のサンプル効率を向上させることを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:41:02 GMT)
Breaking Secure Aggregation: Label Leakage from Aggregated Gradients in Federated Learning [11.2] Federated Learningは、勾配反転攻撃(GIA)下でのプライバシーの脆弱性を示す
セキュリティアグリゲーション(SA)を回避し、個々のクライアントのプライベートラベルを復元するために、ステルスなラベル推論攻撃を提案する。
我々の攻撃は、様々なデータセットやモデルアーキテクチャ上で、100%精度で大規模なラベル回復を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:42:18 GMT)
Fair Clustering: Critique, Caveats, and Future Directions [11.1] クラスタリングは、機械学習とオペレーション研究における根本的な問題である。
公正なクラスタリングを批判的に捉え、無視された問題の集合を特定します。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:34:53 GMT)
AI-based Drone Assisted Human Rescue in Disaster Environments: Challenges and Opportunities [10.8] 無人航空機(UAV)は、災害時の捜索救助任務のために頻繁に配備される。
大規模なドローンは、孤立した災害で立ち往生している人々に必須の物資を届けるために使われる場合もある。
聴覚システムは、動物の鳴き声や風など、自然に発生する人間の叫び声と音を区別しなければならない。
この課題に対処するためには、人工知能(AI)を使用して音の周波数を分析し、一般的なオーディオシグネチャを識別する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:39:46 GMT)
Data Issues in Industrial AI System: A Meta-Review and Research Strategy [10.5] 人工知能(AI)は、産業システムにおいてますます重要な役割を担っている。
近年、さまざまな業界でAIを採用する傾向にあるが、実際のAIの採用は認識されるほど発展していない。
これらのデータ問題にどのように対処するかは、業界と学術の両方に直面する重要な懸念事項である。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:36:59 GMT)
Qibo: A Large Language Model for Traditional Chinese Medicine [10.4] 伝統的な中国医学には、理論と近代医学の根本的な違いのような課題がある。
本研究では,継続的事前学習と教師付き微調整を組み合わせた2段階学習手法を提案する。
本研究の特筆すべき貢献は,TCM専用の2GBコーパスの処理である。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:43:53 GMT)
MVOC: a training-free multiple video object composition method with diffusion models [10.4] 拡散モデルに基づくMVOC法を提案する。
まず、各ビデオオブジェクトに対してDDIMインバージョンを行い、対応するノイズ特性を得る。
次に、画像編集手法で各オブジェクトを合成して編集し、合成ビデオの最初のフレームを得る。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:18:46 GMT)
DABL: Detecting Semantic Anomalies in Business Processes Using Large Language Models [9.8] 大規模言語モデル(LLM)を用いたビジネスプロセスにおける意味異常の検出手法であるDABLを導入する。
我々は、様々なドメインから143,137個の実世界のプロセスモデルを収集し、これらのプロセスモデルのプレイアウトを通して正常なトレースを生成することにより、結果のログを用いてLlama 2を微調整する。
DABLは、与えられたプロセスの一般化能力と学習の両方の観点から、既存の最先端のセマンティックな異常検出手法を超越していることを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:20:19 GMT)
Ladder: A Model-Agnostic Framework Boosting LLM-based Machine Translation to the Next Level [9.7] 汎用大規模言語モデル(LLM)は,広範なWebコンテンツを活用することで,機械翻訳(MT)において顕著な進歩を遂げている。
しかし、翻訳固有のLLMは、ドメイン固有の単言語コーパスを事前学習し、人間の注釈付き翻訳データを用いて微調整することで構築される。
MT用汎用LLMの性能を向上する新しいモデルに依存しない費用対効果ツールであるLadderを開発した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:33:35 GMT)
Adaptive Online Experimental Design for Causal Discovery [9.4] 因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:37:33 GMT)
EmoAttack: Emotion-to-Image Diffusion Models for Emotional Backdoor Generation [9.4] 拡散モデルを用いて画像を生成することによる、未認識かつ潜伏的なリスクを明らかにした。
入力テキスト中の感情を利用して、ネガティブな内容を導入し、ユーザから好ましくない感情を引き出す可能性がある。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:43:23 GMT)
Privacy Requirements and Realities of Digital Public Goods [9.1] デジタル・パブリック・グッズ(DPG)は、国連(UN)の持続可能な開発目標に対応するためのオープンソースデジタル製品である。
DPGは機密データを処理できるため、国連はDPGのファーストオーダー要件としてユーザプライバシを確立している。
DPGのプライバシーリスクは、現在一部がDPG標準によって管理されている。
本研究は、適切なプライバシー保護を確保するため、現行のDMG標準の有効性について検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:06:13 GMT)
Towards Exact Computation of Inductive Bias [9.0] 本稿では,タスクの一般化に必要な帰納バイアスを効率的に計算する手法を提案する。
より高次元的なタスクはより帰納的バイアスを必要とすることを示す。
提案した帰納バイアス指標は,特定のモデルアーキテクチャの利点を情報理論で解釈する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:14:24 GMT)
Efficient Low-rank Identification via Accelerated Iteratively Reweighted Nuclear Norm Minimization [8.9] 数回繰り返してスムーズな問題を効果的に解くアルゴリズムを開発した。
合成データと実データの両方を用いて実験を行い、アルゴリズムの効率性と優越性を実証する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:37:13 GMT)
TacoLM: GaTed Attention Equipped Codec Language Model are Efficient Zero-Shot Text to Speech Synthesizers [8.5] 我々は,新しいニューラルLM,すなわちTacoLMを導入する。
TacoLMは、トレーニングと推論効率を改善するために、ゲートアテンションメカニズムを導入している。
TacoLMは、VALL-Eと比較して、単語エラー率、話者類似度、平均評価スコアが90%少なく、5.2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:39:52 GMT)
CLImage: Human-Annotated Datasets for Complementary-Label Learning [8.3] 我々は,人間のアノテーションから補完ラベルを収集するプロトコルを開発した。
これらのデータセットは、最初の現実世界のCLLデータセットを表している。
我々は,人間の注釈付き補完ラベルの偏りと,補完ラベルのみによる検証の難しさが,実用的CLLの障壁となることを発見した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:53:38 GMT)
The Effect of Similarity Measures on Accurate Stability Estimates for Local Surrogate Models in Text-based Explainable AI [8.2] 類似度尺度の貧弱な選択は、XAI法の有効性に関する誤った結論をもたらす可能性がある。
本稿では,Kendall's Tau,Spearman's Footrule, Rank-biased Overlapなど,テキストベースのランクリスト用に設計された類似度尺度について検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:59:12 GMT)
Adaptive Digital Twin and Communication-Efficient Federated Learning Network Slicing for 5G-enabled Internet of Things [8.1] ネットワークスライシングは、ネットワークリソースの効率的な使用と管理を通じて、増大する要求を満たすために、マルチサービスとリソース要求を区別した産業用IoTネットワークを可能にする。
次世代のIndustry 4.0は、物理システムを正確な意思決定のためにデジタルモデルにマッピングするデジタルツインを導入した。
提案手法では,まずグラフアテンションネットワークを用いて,ネットワークスライスのためのディジタルツイン環境を構築し,リアルタイムトラフィック分析,監視,需要予測を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:33:35 GMT)
Ctrl-V: Higher Fidelity Video Generation with Bounding-Box Controlled Object Motion [8.1] 本研究では,2次元または3次元境界ボックスのピクセルレベルのレンダリングを条件付けとして,制御可能な映像生成モデルを提案する。
また、初期フレームと終端フレームのバウンディングボックスから最大15フレームまでのバウンディングボックスを25フレームクリップで予測できるバウンディングボックス予測器を作成する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:24:57 GMT)
Soft Masked Mamba Diffusion Model for CT to MRI Conversion [8.0] 磁気共鳴イメージング (MRI) とCT (CT) は, 医用画像の分野で主に用いられている。
本研究では,一般的に使用されているU-NetあるいはTransformerのバックボーンを,潜時パッチで動作するMambaと呼ばれる状態空間モデル(SSM)に置き換え,CTからMRIへの遅延拡散モデルを訓練することを目的とする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:06:50 GMT)
SEDMamba: Enhancing Selective State Space Modelling with Bottleneck Mechanism and Fine-to-Coarse Temporal Fusion for Efficient Error Detection in Robot-Assisted Surgery [7.9] 選択的状態空間モデル(SSM)を外科的誤り検出に組み込んだSEDMambaという新しい階層モデルを提案する。
SEDMambaは、長期ビデオにおける外科的エラーの検出と時間的局所化のために、ボトルネック機構と微細な時間的融合(FCTF)を備えた選択的SSMを強化する。
FCTFは、複数の拡張された1D畳み込み層を使用して、様々なスケール範囲にわたる時間情報をマージし、様々な期間のエラーを調節する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 19:20:35 GMT)
What Matters in Transformers? Not All Attention is Needed [7.9] Transformerベースの大規模言語モデル(LLM)のスケーリングは、様々なタスクで有望なパフォーマンスを示している。
このスケーリングには冗長な構造も導入され、現実のデプロイメントには課題がある。
我々は、類似度に基づく計量を用いて、ブロック、メートル法構造、アテンション層を含むトランスフォーマー内の異なるモジュール間の異なる冗長性について検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:41:48 GMT)
Acoustic Feature Mixup for Balanced Multi-aspect Pronunciation Assessment [7.5] データ不足とスコア・ラベルの不均衡に対処する2つの音響特徴混合手法を提案する。
音声認識結果と元の応答音素を比較し,誤発音のヒントを与える。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:56:29 GMT)
An Experimental Characterization of Combined RowHammer and RowPress Read Disturbance in Modern DRAM Chips [7.4] 我々は、RowHammerとRowPressを組み合わせたパターンを、3大DRAMメーカーすべてから84個の実DDR4 DRAMチップで特徴付けている。
以上の結果から,このRowHammerパターンとRowPressパターンの組み合わせは,最先端のRowPressパターンと比較して,最初のビットフリップを誘導するのに要する時間(最大46.1%高速)を著しく小さくすることがわかった。
その結果,両面パターンの2つの攻撃行のうちの1つからRowPressが引き起こした読み出し障害効果が,他方よりもはるかに重要であるという重要な仮説が得られた。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:36:56 GMT)
Evaluating the World Model Implicit in a Generative Model [7.3] 最近の研究は、大きな言語モデルが暗黙的に世界モデルを学ぶことを示唆している。
これには、単純な論理的推論、地理的ナビゲーション、ゲームプレイング、化学といった問題が含まれる。
我々は,古典的なマイヒル・ネローデ定理に触発された世界モデル回復のための新しい評価指標を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:23:08 GMT)
Faithful Knowledge Graph Explanations for Commonsense Reasoning [7.2] 言語モデル(LM)と知識グラフ(KG)の融合は、常識的質問応答において広く利用されている。
現在の手法は、しばしば忠実さをデコードするパスを見落とし、グラフエンコーダ出力とモデル予測の間にばらつきをもたらす。
本研究は,LM-KGのミスアライメントと相反する効果を,突発的な説明を引き起こす重要な要因として同定する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:03:52 GMT)
Function approximation by neural nets in the mean-field regime: Entropic regularization and controlled McKean-Vlasov dynamics [7.2] 我々は「ほぼガウス的」なランダム重みを持つ2層ニューラルネットワークによる関数近似の問題を考察する。
この問題は、ウェイト上の確率測度を超える経路空間で機能する自由エネルギーの大域的最小化として表現できることを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:57:27 GMT)
A Survey of Robotic Language Grounding: Tradeoffs between Symbols and Embeddings [7.1] 大きな言語モデルでは、ロボットは言語をより柔軟に理解し、これまで以上に能力を高めることができる。
この調査は,1) 言語といくつかの手作業による意味の形式的表現のマッピング,2) 言語と高次元ベクトル空間のマッピングと,低レベルロボットのポリシーに直接変換する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:03:53 GMT)
Statistical Models of Top-$k$ Partial Orders [7.1] 我々は、トップ$k$部分順序とリスト長$k$に対する分布を共同でモデル化するためのアプローチを導入し、分類する。
サンフランシスコの学校選別とサンフランシスコの選別選別選別選別選別選別選別選別選別によるデータを用いて、モデルが観測されたデータをどのように予測するかを評価する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:04:24 GMT)
OMPGPT: A Generative Pre-trained Transformer Model for OpenMP [6.9] OMPGPTは、OpenMPプラグマ生成のための言語モデル固有の強みを巧みに活用するために設計された、新しいドメイン固有モデルである。
我々は、NLPドメインからの迅速なエンジニアリング技術を活用し、OMPGPTの有効性を高めるために設計された革新的な戦略であるChain-of-OMPを作成する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:28:07 GMT)
Enhancing Travel Choice Modeling with Large Language Models: A Prompt-Learning Approach [6.9] 本稿では,予測精度を大幅に向上させ,個々の予測に対して明確な説明を提供する,プロンプト学習に基づく大規模言語モデル(LLM)フレームワークを提案する。
スイスで収集されたLondon Passenger Mode Choice(LPMC)とOptima-Mode(Optima-Mode)の2つの選択肢データセットを用いて,フレームワークの有効性を検証した。
その結果,LLMは人々の選択を予測する上で,最先端のディープラーニング手法や個別選択モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:44:34 GMT)
LaMSUM: A Novel Framework for Extractive Summarization of User Generated Content using LLMs [6.8] 大規模言語モデル(LLM)は、要約を含む幅広いNLPタスクにおいて、印象的なパフォーマンスを示している。
投票アルゴリズムを活用して,LLMから抽出要約を生成する新しいフレームワークLaMSUMを提案する。
Llama 3 と Mixtral と Gemini の3つのオープンソース LLM について評価した結果,LaMSUM は最先端の抽出要約法より優れていることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:25:55 GMT)
The Impact of Speech Anonymization on Pathology and Its Limits [6.7] 本研究では,ドイツの複数の機関の2700人以上の話者を対象に,匿名化が病的スピーチに与える影響について検討した。
Dysarthria, Dysphonia, Cleft Lip and Palateなどの特定の疾患は最小限の効用変化を経験し, Dysglossiaはわずかに改善した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:47:05 GMT)
Functional Overlap Reranking for Neural Code Generation [6.7] SRankは、コード生成から最良のソリューションを選択するための、新しいランク付け戦略である。
ソリューションクラスタ間の機能の重複を定量化することにより、私たちのアプローチは、コードソリューションのより良いランキング戦略を提供します。
実験結果から,pass@1のスコアで顕著な結果が得られることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:42:32 GMT)
DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.6] 元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:48:32 GMT)
Consensus-based construction of high-dimensional free energy surface [6.2] 主な課題は、エネルギー障壁と次元の出現である。
既存のアプローチは、フルフェーズ空間の効率的な探索を確立するための洗練されたサンプリング手法に基づいていることが多い。
本稿では,関数表現とトレーニングセットを同時に最適化し,サンプリングに基づくアプローチを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 19:32:50 GMT)
Human-AI Safety: A Descendant of Generative AI and Control Systems Safety [6.1] 先進的なAI技術に対する有意義な安全性保証には、AI出力と人間の振る舞いによって形成されるフィードバックループが、どのようにして異なる結果に向かって相互作用を駆動するかについての推論が必要である、と我々は主張する。
我々は、次世代の人間中心AI安全性に向けた具体的な技術ロードマップを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:17:22 GMT)
Simple Yet Efficient: Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment [6.0] FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両モード間のギャップを狭めるための,単純かつ効率的な手法を提案する。
このフレームワークは,CNNおよびViTベースのバックボーンにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:02:33 GMT)
Federated Adversarial Learning for Robust Autonomous Landing Runway Detection [6.0] 本稿では,着陸滑走路を検出するための対向学習フレームワークを提案する。
我々の知る限りでは、着陸滑走路検出における対向的なサンプル問題に対処する連合学習の事例としては、これが初めてである。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 19:31:52 GMT)
Structure Gaussian SLAM with Manhattan World Hypothesis [5.9] 幾何学的精度と完全性を高めるRGB-DシステムであるManhattan Gaussian SLAM(MG-SLAM)を提案する。
MG-SLAMは、構造されたシーンから導かれた融合した線分をシームレスに統合することにより、テクスチャレス屋内領域におけるロバストな追跡を確実にする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:57:03 GMT)
Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing [5.5] 本稿では, 高分子太陽電池ドナー/アクセプターペアの発見のための各種能動的学習手法のシミュレーションを行う。
提案手法は, 材料革新の15年間の加速に相当し, 発見時間を約75%短縮する可能性を示した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:56:31 GMT)
Emergent Dominance Hierarchies in Reinforcement Learning Agents [5.5] 現代の強化学習(RL)アルゴリズムは、様々なタスクにおいて人間より優れている。
我々は、RLエージェントの集団が、新しい集団に支配階層を発明し、学習し、強制し、伝達できることを示します。
支配的な階層構造は、鶏、マウス、魚、その他の種で研究されるものと類似した構造を持つ。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:44:33 GMT)
CasModaTest: A Cascaded and Model-agnostic Self-directed Framework for Unit Test Generation [5.5] CasModaTestは、カスケードされた、モデルに依存しない、エンドツーエンドのユニットテスト生成フレームワークである。
テストプレフィックスを生成し、オークルをテストし、それらの有効性をチェックするためにコンパイルまたは実行します。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:52:39 GMT)
Learning When the Concept Shifts: Confounding, Invariance, and Dimension Reduction [5.4] 観測データでは、分布シフトは観測されていない共起因子によって駆動されることが多い。
このことは、観測データを用いた領域適応問題の研究を動機付けます。
学習した低次元部分空間を用いて、ターゲットとソースのリスクの間にほぼ理想的なギャップを生じさせるモデルを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:43:08 GMT)
Score-based Diffusion Models via Stochastic Differential Equations -- a Technical Tutorial [5.2] 本稿では、スコアベース拡散モデルに焦点を当て、微分方程式(SDE)による定式化に特に焦点をあてる。
緩やかな導入の後、拡散モデリングにおける2つの柱、サンプリングとスコアマッチングについて論じる。
提案された結果の主案を説明するための短い証明が与えられる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:31:33 GMT)
Spatial Transfer Learning for Estimating PM2.5 in Data-poor Regions [5.2] 大気汚染、特に粒子状物質2.5(PM2.5)は公衆衛生の懸念事項である。
本稿では、両方のドメインの空間的および意味的依存関係をキャプチャするLatent Dependency Factor(LDF)という新機能を提案する。
実験の結果, LDFを用いた移動学習モデルでは, ベースラインよりも19.34%向上していることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:15:36 GMT)
AllMatch: Exploiting All Unlabeled Data for Semi-Supervised Learning [5.1] 提案するSSLアルゴリズムであるAllMatchは,擬似ラベル精度の向上とラベルなしデータの100%利用率の向上を実現する。
その結果、AllMatchは既存の最先端メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:59:52 GMT)
Multimodal Segmentation for Vocal Tract Modeling [5.0] リアルタイム磁気共鳴イメージング(RT-MRI)は、音声中の内音節の正確な動きを計測する。
まず、視覚のみのセグメンテーション手法を用いて、RT-MRIビデオにディープラベリング戦略を提案する。
次に、音声を用いたマルチモーダルアルゴリズムを導入し、発声器のセグメンテーションを改善する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:44:38 GMT)
Universal Batch Learning Under The Misspecification Setting [4.8] ログロスを伴う不特定設定において、普遍的なエムバッチ学習の問題を考察する。
我々は、最適普遍学習者、データ生成分布の集合上の混合を導出し、min-max後悔を表す閉形式表現を得る。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:32:56 GMT)
Beyond Efficiency: Scaling AI Sustainably [4.7] 現代のAIアプリケーションは、コンピューティングにおける需要を継続的に増加させてきた。
本稿では, ハードウェア製造における炭素排出量の具体化だけでなく, トレーニングおよび推論からのCO排出の操作を含む, AIの炭素影響を特徴付ける。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:33:22 GMT)
Continual Learning with Diffusion-based Generative Replay for Industrial Streaming Data [4.4] 本稿では, 蒸留法に基づく自己指導(DSG)の継続的学習手法を提案する。
DSGは、新たな生成再生機構を通じて、産業ストリーミングデータによって提示される課題に対処する。
CWRU, DSA, WISDMデータセットの実験結果からDSGの有効性が示された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:02:25 GMT)
Modeling Unknown Stochastic Dynamical System Subject to External Excitation [4.4] 未知の非線形力学系を学習するための数値的手法を提案する。
私たちの基本的な前提は、システムの統治方程式は利用できないということです。
十分な量のI/Oデータが得られる場合,本手法は未知のダイナミクスを学習することができる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:21:44 GMT)
Quantum Electronics on Quantum Liquids and Solids [4.3] 軽い粒子質量と弱い粒子-粒子相互作用を持つ非極性原子または分子は、低温で量子液体と固体(QLS)を形成することができる。
過剰電子は真空中のQLSの表面に自然に結合し、2次元と低次元でユニークな量子電子の挙動を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:10:32 GMT)
Deep Learning Domain Adaptation to Understand Physico-Chemical Processes from Fluorescence Spectroscopy Small Datasets: Application to Ageing of Olive Oil [4.1] 蛍光分光法は生命科学や化学の基本的な道具であり、環境モニタリング、食品品質管理、生物医学診断などの応用に広く用いられている。
深層学習を用いた分光データの解析、特に蛍光励起放出行列(EEM)は、通常、小さくてスパースなデータセットが利用できるため、大きな課題を提起する。
本研究では、これらの課題に対処する新しい解釈可能性アルゴリズムとともに、事前学習された視覚モデルによるドメイン適応を利用する新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:29:35 GMT)
Reading Is Believing: Revisiting Language Bottleneck Models for Image Classification [4.1] 我々は、画像分類のためのディープラーニングモデルの説明可能性を保証するアプローチとして、言語ボトルネックモデルを再考する。
実験により、現代の画像キャプタと事前訓練された言語モデルを組み合わせた言語ボトルネックモデルにより、ブラックボックスモデルを超える画像分類精度が得られることを示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:49:34 GMT)
Deep Optimal Experimental Design for Parameter Estimation Problems [4.1] ディープラーニングを用いた新しい実験設計手法について検討する。
ネットワークのトレーニングをLikelihood Free Estorとして行うことで,設計プロセスを大幅に単純化できることを示す。
パラメータ推定問題に対する回収プロセスの品質は, 深い設計により向上する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:06:55 GMT)
Fusing Audio and Metadata Embeddings Improves Language-based Audio Retrieval [4.0] 生音声信号とテキスト記述とを一致させるには、音声の内容と記述の意味を理解する必要がある。
本稿では,音声メタデータを付加的な手がかりとして用いたハイブリッド検索システムについて検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:19:51 GMT)
Human-compatible driving partners through data-regularized self-play reinforcement learning [4.0] HR-PPO(Human-Regularized PPO)は、エージェントが人間の参照ポリシーから逸脱する小さなペナルティで自己プレイを通じて訓練されるマルチエージェントアルゴリズムである。
その結果,HR-PPOは93%,オフロード率3.5%,衝突率3%の目標達成に極めて有効であることがわかった。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:47:54 GMT)
A photonic quantum engine driven by superradiance [3.4] ナノおよびマイクロスケールのヒートエンジンの性能は、量子力学現象の助けを借りて改善することができる。
量子コヒーレンスを持つ熱貯水池は、単一の貯水池であってもカルノット限界を超えてエンジン性能を向上させるために提案されている。
本稿では,超放射光で駆動されるフォトニック量子エンジンの実証実験を初めて報告する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:23:38 GMT)
RankAdaptor: Hierarchical Dynamic Low-Rank Adaptation for Structural Pruned LLMs [3.3] 本稿では,階層的動的階数スケジューリングを併用した効率的な微調整手法であるRandAdaptorを紹介する。
RankAdaptorは、異なるプルーニング設定に対して構造的なプルーニングで標準のLoRAを一貫して上回っている。
トレーニング可能なパラメータを増やすことなく、RandAdaptorはプルーンドモデルと元のモデルのリカバリの間の精度パフォーマンスギャップをさらに小さくする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:52:58 GMT)
On MDS Property of g-Circulant Matrices [3.1] まず、インボリュート特性とMDS特性を持つ$g$循環行列について論じる。
すると、有限体からの成分を持つ$g$循環半帰納的行列と半直交行列を掘り下げる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:18:31 GMT)
A note on MDS Property of Circulant Matrices [3.1] 2014年、Gupta と Ray は有限体 $mathbbF_2m$ 上の循環不変行列が最大距離分離(MDS)できないことを証明した。
この記事では、有限体 $mathbbF_2m$ 上のこれらの特性を持つ循環行列について述べる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:00:00 GMT)
Clapton: Clifford-Assisted Problem Transformation for Error Mitigation in Variational Quantum Algorithms [2.7] 変分量子アルゴリズム(VQA)は、近い将来に量子優位性を示す。
VQAにおける誤り除去のためのClifford-Assisted Problem Transformationを提案する。
Claptonはエンドツーエンドのアプリケーション・ツー・デバイス・フレームワークとして構築されている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 03:33:30 GMT)
Collaboration or Corporate Capture? Quantifying NLP's Reliance on Industry Artifacts and Contributions [2.7] EMNLP 2022で発表された100の論文を調査し,研究者が業界モデルにどの程度依存しているかを調査した。
私たちの研究は、将来の研究者が、代替手段がなければ、業界とのコラボレーションがまだコラボレーションであるかどうかをより正確に解決するための足場として役立ちます。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:27:04 GMT)
Succinct quantum testers for closeness and $k$-wise uniformity of probability distributions [2.3] 我々は、近接性の性質をテストする基本的な問題に対する潜在的な量子スピードアップについて検討する。
本稿では,クエリ複雑性を$Orbrasqrtnk/varepsilonで表した最初の量子アルゴリズムを提案する。
我々の量子アルゴリズムは、振幅推定のような基本的な量子サブルーチンのみを用いて、かなり単純で時間効率が高い。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:05:01 GMT)
Dynamic Addition of Noise in a Diffusion Model for Anomaly Detection [2.2] 拡散モデルは、名目データ分布を捕捉し、再構成を通して異常を識別することで、異常検出に有用な応用を見出した。
それらの利点にもかかわらず、彼らは様々なスケールの異常、特に欠落した成分全体のような大きな異常をローカライズするのに苦労している。
本稿では,従来の暗黙的条件付け手法であるメングらを拡張し,拡散モデルの能力を高める新しい枠組みを提案する。
2022年は3つの重要な意味を持つ。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:22:11 GMT)
iACOS: Advancing Implicit Sentiment Extraction with Informative and Adaptive Negative Examples [2.0] そこで本稿では,カテゴリとオピニオンをセンチメントで抽出する新しい手法iACOSを提案する。
iACOSはテキストの最後に2つの暗黙のトークンを付加し、暗黙のアスペクトや意見を含むすべてのトークンのコンテキスト認識表現をキャプチャする。
2つの公開ベンチマークデータセットのF1スコアにより,iACOSは,他の4倍の抽出基準値よりも有意に優れていた。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 05:01:21 GMT)
NeuralSCF: Neural network self-consistent fields for density functional theory [1.8] コーンシャム密度汎関数理論(KS-DFT)は、正確な電子構造計算に広く応用されている。
深層学習の目的としてコーン・シャム密度マップを確立するニューラルネットワーク自己整合体(NeuralSCF)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:24:08 GMT)
Mapping the Potential of Explainable Artificial Intelligence (XAI) for Fairness Along the AI Lifecycle [1.4] 説明可能なAI(XAI)は、AIシステムの公正性を高めるための有望な方法だと考えています。
AIライフサイクルに沿って、フェアネスデシダータの一貫性のあるマッピングはありません。
8つのフェアネスデシダラタを蒸留し、それらをAIライフサイクルに沿ってマッピングし、XAIがそれぞれにどのように対処できるかについて議論する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:35:07 GMT)
Real-time Speech Summarization for Medical Conversations [1.4] 医師と患者の会話では、医療関連情報の特定が重要である。
本稿では,産業における実世界のアプリケーションを対象とした,初めてのリアルタイム音声要約システムを提案する。
医療会話のための最初の音声要約データセットであるVietMed-Sumを提示する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:37:51 GMT)
Automating Transfer of Robot Task Plans using Functorial Data Migrations [1.4] ファクタは、ソースドメインからターゲットドメインへのプランの転送に使用可能な、ドメインタイプと述語の間の構造化されたマップを提供する。
本稿では,AI2-THOR Kitchen環境と互換性のあるタスクプランを標準Blocksworldドメインから移行することで,このアプローチを実証する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:35:32 GMT)
Feedback-driven quantum reservoir computing for time-series analysis [1.2] 時系列解析のためのフィードバック駆動型量子貯水池計算(QRC)フレームワークを提案する。
本研究は,QRCがフィードバックによってフェードメモリ特性の取得に成功したことを実証する。
また、QRCの予測能力を評価し、量子スピン系から発する信号の予測性を示す。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:28:08 GMT)
Archiving Body Movements: Collective Generation of Chinese Calligraphy [1.1] 身体運動は行動研究やキネシクスで広く研究されている。
本稿では, 東洋書道における身体運動と書道の原理を適用し, 身体運動を刺激し, アーカイブする方法について検討する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:06:35 GMT)
Fast, accurate and lightweight sequential simulation-based inference using Gaussian locally linear mappings [0.8] シミュレーションベース推論(SBI)の代替として,確率と後部分布の両方を近似する手法を提案する。
提案手法は,マルチモーダル後部であっても,最先端NNベースのSBI法と比較して正確な後部推測を導出する。
本研究は,SBI文献から得られたいくつかのベンチマークモデルと,mRNAトランスフェクション後の翻訳動態の生物学的モデルについて述べる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:26:27 GMT)
Enhancing Solar Driver Forecasting with Multivariate Transformers [0.8] 我々は、時系列変換器(PatchTST)を用いたF10.7、S10.7、M10.7、Y10.7ソーラードライバ予測のためのフレームワークを開発する。
太陽活動の高レベルと低レベルを均等に表現するために、太陽運転者の歴史的分布とトレーニングセットの間の距離に基づいて、試料を重み付けするためのカスタム損失関数を構築した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:26:14 GMT)
Progress Towards Decoding Visual Imagery via fNIRS [0.7] 我々は,fNIRS脳活動からのイメージ再構成の可能性を示し,必要な仕様に適合するプロトタイプの構築に着手する。
その結果, フル解像度fMRIでは93%, 2cmでは20%の精度で検索精度は71%であった。
我々は、レーザードライバ、光子検出器、デジタルコンバータシステムからなるプロトタイプの時間領域fNIRSデバイスの設計を共有している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:42:13 GMT)
SHDB-AF: a Japanese Holter ECG database of atrial fibrillation [0.7] 心房細動(英: atrial fibrillation、AF)は、生活の質を損なう一般的な不整脈であり、塞栓性脳卒中、心不全、その他の合併症を引き起こす。
機械学習(ML)とディープラーニング(DL)の最近の進歩は、診断精度を高める可能性を示している。
Saitama Heart Database Atrial Fibrillation (SHDB-AF)は、日本発のオープンソースホルターECGデータベースである。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 18:35:58 GMT)
Flexible Tails for Normalizing Flows [0.7] この問題に対する一般的な解決策は、重い尾のベース分布を使用することである。
これは、重み付き入力下でのフローの正規化などのニューラルネットワークの最適化が困難であるため、パフォーマンスが低下する可能性がある、と我々は主張する。
ガウス基底分布と重みを生成可能な最終変換層を用いる方法を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:44:01 GMT)
psPRF:Pansharpening Planar Neural Radiance Field for Generalized 3D Reconstruction Satellite Imagery [0.6] 現在の衛星用NeRF変種のほとんどは特定のシーンのために設計されており、新しい幾何学への一般化には至っていない。
本稿では,低分解能RGB(LR-RGB)と高分解能パノクロマティック(HR-PAN)の画像にRational Polynomial Camera(RPC)を併用した平面ニューラルレージアンスフィールドであるpsPRFを紹介する。
シーン間におけるpsRPFの一般化能力を支援するため、プロジェクションロスを採用し、強力な幾何学的自己監督を実現する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 02:02:32 GMT)
ICM Ensemble with Novel Betting Functions for Concept Drift [0.6] 本研究は,CD (Concept Drift) に対処する改良型インダクティブ・コンフォーマル・マーティンゴール (ICM) アプローチを導入することで,これまでの成果を裏付けるものである。
これまでに提案したCAUTIousベッティング機能を強化し,複数の密度推定器を組み込んで検出能力を向上する。
また、このベッティング関数と、これまでICMフレームワークで利用されていなかった2つのベース推定器(補間ヒストグラムと近接近傍密度推定器)を組み合わせる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:56:09 GMT)
ISS-Scenario: Scenario-based Testing in CARLA [0.5] 本稿では,シナリオベーステストのパラダイムにおける自律走行テストフレームワークであるISS-Scenarioを紹介する。
ISS-Scenarioは、バッチテスト、テストケースの探索(潜在的に危険なシナリオ)、自動運転車(AV)の性能評価のために設計されている。
ISS-Scenarioは、ランダムサンプリングと遺伝的アルゴリズムによる最適化検索という、2つのテスト手法をこのフレームワークに統合している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 07:55:12 GMT)
Intrinsic Dimension Correlation: uncovering nonlinear connections in multimodal representations [0.4] 本稿では,内在次元と相関関係の絡み合いを利用して相関関係を定量化する計量を提案する。
まず,制御環境における合成データの検証を行い,その利点と欠点を既存手法と比較した。
ニューラルネットワーク表現における大規模アプリケーションに分析を拡張します。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:36:04 GMT)
LaneSegNet Design Study [0.4] LaneSegNetは、トポロジ情報とレーンラインデータを統合する、レーントポロジ予測の新しいアプローチである。
本研究では,特徴抽出器とトランスフォーマーエンコーダ-デコーダスタック修正によるLaneSegNetアーキテクチャの最適化について検討する。
我々の実装は1つのNVIDIA Tesla A100 GPUでトレーニングされ、2:4比でトレーニング時間を22.3%削減し、平均精度は7.1%低下した。
4:8比はトレーニング時間をわずか11.1%増加させたが、平均精度は23.7%向上した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 21:49:12 GMT)
MetaGreen: Meta-Learning Inspired Transformer Selection for Green Semantic Communication [0.4] エネルギ・ド・セマンティック・ロスの関数はセマンティック情報損失とエネルギー消費のバランスをとる。
EOSLを用いた変圧器モデル選択はBLEUのスコアベース選択と比較して83%高い類似度/パワー比(SPR)を示す。
メタラーニングの原則に触発されて,EOSLの適用性は,多様かつ多様なコンテキストにまで拡張する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 00:49:40 GMT)
Multistep Criticality Search and Power Shaping in Microreactors with Reinforcement Learning [0.4] 核マイクロリアクターにおける知的制御のための強化学習(RL)アルゴリズムを導入する。
近位政策最適化(PPO)とアクター・クリティカル(A2C)を用いたRLエージェントの訓練
その結果, 最適ドラム位置同定におけるPPOの優れた性能が示された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:14:56 GMT)
Quantum geometry embedded in unitarity of evolution: revealing its impacts as quantum oscillation and dephasing in spin resonance and crystal bands [0.3] 我々は、一元的進化の本質的な結果として、幾何学が量子内でどのように現れるかを示す。
スピンやバンドのシナリオにおいて、振動やデファスティングなどの幾何学的可観測物を例示する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:16:51 GMT)
Enhancing Scalability of Quantum Eigenvalue Transformation of Unitary Matrices for Ground State Preparation through Adaptive Finer Filtering [0.1] ハミルトニアンシミュレーション(英: Hamiltonian Simulation)は、量子コンピュータが古典的計算を上回る可能性を持つ領域である。
このような量子アルゴリズムの主な課題の1つは、システムサイズをアップスケーリングすることである。
本稿では, 固有空間フィルタリングのスケーラビリティを, 与えられたハミルトニアンの基底状態の準備のために向上させるアプローチを提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:35:29 GMT)
DISHA: Low-Energy Sparse Transformer at Edge for Outdoor Navigation for the Visually Impaired Individuals [0.1] 視覚障害者を支援するためにエッジデバイス上に展開するエンドツーエンド技術を提案する。
具体的には,歩道を検知するトランスアルゴリズムのための新しいプルーニング手法を提案する。
提案技術は, 最大32.49%の精度向上, 1.4時間のバッテリー寿命向上を実現している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:49:02 GMT)
Perturbative stability and error correction thresholds of quantum codes [0.0] 位相的に順序付けられた位相は局所摂動に対して安定であり、位相的量子誤り訂正符号は局所誤差に対するしきい値を持つ。
汎用CSS符号と古典線形符号を復号するための古典統計力学モデルを構築した。
LDPC条件を満たすCSS符号に対して,低温秩序相の存在を証明した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 06:46:41 GMT)
Understanding Student and Academic Staff Perceptions of AI Use in Assessment and Feedback [0.0] 高等教育における人工知能(AI)と生成人工知能(GenAI)の台頭は、評価改革を必要としている。
本研究は,AIとGenAIツールを用いた学生と学術スタッフの経験を探索することによって,重要なギャップを解消する。
オンライン調査では、ベトナムの2つの大学とシンガポールの1つの大学から35人の研究スタッフと282人の学生のデータを収集した。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:25:01 GMT)
Uncovering Hidden Intentions: Exploring Prompt Recovery for Deeper Insights into Generated Texts [0.0] 本稿では,タスクのクローズドなセットを伴わずに,この領域における最初の調査を紹介する。
ゼロショットと少数ショットのインコンテキスト学習に加えて,LoRAファインチューニングも試行する。
その結果,元のプロンプトをある程度の精度で復元できることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:16:11 GMT)
Tomita-Takesaki theory and quantum concurrence [0.0] 共起の量子エンタングルメント測度は、2つの量子系に対して観測可能な局所フォン・ノイマン代数から構築されたトミタ・タケサキモジュラー作用素フレームワークから直接計算可能であることが示されている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 17:35:02 GMT)
Superoperator master equations for depolarizing dynamics [0.0] この作品はスーパーオペレーターマスター方程式に特化している。
すなわち、ツイリング超プロジェクターの場合の超作用素マスター方程式はユニタリ群全体に対して導出される。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:40:21 GMT)
Smart Feature is What You Need [0.0] 情報不足による形状誘導の欠如とラベルジッタは、3次元弱教師付き物体検出の主要な問題である。
MMA(Multiscale Mixed Attention)と呼ばれる新しいプラグイン・アンド・イン・ポイント・クラウド特徴表現ネットワークを提案する。
MMAは、近傍の隣接注意と異なる密度スケールにおける不均一注意を利用して特徴表現ネットワークを構築する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 10:18:10 GMT)
Risk-Dominant Equilibrium in Quantum Prisoner's Dilemma [0.0] 絡み合いはリスク支配均衡を完全にコントロールしている。
絡み合いはリスク支配均衡における量子協調を促進し、その結果を改善する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:37:27 GMT)
Privacy Implications of Explainable AI in Data-Driven Systems [0.0] 機械学習(ML)モデルは、解釈可能性の欠如に悩まされる。
透明性の欠如は、しばしばMLモデルのブラックボックスの性質と呼ばれ、信頼を損なう。
XAI技術は、内部の意思決定プロセスを説明するためのフレームワークと方法を提供することによって、この問題に対処する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 08:51:58 GMT)
Present and Future of AI in Renewable Energy Domain : A Comprehensive Survey [0.0] 人工知能(AI)は、様々な産業におけるプロセスを合理化するための重要な手段となっている。
現代の電力システムの再生可能エネルギー(RE)を支援するため、9つのAIベースの戦略がここで特定されている。
この研究は、再生可能エネルギー生成にAI技術を使用すること、再生可能エネルギー予測にAIを活用すること、エネルギーシステムの最適化という3つの主要なトピックについても論じている。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:36:09 GMT)
Planar Rotor in Matrix Mechanics and the Role of States in Quantum Physics [0.0] 平面量子ロータの例を用いて,ハイゼンベルクの行列力学の手法を説明する。
システムの固有状態を使わずに、この単純なモデルのスペクトルを見つける方法を示す。
このことから、ハイゼンベルク状態が量子力学において果たす役割を推測し、状態の必要性を完全に解消できるかどうかを問うことになる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:54:25 GMT)
Nanoscale Mapping of Magnetic Auto-oscillations with a single Spin Sensor [0.0] 磁場最小値の位置によって自己振動点が決定されることを定量的磁気メソメトリーで実験的に実証した。
オートオシレーションモードとスピン波ポテンシャル井戸の相互作用に関する洞察は、実際のデバイスの高度なエンジニアリングを可能にする。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 13:37:14 GMT)
Language Alignment via Nash-learning and Adaptive feedback [0.0] 大規模言語モデルアライメントのためのヒューマンフィードバックによるナッシュラーニングの可能性を示す。
我々は、改良された相手の適応的フィードバックに対して、アライメントをミラー降下アルゴリズムとしてキャストすることで、この考え方をさらに推し進める。
得られたアルゴリズムは、人間に注釈付けされた嗜好データセットを必要とせずに、自己アライメントを行うことができる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 16:55:21 GMT)
Injectivity of ReLU-layers: Perspectives from Frame Theory [0.0] インジェクティビティ(英: Injectivity)とは、情報を失うことなく、その出力から任意の入力を再構成できるマッピングの定義特性である。
本稿では,この問題にアプローチするためのフレーム理論的視点を確立する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 14:07:41 GMT)
GPTopic: Dynamic and Interactive Topic Representations [0.0] GPTopicは、LLM(Large Language Models)を利用して動的でインタラクティブなトピック表現を作成するソフトウェアパッケージである。
GPTopicは、対話的にトピックを探索、分析、洗練するための直感的なチャットインターフェイスを提供する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:00:29 GMT)
Exact and Approximate Conformal Inference for Multi-Output Regression [0.0] コンフォーマル推論は、予測に関連する不確実性を定量化するために機械学習で使用される。
本稿では,多出力回帰を考察し,共形推論の正確な導出を$p$-値で行う。
また、実世界とシミュレーションデータの両方を用いて、これらの手法の有効性に関する理論的および実証的な証拠を提供する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:56:19 GMT)
Emergent Topology in Many-Body Dissipative Quantum Matter [0.0] 擬エルミート多体量子系の散逸ダイナミクスについて検討する。
我々は、それらが普遍的であることを示す幅広いパラメータについて、同じトポロジ的特徴を見出した。
浴への弱いカップリングの限界において、トポロジカルモードは平衡へのアプローチを支配している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 09:39:50 GMT)
Bone Fracture Classification using Transfer Learning [0.0] フラクチャー分類のための頑健で簡単なトレーニングループを導入し,既存手法よりも大幅に優れていた。
提案手法は10時間以内で優れた性能を発揮する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:21:47 GMT)
Battling Botpoop using GenAI for Higher Education: A Study of a Retrieval Augmented Generation Chatbots Impact on Learning [0.0] 本研究で紹介されるLeodar教授は、カスタムメイドのSinglish- speak Retrieval Augmented Generation (RAG)である。
Leodar教授は、AI支援学習の未来を垣間見るとともに、パーソナライズされたガイダンス、24/7の可用性、コンテキストに関連する情報を提供している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 01:02:54 GMT)
An Efficient NAS-based Approach for Handling Imbalanced Datasets [0.0] 本稿では、ニューラルネットワークサーチ(NAS)によるバックボーンアーキテクチャの最適化により、長い尾を持つデータセットの性能向上のための新しいアプローチを提案する。
我々の研究は、バランスの取れたデータセット上でのアーキテクチャの精度が、バランスの取れていないデータセットのパフォーマンスを確実に予測できないことを示している。
本報告では, IMB-NASの基本技術について, NASやアーキテクチャ転送など, 詳細な解説を行う。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:46:03 GMT)
An Automated SQL Query Grading System Using An Attention-Based Convolutional Neural Network [0.0] 本稿では、グレーディングsqlクエリのプロセスを自動化する新しいアプローチについて述べる。
我々は、異なる機械学習タスクに対してパラメータ共有アプローチを採用する独自の畳み込みニューラルネットワークアーキテクチャを採用している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 20:52:17 GMT)
AI-Driven Approaches for Optimizing Power Consumption: A Comprehensive Survey [0.0] 電力最適化が重要である主な理由は、環境効果の低減、運転コストの低減、安定的で持続可能なエネルギー供給である。
電力最適化と人工知能(AI)の統合は、エネルギーの生成、使用、分散の方法を変えるために不可欠である。
AI駆動のアルゴリズムと予測分析によって、電力使用傾向のリアルタイム監視と分析が可能になる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 04:42:37 GMT)
A general frame of quantum simulation for nonlinear partial differential equations [0.0] 量子シミュレーションの「擬似化」技法は、任意の非線形PDEに拡張される。
単純性のために、我々はこれをHAM-Schr'odingerisation quantum algorithm'と呼ぶ。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 11:33:09 GMT)
A frame-bundle formulation of quantum reference frames: from superposition of perspectives to superposition of geometries [0.0] 我々は、量子参照フレーム(QRF)のコアアイデアの完全な幾何学的定式化を可能にする。
QRFは、各時空点における観測者の時間と空間に対する認識について不確実性を符号化する。
QRFは局所的に、セクション全体ではなくイベントのベースに振幅をもたらすことができる。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 12:57:55 GMT)
A Review of Electromagnetic Elimination Methods for low-field portable MRI scanner [0.0] 本稿では,MRIシステムにおける電磁干渉(EMI)を除去するための従来法と深層学習法の両方を包括的に分析する。
我々は、最先端のディープラーニングアプローチと同様に、従来の分析的および適応的なEMI除去技術の基礎となる原則と実装について検討する。
この結果は,従来の手法の信頼性とディープラーニングの高度な能力を組み合わせることで,MRIシステムにおけるより堅牢で効果的なEMI抑制戦略を開発するためのバランスのとれたアプローチを示唆している。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 15:24:33 GMT)
A Nonoverlapping Domain Decomposition Method for Extreme Learning Machines: Elliptic Problems [0.0] エクストリーム・ラーニング・マシン(ELM)は、単一層フィードフォワードニューラルネットワークを用いて偏微分方程式(PDE)を解く手法である。
本稿では,EMMのトレーニング時間を短縮するだけでなく,並列計算にも適する非重複領域分解法(DDM)を提案する。
論文参考訳(メタデータ) (Sat, 22 Jun 2024 23:25:54 GMT)