Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction [153.5] Gambaは、単一のビューイメージからエンドツーエンドの3D再構成モデルである。
1つのNVIDIA A100 GPUで0.05秒以内に再構築が完了する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:43:28 GMT)
Alleviating Hallucinations in Large Vision-Language Models through Hallucination-Induced Optimization [123.5] 大規模ビジュアル言語モデル(LVLM)は、マルチモーダルデータの理解において、例外的な能力を示した。
彼らは必然的に幻覚に悩まされ、生成されたテキストと対応するイメージを切断する。
現在の視覚的コントラスト復号法のほとんどは、視覚的不確実性情報を導入して幻覚を緩和しようとするものである。
しかし、彼らは幻覚トークンを正確に誘導するのに苦労し、幻覚を緩和する効果を著しく制限した。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:46:31 GMT)
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model [118.1] We present DeepSeek-V2, a strong Mixture-of-Experts (MoE) language model characterized by economical training and efficient inference。
DeepSeek-V2は、MLA(Multi-head Latent Attention)やDeepSeekMoEといった革新的なアーキテクチャを採用している。
DeepSeek-V2はDeepSeek 67Bと比較して大幅に性能が向上し、トレーニングコストは42.5%削減された。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:24:58 GMT)
GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering [112.2] GES(Generalized Exponential Splatting)は、GEF(Generalized Exponential Function)を用いて3Dシーンをモデル化する斬新な表現である。
周波数変調損失の助けを借りて、GESは新規なビュー合成ベンチマークにおいて競合性能を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:13:43 GMT)
Curriculum Direct Preference Optimization for Diffusion and Consistency Models [110.1] テキスト・ツー・イメージ・ジェネレーションのためのカリキュラム学習に基づくDPOの新しい拡張版を提案する。
我々のアプローチであるCurriculum DPOは、3つのベンチマークにおける最先端の微調整手法と比較される。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:14:40 GMT)
Critical Learning Periods Emerge Even in Deep Linear Networks [102.9] クリティカルラーニング期間(Critical Learning periods)は、一時的な感覚障害が行動や学習表現に恒久的な影響を及ぼす発達初期の期間である。
生物学的ネットワークと人工ネットワークの急激な違いにもかかわらず、両方のシステムで臨界学習期間が経験的に観察されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:23:57 GMT)
Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement [102.2] SIMAは、自己改善を通じて視覚的および言語的モダリティアライメントを強化するフレームワークである。
コンテキスト内自己批判機構を使用して、プライオリティチューニングのためのレスポンスペアを選択する。
SIMAは従来の手法よりも優れたモダリティアライメントを実現することを実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:09:27 GMT)
Efficient Adversarial Training in LLMs with Continuous Attacks [99.6] 大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。
本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。
C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:20:09 GMT)
InternLM-Math: Open Math Large Language Models Toward Verifiable Reasoning [98.5] InternLM2から事前学習を継続するILMs InternLM-Mathをオープンソースとして公開する。
我々は、連鎖推論、報酬モデリング、形式推論、データ拡張、コードインタプリタを、統一されたSeq2seqフォーマットで統一する。
我々の事前学習モデルは、微調整なしでMiniF2Fテストセットで30.3を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:09:21 GMT)
eQMARL: Entangled Quantum Multi-Agent Reinforcement Learning for Distributed Cooperation over Quantum Channels [98.3] 量子コンピューティングは、マルチエージェント環境における量子絡み合いと協調の潜在的なシナジーを引き起こした。
現在の最先端量子MARL(QMARL)の実装は、古典的な情報共有に依存している。
eQMARL(eQMARL)は、量子チャネル上での協調を容易にする分散型アクター批判フレームワークである。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:43:05 GMT)
Learning Generalizable Human Motion Generator with Reinforcement Learning [95.6] テキスト駆動型ヒューマンモーション生成は、コンピュータ支援コンテンツ作成において重要なタスクの1つである。
既存の方法は訓練データ中の特定の動作表現に過度に適合することが多く、一般化する能力を妨げている。
一般化可能なヒューマンモーション生成のための強化学習において,パスとエラーのパラダイムを取り入れた textbfInstructMotion を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:29:12 GMT)
Near to Mid-term Risks and Opportunities of Open-Source Generative AI [94.1] Generative AIの応用は、科学や医学、教育など、さまざまな分野に革命をもたらすことが期待されている。
こうした地震の影響の可能性は、潜在的なリスクに関する活発な議論を引き起こし、より厳格な規制を要求した。
この規制は、オープンソースのジェネレーティブAIの誕生する分野を危険にさらしている可能性が高い。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:51:29 GMT)
Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations [92.2] 実用的な分散システムでは、労働者は概して均質ではなく、非常に多様な処理時間を持つ。
本稿では、任意に遅い計算を扱うための新しい並列手法Freyaを提案する。
Freyaは従来の手法と比較して,複雑性の保証が大幅に向上していることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:33:30 GMT)
IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts [90.5] IPDreamerは、複雑な画像から詳細で包括的な外観特徴を抽出するために、画像プロンプト適応を取り入れた新しいアプローチである。
以上の結果から,IDDreamerは提供されたテキストと複雑な画像プロンプトの出現の両方に整合した高品質な3Dオブジェクトを効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:17:09 GMT)
SF-DQN: Provable Knowledge Transfer using Successor Feature for Deep Reinforcement Learning [89.0] 本稿では、複数のRL問題が異なる報酬関数を持つが、基礎となる遷移力学を共有する転写強化学習(RL)問題を考察する。
この設定では、各RL問題(タスク)のQ-関数を後継特徴(SF)と報酬マッピングに分解することができる。
GPIを用いたSF-DQNの証明可能な一般化保証を用いた最初の収束解析を確立する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:30:14 GMT)
PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.7] 再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:43:55 GMT)
Rethinking CLIP-based Video Learners in Cross-Domain Open-Vocabulary Action Recognition [84.3] 本稿では,この課題の1つの重要な課題,すなわちシーンバイアスに着目し,新しいシーン対応ビデオテキストアライメント手法を提案する。
我々のキーとなる考え方は、映像表現とシーン符号化されたテキスト表現とを区別し、シーンに依存しないビデオ表現を学習し、ドメイン間のアクションを認識することである。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:47:03 GMT)
Principled Penalty-based Methods for Bilevel Reinforcement Learning and RLHF [82.7] 本稿では, ペナルティ定式化のレンズによる二レベルRL問題の解法として, 第一原理のアルゴリズムフレームワークを提案する。
本稿では,問題景観とそのペナルティに基づく勾配(政治)アルゴリズムについて理論的研究を行う。
シミュレーションによるアルゴリズムの有効性を,Stackelberg Markovゲーム,人間からのフィードバックとインセンティブ設計によるRLで実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:47:54 GMT)
MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion [81.8] トレーニング不要なマルチモーダルLLMエージェント (MuLan) を人体画家として開発し, 段階的にマルチオブジェクトを生成する。
MuLanは、大きな言語モデル(LLM)を使用して、サブタスクのシーケンスへのプロンプトを分解する。
MuLanはまた、視覚言語モデル(VLM)を採用して、各サブタスクで生成された画像にフィードバックを提供し、拡散モデルを制御して、元のプロンプトに反した場合に画像を再生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:56:58 GMT)
How do Large Language Models Handle Multilingualism? [81.2] 本研究では,大規模言語モデル(LLM)が多言語モデルをどのように扱うかを検討する。
LLMはまずクエリを理解し、タスク解決のために多言語入力を英語に変換する。
中間層では、英語を思考に用い、自己意識とフィードフォワード構造を持つ多言語知識を取り入れている。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:59:10 GMT)
HDR-GS: Efficient High Dynamic Range Novel View Synthesis at 1000x Speed via Gaussian Splatting [79.9] 既存のHDR NVS法は主にNeRFに基づいている。
既存のHDR NVS法は主にNeRFに基づいており、長いトレーニング時間と遅い推論速度に悩まされている。
我々は,新しいHDRビューを効率よくレンダリングできる新しいフレームワークであるHigh Dynamic Range Gaussian Splatting (-GS)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:46:58 GMT)
Computational Tradeoffs in Image Synthesis: Diffusion, Masked-Token, and Next-Token Prediction [79.8] 拡散、マスク付きトーケン予測、および次のトーケン予測はすべてトランスフォーマーネットワークアーキテクチャを使用する。
FLOPで測定された計算予算のレンズを用いて,各手法のスケーラビリティを解析する。
次点予測によって導かれるトークン予測手法は, 後続のプロンプト上での拡散率を著しく上回ることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:58:09 GMT)
ConvLLaVA: Hierarchical Backbones as Visual Encoder for Large Multimodal Models [77.6] 高解像度のLMM(Large Multimodal Models)は、過度な視覚トークンと二次的な視覚的複雑さの課題に直面する。
本稿では,LMMのビジュアルエンコーダとして,階層的なバックボーンであるConvNeXtを用いるConvLLaVAを提案する。
ConvLLaVAは高解像度画像を情報豊富な視覚特徴に圧縮し、過剰な視覚トークンの発生を効果的に防止する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:34:15 GMT)
Executable Code Actions Elicit Better LLM Agents [77.0] この研究は、Pythonコードを使用して、Large Language Model(LLM)エージェントのアクションを統一されたアクション空間(CodeAct)に統合することを提案する。
Pythonインタプリタと統合されたCodeActは、コードアクションを実行し、事前アクションを動的に修正したり、マルチターンインタラクションを通じて新しい観察に新しいアクションを発行することができる。
CodeActのパフォーマンス向上は、解釈可能なコードを実行し、自然言語を使ってユーザとコラボレーションすることで、環境と対話するオープンソースのLLMエージェントを構築する動機となります。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:05:14 GMT)
Event Detection from Social Media for Epidemic Prediction [76.9] ソーシャルメディア投稿から疫病関連事象を抽出・分析する枠組みを構築した。
実験では、新型コロナウイルスベースのSPEEDで訓練されたEDモデルが、3つの目に見えない流行の流行を効果的に検出する方法が明らかにされている。
モンキーポックスのWHO流行宣言より4~9週間早く,抽出した事象の報告が急激な増加を示すことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:58:11 GMT)
StrategyLLM: Large Language Models as Strategy Generators, Executors, Optimizers, and Evaluators for Problem Solving [76.5] StrategyLLM は LLM が帰納的推論、特定のタスクインスタンスからの一般的な戦略の導出、帰納的推論を可能にし、これらの一般的な戦略を特定のタスク例に適用し、一般化可能で一貫した数発のプロンプトを構築する。
実験の結果、StrategyLLMは、数学推論(34.2%$rightarrow$38.8%)、コモンセンス推論(70.3%$rightarrow$72.5%)、アルゴリズム推論(73.7%$rightarrow$85.0)を含む、4つの難しいタスクにまたがる13のデータセットに対して、人間によるアノテートソリューションを必要とする競争ベースラインのCoT-SCよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:55:23 GMT)
Text-Based Reasoning About Vector Graphics [76.4] 本稿では,ベクトルグラフィックスに関するテキストベースの推論を行うVisually Descriptive Language Model (VDLM)を提案する。
プリマルビジュアル記述(PVD)による事前訓練言語モデルを用いたVDLMブリッジ
我々のフレームワークは、その不整合認識と推論プロセスにより、より良い解釈可能性を提供します。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:40:26 GMT)
Automating the Diagnosis of Human Vision Disorders by Cross-modal 3D Generation [76.4] 我々は、fMRIを視覚的に可視な3次元視覚にデコードするためにAIがどのように使用できるかを示し、fMRIデータの自動臨床分析を可能にする。
我々は、被験者のfMRIデータを入力として利用する、新しい3Dシーン表現学習手法であるBrain3Dを設計する。
非専門的診断は、脳3Dが人間の視覚系内のV1、V2、V3、V4、中間側頭葉(MTL)などの障害のある脳領域を正常に識別できることを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:06:11 GMT)
Decompose and Aggregate: A Step-by-Step Interpretable Evaluation Framework [75.8] 大規模言語モデル(LLM)はスケーラブルで経済的な評価指標である。
これらの評価者がどの程度信頼できるかという問題は、重要な研究課題として浮上している。
本稿では,デコンプリートとアグリゲートを提案し,その評価プロセスを教育実践に基づいて異なる段階に分解する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:12:30 GMT)
The Road Less Scheduled [75.1] 最適化停止ステップTの仕様を必要としない既存の学習率スケジュールは、Tに依存する学習率スケジュールにより大幅に改善される。
本稿では,スケジュールを全面的に活用することで,この停止時間を回避するアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:20:46 GMT)
Data Reconstruction: When You See It and When You Don't [75.0] 我々は,2つの補足的な疑問に対処することで,再建攻撃の概念を「サンドウィッチ」することを目指している。
我々は,再建攻撃に対するセキュリティ定義を定式化するために,新たな定義パラダイムであるナルシッソス・レジリエンスを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:49:34 GMT)
MambaVC: Learned Visual Compression with Selective State Spaces [74.3] 本稿では,SSMに基づくシンプルで強力で効率的な圧縮ネットワークであるMambaVCを紹介する。
MambaVC は2次元選択的走査 (2DSS) モジュールを備えた視覚状態空間 (VSS) ブロックを各ダウンサンプリング後の非線形活性化関数として開発する。
圧縮ベンチマークデータセットでは、MambaVCはより低い計算とメモリオーバーヘッドでより優れたレート歪み性能を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:24:30 GMT)
Generative Enhancement for 3D Medical Images [74.2] 本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:47:04 GMT)
TACO: Temporal Latent Action-Driven Contrastive Loss for Visual Reinforcement Learning [73.5] 時間的行動駆動型コントラスト学習(TACO: Temporal Action-driven Contrastive Learning)は、時間的コントラスト学習の強力なアプローチである。
TACOは、現在の状態の表現間の相互情報を最適化することにより、状態と行動表現を同時に学習する。
オンラインRLでは、TACOは100万の環境インタラクションステップの後、40%のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:27:54 GMT)
Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models [71.9] 大規模言語モデル (LLM) のための可視化・オブ・ソート (VoT) を提案する。
VoTは、LLMの空間的推論を、それらの推論トレースを可視化することによって引き起こし、その後の推論ステップを導く。
自然言語ナビゲーションや視覚ナビゲーション,2次元グリッドの世界における視覚的タイリングなど,マルチホップ空間推論タスクにVoTを使用している。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:07:44 GMT)
Efficient Degradation-aware Any Image Restoration [71.3] 我々は,低ランク体制下での学習者(DaLe)を用いた効率的なオールインワン画像復元システムである textitDaAIR を提案する。
DaAIRは多種多様な劣化の側面と微妙なニュアンスを共同で掘り下げ、劣化を認識した埋め込みを生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:53:27 GMT)
Multi-Track Timeline Control for Text-Driven 3D Human Motion Generation [71.1] テキスト駆動動作合成におけるタイムライン制御の問題を紹介する。
ユーザーは単一のプロンプトの代わりに、重複する可能性のある時間間隔に整理された複数のプロンプトのマルチトラックタイムラインを指定することができる。
マルチトラックタイムラインから合成アニメーションを生成するための新しいテスト時間復調手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:28:19 GMT)
ContourCraft: Learning to Resolve Intersections in Neural Multi-Garment Simulations [70.4] ニューラルネットワークシミュレーションにおける交差点処理のための学習ベースソリューションであるMonikerを提案する。
モニカーは、衝突の失敗、自己貫通体、または手動で設計された多層構造におけるエラーによって導入された交差点から頑健に回復する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:51:32 GMT)
iVideoGPT: Interactive VideoGPTs are Scalable World Models [70.0] マルチモーダル信号を統合するスケーラブルな自動回帰変換フレームワークであるInteractive VideoGPTを導入する。
iVideoGPTは、高次元の視覚的観察を効率的に識別する新しい圧縮トークン化技術を備えている。
我々の研究は、インタラクティブな汎用世界モデルの開発を進め、生成ビデオモデルと実践的なモデルベース強化学習アプリケーションとのギャップを埋める。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:29:12 GMT)
Light Unbalanced Optimal Transport [69.2] 既存の解法は、原理に基づいているか、複数のニューラルネットワークを含む複雑な最適化目標を重み付けしている。
我々は,この解法がUEOT解の普遍近似を提供し,一般化限界を得ることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:53:23 GMT)
Interpreting Key Mechanisms of Factual Recall in Transformer-Based Language Models [68.8] 本研究では,トランスフォーマーベース言語モデル(LLM)を用いて,現実的なリコール処理を行うメカニズムについて検討する。
出力の出力を人間の理解するコンポーネントに分解することを目的とした,新しい分析手法を提案する。
我々は、事実的リコールの信頼性を高めるために、私たちの解釈を活用することで、この抑制を緩和する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:06:45 GMT)
SEP: Self-Enhanced Prompt Tuning for Visual-Language Model [68.7] SEP(Self-Enhanced Prompt Tuning)という新しいアプローチを導入する。
SEPは、テキストレベルの埋め込みと視覚レベルの埋め込みの両方を強化するために、差別的な事前知識を明示的に取り入れている。
様々なベンチマークやタスクの総合的な評価は、プロンプトチューニングにおけるSEPの有効性を確認している。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:35:56 GMT)
Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition [68.7] 低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的および静的なシーンの復元を目指している。
1つの重要な側面は、時間空間照明と外観強化バージョンに特化した一貫性の制約を定式化することである。
本稿では,レチネックスを基盤とした革新的なビデオ分解戦略について述べる。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:56:40 GMT)
Fast Text-to-3D-Aware Face Generation and Manipulation via Direct Cross-modal Mapping and Geometric Regularization [67.6] テキストから3D対応顔(T3D Face)の生成と操作は、機械学習における新たなホットスポットである。
E3$-FaceNetと呼ばれる高速かつ高精度なT3D顔生成と操作のためのエンド・ツー・エンド・エンド・エフェクト・ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:49:14 GMT)
DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.9] 本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルで効果的なアプローチであるDEEMを提案する。
DEEMは、訓練可能なパラメータを少なくし、事前訓練データが少なく、ベースモデルのサイズを小さくし、幻覚を緩和するための強化された堅牢性と優れた能力を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:46:04 GMT)
Adapting LLaMA Decoder to Vision Transformer [66.2] 本研究は,LLaMAなどのデコーダのみのトランスフォーマーをコンピュータビジョン分野に適用できるかどうかを検討する。
まず、LLaMAのアーキテクチャと整合する標準的なViTのステップバイステップを「LLaMAfy」と呼び、カジュアルマスクを自己注意に直接適用することで、注意崩壊の問題が発生することを発見した。
トレーニング開始時の自己注意にカジュアルマスクを徐々に導入し,最適化行動を容易にするソフトマスク戦略を開発する。
イメージLLaMA (iLLaMA) はアーキテクチャにおいてLLaMAと似ており、直接的に使用することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:16:49 GMT)
FreeMotion: A Unified Framework for Number-free Text-to-Motion Synthesis [65.9] そこで本稿では, 条件付き動作分布を用いて, 単独動作と多人数動作を統一する動き生成手法を提案する。
筆者らの枠組みに基づいて,現在ある一対一動作空間制御手法をシームレスに統合し,多対一動作の正確な制御を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:57:57 GMT)
ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models [65.8] 拡散生成モデルの既存のトレーニングスキームにより,次元と属性の組み合わせによって区切られた空間が十分に標本化されていないことを示す。
構造を完全に活用するプロセスを構築し,ComboStocという名前でこの問題に対処する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:05:59 GMT)
Looking Backward: Streaming Video-to-Video Translation with Feature Banks [65.5] StreamV2Vは、ユーザプロンプトによるリアルタイムストリーミングビデオ変換(V2V)を実現する拡散モデルである。
1つのA100 GPU上で20 FPSを実行することができ、FlowVid、CoDeF、Rerender、TokenFlowよりも15x、46x、108x、158x高速である。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:53:06 GMT)
UnKE: Unstructured Knowledge Editing in Large Language Models [65.1] 本稿では,非構造化知識編集手法,すなわちUnKEを提案する。
レイヤレベルでキーと値のペアを利用することで、UnKEは複雑で包括的な非構造化知識を効果的に表現し、編集する。
新たに提案された非構造知識編集データセット(UnKE)と従来の構造化データセットの結果は、UnKEが顕著な性能を発揮することを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:42:40 GMT)
LAM3D: Large Image-Point-Cloud Alignment Model for 3D Reconstruction from Single Image [64.9] 大規模再構成モデルは、単一または複数入力画像から自動3Dコンテンツ生成の領域において大きな進歩を遂げている。
彼らの成功にもかかわらず、これらのモデルはしばしば幾何学的不正確な3Dメッシュを生成し、画像データからのみ3D形状を推論する固有の課題から生まれた。
生成した3Dメッシュの忠実度を高めるために3Dポイントクラウドデータを利用する新しいフレームワークであるLarge Image and Point Cloud Alignment Model (LAM3D)を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:09:12 GMT)
Risks and Opportunities of Open-Source Generative AI [64.7] Generative AI(Gen AI)の応用は、科学や医学、教育など、さまざまな分野に革命をもたらすことが期待されている。
こうした地震の変化の可能性は、この技術の潜在的なリスクについて活発に議論を巻き起こし、より厳格な規制を要求した。
この規制は、オープンソースの生成AIの誕生する分野を危険にさらす可能性がある。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:12:49 GMT)
Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.6] ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:13:31 GMT)
PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization [63.6] 審査用大言語モデル PandaLM は、いくつかの大きな言語モデルが与えられた優れたモデルを区別するために訓練されている。
PandaLMは、相対的簡潔さ、明快さ、指示への固執、包括性、形式性などの重要な主観的要因に対処する。
PandaLMはGPT-3.5の評価能力の93.75%、テストデータセットのF1スコアの88.28%を達成している。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:37:31 GMT)
CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.5] 本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:49:02 GMT)
RFold: RNA Secondary Structure Prediction with Decoupled Optimization [63.4] RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:05:40 GMT)
U3M: Unbiased Multiscale Modal Fusion Model for Multimodal Semantic Segmentation [63.3] U3M: An Unbiased Multiscale Modal Fusion Model for Multimodal Semanticsを紹介する。
我々は,グローバルな特徴とローカルな特徴の効果的な抽出と統合を保証するために,複数のスケールで機能融合を採用している。
実験により,本手法は複数のデータセットにまたがって優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:58:48 GMT)
Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model [62.5] Ctrl-Adapterは、事前訓練されたコントロールネットの適応を通じて、任意の画像/ビデオ拡散モデルに多様なコントロールを追加する。
6つの多様なU-Net/DiTベースの画像/ビデオ拡散モデルにより、Ctrl-AdapterはCOCO上の事前訓練されたコントロールネットのパフォーマンスと一致する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:29:38 GMT)
MindDial: Belief Dynamics Tracking with Theory-of-Mind Modeling for Situated Neural Dialogue Generation [62.4] MindDialは、Mind-of-mindモデリングで位置決め自由形式の応答を生成できる、新しい対話型フレームワークである。
本研究では、話者の信念と話者の聴取者の信念を予測できる明示的なマインドモジュールを導入する。
筆者らのフレームワークは,提案手法と微調整モデルの両方に適用され,共通地盤アライメントとネゴシエーションの両方を含むシナリオで評価される。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:46:15 GMT)
Text-guided 3D Human Motion Generation with Keyframe-based Parallel Skip Transformer [62.3] 既存のアルゴリズムは、コストがかかりエラーを起こしやすい全シーケンスを直接生成する。
本稿では,入力テキストに対応する人間の動作系列を生成するKeyMotionを提案する。
我々は,自動エンコーダを潜在空間に投影するために,Kullback-Leibler正規化付き変分符号器(VAE)を用いる。
逆拡散のために,デザインラテントとテキスト条件の相互参照を行う新しいパラレルスキップ変換器を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:12:37 GMT)
Inverse-RLignment: Inverse Reinforcement Learning from Demonstrations for LLM Alignment [62.1] 本稿では,これらの課題を克服するために,高品質な実演データを活用する新しいアプローチであるAlignment from Demonstrations (AfD)を紹介する。
AfDをシーケンシャルな意思決定フレームワークで形式化し、報酬信号の欠如というユニークな課題を強調します。
そこで本研究では,AfD に適した報酬モデル上で補間を行う計算効率のよいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:13:53 GMT)
Enhancing Text-to-Image Editing via Hybrid Mask-Informed Fusion [61.4] 本稿では拡散モデルに基づくテキスト誘導画像編集手法を体系的に改善する。
我々は、人間のアノテーションを外部知識として組み込んで、Mask-informed'領域内で編集を限定する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:53:59 GMT)
Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation [61.0] Score Identity Distillation (SiD) は、事前学習した拡散モデルの生成能力を1ステップ生成器に蒸留する革新的なデータフリー手法である。
SiDは、蒸留中のFr'echet開始距離(FID)を指数的に高速に減少させるだけでなく、元の教師拡散モデルのFID性能に近づいたり、超えたりする。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:20:46 GMT)
Nudging Users to Change Breached Passwords Using the Protection Motivation Theory [58.9] 我々は保護動機理論(PMT)に基づいて、侵入したパスワードの変更を促すナッジを設計する。
本研究は, PMTのセキュリティ研究への応用に寄与し, 漏洩したクレデンシャル通知を改善するための具体的な設計上の意味を提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:51:15 GMT)
Provable Training for Graph Contrastive Learning [58.8] Graph Contrastive Learning (GCL)は、ラベルのない拡張グラフからノード埋め込みを学習するための一般的なトレーニング手法として登場した。
GCLのトレーニングは、実際にはすべてのノードで不均衡であることを示す。
ノードがGCLの原理に従う方法の下位境界である計量「ノードコンパクト性」を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:05:30 GMT)
Certifiably Robust RAG against Retrieval Corruption [58.7] Retrieval-augmented Generation (RAG) は、回復汚職攻撃に弱いことが示されている。
本稿では,ロバストRAGを検索汚職攻撃に対する最初の防御フレームワークとして提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:44:25 GMT)
MarkLLM: An Open-Source Toolkit for LLM Watermarking [58.6] MarkLLMは、LLMウォーターマーキングアルゴリズムを実装するためのオープンソースのツールキットである。
評価のために、MarkLLMは3つの視点にまたがる12のツールと、2種類の自動評価パイプラインを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:15:54 GMT)
Chain-of-Thought Prompting for Demographic Inference with Large Multimodal Models [58.6] 大規模マルチモーダルモデル (LMM) は、様々な研究課題において変換可能性を示している。
以上の結果から,LMMはゼロショット学習,解釈可能性,未修正入力の処理に長所があることが示唆された。
本稿では,目標外予測問題を効果的に緩和するChain-of-Thought拡張プロンプト手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:26:56 GMT)
Mind the Gap: A Causal Perspective on Bias Amplification in Prediction & Decision-Making [58.1] 本稿では,閾値演算による予測値がS$変化の程度を測るマージン補数の概念を導入する。
適切な因果仮定の下では、予測スコア$S$に対する$X$の影響は、真の結果$Y$に対する$X$の影響に等しいことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:22:19 GMT)
Fairness-Accuracy Trade-Offs: A Causal Perspective [58.1] 我々は、初めて因果レンズから公正性と正確性の間の張力を分析する。
因果的制約を強制することは、しばしば人口集団間の格差を減少させることを示す。
因果制約付きフェアラーニングのための新しいニューラルアプローチを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:19:52 GMT)
Scaling Up Dynamic Human-Scene Interaction Modeling [58.0] TRUMANSは、現在利用可能な最も包括的なモーションキャプチャーHSIデータセットである。
人体全体の動きや部分レベルの物体の動きを複雑に捉えます。
本研究では,任意の長さのHSI配列を効率的に生成する拡散型自己回帰モデルを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:11:04 GMT)
Let Me Do It For You: Towards LLM Empowered Recommendation via Tool Learning [57.5] 大きな言語モデル(LLM)は、常識的な推論と外部ツールの活用の能力を示している。
ツール学習を通じてLLMを活用したレコメンデーションのためのフレームワークであるToolRecを紹介する。
属性の粒度を探索するプロセスとして推薦プロセスを定式化する。
属性指向ツールには,ランクツールと検索ツールの2種類がある。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:06:54 GMT)
JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning [57.4] JsonTuningは、命令チューニングのための新しい構造から構造へのアプローチである。
JsonTuningは、本質的なタスク要素を理解することによって、一般化を強化する。
曖昧さを減らして堅牢性を向上し、出力に対する明示的な制御を提供することで制御性を向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:44:12 GMT)
Decoding at the Speed of Thought: Harnessing Parallel Decoding of Lexical Units for LLMs [57.3] 大規模言語モデルは、自然言語の理解と生成において例外的な能力を示した。
しかし、それらの生成速度は、その復号過程の本質的にシーケンシャルな性質によって制限される。
本稿では,データ駆動方式で実装された新しいデコーディング手法であるLexical Unit Decodingを紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:35:13 GMT)
Towards Understanding the Working Mechanism of Text-to-Image Diffusion Model [57.2] 近年,高画質テキスト・トゥ・イメージ(T2I)生成に強力な遅延拡散確率モデル (DPM) が適用されている。
段階的デノナイジング生成過程における中間状態を調べることでDPMの背後にあるメカニズムを解明する。
本稿では,テキストガイダンスを適切に取り除き,T2I生成プロセスの高速化に本観測を適用した。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:12:41 GMT)
DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.9] 大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:40:48 GMT)
COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.8] 顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:07:51 GMT)
On the Identification of Temporally Causal Representation with Instantaneous Dependence [56.3] 時間的因果表現学習は時系列観測から潜在因果過程を特定することを目的としている。
ほとんどの方法は、潜在因果過程が即時関係を持たないという仮定を必要とする。
我々は,インスタントtextbfOus textbfLatent dynamics のための textbfIDentification フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:08:05 GMT)
Indexed Minimum Empirical Divergence-Based Algorithms for Linear Bandits [55.9] Indexed Minimum Empirical Divergence (IMED)は、マルチアームバンディット問題に対する非常に効果的なアプローチである。
UCBベースのアルゴリズムとトンプソンサンプリングを実証的に上回ることが観察されている。
我々は、LinIMEDアルゴリズムのファミリーと呼ぶIMEDアルゴリズムの新しい線形バージョンを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:11:58 GMT)
Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.1] 本稿では,天気予報をより微細なテンポラルスケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
我々は、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:56:33 GMT)
A Distributional Analogue to the Successor Representation [55.0] 本稿では,分散強化学習のための新しい手法を提案する。
学習プロセスにおける遷移構造と報酬のクリーンな分離を解明する。
実例として,ゼロショットリスクに敏感な政策評価が可能であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:29:32 GMT)
Improved Distribution Matching Distillation for Fast Image Synthesis [54.7] この制限を解除し、MDDトレーニングを改善する一連の技術であるMDD2を紹介する。
まず、回帰損失と高価なデータセット構築の必要性を排除します。
第2に, GAN損失を蒸留工程に統合し, 生成した試料と実画像との識別を行う。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:08:32 GMT)
CAP-UDF: Learning Unsigned Distance Functions Progressively from Raw Point Clouds with Consistency-Aware Field Optimization [54.7] CAP-UDFは、生の点雲から一貫性を考慮したUDFを学ぶための新しい方法である。
我々は、クエリと近似曲面の関係を徐々に推測するようにニューラルネットワークを訓練する。
学習されたUDFの勾配を用いて表面を抽出する多角化アルゴリズムも導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:19:39 GMT)
Cross-Domain Policy Adaptation by Capturing Representation Mismatch [53.1] 強化学習(RL)において、動的に異なる領域に移行できる効果的な政策を学ぶことが不可欠である。
本稿では、ソースドメインとターゲットドメインとの間に動的ミスマッチが存在する場合の動的適応設定について考察する。
対象領域でのみ表現学習を行い、ソース領域からの遷移における表現偏差を測定する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:06:12 GMT)
Towards Understanding How Transformer Perform Multi-step Reasoning with Matching Operation [52.8] 大きな言語モデルの内部的推論メカニズムを調べることは、よりよいモデルアーキテクチャとトレーニング戦略を設計するのに役立ちます。
構築したデータセットの多段階推論においてTransformerが使用するマッチング機構について検討する。
本稿では,この現象に基づくモデル推論能力の上限に関する予想を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:41:26 GMT)
Tripod: Three Complementary Inductive Biases for Disentangled Representation Learning [52.7] 本研究では,文献から選択した3つの帰納バイアスを持つニューラルネットワークオートエンコーダを提案する。
しかし、実際には、これらの帰納バイアスをインスタンス化する既存の技術を組み合わせることは、大きな利益をもたらすことに失敗する。
学習問題を単純化する3つの手法に適応し、不変性を安定化する鍵正則化項とクォーシュ縮退インセンティブを提案する。
結果のモデルであるTripodは、4つのイメージアンタングルメントベンチマークのスイートで最先端の結果を得る。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:52:02 GMT)
VDGD: Mitigating LVLM Hallucinations in Cognitive Prompts by Bridging the Visual Perception Gap [52.5] 我々は幻覚の詳細な分析を行い、LVLMが幻覚をいかに、いつ、どのように、どのように、どのように、そして、どのようにして、新しい洞察を導き出す。
この欠点を克服するために、幻覚を緩和するためのシンプルで頑健でトレーニングのないVisual Description Grounded Decoding (VDGD)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:21:59 GMT)
A Unified Theory of Stochastic Proximal Point Methods without Smoothness [52.3] 近点法はその数値的安定性と不完全なチューニングに対する頑健性からかなりの関心を集めている。
本稿では,近位点法(SPPM)の幅広いバリエーションの包括的解析について述べる。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:09:19 GMT)
Novel Kernel Models and Exact Representor Theory for Neural Networks Beyond the Over-Parameterized Regime [52.0] 本稿では、ニューラルネットワークの2つのモデルと、任意の幅、深さ、トポロジーのニューラルネットワークに適用可能なトレーニングについて述べる。
また、局所外在性神経核(LeNK)の観点から、非正規化勾配降下を伴う階層型ニューラルネットワークトレーニングのための正確な表現子理論を提示する。
この表現論は、ニューラルネットワークトレーニングにおける高次統計学の役割と、ニューラルネットワークのカーネルモデルにおけるカーネル進化の影響について洞察を与える。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:30:36 GMT)
DFGNN: Dual-frequency Graph Neural Network for Sign-aware Feedback [51.7] 本稿では,周波数フィルタの観点から正負のフィードバックをモデル化する新しいモデルを提案する。
実世界のデータセットについて広範な実験を行い、提案モデルの有効性を実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:07:41 GMT)
BlockFusion: Expandable 3D Scene Generation using Latent Tri-plane Extrapolation [51.0] BlockFusionは拡散ベースのモデルで、3Dシーンを単位ブロックとして生成し、シーンを拡張するためにシームレスに新しいブロックを組み込む。
シーン要素の配置と配置を制御するために2次元レイアウトコンディショニング機構を使用する。
実験結果から、BlockFusionは多様な、幾何学的に整合性があり、拘束力のない大きな3Dシーンを生成可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:56:20 GMT)
Understanding the differences in Foundation Models: Attention, State Space Models, and Recurrent Neural Networks [50.3] 本稿では,これらすべてのアーキテクチャの共通表現に関する原則的な調査を可能にする動的システムフレームワーク(DSF)について紹介する。
ソフトマックスアテンションと他のモデルクラスとの原理的比較を行い、ソフトマックスアテンションを近似できる理論条件について議論する。
このことは、DSFが将来のより効率的でスケーラブルな基盤モデルの体系的な開発を導く可能性を示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:19:57 GMT)
Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow [49.7] 金融、気象学、エネルギーといった産業は毎日大量のデータを生み出している。
本研究では,データ分析エージェントであるData-Copilotを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:35:15 GMT)
Towards Global Optimal Visual In-Context Learning Prompt Selection [49.6] そこで本研究では,グローバルな最適プロンプトを特定するための,コンテキスト内サンプル選択フレームワークを提案する。
Partial2Globalと呼ばれるこの手法では、より包括的な比較を行うために、トランスフォーマーベースのリストワイズローダを採用している。
partial2Globalの有効性は、前景のセグメンテーション、単一物体の検出、画像の着色に関する実験を通じて検証される。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:07:24 GMT)
A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.5] 我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:17:28 GMT)
A Solution-based LLM API-using Methodology for Academic Information Seeking [49.1] SoAyは学術情報検索のためのソリューションベースのLLM API利用方法論である。
ソリューションが事前に構築されたAPI呼び出しシーケンスである場合、推論メソッドとしてソリューションを備えたコードを使用する。
その結果、最先端のLLM APIベースのベースラインと比較して34.58-75.99%のパフォーマンス改善が見られた。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:44:14 GMT)
NVS-Solver: Video Diffusion Model as Zero-Shot Novel View Synthesizer [48.6] そこで本研究では,テキストを不要に操作する新しいビュー合成(NVS)パラダイムを提案する。
NVS-rは、所定のビューで拡散サンプリングプロセスを適応的に変調し、目覚しい視覚体験の作成を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:56:19 GMT)
ALI-Agent: Assessing LLMs' Alignment with Human Values via Agent-based Evaluation [48.5] 大規模言語モデル(LLM)は、人間の価値観と不一致した場合、意図しない、有害なコンテンツも引き出すことができる。
現在の評価ベンチマークでは、LLMが人的価値とどの程度うまく一致しているかを評価するために、専門家が設計した文脈シナリオが採用されている。
本研究では, LLM エージェントの自律的能力を活用し, 奥行き及び適応的アライメント評価を行う評価フレームワーク ALI-Agent を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:38:49 GMT)
Randomized algorithms and PAC bounds for inverse reinforcement learning in continuous spaces [47.9] 本研究は、連続状態と作用空間を持つ離散時間割引マルコフ決定過程を研究する。
まず、専門家の政策全体にアクセスでき、逆問題に対する解決策の集合を特徴づけるケースについて考察する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:53:07 GMT)
WorDepth: Variational Language Prior for Monocular Depth Estimation [47.6] 本研究は,2つの固有不明瞭なモダリティを併用して,メートル法スケールの再構成を行うことができるかどうかを考察する。
一つの画像から高密度深度マップを予測する問題である単眼深度推定に焦点をあてる。
我々のアプローチはテキストと画像の分岐を交互に訓練する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:30:43 GMT)
Emergence of a High-Dimensional Abstraction Phase in Language Transformers [47.6] 言語モデル (LM) は、言語コンテキストから出力トークンへのマッピングである。
我々は5つの事前学習されたトランスフォーマーベースLMと3つの入力データセットに対して、その解析、観察、高レベルの幾何学的アプローチをとる。
本結果は,多くの共通LMアーキテクチャにおいて,中心的な高次元位相がコア言語処理の基盤となることを示唆している。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:49:07 GMT)
SG-Adapter: Enhancing Text-to-Image Generation with Scene Graph Guidance [46.8] 本稿では,シーングラフの構造化表現を利用したScene Graph Adapter(SG-Adapter)を導入する。
SG-Adapterの明示的で完全に連結されていないグラフ表現は、完全に連結されたトランスフォーマーベースのテキスト表現を大幅に改善する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:00:46 GMT)
Parsimony or Capability? Decomposition Delivers Both in Long-term Time Series Forecasting [46.6] 時系列予測(LTSF)は時系列分析において重要なフロンティアである。
本研究は, 分析的および実証的な証拠から, 分解が過剰なモデルインフレーションを包含する鍵であることを実証する。
興味深いことに、時系列データの本質的なダイナミクスに分解を合わせることで、提案モデルは既存のベンチマークより優れている。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:17:03 GMT)
Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment [46.4] リワード・イン・コンテキスト(Rewards-in-Context, RiC)を導入する。
RiCは単一のファンデーションモデルの教師付き微調整のみを必要とし、推論時間中にユーザの好みを動的に調整する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:44:13 GMT)
PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning [46.3] NLP分野におけるRWKVモデルから導かれる線形複雑性のモデルであるPointRWKVを提案する。
まず,改良型マルチヘッド行列値状態を用いて,PointRWKVブロック内のグローバル処理機能について検討する。
次に、グラフ安定化器を用いて、固定半径近傍のグラフに効率よく点雲を符号化する並列分岐を設計する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:02:51 GMT)
Quality-aware Masked Diffusion Transformer for Enhanced Music Generation [46.3] そこで我々は,QA-MDT(Quality-Aware masked diffusion transformer)アプローチを導入し,学習中の入力音楽波形の質を明らかにする。
音楽信号のユニークな特性に基づいて,TTMタスクにMDTモデルを適用し,実装した。
また,キャプション改良データ処理手法により,低品質キャプションの問題にも対処する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:09:27 GMT)
ORCA: A Global Ocean Emulator for Multi-year to Decadal Predictions [45.8] Oceanic Reliable foreCAstは、海洋循環を複数の年単位から2段階の時間スケールで予測する最初のデータ駆動モデルである。
これは、大洋の3次元の循環と力学を、高い物理的一貫性で正確にシミュレートする。
安定かつ忠実に海洋力学を時間スケールでエミュレートし、気候予測にもその可能性を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:23:17 GMT)
Causal de Finetti: On the Identification of Invariant Causal Structure in Exchangeable Data [45.4] 制約に基づく因果探索法は、条件付き独立試験を利用して、様々な応用において因果関係を推定する。
交換可能なデータには、i.d.$$データよりもリッチな条件付き独立構造が含まれており、よりリッチな構造が因果発見にどのように活用できるかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:12:57 GMT)
Full private delegated quantum computing tailored from user to industry [45.0] ユーザレベルおよび業界レベルのユースケースに合わせた、プライベートでセキュアな量子コンピューティングプロトコルとテクニックのセットを提示する。
我々のプロトコルは、暗号化や復号処理に使用される特定のアルゴリズムとは独立しているため、高いレベルで表現される。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:52:11 GMT)
Accommodating Fabrication Defects on Floquet Codes with Minimal Hardware Requirements [45.0] フロケット符号は、ハードウェアの接続要件を減らし、優れたフォールトトレラント特性を提供する。
これは、現実的なハードウェア上でこのようなコードを実行する上で重要な、未調査の課題である。
広帯域な2次元フロケ符号に欠陥量子ビットを収容する新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:00:05 GMT)
Fourier Circuits in Neural Networks: Unlocking the Potential of Large Language Models in Mathematical Reasoning and Modular Arithmetic [44.7] 本稿では,特定の計算戦略を採用するネットワークの背景となる要因について検討する。
一層ニューラルネットワークと一層トランスフォーマーについて述べる。
一層トランスフォーマー研究の注目点として,同様の計算機構を考察する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:28:24 GMT)
Decoding-time Realignment of Language Models [44.5] そこで本研究では, 整列モデルの正則化強度をリトレーニングせずに探索し, 評価する手法を提案する。
DeRaはアライメントの度合いをコントロールし、アンアライメントモデルとアライメントモデルのスムーズな移行を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:39:07 GMT)
Human Image Generation: A Comprehensive Survey [44.2] 本稿では,人間の画像生成技術を3つのパラダイム,すなわちデータ駆動手法,知識誘導手法,ハイブリッド手法に分割する。
異なる手法の利点と特徴はモデルアーキテクチャの観点から要約される。
広範囲の応用可能性により、合成された人間の画像の典型的な下流使用法がカバーされている。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:33:47 GMT)
DehazeDCT: Towards Effective Non-Homogeneous Dehazing via Deformable Convolutional Transformer [43.8] DehazeDCT(Deformable Convolutional Transformer-like Architecture)による非均一なデハージング手法を提案する。
まず,変形可能な畳み込みv4に基づく変圧器型ネットワークを設計し,長距離依存性と適応型空間アグリゲーション機能を実現する。
さらに,ライトウェイトなRetinexインスパイアされた変圧器を活用し,色補正と構造改善を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:59:18 GMT)
EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities [43.7] EconAgentは、マクロ経済シミュレーションのための人間のような特徴を持つ大規模言語モデルを用いたエージェントである。
まず,エージェントの判断による市場動態を取り入れたシミュレーション環境を構築する。
認識モジュールを通して、異なる意思決定機構を持つ異種エージェントを作成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:53:59 GMT)
Beyond the noise: intrinsic dimension estimation with optimal neighbourhood identification [43.3] 内在次元(ID)は教師なし学習と特徴選択における鍵となる概念である。
現実世界のほとんどのデータセットでは、IDはデータが分析されるスケールに依存する。
提案手法では,スイーツスポットを選択するための自動プロトコル,すなわち,IDが有意義で有用である範囲を適切に選択する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:08:05 GMT)
StopThePop: Sorted Gaussian Splatting for View-Consistent Real-time Rendering [42.9] 本稿では,処理オーバーヘッドを最小限に抑えた新しい階層化手法を提案する。
提案手法はガウス版よりも平均で4%遅い。
レンダリング性能はほぼ2倍に向上し,従来のガウス版よりも1.6倍高速になった。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:59:17 GMT)
Stacking Your Transformers: A Closer Look at Model Growth for Efficient LLM Pre-Training [42.9] G_textstack$と呼ばれる深い積み重ね演算子は、トレーニングにおいて顕著な加速を示し、損失が減少し、全体的な性能が向上することを示した。
たとえば、$textitO$2(未使用のスケーラビリティ)については、$G_textstack$はスケーラブルで、一貫してパフォーマンスが良いことを示す。
さらに、$G_textstack$に対する成長タイミングと成長係数を決定するガイドラインを定式化することで、$textitO$3(経験的ガイドラインの欠如)に対処する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:00:00 GMT)
Repelling Random Walks [42.8] グラフに基づくサンプリングを改善するための擬似モンテカルロ機構を提案する。
本稿では,グラフカーネル,PageRankベクトル,およびグラフレット濃度の推定など,ランダムウォークの反発効果を示す。
我々の知る限り、ランダムウォークは、グラフ上のウォーカーの方向を関連づけた最初の厳密に研究された準モンテカルロスキームであり、このエキサイティングな新生領域における新たな研究を招いている。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:05:47 GMT)
General Graph Random Features [42.8] 重み付き隣接行列の任意の関数の偏りのない推定のためのランダムウォークに基づく新しいアルゴリズムを提案する。
提案アルゴリズムは, ノード数に関して, グラフカーネル評価の厳密な3次スケーリングを克服し, 準四次時間的複雑性を享受する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:57:51 GMT)
Defensive Unlearning with Adversarial Training for Robust Concept Erasure in Diffusion Models [42.7] 拡散モデル(DM)はテキスト・画像生成において顕著な成功を収めてきたが、安全性のリスクも生じている。
マシン・アンラーニングのテクニックは、概念消去としても知られ、これらのリスクに対処するために開発されている。
本研究は, 対人訓練(AT)の原理をマシン・アンラーニングに統合することにより, 概念消去の堅牢性を高めることを目的とする。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:47:23 GMT)
Learning from Linear Algebra: A Graph Neural Network Approach to Preconditioner Design for Conjugate Gradient Solvers [42.7] 深層学習モデルは、共役勾配 (CG) 法のような線形解法を反復する際の残差を予条件として用いることができる。
ニューラルネットワークモデルは、この設定でうまく近似するために、膨大な数のパラメータを必要とする。
本研究では,線形代数学から確立したプレコンディショナーを思い出し,GNNの学習の出発点として利用する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:44:30 GMT)
Leakage-Resilient and Carbon-Neutral Aggregation Featuring the Federated AI-enabled Critical Infrastructure [42.7] 本稿では,ACIネットワークに対するリーク耐性,通信効率,カーボンニュートラルアプローチを提案する。
また,CDPAは通信コストを半減し,モデルユーティリティを保ちながら通信コストを半減できることを示す。
我々はCDPAの2.6倍から100倍以上の炭素排出量を発生させる既存のベンチマークを強調した。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:35:09 GMT)
StyleMaster: Towards Flexible Stylized Image Generation with Diffusion Models [42.5] Stylized Text-to-Image Generation (STIG)は、テキストプロンプトとスタイル参照画像に基づいて画像を生成することを目的としている。
本稿では,事前学習した安定拡散を利用して,StyleMasterと呼ばれる新しいフレームワークを提案する。
2つの目的関数を導入し、モデルを最適化し、損失を減らし、セマンティクスとスタイルの一貫性をさらに強化する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:19:40 GMT)
RealCompo: Balancing Realism and Compositionality Improves Text-to-Image Diffusion Models [42.2] RealCompoは、新しいトレーニングフリーで、移行フレンドリーなテキスト・ツー・イメージ生成フレームワークである。
復調過程における2つのモデルの強みのバランスをとるために,直感的で斬新なバランサを提案する。
我々のRealCompoは、幅広い空間認識画像拡散モデルとスタイル化された拡散モデルでシームレスに拡張できる。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:26:46 GMT)
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models [42.2] We present a new efficient LLVM, Mamba based traversal of rationales (Meteor)
豊富な情報を含む長大な論理を埋め込むために,線形時間複雑性を伴う逐次データ処理が可能なMambaアーキテクチャを用いる。
その後、バックボーン・マルチモーダル言語モデル (MLM) を訓練し、合理性の助けを借りて回答を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:04:03 GMT)
Unsupervised Motion Segmentation for Neuromorphic Aerial Surveillance [42.0] イベントカメラには、例外的な時間分解能、優れたダイナミックレンジ、最小限の電力要求がある。
イベントベースモーションセグメンテーションの従来手法には制限があった。
提案手法は,イベントデータと光フロー情報の両方における自己教師型トランスフォーマーの特徴を利用する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:36:13 GMT)
Single-Round Proofs of Quantumness from Knowledge Assumptions [41.9] 量子性の証明は、効率的な量子コンピュータが通過できる、効率よく検証可能な対話型テストである。
既存のシングルラウンドプロトコルは大きな量子回路を必要とするが、マルチラウンドプロトコルはより小さな回路を使用するが、実験的な中間回路測定を必要とする。
我々は、既存の知識仮定に基づいて、量子性の効率的なシングルラウンド証明を構築した。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:33:10 GMT)
Rethinking Independent Cross-Entropy Loss For Graph-Structured Data [41.9] グラフニューラルネットワーク(GNN)は、グラフ構造化データの学習において顕著なパフォーマンスを示した。
本研究では,各ノードと対応するクラスタの結合分布をモデル化する,共同クラスタ型学習という新しいフレームワークを提案する。
このようにして、ローカルクラスタから抽出されたデータラベル参照信号は、ターゲットノード上の識別能力を明示的に強化する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:52:41 GMT)
Scaling Diffusion Mamba with Bidirectional SSMs for Efficient Image and Video Generation [41.5] 本稿では,拡張性のある代替案として,従来の注意機構を先導する新しい拡散アーキテクチャDiffusion Mamba(DiM)を提案する。
DiMは、高速な推論時間と計算負荷の低減を実現し、シーケンス長に対する線形複雑性を維持する。
その結果、DIMのスケーラビリティと効率性を確認し、画像およびビデオ生成技術のための新しいベンチマークを確立した。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:50:27 GMT)
CHARP: Conversation History AwaReness Probing for Knowledge-grounded Dialogue Systems [41.4] 本稿では,会話モデルにおける幻覚評価の改善を目的とした診断テストセットCHARPを紹介する。
広範に分析した結果,CHARPでは会話履歴に効果的に参加できないため,モデルの性能が低下していることが判明した。
以上の結果から,知識基底対話におけるデータセット作成と幻覚評価にかなりの貢献の余地があることが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:00:30 GMT)
Learning to optimize: A tutorial for continuous and mixed-integer optimization [41.3] Learning to Optimize (L2O)は、従来の最適化と機械学習の交差点に立っている。
このチュートリアルでは、L2Oテクニックを深く掘り下げて、最適化アルゴリズムの高速化、ソリューションの見積の迅速化、あるいは最適化問題自体の作り直しなどを紹介している。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:21:01 GMT)
Generating Exceptional Behavior Tests with Reasoning Augmented Large Language Models [41.1] ExLongは、例外的な振る舞いテストを自動的に生成するフレームワークである。
これは、スローステートメントにつながるトレース、スローステートメントを保護する条件式、例外的でない振る舞いテストに関する推論を埋め込んでいる。
我々はexLongとテスト生成のための最先端モデル(CAT-LM)と最強基礎モデル(GPT3.5)を比較した。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:17:11 GMT)
Ask-AC: An Initiative Advisor-in-the-Loop Actor-Critic Framework [41.0] 本稿では,Ask-ACと呼ばれる新しいアドバイザリ・イン・ザ・ループアクター・クリティカル・フレームワークを提案する。
Ask-ACの中心には2つの補完的なコンポーネント、すなわちアクションリクエスタとアダプティブステートセレクタがある。
定常環境および非定常環境における実験結果から,提案手法はエージェントの学習効率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:05:29 GMT)
Transformers represent belief state geometry in their residual stream [40.8] 本稿では,この構造が,データ生成過程の隠蔽状態を更新する信念のメタ力学によって与えられることを示す。
我々の研究は、トレーニングデータの構造と、トランスフォーマーがそれらの振る舞いを実行するために使用する計算構造と表現を結びつけるフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:14:10 GMT)
Prompt-Aware Adapter: Towards Learning Adaptive Visual Tokens for Multimodal Large Language Models [40.5] アダプタは、プロンプトで言及されている特定の関心の対象に関係なく、視覚トークンを生成する。
プロンプト対応アダプタは、プロンプトの特定の焦点に基づいて視覚入力を動的に埋め込む。
このアプローチは、LLMが視覚内容を理解し解釈する能力を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:24:10 GMT)
Coaching Copilot: Blended Form of an LLM-Powered Chatbot and a Human Coach to Effectively Support Self-Reflection for Leadership Growth [40.3] 本稿では,近年のLarge Language Models (LLM) を利用したチャットボットが,エグゼクティブコーチングの分野におけるプロフェッショナルコーチと協調する可能性について考察する。
彼らと一緒にデザインワークショップを開催し,10組のコーチ-クライアントペアに関する2週間のユーザスタディを通じて,人間のコーチを補完するチャットボットの統合の実現可能性とニュアンスについて検討した。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:20:56 GMT)
On the Computational Landscape of Replicable Learning [40.3] 本稿では,Impagliazzo,Lei,Pitassi,Sorrellによって導入された安定性の概念である,アルゴリズム的複製性の計算的側面について考察する。
複製可能性と他の学習可能性の概念との強い統計的つながりを築き上げた最近の研究に動機づけられた我々は、複製可能性とこれらの学習パラダイムの間の計算的つながりをよりよく理解することを目指している。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:30:40 GMT)
OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning [40.1] 本研究では,静的な実演データから模倣ポリシーを事前学習し,高速な微調整を行うオフライン・オンライン・イミテーション学習(IL)について検討する。
我々は, ほぼ専門的なポリシーを同時に学習する, $textttOLLIE$ という原則付きオフライン IL 手法を提案する。
経験的に、$textttOLLIE$は、$textbf20$チャレンジタスクのベースラインメソッドを一貫して大幅に上回ります。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:57:25 GMT)
How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.2] 不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。
本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。
次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:56:39 GMT)
InstructAvatar: Text-Guided Emotion and Motion Control for Avatar Generation [39.2] 本稿では,感情表現型2Dアバターを生成するための新しいテキスト誘導手法を提案する。
我々のフレームワークであるInstructAvatarは、自然言語インタフェースを利用して感情やアバターの顔の動きを制御します。
実験結果から,InstructAvatarは両条件とも良好に一致した結果が得られた。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:53:54 GMT)
No Filter: Cultural and Socioeconomic Diversity in Contrastive Vision-Language Models [38.9] コントラッシブ・ビジョン言語モデル(VLM)における文化的・社会経済的多様性の研究
我々の研究は、より包括的なマルチモーダルシステムを構築するために、多様なデータを使うことの価値を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:39:24 GMT)
Semi-Discrete Optimal Transport: Nearly Minimax Estimation With Stochastic Gradient Descent and Adaptive Entropic Regularization [38.7] 我々は,ラゲールセル推定と密度支持推定の類似性を用いて,OTマップに対して$mathcalO(t-1)$の低いバウンダリレートを証明した。
所望の速さをほぼ達成するために,サンプル数に応じて減少するエントロピー正規化スキームを設計する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:33:20 GMT)
Less is more: Summarizing Patch Tokens for efficient Multi-Label Class-Incremental Learning [38.4] 我々は, pAtch tokeN Embeddings (MULTI-LANE) を要約したクラス増分学習手法を提案する。
提案手法は, pAtch tokeN Embeddings (MULTI-LANE) を要約したマルチラベルクラスインクリメンタルラーニングであり, 高速な推論を実現するとともに, MLCILにおける非絡合タスク固有表現の学習を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:18:27 GMT)
Ada-Tracker: Soft Tissue Tracking via Inter-Frame and Adaptive-Template Matching [38.0] 我々は光学的流れを利用して自然に画素単位の組織変形を捉え、追跡されたテンプレートを適応的に補正する。
Ada-Trackerはより優れた精度を実現し、以前の作業に対してより堅牢に機能する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:01:56 GMT)
FedAWARE: Maximizing Gradient Diversity for Heterogeneous Federated Server-side Optimization [37.7] textscFedAWAREはプラグインモジュールとしてFLアルゴリズムのパフォーマンスを向上させることができる。
textscFedAWAREはプラグインモジュールとしてFLアルゴリズムのパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:13:22 GMT)
PoinTramba: A Hybrid Transformer-Mamba Framework for Point Cloud Analysis [37.2] PoinTrambaはTransformerの分析能力とMambaの卓越した計算効率を組み合わせたハイブリッドフレームワークである。
当社のアプローチでは,まずクラウドをグループに分割し,Transformerが複雑なグループ内依存関係を正確にキャプチャする。
従来のMambaアプローチとは異なり、ランダムな順序付け効果の課題に取り組むために、双方向の重要度対応順序付け(BIO)戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:36:26 GMT)
Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank [37.2] クリックデータから関連性を回復できる条件について検討する。
関連性の回復は、同一性グラフ(IG)が接続されている場合にのみ可能となる。
我々は,ノード介入とノードマージという2つの手法を導入し,データセットの修正とIGの接続性回復を図った。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:29:55 GMT)
Uncertainty Quantification for Neurosymbolic Programs via Compositional Conformal Prediction [36.9] コンフォーマル予測は、機械学習における不確実性を定量化するための有望な戦略として登場した。
本稿では,共形予測をニューロシンボリックプログラムに適用するための新しい枠組みを提案する。
MNISTとMS-COCOの画像を入力として利用するプログラムについて,本手法の評価を行った。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:15:53 GMT)
Beyond Literal Descriptions: Understanding and Locating Open-World Objects Aligned with Human Intentions [36.9] 本稿では、意図駆動型視覚接地(IVG)タスクを提案し、インテンションVGと呼ばれる大規模IVGデータセットを自由形式の意図表現で構築する。
基礎課題を実現するために,現実的なエージェントが様々なシナリオの特定の目標を移動して見つけ出す必要があることを考えると,我々のIVGタスクと意図VGデータセットは,多シナリオ認識と自我中心の視点の両方において重要な特性を考慮に入れている。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:57:38 GMT)
Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach [36.5] 自己教師付き事前学習のための高品質データセットの自動キュレーションの問題点を考察する。
これらの基準をすべて満たしたクラスタリングに基づく手法を提案する。
我々の方法は、大規模で多様なデータリポジトリ上で、$k$-meansの連続的かつ階層的なアプリケーションを含む。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:58:51 GMT)
Can Implicit Bias Imply Adversarial Robustness? [36.5] 勾配に基づくトレーニングアルゴリズムの暗黙のバイアスは、敵の堅牢性を傷つける可能性がある。
勾配流によって訓練された浅層(二層)のReLUネットワークは、よく一般化するが、小半径の敵攻撃には堅牢ではない。
この結果から,トレーニングネットワークの暗黙的バイアスとロバスト性において,データ構造とアーキテクチャの相互作用の重要性を強調した。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:09:53 GMT)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [36.4] そこで本研究では,感情を刺激するイメージを合成し,本来のシーンのセマンティクスと構造を保ちながら,感情を刺激するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。
感情編集データセットが不足しているため、34万対の画像とその感情アノテーションからなるユニークなデータセットを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:58:20 GMT)
Understanding the Impact of Training Set Size on Animal Re-identification [36.4] 本研究では,種特異的な特徴,特に個体内変異が,訓練データ要求に顕著な影響を及ぼすことを示す。
ローカル機能とエンド・ツー・エンドの学習ベースのアプローチの利点を実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:15:52 GMT)
Personalized Adapter for Large Meteorology Model on Devices: Towards Weather Foundation Models [36.2] LM-Weatherは、事前訓練された言語モデル(PLM)を使用する一般的なアプローチである
PLMに軽量なパーソナライズドアダプタを導入し、気象パターンの認識に役立てる。
実験の結果、LM-Weatherは様々なタスクにおいて最先端の結果より優れていた。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:25:09 GMT)
ACPO: A Policy Optimization Algorithm for Average MDPs with Constraints [36.2] 平均基準付き制約付きMDPに対する関数近似アルゴリズムを用いた新しいポリシー最適化を提案する。
我々は,平均CMDPに対する基本感度理論を開発し,それに対応する境界をアルゴリズムの設計に用いた。
ACMDPに適応した他の最先端アルゴリズムと比較して,実験性能が優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:43:35 GMT)
Infinite Limits of Multi-head Transformer Dynamics [36.0] 特徴学習体制における変圧器モデルの訓練力学の様々なスケーリング限界を解析する。
パラメータ化の集合は、適切に定義された無限の幅と深さの制限を許容し、トレーニングを通して注意層を更新することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:01:37 GMT)
MicroAdam: Accurate Adaptive Optimization with Low Space Overhead and Provable Convergence [35.2] 本稿では,メモリオーバーヘッドを最小限に抑えつつ,理論収束保証を維持しつつ,Adamグラデーションの新たな変種を提案する。
分散最適化から古典的誤りフィードバック機構の新たなインスタンスを用いて,結果の圧縮誤差を制御する。
提案手法は, AMSGradと競合することを保証するとともに, 実用性も良好であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:25:23 GMT)
Luban: Building Open-Ended Creative Agents via Autonomous Embodied Verification [35.0] オープンエージェントの構築は常にAI研究の最終的な目標であり、クリエイティブエージェントはより魅力的です。
エージェントがギャップを埋める自律的な実施検証手法を導入し、創造的なタスクの基盤を築き上げます。
具体的には,2段階の自律的実施検証を取り入れた,Minecraftにおける創造的建築タスクを目標とするLubanエージェントを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:25:59 GMT)
ParamReL: Learning Parameter Space Representation via Progressively Encoding Bayesian Flow Networks [34.7] そこで本研究では,パラメータ空間内で動作するParamReLという表現学習フレームワークを提案する。
具体的には、ParamReLは、観察からではなく、パラメータから直接潜在意味論を学習するエンフセルフエンコーダを提案する。
相互情報用語は、潜在意味論の混乱をさらに促進し、同時に意味的意味論を捉える。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:51:38 GMT)
Less is More: on the Over-Globalizing Problem in Graph Transformers [34.5] グローバルアテンション機構は、完全に連結されたグラフにおいてより広い受容場を考慮し、多くの人が有用な情報を全てのノードから抽出できると考えている。
現在の注意機構は,これらの遠隔ノードに過度に焦点を絞っているのに対して,その近辺ノードは実際には有用な情報の大半を包含しているため,比較的弱体化している。
本稿では,コラボレーティブ・トレーニング(CoBFormer)を用いたバイレベル・グローバルグラフ変換器を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:53:13 GMT)
Large Language Models can Deliver Accurate and Interpretable Time Series Anomaly Detection [34.4] 時系列異常検出(TSAD)は、標準トレンドから逸脱する非定型パターンを特定することで、様々な産業において重要な役割を果たす。
従来のTSADモデルは、しばしばディープラーニングに依存しており、広範なトレーニングデータを必要とし、ブラックボックスとして動作する。
LLMADは,Large Language Models (LLMs) を用いて,高精度かつ解釈可能なTSAD結果を提供する新しいTSAD手法である。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:07:02 GMT)
CAFe: Cost and Age aware Federated Learning [34.2] 多くのフェデレートドラーニング(FL)モデルでは、N$のクライアントのうち少なくとも$M$のクライアントがローカルな勾配を返送するのを待つことが一般的な戦略である。
我々は、PSにおけるクライアントの平均年齢が理論収束境界に明示的に現れることを示し、従って、大域モデルの収束を定量化するための計量として用いることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:41:30 GMT)
Transmission Interface Power Flow Adjustment: A Deep Reinforcement Learning Approach based on Multi-task Attribution Map [33.9] 本稿では,データ駆動型深部強化学習(DRL)アプローチを導入し,複数の電力流調整タスクを共同で処理する。
提案手法の中心にはマルチタスク属性マップ (MAM) があり、DRLエージェントは各送信インタフェースタスクを異なる電力系統ノードに明示的に属性付けることができる。
このMAMに基づいて、エージェントは、最適に近い操作コストでマルチタスク調整問題を解決するための効果的な戦略をさらに提供することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:20:53 GMT)
Stabilizing classical accelerometers and gyroscopes with a quantum inertial sensor [33.7] 物質波干渉法による第1次ハイブリダイゼーション冷原子慣性センサについて述べる。
2日間の統合で,それぞれ7倍の10-7$ m/s$2ドル,4倍の10-7$ rad/sを達成できた。
この装置は地球回転速度の最大100倍の速度で運用されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:33:59 GMT)
Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving [33.5] 本稿では,人間の認知プロセスに触発された自律運転の新しいパラダイムである LeapADを紹介する。
特に LeapADは、意思決定に関連する重要なオブジェクトを選択することで、人間の注意をエミュレートする。
システムは、徹底的な分析と推論のための分析プロセス(System-II)と、迅速な経験的処理のためのヒューリスティックプロセス(System-I)から構成される。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:07:28 GMT)
HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation [33.4] Generalized Referring Expression (GRES)は、複数の/非ターゲットシナリオを含むことによって、古典的なRESの定式化を増幅する。
我々は、$textbfH$ierarchical Semantic $textbfD$ecoding with $textbfC$ounting Assistance framework (HDC)を提案する。
我々はHDCに明示的なカウント機能を持たせ、複数の/単一/非ターゲット設定における包括的オブジェクト認識を容易にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:53:59 GMT)
Fast-PGM: Fast Probabilistic Graphical Model Learning and Inference [33.2] 本稿では,PGM学習と推論のための効率的かつオープンソースのライブラリであるFast-PGMについて述べる。
Fast-PGMは、構造やパラメータ学習、正確で近似的な推論を含む、PGMの包括的なタスクをサポートする。
Fast-PGMはフレキシブルなビルディングブロックを開発者に提供し、学習者に詳細なドキュメントを提供し、非専門家のユーザフレンドリーなインターフェースを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:43:37 GMT)
Digitized Counterdiabatic Quantum Algorithms for Logistics Scheduling [33.0] 本研究では,自動化ロボットの求人スケジューリング問題と旅行セールスパーソン問題について検討する。
DCQOでは、断熱量子力学を用いて最適化問題の解を求める。
我々は超伝導およびトラップイオン量子プロセッサにアルゴリズムを実験的に実装した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:53:30 GMT)
Diffusion Actor-Critic with Entropy Regulator [32.8] エントロピーレギュレータ(DACER)を用いたオンラインRLアルゴリズムについて提案する。
このアルゴリズムは拡散モデルの逆過程を新しい政策関数として概念化する。
MuJoCoベンチマークとマルチモーダルタスクの実験は、DACERアルゴリズムが最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:23:27 GMT)
SMILE: Multimodal Dataset for Understanding Laughter in Video with Language Models [32.6] 我々は、ビデオにおける笑いの背景にある理性を理解するための新しい挑戦に取り組む。
提案するデータセットSMILEは、人々がなぜ笑うのかをビデオクリップと言語記述で記述する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:45:09 GMT)
Bridging The Gap between Low-rank and Orthogonal Adaptation via Householder Reflection Adaptation [32.4] 家庭内リフレクション適応法 (HRA) は, 家庭内リフレクションに基づく簡易かつ効果的な適応法である。
HRAは、大きな言語モデルと条件付き画像生成装置を適用する際に、学習可能なパラメータが少なくて優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:18:16 GMT)
Accelerating Relative Entropy Coding with Space Partitioning [32.3] 相対エントロピー符号化(REC)アルゴリズムは、ターゲット分布の$Q$に従ってランダムサンプルを符号化する。
RECアルゴリズムは、少なくとも2D_textKL[Q||P]$の順序で、禁止符号化時間に悩まされる。
本稿では,空間分割を利用したREC方式を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:45:20 GMT)
DeTikZify: Synthesizing Graphics Programs for Scientific Figures and Sketches with TikZ [32.1] DaTikZv2、SketchFig、SciCap++の3つの新しいデータセットを作成します。
私たちは、SciCap++とDaTikZv2でDeTikZifyをトレーニングし、SketchFigから学んだ合成スケッチをトレーニングします。
我々は、TikZプログラムにおいて、DeTikZifyが商業的なClaude 3とGPT-4Vより優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:48:35 GMT)
Open-Vocabulary SAM3D: Understand Any 3D Scene [32.0] オープンな3Dシーン理解のための普遍的なフレームワークであるOV-SAM3Dを紹介する。
このフレームワークは、シーンの事前の知識を必要とせずに、任意の3Dシーンの理解タスクを実行するように設計されている。
ScanNet200 と nuScenes のデータセットで行った実証的な評価は、我々のアプローチが未知のオープンワールド環境における既存のオープンボキャブラリ手法を超越していることを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:07:57 GMT)
Renovating Names in Open-Vocabulary Segmentation Benchmarks [31.2] オープン語彙セグメンテーションベンチマーク(RENOVATE)における「改称」のためのフレームワークを提案する。
我々のフレームワークは、視覚セグメントごとに名前の質を高めるリネームモデルを備えている。
改良された名称は、最大15%の相対的な改善で、より強力なオープン語彙モデルをトレーニングするのに役立ちます。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:57:33 GMT)
Nonlinear Meta-Learning Can Guarantee Faster Rates [31.2] 非線形表現を用いたメタラーニングの理論的保証を導出する。
特に、慎重に正規化することで、さらなるバイアスを緩和できることが示される。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:31:02 GMT)
Facilitating Battery Swapping Services for Freight Trucks with Spatial-Temporal Demand Prediction [30.7] 本稿では,大型トラックにおけるバッテリスワッピングサービスの可能性と有効性について検討する。
特に,バッテリスワッピングサービスの初期段階は移動式バッテリスワッピングステーションが好まれるが,システムが成熟するにつれて固定配置ステーションが好まれる。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:44:43 GMT)
XMoE: Sparse Models with Fine-grained and Adaptive Expert Selection [30.7] ツールは、スパースMoEモデルの有効性と効率を高めるために設計された新しいMoEである。
パフォーマンスを犠牲にすることなく、MoE層の計算負荷を50%以上削減しながら、モデルパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:14:55 GMT)
Fundamental limits of weak learnability in high-dimensional multi-index models [30.5] マルチインデックスモデルは、ニューラルネットワークによる特徴学習を研究する上で有用なベンチマークである。
本稿では, 1次反復アルゴリズムを用いて低次元構造を弱めに復元するために必要な最小サンプル複雑性に着目した。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:59:02 GMT)
Revisiting Counterfactual Regression through the Lens of Gromov-Wasserstein Information Bottleneck [30.3] 我々はGromov-Wasserstein Information bottleneck (GWIB)と呼ばれる新しい学習パラダイムを提案する。
GWIBは最適化の交互化を通じてCFRモデルを効果的に学習し、自明な潜伏分布を避けながら選択バイアスを抑制する。
ITE推定タスクの実験では、GWIBは最先端のCFR法よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:48:24 GMT)
GITA: Graph to Visual and Textual Integration for Vision-Language Graph Reasoning [30.2] 我々は、$textbfG$raph to v$textbfI$sual and $textbfT$extual Integr$textbfA$tion (GITA)というエンドツーエンドフレームワークを提案する。
GITAはまず、ビジュアルグラフを一般的なグラフ推論に組み込む。
GVLQAデータセットと5つの実世界のデータセットの実験は、GITAが一般的なグラフ推論能力において、メインストリームのLLMよりも優れていることを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:58:05 GMT)
Online Prompt Pricing based on Combinatorial Multi-Armed Bandit and Hierarchical Stackelberg Game [30.0] 当社の価格体系は、消費者、プラットフォーム、販売者の利益を考慮し、これら3人の参加者の利益満足度を同時に達成する。
既存の固定価格モードとは異なり、我々が提案するPBTの価格メカニズムはより柔軟で多様なものであり、現実のシナリオのトランザクション要求に応じている。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:13:46 GMT)
FedCal: Achieving Local and Global Calibration in Federated Learning via Aggregated Parameterized Scaler [29.9] フェデレートラーニング(FedCal)は、クライアント固有のスケーラをローカルおよびグローバルキャリブレーションに使用する。
実験では、FedCalが最高性能のベースラインを大幅に上回り、グローバルキャリブレーションエラーを平均47.66%削減した。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:33:58 GMT)
Label-efficient Semantic Scene Completion with Scribble Annotations [29.9] ScribbleSCと呼ばれる新しいラベル効率ベンチマークを構築し、スパーススクリブルに基づくセマンティックラベルと密な幾何学的ラベルを組み合わせてセマンティックシーンを補完する。
本手法は, オフライン-オンライン蒸留モジュールを用いた自動ラベル作成とオンラインモデルトレーニングにより, 性能を向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:09:50 GMT)
Learning the Distribution Map in Reverse Causal Performative Prediction [29.9] データから分布シフトを学習するための新しいアプローチを導入する。
提案手法は逆因果モデルに基づいて予測され, 予測モデルでは, エージェントの作用の有限セットを通してのみ分布シフトを導出する。
本フレームワークでは,エージェントの行動にマイクロファウンデーションモデルを適用し,分布シフトマップを学習するための統計的に正当化された方法論を開発する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:12:13 GMT)
Peacock: A Family of Arabic Multimodal Large Language Models and Benchmarks [29.8] MLLM(Multimodal large language model)は、複雑な推論と言語理解を必要とする幅広いタスクにおいて有効であることが証明されている。
我々は、強力なビジョンと言語能力を備えた、textitPeacockと呼ばれる、アラビア語のMLLMの包括的なファミリーを紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:24:36 GMT)
ARVideo: Autoregressive Pretraining for Self-Supervised Video Representation Learning [29.6] 本稿では,新たな自己教師付きビデオ表現学習フレームワークであるARVideoを提案する。
大規模な実験は、自己教師付きビデオ表現学習の効果的なパラダイムとしてARVideoを確立する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:29:03 GMT)
An Adaptive Approach for Infinitely Many-armed Bandits under Generalized Rotting Constraints [29.6] 本研究では、休息状態において、アームの平均報酬が各プルで減少する可能性があるが、そうでなければ変化しない、無限に多くの武器を持つバンディット問題を考察する。
本稿では,ゆがみ報酬に起因するバイアスや分散トレードオフを管理するために,適応的なスライディングウィンドウを備えたUTBを利用するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:58:55 GMT)
Tackling Prevalent Conditions in Unsupervised Combinatorial Optimization: Cardinality, Minimum, Covering, and More [28.9] 我々は、非監督的なCOにおける一般的な(つまり、一般的に関与する)条件に取り組むことを目指している。
まず、客観的な構築とデランドマイズのための目標を理論的に正当化する。
次に, 異なるCO問題に共通する諸条件に対して, 非自明な目的と, 目的を満たすためのデランドマイズを導出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:44:42 GMT)
Are Long-LLMs A Necessity For Long-Context Tasks? [28.5] 我々は,Long-LLMは長文タスクの解決に必要ではない,と論じる。
本稿では,長文タスクをブートストラップ方式で処理可能なLC-Boostというフレームワークを提案する。
LC-Boostは、提示されたタスクに基づいてコンテキストを適応的にアクセスして利用することにより、多種多様長文処理問題に対処するための一般的なフレームワークとして機能する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:59:30 GMT)
Creation and manipulation of Schrödinger cat states of a nuclear spin qudit in silicon [28.4] 単一アンチモン原子のスピン-7/2核を用いたSchr"odinger cat状態の生成と操作について述べる。
その結果,非古典的資源状態の高忠実度化と単一原子スケール物体の論理制御が示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:22:16 GMT)
Robust Diffusion Models for Adversarial Purification [28.3] 拡散モデル(DM)に基づく対位法(AP)は、対位法トレーニング(AT)の最も強力な代替手段であることが示されている。
本稿では,事前訓練したDMとは独立に,敵対的指導を施した新しい頑健な逆過程を提案する。
この堅牢なガイダンスは、よりセマンティックなコンテンツを保持する純粋化された例を生成するだけでなく、DMの正確でロバストなトレードオフを軽減することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:33:04 GMT)
ASVD: Activation-aware Singular Value Decomposition for Compressing Large Language Models [28.2] 大規模言語モデル(LLM)のための新しい訓練後圧縮パラダイムを提案する。
我々は、アクティベーション対応特異値分解(ASVD)と呼ばれるトレーニング不要の手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:28:15 GMT)
Wearable-based behaviour interpolation for semi-supervised human activity recognition [27.9] 我々は,ラベル付きアクティビティと非ラベル付きアクティビティを同時に使用する,深層半教師付きヒューマンアクティビティ認識(HAR)アプローチであるMixHARを導入する。
以上の結果から,MixHARはHARにおける深層半教師技術の可能性を示すとともに,性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:21:24 GMT)
DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning [27.7] マルチモーダル・プレトレーニングは,自律型ロボットにおける表現学習の目標のトリニティのための効果的な戦略である。
画像シーケンスから意味のあるタスク進行情報を同時に抽出できる統一目的を提案する。
DecisionNCEは、ローカルおよびグローバルなタスク進行機能の両方をエレガントに抽出する、具体化された表現学習フレームワークを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:31:50 GMT)
Large Language Model Sentinel: Advancing Adversarial Robustness by LLM Agent [27.5] 大規模言語モデル(LLM)は、よく設計されたテキストの摂動による敵攻撃に対して脆弱である。
LLAMOS(Large LAnguage Model Sentinel)と呼ばれる新しい防御技術を導入し,LLMの対角的堅牢性を高める。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:23:56 GMT)
Efficient Reinforcement Learning via Large Language Model-based Search [27.3] 大規模言語モデル(LLM)は、自然言語処理の規模で急速に普及している。
MEDIC はモデルベースのfeEDback critIC で LLM を拡張して,抽象的な問題に対して,潜在的に最適だが有効な計画を生成するフレームワークである。
実験の結果, 1) LLM を MEDIC で増強する効果,2) LLM 生成計画によって誘導された PPO および A2C をベースとした RL エージェントの試料複雑さの顕著な改善,3) これらのモデルの使用方法のさらなる検討の方向性が示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:53:57 GMT)
NIVeL: Neural Implicit Vector Layers for Text-to-Vector Generation [27.2] NIVeL はこの問題をベクトルグラフィックスの望ましい特性を保存する別の中間領域で再解釈する。
実験の結果,NIVeL はテキストからベクターまでのグラフィクスの結果を,最先端のグラフィクスよりもはるかに高い品質で生成した。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:15:45 GMT)
Learning accurate and interpretable decision trees [27.2] 我々は、同じドメインから繰り返しデータにアクセスして決定木学習アルゴリズムを設計するためのアプローチを開発する。
本研究では,ベイズ決定木学習における事前パラメータのチューニングの複雑さについて検討し,その結果を決定木回帰に拡張する。
また、学習した決定木の解釈可能性について検討し、決定木を用いた説明可能性と精度のトレードオフを最適化するためのデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:10:10 GMT)
M4U: Evaluating Multilingual Understanding and Reasoning for Large Multimodal Models [27.2] M4Uは多分野多言語マルチモーダル理解と推論の能力を評価するための新しいベンチマークである。
M4Uは、中国語、英語、ドイツ語の科学、工学、医療の分野で64の分野をカバーする8,931のサンプルを含んでいる。
M4Uを用いて,LMM(Large Multimodal Models)とLLM(Large Language Models)を外部ツールで評価する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:25:28 GMT)
Less is More: Discovering Concise Network Explanations [26.1] 本稿では,人間の理解可能な視覚的説明を生成するための新しいアプローチであるDiscovering Conceptual Network Explanations (DCNE)を紹介する。
本手法は,クラス間の識別に重要な視覚的説明を自動的に見つける。
DCNEは、ニューラルネットワークの決定を人間にアクセスし、解釈できるようにするための一歩である。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:10:23 GMT)
Hierarchical Uncertainty Exploration via Feedforward Posterior Trees [26.0] 木評価予測を用いて,複数レベルの粒度にまたがる後部を可視化する新しい手法を提案する。
本手法は, ニューラルネットワークの1つの前方通過において, 入力測定における後部分布の階層的階層化を予測する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:06:51 GMT)
Delving into the Trajectory Long-tail Distribution for Muti-object Tracking [26.0] 我々は追跡データの分布パターンを探索するパイオニアとなった。
既存のMOTデータセットで顕著な長尾分布問題を特定する。
我々は,この歪んだ分布の効果を緩和するベスポーク戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:23:07 GMT)
Fast 3D Molecule Generation via Unified Geometric Optimal Transport [25.9] 本稿では,高速かつ効率的な3次元分子生成のための新しい3次元分子生成フレームワークGOATを提案する。
基本分布と対象データ分布の間の多モード特徴をマッピングするコストを測定するための幾何輸送公式を定式化する。
我々の公式は、統一的で同値で滑らかな表現空間の中で解決される。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:22:01 GMT)
MeMo: Meaningful, Modular Controllers via Noise Injection [25.5] 新たなロボットが同じパーツから構築された場合,モジュール型コントローラを再利用することで,その制御を迅速に学習できることが示される。
私たちはMeMoと呼ばれるフレームワークでこれを実現し、Meは(Me)有界で(Mo)有界なコントローラーを学習します。
我々は,ロボット形態変化の簡易化を目標として,移動環境と把握環境の枠組みをベンチマークした。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:39:20 GMT)
Better Membership Inference Privacy Measurement through Discrepancy [25.5] 本稿では,新たな経験的プライバシ指標を提案する。
我々は,この指標が複数のモデルのトレーニングを伴わず,大規模なイメージネット分類モデルに適用可能であることを示し,より最新で洗練されたトレーニングレシピでトレーニングされたモデルの既存の指標よりも有利であることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:33:22 GMT)
LM4LV: A Frozen Large Language Model for Low-level Vision Tasks [25.4] $textbfLM4LV$は、大規模な言語モデルで、マルチモーダルデータや事前データなしで、さまざまな低レベルの視覚タスクを解決できるフレームワークである。
これは低レベルのビジョンにおけるLLMの強い可能性を示し、MLLMと低レベルのビジョンタスクの間のギャップを埋める。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:25:00 GMT)
HYSYNTH: Context-Free LLM Approximation for Guiding Program Synthesis [25.3] 大規模言語モデル(LLM)は、よく知らないDSLで完全に正しいプログラムを生成するのに失敗する。
これらの制約により、与えられたタスクに対する LLM 補完をタスク固有の文脈自由代用モデル学習に使用するハイブリッドアプローチを導入する。
このハイブリッドなアプローチを3つの領域で評価し、既存のプログラムシンセサイザーと同様に、無誘導探索とLCMからの直接サンプリングの両方より優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:45:51 GMT)
GPT is Not an Annotator: The Necessity of Human Annotation in Fairness Benchmark Construction [25.2] 本稿では,GPT-3.5-Turboがバイアスベンチマークデータセットの開発に有効かどうかを検討する。
我々は、以前の研究をユダヤ人コミュニティと反ユダヤ主義という、新しいコミュニティと一連の偏見に拡張する。
分析の結果,GPT-3.5-Turboはアノテーション処理の性能が悪く,出力に許容できない品質問題が発生することがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:56:03 GMT)
Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems [25.1] 大規模言語モデル (LLM) に基づくエンドツーエンドタスク指向ダイアログ (TOD) システムは、列車データに制限がある場合にのみ、教師付きモデルよりも優れた性能を発揮する。
そこで, SyncTODを提案する。これはLCMを協調的に処理し, タスクのアライメントを改善するのに有用なヒントを与える。
ChatGPTでは、SyncTODはLLMベースのベースラインやSoTAモデルに比べて低データ設定で優れたパフォーマンスを実現し、フルデータ設定では競合性能を維持している。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:13:54 GMT)
UPS: Efficiently Building Foundation Models for PDE Solving via Cross-Modal Adaptation [25.1] UPSは異なるPDEを共有表現空間に埋め込み、F変換アーキテクチャを用いてそれらを処理する。
クロスモーダルUPSは、PDEBenchから1Dと2DのPDEファミリを幅広く利用し、データ転送の4倍、計算の26倍の精度で既存の統一モデルより優れている。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:44:20 GMT)
Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large Language Models [25.0] 本研究では,大規模言語モデル(LLM)におけるデータ汚染を簡易かつ効果的に検出し,その量を推定する手法を提案する。
我々は、複数の質問の連続としてデータ汚染検出をフレーム化し、特定のデータセット分割から各サブサンプルインスタンスの3つの摂動バージョンを作成するクイズ形式を考案する。
以上の結果から,DCQは現状の成果を達成し,既存の方法に比べて汚染・記憶レベルが高いことが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:14:09 GMT)
Visual Echoes: A Simple Unified Transformer for Audio-Visual Generation [24.3] 本稿では,マルチモーダル生成において十分に検討されていない,シンプルで軽量な生成変換器について述べる。
トランスは離散オーディオおよび視覚ベクトル量子化GAN空間で動作し、マスクを装飾的に訓練する。
実験の結果,本手法は最新の画像2audio 生成法を超越していることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:21:13 GMT)
Composed Image Retrieval for Remote Sensing [24.1] この研究は、合成画像検索をリモートセンシングに導入する。
テキスト記述で交互に画像例によって大きな画像アーカイブをクエリできる。
イメージ・ツー・イメージとテキスト・ツー・イメージの類似性を融合させる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:18:31 GMT)
Planted: a dataset for planted forest identification from multi-satellite time series [23.8] 森林プランテーションの認識のための5つの公共衛星のデータと,世界中の植林木種のデータからなるデータセットについて述べる。
PlantDという名前のデータセットには、41か国に分布する64種の木ラベルクラス(46属40種)の2M以上のサンプルが含まれている。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:49:00 GMT)
Bias Testing and Mitigation in LLM-based Code Generation [23.8] 本稿では,コード生成タスクに特化して設計された新しいバイアステストフレームワークを提案する。
調査対象のモデルが生成するコード関数の20.29%から44.93%が偏りに敏感なタスクを扱う際に偏りがあることがわかった。
コード生成モデルのバイアスを軽減するため、我々は5つのバイアス軽減プロンプト戦略を評価する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:03:49 GMT)
Recasting Generic Pretrained Vision Transformers As Object-Centric Scene Encoders For Manipulation Policies [23.4] SOFTは、事前訓練されたビジョントランス (PVT) モデルを取り巻くラッパーである。
最終層のアクティベーションのみから表現を構成するのではなく、SOFTはPVTの注意からオブジェクトのようなエンティティを識別し、配置する。
それぞれのケースにおいて、シミュレーションおよび実環境におけるタスク操作のための標準PVT表現を、SOFTで訓練したポリシーが超越していることを実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:20:15 GMT)
Embedding-Aligned Language Models [23.3] 本稿では,潜在埋め込み空間内で定義された目的に従うために,大規模言語モデル(LLM)を訓練するための新しいアプローチを提案する。
埋め込み型誘導言語 (EAGLE) エージェントは, 埋め込み空間の最適領域に向けて, LLM の生成を反復的に推し進めるように訓練されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:11:17 GMT)
SLIDE: A Framework Integrating Small and Large Language Models for Open-Domain Dialogues Evaluation [23.2] 対話評価のためのフレームワークSLIDE(Small and Large Integrated for Dialogue Evaluation)を提案する。
本手法は, 分類タスクと評価タスクの両方において最先端のパフォーマンスを達成し, また, SLIDEは人的評価器との相関性も良好である。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:32:49 GMT)
Information Re-Organization Improves Reasoning in Large Language Models [22.3] 大規模言語モデル(LLM)の推論能力を高める情報再構成(InfoRE)手法を提案する。
本手法では,文書や段落などの文脈的内容から論理的関係を抽出し,ノイズを最小限に抑えるために冗長な内容を抽出する。
Llama2-70B, GPT-3.5, GPT-4 を用いて, 各種マルチホップ推論タスクにおいて, 提案手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:28:49 GMT)
PoseCrafter: One-Shot Personalized Video Synthesis Following Flexible Pose Control [22.3] PoseCrafterは、フレキシブルポーズのコントロールに続くパーソナライズされたビデオ生成のためのワンショット方式である。
安定拡散と制御ネットに基づいて、我々は、高品質なビデオを生成するための推論プロセスを慎重に設計する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:46:34 GMT)
Themis: Automatic and Efficient Deep Learning System Testing with Strong Fault Detection Capability [22.1] 深層学習システム(DLS)はオートパイロットのような安全クリティカルなタスクに広く応用されている。
DLSテスト技術は、障害を引き起こすデータフローを探索するために摂動入力を生成することによって障害を検出する。
最近の研究では、このような手作業は面倒であり、わずかな障害発生データフローしか検出できないことが示されている。
Themisは, 断層検出能力の強い最初の自動DLSテストシステムである。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:29:11 GMT)
Detection and Positive Reconstruction of Cognitive Distortion sentences: Mandarin Dataset and Evaluation [22.1] 本研究は、ポジティブ心理学理論に基づくポジティブリコンストラクションフレームワークを紹介する。
認知的歪みを検出するための4001のインスタンスと、マンダリンの肯定的な再構成のための1900のインスタンスを含むコーパスを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:17:20 GMT)
CG-FedLLM: How to Compress Gradients in Federated Fune-tuning for Large Language Models [21.9] 本研究では,Large-Language Models (LLMs) における通信効率向上のための圧縮勾配の革新的手法を提案する。
また、このプライバシー中心のフレームワークにおける信号対雑音比、圧縮率、ロバスト性に着目した一連の実験分析を行った。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:17:41 GMT)
Cooperative Backdoor Attack in Decentralized Reinforcement Learning with Theoretical Guarantee [21.6] 分散強化学習シナリオにおける協調的バックドア攻撃について検討する。
提案手法は, バックドアの挙動をRLの状態空間に応じて複数のコンポーネントに分解する。
我々の知る限りでは、分散強化学習における実証可能な協調的バックドア攻撃を示す最初の論文である。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:13:31 GMT)
Distinguish Any Fake Videos: Unleashing the Power of Large-scale Data and Motion Features [21.6] 我々は、AI生成ビデオ検出(GenVidDet)に特化して設計された広範なビデオデータセットを紹介する。
また,DuB3D(Du-Branch 3D Transformer)という,実写映像と実写映像を区別する革新的な方法を提案する。
DuB3Dは、96.77%の精度で実際の映像コンテンツと生成された映像コンテンツを区別でき、目に見えないタイプでも強力な一般化能力を持つ。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:26:04 GMT)
Before Generation, Align it! A Novel and Effective Strategy for Mitigating Hallucinations in Text-to-SQL Generation [21.6] In-Context Learning (ICL)によって駆動されるLarge Language Models (LLM)は、テキストからテキストへの変換性能を大幅に改善した。
従来の手法では一般に、1)スキーマのリンクと2)論理合成という2段階の推論フレームワークを使用しており、このフレームワークは有効であるだけでなく、解釈可能である。
これらの進歩にもかかわらず、LLMの一般化の本質的に悪い性質は幻覚を引き起こすことが多く、LLMの潜在能力を制限している。
本研究ではまず,各段階の幻覚をテキスト・ツー・テキストで識別し,分類する。
次に、新しい戦略であるタスクアライメント(TA)を紹介します。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:51:08 GMT)
MindShot: Brain Decoding Framework Using Only One Image [21.5] MindShotは、クロスオブジェクトの事前知識を活用することで、効果的に数発のブレインデコーディングを実現するために提案されている。
新しい被験者と事前訓練された個人は、同じ意味クラスのイメージのみを見る必要があり、モデルの適用性を大幅に拡大する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:07:06 GMT)
Denoising LM: Pushing the Limits of Error Correction Models for Speech Recognition [21.5] Denoising LM (DLM) は大量の合成データで訓練された$textitscaled$エラー補正モデルである。
DLMは、$textittest-clean$で1.5%のワードエラー率(WER)、$textittest-other$で3.3%のWERを達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:05:12 GMT)
Thinking Forward: Memory-Efficient Federated Finetuning of Language Models [21.4] この研究は、FLアルゴリズムであるSpryを導入し、LLMのトレーニング可能な重量を、参加するクライアント間で分割する。
Spryはメモリフットプリントが低く、精度が高く、高速な収束を実現している。
Spryは、コモディティモバイルデバイスやエッジデバイス上で、これまで不可能だったFLデプロイメントを実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:37:48 GMT)
ODGEN: Domain-specific Object Detection Data Generation with Diffusion Models [21.2] 本稿では,境界ボックスに条件付き高品質な画像を生成する新しい方法であるODGENを提案する。
まず, 収穫した前景オブジェクトと画像全体を対象分布に合わせるために, 事前学習した拡散モデルを微調整する。
次に,空間的制約とオブジェクト指向のテキスト記述を伴って合成された視覚的ロバスト性プロンプトを用いて拡散モデルを制御することを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:10:34 GMT)
Extended Flow Matching: a Method of Conditional Generation with Generalized Continuity Equation [21.2] 条件生成は 生成モデルの最も重要な応用の1つです
行列場を通して条件生成に帰納バイアスを導入することができることを示す。
条件生成におけるEMFの競争性を支持する実験結果とともに,本理論を提示する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:03:04 GMT)
On the Correspondence of Non-flat Assumption-based Argumentation and Logic Programming with Negation as Failure in the Head [21.0] 非平坦なABAとLPの対応性を示す。
次に、この結果を、もともと双極性ABAと呼ばれる非平坦なABAの断片に対して定義された、いわゆる集合安定ABA意味論に拡張する。
本稿では,LP の集合安定セマンティクスを頭の中の失敗として定義し,集合安定な ABA セマンティクスとの対応を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:25:22 GMT)
Evaluating the Adversarial Robustness of Retrieval-Based In-Context Learning for Large Language Models [20.8] In-Context Learning (ICL) は、プロンプトでデモをエンコードするために使用される選択、順序、動詞に敏感である。
Retrieval-Augmented ICLメソッドは、レトリバーを活用して、意味論的に関連する例を例示として抽出することで、この問題に対処しようとする。
本研究は, 検索強化モデルにより, 検体攻撃に対する堅牢性が向上することを明らかにする。
そこで本研究では,攻撃したサンプルを用いてサンプルプールを充実させる,効果的な訓練自由対人防御手法であるDARDを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:56:36 GMT)
Unlearning during Learning: An Efficient Federated Machine Unlearning Method [20.8] フェデレートラーニング(FL)は分散機械学習パラダイムとして注目されている。
忘れられる権利の実装を容易にするために、フェデレーション・マシン・アンラーニング(FMU)の概念も現れた。
我々はこれらの制限を克服することを目的とした革新的で効率的なFMUフレームワークであるFedAUを紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:53:13 GMT)
FastDrag: Manipulate Anything in One Step [20.5] 本稿では,FastDragというワンステップのドラッグベースの画像編集手法を導入し,編集プロセスの高速化を図る。
この革新は1段階の遅延セマンティック最適化を実現し、編集速度を大幅に向上させる。
私たちのFastDragはDragBenchデータセットで検証されています。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:59:26 GMT)
Model Cascading for Code: Reducing Inference Costs with Model Cascading for LLM Based Code Generation [20.4] 本稿では,各モデルがそれぞれのソリューションに対して一連のテストケースを生成し,実行させ,その結果をカスケードしきい値として用いることを提案する。
モデルカスケード戦略は,1つのモデルで出力を生成するよりも計算コストを削減できるが,精度は向上することを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:20:04 GMT)
RAEE: A Training-Free Retrieval-Augmented Early Exiting Framework for Efficient Inference [20.3] 本稿では、効率的な推論のためのトレーニング不要な検索拡張早期実行フレームワークであるRAEEを提案する。
実験の結果,提案したRAEEは推論を著しく加速できることが示された。
RAEEは8つの分類タスクで最先端のゼロショットのパフォーマンスも達成している。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:01:24 GMT)
Just Ask One More Time! Self-Agreement Improves Reasoning of Language Models in (Almost) All Scenarios [20.1] textbfSelf-Agreementは、ほとんどすべてのシナリオに適用できる一般化可能なアンサンブル最適化手法である。
6つの公開推論ベンチマークと優れた一般化能力で、同時に顕著なパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:11:21 GMT)
Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradient [20.1] 本稿では,拡散モデルにおける非学習概念のための概念領域補正フレームワークを提案する。
直感的概念とアンカー的概念の出力領域を敵対的訓練によって整合させることにより、未学習結果の一般化性を高める。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:47:36 GMT)
Repetita Iuvant: Data Repetition Allows SGD to Learn High-Dimensional Multi-Index Functions [20.0] 勾配に基づくアルゴリズムを用いて学習した2層浅層ニューラルネットワークのトレーニング力学について検討する。
理想化シングルパス勾配勾配学習シナリオの簡単な修正により,その計算効率が大幅に向上することを示す。
この結果から,ネットワークが事前処理なしでデータから関連構造を学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:34:31 GMT)
Cross-Task Defense: Instruction-Tuning LLMs for Content Safety [20.0] 大きな言語モデル(LLM)は、安全性とユーティリティのバランスをとる上での課題に直面します。
悪意のある短い質問に対する防御にもかかわらず、不正行為を教えるマニュアルなど、LLMが危険な長文を安全に扱える能力は、まだ不明である。
安全関連事例からなる防衛データセットを導入し,学習指導のための単一タスクと混合タスクの損失を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:14:32 GMT)
Towards Geometry-Aware Pareto Set Learning for Neural Multi-Objective Combinatorial Optimization [19.6] 多目的多様性最適化(MOCO)問題は、様々な現実世界の応用で広く用いられている。
既存のほとんどのニューラルMOCO法は、MOCO問題を一連のSinge-Objective diversity enhancement (SOCO)問題に変換するために問題に依存する。
これらの手法はしばしば、不明瞭で時間を要する正確な超体積計算のため、前面の部分領域を近似する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:36:10 GMT)
EmpathicStories++: A Multimodal Dataset for Empathy towards Personal Experiences [19.6] EmpathicStories++は共感に関する最初の時系列データセットで、参加者の家で1ヶ月以上にわたりソーシャルロボットをデプロイした。
2つの文脈で評価された個人的経験に基づいて、他人の物語に対する共感を予測する新しいタスクを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:57:18 GMT)
AuthNet: Neural Network with Integrated Authentication Logic [19.6] 本稿では,認証ロジックをモデルの一部として統合する,AuthNetと呼ばれるネイティブ認証機構を提案する。
AuthNetは、あらゆる畳み込みニューラルネットワークと互換性があり、私たちの評価では、認証されていないユーザを拒否することで、AuthNetが目標を達成することに成功した。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:44:22 GMT)
LTL-Constrained Policy Optimization with Cycle Experience Replay [19.4] 線形論理(LTL)は、強化学習エージェントの動作を制限するための正確な手段を提供する。
本稿では、この問題に対する報酬形成アプローチであるCyclER(CyclER)について紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:57:06 GMT)
Cardinality Estimation on Hyper-relational Knowledge Graphs [19.3] クエリのカーディナリティ推定(CE)は、実行せずに結果の数を推定することである。
現在の研究者は、高関係KGs (HKGs) を、3つの事実を等化子で表すために提案している。
そこで本研究では,CEを調査するための3つの一般的なHKGに対して,多種多様かつ偏りのないハイパーリレーショナルクエリセットを構築した。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:44:43 GMT)
Continual Release of Differentially Private Synthetic Data from Longitudinal Data Collections [19.1] 本研究では,縦方向のデータ収集から微分プライベートな合成データを連続的に放出する問題について検討する。
各ステップごとに、各ステップが新しいデータ要素をレポートするモデルを導入します。
本稿では,2種類のクエリを連続的に保存する合成データ生成アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:55:41 GMT)
A Dataset for Research on Water Sustainability [19.0] 本研究は, 冷却システムにおける直接水利用と, 発電に埋め込まれた間接水利用のためのデータセットを構築した。
当社のデータセットは、2019年から2023年までの米国の主要都市と州の時給水効率で構成されています。
本稿では,データセットの予備解析を行い,その利点を享受できる3つの潜在的なアプリケーションについて論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:59:52 GMT)
SLAM for Visually Impaired People: a Survey [18.8] 視力障害と視覚障害に対するSLAMベースのソリューションに関する54の最近の研究の体系的な文献レビューを初めて紹介する。
視覚障害者のナビゲーションにおけるこれらの手法の利点と限界について論じる。
また,現実シナリオにおけるSLAMベースのソリューションの有効性とユーザ満足度を評価した。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:51:45 GMT)
Belief-State Query Policies for Planning With Preferences Under Partial Observability [18.8] 現実の環境での計画では、ユーザーの好みに合わせて部分的な可観測性に対処する必要があることが多い。
本稿では,パラメータ化信念状態クエリ(BSQ)を用いた部分的に観察可能な設定において,エージェント行動に対するユーザの嗜好を表現する新しいフレームワークを提案する。
BSQの選好は、部分的に観測可能な環境での選好を計画する上で、計算学的に実現可能なアプローチであることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:04:51 GMT)
ART: Automatic Red-teaming for Text-to-Image Models to Protect Benign Users [18.4] そこで本研究では,テキスト・ツー・イメージ・モデルの安全性を評価するために,新しい自動レッド・チーム・フレームワークARTを提案する。
包括的実験により、人気のあるオープンソーステキスト・ツー・イメージモデルの毒性を明らかにする。
また、テキスト・ツー・イメージ・モデルに関連する安全性リスクを研究するために、大規模な3つの赤チームデータセットも導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:44:27 GMT)
Instantiations and Computational Aspects of Non-Flat Assumption-based Argumentation [18.3] 非平坦なABAにおける推論のためのインスタンス化に基づくアプローチについて検討する。
非平坦なABAにおける推論のための2つのアルゴリズム的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:42:44 GMT)
UHGEval: Benchmarking the Hallucination of Chinese Large Language Models via Unconstrained Generation [18.2] 大規模言語モデル (LLM) は、現代の自然言語処理において重要な貢献者となっている。
LLMは幻覚テキストをしばしば生成し、その実用性を専門的な文脈で実現している。
最小限の制約で生成した出力をコンパイルするアンコントラスト型幻覚生成評価ベンチマークを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:29:14 GMT)
EasyRL4Rec: An Easy-to-use Library for Reinforcement Learning Based Recommender Systems [18.2] 我々は、RLベースのRS用に特別に設計された、使いやすいコードライブラリであるEasyRL4Recを紹介する。
このライブラリは5つのパブリックデータセットに基づいた軽量で多様なRL環境を提供する。
EasyRL4Recは、RLベースのRSのドメインにおけるモデル開発と実験プロセスの促進を目指している。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:45:21 GMT)
GS-Hider: Hiding Messages into 3D Gaussian Splatting [18.2] 3Dガウススプラッティング(3DGS)はすでに3Dシーンの再構築と新しいビュー合成の分野における新たな研究の焦点となっている。
このような3D資産の著作権、完全性、プライバシーを保護することが不可欠である。
本稿では,GS-Hiderと呼ばれる3DGSの立体撮影フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:18:15 GMT)
Scale-Invariant Feature Disentanglement via Adversarial Learning for UAV-based Object Detection [18.1] 本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。
3つのベンチマークデータセット上で、最先端の3つの軽量検出フレームワークに適用する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:40:22 GMT)
Smoothed Online Classification can be Harder than Batch Classification [18.1] オンライン学習の円滑化は,PACモデルに基づくiidバッチ設定の学習と同じくらい容易であることを示す。
PACモデルではiidバッチ設定で学習できるが,スムーズなオンラインモデルでは学習できない仮説クラスを構築した。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:37:39 GMT)
Dual Lagrangian Learning for Conic Optimization [18.0] 本稿では,ラグランジアン双対性に基づく体系的二重補完手法,微分可能な円錐射影層,および自己教師型学習フレームワークを提案する。
また、円錐問題の幅広いクラスに対する閉形式二重完備式も提供し、コストのかかる暗黙の層の必要性を排除している。
提案手法は、最先端の学習法よりも優れており、平均0.5%未満の最適ギャップを有する商用インテリアポイントソルバの1000倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:53:01 GMT)
Diff3DS: Generating View-Consistent 3D Sketch via Differentiable Curve Rendering [17.9] 3Dスケッチは、オブジェクトやシーンの3D形状と構造を視覚的に表現するために広く使用されている。
Diff3DSは、ビュー一貫性のある3Dスケッチを生成するための、新しい差別化可能なフレームワークである。
我々のフレームワークは3Dスケッチとカスタマイズされた画像のドメインをブリッジし、3Dスケッチのエンドツーエンド最適化を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:48:14 GMT)
Controlled Text Generation for Large Language Model with Dynamic Attribute Graphs [17.8] 制御されたテキスト生成(CTG)は、特定の望ましい属性を示すテキストを作成することを目的としている。
本研究では,動的属性グラフに基づく制御テキスト生成という,大規模言語モデルのためのプラグイン可能なCTGフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:56:41 GMT)
ROSE: Register Assisted General Time Series Forecasting with Decomposed Frequency Learning [17.7] 分解周波数学習(ROSE)を用いた登録型汎用時系列予測モデルを提案する。
ROSEは事前学習タスクに分解周波数学習を採用し、周波数ベースのマスキングと再構成による時系列における意味情報と周期情報を分解し、ドメイン間の統一表現を得る。
大規模時系列データを事前トレーニングした後、ROSEは8つの実世界のベンチマークで最先端の予測性能を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:01:09 GMT)
Scoring Intervals using Non-Hierarchical Transformer For Automatic Piano Transcription [17.7] 本稿では,変圧器の注目度に類似したスケール内積演算を用いた簡易スコアリング手法を提案する。
エンコーダのみの非階層型トランスフォーマーバックボーンを低解像度の特徴マップでのみ動作させ,ピアノの音符やペダルを高精度かつ高精度に書き起こせることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:20:54 GMT)
Consistency of Neural Causal Partial Identification [17.5] ニューラル因果モデル(NCM)による部分同定の整合性を示す。
結果は、深さと接続性の観点から、基盤となるニューラルネットワークアーキテクチャの設計の影響を強調している。
我々は、リプシッツ正則化がなければ、NCMは整合性がないかもしれないことを示す反例を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:12:39 GMT)
3D Unsupervised Learning by Distilling 2D Open-Vocabulary Segmentation Models for Autonomous Driving [17.4] 2次元開語彙セグメンテーションモデルを用いた新しい3次元教師なしフレームワークUOVを提案する。
最初の段階では、2次元オープン語彙モデルの高品質なテキストと画像の特徴を革新的に統合する。
第2段階では、点雲と画像の間の空間マッピングを利用して擬似ラベルを生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:18:09 GMT)
Exploring the Impact of Synthetic Data for Aerial-view Human Detection [17.4] 航空ビューによる人間の検出は、より多様な人間の外観を捉えるために、大規模なデータに対する大きな需要がある。
合成データはデータを拡張するのに十分なリソースだが、実際のデータとのドメインギャップは、トレーニングで使用する上で最大の障害である。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:19:48 GMT)
Fast-DDPM: Fast Denoising Diffusion Probabilistic Models for Medical Image-to-Image Generation [17.3] 我々は,トレーニング速度,サンプリング速度,生成品質を同時に向上する,シンプルで効果的なアプローチであるFast-DDPMを紹介した。
1000のタイムステップでイメージデノイザを訓練するDDPMとは異なり、Fast-DDPMは10のタイムステップのみを使用する。
高速DDPMはDDPMよりも優れており、全てのタスクにおける畳み込みネットワークと生成的敵ネットワークに基づく最先端の手法である。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:48:33 GMT)
Inferring Manifolds From Noisy Data Using Gaussian Processes [17.2] ほとんどの既存の多様体学習アルゴリズムは、元のデータを低次元座標で置き換える。
本稿では,これらの問題に対処するための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:35:29 GMT)
Basis Selection: Low-Rank Decomposition of Pretrained Large Language Models for Target Applications [17.1] 大規模言語モデル(LLM)は様々なアプリケーションの性能を著しく向上させるが、計算集約的でエネルギー需要が高い。
これにより、パーソナルコンピュータやモバイル/ウェアラブルデバイスといった限られたリソースを持つデバイスにデプロイすることが困難になる。
我々は、これらのモデルを効果的に圧縮するために、特定のアプリケーションの要求に合わせて低ランク分解アプローチを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:40:20 GMT)
Continuous-time Riemannian SGD and SVRG Flows on Wasserstein Probabilistic Space [17.1] 我々はワッサーシュタイン空間上の勾配流を勾配降下流(SGD)と分散還元流(SVRG)に拡張する。
ワッサーシュタイン空間の性質を利用して、ユークリッド空間における対応する離散力学を近似するために微分方程式を構築する。
この結果はユークリッド空間における結果と一致することが証明されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:04:03 GMT)
Towards Real World Debiasing: A Fine-grained Analysis On Spurious Correlation [17.1] 既存のベンチマークと実世界のデータセットのバイアス分布を再検討し、データセットバイアスを分析するためのきめ細かいフレームワークを提案する。
その結果,既存の手法では現実のバイアスに対処できないことがわかった。
本稿では,Debias in Destruction (DiD) という,既存のデバイアス法に容易に適用可能な,シンプルかつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:06:41 GMT)
Optimal Algorithms for Online Convex Optimization with Adversarial Constraints [17.0] COCOでは、そのラウンドのアクションを選択した後、学習者に凸コスト関数と凸制約関数を明らかにする。
オンラインポリシは,制限的な仮定を伴わずに,$O(sqrtT)$ regretと$O(sqrtT)$ CCVを同時に達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:07:26 GMT)
Derivatives of Stochastic Gradient Descent [16.9] グラディエントDescent (SGD) の反復剤の誘導体の挙動について検討する。
元のSGDの収束によって摂動される異なる目的関数上の不正確なSGDによって駆動されることを示す。
具体的には、定常的なステップサイズでは、これらの導関数は解導関数を中心とするノイズボール内で安定化し、消滅したステップサイズでは$O(log(k)2 / k)$収束率を示すことを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:32:48 GMT)
TrojanRAG: Retrieval-Augmented Generation Can Be Backdoor Driver in Large Language Models [16.7] 大規模言語モデル(LLM)は、自然言語処理(NLP)において顕著なパフォーマンスにもかかわらず、潜在的なセキュリティ脅威に対する懸念を提起している。
バックドア攻撃は当初、LLMがあらゆる段階で重大な損害を受けていることを証明したが、コストとロバスト性は批判されている。
本稿では,Retrieval-Augmented Generationにおいて,共同でバックドア攻撃を行うTrojanRAGを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:12:51 GMT)
Canonical Variates in Wasserstein Metric Space [16.7] We use the Wasserstein metric to measure distances between distributions, then used by distance-based classification algorithm。
我々の研究の中心は、分類精度を高めるために、ワッサーシュタイン計量空間内の次元の減少である。
本稿では,クラス間変動からクラス内変動への商として定義されたフィッシャー比を最大化する原理に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:59:21 GMT)
LocMoE+: Enhanced Router with Token Feature Awareness for Efficient LLM Pre-Training [16.5] 我々はローオーバーヘッドのLocMoEの洗練されたバージョンであるLocMoE+を紹介する。
LocMoE+は、GDAD、C-Eval、TeleQnAデータセット全体で9.7%から14.1%のパフォーマンス向上を示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:50:44 GMT)
Diversifying Human Pose in Synthetic Data for Aerial-view Human Detection [16.4] 本研究では,空中視による人間検出のための合成データセットにおいて,人間のポーズを多様化するための枠組みを提案する。
提案手法では,ポーズ生成器を用いて新規ポーズのセットを構築し,既存の合成データセットの画像を変更して,新規ポーズを仮定する。
実験では、合成データがトレーニングにどのように使用されるか、あるいはデータサイズに関わらず、トレーニングでポーズの異なるデータセットを活用することにより、はるかに精度が向上することを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:08:27 GMT)
$\textit{Comet:}$ A $\underline{Com}$munication-$\underline{e}$fficient and Performant Approxima$\underline{t}$ion for Private Transformer Inference [16.3] 推論性能を損なうことなく通信コストを削減するために,新しいプラグイン方式Cometを導入する。
私たちは、GLUEベンチマークデータセットでComet on BertとRoBERTaモデルを評価し、通信の少ない3.9$times$と3.5$times$ Speedupsを示しました。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:43:00 GMT)
Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders [16.3] 時系列異常検出は幅広い応用において重要な役割を果たす。
既存のメソッドでは、データセットごとに1つの特定のモデルをトレーニングする必要があります。
本稿では,広範囲なマルチドメインデータセット上で事前学習した時系列異常検出モデルを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:59:43 GMT)
SOAP: Enhancing Efficiency of Generated Code via Self-Optimization [16.2] 大規模言語モデル(LLM)は、コード生成の著しい進歩を示している。
LLMは、しばしば非効率に悩まされ、実行時間が長くなり、メモリ消費が増加する。
自己最適化フレームワークであるOverheAd Profile (SOAP) に基づく自己最適化を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:48:15 GMT)
Gaussian Splatting on the Move: Blur and Rolling Shutter Compensation for Natural Camera Motion [16.1] 本稿では,カメラの動きに適応し,手持ち映像データを用いた高品質なシーン再構成を実現する手法を提案する。
合成データと実データの両方を用いて、既存の手法よりもカメラの動きを軽減できる性能を示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:29:28 GMT)
Erase to Enhance: Data-Efficient Machine Unlearning in MRI Reconstruction [16.1] 本稿では,MRIタスクにおいて機械学習が可能であり,バイアス除去に有用であることを示す。
異なる臓器のデータセット間でどの程度の共有知識が存在するかを研究するためのプロトコルを構築しました。
本研究は, トレーニングデータを組み合わせることで, 幻覚や画像品質の低下につながることを明らかにした。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:01:35 GMT)
Talk to Parallel LiDARs: A Human-LiDAR Interaction Method Based on 3D Visual Grounding [16.0] 並列LiDARに3D視覚グラウンドタスクを導入し、LiDARシステムのための新しいヒューマン・コンピュータインタラクションパラダイムを提案する。
本研究では,自律運転における3次元視覚的接地に適した大規模ベンチマークデータセットであるTalk2LiDARを提案する。
Talk2Car-3DおよびTalk2LiDARデータセットに関する実験は、BEVの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:00:45 GMT)
Momentum-Based Federated Reinforcement Learning with Interaction and Communication Efficiency [16.0] 本稿では,モーメント側分布を利用したフェデレート強化学習(FRL)アルゴリズムを提案する。
運動量パラメータと相互作用周波数の適切な選択により、alg は $tildemathcalilon(H-1 N-3/2)$ と $Nmathcalilon(eps-1-1)$ の相互作用と通信を達成できることを示す。
実験は、実質的なパフォーマンス向上を裏付ける
論文参考訳(メタデータ) (Fri, 24 May 2024 03:23:37 GMT)
SCALM: Towards Semantic Caching for Automated Chat Services with Large Language Models [15.7] セマンティック分析を重視し,重要なキャッシュエントリやパターンを識別する新しいキャッシュアーキテクチャであるSCALMを提案する。
評価の結果,SCALMはキャッシュヒット率を増大させ,LLMChatサービスの運用コストを低減させることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:16:22 GMT)
Tensor Frames -- How To Make Any Message Passing Network Equivariant [15.7] 等価なメッセージパッシングアーキテクチャを構築するための新しいフレームワークを提案する。
我々は、点雲上の通常のベクトル回帰について、最先端の結果を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:41:06 GMT)
Out-of-Distribution Detection using Neural Activation Prior [15.7] アウト・オブ・ディストリビューション検出(OOD)は、機械学習モデルを現実世界にデプロイする上で重要な技術である。
OOD検出のためのシンプルで効果的なニューラルアクティベーションプリミティブ(NAP)を提案する。
提案手法は,CIFARベンチマークとImageNetデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:27:50 GMT)
Perfect Alignment May be Poisonous to Graph Contrastive Learning [15.7] Graph Contrastive Learning (GCL)は、正のペアの整列と負のペアの分離によってノード表現を学習することを目的としている。
本稿では,アップストリーム性能とダウンストリーム性能の関連性を確立することを目的とする。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:01:29 GMT)
SynGhost: Imperceptible and Universal Task-agnostic Backdoor Attack in Pre-trained Language Models [15.6] 事前学習は、下流タスクにおいて顕著なパフォーマンスを達成するために、事前訓練された言語モデル(PLM)をデプロイするために必要なフェーズであった。
バックドア攻撃は,タスク非依存のエントリポイントとして,そのようなフェーズを悪用することを示す。
PLMの非知覚的かつ普遍的なタスクに依存しないバックドア攻撃である$mathttSynGhost$を提示する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:21:55 GMT)
A Review of Safe Reinforcement Learning: Methods, Theory and Applications [15.5] 我々は,手法,理論,応用の観点から,安全なRLのレビューを行う。
我々は、安全なRLを現実世界のアプリケーションにデプロイする上で、"2H3W"とよばれる5つの重要な問題を思いついた。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:33:04 GMT)
Class Machine Unlearning for Complex Data via Concepts Inference and Data Poisoning [15.4] 現在のAI時代では、ユーザーはプライバシー上の懸念から、AI企業にトレーニングデータセットからデータを削除するよう要求することができる。
機械学習は、モデルオーナーが要求されたトレーニングデータやクラスを削除することができ、モデルのパフォーマンスにほとんど影響を与えない新しい技術である。
本稿では、画像の特徴やテキストデータのトークンではなく、概念の定義を適用して、未学習クラスの意味情報を表現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:59:17 GMT)
Matchings, Predictions and Counterfactual Harm in Refugee Resettlement Processes [15.1] データ駆動型アルゴリズムマッチングは、難民と雇用率をユーティリティーの尺度として利用する場所をマッチングする。
我々は,難民プールにおけるデフォルトポリシーによる配置決定を前提として,逆マッチング問題を解決するポストプロセッシングアルゴリズムを開発した。
これらの修正された予測の下では、プール上の予測ユーティリティを最大化する最適なマッチングポリシーは有害ではないことが保証される。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:51:01 GMT)
Bayesian WeakS-to-Strong from Text Classification to Generation [14.9] この研究は、人間の意見の多様性をシミュレートする弱いモデルのアンサンブルを探索することで、Weak-to-StrongからWeakS-to-Strongに拡張する。
信頼性スコアは、WeakS-to-Strong一般化を導くベイズ的アプローチを用いて推定される。
その結果,提案手法の有効性を学生モデルの信頼性に示し,スーパーアライメントの可能性を示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:33:11 GMT)
Score Distillation via Reparametrized DDIM [14.8] スコア蒸留サンプリングで用いられる画像誘導は, 2次元デノベーション生成過程の速度場として理解できることを示す。
本研究では,SDS更新ステップ毎にDDIMを反転させることにより,より優れたノイズ近似を復元可能であることを示す。
本手法は、他の最先端のスコア蒸留法と比較して、より良く、あるいは類似した3D生成品質を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:22:09 GMT)
Bayesian Optimization of Functions over Node Subsets in Graphs [14.7] グラフ上での最適化のための新しいフレームワークを提案する。
元のグラフの各$k$-nodeを、新しいグラフのノードにマップします。
人工環境と実環境環境の両方における実験により,提案したBOフレームワークの有効性が示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:24:55 GMT)
Dissecting the Interplay of Attention Paths in a Statistical Mechanics Theory of Transformers [14.6] 本稿では,トランスフォーマーと密接な関係を持つ深層多頭部自己注意ネットワークについて考察する。
このモデルでベイズ学習の統計力学理論を開発する。
合成および実世界のシーケンス分類タスクについて,本研究の成果を確認した。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:34:18 GMT)
Quantifying the Gain in Weak-to-Strong Generalization [14.5] より弱いモデルよりも強いモデルによって達成される性能の向上は、弱いモデルによって生成されるラベル上の強モデルによって引き起こされる不適合誤差によって定量化されることを示す。
例えば、強いモデルが弱いモデルよりも改善する量を予測することができ、また、そのミスフィットエラーに基づいて、強いモデルをトレーニングするために異なる弱いモデルを選択することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:14:16 GMT)
Unambiguous discrimination of sequences of quantum states [14.4] 未知の量子列の状態を誤りなく決定する問題を考察する。
半定値プログラムの最適条件を解くことで最適確率を算出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:37:08 GMT)
HLDC: Hindi Legal Documents Corpus [14.3] Hindi Legal Documents Corpus (HLDC) は、ヒンディー語で900万以上の法的文書のコーパスである。
ドキュメントは、下流アプリケーションの開発を可能にするために、クリーンで構造化されている。
コーパスのユースケースとして,保釈予測の課題を紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:07:12 GMT)
Leveraging Unknown Objects to Construct Labeled-Unlabeled Meta-Relationships for Zero-Shot Object Navigation [14.3] ゼロショットオブジェクトナビゲーション(ZSON)は、エージェントがトレーニングセットに存在しない未確認オブジェクトにナビゲートする状況に対処する。
ラベルのない物体を訓練手順に導入し、エージェントの知識基盤を識別可能だが、これまで見過ごされていた情報で強化する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:26:18 GMT)
Off-the-shelf ChatGPT is a Good Few-shot Human Motion Predictor [14.3] 既存の数発のモーション予測作業では、人間の動きに対して専用に訓練された特定のモデルが一般的に必要である。
本研究では,特定の人間の動作予測モデルをトレーニングすることで,この課題に対処する代わりに,新しいFMP-OCフレームワークを提案する。
FMP-OC では,非言語タスクであるFew-shot Motion Prediction をオフザシェルフ言語モデル ChatGPT を用いて直接実行することが可能となる。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:50:21 GMT)
Proportional Fairness in Clustering: A Social Choice Perspective [14.2] 我々はChenらによる比例クラスタリング問題(ICML'19)について検討し、計算社会選択におけるマルチウィンナー投票の分野と関連づける。
比例フェアネスに対する近似は、個人フェアネスに対する近似であり、その逆でもあることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:52:23 GMT)
Disease-informed Adaptation of Vision-Language Models [14.1] 本稿では,医用画像解析におけるVLMを用いた伝達学習の可能性について検討する。
VLMの効果的な適応は、疾患概念のニュアンス表現学習に影響を及ぼすと論じている。
本稿では,新しい病原体学習フレームワークにおいて,病原体によるコンテキストプロンプトを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:18:02 GMT)
Learning Invariant Causal Mechanism from Vision-Language Models [14.0] 人間は、複雑な世界における環境の変化にもかかわらず不変である再利用可能な知識を学習することで、様々な領域にわたる意思決定に長けている。
本稿では,CLIP (CLIP-ICM) の不変因果メカニズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:22:35 GMT)
Timely Fusion of Surround Radar/Lidar for Object Detection in Autonomous Driving Systems [14.0] レーダーとライダーセンサーのデータは、その補完的な利点を十分に活用し、周囲をより正確に再現することができる。
既存のレーダ/リダ融合法は、サラウンドレーダの低周波で動作する必要がある。
本稿では,Radar/Lidar周辺を高速なLidarのみに制限された作業周波数でヒューズする手法を開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:40:22 GMT)
DiffCalib: Reformulating Monocular Camera Calibration as Diffusion-Based Dense Incident Map Generation [13.8] 我々は、事前学習した拡散モデルに埋め込まれた包括的視覚知識を活用し、より堅牢で正確な単眼カメラ固有の推定を可能にする。
本モデルでは, 予測誤差を最大40%低減し, 最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:05:04 GMT)
Anomalous Change Point Detection Using Probabilistic Predictive Coding [13.7] 確率予測符号化 (Probabilistic Predictive Coding, PPC) と呼ばれる深層学習に基づく CPD/AD 手法を提案する。
PPCは、連続したデータを低次元の潜在空間表現にエンコードし、その後のデータ表現とそれに対応する予測不確かさを予測することを共同で学習する。
本研究では, 合成時系列実験, 画像データ, 実世界の磁気共鳴分光画像データにまたがって提案手法の有効性と適応性を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:17:34 GMT)
SATSense: Multi-Satellite Collaborative Framework for Spectrum Sensing [13.5] ローアース・オービター・インターネット(英語版)は最近展開され、地球外のネットワークで世界中にサービスを提供している。
複数の衛星からの多様なデータを利用した協調センシング手法を提案する。
本稿では,効率的なスペクトルセンシングを実現するために,グラフニューラルネットワークに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:29:57 GMT)
NuwaTS: Mending Every Incomplete Time Series [13.4] 時系列計算のための言語訓練フレームワークであるNuwaTSを紹介する。
NuwaTSは、欠落したパターンを持つ任意のドメインからの不完全な時系列上の計算タスクに適用することができる。
既存のドメイン固有モデルよりも優れた1対全計算モデルを得る。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:59:02 GMT)
Prompt Tuning Strikes Back: Customizing Foundation Models with Low-Rank Prompt Adaptation [13.3] Low-Rank Prompt Adaptation (LOPA) は、最先端のPEFTメソッドやフル微調整と同等に動作するプロンプトチューニングベースのアプローチである。
LOPAは、インスタンス間でタスク固有の情報を共有することと、インスタンスごとのカスタマイズをバランスさせることで、ソフトプロンプトを生成する。
パラメータ効率を達成するために、各インスタンスにエンコードされたソフトプロンプトコンポーネントの低ランク分解を使用する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:11:42 GMT)
Autonomous Quilt Spreading for Caregiving Robots [13.3] 睡眠中のキルトを故意に消耗させる乳児を迅速かつ正確に再発見するための新しい戦略を提案する。
我々のアプローチは、干渉分解能とキルト拡散の2つのステップに定式化されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:11:29 GMT)
Towards Bounding Causal Effects under Markov Equivalence [13.1] 観測データのみを用いた因果関係の導出について考察する。
等価クラスの不変性を利用する因果効果のバウンダリを導出する体系的アルゴリズムを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:28:48 GMT)
BiSup: Bidirectional Quantization Error Suppression for Large Language Models [13.0] 本稿では,双方向量子化誤差抑圧法であるBiSupを紹介する。
BiSupは2つの最先端手法で性能を向上できることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:39:27 GMT)
Fisher Flow Matching for Generative Modeling over Discrete Data [13.0] 離散データのための新しいフローマッチングモデルであるFisher-Flowを紹介する。
Fisher-Flowは、離散データ上のカテゴリー分布を考慮し、明らかに幾何学的な視点を採っている。
Fisher-Flowにより誘導される勾配流は, 前方KLの発散を低減するのに最適であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:21:17 GMT)
Polyp Segmentation Generalisability of Pretrained Backbones [13.0] 事前学習したバックボーンの異なるモデルが、トレーニングデータと多少異なる分布のデータにどのように一般化するかを検討する。
我々の結果は、ViT-Bバックボーンのモデルでは性能が優れているにもかかわらず、ResNet50バックボーンのモデルは一般的により一般化されていることを示唆している。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:09:52 GMT)
The Impact and Opportunities of Generative AI in Fact-Checking [12.8] 生成AIは、OpenAIのフラッグシップGPTモデルを使用したフォーチュン500企業の90%以上が、ホワイトカラーの専門職を変革する可能性がある。
しかし、そのような技術は、事実情報の検証と報告を行う組織にどのように影響しますか?
我々は6大陸29のファクトチェック組織で働くN=38人を対象に30回のインタビューを行った。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:58:01 GMT)
Leveraging Logical Rules in Knowledge Editing: A Cherry on the Top [12.8] 知識編集(KE)におけるマルチホップ質問回答(MQA)は,大規模言語モデル(LLM)において重要な課題である
本稿では, RULE-KE をベースとした知識編集フレームワーク RULE-KE を提案する。
既存のデータセットと新しいデータセットを用いた実験的評価では、RULE-KEはパラメータベースのソリューションとメモリベースのソリューションの両方のパフォーマンスを、それぞれ92%と112.9%に向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:30:00 GMT)
Biometrics and Behavioral Modelling for Detecting Distractions in Online Learning [12.5] 本稿では,eラーニングセッション中に異常な頭部ポーズを検出するコンピュータビジョンアプローチについて検討する。
本稿では,学習者のセッションで観測された平均値から頭部姿勢の偏差を検出するためのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:02:55 GMT)
Nonlinear denoising score matching for enhanced learning of structured distributions [12.4] 非線形ドリフトに一般化することで、追加構造を力学に組み込むことができる。
本手法の有効性をいくつかの例で示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:14:23 GMT)
Exploring the Evolution of Hidden Activations with Live-Update Visualization [12.4] 我々は、トレーニング中に隠された表現の進行を明らかにする自動化されたリアルタイム可視化ツールであるSentryCamを紹介した。
以上の結果から, この可視化は, 基礎的指標と比較して, 学習のダイナミクスをより包括的に把握できることが示唆された。
SentryCamは、タスク転送や破滅的な忘れなど、継続的な学習環境への詳細な分析を容易にすることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:23:20 GMT)
Enhancing Adverse Drug Event Detection with Multimodal Dataset: Corpus Creation and Model Development [12.3] 有害薬物イベント(ADEs)の採掘は、患者の安全性を高めるために薬物移動において重要な役割を担っている。
従来のADE検出方法は信頼性が高いが遅く、大規模な操作に容易に適応できない。
以前のADE鉱業研究は、視覚的な手がかりを見越して、テキストベースの方法論に焦点を当ててきた。
我々は、ADE関連テキスト情報を視覚支援と組み合わせたMMADE(MultiModal Adverse Drug Event)検出データセットを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:58:42 GMT)
Enhancing Learning with Label Differential Privacy by Vector Approximation [12.2] ラベル微分プライバシ(DP)は、データセットのトレーニングにおいてラベルのプライバシを保護するフレームワークである。
既存のアプローチは、ラベルをランダムに反転させることで、ラベルのプライバシを保護する。
本稿では,実装が容易で,計算オーバーヘッドがほとんどないベクトル近似手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:08:45 GMT)
OptLLM: Optimal Assignment of Queries to Large Language Models [12.1] 大規模言語モデル(LLM)における費用効率の高いクエリ割り当て問題に対処するフレームワークを提案する。
当社のフレームワークであるOpsLLMは、ユーザに対して、予算の制約やパフォーマンスの優先事項に合わせて、選択可能なさまざまな最適なソリューションを提供します。
OptLLMの有効性を評価するため,テキスト分類,質問応答,感情分析,推論,ログ解析など,さまざまなタスクについて広範な実験を行った。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:05:37 GMT)
On the Convexity and Reliability of the Bethe Free Energy Approximation [12.0] 我々はBethe近似がいつ信頼できるか、どのように検証できるかを分析する。
実用的なコントリビューションとして、Bethe自由エネルギーの最小値を求める準ニュートン法である$textttBETHE-MIN$を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:57:40 GMT)
Fieldscale: Locality-Aware Field-based Adaptive Rescaling for Thermal Infrared Image [12.0] 本研究では、局所性を考慮した2Dフィールドに基づく再スケーリングであるFieldscaleを提案する。
各領域の画素ゲインを適応的に決定し、空間的に一貫した8ビットの再スケール画像を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:49:52 GMT)
Model-based Reinforcement Learning for Parameterized Action Spaces [11.9] PAMDPのためのモデルベース強化学習アルゴリズムを提案する。
エージェントはパラメータ化されたアクション条件付き力学モデルを学び、修正されたモデル予測経路積分制御で計画する。
いくつかの標準ベンチマークにおける実験結果から,本アルゴリズムは最先端のPAMDP法よりも優れたサンプリング効率と性能を実現することが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:15:42 GMT)
Learning Nash Equilibria in Zero-Sum Markov Games: A Single Time-scale Algorithm Under Weak Reachability [11.8] 我々は,ゼロサムゲームにおいて,プレイヤーが情報のみを閲覧し,相手の行動や支払いを行うような分散学習を検討する。
従来の研究は、強い到達可能性仮定の下で二重時間スケールのアルゴリズムを用いて、この設定でナッシュ均衡に収束することを示した。
我々の貢献は合理的で収束したアルゴリズムであり、Tsallis-Entropy regularization を値イテレーションに基づくアルゴリズムで利用している。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:57:54 GMT)
Accelerating Diffusion Models with Parallel Sampling: Inference at Sub-Linear Time Complexity [11.7] 拡散モデルは、訓練と評価に費用がかかるため、拡散モデルの推論コストを削減することが大きな目標である。
並列サンプリング手法であるHh2024parallelを用いて拡散モデルを高速化する実験的な成功に触発されて,サンプリングプロセスを各ブロック内に並列化可能なPicard繰り返しを持つ$mathcalO(1)$ブロックに分割することを提案する。
我々の結果は、高速で効率的な高次元データサンプリングの可能性に光を当てた。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:59:41 GMT)
Dishonest Approximate Computing: A Coming Crisis for Cloud Clients [11.7] 本稿では,悪質な攻撃をDHAC(DisHonest Approximate Computing)と定義する。
残差クラスチェックとフォワードバックバックチェックの2つのゴールデンモデルフリー検出手法を提案する。
以上の結果から,CRCとFBCはともにDHACの96%~99%の症例を検出できることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:04:42 GMT)
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models [11.7] マルチモーダル大言語モデル(LLM)を用いたゼロショット画像分類のための簡易かつ効果的な手法を提案する。
当社の手法では,データセット毎にプロンプトエンジニアリングを必要とせず,その代わりに,すべてのデータセットに対して単一の,直接的なプロンプトセットを使用する。
平均10以上のベンチマークで精度は4.1ポイント向上し,ImageNetデータセットでは6.8ポイント向上した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:05:15 GMT)
Application based Evaluation of an Efficient Spike-Encoder, "Spiketrum" [11.6] スパイクベースのエンコーダは、情報をスパイクまたはパルスのシーケンスとして表現し、ニューロン間で伝達される。
Spiketrumエンコーダはスパイクトレインまたはコードセットを使用して入力データを効率よく圧縮する。
この論文は、Spketrumハードウェアとそのソフトウェアの両方を、最先端で生物学的に証明可能なエンコーダに対して広範囲にベンチマークしている。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:36:24 GMT)
Dimension-free deterministic equivalents for random feature regression [11.6] テスト誤差は特徴写像固有値のみに依存する閉形式式によってよく近似されていることを示す。
特に、近似保証は非漸近的で乗法的であり、特徴写像次元とは独立である。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:43:26 GMT)
You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs [11.5] YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のために設計された、新しい生成モデルである。
YOSOは,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。
特に、512の解像度で訓練された1ステップで画像を生成できる最初の拡散変換器を提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:01:32 GMT)
A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search [11.5] 本稿では,相互情報(PODM-MI)に基づく嗜好指向の多様性モデルを提案する。
PODM-MIは、再ランクプロセスにおける正確性と多様性の両方を考慮する。
我々は,PODM-MIをeコマース検索プラットフォームに導入することに成功している。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:03:34 GMT)
RoGS: Large Scale Road Surface Reconstruction based on 2D Gaussian Splatting [11.5] 道路面の再建は自動運転において重要な役割を担っている。
本稿では,2次元ガウススプラッティング (2DGS) に基づく大規模道路表面再構成手法RoGSを提案する。
我々は,様々な挑戦的な現実のシーンにおける道路表面の再構築において,優れた成果を上げた。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:38:18 GMT)
Robustifying Safety-Aligned Large Language Models through Clean Data Curation [11.3] 大きな言語モデル(LLM)は、有害なコンテンツを含むデータセットでトレーニングされた場合、脆弱性がある。
本稿では,両シナリオにおける敵対的影響に対処するためのデータキュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:50:38 GMT)
ConfusionPrompt: Practical Private Inference for Online Large Language Models [11.3] 大規模言語モデル(LLM)は一般的にオンラインサービスとしてデプロイされ、ユーザーはクラウドサーバーにインフォメーションプロンプトを送信する必要がある。
ConfusionPromptは,プロンプトをサブプロンプトに分解することでサーバを難読化するために設計された,新しいLLM推論フレームワークである。
プライバシ保護グループに必要なプロンプトを定式化するために,$(lambda, mu, rho)$-privacyモデルを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:57:36 GMT)
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models [11.3] テキストと画像の拡散モデルは、フレキシブルでリアルな画像合成のための前例のない能力を示している。
これらのモデルは、時間を要するサンプリング手順に依存しており、レイテンシの削減を動機付けている。
我々のアプローチは、再訓練、微調整、知識蒸留なしに、直接遅延を減らそうとしている。
我々は,これらの再利用戦略と同等のレイテンシの少数のサンプリング手順を経験的に比較し,再利用が元の高遅延拡散モデルにより生成された画像に近い画像を生成することを発見した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:23:38 GMT)
AgentCoder: Multi-Agent-based Code Generation with Iterative Testing and Optimisation [11.2] 本稿では,マルチエージェント・アシスタント・コード生成(AgentCoder)を紹介する。
AgentCoderは,プログラマエージェント,テストデザイナエージェント,テストエグゼクタエージェントという,特殊なエージェントを備えたマルチエージェントフレームワークを備えた,斬新なソリューションだ。
9つのコード生成モデルと12つの拡張アプローチの実験では、既存のコード生成モデルよりもAgentCoderの方が優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:47:24 GMT)
Reshuffling Resampling Splits Can Improve Generalization of Hyperparameter Optimization [11.1] 驚くべきことに、各構成の分割をリシャッフルすることで、最終モデルの一般化性能が向上することが多い。
リシャッフルは固定スプリットの使用と競合するテストパフォーマンスをもたらすが、単一のトレインバリデーションのホールドアウトプロトコルの結果を大幅に改善する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:48:18 GMT)
Transaction Fee Estimation in the Bitcoin System [11.1] Bitcoinシステムでは、取引手数料はブロックチェーンの確認のインセンティブとなる。
本研究は,新たな取引の取引手数料を推定し,所定の時間内にその確認を支援することに焦点を当てる。
本稿では、トランザクション自体を含む幅広いソースからの知識をニューラルネットワークモデルに統合し、適切なトランザクション料金を見積もるフレームワークFENNを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:27:00 GMT)
Annotation Free Semantic Segmentation with Vision Foundation Models [11.0] 既存の基盤モデルを用いて,任意のセマンティックセグメンテーションデータセットに対してフリーアノテーションを生成する。
CLIPを使ってオブジェクトとSAMを検出し、高品質なオブジェクトマスクを生成します。
我々のアプローチは、最小限のトレーニングで事前訓練された視覚エンコーダに言語ベースのセマンティクスをもたらすことができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:05:00 GMT)
$$\mathbf{L^2\cdot M = C^2}$$ Large Language Models as Covert Channels... a Systematic Analysis [11.0] 大規模言語モデル(LLM)は、様々なタスクのパフォーマンスのため、ここ数年で大きな人気を集めている。
LLMは様々な攻撃を受けやすいが、多様なシステムのセキュリティも改善できる。
検閲に抵抗する通信を容易にするために,オープンソースLLMは,どの程度の振る舞いをするのだろうか?
論文参考訳(メタデータ) (Fri, 24 May 2024 15:47:35 GMT)
DAGER: Exact Gradient Inversion for Large Language Models [11.0] フェデレーション学習は、複数のクライアントからローカルに計算された勾配を集約することで機能する。
これまでの研究では、いわゆるグラディエント・インバージョン・アタックを使用して、データをサーバによって実際に回収できることが示されていた。
入力テキストのバッチ全体を正確に復元する最初のアルゴリズムであるDAGERを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:14:24 GMT)
BadGD: A unified data-centric framework to identify gradient descent vulnerabilities [11.0] BadGDは、敵の操作を理解し緩和するための新しい標準を設定している。
この研究は、このようなデータ中心の攻撃によって引き起こされる深刻な脅威を強調し、機械学習における堅牢な防御の必要性を強調している。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:39:45 GMT)
Automatic parking planning control method based on improved A* algorithm [10.9] 本稿では,A*アルゴリズムに基づく自動駐車計画アルゴリズムの改良を提案し,自動駐車の制御モジュールとしてモデル予測制御(MPC)を用いる。
このアルゴリズムは、関数の最適化、バイナリヒープの最適化、双方向検索により、リアルタイムの計画性能を向上させる。
MPCは、計画された軌道に沿って車を運転する制御コマンドを出力するために使用される。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:26:07 GMT)
Automated Parking Planning with Vision-Based BEV Approach [10.9] 本稿では,A*アルゴリズムに基づく自動駐車アルゴリズムの改良,車両運動モデルの統合,機能最適化,双方向探索,ベジエ曲線最適化を提案する。
従来のアルゴリズムと比較して、より困難な衝突リスクテストケースで計算時間を短縮し、快適なメトリクスのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:26:09 GMT)
DecoderTracker: Decoder-Only Method for Multiple-Object Tracking [10.8] 本稿では,Decoderのみの軽量モデルであるDecoderTrackerの構築を試みる。
具体的には,エンコーダ構造を置き換えるために,画像から特徴を効率的に抽出できる画像特徴抽出ネットワークを開発した。
DanceTrackデータセットでは、ベルやホイッスルを使わずに、DecoderTrackerのトラッキング性能は、約2倍の推論速度でMOTRをわずかに上回る。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:53:26 GMT)
Heart Murmur and Abnormal PCG Detection via Wavelet Scattering Transform & a 1D-CNN [10.7] この研究は、心電図(PCG)記録から自動的かつ正確な心臓外傷検出を行う。
2つのパブリックPCGデータセット(CirCor Digiscope 2022データセットとPCG 2016データセット)を使用して、3つのカスタムニューラルネットワーク(NN)をトレーニングおよびテストする。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:31:43 GMT)
Discriminative Estimation of Total Variation Distance: A Fidelity Auditor for Generative Data [10.7] 本稿では,2つの分布間の総変動(TV)距離を推定する判別手法を提案する。
本手法は,2つの分布の分類におけるベイズリスクとテレビの距離の関係を定量的に評価する。
分類において、特定の仮説クラスを選択することで、テレビの距離を推定する際の高速収束率が達成できることを実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:18:09 GMT)
On Computing Plans with Uniform Action Costs [10.6] 本稿では,3つの一様性指標を自動計画に適応させ,行動コストと行動コストの総和を語彙的に最適化する計画ベースコンパイルを提案する。
良く知られた計画ベンチマークと新しい計画ベンチマークの両方の実験結果は、修正されたタスクを効果的に解決し、一様計画を生成することができることを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:19:23 GMT)
FreezeAsGuard: Mitigating Illegal Adaptation of Diffusion Models via Selective Tensor Freezing [10.6] 本稿では,拡散モデルの非可逆的適応を可能にする技術であるFreezeAsGuardを提案する。
基本的アプローチは、モデルパブリッシャが不正なモデル適応に不可欠な事前訓練された拡散モデルにおいてテンソルを選択的に凍結することである。
実験の結果,FreezeAsGuardは偽の人物の肖像を制作する違法なモデル適応を緩和する強力な力を持っていることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:23:51 GMT)
Predicting the Impact of Model Expansion through the Minima Manifold: A Loss Landscape Perspective [10.5] 本稿では, 多様体の大きさを推定することにより, 膨張の影響を研究するための計量について述べる。
実験結果から, 性能の利得と多様体サイズとの関係が明らかとなった。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:33:05 GMT)
Provably Quantum-Secure Microgrids through Enhanced Quantum Distributed Control [10.5] 本稿では、DER間の同期と電力共有を保証できるスケーラブルな量子分散コントローラを考案する。
鍵となるイノベーションは、新しい量子分散スキームが、参加するDER間の量子チャネルから直接秘密情報を交換できるという事実にある。
2つのacおよびdcマイクログリッドのケーススタディは、新しい量子分散制御戦略の有効性を検証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:34:10 GMT)
Self-distilled Dynamic Fusion Network for Language-based Fashion Retrieval [10.4] 本稿では,多粒度特徴を動的に構成する自己蒸留型動的核融合ネットワークを提案する。
提案手法には,(1)モダリティ特異的ルータを用いた動的核融合ネットワークと(2)自己経路蒸留損失の2つの新たなモジュールが含まれている。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:28:01 GMT)
ExactDreamer: High-Fidelity Text-to-3D Content Creation via Exact Score Matching [10.4] 現在のアプローチは、しばしば3次元合成のために事前訓練された2次元拡散モデルを適用する。
過剰な平滑化は、3Dモデルの高忠実度生成に重大な制限をもたらす。
LucidDreamer は SDS における Denoising Diffusion Probabilistic Model (DDPM) を Denoising Diffusion Implicit Model (DDIM) に置き換える
論文参考訳(メタデータ) (Fri, 24 May 2024 20:19:45 GMT)
Domain Generalisation for Object Detection under Covariate and Concept Shift [10.3] ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:58:36 GMT)
VB-LoRA: Extreme Parameter Efficient Fine-Tuning with Vector Banks [10.3] ローランク適応(LoRA)とその派生型は、かなりのストレージと送信コストを発生させる。
行列次元,モジュール,レイヤ間の低ランク分解の障壁を断ち切る「分割共有」パラダイムを導入する。
VB-LoRAは、最先端PEFT法と比較して、同等または優れた性能を維持しながら、極端なパラメータ効率を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:24:34 GMT)
Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling [10.2] ドット積自己注意などのトランスフォーマーの異なる成分が表現力に影響を及ぼすメカニズムについて検討する。
本研究では,トランスフォーマーにおける臨界パラメータの役割を明らかにする。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:03:59 GMT)
Initialization is Critical to Whether Transformers Fit Composite Functions by Inference or Memorizing [10.2] 本稿では,変圧器が構成問題に対してどのように振る舞うかのメカニズムを考察する。
パラメータ初期化尺度は、モデルが推論解を学習するかどうかを決定する上で重要な役割を果たす。
推論解は複雑さのバイアスが低く、単一のアンカーの個々のマッピングを学習できる重要な要素である、と仮定する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:00:31 GMT)
Bayesian Vector AutoRegression with Factorised Granger-Causal Graphs [10.0] 本研究では,観測時系列データからGranger因果関係を自動的に検出する問題について検討する。
本稿では,二元的グランガー因果グラフ上の事前分布を階層的に分解した新しいベイズVARモデルを提案する。
我々は,2進グランガー因果グラフの後方推定を効率的に行うアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:40:45 GMT)
Bundle Neural Networks for message diffusion on graphs [10.0] 結合ニューラルネットワーク(BuNN)は,任意のグラフ上の任意の特徴変換をインジェクティブな位置符号化で近似できることを示す。
また、BuNNが任意のグラフの族上の任意の特徴変換を近似して、任意の射影的位置エンコーディングを行えば、普遍的なノードレベルの表現性が得られることを証明した。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:28:48 GMT)
Sparse Spectral Training and Inference on Euclidean and Hyperbolic Neural Networks [10.0] SST(Sparse Spectral Training)は、全ての特異値を更新し、ネットワーク重みの特異ベクトルを選択的に更新する高度な訓練手法である。
SSTは、特異値の重み付けによる多項サンプリング法により決定される特異ベクトルに対する目標更新戦略を用いて、トレーニングプロセスを洗練する。
OPT-125Mでは、組込み寸法の8.3%に等しく、SSTはパープレキシティギャップを67.6%減らし、一般的なローランク法で性能損失を著しく低減した。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:59:41 GMT)
Improved Particle Approximation Error for Mean Field Neural Networks [9.8] MFLD(Mean-field Langevin dynamics)は、確率分布の空間上で定義されるエントロピー規則化された非線形凸関数を最小化する。
最近の研究は、MFLDにおけるカオスの時間的一様伝播を実証している。
粒子近似誤差における対数的ソボレフ不等式(LSI)定数の依存性を改善する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:59:06 GMT)
Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition [9.8] この研究は、ロングビデオ上で認識モデルをトレーニングするための、弱い教師付きエンドツーエンドフレームワークを構築することを目的としている。
提案するフレームワーク,すなわちAdaptFocusは,情報的アクションクリップに適応的にフォーカスするために,アクションの発生頻度を推定する。
提案するAdaptFocusフレームワークの有効性は,3つの長ビデオデータセットで実証されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:25:04 GMT)
Statistical and Computational Guarantees of Kernel Max-Sliced Wasserstein Distances [9.6] カーネル最大スライシング (KMS) ワッサーシュタイン距離は、この目的のために開発された。
KMS の 2$-Wasserstein 距離の計算は NP-hard であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:14:56 GMT)
Linearly Controlled Language Generation with Performative Guarantees [9.5] 我々は、LMの潜在空間で線形に表現される概念意味論の共通モデルを用いる。
本研究では,望ましくない意味に対応する領域から動的に軌道を逸脱する,軽量で勾配のない介入を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:30:44 GMT)
Discriminative Entropy Clustering and its Relation to K-means and SVM [9.4] モデルの入力と出力の相互情報の最大化は、ソフトマックス予測の「決定性」と「公正性」に関係している。
本稿では,一般的なソフトマックスモデルに対するエントロピークラスタリングの自己ラベル化に関する新しい定式化を提案する。
我々のアルゴリズムは、ディープクラスタリングのためのいくつかの標準ベンチマークにおける技術状況を改善する。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:18:42 GMT)
Critical windows: non-asymptotic theory for feature emergence in diffusion models [9.3] 我々は,重要なウィンドウと呼ぶ画像生成のための拡散モデルの興味深い性質を理解するための理論を開発する。
本稿では,これらのウィンドウを解析するための公式な枠組みを提案し,強対数凹凸密度の混合から得られるデータに対して,これらのウィンドウを証明可能な有界化が可能であることを示す。
安定拡散に関する予備実験は、クリティカルウィンドウが現実世界の拡散モデルにおける公正さとプライバシー侵害を診断するための有用なツールとして役立つことを示唆している。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:35:38 GMT)
Feature Splatting for Better Novel View Synthesis with Low Overlap [9.2] 3D Splattingは非常に有望なシーン表現として登場し、新しいビュー合成における最先端の品質を実現している。
本稿では,3次元ガウスの色彩情報をガウス特徴ベクトルに符号化し,特徴分割(Feature Splatting)と表現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:02:29 GMT)
UnitNorm: Rethinking Normalization for Transformers in Time Series [9.2] 正規化技術は,時系列解析タスクにおけるトランスフォーマーモデルの性能向上と安定性向上に不可欠である。
入力ベクトルをノルムで拡張し、注意パターンを変調する新しい手法であるUnitNormを提案する。
UnitNormの有効性は、予測、分類、異常検出など、さまざまな時系列分析タスクで実証されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:58:25 GMT)
Minimizing UCB: a Better Local Search Strategy in Local Bayesian Optimization [9.1] 我々は、勾配降下法と上信頼境界(UCB)を最小化する手法の関係を発展させる。
GIBO における CB の最小化により勾配降下を最小化する局所ベイズ最適化アルゴリズム MinUCB を提案する。
提案手法は,異なる合成関数と実世界の関数に応用し,本手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:17:24 GMT)
Beyond Trend and Periodicity: Guiding Time Series Forecasting with Textual Cues [9.1] 本研究は,TGTSF(Text-Guided Time Series Forecasting)タスクを紹介する。
TGTSFは、チャネル記述や動的ニュースなどのテキストキューを統合することで、従来の手法の限界に対処する。
テキストキューと時系列データを相互アテンション機構を用いて融合する,堅牢なベースラインモデルである TGForecaster を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:10:27 GMT)
Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization [9.0] Federated Learning (FL)は、コラボレーションとプライバシ保護の機械学習のための有望なフレームワークを提供する。
FLとのかなりの通信コストは、その効率に重大な課題をもたらす。
本稿では,ゼロオーダー最適化技術を活用したFLのための新しい自由通信方式を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:07:05 GMT)
TRAWL: External Knowledge-Enhanced Recommendation with LLM Assistance [9.0] 有望なアプローチは、振る舞いに基づく推薦システムを豊富な意味情報で強化するために、外部知識を活用することである。
このアプローチは、生の外部知識の認知と意味表現の適応という2つの主要な課題に直面している。
LLM支援を用いた外部知識強化レコメンデーション手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:09:35 GMT)
Repeat-Aware Neighbor Sampling for Dynamic Graph Learning [9.0] 既存の研究は、主に最新の隣のシーケンスに依存して進化するパターンを得る。
将来、2つのノードが相互に相互作用するかどうかは、過去に起こったのと同じ相互作用と非常に相関している、と我々は主張する。
本稿では,近隣のサンプリング戦略と時間情報学習における1次・高次反復行動の進化パターンを考察したRepeatMixerを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:24:29 GMT)
Scaling Law for Time Series Forecasting [9.0] 大規模データセット、複雑なモデル、強化されたデータの粒度に報いるスケーリング法則は、ディープラーニングの様々な分野において観察されている。
しかし、時系列予測の研究は、時系列予測のためのディープラーニング手法のスケーリング行動に疑問を投げかけている。
本稿では,このような異常な振る舞いを説明できる時系列予測法則のスケーリング理論を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:46:27 GMT)
Towards Principled Graph Transformers [8.9] k次元Weisfeiler-Leman(k-WL)階層に基づくグラフ学習アーキテクチャは、理論的によく理解された表現力を提供する。
提案するEdge Transformerは,ノードではなくノードペアで動作するグローバルアテンションモデルであり,少なくとも3WLの表現力を持つことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:42:44 GMT)
Adversarial Attacks on Hidden Tasks in Multi-Task Learning [8.9] マルチタスクモデルの非ターゲットタスクと共有バックボーンネットワークからの知識を活用する新しい逆攻撃手法を提案する。
CelebAとDeepFashionデータセットの実験結果から,隠れタスクの精度を劣化させる手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:11:30 GMT)
AMGPT: a Large Language Model for Contextual Querying in Additive Manufacturing [8.8] AMGPTは、金属添加物製造クエリ用に設計された特殊なLCMテキストジェネレータである。
我々は、スクラッチからトレーニングする代わりに、Hugging Faceからトレーニング済みのLlama2-7BモデルをRetrieval-Augmented Generation (RAG)セットアップで採用する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:03:32 GMT)
Volumetric Primitives for Modeling and Rendering Scattering and Emissive Media [8.8] 我々は、単純なカーネルベースのボリュームプリミティブの混合物を用いて散乱媒体と放射媒体のモデリングを形式化し、一般化する。
本稿では,散乱媒体の前方および逆レンダリングのためのボリュームモデリングの代替として,本手法を実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:42:05 GMT)
The Writing is on the Wall: Analyzing the Boom of Inscriptions and its Impact on EVM-compatible Blockchains [8.7] 本研究は,入力トランザクションの適用状況と,突然のトランザクション急激な期間におけるブロックチェーンのスケーラビリティへの影響について検討する。
L1ブロックチェーンとは異なり、トランザクションの急増の間、zkSyncとArbitrumは、単一のL1バッチに対するL2トランザクションの圧縮に起因する、中央値のガス料金が低かった。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:21:53 GMT)
Optimal transport for automatic alignment of untargeted metabolomic data [8.7] 本稿では,LC-MSデータセットを最適なトランスポートで自動的に組み合わせる,フレキシブルでユーザフレンドリなアルゴリズムであるGromovMatcherを紹介する。
特徴強度相関構造を利用することで、GromovMatcherは優れたアライメント精度とロバスト性を提供する。
我々は,GromovMatcherが,いくつかのがんタイプに関連するライフスタイルのリスク要因に関連するバイオマーカーの検索をいかに促進するかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:16:49 GMT)
Trajectory-Based Multi-Objective Hyperparameter Optimization for Model Retraining [8.6] 本稿では,新しいトラジェクトリベース多目的ベイズ最適化アルゴリズムを提案する。
我々のアルゴリズムは、より優れたトレードオフとチューニング効率の両面において、最先端のマルチオブジェクトよりも優れています。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:43:45 GMT)
Towards Precision Healthcare: Robust Fusion of Time Series and Image Data [8.6] 本稿では,データの種類毎に2つのエンコーダを用いて,視覚情報と時間情報の両方において複雑なパターンをモデル化する手法を提案する。
また、不均衡なデータセットに対処し、不確実性損失関数を使用し、改善した結果を得る。
本手法は,臨床応用におけるマルチモーダルディープラーニングの改善に有効であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:18:13 GMT)
ProDAG: Projection-induced variational inference for directed acyclic graphs [8.6] 我々は、DAG(Directed Acyclic Graphs)の空間を直接支援する新しい分布に基づく変分ベイズ推論フレームワークを開発する。
提案手法であるProDAGは,精度の高い推論が可能であり,既存の最先端の代替手法よりも優れている場合が多い。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:04:28 GMT)
Blaze3DM: Marry Triplane Representation with Diffusion for 3D Medical Inverse Problem Solving [8.5] 本稿では,コンパクトな三面体ニューラルフィールドと強力な拡散モデルを統合することにより,高速かつ高忠実な生成を可能にする新しいアプローチBlaze3DMを提案する。
技術的には、Blaze3DMは、データ依存の3次元平面埋め込みと共有デコーダを同時に最適化し、各3次元平面を対応する3次元ボリュームに再構成することから始まる。
スパースビューCT、リミテッドアングルCT、圧縮センシングMRI、MRI等方的超解像を含むゼロショット3次元医療逆問題解決実験は、Blaze3DMが最先端性能を達成するだけでなく、計算効率も著しく向上することを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:07:27 GMT)
Hacc-Man: An Arcade Game for Jailbreaking LLMs [8.5] ハックマン(Hacc-Man)は、LLMを「ジェイルブレイク」するようプレイヤーに挑戦するゲームである。
本稿では,LLMの「ジェイルブレイク」に挑戦するゲームであるHacc-Manを紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:55:20 GMT)
A3:Ambiguous Aberrations Captured via Astray-Learning for Facial Forgery Semantic Sublimation [8.4] 我々は,アストレイラーニング(astray-learning)という,偽のセマンティクスの分離と昇華に類似したアプローチを提案する。
提案手法の主な目的は,高周波成分から派生したハイブリッド・フォージェリー・セマンティクスを,認証画像にブレンドすることである。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:12:57 GMT)
Multi-frequency control and measurement of a spin-7/2 system encoded in a transmon qudit [8.4] 実効スピン7/2系における回転と投射を生成するために、同時マルチ周波数駆動を用いる。
変位演算子と仮想SNAPゲートを組み合わせることで、O(d)物理パルスにおける任意の単一量子ユニタリ演算を実現する。
これらのネイティブなクディット演算は、クディットに基づく誤差補正や格子ゲージ理論のクディットによるシミュレーションを探索するエンタングル演算と組み合わせることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:00:28 GMT)
Learning the Language of Protein Structure [8.4] 本稿では,タンパク質構造を離散表現に効果的にトークン化するベクトル量子化オートエンコーダを用いたアプローチを提案する。
学習した表現の有効性を示すために、コードブック上でトレーニングされた単純なGPTモデルにより、新規で多様性があり、設計可能なタンパク質構造を生成することができることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:03:47 GMT)
Fast adiabatic preparation of multi-squeezed states by jumping along the path [8.3] 本稿では,マルチシーズ状態の高速な調製のための新しいショートカット to adiabaticity (STA)法を提案する。
ボソニックモードとキュービット間のハイブリッド絡み合い状態と同様に,多列状態の高忠実かつ高速な調製を実演する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:27:28 GMT)
AnchorAL: Computationally Efficient Active Learning for Large and Imbalanced Datasets [8.3] 不均衡な分類タスクのアクティブラーニングは、マイノリティクラスが自然に稀に発生するため、困難である。
標準的なプールベースのアクティブラーニングは、大きなプールでは計算コストが高く、初期決定境界を過度に適合させることで、しばしば低い精度に達する。
異なる分類タスクに対する実験では、AnchorALは(i)高速で、実行時間を数時間から数分に短縮し、(ii)よりパフォーマンスの高いモデルをトレーニングし、(iii)競合するメソッドよりもバランスの取れたデータセットを返す。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:46:14 GMT)
Out of Many, One: Designing and Scaffolding Proteins at the Scale of the Structural Universe with Genie 2 [8.1] 我々はGenie 2を導入し、より大きく、より多様なタンパク質構造空間をキャプチャするためにGenieを拡張した。
Genie 2は、新しいマルチモチーフフレームワークを通じてモチーフスキャフォールディング機能を追加する。
非条件生成と条件生成の両方で、Genie 2は最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:11:41 GMT)
Nonreciprocal entanglement in cavity magnomechanics exploiting chiral cavity-magnon coupling [8.1] キャビティ・マグノメカティカル・システムにおいて,非相互量子絡み合いを実現する方法を示す。
この研究は、ノイズ耐性量子処理、チャネル多重量子テレポーテーション、カイラルマグノン量子ネットワークにおいて有望な応用を見出すことができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:23:56 GMT)
Airdrops: Giving Money Away Is Harder Than It Seems [8.1] エアドロップの設計空間を概説し、エアドロップが理想的に生み出すべき結果の合理的なリストを指定する。
本研究は,複数の大規模エアロッドからのオンチェーンデータを解析し,過去のエアロッドの成功を実証的に評価する。
私たちの分析は、一般的なエアドロップの設計が与える共通の落とし穴の概観に続きます。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:21:06 GMT)
FTMixer: Frequency and Time Domain Representations Fusion for Time Series Modeling [8.0] 時系列データは、時間領域と周波数領域の両方で表すことができる。
両領域の強度を利用するために、周波数・時間領域混合器(FTMixer)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:31:46 GMT)
Towards Better Understanding of In-Context Learning Ability from In-Context Uncertainty Quantification [7.9] 条件付き期待値 $mathbbE[Y|X]$ と条件付き分散 Var$(Y|X)$ の両方を予測する双目的予測タスクを考える。
理論的には、トレーニングされたトランスフォーマーがベイズ最適付近に到達し、トレーニング分布の情報の利用が示唆される。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:08:55 GMT)
A Case Study of LLM for Automated Vulnerability Repair: Assessing Impact of Reasoning and Patch Validation Feedback [7.7] 提案するVRpilotは,推論とパッチ検証フィードバックに基づく脆弱性修復手法である。
以上の結果から,VRpilotはCとJavaのベースライン技術よりも平均14%と7.6%の正確なパッチを生成することがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:29:48 GMT)
Inverse Feasibility in Over-the-Air Federated Learning [7.6] 線形フォワードモデルに対する逆実現可能性の概念をOTA FLアルゴリズムの強化ツールとして導入する。
この定義を用いて既存のOTA FLモデルを解析し、改善すべき領域を特定し、新しいOTA FLモデルを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:29:46 GMT)
MonoDETRNext: Next-generation Accurate and Efficient Monocular 3D Object Detection Method [7.6] 2次元検出と深さ推定の成功戦略に基づいて,MonoDETRNextを提案する。
提案手法は,効率的なハイブリッドビジュアルエンコーダの開発,深度予測機構の強化,革新的なクエリ生成戦略の導入を含む。
既存のソリューションに対して,モデルの性能を徹底的に評価した。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:22:55 GMT)
Soft Robust MDPs and Risk-Sensitive MDPs: Equivalence, Policy Gradient, and Sample Complexity [7.6] 本稿では,リスクに敏感なMDPの新たな定式化について紹介し,従来のマルコフリスク尺度と若干異なる方法でリスクを評価する。
両問題に対してポリシー勾配定理を導出し、厳密なポリシー勾配法の勾配支配と大域収束を証明した。
また、サンプルベースのオフライン学習アルゴリズム、すなわちロバスト適応Z反復(RFZI)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:51:18 GMT)
Towards Client Driven Federated Learning [7.5] 私たちは、クライアントを駆動する新しいFLフレームワークであるクライアント駆動フェデレートラーニング(CDFL:Client-Driven Federated Learning)を紹介します。
CDFLでは、各クライアントは、ローカルにトレーニングされたモデルをサーバにアップロードし、ローカルタスクに合わせてカスタマイズされたモデルを受け取ることで、独立して非同期にモデルを更新する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:17:49 GMT)
NeB-SLAM: Neural Blocks-based Salable RGB-D SLAM for Unknown Scenes [7.5] NeB-SLAMは、未知のシーンのためのニューラルネットワークブロックベースのスケーラブルなRGB-D SLAMである。
まず,未知のシーン全体をサブマップの集合として表現する分割・コンカレントマッピング戦略を提案する。
次に,カメラトラッキング時のニューラルブロックのアダプティブアロケーションを実現するために,適応的なマップ成長戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:11:45 GMT)
Mosaic Memory: Fuzzy Duplication in Copyright Traps for Large Language Models [7.4] 著作権トラップはオリジナルコンテンツに注入されることが提案されており、新たにリリースされたLCMのコンテンツ検出性が改善されている。
Trapsはユニークなテキストシーケンスの正確な重複に依存しており、一般的にデプロイされるデータ重複のテクニックに弱いままである。
本稿では,複製間のわずかな変更を特徴とするファジィ著作権トラップの生成を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:05:05 GMT)
Maximum diffusion reinforcement learning [7.3] 相関は機械学習に根本的な課題を生み出す。
エージェントのシーケンシャルな経験からデータが直接収集される強化学習では、この仮定の違反は避けられないことが多い。
エージェントエクスペリエンスを関連付けることで、継続的デプロイメントにおけるシングルショット学習を確実に実現します。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:49:00 GMT)
Knowledge-enhanced Relation Graph and Task Sampling for Few-shot Molecular Property Prediction [7.3] 本稿では,新しいメタラーニングFSMPPフレームワーク(KRGTS)を提案する。
KRGTSは知識強化リレーショナルグラフモジュールとタスクサンプリングモジュールで構成される。
経験的に、5つのデータセットに対する広範な実験は、さまざまな最先端手法よりもKRGTSの方が優れていることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:31:19 GMT)
A rationale from frequency perspective for grokking in training neural network [7.3] グロキング(Grokking)は、ニューラルネットワークNNがトレーニングデータに最初に適合し、後にトレーニング中にテストデータに一般化する現象である。
本稿では,NNにおけるこの現象の出現を説明するための周波数視点を実証的に提示する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:57:23 GMT)
An analysis of the noise schedule for score-based generative models [7.2] 対象分布と推定分布とのKL分散の上限を確立する。
We provide a tighter error bound in Wasserstein distance than the state-of-the-art results。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:44:50 GMT)
Text Generation: A Systematic Literature Review of Tasks, Evaluation, and Challenges [7.1] このレビューでは、テキスト生成の作業を5つの主要なタスクに分類する。
各タスクについて、関連する特徴、サブタスク、および特定の課題についてレビューする。
近年のテキスト生成論文では,タスクやサブタスクに共通する9つの顕著な課題が報告されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:38:11 GMT)
Free Performance Gain from Mixing Multiple Partially Labeled Samples in Multi-label Image Classification [7.1] マルチラベル画像分類データセットは、多くのラベルが欠落している場所で部分的にラベル付けされることが多い。
このような部分ラベル付きデータセット用に設計されたミックスアップ変種であるLogicMixを提案する。
LogicMixは、未知のラベルを正しく混合できるように、サンプルラベルを論理ORで混合する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:05:09 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0] アウト・オブ・ディストリビューション(OOD)検出は、AIの安全なデプロイに不可欠である。
ニューラル・コラプス(Neural Collapse)に触発されて、OOD試料の特徴と比較して重量ベクトルに近づいた分布内分布(ID)サンプルの特徴が明らかになった。
我々は,OOD検出における重みベクトルへの特徴近接を利用して,OODサンプルをフィルタする特徴ノルムを用いて,この視点を補うことを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:30:30 GMT)
Data-driven Semi-supervised Machine Learning with Surrogate Safety Measures for Abnormal Driving Behavior Detection [7.0] 本研究では,いくつかの異常運転行動を明らかにする大規模実世界のデータを分析した。
部分ラベル付きデータを用いた半教師付き機械学習(ML)法を開発し,異常運転行動を正確に検出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:16:46 GMT)
Comparing remote sensing-based forest biomass mapping approaches using new forest inventory plots in contrasting forests in northeastern and southwestern China [6.9] 大規模高空間分解能地上バイオマス(AGB)マップは、森林炭素ストックの決定と変化の過程において重要な役割を担っている。
GEDIは、散布された足跡を収集するサンプリング装置であり、そのデータは他の連続カバー衛星のデータと組み合わせて高解像度の地図を作成する必要がある。
GEDI L2Aデータから森林AGBを推定するローカルモデルを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:10:58 GMT)
Explainable AI Enhances Glaucoma Referrals, Yet the Human-AI Team Still Falls Short of the AI Alone [6.7] 各種のAI説明は、提供者が即時または緊急の専門紹介を必要とする患者を区別するのにどのように役立つかを検討する。
我々は、高リスク患者を特定するためのプロキシとして、通常のアイケアデータから緑内障手術のニーズを予測するための説明可能なAIアルゴリズムを構築した。
本研究は,本質的・ポストホックな説明性を取り入れ,ヒト-AIチームのパフォーマンスを評価するために,眼科医とオンライン研究を行った。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:01:20 GMT)
LLS: Local Learning Rule for Deep Neural Networks Inspired by Neural Activity Synchronization [6.7] 従来のバックプロパゲーション(BP)を用いたディープニューラルネットワーク(DNN)のトレーニングは、計算複雑性とエネルギー消費の観点からの課題を提示している。
脳内で観察される神経活動同期現象(LLS)にインスパイアされた新しい局所学習規則を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:24:24 GMT)
Coordinated Multi-Neighborhood Learning on a Directed Acyclic Graph [6.7] 因果非巡回グラフ(DAG)の構造を学習することは、機械学習や人工知能の多くの分野で有用である。
強い、しばしば制限的な仮定なしに優れた経験的、理論的結果を得ることは困難である。
本論文では,複数のユーザ特定ターゲットノードの周囲の局所構造を推定する制約に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:49:43 GMT)
Federated Behavioural Planes: Explaining the Evolution of Client Behaviour in Federated Learning [6.6] FLシステムの力学を解析・可視化・説明するための新しい手法であるFBP(Federated Behavioural Planes)を紹介する。
我々の実験は、FBPがクライアントの進化状態を記述した情報トラジェクトリを提供することを示した。
我々は、悪意のあるクライアントモデルやノイズの多いクライアントモデルを検出するために、Federated Behavioural Shieldsという名前のロバストアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:17:51 GMT)
Log-Concave Sampling on Compact Supports: A Versatile Proximal Framework [6.6] 本稿では,凸およびコンパクトな支持体上に定義された強対数凹分布のサンプリングについて検討する。
本稿では,制約セットへの射影を包含する一般近位フレームワークを提案する。
本分析は,制約サンプリングの文脈におけるLangevin型サンプリングアルゴリズムに着目した。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:24:21 GMT)
The Impact of Geometric Complexity on Neural Collapse in Transfer Learning [6.6] 損失面の平坦さと神経崩壊は、最近、有用な事前学習指標として現れている。
実験と理論を通じて、事前学習されたネットワークの幾何学的複雑さに影響を与えるメカニズムが神経崩壊に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:52:09 GMT)
Marvelous Agglutinative Language Effect on Cross Lingual Transfer Learning [6.4] 類似言語構造を持つ言語を使用することは,言語間移動学習に有効であることが知られている。
韓国語などの凝集言語の使用は、言語間移動学習においてより効果的であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:13:18 GMT)
Lost in the Averages: A New Specific Setup to Evaluate Membership Inference Attacks Against Machine Learning Models [6.3] メンバーシップ推論攻撃(MIAs)は、機械学習(ML)モデルの妥当性を評価するために使用され、個々のレコードを記憶する。
MLモデルに対するMIAの評価設定を新たに提案する。
現在設定されているリスク見積は、多くのレコードが低いリスクとして誤って分類されていることを示しています。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:37:38 GMT)
Uncovering cognitive taskonomy through transfer learning in masked autoencoder-based fMRI reconstruction [6.3] 機能的磁気共鳴画像(fMRI)データを再構成するために,マスク付きオートエンコーダ(MAE)モデルを用いる。
本研究は,maEモデルを用いたfMRI再構成により,潜在表現の発見が可能であることを示唆する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:29:16 GMT)
DEBATE: Devil's Advocate-Based Assessment and Text Evaluation [6.3] マルチエージェントスコアリングシステムに基づくNLG評価フレームワークであるDEBATEを提案する。
フレームワーク内では、あるエージェントが他のエージェントの議論を批判するように指示される。
エージェント間の議論の広範囲性とエージェントのペルソナが評価者のパフォーマンスに影響を及ぼすことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:06:41 GMT)
Governing the Commons: Code Ownership and Code-Clones in Large-Scale Software Development [6.2] 弱いオーナシップや集合的なオーナシップを採用するソフトウェア開発組織では,さまざまなチームがさまざまなコンポーネントの変更を自律的に実施することが期待される。
私たちの目標は、異なるチームが異なるコンポーネントを変更するときに、コードのクローンという形で技術的負債を導入する方法と理由を理解することです。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:23:51 GMT)
Pipeline Parallelism with Controllable Memory [6.1] 既存のパイプラインスケジュールのほとんどすべてが、私たちの知る限り、メモリ非効率であることを示しています。
制御可能なアクティベーションメモリを備えたメモリ効率の高いビルディングブロック群を導入し,最大アクティベーションメモリを1F1Bの1/2に削減する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:54:36 GMT)
OMNI-EPIC: Open-endedness via Models of human Notions of Interestingness with Environments Programmed in Code [6.1] オープンエンドおよびAI生成アルゴリズムは、ますます複雑なタスクを無期限に生成し、解決することを目的としている。
この壮大なビジョンを達成するためには、学習は潜在的なタスクの膨大な範囲内で行われなければならない。
OMNI-EPICという新しいフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:57:32 GMT)
Medformer: A Multi-Granularity Patching Transformer for Medical Time-Series Classification [6.0] 医用時系列分類に特化した多粒度パッチ変換器であるMedformerを紹介する。
本手法は,医療時系列の特徴を生かした3つの新しいメカニズムを取り入れたものである。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:51:10 GMT)
Two-Timescale Critic-Actor for Average Reward MDPs with Function Approximation [5.9] 本稿では,長期平均報酬設定における関数近似を用いた最初の2段階の批評家・アクターアルゴリズムを提案する。
我々の分析の特筆すべき特徴は、最近のシングルタイムスケールアクター批判アルゴリズムとは異なり、我々のスキームの完全な収束解析を提示することである。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:57:17 GMT)
BrainMorph: A Foundational Keypoint Model for Robust and Flexible Brain MRI Registration [5.9] 本稿では,最近提案されたKeyMorphフレームワークに基づく汎用脳MRI登録のためのキーポイントベース基礎モデルを提案する。
BrainMorphと呼ばれる私たちのモデルは、マルチモーダル、ペアワイド、スケーラブルなグループワイド登録をサポートするツールとして機能します。
BrainMorphは、頭蓋骨と非頭蓋骨の巨大なデータセットで訓練されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:02:33 GMT)
Generating Code World Models with Large Language Models Guided by Monte Carlo Tree Search [5.9] 我々は,大規模言語モデル(LLM)が生成する世界モデルであるコードワールドモデルを,モデルベース強化学習(RL)のためのPythonコード形式として検討する。
LLMではなくコードを呼び出すことは、正確で信頼性があり、解釈可能で、非常に効率的であるという利点があります。
LLMの新しいコード生成戦略であるモンテカルロ木探索法(GIF-MCTS)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:31:26 GMT)
Physiological Data: Challenges for Privacy and Ethics [5.8] 現在利用可能な技術がどのように悪用されるかを特定します。
生理的データを非生理的データと組み合わせることで、生理的ウェアラブルの予測能力を根本的に拡張する方法について論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:59:42 GMT)
Learning about Data, Algorithms, and Algorithmic Justice on TikTok in Personally Meaningful Ways [5.8] 我々は、TikTokと関わり合う際に、若者が個々に意味のある方法でどのように学習するかについて異なる視点を提示する。
このアプリケーションは若者が相互に接続するためのグローバルな空間になっている。
我々は、TikTokがどのように機能するかを若者がどのように調査し、倫理とアルゴリズムの正義の問題を考慮し、プラットフォームに対する理解を利用して変化を提唱するかについて議論する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:07:48 GMT)
A hierarchical Bayesian model for syntactic priming [5.8] シナティックプライミングの効果は、よく文書化された3つの経験的性質を示す。
本稿では,これら3つの現象を一般学習の枠組みで再現する方法について述べる。
また,構文プライミングの語彙的基礎に対するモデルの影響についても論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:26:53 GMT)
Athena: Efficient Block-Wise Post-Training Quantization for Large Language Models Using Second-Order Matrix Derivative Information [5.8] 大規模言語モデル(LLM)は、機械翻訳、テキスト生成、感情分析などの高度な自然言語処理タスクを持つ。
数十億のパラメータで構成されるその大きなサイズは、ストレージ、計算、デプロイメントの課題を提起する。
我々は,LLMの効率的なブロックワイズ後量子化のための新しいアルゴリズムであるAthenaを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:14:29 GMT)
Deep Activity Model: A Generative Approach for Human Mobility Pattern Synthesis [5.7] 我々は,ユビキタスおよびオープンソースデータを用いて,人間の移動性モデリングと合成のための新しい生成的深層学習手法を開発した。
このモデルは、アメリカ合衆国全国のデータセットで評価され、そこでは、基底の真理分布に密接に従う活動連鎖の生成において、優れた性能を示す。
この革新的なアプローチは、特に下流のアクティビティに基づくモビリティ・シミュレーションモデルの入力として人間のアクティビティ・チェーンの生成において、モビリティ・モデリング研究を前進させる大きな可能性を秘めている。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:04:10 GMT)
Semantic Aware Diffusion Inverse Tone Mapping [5.7] 逆トーンマッピングによる高ダイナミックレンジ(HDR)へのキャプチャー標準ダイナミックレンジ(SDR)画像のアップの試み
本稿では,SDR画像をHDRにマッピングする新たな逆トーンマッピング手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:44:22 GMT)
Faster and Better Quantum Software Testing through Specification Reduction and Projective Measurements [5.7] 制限を克服するために、量子プログラム仕様に還元アルゴリズムを適用する。
平均テストランタイムは169.9sから11.8sに改善され、大きな回路深度を持つプログラムに顕著な改善が加えられた。
提案手法は, 突然変異率を54.5%から74.7%に引き上げ, 位相フリップ欠陥を効果的に検出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:26:18 GMT)
Filtered Corpus Training (FiCT) Shows that Language Models can Generalize from Indirect Evidence [5.6] 本稿では,特定の言語構造をフィルタリングしてコーパス上で言語モデル(LM)を訓練するフィルタコーパストレーニングを紹介する。
本手法をLSTMとTransformer LMの両方に適用し,幅広い言語現象を対象とするフィルタコーパスを開発した。
以上の結果から,トランスフォーマーは(パープレキシティによって測定されるように)準LMよりも優れているが,両モデルとも言語一般化対策において等しく,驚くほどよく機能することがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:47:20 GMT)
Scaling Laws for Discriminative Classification in Large Language Models [5.6] 言語モデリングタスクを識別的分類タスクとして再定義することで、LLMを使用して顧客サポートの支持者を増強できるシステムを提案する。
オフラインとオンラインの両方の実験の結果を提示し,実験システムのオフラインゲインと統計的に有意なオンラインリフトを観測した。
モデルのサイズ、レイテンシ、正確性に関するトレードオフの空間について議論し、将来的なアプリケーションを提案することで、私たちは締めくくっています。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:58:38 GMT)
What is a Goldilocks Face Verification Test Set? [5.5] 顔認識モデルは一般的に、数百万の画像を含むWebスクラッドデータセットで訓練される。
ウェブスクラッド画像から収集された列車とテストセットの両方により、列車とテストセット間の不整合性の集合を保証することが重要である。
現在の列車とテストセットは、一般的にアイデンティティやイメージの不一致ではなく、その結果、推定精度に楽観的なバイアスが生じることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:27:10 GMT)
Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Models [5.4] Go-Exploreは、ハード探索問題を解決するために設計されたアルゴリズムの強力なファミリーである。
本稿では,従来の Go-Explore の範囲を大きく広げる Intelligent Go-Explore (IGE) を提案する。
IGEには人間のような能力があり、新しい状態がいかに面白く、あるいは有望であるかを直感的に識別する能力がある。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:45:27 GMT)
VerMCTS: Synthesizing Multi-Step Programs using a Verifier, a Large Language Model, and Tree Search [5.4] 大型言語モデル(LLM)は有用なコードを生成することができるが、しばしばそれらが生成するコードは信頼できない。
本稿では,Dafny と Coq で検証プログラムを生成することで,この問題を解決するための VerMCTS を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:51:14 GMT)
A Carbon Tracking Model for Federated Learning: Impact of Quantization and Sparsification [5.3] フェデレートラーニング(FL)手法は効率的なコミュニケーション技術を採用し、エッジデバイスに機械学習タスクを分散させる。
本稿では,FLシステムのエネルギーおよび炭素フットプリントへの影響をリアルタイムにモニタリングするためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:58:55 GMT)
Reducing the cost of posterior sampling in linear inverse problems via task-dependent score learning [5.3] 前方マッピングの評価は, 後部サンプル生成時に完全に回避可能であることを示す。
この観測は、最近導入された無限次元拡散モデルの枠組みに一般化されることを証明している。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:33:27 GMT)
On the Weight Dynamics of Deep Normalized Networks [5.3] ディープニューラルネットワークの層間の効果的な学習率(ELR)の相違は、トレーニング容易性に悪影響を及ぼす可能性がある。
正規化層を持つネットワークの重み力学をモデル化することにより、これらの相違が時間とともにどのように進化するかを定式化する。
一定の学習率のトレーニングでは,初期勾配の爆発にもかかわらず,ELR比が1に収束することが証明された。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:12:25 GMT)
GPTZoo: A Large-scale Dataset of GPTs for the Research Community [5.2] GPTZooは730,420のGPTインスタンスからなる大規模データセットである。
それぞれのインスタンスには、その特性を記述した21の属性と、開発中に使用される命令、ナレッジファイル、サードパーティサービスを含む豊富なメタデータが含まれている。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:17:03 GMT)
Rethinking Class-Incremental Learning from a Dynamic Imbalanced Learning Perspective [5.2] ディープニューラルネットワークは、新しい概念を継続的に学習するとき、破滅的な忘れ込みに悩まされる。
我々は、古いタスクと新しいタスクデータの不均衡が、古いタスクを忘れるのに寄与すると主張している。
本稿では,一様かつコンパクトな特徴を学習するUPCL(Uniform Prototype Contrastive Learning)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:26:37 GMT)
CLIP model is an Efficient Online Lifelong Learner [5.2] Contrastive Language-Image Pretraining (CLIP)のような視覚言語モデルは、オンライン生涯学習に適した候補である。
我々は、画像とテキストの対称性を維持するために、Symmetric Image-Text(SIT)チューニング戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:21:49 GMT)
MeteoRA: Multiple-tasks Embedded LoRA for Large Language Models [5.0] 大規模言語モデル(LLM)用に設計されたスケーラブルなマルチ知識LoRA融合フレームワークであるMeteoRAを紹介する。
MeteoRAは様々なLoRAアダプタをMixture-of-Experts (MoE)スタイルのベースLLMに統合し、モデルがタスク入力に基づいて関連するアダプタを自動的に選択できるようにする。
LlaMA2-13B と LlaMA3-8B ベースモデルに既製の 28 個の LoRA アダプタを MeteoRA 経由で搭載し,各アダプタと同等の性能を示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:38:54 GMT)
Learning from True-False Labels via Multi-modal Prompt Retrieving [4.9] 本稿では,視覚言語モデル(VLM)によって生成される場合の高精度化を実現するために,TFL(True-False Labels)という,弱教師付きラベル設定を提案する。
理論的には、TFLの条件付き確率分布情報を探索し、利用するためのリスク一貫性推定器を導出する。
実験の結果,提案したTFL設定法とMPP学習法の有効性が示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:39:15 GMT)
Airship Formations for Animal Motion Capture and Behavior Analysis [4.9] 複数の角度から野生の馬を追跡し、追跡し、視覚的に記録するために、飛行船の形成を使用するように設計されたシステムを紹介します。
本研究では,複数の角度から野生の馬を追跡し,追跡し,視覚的に記録するための飛行船形成システムを紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:59:48 GMT)
DeepLight: Reconstructing High-Resolution Observations of Nighttime Light With Multi-Modal Remote Sensing Data [4.9] 夜間光(NTL)リモートセンシング観測は、一連の持続可能な開発目標を達成するための進捗を定量的に評価するためのユニークなプロキシとして機能する。
本研究では,マルチモーダルリモートセンシングデータを用いた高解像度NTL画像の再構成手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:06:42 GMT)
Transfer of Safety Controllers Through Learning Deep Inverse Dynamics Model [4.8] 制御障壁証明書は、制御システムの安全性を正式に保証する上で有効であることが証明されている。
制御障壁証明書の設計は、時間がかかり、計算に費用がかかる作業である。
本稿では,制御器の正当性を保証する妥当性条件を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:29:48 GMT)
MUCM-Net: A Mamba Powered UCM-Net for Skin Lesion Segmentation [4.8] 皮膚病変のセグメンテーションは早期皮膚がん検出の鍵となる。
CNNやU-Netといったディープラーニング手法は、これらの問題に対処する上で有望であることを示している。
本稿では,Mamba State-Space ModelsとUCM-Netアーキテクチャを組み合わせたMUCM-Netを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:33:59 GMT)
Fast, accurate training and sampling of Restricted Boltzmann Machines [4.8] 本稿では,データセットの主方向を低ランクRBMに統合する革新的な手法を提案する。
このアプローチは静的モンテカルロ過程による平衡測度の効率的なサンプリングを可能にする。
この戦略は,従来の手法が失敗するデータセットにおけるデータの多様性をフルに捉えるために,RAMのトレーニングに成功していることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:23:43 GMT)
Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rate [4.7] リカレント強化学習(RL)は、観測不能な状態予測のためのリカレントニューラルネットワーク(RNN)に基づくコンテキストエンコーダである。
従来のRL法は、RNNの勾配不安定性に起因する訓練安定性の問題に直面していた。
本稿では,この問題を解決するために,コンテキストエンコーダ特化学習率(RESeL)を用いたリカレントオフ政治RLを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:33:47 GMT)
Mitigating scattering in a quantum system using only an integrating sphere [4.6] 量子系では、散乱はデコヒーレンスと損失の両方に寄与する。
本稿では,散乱の悪影響を著しく軽減できる実験手法を提案する。
我々の手法は、破壊的ランダムプロセスから量子相関を回復するための先駆的なステップである。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:26:56 GMT)
Characterizing MPS and PEPS Preparable via Measurement and Feedback [4.5] 長距離の絡み合った状態は、短期量子デバイスに重大な課題をもたらす。
測定とフィードバック(MF)は、一定の回路深度しか持たない特定のパラダイム的長距離絡み合った状態の調製を可能にすることで、この課題を支援することが知られている。
我々は,MFを用いて調製できるマトリックス生成状態 (MPS) とプロジェクテッド絡み合ったペア状態 (PEPS) の構造を詳述する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:14:17 GMT)
Nearly-Optimal Consensus Tolerating Adaptive Omissions: Why is a Lot of Randomness Needed? [4.5] 同期分散システムにおいて,通信リンクから障害当事者への通信がメッセージの送信を省略できる場合,$n$の自律的パーティによる合意に達するという問題について検討する。
我々は、$O(sqrtnlog2 n)$ラウンドで動作し、$O(n2log3 n)$通信ビットを送信するランダム化アルゴリズムを設計する。
MCアルゴリズムが$O(R)$呼び出しを使用する場合、$Omega(fracn2maxR,nlog n)$ラウンドで動作しないことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:59:32 GMT)
Transfer Learning with Informative Priors: Simple Baselines Better than Previously Reported [4.5] 転送学習と5つのデータセットにまたがるソースタスクの事前情報とを比較検討する。
クラス毎の5-300例のシナリオでは、2つのデータセットに対して負あるいは無視的なゲイン、他の2つのデータセットでは控えめなゲイン、ひとつのデータセットでは実質的なゲインが見られます。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:12:23 GMT)
Taming Score-Based Diffusion Priors for Infinite-Dimensional Nonlinear Inverse Problems [4.4] 本研究では,関数空間におけるベイズ逆問題の解法を提案する。
可能性の対数共空性は仮定せず、非線型逆問題と互換性がある。
従来の正規化法で確立された固定点法に着想を得た新しい収束解析を行う。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:17:01 GMT)
Score-based generative models are provably robust: an uncertainty quantification perspective [4.4] 本研究では,スコアベース生成モデル (SGM) が実運用において複数の誤差源に対して確実に堅牢であることを示す。
我々の主要なツールは、ワッサーシュタイン不確実性伝播(WUP)定理である。
a) 有限サンプル近似による誤差, (b) 早期停止, (c) スコアマッチング対象選択, (d) スコア関数パラメトリゼーション, (e) 基準分布選択が生成モデルの品質に与える影響を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:50:17 GMT)
Decaf: Data Distribution Decompose Attack against Federated Learning [4.4] FLにおけるデータ分散分解攻撃(Data Distribution Decompose Attack on FL)という,革新的なプライバシの脅威を考案しています。
Decafはひそかに運営しており、データ配信のプライバシーの侵害に関して、完全に受動的で、被害者のユーザーには検出できない。
結果から,IID,非IIDのいずれであっても,ローカルなデータ分散を正確に分解できることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:56:32 GMT)
On the Hyperparameter Loss Landscapes of Machine Learning Models: An Exploratory Study [4.3] 我々は、6つの代表MLモデルの1500HP損失ランドスケープを、異なる忠実度レベルの63データセット上で探索分析する。
我々は、様々なモデル、データセット、忠実度にまたがる同様の地形地形を観察し、HPOにおけるいくつかの中心的なトピックに光を当てた。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:08:51 GMT)
SMART: Scalable Multi-agent Real-time Simulation via Next-token Prediction [4.3] 本稿では,ベクトル化された地図とエージェント軌跡データを離散的なシーケンストークンにモデル化する,新しい自律走行運動生成パラダイムを提案する。
これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、次のトークン予測タスクをトレーニングする。
複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証しました。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:17:35 GMT)
ETTrack: Enhanced Temporal Motion Predictor for Multi-Object Tracking [4.3] 時間的動き予測器であるETTrackを用いた動きに基づくMOT手法を提案する。
具体的には、動作予測器は、変換器モデルと時間畳み込みネットワーク(TCN)を統合して、短期および長期の動作パターンをキャプチャする。
本研究では,DanceTrackとSportsMOTの最先端トラッカーと比較して,ETTrackの競争性能が向上していることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:51:33 GMT)
Orchid: Flexible and Data-Dependent Convolution for Sequence Modeling [4.2] 本稿では,従来の注意機構の2次複雑さに対処する新しいアーキテクチャであるOrchidを紹介する。
このアーキテクチャのコアには、新しいデータ依存のグローバル畳み込み層があり、入力シーケンスに条件付きカーネルを文脈的に適応させる。
言語モデリングや画像分類など,複数の領域にまたがるモデルの評価を行い,その性能と汎用性を強調した。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:51:52 GMT)
Encoder Embedding for General Graph and Node Classification [4.2] エンコーダの埋め込み行列が大数の法則と中心極限定理を満たすことを証明している。
ある条件下では、クラスごとの正規性を達成し、識別分析による最適な分類を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:51:08 GMT)
Are You Copying My Prompt? Protecting the Copyright of Vision Prompt for VPaaS via Watermark [4.1] Visual Prompt Learning (VPL) は、事前訓練されたモデルパラメータの更新を避けることで、リソース消費を大幅に削減する従来の微調整方法とは異なる。
Visual Prompts as a Service (V)の開発者が登場した。
これらの開発者は、認可された顧客に巧妙なプロンプトを提供することで利益を得る。
しかし、大きな欠点はプロンプトのコピーと再配布が簡単であり、V開発者の知的財産権を脅かすことである。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:31:03 GMT)
Data-Driven Discovery of PDEs via the Adjoint Method [4.0] 本稿では、与えられたデータに基づいて、基礎となる支配的偏微分方程式(PDE)を発見する方法を提案する。
PDEの形式を同定する上で,提案手法の有効性を示す。
また,その性能をPDE-FIND(PDE-FIND)として有名なPDE関数同定法と比較した。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:52:32 GMT)
Information-theoretic Generalization Analysis for Expected Calibration Error [4.0] 本研究は,2つの共通ビンニング戦略,一様質量と一様幅ビンニングにおける推定バイアスの最初の包括的解析である。
私たちの境界は、推定バイアスを最小限に抑えるために、初めて最適なビンの数を明らかにします。
バイアス分析を情報理論に基づく一般化誤差解析に拡張する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:59:29 GMT)
First-order methods for Stochastic Variational Inequality problems with Function Constraints [3.9] 本稿では,機能制約付き変分不等式(FCVI)問題に対して,スムーズあるいは非スムーズな設定で新しい一階法を提案する。
全てのアルゴリズムは、同じ複雑性を保ちながら、主変数と双変数を結合する関数制約を持つサドル点問題に容易に拡張できる。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:31:22 GMT)
GSDeformer: Direct Cage-based Deformation for 3D Gaussian Splatting [3.9] 本手法は,3次元ガウススティング(2DGS)における自由変形を,構造的変化を伴わずに達成する。
我々は、3DGSを新しいプロキシポイントクラウド表現に変換する。そこでは、3DGSを構成する3Dガウスに変換を推論するためにその変形を利用することができる。
提案手法は3DGSの基盤となるアーキテクチャを変更するものではない。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:16:28 GMT)
Geometry-Complete Diffusion for 3D Molecule Generation and Optimization [3.8] 3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:49:33 GMT)
Inference of Utilities and Time Preference in Sequential Decision-Making [3.8] 本稿では,自動投資マネージャやロボアドバイザの能力を高めるための新しい制御フレームワークを提案する。
本稿では,各クライアントのリスク許容度,日々の消費評価,重要な生活目標に合わせた,実用機能と時間変化率の一般的な割引スキームを組み込んだ連続時間モデルを提案する。
提案する枠組みは、個別の投資アドバイスを改善することで金融技術の進歩だけでなく、医療、経済学、人工知能など他の分野にも広く貢献する。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:13:56 GMT)
Kronecker-Factored Approximate Curvature for Physics-Informed Neural Networks [3.7] PINN損失に対するKronecker-factored almost curvature (KFAC)を提案する。
我々のKFACベースの勾配は、小さな問題に対する高価な2階法と競合し、高次元のニューラルネットワークやPDEに好適にスケールし、一階法やLBFGSを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:36:02 GMT)
MagicBathyNet: A Multimodal Remote Sensing Dataset for Bathymetry Prediction and Pixel-based Classification in Shallow Waters [3.7] MagicBathyNetはSentinel2、SPOT-6、空中画像、海底クラスのフォーマットとアノテーションからなるベンチマークデータセットである。
その後、学習ベースの浴量測定とピクセルベースの分類において最先端の手法をベンチマークするために利用される。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:58:02 GMT)
Self-Contrastive Weakly Supervised Learning Framework for Prognostic Prediction Using Whole Slide Images [3.6] 予測は、基底の真理ラベルが本質的に弱いため、独特な挑戦となる。
そこで本研究では, ネットワークを用いた組織分割アルゴリズムを用いて, 関心領域の抽出を行う新しい3部フレームワークを提案する。
AUCは再発率0.721, 再発率0.678, 治療成績予測は0.678であった。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:45:36 GMT)
SpotNet: An Image Centric, Lidar Anchored Approach To Long Range Perception [3.6] SpotNetは高速で単一ステージのイメージ中心だが、長距離3Dオブジェクト検出のためのLiDARアンロックアプローチである。
我々は,LiDAR/画像センサフュージョンへのアプローチと2次元および3次元検出タスクの連成学習が組み合わさって,LiDARの精度が低い3次元物体検出に繋がることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:25:48 GMT)
Scaling up the Banded Matrix Factorization Mechanism for Differentially Private ML [3.6] DP-BandMFのリーチを大幅に拡張し,106ドル以上のトレーニングイテレーションで使用可能にする手法を提案する。
拡張実装は、広範な実験と合わせて、最適なバンド数を選択するための明確なガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:19:15 GMT)
Pattern-Based Time-Series Risk Scoring for Anomaly Detection and Alert Filtering -- A Predictive Maintenance Case Study [3.5] 本稿では,逐次パターンの類似性に基づいて,異常検出と警告フィルタリングを高速かつ効率的に行う手法を提案する。
本稿では, 大規模産業システムにおける異常検出を含む様々な目的で, このアプローチをどのように活用するかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:27:45 GMT)
CowScreeningDB: A public benchmark dataset for lameness detection in dairy cows [3.5] このデータセットは、スペインのグラン・カナリアにある乳園で43頭の牛から得られた。
乳牛の日常のルーチン中にApple Watch 6を使って収集されたデータに基づいて構築されたマルチセンサーデータセットで構成されている。
データセットの公開共有とは別に、私たちは、生の感覚データを用いて、正常でラメのソーを分類する機械学習手法も共有しています。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:36:00 GMT)
Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model [3.4] ISA-HOIはCLIPからの知識を広範囲に活用し,視覚的特徴とテキスト的特徴の対話的意味論を整合させる。
本手法は, HICO-DETとV-COCOのベンチマークにおいて, トレーニングエポックがはるかに少なく, ゼロショット環境下での最先端性能を向上する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:46:39 GMT)
Align as Ideal: Cross-Modal Alignment Binding for Federated Medical Vision-Language Pre-training [3.2] 視覚言語による事前訓練には大規模なマルチモーダルデータが必要であるため、特に医学的応用において障害となる。
We propose a Federated Align as IDeal (FedAID) framework to bind local client with an ideal crossmodal alignment。
実世界のデータセットを用いた実験では,効率的なフェデレーション型マルチモーダル学習の促進に成功している。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:08:38 GMT)
Analysis of Marketed versus Not-marketed Mobile App Releases [3.1] メジャーリリース、マイナーリリース、パッチリリースはリリースサイクルの期間、性質、変更速度に大きな違いがある。
マーケット化されたモバイルアプリと非マーケットのモバイルアプリには、サイクル期間、性質、変更の程度で大きな違いがある。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:48:49 GMT)
Toward TransfORmers: Revolutionizing the Solution of Mixed Integer Programs with Transformers [3.1] 混合整数プログラムの課題に対処するためにトランスフォーマーモデルを用いた革新的なディープラーニングフレームワークを導入する。
提案手法は,MIP問題のバイナリ変数の予測にトランスフォーマーを用いた最初の手法である。
本稿では,変圧器ニューラルネットワークを用いてCLSPソリューションを学習する効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:17:43 GMT)
Estimating Physical Information Consistency of Channel Data Augmentation for Remote Sensing Images [3.1] 本稿では,チャネル拡張手法がRS画像の物理情報に影響を及ぼすかどうかを推定する手法を提案する。
物理一貫性を評価するために,オリジナルおよび拡張ピクセルシグネチャに関連するスコアを比較した。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:14:37 GMT)
An Evaluation of Estimative Uncertainty in Large Language Models [3.0] 推定の不確実性は長い間、CIAなどの諜報機関を含む研究領域であった。
本研究は,一般用大言語モデル(LLM)における推定の不確かさを,人間と相互に比較した。
GPT-3.5 や GPT-4 のような LLM は人間の推定値と一致している。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:39:31 GMT)
PDE Control Gym: A Benchmark for Data-Driven Boundary Control of Partial Differential Equations [3.0] PDEのバウンダリ制御のための学習環境を初めて提示する。
本稿では,この一連のベンチマーク問題を解決するためのモデルフリー強化学習アルゴリズムについて紹介する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:40:41 GMT)
Sparse maximal update parameterization: A holistic approach to sparse training dynamics [2.9] 疎密で高密度なネットワークが、同じ最適なHPを共有していないことを示す。
S$mu$Parは、アクティベーション、グラデーション、およびウェイト更新を全てのスケールが、スパーシティレベルとは無関係に保証する。
大規模言語モデリングでは、S$mu$Parトレーニングは、高密度モデル標準パラメータ化を用いる一般的なアプローチに比べて、損失を最大8.2%改善する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:39:26 GMT)
Privacy-preserving recommender system using the data collaboration analysis for distributed datasets [2.9] 分散データセットのデータコラボレーション分析を用いて,プライバシ保護リコメンデータシステムのためのフレームワークを構築した。
2つのパブリックレーティングデータセットを用いた数値実験により、評価予測のためのプライバシ保護手法が分散データセットの予測精度を向上させることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:43:00 GMT)
Testing Multi-Subroutine Quantum Programs: From Unit Testing to Integration Testing [2.9] 本稿では,マルチサブルーチン量子プログラムの特定のテスト要件について述べる。
テストプロセスの観点から、テスト基準とテクニックに重点を置いています。
我々は、様々な変異体やランダムな入力を含む、典型的な量子サブルーチンの包括的なテストを行う。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:04:09 GMT)
Equivalence, Identity, and Unitarity Checking in Black-Box Testing of Quantum Programs [2.9] 量子プログラムは本質的に非決定的な振る舞いを示し、古典的プログラムと比較してエラー発見に重大な課題をもたらす。
量子プログラムのブラックボックステストにおいて、等価性、アイデンティティ、ユニタリ性チェックの課題に対処するために設計された3つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:53:44 GMT)
FloodDamageCast: Building Flood Damage Nowcasting with Machine Learning and Data Augmentation [2.9] FloodDamageCastは、現在、不動産洪水の被害に対応する機械学習フレームワークである。
このフレームワークは、2017年のハリケーン・ハービーの間、テキサス州ハリス郡で500メートル×500メートルの解像度で住宅の洪水被害を予測するために、異種データを活用している。
洪水被害から回復した洞察は、緊急対応者がより効率的に修理ニーズを特定し、リソースを割り当て、地上での検査を合理化するのに役立つ。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:04:33 GMT)
Spectraformer: A Unified Random Feature Framework for Transformer [2.9] 本稿では,Transformerの線形化におけるカーネル関数の近似と学習のための統合フレームワークであるSpectraformerを紹介する。
実験の結果,従来のSOTAランダム機能であるTransformerよりも23.4%高速なトレーニング時間と25.2%低いメモリ消費の新たな組み合わせが得られた。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:52:53 GMT)
AGS-GNN: Attribute-guided Sampling for Graph Neural Networks [2.8] グラフニューラルネットワーク(GNN)のための新しい属性誘導サンプリングアルゴリズムであるAGS-GNNを提案する。
AGS-GNNはグラフのノードの特徴と接続構造を利用して、グラフのホモフィリーとヘテロフィリーの両方に同時に適応する。
AGS-GNNは、ノード分類のためのグラフ全体を用いて、最も優れたヘテロ親和性GNNに匹敵するテスト精度を達成している。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:15:46 GMT)
Fine-Grained Dynamic Framework for Bias-Variance Joint Optimization on Data Missing Not at Random [2.8] レコメンデーションシステムやディスプレイ広告など、ほとんどの実践的なアプリケーションでは、収集されたデータには欠落する値が含まれることが多い。
我々は,バイアスと分散を協調的に最適化する,体系的なきめ細かな動的学習フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:07:09 GMT)
UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes [2.8] 我々は空間クラスタリングと自己監督型シーンフローを用いて、LiDARから静的および動的オブジェクトの提案セットを得る。
その結果、静的および動的フォアグラウンドオブジェクトが一緒に得られ、既存の検出器は単一のトレーニングで訓練することができる。
我々はnuScenesデータセットに関する広範な実験を行い、教師なしオブジェクト発見、すなわちUNIONの最先端性能を向上させる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:27:05 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [2.7] 量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。
PCSは距離1の符号であり、標準的な量子誤り訂正と検出方法よりも少ないリソースを必要とする。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:56:21 GMT)
More Insight from Being More Focused: Analysis of Clustered Market Apps [2.7] 最近の調査では、主に全アプリのサンプリングが検討されている。
プロプライエタリなソフトウェアやWebベースのサービスと同様に、より均一なサンプルを見ることで、より具体的な結果が期待できる。
本稿では,アプリの同質なサンプルを対象とし,分析から得られる洞察の度合いを高める。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:34:06 GMT)
Models That Prove Their Own Correctness [2.7] 我々は,その出力の正しさを証明する自己証明モデルを,対話的証明を通じて検証アルゴリズムとして$V$で訓練する。
ランダムな入力に対して高い確率で、モデルは正しい出力を出力し、その正しさを$V!$に証明する。
自己証明モデルは出力の大部分の正しさを証明し、*all*不正確な出力(任意のモデルの)は$V$で検出される。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:10:08 GMT)
Neuromorphic dreaming: A pathway to efficient learning in artificial agents [2.7] 本稿では、混合信号アナログ/デジタルニューロモルフィックハードウェア上でのスパイキングニューラルネットワーク(SNN)を用いたモデルベース強化学習(MBRL)のハードウェア実装について述べる。
このアプローチは、高サンプリング効率を実現しつつ、混合信号ニューロモルフィックチップのエネルギー効率を活用する。
我々は、ハードウェア実装をトレーニングして、AtariゲームPongをプレイすることで、モデルを検証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:03:56 GMT)
Isotropy, Clusters, and Classifiers [2.6] 我々は、等方性がクラスタの存在と互換性のない埋め込み空間に要求を課すことを強調する。
我々は、この事実を数学的にも経験的にも証明し、文献の以前の結果に光を当てるために使用します。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:01:39 GMT)
Non-invertible SPT, gauging and symmetry fractionalization [2.5] 我々はRep($Q_8$)双対性Webにおけるすべての対称性の位相の格子モデルを構築する。
これらの相互作用は、2+1dバルクSETの対称性分数化を用いて説明できることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:35:55 GMT)
Source Code Archiving to the Rescue of Reproducible Deployment [2.5] 我々は、GuixとユニバーサルソースコードアーカイブであるSoftware Heritageを接続する作業について述べ、Guixは、安定的なアーカイブによって支援された最初のフリーソフトウェア配布およびツールとなる。
次に,5年以上にわたって収集されたデータによるパッケージソースコードのアーカイブカバレッジについて報告し,残る課題について論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:00:28 GMT)
Adapting PromptORE for Modern History: Information Extraction from Hispanic Monarchy Documents of the XVIth Century [2.5] 本稿では,PmptOREを応用して,特殊文書,すなわちスペイン審問による裁判のデジタル写本から関係を抽出する手法を提案する。
提案手法では,予測を行うデータに対して,事前学習対象を持つトランスフォーマーモデルを微調整する。
その結果,Biased PromptOREモデルでは50%の精度向上が得られた。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:39:47 GMT)
A Systematic Bias of Machine Learning Regression Models and Its Correction: an Application to Imaging-based Brain Age Prediction [2.5] 我々はこの線形中心傾向に反するバイアスを「機械学習回帰の体系的バイアス」と呼ぶ。
このバイアスを補正し,提案手法を実装するための計算効率の良いアルゴリズムを開発するために,一般化された制約付き最適化手法を提案する。
競合する機械学習モデルと比較して、ニューロイメージングに基づく脳年齢計算における「機械学習回帰の体系的バイアス」の長年の問題に効果的に対処する。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:34:16 GMT)
Hierarchical NeuroSymbolic Approach for Comprehensive and Explainable Action Quality Assessment [2.5] 行動品質評価(AQA)は、人間の行動のパフォーマンスや実行を定量的に評価するためにコンピュータビジョンを適用する。
現在のアプローチはエンドツーエンドのニューラルモデルで、透明性が欠如し、主観的な人間の判断を地道として訓練する傾向がある。
本稿では、ニューラルネットワークを用いてビデオデータから解釈可能なシンボルを抽象化し、それらのシンボルに規則を適用することによって品質評価を行う、AQAのためのニューロシンボリックパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:44:11 GMT)
An Approximate Dynamic Programming Framework for Occlusion-Robust Multi-Object Tracking [2.5] 近似動的プログラミングトラック(ADPTrack)というフレームワークを提案する。
これは、ベースと呼ばれる既存のメソッドを改善するために動的プログラミングの原則を適用します。
提案手法は,最先端手法よりも精度が0.7%向上したことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:27:14 GMT)
A Counterfactual Analysis of the Dishonest Casino [2.4] 不名誉なカジノは、教育環境においてHMMとグラフィカルモデルを導入するためによく知られた隠れマルコフモデル(HMM)である。
本稿では,HMMプリミティブの範囲を超えて,カジノの不正行為にどの程度の勝利が寄与するかを考察する。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:26:54 GMT)
Transformer-based Federated Learning for Multi-Label Remote Sensing Image Classification [2.3] 各種クライアントにおける非IIDトレーニングデータに関連する課題に対処するために,最先端のトランスフォーマーアーキテクチャが適用可能であるかを検討する。
トランスフォーマーアーキテクチャは、局所的なトレーニングと集約の複雑さの増大により、能力を高める。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:13:49 GMT)
Model-free reinforcement learning with noisy actions for automated experimental control in optics [2.3] 強化学習(RL)を用いた光ファイバーにレーザー光を結合するための自動実験アライメントについて検討する。
時間を節約するために、私たちは仮想テストベッドを使用して、部分的な可観測性を扱う環境をチューニングします。
実験の完全なトレーニングにより、エージェントは、現在あるノイズを処理するために直接学習する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:36:23 GMT)
A PST Algorithm for FPs Suppression in Two-stage CNN Detection Methods [2.3] 本稿では,歩行者と歩行者以外のサンプルを識別する2段階CNN検出手法の学習を支援するために,歩行者に敏感な学習アルゴリズムを提案する。
提案アルゴリズムの助けを借りて,より小型で高精度なメトロ旅客検出器であるMetroNextの検出精度がさらに向上した。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:26:14 GMT)
Mirage: An RNS-Based Photonic Accelerator for DNN Training [2.3] フォトニックコンピューティングは、ディープニューラルネットワーク(DNN)における重要な演算である、高効率な行列乗算を実現するための魅力的な道である
本稿では、Residue Number System (RNS) を用いたフォトニックハードウェアにおける精度の課題を克服するフォトニックDNNトレーニングアクセラレータであるMirageを提案する。
RNSはモジュラー演算に基づく数値システムであり、複数の低精度なモジュラー演算によって高精度な演算を行うことができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:06:53 GMT)
RFLPA: A Robust Federated Learning Framework against Poisoning Attacks with Secure Aggregation [2.3] フェデレートラーニング(FL)は、複数のデバイスがデータを共有せずに協調的にモデルをトレーニングすることを可能にする。
その利点にもかかわらず、FLはプライバシーの漏洩や中毒攻撃に弱い。
本稿では,SecAggプロトコルに基づくRFLPAに対する堅牢なフェデレート学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:31:10 GMT)
Building BESSER: an open-source low-code platform [2.3] BESSERは、(スマートな)ソフトウェアを開発するためのオープンソースのローコードプラットフォームである。
システム仕様とドメイン仕様に様々な形式(表記法)を提供する。
どちらのタイプのコンポーネントも拡張可能で、コミュニティからのコントリビューションも可能です。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:08:49 GMT)
A Neurosymbolic Framework for Bias Correction in CNNs [2.2] 我々は、訓練されたCNNにおいて、バイアス補正のためのNeSyBiCorと呼ばれるニューロシンボリックフレームワークを導入する。
そこで本研究では,PlacesデータセットのクラスサブセットでトレーニングしたCNNのバイアスの修正に成功した。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:09:53 GMT)
Enhancing Generalized Fetal Brain MRI Segmentation using A Cascade Network with Depth-wise Separable Convolution and Attention Mechanism [2.2] そこで我々は,胎児脳MRIセグメントの精度と一般化を高めるために,CasUNextと呼ばれる新しいカスケードネットワークを提案する。
CasUNextはPhilipsとSiemensの2つのスキャナーから20~36週間の胎児MRIで評価した。
その結果,CasUNext は U-Net や他の最先端手法と比較してセグメンテーション性能が向上していることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:23:22 GMT)
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation [2.2] ロボット制御タスクでは、シミュレーションにおいて強化学習(RL)によって訓練されたポリシーは、物理ハードウェアにデプロイされた場合、しばしばパフォーマンス低下を経験する。
リプシッツ正則化は、近似値関数勾配の条件付けに役立ち、訓練後のロバスト性の向上につながる。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:19:37 GMT)
Concept-based Explainable Malignancy Scoring on Pulmonary Nodules in CT Images [2.2] 一般化加法モデルと概念ベース学習を適用した解釈可能なモデルを提案する。
本モデルは、最終回帰スコアに加えて臨床的に重要な属性のセットを検出し、肺結節属性と最終診断決定との関係を学習する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:36:44 GMT)
Electric-magnetic duality and $\mathbb{Z}_2$ symmetry enriched Abelian lattice gauge theory [2.2] キータエフの量子二重モデル(英: Kitaev's quantum double model)は、Dijkgraaf-Witten位相量子論(TQFT)の格子ゲージ理論的実現である。
位相的に保護された基底状態空間は、トポロジカル量子計算とトポロジカル量子メモリに広く応用されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:20:13 GMT)
Comparison of static and dynamic random forests models for EHR data in the presence of competing risks: predicting central line-associated bloodstream infection [2.2] 病院の入院に関する予後の結果は、一般的に検閲に苦しめられず、分類的にも時間的にもモデル化できる。
本研究は無作為林(RF)モデルを用いて中央線関連血液ストリーム感染症(CLABSI)の発症リスクを予測した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:43:16 GMT)
PriCE: Privacy-Preserving and Cost-Effective Scheduling for Parallelizing the Large Medical Image Processing Workflow over Hybrid Clouds [2.2] 大きな医療画像のためのディープニューラルネットワークを実行することは、集中型コンピューティングにおけるリソース不足と時間を要するタスクである。
プライバシー上の懸念から、クラウド上で機密性の高い医療画像を処理することは依然として困難である。
この多目的最適化問題を解決するために,PriCEと呼ばれる新しいプライバシ保護・コスト効率手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:52:00 GMT)
Entanglement hierarchies in multipartite scenarios [2.2] 量子状態のキャラクタリゼーション方法として,階層的量子化の集合全体を提示する。
ここでは、$k$-GMのコンカレンスにより、絡み合った状態が$(n-1)$の異なるクラスに明確に分類できることを示す。
特に$alpha$-$-GM concurrence $(0alpha1)$は、GHZ状態と$W$状態が同じ階層に属することを判断する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:43:13 GMT)
Heterogeneous virus classification using a functional deep learning model based on transmission electron microscopy images (Preprint) [2.1] 透過電子顕微鏡(TEM)画像の解析は、インスタントウイルスの同定に非常に成功したことが証明されている。
本稿では,これらの画像中のウイルスの種類を正確に識別する深層学習に基づく分類モデルを提案する。
実験の結果、データセットに存在する14種類のウイルスを97.44%の分類精度とF1スコアで区別できることが示された。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:52:14 GMT)
Leveraging knowledge distillation for partial multi-task learning from multiple remote sensing datasets [2.1] ターゲットタスクの1つにトレーニング例をアノテートする部分的マルチタスク学習は、リモートセンシングにおいて有望なアイデアである。
本稿では, 知識蒸留を用いて, 代替課題における基礎的真理の必要性を代替し, その性能を向上させることを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:48:50 GMT)
A Comprehensive Survey of Accelerated Generation Techniques in Large Language Models [2.1] 本稿では,自己回帰言語モデルにおける高速化手法について調査する。
我々はこれらの手法を,投機的復号化,早期退避機構,非自己回帰手法の4つの重要な領域に分類する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:40:27 GMT)
Examining Ownership Models in Software Teams: A Systematic Literature Review and a Replication Study [2.1] 2005年から2022年にかけて発行された79の関連論文を特定した。
我々は、タイプ、所有者、所有権度に基づく所有権のアーティファクトの分類を開発する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:03:22 GMT)
Knowledge-Informed Auto-Penetration Testing Based on Reinforcement Learning with Reward Machine [2.1] DRLRM-PTと呼ばれる知識情報を用いたAutoPTフレームワークを提案する。
我々は、PTポリシーをトレーニングするためのガイドラインとして、ドメイン知識を符号化するために報酬機(RM)を使用します。
より詳細なドメイン知識を符号化したRMは、単純な知識を持つRMよりもPT性能が良いことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:05:12 GMT)
PDL: Regularizing Multiple Instance Learning with Progressive Dropout Layers [2.1] 多重インスタンス学習(MIL)は、バッグとして知られるインスタンスのコレクションにバイナリクラスラベルを割り当てようとする、弱い教師付き学習アプローチである。
本稿では,複雑な特徴表現の発見において,MILモデルの過度な適合と強化を図るために,プログレッシブ・ドロップアウト・レイヤ(PDL)という手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:46:08 GMT)
A generalized neural tangent kernel for surrogate gradient learning [2.0] 我々は、代理勾配学習(SGL)の分析を可能にする、ニューラルタンジェントカーネル(NTK)の一般化を提供する。
符号アクティベーション関数と有限幅のネットワークにおけるSGLを、サロゲート勾配NTKと比較して数値的に比較する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:27:23 GMT)
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI [2.0] 生成モデルは画像分布を学習し、アンサンプされたk空間データから高品質な画像の再構成に使用できる。
画像系列に対する自己回帰画像拡散(AID)モデルを提案し,それを後部MRI再構成のサンプリングに用いた。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:41:54 GMT)
Robust estimation with Lasso when outputs are adversarially contaminated [2.0] 出力が逆向きに汚染されている場合のロバストな推定について検討する。
最近、ダラーリャンとトンプソンはいくつかの有用な不等式を与え、その後、グエンやトラン(2012年)よりも高速な収束速度を示した。
ダラーリャンやトンプソンと異なる証明を与え、ダラーリャンやトンプソンと同じ収束率を与える。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:29:03 GMT)
Outlier Robust and Sparse Estimation of Linear Regression Coefficients [2.0] 線形回帰係数のアウトリー・ロバストとスパース推定について考察する。
本研究は,本研究と類似の関心を共有できる先行研究よりも,仮説の弱い誤差境界を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:26:48 GMT)
Large Language Model (LLM) for Standard Cell Layout Design Optimization [2.0] 我々はLarge Language Model(LLM)を用いて、セルレイアウトのPPAを最適化し、ReActプロンプトでルタビリティをデバッグするために、高品質なクラスタ制約を漸進的に生成する。
2nmのシーケンシャルスタンダードセルのベンチマークにおいて,提案手法が最大19.4%の小さいセル領域を実現することを示す。
要約すると,提案手法はセル面積を平均4.65%削減するだけでなく,セルレイアウト設計における不安定性を修正することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:59:58 GMT)
Sparse Matrix in Large Language Model Fine-tuning [2.0] 本稿では,PEFTとフル微調整性能の差を最小限に抑えるために,スパースサブ行列を選択する手法を提案する。
実験では,本手法が他のPEFTベースラインを一貫して上回ることを示した。
また,訓練可能なパラメータの数が増加するにつれて,LoRAとDoRAの性能が低下する傾向を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:12:14 GMT)
SoilNet: An Attention-based Spatio-temporal Deep Learning Framework for Soil Organic Carbon Prediction with Digital Soil Mapping in Europe [2.0] デジタル土壌マッピング(DSM)は、統計モデリングと最先端技術を統合する先進的なアプローチである。
本研究では,DSMフレームワークにおける空間時間深層学習(DL)技術の意義を明らかにする。
気候時空間情報とともに,ベース畳み込みニューラルネットワーク(CNN)モデルと空間的注意機構を用いて空間情報を取り入れた新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:54:03 GMT)
Solving Partial Differential Equations with Equivariant Extreme Learning Machines [2.0] 極端学習機械を用いて偏微分方程式を予測する。
サンプル効率を高めるために, 追加の対称性をいかに活用できるかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:53:42 GMT)
A Misleading Gallery of Fluid Motion by Generative Artificial Intelligence [1.9] 本稿では、よく知られた生成人工知能(AI)アプリケーションからの出力の精度について検討する。
これらのアプリケーションによって生成された画像と実験室実験と数値ソフトウェアによる実画像を比較した。
以上の結果から,これらの生成AIモデルは流体力学画像において十分に訓練されていないことが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:17:15 GMT)
Enhancing Augmentative and Alternative Communication with Card Prediction and Colourful Semantics [1.9] 通信カードの予測を改善するためのColourful Semanticsフレームワークを組み込んだBERTモデルBERTptCSを導入する。
主な目的は、通信カード予測の精度と文脈的関連性を高めることである。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:33:34 GMT)
Theoretical Analysis for Expectation-Maximization-Based Multi-Model 3D Registration [1.9] 我々は,最近提案された予測最大化に基づくアルゴリズムの詳細な理論的解析を行い,多モデル3D登録という3次元登録問題のバリエーションを解決する。
特に、解析は、コース全体を通して様々なインスタンスで開発され、適用される確率的尾境界の使用を中心に展開される。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:26:56 GMT)
Using Large Language Models to Enrich the Documentation of Datasets for Machine Learning [1.8] 大規模言語モデル(LLM)を用いて,文書から次元を自動的に抽出する戦略について検討する。
当社のアプローチは、データパブリッシャや実践者がマシン可読なドキュメントを作成するのに役立ちます。
我々は、我々のアプローチを実装するオープンソースツールと、実験のコードと結果を含むレプリケーションパッケージをリリースした。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:25:49 GMT)
Analyzing the Impact of Climate Change With Major Emphasis on Pollution: A Comparative Study of ML and Statistical Models in Time Series Data [1.8] 産業活動の急増は、その多様な環境影響を予測する上で、複雑な課題となっている。
産業活動の環境影響を予測し緩和するために、これらのダイナミクスをより深く理解することを目的としている。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:18:17 GMT)
Large Language Models Reflect Human Citation Patterns with a Heightened Citation Bias [1.8] サイテーションの実践は科学知識の構造を形成するのに不可欠である。
GPT-4のような大規模言語モデル(LLM)の出現は、これらのプラクティスに新たなダイナミクスをもたらす。
本稿では,GPT-4で推奨される参照の特性と潜在的なバイアスについて分析する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:34:32 GMT)
GLiDR: Topologically Regularized Graph Generative Network for Sparse LiDAR Point Clouds [1.8] 希少なLiDAR点雲は、静的構造の細部が著しく失われ、ナビゲーションに利用可能な静的点の密度が低下する。
我々は,0次元永続ホモロジーを用いてトポロジ的に正規化されたグラフ生成ネットワークGLiDRを提案する。
これにより、GLiDRは、トポロジ的に一貫性のあるグローバルな静的LiDARバックボーンに沿って、より新しい静的ポイントを導入することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:48:43 GMT)
MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs [1.8] 水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。
近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。
MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:47:19 GMT)
Size biased Multinomial Modelling of detection data in Software testing [1.8] バグサイズや最終的なバグサイズを利用して、ソフトウェアの信頼性をより正確に判断する上で役立ちます。
このモデルはシミュレーションによって検証され、その後、重要な宇宙アプリケーションテストデータに使用される。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:57:34 GMT)
Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph [1.7] 本研究は,革新的なセマンティッククエリ処理システムを開発することを目的としている。
オーストラリア国立大学のコンピュータサイエンス(CS)研究者による研究成果に関する総合的な情報を得ることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:19:45 GMT)
Implementation of New Security Features in CMSWEB Kubernetes Cluster at CERN [1.7] CMSWEB(k8s)クラスタに導入された新しいセキュリティ機能について論じる。
新機能としては、ネットワークポリシの実装、Open Policy Agent(OPA)のデプロイ、OPAポリシの実施、Vaultの統合などがある。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:22:22 GMT)
A Planet Scale Spatial-Temporal Knowledge Graph Based On OpenStreetMap And H3 Grid [1.7] 本稿では,OpenStreetMapデータの時空間知識グラフへの惑星スケール変換を支援するフレームワークを提案する。
OpenStreetMapデータに加えて、異なるOpenStreetMapを個々のh3グリッドセルに並べる。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:22:20 GMT)
Predicting Parkinson's disease trajectory using clinical and functional MRI features: a reproduction and replication study [1.6] パーキンソン病(英: Parkinson's disease、PD)は、神経変性疾患の1つで、病態はよく分かっていない。
最近、いくつかの神経イメージングバイオマーカーが研究されているが、これらはいくつかの可変性の原因に影響を受けやすい。
この研究は、PDの潜在的な神経イメージングバイオマーカーの複製可能性を研究する大規模なプロジェクトの一部である。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:33:01 GMT)
Intensive Care as One Big Sequence Modeling Problem [1.6] 本稿では、患者と医療提供者とのインタラクションをイベントストリームとして表現する、シーケンスモデリングとしてのヘルスケアのパラダイムを提案する。
我々はMIMIC-IVデータセットから一様イベントストリームフォーマットに異種臨床記録を変換したシーケンスモデリングベンチマークMIMIC-SEQを開発した。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:50:06 GMT)
Confidence Trigger Detection: Accelerating Real-time Tracking-by-detection Systems [1.6] 信頼強化検出(CTD)は、中間状態によく似たフレームのオブジェクト検出を戦略的に回避する革新的な手法である。
CTDは追跡速度を向上するだけでなく、既存の追跡アルゴリズムを超越して精度も維持する。
本実験はCTDフレームワークの堅牢性と汎用性を実証し,資源制約環境におけるリアルタイムトラッキングの実現の可能性を示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:21:38 GMT)
CFGs: Causality Constrained Counterfactual Explanations using goal-directed ASP [1.6] 本稿では,CFG(CounterFactual Generation with s(CASP)を提案する。このフレームワークは,目標指向のAnswer Set Programming(ASP)システムs(CASP)を利用して,デファクトな説明を自動的に生成する。
CFGがこれらの世界、すなわち、望ましくない結果を得る最初の状態から、望まれる決定を得る想像された目標状態へどのようにナビゲートするかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:47:58 GMT)
Oil & Water? Diffusion of AI Within and Across Scientific Fields [1.5] 我々は、20の科学分野にわたる約8000万の研究出版物において、人工知能の普及に関する主張を調査する。
指数的成長を観察し,全分野にわたって約13倍(13倍)増加した。
このエンゲージメントの拡大は、あらゆる分野におけるより深い学際的な統合に向けた動きを示唆する一方で、増大するユビキティは、AIによる研究とより伝統的な学際的な研究の間の意味的な緊張と関係している。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:39:32 GMT)
Spatio-temporal Value Semantics-based Abstraction for Dense Deep Reinforcement Learning [1.5] Intelligent Cyber-Physical Systems (ICPS)は、CPS(Cyber-Physical System)の特殊な形態を表す。
CNNとDeep Reinforcement Learning (DRL)は、知覚、意思決定、制御を含む多面的なタスクを実行する。
DRLは意思決定プロセスにおける効率性、一般化能力、データの不足という観点で、課題に直面している。
本研究では空間時間値意味論に基づく革新的な抽象的モデリング手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:21:10 GMT)
How to Fix a Broken Confidence Estimator: Evaluating Post-hoc Methods for Selective Classification with Deep Neural Networks [1.5] 我々は,ロジットの単純な$p$-norm正規化を行い,次に最大ロジットを信頼度推定器とすることで,選択的分類性能が著しく向上することを示した。
我々の結果は、分布シフトの下で一貫していることが示されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:48:11 GMT)
Implementation of CU gates and its application in a remote-controlled quantum operation [1.4] 任意対のユニタリゲート間でCUゲートを実装する手法を提案し,実験的に実証する。
提案した遠隔制御量子ゲートモデルは、セキュアで効率的な量子情報処理の道を開くことができると考えている。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:42:25 GMT)
NMGrad: Advancing Histopathological Bladder Cancer Grading with Weakly Supervised Deep Learning [1.4] 組織学的スライスを用いた膀胱癌評価のためのパイプラインを提案する。
異なる倍率レベルでウロテリウム組織タイルを抽出し、特徴抽出のために畳み込みニューラルネットワークを用いて処理する。
グレードの予測に注意を払って、ネストされた複数のインスタンス学習アプローチを採用している。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:02:39 GMT)
Activator: GLU Activations as The Core Functions of a Vision Transformer [1.4] トランスフォーマーアーキテクチャは現在、ディープラーニングによって対処されるさまざまなタスクにおいて、多くの成功の背後にある主要なドライバである。
本稿では,多層パーセプトロンアーキテクチャに線形ゲートユニット(GLU)アクティベーションを組み込んだ変圧器アーキテクチャに通常採用されるアテンション機構の置換について検討する。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:46:52 GMT)
Synthetic high angular momentum spin dynamics in a microwave oscillator [1.3] 本研究では、高調波クディットの共振駆動に付随する連続的な発電機を実現するために、高調波発振器をオンデマンドで変更する方法を示す。
初めて線形高調波演算を用いて、4つの論理ゲートを高調波キュート符号化で達成する。
この結果は、閉ヒルベルト空間上の運動が量子情報処理にどのように役立つかを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:37:43 GMT)
Coordinated Disclosure for AI: Beyond Security Vulnerabilities [1.3] 機械学習(ML)モデルにおけるアルゴリズム上の欠陥は、従来のソフトウェア脆弱性とは異なる課題を示している。
このギャップに対処するため、我々は専用のコーディネート・フラッド・開示・フレームワークの実装を提案する。
本稿では,MLにおける情報開示の歴史的背景を考察し,害の報告や参加型監査の出現を包括する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:08:34 GMT)
Learning Dynamical Systems by Leveraging Data from Similar Systems [1.3] 本稿では,補助システムによって生成されたデータにアクセスできる場合の線形システムの力学を学習する問題について考察する。
本研究は,ノイズによる本質的なシステム識別誤差の低減に有効であることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:19:00 GMT)
Visualize and Paint GAN Activations [1.3] これらのモデルの内部動作をよりよく理解し、無条件で訓練されたGANで構造を描くことを目的として、GANの生成した構造と、それらが隠れた層内での活性化とどのように相関するかを考察する。
これにより、生成された画像をより制御し、トレーニングデータにそのようなセグメンテーションを必要としないセグメンテーションマップからセグメンテーションを生成することができます。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:22:58 GMT)
Gradient-Free Training of Recurrent Neural Networks using Random Perturbations [1.2] リカレントニューラルネットワーク(RNN)は、チューリング完全性とシーケンシャルな処理能力のために、計算の潜在能力を秘めている。
時間によるバックプロパゲーション(BPTT)は、時間とともにRNNをアンロールすることでバックプロパゲーションアルゴリズムを拡張する。
BPTTは、前方と後方のフェーズをインターリーブし、正確な勾配情報を格納する必要があるなど、大きな欠点に悩まされている。
BPTTと競合するRNNにおける摂動学習に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:00:40 GMT)
Generalizable and Scalable Multistage Biomedical Concept Normalization Leveraging Large Language Models [1.2] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて、大きな可能性と高いパフォーマンスを示している。
バイオメディカル研究でよく用いられるルールベース正規化システムと組み合わせて, プロプライエタリおよびオープンソース両方のLSMを適用した。
生物医学的要約の公開データセットから,5,523の概念用語とテキストコンテキストを評価した。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:31:04 GMT)
Variational Quantum Algorithms for the Allocation of Resources in a Cloud/Edge Architecture [1.1] 変分量子アルゴリズムは, 近い将来, 古典的アルゴリズムの代替となる可能性が示唆された。
特に、2つのアルゴリズム、すなわち量子近似最適化アルゴリズム(QAOA)と変分量子固有解器(VQE)の性能を比較した。
シミュレーション実験は、クラウドと2つのエッジノードを含む %CM230124 の単純な問題に対して実施され、VQE アルゴリズムは、検索空間を制限できる適切な回路テクスタイタンサッチを備えている場合に、より良い性能を保証することを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:38:47 GMT)
CausalConceptTS: Causal Attributions for Time Series Classification using High Fidelity Diffusion Models [1.1] 特定の分類結果に対する概念の因果効果を評価するための新しい枠組みを提案する。
我々は、現状の拡散に基づく生成モデルを利用して、反現実的な結果を推定する。
我々のアプローチは、これらの因果属性と、理論的にも経験的にも、密接に関連する関連属性を比較する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:33:18 GMT)
Harnessing Large Language Models for Software Vulnerability Detection: A Comprehensive Benchmarking Study [1.0] ソースコードの脆弱性発見を支援するために,大規模言語モデル(LLM)を提案する。
目的は、複数の最先端のLCMをテストし、最も優れたプロンプト戦略を特定することである。
LLMは従来の静的解析ツールよりも多くの問題を特定でき、リコールやF1スコアの点で従来のツールよりも優れています。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:59:19 GMT)
Benchmarking Hierarchical Image Pyramid Transformer for the classification of colon biopsies and polyps in histopathology images [1.0] 自己教師型学習の最近の進歩は、アノテーションを必要とせずに、高度に記述的な画像表現を学習できることを示してきた。
近年の階層画像ピラミッド変換器(HIPT)の大腸生検・ポリープ分類への応用について検討した。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:59:30 GMT)
Benchmarking Pre-trained Large Language Models' Potential Across Urdu NLP tasks [1.0] 多言語データで事前訓練されたLarge Language Models (LLMs)は、自然言語処理の研究に革命をもたらした。
本研究では,15のUrduデータセットを用いて,14のタスクにまたがる顕著なLLMの詳細な検討を行った。
実験の結果、SOTAモデルはゼロショット学習を伴う全てのUrdu NLPタスクにおいて、エンコーダ-デコーダ事前訓練された言語モデルを上回ることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:30:37 GMT)
HiddenSpeaker: Generate Imperceptible Unlearnable Audios for Speaker Verification System [1.0] 学習音声サンプルに知覚不能な摂動を埋め込んだHiddenSpeakerというフレームワークを提案する。
以上の結果から,HiddenSpeakerは学習不可能なサンプルでモデルを騙すだけでなく,摂動の知覚能力を高めることが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:49:00 GMT)
Identifying Functionally Important Features with End-to-End Sparse Dictionary Learning [0.9] ニューラルネットワークによって学習された特徴を特定することは、機械的解釈可能性における中核的な課題である。
本稿では,SAEの学習方法であるエンドツーエンドのスパース辞書学習を提案する。
我々は,e2e SAE特徴と標準SAE特徴との幾何学的および定性的差異について検討する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:16:32 GMT)
How Culturally Aware are Vision-Language Models? [0.8] 神話、民俗舞踊、文化記号、シンボルなどの民俗ジャンルからのイメージは、あらゆる文化にとって不可欠である。
本研究は、これらの画像中の文化的特定情報を特定するために、4つの一般的な視覚言語モデルの性能を比較した。
画像キャプションにおける文化意識の度合いを計測する新しい評価指標であるCAS(Cultural Awareness Score)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:45:14 GMT)
Prediction De-Correlated Inference: A safe approach for post-prediction inference [0.8] この設定での推論はしばしばポスト述語推論と呼ばれる。
我々は,予測相関推論 (PDC) という,予測後条件下での統計的推論のための新しい仮定リーンフレームワークを提案する。
我々のアプローチは安全であり、PDCが任意のブラックボックス機械学習モデルに自動的に適応し、教師付き機械学習モデルよりも一貫して優れる。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:02:16 GMT)
Device-independent quantum key distribution with arbitrarily small nonlocality [0.8] デバイス非依存の量子キー分散(DIQKD)により、2人のユーザが使用する量子デバイスを信頼することなく、共有暗号キーをセットアップできる。
ここではそのような境界が存在しないことを示し、局所集合に任意に近い相関を持つ鍵を与えるスキームを与える。
我々の構成のいくつかは、一対の絡み合った量子ビットに対して最大1ビットの鍵を達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:43:15 GMT)
Send Message to the Future? Blockchain-based Time Machines for Decentralized Reveal of Locked Information [0.8] 条件情報開示システムは、時間や場所などの特定の条件を満たすと、情報のリリースを自動化する。
本稿では,条件情報公開システムの理解,設計,適用のブレークスルーを紹介する。
これは、この先駆的なパラダイムの完全な評価ポートフォリオを提供し、分析結果、Tamarin Proverにおける堅牢性の検証、そして世界中に展開された実世界のオープンソースのプロトタイプのパフォーマンス評価を含む。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:06:17 GMT)
Machine Unlearning in Large Language Models [0.8] 本稿では,大規模言語モデル(LLM)を倫理,プライバシ,安全基準と整合させる手法を提案する。
本研究の目的は,LLMにおける学習情報を選択的に消去・修正することであり,有害な応答や著作権のあるコンテンツを対象としている。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:12:51 GMT)
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics [0.8] リスク対応強化学習アルゴリズムは、さまざまな継続的なタスクにおいて、リスクニュートラルなアルゴリズムよりも優れていた。
これらのアルゴリズムが採用する悲観的目的の理論的基礎は、まだ確立されていない。
本稿では,2つのアクターネットワークを特徴とするリスク認識型モデルフリーアルゴリズムとして,Dual Actor-Critic (DAC)を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:40:18 GMT)
From Data Complexity to User Simplicity: A Framework for Linked Open Data Reconciliation and Serendipitous Discovery [0.7] この記事では、Linked Open Dataソースの整列と、セレンディピティーな発見のためのユーザフレンドリーなインターフェースを提供するWebポータルを作成するための、新しいソフトウェアソリューションを紹介します。
本稿では,Polifonia Webポータルをモチベーションシナリオとケーススタディとして提示し,音楽遺産領域におけるデータ和解や寛大なインターフェースの提供といった研究課題に対処する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:03:20 GMT)
GroundGrid:LiDAR Point Cloud Ground Segmentation and Terrain Estimation [0.7] 本研究では,2次元標高マップを用いて地形推定と点雲地分断問題を解くシステムであるGroundGridを提案する。
グラウンドグリッドのグラウンドセグメンテーションと地形推定性能を評価し,他の最先端手法と比較した。
この結果から、GroundGridは平均94.78%のIoUで他の最先端システムよりも高速で171Hzの性能を維持することができることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:02:44 GMT)
Unmasking the giant: A comprehensive evaluation of ChatGPT's proficiency in coding algorithms and data structures [0.7] 本稿では,ChatGPTが入力した問題に対する正しい解を生成する能力,コード品質,コードによってスローされる実行時エラーの性質を評価する。
この種の状況において、ChatGPTコードがいかに間違っているか、いくつかの洞察を得るために、パスされたテストケースのパターンを調べます。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:28:09 GMT)
Conditional Normalizing Flows for Active Learning of Coarse-Grained Molecular Representations [0.7] フローの正規化のような生成機械学習手法は、サンプルなしでボルツマン分布を直接学習するために使われてきた。
本研究では,この問題を細粒度と粗粒度という2つのレベルに分けることで,この問題に対処する。
構成空間を探索するために,フローを更新し,必要時にのみ全原子ポテンシャルエネルギー評価を行うことのできる,能動学習による粗粒度シミュレーションを用いる。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:13:33 GMT)
chainBoost: A Secure Performance Booster for Blockchain-based Resource Markets [0.6] 分散資源市場のためのセキュアなパフォーマンス向上剤である chainBoost を提案する。
サービス関連の操作を高速化し、ブロックチェーンサイズを削減し、低オーバーヘッドでフレキシブルなサービス支払い交換モダリティをサポートする。
分散ファイルストレージ市場のための概念実証プロトタイプをユースケースとして実装する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:08:38 GMT)
Enhancing Pollinator Conservation towards Agriculture 4.0: Monitoring of Bees through Object Recognition [0.6] 本稿では,ハチの行動の自律的追跡・報告にコンピュータビジョンと物体認識を用いる方法について検討する。
ビデオストリームから蜂を含む9664画像の新しいデータセットを抽出し、バウンディングボックスで注釈付けする。
トレーニングされたモデルは、説明可能なAIインターフェース内にパッケージされ、検出イベントをタイムスタンプされたレポートとチャートに変換する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:45:24 GMT)
Assessing Political Bias in Large Language Models [0.6] 我々は、ドイツの有権者の視点から、欧州連合(EU)内の政治問題に関するオープンソースのLarge Language Models(LLMs)の政治的バイアスを評価する。
Llama3-70Bのような大型モデルは、左派政党とより緊密に連携する傾向にあるが、小さなモデルは中立であることが多い。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:59:31 GMT)
Shopping Queries Image Dataset (SQID): An Image-Enriched ESCI Dataset for Exploring Multimodal Learning in Product Search [0.6] Shopping Queriesイメージデータセット(SQID)は、Amazon Shopping Queriesデータセットの拡張で、190,000の製品に関連するイメージ情報に富んでいる。
視覚情報を統合することで、SQIDは製品検索とランキングを改善するためのマルチモーダル学習技術の研究を促進する。
本稿では,SQIDと事前学習モデルを用いて,検索とランキングにマルチモーダルデータを用いることの価値を示す実験結果を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:50:31 GMT)
Randomized heuristic repair for large-scale multidimensional knapsack problem [0.5] 多次元クナップサック問題(MKP)は、最大総利益項目のサブセットを決定するNPハード最適化問題である。
本稿では, 品質を劣化させることなく, 補修液の変動性を向上する効率補修法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:01:05 GMT)
Strong screening rules for group-based SLOPE models [0.5] グループベースSorted L-One Penalized Estimation(SLOPE)モデルのスクリーニングルールを開発する。
開発されたルールは、OSCARを含むグループベースのモデルのより広範なファミリーに適用できる。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:48:06 GMT)
Open-Source Assessments of AI Capabilities: The Proliferation of AI Analysis Tools, Replicating Competitor Models, and the Zhousidun Dataset [0.5] 人工知能の軍事能力への統合は、世界中の主要な軍事力の標準となっている。
本稿では、Zhousidunデータセットの詳細な検証を通して、軍用AIモデルを分析するためのオープンソースの方法論を実証する。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:59:58 GMT)
Hypergraph: A Unified and Uniform Definition with Application to Chemical Hypergraph [0.5] 本稿では,非指向性,指向性,ネスト性を持つハイパーグラフの概念を統一するハイパーグラフの新たな定義を提案する。
具体的には、ハイパーエッジを単純なハイパーエッジ、ネストハイパーエッジ、あるいは有向ハイパーエッジと定義する。
この新たな定義の統一性とパワーは、可視化とともに、高次相関を表現するためにハイパーグラフを使うことを促進するべきである。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:14:44 GMT)
ProtFAD: Introducing function-aware domains as implicit modality towards protein function perception [0.4] 本稿では,タンパク質の異なる機能を識別するために,機能認識ドメイン表現とドメイン結合型学習戦略を提案する。
提案手法は, 様々なベンチマークにおいて, 最先端の手法よりも大きく, 包括的に優れている。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:26:45 GMT)
E2Vec: Feature Embedding with Temporal Information for Analyzing Student Actions in E-Book Systems [0.4] 本研究では,単語埋め込みに基づく特徴表現手法であるE2Vecを提案する。
我々は,2年間のコンピュータサイエンスコースから,305名の生徒にそれぞれ埋め込みベクトルを生成するために,fastTextを適用した。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:17:43 GMT)
SeDe: Balancing Blockchain Privacy and Regulatory Compliance by Selective De-Anonymization [0.4] 我々は、Selective De-Anonymization (SeDe) と呼ばれる規制および準拠のフレームワークを確立することにより、プライバシ保護機能のバランスをとるフレームワークを提案する。
我々の技術は、匿名化の決定や制御を単一のエンティティに残さずに、複数のエンティティに分散させながら、それぞれのアクションに責任を負うことなく、これを実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:18:10 GMT)
Review of Machine Learning Approaches for Diagnostics and Prognostics of Industrial Systems Using Industrial Open Source Data [0.3] 本稿では,オープンソースのデータセットを用いた産業システムの診断・診断のための機械学習手法について概説する。
これは、複雑な産業タスクに取り組む上で、従来の機械学習とディープラーニングの両方が進化する役割を強調している。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:09:34 GMT)
Nonparametric Instrumental Variable Regression through Stochastic Approximate Gradients [0.3] 集団リスクを直接最小化することにより,NPIV回帰に対処するための関数勾配降下アルゴリズムの定式化方法を示す。
我々は,過大なリスクに対するバウンダリの形で理論的支援を行い,提案手法の優れた安定性と競争性能を示す数値実験を行った。
このアルゴリズムは、ニューラルネットワークやカーネルベースの手法のような柔軟な推定器の選択と、非二次的損失関数を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:09:40 GMT)
BBK: a simpler, faster algorithm for enumerating maximal bicliques in large sparse bipartite graphs [0.3] 本稿では,二部グラフ内の最大双斜線を包括的に列挙するアルゴリズムを提案する。
BBK for Bipartite Bron-Kerboschと呼ばれるこのアルゴリズムは、Bron-Kerboschアルゴリズムの新しい拡張である。
最先端のアルゴリズムよりも高速で、既存の実装では管理できない巨大な二部グラフの列挙を可能にする。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:00:21 GMT)
Adaptive measurement strategy for noisy quantum amplitude estimation with variational quantum circuits [0.3] 本稿では,不特定強度の非偏極雑音の存在下での振幅推定について検討する。
我々は,提案手法が量子クラム・ラオ境界(QCRB)をほぼ達成できることを数値的に示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:15:56 GMT)
Over-the-Air Runtime Wi-Fi MAC Address Re-randomization [0.3] 現在の提案では、アクセシビリティポイント(AP)から切り離されたとき、モバイルデバイスMACアドレスを定期的に変更している。
この方法では、フレームは変更間でリンクできないが、モバイルデバイスの存在は、接続されている限り露出する。
本手法は,Wi-Fiフレームの接続性を低減あるいは排除し,接続の切断や切断を待たずに実現する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:42:15 GMT)
Full-stack evaluation of Machine Learning inference workloads for RISC-V systems [0.3] 本研究は,オープンソースのアーキテクチャシミュレータであるgem5を用いて,RISC-Vアーキテクチャ上での機械学習ワークロードの性能を評価する。
MLIR(Multi-Level Intermediate Representation)に基づいたオープンソースのコンパイルツールチェーンを活用することで、ディープラーニング推論ワークロードに特化したベンチマーク結果が提示される。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:24:46 GMT)
HTN-Based Tutors: A New Intelligent Tutoring Framework Based on Hierarchical Task Networks [0.3] 階層型タスクネットワーク(HTN)を用いたエキスパートモデルを表現するインテリジェントなチュータフレームワークであるHTNベースのチュータを提案する。
さまざまな問題解決戦略の柔軟なエンコーディングを可能にし、階層的な知識組織によるさらなるメリットを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:38:22 GMT)
Hierarchical Loss And Geometric Mask Refinement For Multilabel Ribs Segmentation [0.2] 階層的損失関数を用いたマルチラベルリブ分割モデルを提案する。
我々のモデルは、パブリックなRibSeg v2データセットで98.2%のラベル精度を達成した。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:39:21 GMT)
Do Not Trust Power Management: Challenges and Hints for Securing Future Trusted Execution Environments [0.2] 2017年以降、Tangらは新たなソフトウェア対応ハードウェアアタックを導入した。
これらの攻撃は、TEEのセキュリティ保証をバイパスし、暗号鍵のような機密情報を暴露することを目的としている。
本稿では,これらの攻撃の包括的知識調査と文献対策の評価について述べる。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:26:39 GMT)
DETECTA 2.0: Research into non-intrusive methodologies supported by Industry 4.0 enabling technologies for predictive and cyber-secure maintenance in SMEs [0.2] DETECTA 2.0プロジェクトは、リアルタイム異常検出、高度な分析、予測予測機能を調和させる。
中心となるのはDigital Twinインターフェースで、マシン状態と検出された異常の直感的なリアルタイム可視化を提供する。
予測エンジンは、N-HiTSのような高度な時系列アルゴリズムを使用して、将来のマシン利用トレンドを予測する。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:38:38 GMT)
Error Crafting in Probabilistic Quantum Gate Synthesis [0.2] 我々は,誤り合成が完全かつ効率的に評価できるという事実を生かしている。
クリフォード+T形式に基づくパウリ回転の数値的な証拠を示す。
我々の研究は、エラー対策を編成する量子回路設計とアーキテクチャの新たな道を開く。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:54:11 GMT)
A Quantum Approximation Scheme for k-Means [0.2] QRAMモデルにおける古典的な$k$-meansクラスタリング問題に対する量子近似スキームを提案する。
我々の量子アルゴリズムは、時間$tildeO left(2tildeO(frackvarepsilon) eta2 dright)$で実行される。
教師なし学習の以前の研究とは異なり、我々の量子アルゴリズムは量子線型代数のサブルーチンを必要としない。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:01:12 GMT)
On the Tractability of SHAP Explanations under Markovian Distributions [0.2] SHAPフレームワークはMLモデルの局所的な説明可能性のための最も広く利用されているフレームワークの1つである。
その人気にもかかわらず、その正確な計算は非常に困難であることが知られ、様々な構成においてNP-Hardであることが証明されている。
近年の研究では、特定のモデルファミリーに対するSHAPスコアの計算に関して、肯定的な複雑性の結果が明らかにされている。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:45:34 GMT)
Discovering deposition process regimes: leveraging unsupervised learning for process insights, surrogate modeling, and sensitivity analysis [0.2] 本研究は,化学気相沈着(CVD)反応器の堆積過程を解明するための包括的アプローチを導入する。
我々の方法論は、プロセスの異なる状態に対応する"アウトカム"のクラスタを特定するために、詳細なCFDモデルによって導かれるプロセス結果に依存しています。
この現象はArrheniusプロット解析により実験的に検証され,本手法の有効性が確認された。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:10:22 GMT)
Constraining the Higgs Potential with Neural Simulation-based Inference for Di-Higgs Production [0.1] 我々は,ディヒッグス現象の運動論を通じて,標準モデルを超えて物理に対する感度を改善する方法について検討する。
特に,シミュレーションに基づく推論を通した機械学習を用いて,空間当たりの確率比を推定する。
標準モデル有効場理論の観点では、限られた数の観測可能量を追加することで、ウィルソン係数の縮退を除去できる。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:00:00 GMT)
Quantum gravity inspired nonlocal quantum dynamics preserving the classical limit [0.0] 量子力学の非局所的な修正は非相対論的エネルギーで見られる。
量子確率密度と自由エネルギーの古典的極限は、非局所性スケールに匹敵するエネルギーの影響を受けないことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:33:51 GMT)
GECKO: Generative Language Model for English, Code and Korean [0.0] 韓国語と英語に最適化された二言語大言語モデル(LLM)であるGECKOとプログラミング言語を紹介する。
GECKOはLLaMAアーキテクチャを採用した韓国語と英語のバランスよく高品質なコーパスで事前訓練されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:30:41 GMT)
\textsc{Retro}]{\textsc{Retro}: \underline{Re}using \underline{t}eacher p\underline{ro}jection head for efficient embedding distillation on Lightweight Models via Self-supervised Learning [0.0] 本研究では,教師のプロジェクションヘッドを学生に再利用するtextscRetroを提案する。
実験結果から, 軽量モデルにおける最先端モデルに対して, 大幅な改善が得られた。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:53:09 GMT)
Zero-Shot Spam Email Classification Using Pre-trained Large Language Models [0.0] 本稿では,ゼロショットプロンプトを用いたスパムメール分類における事前学習型大規模言語モデル(LLM)の適用について検討する。
オープンソース (Flan-T5) とプロプライエタリ LLM (ChatGPT, GPT-4) の両方の性能をよく知られた SpamAssassin データセット上で評価した。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:55:49 GMT)
When Generative AI Meets Workplace Learning: Creating A Realistic & Motivating Learning Experience With A Generative PCA [0.0] 本稿では,ジェネレーティブPCA(GenPCA)を用いた組織コミュニケーション訓練について述べる。
評価は有望な結果を示している: エージェントは、従業員の間で肯定的に認識され、自己決定学習の改善に寄与した。
我々は、GenPCAが支援する実践的手法と、そのような職場学習エージェントの改善の可能性について提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:49:18 GMT)
What You Shouldn't Know About Quantum Computers [0.0] 複雑なjargonを切断して、量子コンピューティングの真正な事実を提供する。
好奇心とニーズの範囲で読者に知らせ、刺激を与えるために書かれた。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:44:12 GMT)
What AIs are not Learning (and Why): Bio-Inspired Foundation Models for Robots [0.0] 現在のスマートロボットは、手動プログラミング、数学的モデル、計画フレームワーク、強化学習を使って作成されている。
2足歩行ロボットの高コスト(ボディ)は、研究と展開の両方において大きな障害となる。
本稿では、人間互換サービスロボットが知っておくべきことに焦点を当てる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:20:47 GMT)
V-Zen: Efficient GUI Understanding and Precise Grounding With A Novel Multimodal LLM [0.0] 本稿では,GUIの理解と基盤化の領域に革命をもたらすために,MLLM (Multimodal Large Language Model) を巧みに構築した V-Zen について述べる。
V-Zenは、効率的な接地と次のアクション予測のための新しいベンチマークを確立する。
V-ZenとGUIDEの統合の成功は、マルチモーダルAI研究における新たな時代の幕開けを告げ、インテリジェントで自律的なコンピューティング体験への扉を開く。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:21:45 GMT)
Two-mode Squeezing in Floquet Engineered Power-law Interacting Spin Models [0.0] 階層間の2モードのスケザリングという形で、スケーラブルな絡み合いの生成は、一般的にパワーローモデルで達成できる。
空間的に時間的に設計された相互作用は、生成した絡み合いを大幅に増加させ、実際にハイゼンベルク制限スケーリングを達成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:30:05 GMT)
TrojanForge: Adversarial Hardware Trojan Examples with Reinforcement Learning [0.0] ハードウェアトロイの木馬問題は、攻撃者とディフェンダーの間の連続したゲームと考えることができる。
最近、機械学習はHT研究の進展の鍵となった。
トロイジャンForgeは、HT検出器を倒す敵の例を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:37:32 GMT)
Transformers for Image-Goal Navigation [0.0] 本稿では,画像目標,カメラ観測,ロボットの過去の動作を共同でモデル化し,将来の行動を予測するための生成トランスフォーマーモデルを提案する。
本モデルでは,長期間の地平線上での視覚情報の収集と関連性を実証し,ナビゲーションの効率化に寄与する。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:25:08 GMT)
Trackastra: Transformer-based cell tracking for live-cell microscopy [0.0] 細胞追跡は、ライブセル顕微鏡における全方位画像解析タスクである。
Trackastraは、単純なトランスフォーマーアーキテクチャを用いた汎用的な細胞追跡手法である。
我々の追跡手法は、高度に調整された最先端の細胞追跡アルゴリズムに匹敵する性能を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:44:22 GMT)
Towards a Probabilistic Fusion Approach for Robust Battery Prognostics [0.0] 本稿では,リチウムイオン電池の容量減少を予測するためのベイズアンサンブル学習手法を提案する。
提案手法は,NASA Ames Prognostics Center of Excellenceによって収集された電池老化データセットを用いて検証された。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:26:36 GMT)
Towards Relational Quantum Field Theory [0.0] 我々は、正の作用素値測度(量子フレーム)に対する作用素値関数(量子場)に対する一般積分理論を開発する。
不定時相の形式は、任意の主バンドルの文脈における量子状態から生じる。
これは一般相対論的および量子物理学の原理を整合する問題に関する新しい視点を提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:31:27 GMT)
Super-diffusive transport in two-dimensional Fermionic wires [0.0] We study the scaling of the conductance of a Fermionic wire with its length, $L$ as the width of the wire $Wrightarrowinfty$。
このモデルでは, コンダクタンスの超拡散スケーリング(1/L1/2$) が$|E|E_c$内にあることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:47:04 GMT)
Strongest nonlocal sets with minimum cardinality in tripartite systems [0.0] 我々は$mathbbCdotimes mathbbCd$において、最も強い非局所集合である$d2+1を構築する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:37:50 GMT)
Spiketrum: An FPGA-based Implementation of a Neuromorphic Cochlea [0.0] 本稿では,汎用スパイク符号化アルゴリズムであるSpketrumを活用するFPGAベースのニューロモルフィック・コクリーを提案する。
コチェリーモデルは、音波振動を生物学的に現実的な音波スパイク列車に変換するのに優れている。
音波形を超えて様々な感覚情報をエンコードする能力は、現在と将来のスパイクベースのインテリジェントコンピューティングシステムにとって有望な感覚入力として位置づけられている。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:31:47 GMT)
Speed-Accuracy Trade-Off Relations in Quantum Measurements and Computations [0.0] 我々は,エネルギー保存法と地域性の結果として,基本的な速度・精度のトレードオフ関係を確立する。
我々のトレードオフは、ハミルトニアンと非可換な作用素に対するゼロエラー測度が有限時間で実装できないというノーゴー定理として機能する。
本手法を量子計算に適用し,またユニタリゲートの実装に対して,別の速度-精度トレードオフ関係を提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:24:40 GMT)
Semi-Supervised Learning guided by the Generalized Bayes Rule under Soft Revision [0.0] 擬似ラベル選択のためのロバストな基準としてソフトリビジョンを用いたガンマ・マキシミン法の提案
我々は,最適化問題としてソフトリビジョンを用いたガンマ・マキシミン法を用いて,最適な擬似ラベル付きデータを求めるタスクを定式化する。
特にラベル付きデータの比率が低い場合, ソフトリビジョンによるガンマ・マキシミン法は非常に有望な結果が得られることが観察された。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:30:45 GMT)
Seeing the World through an Antenna's Eye: Reception Quality Visualization Using Incomplete Technical Signal Information [0.0] 我々は、一般的に監視や制御目的にのみ使用される技術信号情報に利点を付加する塗装アプローチについて述べる。
生データよりも製品にペンキを塗ることの利点と、技術信号情報の可視化の豊かな可能性を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:23:39 GMT)
STC-ViT: Spatio Temporal Continuous Vision Transformer for Weather Forecasting [0.0] トランスフォーマーモデルは、最先端の結果を達成するための天気予報に顕著な可能性を示している。
STC-ViTは、連続的なニューラルODE層とマルチヘッドアテンション機構を組み込んで、時間の経過とともに連続的な天気変化を学習する。
我々は,STC-ViTを,操作型数値気象予測(NWP)モデルと深層学習に基づく天気予報モデルと比較した。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:19:33 GMT)
Robust width: A lightweight and certifiable adversarial defense [0.0] 逆例は、モデルが誤った予測や分類を行うように意図的に構築される。
本研究では,最近圧縮センシングに導入された頑健な幅特性(RWP)に基づく対角防御について検討する。
本稿では、RWPに基づく特定の入力浄化方式により、ほぼスパースな画像に対して理論的ロバスト性を保証することを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 22:50:50 GMT)
Risk Factor Identification In Osteoporosis Using Unsupervised Machine Learning Techniques [0.0] 電子カルテに新たなクラスタリング法を適用し,骨粗しょう症に関連するリスク因子の信頼性について検討した。
本研究は,クラスタリング,特徴選択,主機能識別という3つのコンポーネントのいずれかに適応可能な反復的クラスタリングフレームワークを含む,新たなClustering Iterations Framework(CLIF)の利用を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:53:28 GMT)
Restoring metrological quantum advantage of measurement precision in noisy scenario [0.0] 本研究では,Hミルトニアン系のパラメータ推定において,フィッシャー情報に基づく最小不確かさの下位境界において量子的優位性が得られることを示す。
システム粒子間の相互作用を組み込むことにより、最大絡み合ったプローブによる周波数推定の精度向上を図ることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:25:59 GMT)
Resource-Efficient Heartbeat Classification Using Multi-Feature Fusion and Bidirectional LSTM [0.0] 多機能核融合と双方向長短期記憶(Bi-LSTM)を用いた心電図(ECG)を用いた心拍分類の資源効率向上手法を提案する。
このデータセットは、MIT-BIH Arrhythmia Database: Normal (N)、Left Bundle Branch Block (LBBB)、Right Bundle Branch Block (RBBB)、Premature Ventricular Contraction (PVC)、Paced Beat (PB)の5つのオリジナルクラスで構成されている。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:53:27 GMT)
Radiative processes of single and entangled detectors on circular trajectories in (2+1) dimensional Minkowski spacetime [0.0] 2つの絡み合った検出器は、(2+1)$2次元ミンコフスキー時空で円軌道上を移動している。
ミンコフスキー真空中および熱浴中における検出器の遷移確率を算出した。
有限時間間隔でスイッチオンした場合の検出器の遷移確率率を評価する。
論文参考訳(メタデータ) (Fri, 24 May 2024 05:46:04 GMT)
Quantum-centric strong and dynamical electron correlation: A resource-efficient second-order $N$-electron valence perturbation theory formulation for near-term quantum devices [0.0] 本稿では, 短期量子デバイスにおけるStrongly-Contracted $N$-Electron Valence Perturbation Theory (SC-NEVPT2) の高効率実装について述べる。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:37:31 GMT)
Quantum nondemolition measurement operator with spontaneous emission [0.0] 本稿では,自然発光の存在下での原子アンサンブルの量子非分解(QND)測定の理論について述べる。
高自然放出条件下では、QND測定は、測定が崩壊する独自の支配的状態を有することを示す。
我々は、原子-光相互作用強度を調整することによって、原子の様々な非古典状態を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:50:37 GMT)
Quantum Simulation of SU(3) Lattice Yang Mills Theory at Leading Order in Large N [0.0] ヒルベルト空間と相互作用が N_c の逆パワーでどのように拡張できるかを示す。
量子ビットおよび量子ビット上の SU(3) ゲージ場の単純表現を可能にする明示的な構成を与える。
この定式化により、CNOT深さ113のibm_torino上の5x5および8x8格子上のSU(3)格子ゲージ理論のリアルタイムダイナミクスのシミュレーションが可能になる。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:09:05 GMT)
Quantum Phase Transition in a Modified Jaynes-Cummings Model [0.0] 単一光子空洞放射場を持つ改良型Jaynes-Cummingsモデルを提案する。
Rabiモデルで実現された量子相転移は、Jaynes-Cummingsモデルでも起こる。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:40:17 GMT)
Quantum Many-Body Scarring in a Non-Abelian Lattice Gauge Theory [0.0] 量子多体散乱(Quantum many-body scarring、QMBS)は、エルゴディディティ破壊の興味深いメカニズムである。
動的物質を持つ非アベリアSU(2)LGTにおけるQMBSの証拠を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:46:51 GMT)
Quadrature-PT symmetry: Classical-to-quantum transition in noise fluctuations [0.0] 我々は、位相依存性増幅(PSA)と平衡損失を行う非エルミタン(NH)双ビーム系が、古典的NHまたはエルミタン量子シナリオに欠如している特徴を示す証拠を示す。
提案するバイパートイトオープンシステムでは,量子クラムエル・ラオ境界やフィッシャー情報に制約された信号対雑音比と感度の向上が期待できる。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:52:02 GMT)
PyCellMech: A shape-based feature extraction pipeline for use in medical and biological studies [0.0] 医学研究者は身体計測と画像データを用いて障害の予防と治療に関する知識を得る。
この取り組みを支援するために、画像構造からデータを集めるように設計された特徴抽出パッケージが利用可能である。
PyCellMechパッケージは、一次元、幾何学的、多角形に分類される3種類の形状特徴を抽出する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:55:42 GMT)
Profiling checkpointing schedules in adjoint ST-AD [0.0] Checkpointingは、さまざまなレベルで適用可能なストレージ/再計算トレードオフである。
本稿では,隣接コードの実行時プロファイリングに基づくアルゴリズムを提案する。
本稿は,MITgcm大洋および大気循環モデルから得られた試験事例に対する本手法の関心を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:20:45 GMT)
Production of Entangled X-rays through Nonlinear Double Compton Scattering [0.0] 絡み合ったX線を生成するためのアクセス可能な情報源は、高エネルギーの量子光学の分野にとって不可欠である。
本稿では、強いレーザー波中の電子によって放出される2つの光子の絡み合いと偏光について詳細に解析する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:21:43 GMT)
Probeable Problems for Beginner-level Programming-with-AI Contests [0.0] 我々は,複数の機関の学部生を対象に,2時間のプログラミングコンテストを実施している。
学生は個人またはグループで働けるようになり、AIツールを自由に使えるようになった。
これらのグループによって提出されたコードが、欠落した詳細を特定できる範囲を分析し、形式的および非公式なCS教育文脈における学習を支援する方法を特定する。
論文参考訳(メタデータ) (Fri, 24 May 2024 00:39:32 GMT)
Prejudice and Volatility: A Statistical Framework for Measuring Social Discrimination in Large Language Models [0.0] 本研究では,Large Language Models (LLMs) の生成における不整合が社会的不正を誘発し,さらに悪化させる可能性について検討した。
LLMを評価するための行動指標を正確に定義するPrejudice-Volatility Framework(PVF)を定式化する。
我々は,LLMの集合的差別リスクを,システムバイアスやボラティリティリスクから生じる偏見リスクに数学的に分解する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:02:10 GMT)
Persian Homograph Disambiguation: Leveraging ParsBERT for Enhanced Sentence Understanding with a Novel Word Disambiguation Dataset [0.0] ペルシャのホモグラフの曖昧化に適した新しいデータセットを提案する。
本研究は,コサイン類似性法による各種埋没物の徹底的な探索を含む。
我々は、精度、リコール、F1スコアの観点からモデルの性能を精査する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:56:36 GMT)
PatchProt: Hydrophobic patch prediction using protein foundation models [0.0] タンパク質表面上の疎水性パッチは、タンパク質-タンパク質とタンパク質-リガンド相互作用において重要な機能的役割を担っている。
微調整基礎モデルは、新しいタスクの特定のニュアンスにモデルを適応させることができる。
マルチタスクのディープラーニングは、データギャップに対処するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:37:02 GMT)
Parameterization and optimizability of pulse-level VQEs [0.0] 量子固有解法(VQEs)試験状態は、一連のパラメータ化ゲートを基準状態に適用することによって作成される。
最近提案されたctrl-VQEアルゴリズムは、パルスの振幅、周波数、位相を分子エネルギーを最小化するために用いられる変動パラメータとして取る。
論文参考訳(メタデータ) (Fri, 24 May 2024 03:02:45 GMT)
PAWS-VMK: A Unified Approach To Semi-Supervised Learning And Out-of-Distribution Detection [0.0] 本稿では,画像分類タスクの最先端結果を取得するディープラーニング手法であるPAWS-VMKについて述べる。
PAWS-VMKは、クラス毎に4つのラベル付きインスタンスを持つCIFAR-10 (99.2%)とCIFAR-100 (89.8%)と、クラス毎に2つのラベル付きインスタンスを持つFood-101 (90.1%)の半教師付き学習のベンチマークを新たに設定している。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:06:34 GMT)
Output-Constrained Decision Trees [0.0] 本稿では,マルチターゲット出力だけでなく,対象間の制約も扱える決定木を新たに導入する。
我々は,制約に対処する分割基準を調整し,実現可能な予測を得ることにより,従来の決定木をカスタマイズすることに注力する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:54:44 GMT)
Organic Data-Driven Approach for Turkish Grammatical Error Correction and LLMs [0.0] 我々は,新しい有機データ駆動型アプローチ,クリーン挿入を導入し,並列なトルコ文法的誤り訂正データセットを構築する。
トルコの文法的誤り訂正テストの2つのセットについて, 公開されている3つのうちの2つについて, 最先端の結果を得た。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:00:24 GMT)
Optimizing Large Language Models for OpenAPI Code Completion [0.0] 本研究では,GitHub CopilotのOpenAPI補完性能を評価する。
MetaのオープンソースモデルであるCode Llamaを利用したタスク固有の最適化セットを提案する。
微調整されたCode Llamaモデルは、GitHub Copilot上で55.2%のピーク精度向上を達成した。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:19:03 GMT)
Near-coherent quantum emitters in hexagonal boron nitride with discrete polarization axes [0.0] 六方晶窒化ホウ素(hBN)は近年、固体の量子放出体として注目されている。
ここでは、ほぼコヒーレントなhBN量子エミッタを観測するために、スペクトルホールバーニング分光法と共鳴偏光測定を用いる。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:42:53 GMT)
NeSy is alive and well: A LLM-driven symbolic approach for better code comment data generation and classification [0.0] 我々は,C言語におけるコードコメント分類のための合成データを生成するために,記号ベース学習技術と大言語モデル(LLM)エージェントを組み合わせたニューラルシンボリック(NeSy)ワークフローを提案する。
我々の最良のモデルであるニューラルネットワークは、データ拡張後の1.033%の増加でマクロF1スコアが91.412%に達する。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:11:17 GMT)
Multimodal Object Detection via Probabilistic a priori Information Integration [0.0] マルチモーダル物体検出はリモートセンシングにおいて有望であることを示す。
本稿では,対象対象物を含む1つのモダリティのみを含むマルチモーダル物体検出について検討する。
本稿では,文脈のバイナリ情報を確率マップに変換することでアライメント問題を解決することを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:28:06 GMT)
Multi-qubit quantum state preparation enabled by topology optimization [0.0] 逆設計のナノフォトニックキャビティにより、量子エミッタのペアとトリプルの純状態が作成できる。
我々の研究成果は、多ビット量子状態の効率的かつ迅速な準備に向けての道を開くものである。
論文参考訳(メタデータ) (Fri, 24 May 2024 08:52:22 GMT)
Modally Reduced Representation Learning of Multi-Lead ECG Signals through Simultaneous Alignment and Reconstruction [0.0] 本稿では,ECG信号のチャネルに依存しない統一表現を生成することができるECG信号の表現学習手法を提案する。
生成された埋め込みは、下流タスクのためのECG信号の有能な機能として機能します。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:06:05 GMT)
Metrological usefulness of entanglement and nonlinear Hamiltonians [0.0] 量子フィッシャー情報が与えられたパラメータエンコーディングハミルトニアンに対して有界な分離性を超えたときに、メトロロジカルに有用な絡み合いが特定される。
ここでは、非線形ハミルトニアンに対するメロジカルに有用な絡み合いを特徴付け、集合角モータに対する分離性バウンダリを提示する。
また、QFIを最大化する絡み合った状態に対する一般表現も提供し、これらが必ずしもGHZライクな状態ではないことを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:46:55 GMT)
Mask-based Invisible Backdoor Attacks on Object Detection [0.0] ディープラーニングモデルは、バックドア攻撃に弱い。
本研究では,マスクベースのアプローチを用いて,物体検出に対する効果的な視覚的バックドア攻撃を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:17:39 GMT)
Many-body systems with spurious modular commutators [0.0] 近年、ギャップを持つ2次元量子多体系のキラル中心電荷は、モジュラーコンピュテータとして知られるバルク基底状態の絡み合い尺度に比例することが提案されている。
この関係を支持する重要な証拠はあるが、本論文では普遍的ではないことを示す。
任意の大きさのシステムに対して、モジュラーコンピュレータに対して非ゼロの「スパーラス」値を与えるようなキラル中心電荷を消滅させた格子系の例を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 19:27:28 GMT)
MCDFN: Supply Chain Demand Forecasting via an Explainable Multi-Channel Data Fusion Network Model Integrating CNN, LSTM, and GRU [0.0] CNN,Long Short-Term Memory Network (LSTM), Gated Recurrent Units (GRU)を統合したハイブリッドアーキテクチャであるMulti-Channel Data Fusion Network (MCDFN)を紹介する。
我々の厳密なベンチマークは、MCDFNが他の7つのディープラーニングモデルより優れていることを示している。
本研究は,需要予測手法を進歩させ,MCDFNをサプライチェーンシステムに統合するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:30:00 GMT)
Leveraging joint sparsity in hierarchical Bayesian learning [0.0] 複数の測定ベクトルから連続的にスパースなパラメータベクトルを推定するための階層的ベイズ学習手法を提案する。
その結果,従来のベイズ推論手法と組み合わせて新しいアルゴリズム群を生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:37:45 GMT)
Leveraging Semantic Segmentation Masks with Embeddings for Fine-Grained Form Classification [0.0] 史料の効率的な分類は系譜学、法学、歴史学などの分野において重要である。
本稿では、ResNet、マスク付き画像変換器(Di)、埋め込みセグメンテーションなどのディープラーニングモデルを統合した表現型学習戦略を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:45:45 GMT)
Learning Antenna Pointing Correction in Operations: Efficient Calibration of a Black Box [0.0] 運用アンテナシステムのための効率的なオフラインポインティングキャリブレーション手法を提案する。
我々の手法は校正の労力を最小化し、技術的信号情報を活用する。
本実験では,実環境における提案手法の有用性を示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:17:05 GMT)
Large Language Model Pruning [0.0] LLMに特化したモデルプルーニング手法を提案する。
提案手法は深層学習モデルの説明可能性を強調する。
また、大規模モデルにおけるプルーニングと小規模モデルにおけるプルーニングの違いについても検討する。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:22:15 GMT)
Investigating entropic dynamics of multiqubit cavity QED system [0.0] 多ビット空洞量子力学系のエントロピー力学をシミュレートし、エントロピーの様々な側面を探索する。
Tavis-Cummings-Hubbardモデルの修正版では、原子は光ツイーザーを介して光学キャビティに保持される。
原子と空洞との相互作用は異なる電子遷移をもたらし、対応する種類の光子の生成と消滅をもたらす。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:22:29 GMT)
Improving Simulation Regression Efficiency using a Machine Learning-based Method in Design Verification [0.0] 本稿では,Cadenceが導入した機械学習技術,すなわちXcelium MLのランキングと新たな機械学習技術について述べる。
ランク付けは、これまでのシミュレーションで最大のカバレッジを持つと判明した特定の種を選択する。
Xcelium MLは、ランダム化点と過去の回帰のカバレッジとの相関を見出した結果、最適化されたパターンを生成する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:51:51 GMT)
HyperMask: Adaptive Hypernetwork-based Masks for Continual Learning [0.0] CLタスクに応じてターゲットネットワークを動的にフィルタリングするHyperMaskという手法を提案する。
宝くじの仮説により、重み付けされた忘れ物を持つ1つのネットワークを使うことができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:49:30 GMT)
HyperInterval: Hypernetwork approach to training weight interval regions in continual learning [0.0] 埋め込み空間内でのインターバル演算を利用する技術であるHyperIntervalを紹介する。
我々は、連続したタスクに対するインターバル埋め込みを訓練し、ハイパーネットワークをトレーニングし、これらの埋め込みをターゲットネットワークの重みに変換する。
トレーニングの終わりに、すべてのタスク専用の1つのネットワークを生成するために、1つの普遍的な埋め込みを選択することができます。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:20:41 GMT)
Hybrid Context Retrieval Augmented Generation Pipeline: LLM-Augmented Knowledge Graphs and Vector Database for Accreditation Reporting Assistance [0.0] ビジネススクールが認定を受け、維持するためには、厳格で時間のかかる報告と査読プロセスを行わなければならない。
我々は、ドキュメントのアライメントとレポートのプロセスを支援する、ハイブリッドなコンテキスト検索拡張生成パイプラインを作成します。
パイプラインのアウトプットは、機関の利害関係者が認定レポートを構築するために使用することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:05:45 GMT)
Human-in-the-loop Reinforcement Learning for Data Quality Monitoring in Particle Physics Experiments [0.0] 本稿では,データ品質モニタリングプロセスを自動化するために,人間によるループ強化学習を適用するための概念実証を提案する。
人間の分類におけるランダムな非バイアスノイズが低減され,ベースラインの精度が向上することを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:52:46 GMT)
Hierarchical Clustering via Local Search [0.0] 階層クラスタリングのための局所探索アルゴリズムを提案する。
任意の局所最適木は少なくとも$fracn-23sum_i jw(i,j)$の収益を保証し、そこでは$n$はオブジェクトの数で、$w: [n] times [n] mathbbR+$は関連する類似関数である。
論文参考訳(メタデータ) (Fri, 24 May 2024 23:46:24 GMT)
Hermitian stochastic methodology for X-ray superfluorescence [0.0] 最近導入されたX線自発放射の力学をモデル化するための理論的枠組みは、量子エミッタの密度行列と放射場のサンプリングに基づいている。
第一原理に基づいて、価値ある理論的な洞察を与える一方で、元の微分方程式は分岐と数値的不安定性を示す。
ここでは、コンポーネントを摂動的に考慮し、この問題を解決する。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:37:30 GMT)
Generating density nowcasts for U.S. GDP growth with deep learning: Bayes by Backprop and Monte Carlo dropout [0.0] 人工ニューラルネットワーク(ANN)は,GDPの現在の精度において,動的因子モデル(DFM)よりも優れていることを示す。
我々は、ANNが米国のGDP成長のために密度のアップキャストを生成することができる2つの異なるディープラーニングアルゴリズムを適用した。
結果は、BackpropによるBayesとMonte Carloのドロップアウトの両方が、ANNのスコープと機能を効果的に拡張できることを示している。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:06:08 GMT)
From inverse-cascade to sub-diffusive dynamic scaling in driven disordered Bose fluids [0.0] ボースガスが3つの異なる力学系に交差していることが分かる。
これら3つの力学系はすべて、自己相似スケーリング法則によって記述できることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:19:53 GMT)
From Frege to chatGPT: Compositionality in language, cognition, and deep neural networks [0.0] 我々は、哲学、認知科学、神経科学の幅広い読者のために、機械学習による最近の経験的研究をレビューする。
特に,我々は,合成一般化機能を備えたニューラルネットワークを実現するための2つのアプローチを強調した。
これらの発見が人間の認知における構成性の研究にもたらす意味について論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:36:07 GMT)
Feasibility of perturbative generation of bound-states from resonances or virtual states [0.0] 一階摂動理論により共振器や仮想状態から有界状態を生成することができるかを検討する。
次から次への順序相互作用と先行次(LO)波動関数を挟み込むことで負のエネルギー状態が得られることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:35:57 GMT)
Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables [0.0] 「ショートカット」は、新しいデータへの一般化に失敗するトレーニングデータから簡単に学習できるパターンである。
例えば、馬を認識するための著作権の透かし、ハスキーを認識するための雪の背景、悪性皮膚病変を検出するためのインクマーキングなどである。
我々は、グローバルな洞察にインスタンスベースの説明を集約する新しいアプローチである、対実周波数表を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:58:02 GMT)
Entanglement Entropy in Ground States of Long-Range Fermionic Systems [0.0] 一次元格子上の様々な自由フェルミオンモデルの基底状態絡み合いエントロピーのスケーリングについて検討する。
ローカルシステムにおける領域法スケーリングへの移行を規定する,さまざまなシステムに共通する$alpha_c$が存在するかどうかを問う。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:08:52 GMT)
Enhancing Q-Learning with Large Language Model Heuristics [0.0] 大規模言語モデル(LLM)は、単純なタスクでゼロショット学習を達成できるが、推論速度の低下と時折幻覚に悩まされる。
我々は,LLMを幻覚として活用し,強化学習のためのQ関数の学習を支援するフレームワークであるtextbfLLM-guided Q-learningを提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:32:06 GMT)
Efficient Biomedical Entity Linking: Clinical Text Standardization with Low-Resource Techniques [0.0] 複数の用語は、臨床エンティティと呼ばれることができる同じコア概念を参照することができる。
UMLS(Unified Medical Language System)のようなオントロジーは、何百万もの臨床エンティティを格納するために開発・維持されている。
そこで本稿では,エンティティの曖昧さを解消するために,コンテキストベースとコンテキストレスの省力化手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 01:14:33 GMT)
Effective Confidence Region Prediction Using Probability Forecasters [0.0] 本研究では,条件付き確率推定から信頼領域予測を生成する手法を提案する。
実験の約44%は、よく校正された信頼領域の予測を示している。
以上の結果から,医療診断における有効信頼領域予測の実用的メリットが示唆された。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:33:08 GMT)
EHRMamba: Towards Generalizable and Scalable Foundation Models for Electronic Health Records [0.0] 我々は,Mambaアーキテクチャ上に構築された堅牢な基盤モデルであるEHRMambaを紹介する。
EHRMambaは、線形計算コストのために、以前のモデルよりも最大4倍長いシーケンスを処理できる。
EHRデータに対するMTF(Multitask Prompted Finetuning)の新たなアプローチを導入することで,EHRMambaは単一ファインタニングフェーズで複数の臨床タスクを同時に学習することが可能になる。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:22:21 GMT)
Dynamically corrected gates in silicon singlet-triplet spin qubits [0.0] 我々はSi/SiGe二重量子ドットで実現されたシングルトリップキュービットにおける超微細ノイズを軽減するために設計された補正ゲートを実験的に実装した。
修正されたゲートは不忠実度を約3倍に減らし、その結果、アイデンティティとアダマールゲートの両方で0.99以上となる。
論文参考訳(メタデータ) (Fri, 24 May 2024 02:02:51 GMT)
Distribution-free Deviation Bounds and The Role of Domain Knowledge in Learning via Model Selection with Cross-validation Risk Estimation [0.0] リスク推定とモデル選択のためのクロスバリデーション技術は、統計学や機械学習で広く利用されている。
本稿では,クロスバリデーションリスク推定を用いたモデル選択による学習を汎用的な学習フレームワークとして提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:19:27 GMT)
Deterministic interconversion of GHZ state and KLM state via Lie-transform-based pulse design in Rydberg atoms [0.0] 本稿では,GHZ状態とKLM状態のRydberg原子との相互変換を実現する手法を提案する。
数値シミュレーションの結果,本手法はデコヒーレンスや操作上の不完全性に対して頑健であることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 11:33:40 GMT)
Daemonic quantum battery charged by thermalization [0.0] 我々は、量子システムをメモリとして使用し、充電器を計測し、充電状態に電池をそのまま残すプロトコルを導入する。
記憶のエルゴトロピーと,バッテリのデイモン的エルゴトロピーについて検討した。
論文参考訳(メタデータ) (Fri, 24 May 2024 21:31:48 GMT)
D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup [0.0] そこで我々はD-MiSo(Dynamic Multi-Gaussian Soup)を提案する。
また,パラメータ化されたガウススプラットをリンクし,推定メッシュと三角スープを形成する手法を提案する。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:46:19 GMT)
Counterfactual Explanations for Linear Optimization [0.0] 対実的説明(CE)の概念は、複雑なAIシステムの内部動作を理解するための重要な概念の1つとして登場した。
本稿では,CEの考え方を線形最適化に変換し,3種類のCE(強度,弱度,相対性)の提案,動機付け,解析を行う。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:58:00 GMT)
Counterexample-Guided Repair of Reinforcement Learning Systems Using Safety Critics [0.0] 安全評論家を活かした強化学習システム修復のための逆例誘導修復アルゴリズムを考案する。
このアルゴリズムは、勾配に基づく制約最適化を用いて、強化学習エージェントと安全評論家を共同で修復する。
論文参考訳(メタデータ) (Fri, 24 May 2024 10:56:51 GMT)
Comparative Analysis of Four Prominent Ant Colony Optimization Variants: Ant System, Rank-Based Ant System, Max-Min Ant System, and Ant Colony System [0.0] 本研究は,Ant Colony Optimization (ACO)の4変種であるAnt System (AS), Rank-Based Ant System (ASRank), Max-Min Ant System (MMAS), Ant Colony System (ACS)の比較分析を行った。
その結果,アルゴリズムの性能は問題スケールやインスタンスタイプに大きく影響していることがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:51:13 GMT)
ComFe: Interpretable Image Classifiers With Foundation Models, Transformers and Component Features [0.0] コンポーネント特徴(ComFe)は、新しい解釈可能な画像分類手法である。
高度にスケーラブルで、非解釈可能な手法と比較して精度と堅牢性を向上させることができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:10:35 GMT)
Collaborative Access Control for IoT -- A Blockchain Approach [0.0] IoT(Internet of Things)は、多数の相互接続デバイスを保護するために、堅牢なアクセス制御機構を必要とする。
このようなソリューションの問題を識別し、ブロックチェーンベースの分散アクセス制御アプローチを採用する。
提案システムの有効性を実証し,ショートカット機構によりアクセス時間を約43%短縮できることを示した。
論文参考訳(メタデータ) (Fri, 24 May 2024 17:46:53 GMT)
Clustering Survival Data using a Mixture of Non-parametric Experts [0.0] 本研究では,クラスタリングと生存関数予測を統合した生存解析アルゴリズムであるSurvMixClustを紹介する。
5つの公開データセットで評価したところ、SurvMixClustは、異なる生存曲線を持つバランスの取れたクラスタを生成し、クラスタリングベースラインを上回り、予測精度で非クラスタリングサバイバルモデルと競合することがわかった。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:47:58 GMT)
Clifford Group and Unitary Designs under Symmetry [0.0] 対称クリフォード群が対称ユニタリな3次元設計であることは、対称性の制約がパウリ部分群によって記述されるときに限る。
また、パウリ対称性のための単純な量子ゲートを持つ対称クリフォード群の完全かつ一意な構成法も見出した。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:51:49 GMT)
Clearing the Path for Software Sustainability [0.0] 本稿では,第3次研究から得られた知見をもとに,文献における重要な課題を概説する。
ソフトウェア持続可能性の定義に関する混乱、ソフトウェア開発における持続可能性を考えるべき時期に関する不確実性、評価指標とツールの欠如、ソフトウェアシステムの持続可能性に関する狭い視点、認識と教育の不足、実践における重大な考慮の欠如。
論文参考訳(メタデータ) (Fri, 24 May 2024 15:24:24 GMT)
ChatGPT Code Detection: Techniques for Uncovering the Source of Code [0.0] 高度な分類技術を用いて、人間によって書かれたコードとChatGPTによって生成されたコードとを区別する。
我々は、強力な埋め込み機能(ブラックボックス)と教師付き学習アルゴリズムを組み合わせた新しいアプローチを採用する。
トレーニングされていない人間は、ランダムな推測よりも、同じタスクを解くことが示される。
論文参考訳(メタデータ) (Fri, 24 May 2024 12:56:18 GMT)
Benchmarking bosonic modes for quantum information with randomized displacements [0.0] 本稿では,位相空間におけるボソニックモードのランダムな変位を利用したボソニックランダム化ベンチマークプロトコルについて述べる。
捕捉されたイオン系の運動モードに工学的ノイズを注入することにより解析モデルを実験的に検証する。
最後に,本システムにおける固有誤差特性について検討し,高相関雑音の存在を支配的過程として同定した。
論文参考訳(メタデータ) (Fri, 24 May 2024 06:00:05 GMT)
Artificial Intelligence Model for Tumoral Clinical Decision Support Systems [0.0] 脳腫瘍評価における比較診断は、新しい患者が評価された場合と同様の事例を比較するために、医療センターの利用可能な情報を使用することが可能である。
人工知能モデルを活用することで、提案システムは、与えられたクエリに対して最も類似した脳腫瘍を検索することができる。
論文参考訳(メタデータ) (Fri, 24 May 2024 07:25:28 GMT)
Arbitrary quantum circuits on a fully integrated two-qubit computation register for a trapped-ion quantum processor [0.0] トラップイオン量子コンピュータの計算モジュールとして機能するユニバーサル2量子レジスタ上の任意の回路の実装について報告する。
量子ゲートの普遍的な集合は、チップ集積マイクロ波アドレスのみを用いて9$Be$+$イオンの2イオンクーロン結晶上に実装される。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:31:21 GMT)
Anomaly inflow for CSS and fractonic lattice models and dualities via cluster state measurement [0.0] Calderbank-Shor-Steane (CSS) 符号はトーリック符号とフラクトンモデルを含む量子誤り訂正符号のクラスである。
Foliationと呼ばれるプロシージャは、所定のCSSコードのクラスタ状態を定義する。
葉状CSS鎖複合体のサイクルで支持される一般化大域対称性によって保護される対称性保護トポロジカル秩序を有することを論じる。
論文参考訳(メタデータ) (Fri, 24 May 2024 18:00:04 GMT)
An operational distinction between quantum entanglement and classical non-separability [0.0] 量子絡み合い (quantum entanglement) は多次元系における重ね合わせ状態(少なくとも2つの粒子)を記述し、分解不可能であり、したがって分離不能である。
非分離状態は、ベクトル空間を含む古典理論にも存在する。
どちらの場合もベルのような不平等を犯すことが可能である。
論文参考訳(メタデータ) (Fri, 24 May 2024 16:32:33 GMT)
A way around the exponential scaling in optimal quantum control [0.0] 量子不変量と最適制御の分野からのアイデアを組み合わせることで、量子状態に明示的に言及することなく量子系の量子制御を設計できることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 14:48:00 GMT)
A Simple and Efficient Joint Measurement Strategy for Estimating Fermionic Observables and Hamiltonians [0.0] 量子化学と相関するフェルミオン系に関係のあるフェルミオン可観測物とハミルトンを簡易に推定する手法を提案する。
提案手法は,N$モードフェルミオン系におけるマヨラナ作用素の任意の積のノイズバージョンを共同測定する手法の実装に基づいている。
論文参考訳(メタデータ) (Fri, 24 May 2024 13:39:12 GMT)
A Simple Solution for Homomorphic Evaluation on Large Intervals [0.0] ホモモルフィック暗号化(HE)は、プライバシー保護計算に使用される有望な手法である。
非ポリノミカル関数の近似の同型評価は、プライバシ保存機械学習において重要な役割を果たす。
我々は,任意の関数を近似する簡単な解を導入する。
論文参考訳(メタデータ) (Fri, 24 May 2024 04:13:22 GMT)
A Novel Nearest Neighbors Algorithm Based on Power Muirhead Mean [0.0] 本稿では,革新的Power Muirhead Mean K-Nearest Neighbors (PMM-KNN)アルゴリズムを紹介する。
K-Nearest Neighbors法と適応型Power Muirhead Mean演算子を組み合わせる。
多様なベンチマークデータセットに対する大規模な実験は、他の分類法よりもPMM-KNNの方が優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 May 2024 20:04:48 GMT)
A Fisher-Rao gradient flow for entropic mean-field min-max games [0.0] グラディエントフローは多くの機械学習問題に対処する上で重要な役割を果たす。
エントロピー正則化を用いた凸凹型min-maxゲームにおいて,テキストフィッシャー・ラオ(Mean-Field Birth-Death)勾配流の連続時間収束について検討する。
論文参考訳(メタデータ) (Fri, 24 May 2024 09:15:29 GMT)