Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.8] AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:54:06 GMT)
Do LLMs Think Fast and Slow? A Causal Study on Sentiment Analysis [136.1] 感性分析(SA)は、製品レビューのようなテキストで表される感情を特定することを目的としている。
レビューとそれに関連する感情を踏まえると、この研究は2つのタスクの組み合わせとしてSAを定式化します。
総感情スコアがすべての文レベル感情の平均を近似するとC1、総感情スコアがピークとエンドの感情の平均を近似するとC2と分類する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:50:25 GMT)
Llama Scope: Extracting Millions of Features from Llama-3.1-8B with Sparse Autoencoders [115.3] スパースオートエンコーダ(SAE)は、言語モデルからスパース表現を抽出する強力な教師なし手法として登場した。
我々は、Llama-3.1-8B-Baseモデルの各層とサブ層で訓練された256個のSAEスイートを紹介し、32Kと128Kの特徴を持つ。
基礎モデルに基づいて訓練されたSAEのより長い文脈と微調整モデルへの一般化性を評価する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:33:49 GMT)
CorDA: Context-Oriented Decomposition Adaptation of Large Language Models for Task-Aware Parameter-Efficient Fine-tuning [101.8] 現在の微調整手法は、学習すべき下流タスクのコンテキストや、維持すべき重要な知識のコンテキストに広く適用できるアダプタを構築している。
学習可能なタスク対応アダプタを構築するコンテキスト指向の分解適応手法であるCorDAを提案する。
本手法は,知識保存型適応と指導レビュー型適応の2つの選択肢を実現する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:27:57 GMT)
GPT4Video: A Unified Multimodal Large Language Model for lnstruction-Followed Understanding and Safety-Aware Generation [100.2] GPT4Videoは、ビデオ理解と生成の両方の能力で大規模言語モデルを強化する統一されたマルチモデルフレームワークである。
具体的には、安定拡散生成モデルと統合された命令追従型アプローチを開発し、映像生成シナリオを効果的かつ安全に扱うことを実証した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:20:03 GMT)
Historical Test-time Prompt Tuning for Vision Foundation Models [100.0] HisTPTは、学習したテストサンプルの有用な知識を記憶する、履歴的テストタイムプロンプトチューニング技術である。
HisTPTは、異なる視覚認識タスクを処理しながら、一貫した優れたプロンプトチューニング性能を達成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:03:15 GMT)
TabDiff: a Multi-Modal Diffusion Model for Tabular Data Generation [91.5] 1つのモデルで表データのマルチモーダル分布をモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:58:47 GMT)
Decoupled Kullback-Leibler Divergence Loss [90.5] 我々は、クルバック・リブラー(KL)の除算損失がデカップリングカルバック・リブラー(DKL)の除算損失と等価であることを証明した。
我々はKL/DKLにクラスワイドなグローバル情報を導入し、個々のサンプルからバイアスを取ります。
提案手法は,新たな最先端の対人ロバスト性を公衆のリーダーボード上で実現する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:32:11 GMT)
R-CoT: Reverse Chain-of-Thought Problem Generation for Geometric Reasoning in Large Multimodal Models [86.1] 本稿では,R-CoT(Reverse Chain-of-Thought)幾何問題生成パイプラインを提案する。
まず、GeoChainを導入し、高忠実度幾何画像とそれに対応する記述を生成する。
次に、記述に基づいてステップバイステップの推論を行うReverse A&Q手法を設計し、推論結果から逆の質問を生成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:02:01 GMT)
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation [83.6] 本稿では,長期ビデオ生成のための自己回帰モデルを用いた拡散変換器を高速化するフレームワークARLONを提案する。
潜在ベクトル量子変分オートコーダ(VQ-VAE)は、DiTモデルの入力潜時空間をコンパクトなビジュアルトークンに圧縮する。
適応ノルムベースのセマンティックインジェクションモジュールは、ARモデルから粗い離散視覚ユニットをDiTモデルに統合する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:28:28 GMT)
BlinkFlow: A Dataset to Push the Limits of Event-based Optical Flow Estimation [76.7] イベントカメラは、高時間精度、低データレート、高ダイナミックレンジ視覚知覚を提供する。
イベントベース光フローのための大規模データを高速に生成するための新しいシミュレータBlinkSimを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:13:02 GMT)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.3] 視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:26:53 GMT)
VidPanos: Generative Panoramic Videos from Casual Panning Videos [73.8] パノラマ画像ステッチは、カメラの視野を越えて広がるシーンの統一された広角ビューを提供する。
本稿では,カジュアルにキャプチャされたパンニングビデオからパノラマ動画を合成する方法を提案する。
我々のシステムは、人、車、流れる水など、さまざまな場所のシーンにビデオパノラマを作成できる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:13:38 GMT)
BlinkVision: A Benchmark for Optical Flow, Scene Flow and Point Tracking Estimation using RGB Frames and Events [72.3] 我々はBlinkVisionを提案する。BlinkVisionは大規模かつ多彩なベンチマークで、複数のモダリティと高密度対応アノテーションを持つ。
BlinkVisionは、フォトリアリスティックなデータを提供し、カメラの揺らぎや変形など、さまざまな自然主義的な要素をカバーしている。
画像ベースとイベントベースの両方の3種類の対応タスク(光学フロー、点追跡、シーンフロー推定)の広範なベンチマークを可能にする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:59:21 GMT)
Coherence-guided Preference Disentanglement for Cross-domain Recommendations [71.4] 本研究では,共有項目属性を明示的に抽出し,共有ユーザの好みを学習するためのコヒーレンス誘導型参照不整合(CoPD)手法を提案する。
実世界のデータセットで行った実験は、既存の競争ベースラインよりも提案したCoPDの優れた性能を示し、ドメイン間の推薦性能を向上させる効果を強調した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:21:14 GMT)
4-bit Shampoo for Memory-Efficient Network Training [69.1] 二階計算は理論と実践における一階計算よりも優れている。
32ビット状態を圧縮してビット幅を小さくすることで、メモリ使用量の削減が期待できる。
4ビットシャンプーで実演した最初の4ビットの2階目を提案し,32ビットのシャンプーと同様の性能を維持した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:38:02 GMT)
Beyond Interpretability: The Gains of Feature Monosemanticity on Model Robustness [68.7] ディープラーニングモデルは多意味性による解釈可能性の欠如に悩まされることが多い。
神経細胞が一貫したセマンティクスと異なるセマンティクスに対応するモノセマンティクスの最近の進歩は、解釈可能性を大幅に改善した。
モノセマンティックな特徴は解釈可能性を高めるだけでなく、モデル性能の具体的な向上をもたらすことを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:03:20 GMT)
StreamingDialogue: Prolonged Dialogue Learning via Long Context Compression with Minimal Losses [67.9] StreamingDialogueは長い対話履歴を最小限の損失でconv-attnシンクに圧縮する。
本手法は対話タスクにおいて強いベースラインを上回ります。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:14:55 GMT)
What Makes CLIP More Robust to Long-Tailed Pre-Training Data? A Controlled Study for Transferable Insights [67.7] 大規模なデータ不均衡は、Webスケールの視覚言語データセットの間に自然に存在する。
事前学習したCLIPは、教師付き学習と比較してデータ不均衡に顕著な堅牢性を示す。
CLIPの堅牢性と差別性は、より記述的な言語監督、より大きなデータスケール、より広いオープンワールドの概念によって改善される。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:53:20 GMT)
Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.2] 我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:09:59 GMT)
Inevitable Trade-off between Watermark Strength and Speculative Sampling Efficiency for Language Models [63.5] 最大透かし強度と最高サンプリング効率を同時に維持することは不可能である。
本研究では,サンプリング効率と透かし強度を両立させる2つの手法を提案する。
我々の研究は、透かし強度とサンプリング効率の本質的にのトレードオフを理解するための厳密な理論基盤を提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:00:19 GMT)
KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledge [63.2] 知識グラフ埋め込み(KGE)技術は、知識グラフ内の実体と関係のコンパクトな表現を学習するために重要である。
本研究では、エンティティクラスタのセマンティックコヒーレントな階層構造を構築するKG-FITを紹介する。
ベンチマークデータセットFB15K-237、YAGO3-10、PrimeKGの実験は、最先端の訓練済み言語モデルに基づく手法よりもKG-FITの方が優れていることを示した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:31:49 GMT)
Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.3] 本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:27:05 GMT)
LaRS: Latent Reasoning Skills for Chain-of-Thought Reasoning [61.8] Chain-of-Thoughting(CoT)プロンプトは、大規模言語モデル(LLM)のための一般的なコンテキスト内学習手法である。
本稿では、教師なし学習を用いて有理数の潜在空間表現を生成するLaRS(Lalatnt Reasoning Skills)という新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:36:25 GMT)
What Factors Affect Multi-Modal In-Context Learning? An In-Depth Exploration [59.9] 本稿では,MM-ICLの中核となる3つのステップについて検討する。
本研究は, 実演検索におけるマルチモーダルレトリバーの必要性と, 演目間注文よりも演目内注文が重要であることを明らかにする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:37:51 GMT)
Open-Vocabulary Object Detection via Language Hierarchy [58.7] 我々はLHST(Language Hierarchical Self-Training)を設計し、弱教師付き検出器トレーニングに言語階層を導入する。
LHSTは、画像レベルのラベルを言語階層で拡張し、拡張されたラベルと自己学習の共正規化を可能にする。
提案手法は、14の広く研究されている対象検出データセットに対して、一貫して優れた一般化性能を実現する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:20:03 GMT)
Towards Understanding the Working Mechanism of Text-to-Image Diffusion Model [57.2] 近年,高画質テキスト・トゥ・イメージ(T2I)生成に強力な遅延拡散確率モデル (DPM) が適用されている。
段階的デノナイジング生成過程における中間状態を調べることでDPMの背後にあるメカニズムを解明する。
本稿では,テキストガイダンスを適切に取り除き,T2I生成プロセスの高速化に本観測を適用した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:44:41 GMT)
Referring Human Pose and Mask Estimation in the Wild [57.1] 野生における人間行動とマスク推定(R-HPM)について紹介する。
このタスクは、補助ロボティクスやスポーツ分析のような人間中心のアプリケーションにとって大きな可能性を秘めている。
我々は、R-HPMのためのUniPHDと呼ばれる最初のエンドツーエンドのプロンプト可能なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:44:15 GMT)
Optimization Hyper-parameter Laws for Large Language Models [56.3] ハイパーパラメータとトレーニング結果の関係をキャプチャするフレームワークであるOps-Lawsを提案する。
さまざまなモデルサイズとデータスケールにわたる検証は、Opt-Lawsのトレーニング損失を正確に予測する能力を示しています。
このアプローチは、全体的なモデル性能を高めながら、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:53:21 GMT)
DALD: Improving Logits-based Detector without Logits from Black-box LLMs [56.2] 大規模言語モデル(LLM)はテキスト生成に革命をもたらし、人間の文章を忠実に模倣する出力を生成する。
我々は、ブラックボックステキスト検出における最先端性能を再定義する革新的なフレームワークであるDLD(Dis Distribution-Aligned LLMs Detection)を提案する。
DALDは、サロゲートモデルの分布を未知の目標LLMの分布と整合させ、高速モデルの反復に対する検出能力とレジリエンスを向上するように設計されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:55:40 GMT)
Generalization of the exact Eriksen and exponential operators of the Foldy-Wouthuysen transformation to arbitrary-spin particles in nonstationary fields [55.2] 我々はFoldy-Wouthuysen変換を用いて相対論的量子力学のSchr"odinger図を得る。
以前の出版物とは異なり、Foldy-Wouthuysen変換の正確なエリクセンおよび指数作用素を決定する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:41:50 GMT)
FIRP: Faster LLM inference via future intermediate representation prediction [54.9] FIRPはデコードステップ毎に1つではなく複数のトークンを生成する。
いくつかのモデルとデータセットで1.9x-3xのスピードアップ比を示す広範な実験を行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:53:49 GMT)
A Canonicalization Perspective on Invariant and Equivariant Learning [54.4] フレームの設計について,本質的で完全な視点を提供する正準化の視点を導入する。
フレームと標準形式の間には固有の関係があることが示される。
既存の手法よりも厳密な固有ベクトルのための新しいフレームを設計する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:58:54 GMT)
Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.7] 本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。
私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。
我々の手法は最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:22:59 GMT)
MusicFlow: Cascaded Flow Matching for Text Guided Music Generation [53.6] MusicFlowは、フローマッチングに基づくケースドテキストから音楽への生成モデルである。
学習目的としてマスク予測を活用することで,音楽の充実や継続といった他のタスクにモデルを一般化することができる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:35:41 GMT)
R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.2] 3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 05:42:54 GMT)
Kernel Approximation of Fisher-Rao Gradient Flows [52.2] 本稿では,フィッシャー・ラオ型およびワッサーシュタイン型勾配流の勾配構造,流れ方程式,および核近似に関する厳密な研究を行う。
具体的には、フィッシャー・ラオ幾何学とその様々なカーネルに基づく近似に注目し、原理的な理論的枠組みを開発する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:52:08 GMT)
Building, Reusing, and Generalizing Abstract Representations from Concrete Sequences [52.0] 人間は異なるシーケンスで抽象パターンを学習し、無関係な詳細をフィルタリングする。
多くのシーケンス学習モデルには抽象化能力がないため、メモリの非効率性や転送の低さにつながる。
非パラメトリック階層型変数学習モデル(HVM)を導入し、シーケンスからチャンクを学習し、文脈的に類似したチャンクを変数として抽象化する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:13:07 GMT)
Neural Surface Detection for Unsigned Distance Fields [51.8] 我々は、UDFをローカルにSDFに変換するためのディープラーニングアプローチを導入し、既存のアルゴリズムで効果的に三角測量できるようにした。
既存の手法よりも表面検出の精度がよいことを示す。
また,UDF上で動作可能なデュアルメッシュ方式であるDualMeshUDFと併用して,この手法の柔軟性を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:58:06 GMT)
Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphs [51.3] 知識グラフクエリ埋め込み(KGQE)は、不完全なKGに対する複雑な推論のために、低次元KG空間に一階論理(FOL)クエリを埋め込むことを目的としている。
近年の研究では、FOLクエリの論理的セマンティクスをよりよく捉えるために、さまざまな外部情報(エンティティタイプや関係コンテキストなど)を統合している。
コードのようなクエリ命令から遅延クエリパターンをキャプチャする効果的なクエリ命令解析(QIPP)を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:18:52 GMT)
LLM Robustness Against Misinformation in Biomedical Question Answering [51.0] 探索拡張生成(RAG)アプローチは,質問応答のための大規模言語モデル(LLM)の折り畳みを低減するために用いられる。
バイオメディカル質問に対する誤報に対する4つのLDMの有効性とロバスト性を評価した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:23:26 GMT)
Tripartite entanglement from experimental data: $B^0\to K^{*0}μ^+μ^-$ as a case study [49.2] 本研究では,1量子ビットと2量子ビットからなる三部構造に対応する専用実験データからヘリシティ振幅の再構成に基づく角度解析を開発する。
解析の応用として、LHCbの協力によって記録されたデータを用いて、B0to K*0mu+mu-$崩壊における最終状態の完全な量子トモグラフィーを行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:10:13 GMT)
Tripartite entanglement from experimental data: $B^0\to K^{*0}μ^+μ^-$ as a case study [49.2] 本研究では,1量子ビットと2量子ビットからなる三部構造に対応する専用実験データからヘリシティ振幅の再構成に基づく角度解析を開発する。
解析の応用として、LHCbの協力によって記録されたデータを用いて、B0to K*0mu+mu-$崩壊における最終状態の完全な量子トモグラフィーを行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:10:13 GMT)
Certifying classes of $d$-outcome measurements with quantum steering [49.2] 我々は、$d$-outcomesの射影測度の大きなクラスに合わせて、ステアリングの不平等の族を構築する。
これらの不等式に対する最大量子違反は、これらの測定の証明と2つの四重項の最大エンタングル状態に利用できることを証明している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:32:53 GMT)
FuseFL: One-Shot Federated Learning through the Lens of Causality with Progressive Model Fusion [48.9] ワンショットフェデレートラーニング(OFL)は、訓練されたモデルを1回だけ集約することで、FLにおける通信コストを大幅に削減する。
しかし、高度なOFL法の性能は通常のFLよりもはるかに遅れている。
本稿では,FuseFL と呼ばれる,高い性能と低通信・ストレージコストを有する新しい学習手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:07:10 GMT)
Lodge++: High-quality and Long Dance Generation with Vivid Choreography Patterns [48.5] Lodge++は、高品質で、超長い、鮮やかなダンスを生成するためのコレオグラフィーフレームワークである。
計算効率の課題に対処するため、Lodge++では、粗いダンスから罰金までのダンスを生成するための2段階の戦略を採用している。
Lodge++は,様々なダンスジャンルに適した超長いダンスを高速に生成できることを示す広範な実験によって検証されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:32:35 GMT)
AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [47.7] AutoKaggleは、コード実行と単体テストを組み合わせた反復的な開発プロセスを実装し、コードの正しさとロジックの整合性を保証する。
データクリーニング、特徴工学、モデリングのための検証済み機能を含む汎用データサイエンスツールキットは、このソリューションの基礎を形成します。
AutoKaggleは、一般的なデータサイエンスパイプラインにおけるバリデーションレート0.85と総合スコア0.82を達成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:44:25 GMT)
Internet of Federated Digital Twins (IoFDT): Connecting Twins Beyond Borders for Society 5.0 [47.6] デジタルツイン(DT)の概念は将来の産業に革命をもたらすことが期待されており、将来のスマート社会、すなわち社会5.0のビジョンの中心に位置する。
本稿では,異なる社会5.0 サービスを表す DT を全体統合した,インターネット・オブ・フェデレーション・デジタル・ツインズ (IoFDT) の新たな概念を思い起こさせる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 11:35:59 GMT)
CleanDiffuser: An Easy-to-use Modularized Library for Diffusion Models in Decision Making [47.0] CleanDiffuserは、DMベースの意思決定アルゴリズムのための、使いやすくモジュール化されたオープンソースライブラリである。
CleanDiffuserは意思決定コミュニティに長期的なサポートを提供し、より堅牢なソリューションの開発を強化し、促進する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:56:03 GMT)
Learning Continually by Spectral Regularization [45.6] 連続学習アルゴリズムは、ネットワークのトレーニング性を維持しながら、良好な性能を維持することにより、可塑性の損失を軽減する。
我々は,初期化時のニューラルネットワークパラメータの特異値が学習の初期段階におけるトレーニング容易性の重要な要因であることから着想を得た,継続学習を改善するための新しい手法を開発した。
提案するスペクトル正規化器は,連続的な教師付きおよび強化学習環境において,様々なモデルアーキテクチャの訓練性と性能を維持可能であることを示す実験的検討を行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:45:38 GMT)
FoldMark: Protecting Protein Generative Models with Watermarking [44.0] 著作権保護と有害なコンテンツ生成は、タンパク質生成モデルの広範な実装に課題をもたらす。
本稿では,タンパク質生成モデルに透かしを埋め込むことが可能であるか検討する。
タンパク質生成モデルの一般的な透かし戦略としての2段階FoldMarkを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:53:46 GMT)
ThunderKittens: Simple, Fast, and Adorable AI Kernels [43.3] We present ThunderKittens (TK), a framework for write performanceant AI kernels while rest to use and maintain。
我々は、さまざまなAI操作に対して、以前のカーネルと一致するか、より優れているカーネルを提供することで、TKの価値を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:07:16 GMT)
Normal-GS: 3D Gaussian Splatting with Normal-Involved Rendering [42.8] Normal-GSは、通常のベクトルを3DGSレンダリングパイプラインに統合する新しいアプローチである。
そこで本研究では, 表面の精度を向上しつつ, ほぼ最先端の視覚的品質を達成できることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:58:50 GMT)
Plastic Learning with Deep Fourier Features [42.4] プラスチックのアルゴリズムに繋がる基本原理を特定します。
特に, 線形関数近似は, 深部線形ネットワークの特殊な場合と同様に, 可塑性の喪失に悩まされないことを示す理論的結果を提供する。
ディープ・ネットワークは、ディープ・フーリエの機能によって構成され、高度にトレーニング可能であり、学習過程を通じてトレーニング性を維持している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:38:06 GMT)
Memorization in In-Context Learning [42.2] In-context Learning (ICL) は,大規模言語モデル(LLM)の性能向上に有効な手法であることが証明されている。
本研究は、ICLが記憶したトレーニングデータをどのように表すかを示し、この記憶とパフォーマンスの相関について検討した最初のものである。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:04:58 GMT)
SympCam: Remote Optical Measurement of Sympathetic Arousal [42.0] 遠隔同情的覚醒予測の課題に適した新しい畳み込みアーキテクチャを提案する。
本手法により予測された交感神経刺激は, バランスの取れた90%の精度で身体的ストレスを検出することができることを示す。
我々は,遠隔同情的覚醒予測のタスクのために,明示的に設計されたデータセットを寄贈する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:46:55 GMT)
Point-PRC: A Prompt Learning Based Regulation Framework for Generalizable Point Cloud Analysis [39.9] 近年の研究では、パラメータ効率のよいプロンプトチューニングにより、3次元点雲認識の性能が著しく向上できることが示されている。
本稿では,学習可能なプロンプトが大規模3次元モデルにおいて,よく学習された一般知識と積極的に対話することを可能にする包括的規制フレームワークを提案する。
意外なことに,本手法は,一貫した一般化能力の向上だけでなく,様々な3DDGベンチマークにおけるタスク固有の3D認識性能を明確なマージンで向上させる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:35:47 GMT)
TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Best-of-N Sampling [39.0] 推論時アライメントは、追加のトレーニングや微調整を必要とせずに、大きな言語モデルの性能を向上させる。
Best-of-N (BoN) サンプリングは、単純だが強力なアプローチであり、複数のレスポンスを生成し、最良のものを選択する。
我々は、投機的木探索戦略をBest-of-N(BoN)サンプリングに統合する新しいフレームワークであるTreeBoNを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:30:42 GMT)
Generator Matching: Generative modeling with arbitrary Markov processes [37.7] 任意のマルコフプロセスを用いた生成モデリングのためのモダリティに依存しないフレームワークであるジェネレータマッチングを導入する。
本稿では,ジェネレータマッチングが拡散モデル,フローマッチング,離散拡散モデルなど,様々な生成的モデリング手法を統合することを示す。
ジャンププロセスのような新しいマルコフプロセスに設計空間を拡大する基盤を提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:47:29 GMT)
A Proximal Gradient Method With Probabilistic Multi-Gossip Communications for Decentralized Composite Optimization [36.8] 本稿では,分散合成(平滑+非平滑)最適化のための通信効率の良いMG-Skipを提案する。
MG-Skipは通信の複雑さを最適に達成し,非滑らかなセットアップにおけるローカル更新の利点を確認する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:37:14 GMT)
Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy [36.2] テキスト・画像拡散モデルにおける条件付きオーバーフィッティング現象を提案する。
提案手法は, 各種データおよびデータセットのスケールにおいて, 従来手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:43:56 GMT)
On $f$-Divergence Principled Domain Adaptation: An Improved Framework [34.9] 教師なしドメイン適応(UDA)は、機械学習における分散シフトに対処する上で重要な役割を果たす。
本研究では,その$f$-divergence-baseddisrepancyを精査することにより,UDAの理論的基礎を改良する。
また、KLをベースとした新たな測定値として、$f$-domaindisrepancy(f$-DD)を導入しました。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:54:21 GMT)
Beyond Efficiency: A Systematic Survey of Resource-Efficient Large Language Models [33.5] LLM(Large Language Models)は、計算、メモリ、エネルギー、金融資源の高消費に課題をもたらす。
本調査は, LLMの資源効率向上を目的とした多種多様な手法を概観することにより, これらの課題を体系的に解決することを目的としている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:47:47 GMT)
Rethinking Reconstruction-based Graph-Level Anomaly Detection: Limitations and a Simple Remedy [32.6] Graph-AEsの注目すべき応用は、グラフレベル異常検出(GLAD)である。
再建フリップと呼ばれる非自明な反例を報告する。
MUSE という名前の新規でシンプルなGLAD法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:41:51 GMT)
Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning? [32.3] 変圧器を用いた軌道最適化手法はオフライン強化学習(オフラインRL)において例外的な性能を示した。
しかし、パラメータのサイズがかなり大きく、スケーラビリティが制限されているため、特にシーケンシャルな意思決定シナリオでは問題が発生します。
有望な新しい線形時間シーケンスモデルであるMambaは、トランスフォーマーと同等のパフォーマンスを提供すると同時に、長いシーケンスのパラメータをかなり少なく提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:46:58 GMT)
Nova: An Iterative Planning and Search Approach to Enhance Novelty and Diversity of LLM Generated Ideas [30.4] 我々は,大規模言語モデル(LLM)の創造的可能性を高めるために,拡張計画と探索手法を導入する。
我々の枠組みは、特に新規性と多様性において、生成したアイデアの質を大幅に高める。
本手法は,スイスのトーナメント評価において,170枚のシード論文に基づいて,少なくとも2.5倍以上の上位のアイデアを生成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:02:32 GMT)
Guidance Disentanglement Network for Optics-Guided Thermal UAV Image Super-Resolution [29.0] オプティクス誘導熱UAV画像超解像(OTUAV-SR)は大きな研究関心を集めている。
既存の方法は、光学画像から誘導特徴を生成するために単一の誘導モデルを用いており、熱UAV画像の超高解像度化を支援する。
本稿では,典型的なUAVシナリオ属性に従って光画像表現をアンタングル化する,新しい誘導ディアンタングルメントネットワーク(GDNet)を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:49:17 GMT)
Guiding Through Complexity: What Makes Good Supervision for Hard Reasoning Tasks? [29.0] 複雑さの異なるタスクにおいて、様々な品質レベルで監視データを提供する様々なデータ駆動戦略について検討する。
ハードタスクの監視における結果エラー率が高い場合でも、そのようなデータによるトレーニングは、より簡単なサブタスクの監督を完璧に上回ります。
また,本研究の結果から,タスク・インスペクションとサブタスク・インスペクションを補完することで,顕著なパフォーマンス向上が期待できることがわかった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:55:27 GMT)
On the differential and Walsh spectra of $x^{2q+1}$ over $\mathbb{F}_{q^2}$ [28.5] パワー関数 $F(x)=x2q+1$ over $mathbbF_q2$ の微分スペクトルを決定する。
$mathbbF_q2$の特性が$$$であるとき、ウォルシュスペクトルの値分布も$F$である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:09:10 GMT)
Harmony4D: A Video Dataset for In-The-Wild Close Human Interactions [27.7] Harmony4Dは、レスリング、ダンス、MMAなどのフィールド内アクティビティを特徴とする人間と人間のインタラクションのためのデータセットである。
我々は、フレキシブルなマルチビューキャプチャシステムを用いて、これらのダイナミックなアクティビティを記録し、人間検出、追跡、2D/3Dポーズ推定、および密接な相互作用のある被験者のためのメッシュ回復のためのアノテーションを提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:05:15 GMT)
Semi-supervised Symmetric Non-negative Matrix Factorization with Low-Rank Tensor Representation [27.1] 半教師付き対称非負行列分解(SNMF)
対制約行列により合成されたテンソルの低ランク表現を求めるSNMFモデルを提案する。
次に、拡張SNMFモデルを提案し、埋め込み行列を上記のテンソル低ランク表現に適合させる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:23:08 GMT)
To Drop or Not to Drop? Predicting Argument Ellipsis Judgments: A Case Study in Japanese [26.7] 本研究では,日本語のバランスコーパスにおいて,2000以上のデータポイントで特定の議論を省略すべきか否かについて検討する。
データは、ネイティブ話者がこうした判断に対して共通の基準を共有していることを示している。
システムの予測と特定の言語的側面における人間の判断とのギャップが明らかになる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:28:25 GMT)
Wavelet-based Mamba with Fourier Adjustment for Low-light Image Enhancement [26.1] We propose a novel Wavelet-based Mamba with Fourier Adjustment model called WalMaFa。
WMBはDecoderで採用され、FFABはLatent-Decoder構造で採用されている。
実験により,提案したWalMaFaは,計算資源が少なく,高速で,最先端の性能を実現することができた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:48:28 GMT)
Evaluating Deep Unlearning in Large Language Models [26.0] 本研究では,現在行われている大規模言語モデルの未学習手法が,事実の表面的未学習を超えて成功するかどうかを考察する。
我々は、深層学習の程度を定量化するために、メートル法を設計し、リコールする。
その結果,1つの事実のみを深層学習するタスクでは,高いリコールで適切に学習できないか,あるいは他の無関係な事実を未学習にしてしまうことが判明した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:19:23 GMT)
Exocentric To Egocentric Transfer For Action Recognition: A Short Survey [25.4] エゴセントリックな視覚は、カメラ装着者の視点からシーンを捉えます。
外見中心の視覚はシーン全体のコンテキストを捉えます。
エゴとエクソビューの併用モデリングは、次世代AIエージェントの開発に不可欠である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:38:51 GMT)
Practical Bayesian Algorithm Execution via Posterior Sampling [24.8] PS-BAXは後方サンプリングに基づく単純で効果的でスケーラブルなBAX法である。
PS-BAXは、多くの最適化変種やレベルセット推定を含む幅広い問題に適用できる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:11:55 GMT)
Pruning neural network models for gene regulatory dynamics using data and domain knowledge [24.7] 本稿では,モデルフィッティングにおけるドメイン固有構造情報を用いてネットワークプルーニングをガイドするフレームワークであるDASHを提案する。
DASHは、遺伝子相互作用パートナーに関する知識を用いて、一般的な刈り取り法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:50:23 GMT)
Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.9] そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:13:38 GMT)
MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning [23.9] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:48:08 GMT)
MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning [23.9] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:48:08 GMT)
Vector Quantization Prompting for Continual Learning [23.3] 連続学習は、1つのモデルを一連のタスクでトレーニングする際に破滅的な忘れを克服する必要がある。
最近のトップパフォーマンスアプローチは、学習可能なパラメータのセットを使ってタスク知識をエンコードするプロンプトベースの手法である。
本稿では,ベクトル量子化を離散的なプロンプトのエンドツーエンドトレーニングに組み込む,プロンプトに基づく連続学習手法であるVQ-Promptを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:43:53 GMT)
Images that Sound: Composing Images and Sounds on a Single Canvas [22.7] 自然画像と自然音声とを併用した分光図の合成が可能であることを示す。
我々のアプローチは単純でゼロショットであり、事前訓練されたテキスト・ツー・イメージとテキスト・トゥ・スペクトログラム拡散モデルを利用する。
提案手法は,所望の音声プロンプトと一致したスペクトログラムを生成すると同時に,所望の映像プロンプトの視覚的外観を抽出する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:47:14 GMT)
CodeCloak: A Method for Evaluating and Mitigating Code Leakage by LLM Code Assistants [22.3] CodeCloakは、コードアシスタントサービスに送信する前にプロンプトを操作する、新しいディープ強化学習エージェントである。
CodeCloakは、次の2つの矛盾した目標を達成することを目指している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:44:03 GMT)
NT-VOT211: A Large-Scale Benchmark for Night-time Visual Object Tracking [21.9] 本稿では,夜間における視覚的物体追跡アルゴリズムの評価のための新しいベンチマークであるNT-VOT211を提案する。
NT-VOT211は211の多様なビデオで構成されており、カメラモーション、変形、高速モーション、動きのぼやけ、小さなターゲット、邪魔者、オクルージョン、外見など8つの属性を持つ211,000の良質なアノテートフレームを提供している。
これは、これまでで最大の夜間トラッキングベンチマークであり、特に、夜間トラッキングシナリオに固有の、視界の悪さ、画像のぼやけ、イントラクタといった、ユニークな課題に対処するように設計されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:19:48 GMT)
Depth Attention for Robust RGB Tracking [21.9] 本稿では,RGBビデオシーケンスにおける動きのぼかしの影響や視界外なターゲット追跡の課題に対処するために,単眼深度推定を利用した新しいフレームワークを提案する。
我々の知識を最大限に活用するために、我々は最初に深度注意機構を提案し、深度情報と美術追跡アルゴリズムの状態をシームレスに統合するシンプルなフレームワークを定式化した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:47:47 GMT)
Evaluating the design space of diffusion-based generative models [21.5] この記事では、生成プロセス全体について、初めて定量的に理解する。
勾配降下下での復調スコアマッチングの非漸近収束解析を行う。
分散爆発モデルに対する精密サンプリング誤差解析も提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:51:56 GMT)
Bayesian Bandit Algorithms with Approximate Inference in Stochastic Linear Bandits [21.1] 我々は,線形トンプソンサンプリング (LinTS) とベイズ的上部信頼境界の拡張 (LinBUCB) が,元の後悔の上界の速度を保てることを示す。
また、LinBUCBはLinTSの後悔率を$tildeO(d3/2sqrtT)$から$tildeO(dsqrtT)$に短縮することを示した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:43:15 GMT)
FungiTastic: A multi-modal dataset and benchmark for image categorization [21.0] 我々は,20年間にわたって連続的に収集された菌類記録に基づいて,新しいベンチマークとデータセットFungiTasticを導入する。
データセットは専門家によってラベル付けされ、キュレーションされ、5kの細粒度カテゴリー(種)の約350kのマルチモーダル観測で構成されている。
FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:34:38 GMT)
MedGo: A Chinese Medical Large Language Model [20.8] 本稿では,中国の医学大言語モデルであるMedGoについて述べる。
MedGoは、高品質な教師なし医療データ、教師付きデータ、嗜好アライメントデータを組み合わせて訓練された。
その結果、MedGoは様々な中国の医療情報処理タスクで有望なパフォーマンスを達成できた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:52:52 GMT)
S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-training [20.1] S-STEは,2:4スパースに連続的に重みを投影し,テンソルごとの固定スケーリング係数でスパース重みを再スケールする,シンプルな2:4トレーニング手法である。
その結果,提案手法は以前の2:4の事前学習レシピよりも優れており,完全なパラメータモデルでも同等であることがわかった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:15:32 GMT)
LOBG:Less Overfitting for Better Generalization in Vision-Language Model [19.9] 視覚言語モデルのためのLOBGというフレームワークを提案する。
私たちはCLIPを使用して、オーバーフィッティングを引き起こす可能性のあるきめ細かいフォアグラウンド情報をフィルタリングし、基本的な視覚概念でプロンプトを導く。
提案手法は,最先端手法と比較して,一般化能力を大幅に向上し,過度な適合を緩和する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:40:39 GMT)
LOBG:Less Overfitting for Better Generalization in Vision-Language Model [19.9] 視覚言語モデルのためのLOBGというフレームワークを提案する。
私たちはCLIPを使用して、オーバーフィッティングを引き起こす可能性のあるきめ細かいフォアグラウンド情報をフィルタリングし、基本的な視覚概念でプロンプトを導く。
提案手法は,最先端手法と比較して,一般化能力を大幅に向上し,過度な適合を緩和する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:40:39 GMT)
Graph Neural Networks on Discriminative Graphs of Words [19.8] 本研究では,単語グラフニューラルネットワーク(DGoW-GNN)によるテキストの識別手法を提案する。
本稿では,GNNとシーケンスモデルを組み合わせたグラフベースのテキスト分類の新しいモデルを提案する。
提案手法を7つのベンチマークデータセットで評価し,いくつかの最先端ベースラインモデルにより性能が向上していることを確認した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:14:06 GMT)
Props for Machine-Learning Security [19.7] Propsは、マシンラーニング(ML)のためのディープウェブデータへのアクセスを認証し、プライバシ保護するための保護されたパイプラインである
Propsはまた、プライバシ保護の信頼性と推論形式を可能にし、MLアプリケーションで機密データを安全に使用できるようにする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:05:48 GMT)
Accelerating Transformer Pre-training with 2:4 Sparsity [19.6] NVIDIA Ampere GPUは、細粒度の2:4スパース行列乗算を、その密度の高い等価値の2倍の速さで実行することができる。
そこで本研究では,スパース精製ストレートスルー推定器を改良し,温暖化段階における分解係数を推定し,モデルの品質を向上させる3つの手法を提案する。
提案アルゴリズムは,複数の変圧器事前学習タスクにおいて,密集学習アルゴリズムと類似の収束性を実現する一方,変圧器ブロックの異なる形状で実際の加速度を観測することができる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:40:08 GMT)
Large Language Models as Urban Residents: An LLM Agent Framework for Personal Mobility Generation [19.6] 本稿では,Large Language Models (LLMs) をエージェントフレームワークに統合した,個人用モビリティ生成のための新しいアプローチを提案する。
本研究は,LLMと実際の都市モビリティデータとの整合性,信頼性の高い活動生成戦略の開発,都市モビリティにおけるLLM応用の探索という3つの研究課題に対処する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:02:01 GMT)
Denoising: A Powerful Building-Block for Imaging, Inverse Problems, and Machine Learning [19.2] デノイング(Denoising)とは、信号のランダムなゆらぎを減らし、本質的なパターンを強調するプロセスである。
近年のデノナイジング技術、特に撮像技術は顕著な成功を収めている。
その長い歴史にも拘わらず、コミュニティは予期せぬ、画期的なデノベーションの使い方を明らかにし続けている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:08:19 GMT)
Shall We Team Up: Exploring Spontaneous Cooperation of Competing LLM Agents [19.0] 本稿では、エージェントが文脈に深く関与し、明示的な指示なしに適応的な決定を行う自然現象の重要性を強調する。
我々は,3つの競争シナリオにまたがる自発的な協力を探究し,協力の段階的出現をシミュレートした。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:03:37 GMT)
GUMBEL-NERF: Representing Unseen Objects as Part-Compositional Neural Radiance Fields [18.9] 我々は、未確認物体の新規なビューを合成するための隠れた専門家選択機構を備えた、ME(Mix-of-expert)ニューラルラジアンスフィールド(NeRF)モデルであるGumbel-NeRFを提案する。
Gumbel-NeRF は,一対一の入力から未知の物体を新しい視点で合成するタスクに適用した場合,専門家の境界付近で低品質な表現を生成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:07:04 GMT)
Integrating uncertainty quantification into randomized smoothing based robustness guarantees [18.6] ディープニューラルネットワークは、安全クリティカルなアプリケーションにおいて有害な誤った予測を引き起こす可能性のある敵攻撃に対して脆弱である。
ランダムな滑らか化による認証されたロバスト性は、スムーズ化された分類器の予測が与えられた入力の周りの$ell$-ball内では変化しないという確率的保証を与える。
不確実性に基づく拒絶は、しばしば敵の攻撃からモデルを守るために実践的に適用される技法である。
新たなフレームワークは,ネットワークアーキテクチャや不確実性評価の体系的な評価を可能にすることを実証する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:07:43 GMT)
Enhancing Community Vision Screening -- AI Driven Retinal Photography for Early Disease Detection and Patient Trust [17.8] コミュニティビジョンスクリーニングは、視覚障害のある個人を識別し、回避可能な盲目を防ぐ上で重要な役割を担っている。
眼疾患関連視力喪失の患者を、さらに治療のために第三次眼科センターにスクリーニングし、参照するための、シンプルで効率的なプロセスの必要性が高まっている。
本稿では, 単純で非侵襲的な網膜写真に基づくECVS(Enhancing Community Vision Screening)ソリューションについて紹介する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:31:19 GMT)
GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning [17.7] 微分経済学は、深層学習を用いてメカニズム設計を学ぶAMDの一形態である。
GEneral Menu-based NETwork (GemNet) を導入し,マルチバイダ,汎用,完全戦略保護 (SP) オークションを学習する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:47:25 GMT)
Deep Learning, Machine Learning -- Digital Signal and Image Processing: From Theory to Application [17.3] デジタル信号処理(DSP)とDIP(Digital Image Processing)と機械学習(ML)とディープラーニング(DL)は、コンピュータビジョンにおいて人気のある研究分野である。
我々は、画像強調、フィルタリング技術、パターン認識における変換的応用を強調した。
我々は、リアルタイムデータ処理を最適化するアルゴリズムを実装し、コンピュータビジョンにおけるスケーラブルで高性能なソリューションの基礎を形成します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:00:33 GMT)
Optimal Algorithms for Online Convex Optimization with Adversarial Constraints [17.0] COCOでは、そのラウンドのアクションを選択した後、学習者に凸コスト関数と凸制約関数を明らかにする。
我々は、オンラインポリシーが、制限的な仮定なしで、同時に$O(sqrtT)$ regretと$tildeO(sqrtT)$ CCVを達成できることを示します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:37:56 GMT)
Enhancing Domain Adaptation through Prompt Gradient Alignment [16.6] 我々は、ドメイン不変性と特定の特徴の両方を学ぶために、素早い学習に基づく一連の作品を開発する。
我々は、UDAを、各目的がドメイン損失で表される多重目的最適化問題とみなした。
提案手法は,異なるUDAベンチマークにおいて,他のプロンプトベースベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:40:32 GMT)
RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar [15.8] 3D占有に基づく知覚パイプラインは、かなり進歩した自律運転を持つ。
現在の方法では、LiDARやカメラの入力を3D占有率予測に頼っている。
本稿では,4次元イメージングレーダセンサを用いた3次元占有予測手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:15:54 GMT)
CodeRosetta: Pushing the Boundaries of Unsupervised Code Translation for Parallel Programming [15.4] 我々は,プログラミング言語とHPC拡張間の翻訳に特化して設計されたエンコーダ・デコーダモデルであるCodeRosettaを紹介する。
CodeRosettaはC++から並列C++翻訳タスクで評価される。
以上の結果から,CodeRosettaはC++の最先端のベースラインよりも翻訳に優れていた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:34:07 GMT)
Few-shot Open Relation Extraction with Gaussian Prototype and Adaptive Margin [15.1] no-of-the-above (FsRE with NOTA) によるほとんどショット関係抽出は、未知のクラスを持つ数ショットシナリオでラベルを予測することを目的としている。
GPAM for FsRE with NOTA という,ガウスプロトタイプと適応マージンに基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:16:09 GMT)
DeCaf: A Causal Decoupling Framework for OOD Generalization on Node Classification [15.0] グラフニューラルネットワーク(GNN)は、分散シフトの影響を受けやすいため、クリティカルドメインの脆弱性やセキュリティ上の問題が発生する。
不変(機能、構造)-ラベルマッピングの学習を目標とする既存の方法は、データ生成プロセスに関する過度に単純化された仮定に依存することが多い。
構造因果モデル(SCM)を用いたより現実的なグラフデータ生成モデルを提案する。
本稿では,非バイアスな特徴ラベルと構造ラベルのマッピングを独立に学習する,カジュアルなデカップリングフレームワークDeCafを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:22:18 GMT)
Efficient Diversity-based Experience Replay for Deep Reinforcement Learning [15.0] 本稿では, 状態実現における多種多様なサンプルの優先順位付けに決定論的点プロセスを活用する, 多様性に基づく経験リプレイ(DBER)を提案する。
我々は,MuJoCo,Atariゲーム,ハビタットのリアルな室内環境におけるロボットマニピュレーションタスクについて広範な実験を行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:51:27 GMT)
Efficient and Effective Retrieval of Dense-Sparse Hybrid Vectors using Graph-based Approximate Nearest Neighbor Search [14.8] グラフに基づく高密度疎ハイブリッドベクトルのためのANNSアルゴリズムを提案する。
提案アルゴリズムは,既存のハイブリッドベクトル探索アルゴリズムと同等の精度で8.9x$sim$11.7xスループットを実現する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:12:51 GMT)
Distributional MIPLIB: a Multi-Domain Library for Advancing ML-Guided MILP Methods [14.8] 混合線形プログラミング(MILP)は最適化問題をモデル化するための基本的なツールである。
このアプローチの人気は高まっているが、同様のMILPインスタンスのディストリビューションを提供する共通のリポジトリがない。
ML誘導MILP法を進化させるための問題分散ライブラリであるDistributedal MIPLIBを紹介する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 01:54:10 GMT)
Get Large Language Models Ready to Speak: A Late-fusion Approach for Speech Generation [14.7] 大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。
そこで本稿では,TTS-Llamaモデルを用いたテキスト音声合成(TTS)システムを提案する。
さらに,テキストと音声によるマルチモーダルLLMであるMoLE-Llamaを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:28:57 GMT)
Learning from Response not Preference: A Stackelberg Approach for LLM Detoxification using Non-parallel Data [14.6] 本研究は,非並列データのみを用いて大規模言語モデル(LLM)を解毒リウィッターに変換する微調整手法を提案する。
実験により, SRO微細化LLMは, スタイル精度, 内容類似性, 流速に関する最先端モデルに匹敵する満足度を達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:39:54 GMT)
TEAFormers: TEnsor-Augmented Transformers for Multi-Dimensional Time Series Forecasting [14.4] 多次元時系列データは、経済学、金融学、気候科学などの分野でますます普及している。
従来のTransformerモデルはシーケンシャルなデータに適応しているが、これらの多次元構造を効果的に保存していない。
本稿では,Transformer フレームワークにテンソル展開と圧縮を組み込んだ新しい手法である Vectors-Augmented Transformer (TEAFormer) を紹介する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:32:12 GMT)
Q-Distribution guided Q-learning for offline reinforcement learning: Uncertainty penalized Q-value via consistency model [14.2] 我々は,不確実性推定に基づいて,OOD領域のQ値に悲観的な調整を施したQ-Distriion Guided Q-Learning (QDQ)を提案する。
QDQは一貫してD4RLベンチマークで強いパフォーマンスを示し、多くのタスクで大幅な改善を実現している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:39:25 GMT)
CoralSCOP-LAT: Labeling and Analyzing Tool for Coral Reef Images with Dense Mask [14.1] 本研究では,サンゴ礁の自動・半自動ラベル付け・分析ツールであるCoralSCOP-LATを提案する。
提案されたCoralSCOP-LATは、分析効率、精度、柔軟性から、既存のツールをはるかに上回っている。
我々のサンゴ礁分析ツールであるCoralSCOP-LATは、大規模なサンゴ礁モニタリングを繰り返すのに役立ちます。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:26:44 GMT)
Idempotent Unsupervised Representation Learning for Skeleton-Based Action Recognition [13.6] 教師なし表現学習のための新しい骨格ベース等等化生成モデル(IGM)を提案する。
ベンチマークデータセットであるNTU RGB+DとPKUMMDに関する実験により,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:29:04 GMT)
Distillation Improves Visual Place Recognition for Low Quality Images [13.4] リアルタイムの視覚的ローカライゼーションはしばしばオンラインコンピューティングを利用しており、クエリ画像やビデオは視覚的位置認識(VPR)のためにリモートサーバに送信される。
限られたネットワーク帯域幅は、画像品質の低下と、大域的な画像記述子の劣化を必要とし、VPRの精度を低下させる。
本稿では,高品質な画像から特徴表現を学習し,低品質な画像からより識別性の高い記述子を抽出する知識蒸留手法を用いて,記述子抽出レベルでこの問題に対処する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:09:27 GMT)
TorchOpera: A Compound AI System for LLM Safety [13.1] 本稿では,大規模言語モデルにおけるプロンプトと応答の安全性と品質を向上させる複合AIシステムであるTorchOperaを紹介する。
TorchOperaは、すべてのユーザプロンプトが安全で、コンテキスト的にグラウンディングされ、効果的に処理されていることを保証します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:53:40 GMT)
Causal Modeling in Multi-Context Systems: Distinguishing Multiple Context-Specific Causal Graphs which Account for Observational Support [12.7] 複数のコンテキストからのデータによる因果構造学習は、機会と課題の両方をもたらす。
本稿では,文脈間の観察支援の違いが因果グラフの識別可能性に及ぼす影響について検討する。
構造因果モデルにおける文脈固有の独立性をモデル化する枠組みを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:34:58 GMT)
Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping [12.6] 本稿では,動作品質評価のためのMED-ACDTW法を提案する。
提案手法では2次元および3次元の空間次元と複数の人体特徴を用いてテンプレートとテストビデオの特徴を比較する。
適応的制約スキームは、行動品質評価の判別可能性を約30%向上させる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:23:05 GMT)
High-Quality, ROS Compatible Video Encoding and Decoding for High-Definition Datasets [12.3] 本稿では,ロボット・データセットにおける最新のビデオエンコーダの利用について検討する。
ROS 1 と ROS 2 のフレームワーク内で mp4 ビデオを再生できるソフトウェアを提供する。
適切なストレージ制約下で,高品質なビデオデータセットの保存と共有が可能であることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:10:52 GMT)
Deep Learning Based Dense Retrieval: A Comparative Study [11.7] 我々は, BERT, Dense Passage Retrieval (DPR), Contriever, SimCSE, ANCEなどのモデルを評価することにより, 汚染トークン化剤に対する高密度検索システムの脆弱性を評価する。
実験の結果, 小さな摂動でも精度に大きく影響し, 重要なアプリケーションにおける堅牢な防御の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:52:36 GMT)
GrounDiT: Grounding Diffusion Transformers via Noisy Patch Transplantation [11.5] 拡散変換器(DiT)を用いたテキスト・画像生成のための新しいトレーニング不要な空間接地手法を提案する。
DiTは、各バウンディングボックスに対応するノイズの多いパッチを生成し、ターゲットオブジェクトを完全にエンコードし、各領域のきめ細かい制御を可能にする。
提案手法は,意味的共有(semantic sharing)と呼ぶDiTの興味深い性質に基づいている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:30:45 GMT)
PViT: Prior-augmented Vision Transformer for Out-of-distribution Detection [10.7] 我々は、画像出力(OOD)検出のためのViTモデルの堅牢性を高めるために、PViT(Predior-augmented Vision Transformer)を導入する。
PViTは、予測されたクラスロジットと事前訓練されたモデルから得られた前のロジットとのばらつきを定量化することにより、OODサンプルを識別する。
大規模なImageNetベンチマークの実験では、PViTは既存の最先端のOOD検出方法よりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:29:46 GMT)
Conditional GAN for Enhancing Diffusion Models in Efficient and Authentic Global Gesture Generation from Audios [10.6] VAEに基づく手法には、局所的なジッタとグローバルな不安定性の問題が伴う。
本稿では,音声制御信号を捕捉し,拡散段差と発声段差の多モーダル denoising 分布を暗黙的に一致させる条件付き GAN を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:25:11 GMT)
YourSkatingCoach: A Figure Skating Video Benchmark for Fine-Grained Element Analysis [10.3] データセットには、ジャンプ要素の454のビデオ、検出された各ビデオ中のスケータースケルトン、ジャンプの開始フレームと終了フレームのゴールドラベル、フィギュアスケートの動画ベンチマークが含まれている。
そこで本研究では,ジャンプの時間長を正確に検出することを目的とした,新しい動作解析タスクである空気時間検出を提案する。
細粒度ラベルの一般化性を検証するため、粗粒度タスクアクション分類ではなく、クロススポーツタスクとして他のスポーツにも同様のプロセスを適用する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:52:28 GMT)
ArterialNet: Reconstructing Arterial Blood Pressure Waveform with Wearable Pulsatile Signals, a Cohort-Aware Approach [10.2] ArterialNetは、一般化されたパルサタイル-ABP信号変換と、ハイブリッド損失関数と正規化を用いたパーソナライズされた特徴抽出を統合している。
我々はMIMIC-IIIデータセットを用いてArterialNetを検証し,少なくとも標準偏差が58%低い5.41 mmHgの根平均二乗誤差(RMSE)を達成した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:47:53 GMT)
RopeTP: Global Human Motion Recovery via Integrating Robust Pose Estimation with Diffusion Trajectory Prior [10.1] RopeTPは,ロバストポーズ推定と拡散軌道を組み合わせた新しいフレームワークである。
RopeTPは2つのベンチマークデータセットの現在のメソッドを上回っている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:19:39 GMT)
Large Language Models as Data Preprocessors [10.0] 大規模言語モデル (LLM) は人工知能において大きな進歩を遂げている。
本研究では、データマイニングおよび分析アプリケーションにおいて重要な段階である、データ前処理におけるその可能性について検討する。
我々は,最先端のプロンプトエンジニアリング技術を統合したデータ前処理のためのLLMベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:35:47 GMT)
Multiple kernel concept factorization algorithm based on global fusion [9.9] 教師なし環境では、特定のデータセットに対して適切なカーネル関数を設計または選択するために、Globalized Multiple Kernel(GMKCF)と呼ばれる新しいアルゴリズムが提案された。
提案アルゴリズムは,Kernel K-Means(KKM), Spectral Clustering(SC), CF Kernel(KCF), Co-regularized Multi-view spectrum clustering(Coreg), Robust Multiple KKM(RMKKM)などのデータクラスタリングにおける比較アルゴリズムより優れている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:13:57 GMT)
Meta-Learning Approaches for Improving Detection of Unseen Speech Deepfakes [9.9] 現在の音声ディープフェイク検出手法は、既知の相手に対して良好に機能する。
ソーシャルメディア上でのスピーチのディープフェイクの拡散は、目に見えない攻撃に一般化できるシステムの必要性を浮き彫りにしている。
我々はメタラーニングの観点からこの問題に対処し、非常に少ないサンプルで、目に見えない攻撃に適応するために攻撃不変の機能を学ぶことを目的としている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:14:32 GMT)
WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction [9.6] オフロード環境は幾何学的情報に富んでいるため、3Dセマンティック占有予測タスクに適している。
オフロード3Dセマンティック占有予測タスクに密接な占有アノテーションを提供する最初のベンチマークであるWildOccを紹介する。
本稿では, より現実的な結果を得るために, 粗大な再構成を用いた基礎的真理生成パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:11:07 GMT)
Hamiltonian Score Matching and Generative Flows [9.6] スコアマッチングと生成モデルのためのツールとしてハミルトン速度予測器(HVP)を導入する。
HVPを用いて構築された2つの革新は、ハミルトン軌道によるデータの増大によってスコア関数を推定するハミルトンスコアマッチング(HSM)と、非力場を持つHGFとして拡散モデルとフローマッチングを包含する新しい生成モデルであるハミルトン生成フロー(HGF)である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:17:52 GMT)
Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse [9.5] CoT(Chain-of-Thought)は、大規模言語やマルチモーダルモデルを扱う上で広く使われている戦略である。
認知心理学からインスピレーションを得て,CoTが性能を低下させるタスクの特徴を同定する。
予測時間推論を用いた場合,多種多様な最先端モデル群が性能低下を示すことが判明した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:30:41 GMT)
Towards an LLM-Based Speech Interface for Robot-Assisted Feeding [9.5] LLM(Large Language Models)を利用した音声インタフェースにより、個人はロボットに高度なコマンドや微妙な好みを伝えることができる。
本研究では,商用支援ロボットのためのLLMベースの音声インタフェースを実演する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:56:51 GMT)
Vanilla Feedforward Neural Networks as a Discretization of Dynamical Systems [9.4] 本稿では,従来のネットワーク構造に戻り,バニラフィードフォワードネットワークが動的システムの数値的な離散化であることを示す。
我々の結果は、フィードフォワードニューラルネットワークの近似特性を理解するための新しい視点を提供することができる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:56:09 GMT)
Automatic Estimation of Singing Voice Musical Dynamics [9.3] 本稿では,データセットキュレーションの方法論を提案する。
我々は163のスコアファイルと一致して509の楽曲のダイナミックスを歌声の演奏に注釈付けしたデータセットをコンパイルする。
我々は、様々なウィンドウサイズを持つCNNモデルを訓練し、音楽力学を推定するの有効性を評価する。
実験の結果,バークスケールによる音声力学予測は対数メル特徴よりも優れていた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:15:18 GMT)
Prompt-based test-time real image dehazing: a novel pipeline [9.2] 本稿では,プロンプトをベースとしたテストタイム・デハージング(PTTD)について述べる。
合成データに基づいて訓練されたデハジングモデルを用いて、符号化機能の統計(平均および標準偏差)を微調整することにより、領域ギャップを狭めることができることを実験的に観察した。
PTTDはモデルに依存しず、様々な最先端のデハージングモデルを備えており、実際の画像デハージングタスクに取り組むために合成ハジークリーンペアで訓練されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:33:39 GMT)
Unsupervised Panoptic Interpretation of Latent Spaces in GANs Using Space-Filling Vector Quantization [9.2] GAN(Generative Adversarial Network)は、サンプルを現実世界の画像にマッピングできる潜在空間を学習する。
初期の教師付き手法は、解釈可能な潜在空間を作成したり、解釈可能な方向を発見することを目的としていた。
本研究では,空間充足ベクトル量子化 (SFVQ) と呼ばれるベクトル量子化の修正手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:56:02 GMT)
R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest [9.1] R-LLaVAは、単純な医用アノテーションをCLIPを介して画像空間に直接組み込むことで、バイオメディカルVQA理解を高めるように設計されている。
これらの注釈付き視覚領域は、トレーニング中にLLaVAモデルに入力され、バイオメディカルクエリに対するモデルの理解を深めることを目的としている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:56:56 GMT)
Advancing Video Anomaly Detection: A Concise Review and a New Dataset [8.8] ビデオ異常検出(VAD)は、セキュリティ監視、交通監視、産業監視、医療に広く応用されている。
大規模な研究努力にもかかわらず、研究者に洞察力のあるガイダンスを提供する簡潔なレビューは残っていない。
本稿では,様々な視点からモデルとデータセットを考察する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:54:35 GMT)
A Derivational ChainBank for Modern Standard Arabic [8.8] ChainBankはアラビア語の派生形態をモデリングするための新しいフレームワークである。
それは、その派生的重要性を反映した派生した単語の連鎖を構築することによって、形と意味の接続を確立する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:43:23 GMT)
PaPaGei: Open Foundation Models for Optical Physiological Signals [8.8] 光胸腺撮影は生体信号と心臓血管の健康をモニタリングする最も広く用いられている非侵襲的手法である。
PPG信号に基づいてトレーニングされた現在の機械学習モデルは、主にタスク固有であり、一般化性に欠ける。
PPG信号のための最初のオープン基盤モデルPaPaGeiを紹介する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:18:06 GMT)
Efficient Circuit Wire Cutting Based on Commuting Groups [8.6] 現在の量子デバイスは、回路サイズや量子ビット数の増加によるエラー率の増大により、大きな回路を扱う際に困難に直面している。
回路配線切断技術は、大きな回路をより小さく、より管理しやすいサブ回路に分割することでこの問題に対処する。
アンシラ支援型量子プロセストモグラフィーとMUBsを用いた同時計測手法に着想を得て,サブサーキット走行オーバーヘッドを低減できる新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:40:00 GMT)
Embedded Nonlocal Operator Regression (ENOR): Quantifying model error in learning nonlocal operators [8.6] 本研究では,非局所的同化代理モデルとその構造モデル誤差を学習するための新しい枠組みを提案する。
このフレームワークは、長期シミュレーションにおける均質化材料応答予測のための離散性適応不確実性定量化を提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:17:27 GMT)
Spatiotemporal Representation Learning for Short and Long Medical Image Time Series [8.3] 時間的発達の分析は多くの医療条件の正確な予後に不可欠である。
数ヶ月または数年にわたって起こる長期の発達を追跡することは、正確な予後に不可欠である。
短期的・長期的分析と臨床的意思決定の両方の重要性にもかかわらず、彼らは医学的深層学習において過小評価されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:56:00 GMT)
Taming Cross-Domain Representation Variance in Federated Prototype Learning with Heterogeneous Data Domains [8.0] フェデレートラーニング(FL)は、プライベートデータを共有することなく、協調的な機械学習トレーニングを可能にする。
ほとんどのFLメソッドは、クライアント間で同じデータドメインを前提としていますが、現実のシナリオは、しばしば異種データドメインを伴います。
分散を意識した2段階のプロトタイプをクラスタリングし,新たな$alpha$-sparsityのプロトタイプロスを利用するFedPLVMを紹介した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:21:07 GMT)
Rethinking Data Synthesis: A Teacher Model Training Recipe with Interpretation [8.0] 大規模言語モデル(LLM)訓練の最近の進歩は、多種多様な高品質な命令データの必要性を強調している。
データ生成のためのモデルを具体的に訓練する方法を検討することにより、 textbfNOMAD というパラダイムシフトを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:38:39 GMT)
MOMAland: A Set of Benchmarks for Multi-Objective Multi-Agent Reinforcement Learning [7.8] 多目的多エージェント強化学習(MOMARL)は、学習プロセスにおいて複数の目的を考慮する必要がある複数のエージェントによる問題に対処する。
MOAlandは、多目的マルチエージェント強化学習のための標準化された環境の最初のコレクションである。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:55:41 GMT)
S3E: A Multi-Robot Multimodal Dataset for Collaborative SLAM [7.5] 拡張型マルチモーダルデータセットであるS3Eを紹介する。
S3Eは4つの異なる共同軌道パラダイムを横断する無人地上車両群によって捕獲され、13の屋外および5つの屋内シーケンスを含んでいる。
これらのシーケンスは、360度LiDAR点雲、高分解能ステレオ画像、高周波慣性測定ユニット(IMU)、UWB(Ultra-wideband)の相対観測を含む、細心の同期と空間的に校正されたデータストリームを特徴としている。
我々のデータセットは、スケール、シーンの多様性、データの複雑度に関する過去の取り組みを上回るだけでなく、協調的なSLAM方法論と個別のSLAM方法論の徹底的な分析とベンチマークも提供しています。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:11:57 GMT)
Deep Learning-Driven Microstructure Characterization and Vickers Hardness Prediction of Mg-Gd Alloys [7.2] 本研究では,画像処理と深層学習技術に基づくマルチモーダル融合学習フレームワークを提案する。
固溶Mg-Gd合金のビッカース硬さを正確に予測するために, 元素組成と組織特性を統合した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:28:29 GMT)
Personalized Summarization of Scientific Scholarly Texts [7.1] 本稿では,学術論文の抽出要約を生成する教師なしアルゴリズムであるP-Summを提案する。
このアルゴリズムの斬新さは、望ましい知識を取り入れ、個人的な要約の中で望ましくない知識を排除する能力にある。
学術論文からなる4つのデータセット上でのP-Summアルゴリズムの性能評価を行った。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:25:59 GMT)
Active Preference Learning for Ordering Items In- and Out-of-sample [7.1] アイテムペアを積極的にサンプリングすることで、正確な順序付けを学ぶのに必要なアノテーションの数を減らすことができる。
多くのアルゴリズムはアイテム間の共有構造を無視している。
また、比較におけるノイズがアイテムペア間でどのように変化するかは無視することが一般的である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:36:13 GMT)
Is Moral Self-correction An Innate Capability of Large Language Models? A Mechanistic Analysis to Self-correction [7.1] 我々は道徳的自己補正の基本的な2つの疑問に答えることを目指している。
本研究では,異なる自己補正成分が,隠れた状態に埋め込まれた道徳にどう介入するかを検討する。
本稿では,効果的な自己補正を必要とする自己識別フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:52:21 GMT)
Gain-Loss Coupled Systems [7.0] ゲインロス結合系は、小さな次元、高出力、高コヒーレンス、低位相雑音で発振することができる。
このレビューでは、これらのシステムの概要を概観し、基礎的な物理構造、重要な実験観測、理論的洞察を探求する。
著者らは、量子科学と量子技術のためのゲインロス結合システムの理解と応用をさらに進めるために、将来の研究の方向性を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:37:14 GMT)
TrajAgent: An Agent Framework for Unified Trajectory Modelling [7.0] 軌道モデリングは、生活サービス、都市交通、行政などの分野で広く応用されている。
本稿では,大規模言語モデルに基づくエージェントフレームワークであるTrajAgentを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:51:09 GMT)
Maintaining Informative Coherence: Migrating Hallucinations in Large Language Models via Absorbing Markov Chains [6.9] 大規模言語モデル(LLM)は、テキスト生成、翻訳、要約のための強力なツールである。
LLMは、文脈情報の忠実さとコヒーレンスを維持するのに失敗する幻覚症状に悩まされることが多い。
本稿では,マルコフ連鎖を吸収し,文脈情報の重要性を定量化する新しい復号手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:51:18 GMT)
$\textit{Who Speaks Matters}$: Analysing the Influence of the Speaker's Ethnicity on Hate Classification [6.9] 大規模言語モデル(LLM)は、ヘイトスピーチ検出を含むスケーラブルなコンテンツモデレーションに対して、有望な約束を提供する。
弱く、村落や方言に偏っていることが知られている。
そのためには、ヘイトスピーチ検出などの高度なタスクを批判的に精査する必要がある。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:06:24 GMT)
Toward Conditional Distribution Calibration in Survival Prediction [6.9] 本研究では,モデルが観測した時点における個人生存確率を用いて,共形予測に基づく手法を提案する。
限界キャリブレーションと条件キャリブレーションの両方に関する理論的保証を提供し、15の多様な実世界のデータセットに対して広範囲にテストする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:19:46 GMT)
Model Editing as a Robust and Denoised variant of DPO: A Case Study on Toxicity [6.8] 本稿では,無調音アライメントの代替であるProFSを導入し,毒性低減のユースケースでその効果を実証する。
ProFSはモデルパラメータ空間内の有毒な部分空間を特定し、検出された部分空間を投影することでモデル毒性を低減する。
我々は, ProFS が DPO よりもサンプリング効率が高いことを示し,さらにノイズの多いデータに対するロバスト性を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:09:56 GMT)
ANOMIX: A Simple yet Effective Hard Negative Generation via Mixing for Graph Anomaly Detection [6.5] グラフコントラスト学習(GCL)は一般的に多数のサンプルを必要とする。
サンプル数を減らす効果的な方法の1つは、強陰性(例えば、Mixup)を使用することである。
本稿では,新しいグラフ混合手法であるANOmix-MとGADのためのマルチレベルコントラストからなるフレームワークであるANOmixを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:35:12 GMT)
Hierarchical Multiple Kernel K-Means Algorithm Based on Sparse Connectivity [6.5] 本稿では,スパース接続に基づく階層型マルチカーネルK-Means (SCHMKKM) アルゴリズムを提案する。
より離散的な情報融合は、より一貫性のある分割行列を学習するのに有益であることが示されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:35:09 GMT)
Self-Supervised Learning and Opportunistic Inference for Continuous Monitoring of Freezing of Gait in Parkinson's Disease [6.5] パーキンソン病(英: Parkinson's disease、PD)は、生命の質に大きな影響を与える進行性神経疾患である。
既存の症状モニタリング技術はパワーハングリーであり、大量のラベル付きデータに依存し、制御された設定で運用されている。
本研究は,リアルタイムFoG検出のための計算効率の高い自己教師型学習フレームワークLIFT-PDを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:47:18 GMT)
Multi-Agent Target Assignment and Path Finding for Intelligent Warehouse: A Cooperative Multi-Agent Deep Reinforcement Learning Perspective [6.5] 多エージェント目標割り当てと経路計画(TAPF)はインテリジェントウェアハウスにおける2つの重要な問題である。
協調型多エージェント深層強化学習(RL)の観点から目標の割り当てと経路計画を同時に解く方法を提案する。
実験結果から,本手法は様々なタスク設定において良好に動作することが示された。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:09:58 GMT)
Characterization of Noise using variants of Unitarity Randomized Benchmarking [6.4] Unitarity randomized benchmarking (URB) プロトコルは、量子ゲートによって誘導されるノイズのコヒーレンスを推定する方法である。
我々は、実際の量子デバイスから全てのパラメータとノイズモデルを使用する量子シミュレータにおいて、URBプロトコルを初めて実装した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:46:51 GMT)
CATS: Contextually-Aware Thresholding for Sparsity in Large Language Models [6.4] 大規模言語モデル(LLM)は、劇的に高度なAIアプリケーションを持っているが、その膨大な推論コストのため、そのデプロイメントは難しいままである。
本稿では,基本LLMの活性化と推論コストの低減を両立させる新しいフレームワーク,CATS(Contextually Aware Thresholding for Sparsity)を提案する。
提案手法は,Mistral-7BやLlama2-7Bなどの各種ベースモデルに適用可能であり,下流タスク性能において既存のスペーサー化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:15:39 GMT)
MatViX: Multimodal Information Extraction from Visually Rich Articles [6.3] 材料科学では、研究論文から構造化情報を抽出することで、新しい素材の発見を加速することができる。
textscMatViXは、324ドルのフル長の調査記事と1688ドルの複雑な構造化ファイルからなるベンチマークです。
これらのファイルは、テキスト、テーブル、フィギュアからフル長の文書から抽出され、MIEにとって包括的な課題となる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:13:58 GMT)
Prototypical Extreme Multi-label Classification with a Dynamic Margin Loss [6.2] XMC (Extreme Multi-label Classification) メソッドは、非常に大きなラベル空間において、与えられたクエリの関連ラベルを予測する。
XMCにおける最近の研究は、テキスト記述を最も近いラベルの復元に適した埋め込み空間に投影するディープエンコーダを用いてこの問題に対処している。
本稿では,新しいプロトタイプ・コントラスト学習技術を用いて,ブルートフォース手法を超越した効率と性能を再現するXMC手法PRIMEを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:24:23 GMT)
Multi-Agent Target Assignment and Path Finding for Intelligent Warehouse: A Cooperative Multi-Agent Deep Reinforcement Learning Perspective [6.1] 多エージェント目標割り当てと経路計画(TAPF)はインテリジェントウェアハウスにおける2つの重要な問題である。
協調型多エージェント深層強化学習(RL)の観点から目標の割り当てと経路計画を同時に解く方法を提案する。
実験結果から,本手法は様々なタスク設定において良好に動作することが示された。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:09:58 GMT)
SPICEPilot: Navigating SPICE Code Generation and Simulation with AI Guidance [6.0] 大規模言語モデル(LLM)は、コード生成を自動化する大きな可能性を示しています。
しかし、ハードウェア固有の知識が不足しているため、正確な回路レベルのSPICEコードを生成する能力は限られている。
PySpiceを使って生成されたPythonベースの新しいデータセットであるSPICEPilotと、それに伴うフレームワークについて述べる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:58:06 GMT)
Unsupervised Feature Selection Algorithm Based on Dual Manifold Re-ranking [5.8] 本稿では,2次多様体再ランク付け(DMRR)に基づく教師なし特徴選択アルゴリズムを提案する。
異なる類似度行列は、サンプル間、サンプル間、特徴間、特徴間の多様体構造を記述するために構築される。
DMRRを3つの教師なし特徴選択アルゴリズムと2つの教師なし特徴選択後処理アルゴリズムと比較することにより、異なるサンプルの重要性情報と、より優れた特徴選択を実現するために、サンプルと特徴の二重関係が有用であることを確認した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:29:17 GMT)
Towards Efficient and Scalable Training of Differentially Private Deep Learning [5.8] 微分プライベート勾配降下(DP-SGD)は、差分プライバシ(DP)の下で機械学習モデルを訓練するための標準アルゴリズムである。
Poissonサブサンプリングによる計算効率の良いDP-SGDの実装は簡単ではないため、多くの実装がこの要件を無視している。
本研究では,DP下でのディープラーニングモデルを学習する際の計算コストを定量化するための総合的な実証的研究を行う。
PyTorch の Opacus を用いた単純実装 DP-SGD は,SGD よりも2.6~8倍のスループットを持つことがわかった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:32:52 GMT)
Geometric Collaborative Filtering with Convergence [5.7] 本稿では,協調フィルタリングにおける一般化ギャップの概念を導入し,これを潜在協調フィルタリングモデルに対して解析する。
本稿では,損失関数を生じさせる幾何上界と,項目メタタの幾何を有意に活用して推薦を改善する方法を提案する。
提案したGeoCFアルゴリズムは,Movielens20MおよびNetflixデータセット上の既存のすべての手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:56:17 GMT)
Geometric Collaborative Filtering with Convergence [5.7] 本稿では,協調フィルタリングにおける一般化ギャップの概念を導入し,これを潜在協調フィルタリングモデルに対して解析する。
本稿では,損失関数を生じさせる幾何上界と,項目メタタの幾何を有意に活用して推薦を改善する方法を提案する。
提案したGeoCFアルゴリズムは,Movielens20MおよびNetflixデータセット上の既存のすべての手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:56:17 GMT)
SeTAR: Out-of-Distribution Detection with Selective Low-Rank Approximation [5.6] ニューラルネットワークの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
トレーニング不要なOOD検出手法であるSeTARを提案する。
SeTARは、単純なグリーディ探索アルゴリズムを用いて、モデルの重量行列のポストホックな修正によるOOD検出を強化する。
私たちの研究は、OOD検出のためのスケーラブルで効率的なソリューションを提供し、この分野で新しい最先端を設定します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:44:46 GMT)
Modular Learning of Deep Causal Generative Models for High-dimensional Causal Inference [5.5] Modular-DCMは、因果構造を考えると、敵のトレーニングを用いてネットワーク重みを学習する最初のアルゴリズムである。
本稿では,CelebA-HQ における因果不変予測問題を用いて,このアルゴリズムの COVIDx データセットとそのユーティリティへの収束性を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:18:04 GMT)
On the Implicit Relation Between Low-Rank Adaptation and Differential Privacy [5.4] 言語モデルの低ランクタスク適応(LoRAやFLoRAなど)が提案されている。
データプライバシのレンズからの低ランク適応に注目します。
他の既存の微調整アルゴリズムとは異なり、低ランク適応は暗黙的に微調整データのプライバシーを提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:54:59 GMT)
An approach to hummed-tune and song sequences matching [5.0] Hum2Song Zalo AI Challenge 2021は、ユーザーがハミングチューンを打つことで曲の名前を検索するコンテストだ。
本稿では,原型(mp3)からトレーニングおよび推論に使用可能な形式まで,事前処理されたデータの詳細について述べる。
結果は、公開テストセットのMRR@10測定値の94%近くと、公開リーダボードのトップ1に表示される。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:50:43 GMT)
Understanding Sarcoidosis Using Large Language Models and Social Media Data [5.0] サルコイドーシスは,各種臓器に肉芽腫が出現する稀な炎症性疾患である。
我々は,ソーシャルメディアプラットフォームRedditでサルコイドーシスに関連する議論を分析するために,Large Language Model (LLM)を用いた。
プレドニゾンが最も処方された薬剤であり, インフリキシマブは予後改善に最も有効であった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:48:23 GMT)
On the exact quantum query complexity of $\text{MOD}_m^n$ and $\text{EXACT}_{k,l}^n$ [5.0] 我々は、$textMOD_mn$を計算するための正確な量子アルゴリズムを示す。
我々は、0,1n$ を有限集合 $X$ が$n$ 未満であるような対称関数の広いクラスの正確な量子クエリ複雑性を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:18:14 GMT)
NeuroPath: A Neural Pathway Transformer for Joining the Dots of Human Connectomes [4.4] 本稿では, FCのユビキタスインスタンスが, SCによって物理的に配線された神経経路(デトゥール)によってどのようにサポートされているかを明らかにするために, トポロジカルデトゥールの概念を導入する。
機械学習のclich'eでは、SC-FCカップリングの基礎となるマルチホップデトゥール経路により、新しいマルチヘッド自己保持機構を考案することができる。
バイオインスパイアされたニューロパス(NeuroPath)と呼ばれる深層モデルを提案し,これまでにない量のニューロイメージから有意な結合性特徴表現を求める。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:25:05 GMT)
NeuroPath: A Neural Pathway Transformer for Joining the Dots of Human Connectomes [4.4] 本稿では, FCのユビキタスインスタンスが, SCによって物理的に配線された神経経路(デトゥール)によってどのようにサポートされているかを明らかにするために, トポロジカルデトゥールの概念を導入する。
機械学習のclich'eでは、SC-FCカップリングの基礎となるマルチホップデトゥール経路により、新しいマルチヘッド自己保持機構を考案することができる。
バイオインスパイアされたニューロパス(NeuroPath)と呼ばれる深層モデルを提案し,これまでにない量のニューロイメージから有意な結合性特徴表現を求める。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:25:05 GMT)
Perspectives on epitaxial InGaP for quantum and nonlinear optics [4.2] InGaP $chi(2)$非線形集積フォトニクスプラットフォームの概要と実験成果について述べる。
例外的な$chi(2)$非線形性と低光学損失により、エピタキシャルInGaPプラットフォームは幅広い2階非線形光学効果を著しく向上させる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:41:59 GMT)
UTSRMorph: A Unified Transformer and Superresolution Network for Unsupervised Medical Image Registration [4.1] 複雑な画像登録は、医用画像解析において重要な課題である。
本稿では,UTSRMorphネットワークと統合トランスフォーマー(UTSRMorph)ネットワークという,教師なしの新たな画像登録手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:28:43 GMT)
Schrödinger Bridge with Quadratic State Cost is Exactly Solvable [3.8] そこで本稿では,2次状態のコスト・ツー・ゴーを用いたSchr"odinger Bridgeの正規化された変種を提案する。
従来のシュル・オーディンガー橋とは異なり、正規化は状態依存的な確率質量の殺害と生成の速度を誘導する。
我々はこのマルコフ核を閉じた形で導き出し、正規化されたシュル「オーディンガー橋は、非ガウスの終点に対しても、正確に解けるとブラックショーイングする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:21:54 GMT)
ProtSCAPE: Mapping the landscape of protein conformations in molecular dynamics [3.6] 我々は,新しい深層学習アーキテクチャ,タンパク質トランスフォーマー,散乱,注意,位置埋め込み(ProtSCAPE)を導入する。
ProtSCAPEは、幾何学的散乱変換のマルチスケールの性質を利用して、グラフとして概念化されたタンパク質構造から特徴を抽出する。
これらの特徴を、残基やアミノ酸シグナルに焦点をあてた二重の注意構造と統合し、タンパク質軌道の潜在的な表現を生成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:59:48 GMT)
Stable dynamic helix state in the nonintegrable XXZ Heisenberg model [3.6] XXZハイゼンベルクモデルにおけるスピンヘリックス状態の安定性に対する外部場の影響について検討する。
系がカオスのままである限り、ヘリックス状態の不足範囲は顕著な変化を示さない。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:18:40 GMT)
Let it shine: Autofluorescence of Papanicolaou-stain improves AI-based cytological oral cancer detection [3.2] 早期に検出された口腔癌は治療可能であるが、後期に致命的になることが多い。
コンピュータ支援法は、費用対効果と正確な細胞学的解析に不可欠である。
本研究は,マルチモーダルイメージングとディープフュージョンを用いた,AIによる口腔癌検出の改善を目的とする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:58:38 GMT)
Asynchronous Perception Machine For Efficient Test-Time-Training [3.2] テスト時間トレーニング(TTT)のための計算効率の良いアーキテクチャである非同期知覚機械(APM)を提案する。
APMは、任意の順序で、任意の順序で画像のパッチを一度に処理でき、ネット内のセマンティックアウェアネスをテクストゥルエンコードする。
我々は、データセット固有の事前トレーニング、拡張、あるいは任意のプレテキストタスクなしで、配信外画像を認識するAPMの能力を実証する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:57:30 GMT)
Improving Speech-based Emotion Recognition with Contextual Utterance Analysis and LLMs [2.9] 音声感情認識(SER)は、音声言語から感情状態を特定することに焦点を当てている。
データ信頼性を確保するために、まず利用可能なすべての書き起こしを改良する新しいアプローチを提案する。
次に、各会話をより小さな対話に分割し、これらの対話を文脈として使用し、対話内のターゲット発話の感情を予測する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:23:34 GMT)
C-MCTS: Safe Planning with Monte Carlo Tree Search [2.8] CMDP(Constrained Markov Decision Process)の定式化は、制約を受ける安全クリティカルな意思決定タスクの解決を可能にする。
エージェント展開前のオフラインフェーズで時間差学習を訓練した安全評論家を用いてコストを見積もるConstrained MCTS(C-MCTS)を提案する。
C-MCTSはコスト制約を満たすが、制約境界に近づき、以前の作業よりも高い報酬を達成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:11:16 GMT)
Adversarial Robustness Through Artifact Design [2.7] 敵の強靭性を改善するための新しい手法を提案する。
具体的には、標準を再定義し、既存の標準に小さな変更を加え、敵の例から防御する方法を提供する。
交通信号認識の分野における我々のアプローチを評価し,交通信号ピクトグラムとその色を変更する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:09:59 GMT)
Network scaling and scale-driven loss balancing for intelligent poroelastography [2.7] フルウェーブフォームデータからポリ弾性媒体のマルチスケールキャラクタリゼーションのためのディープラーニングフレームワークを開発した。
2つの大きな課題は、この目的のために既存の最先端技術を直接適用することを妨げる。
本稿では, ニューラルネットワークをスケーリング層に構成した単位形状関数を用いて, ニューラルプロパティマップを構築する, エンフェネティックスケーリングの考え方を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:06:29 GMT)
Leveraging Auxiliary Task Relevance for Enhanced Industrial Fault Diagnosis through Curriculum Meta-learning [2.6] 本稿では,RT-ACM強化故障診断フレームワークを提案する。
RT-ACMは補助作業条件の関連性を考慮して訓練を改善する。
このアプローチは、メタラーナーが優れた収束状態を達成するのに役立つ。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:32:41 GMT)
A Tight Lower Bound on Adaptively Secure Full-Information Coin Flip [2.5] コインフリッピングプロトコルでは、計算上の敵は、プロトコルの実行に沿ってどのパーティを腐敗させるかを選択することができる。
我々は、(丸い複雑さの)$n$-partyプロトコルが$omega(sqrtn)$ corruptionsに回復可能であることを証明している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:52:14 GMT)
Brain Networks and Intelligence: A Graph Neural Network Based Approach to Resting State fMRI Data [2.2] 本稿では,rsfMRIによる接続行列上のグラフニューラルネットワークを用いて,インテリジェンス(流動性,結晶化,全知能)を予測するBrainRGINという新しいモデリングアーキテクチャを提案する。
本手法では,脳のサブネットワーク組織の性質を反映するグラフ畳み込み層に,クラスタリングに基づく埋め込みとグラフ同型ネットワークを組み込む。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:56:30 GMT)
A New Non-Binary Response Generation Scheme from Physical Unclonable Functions [2.1] PUFビットの1-確率に基づく新しい非バイナリ応答生成方式を提案する。
FPGA実装の結果は,従来の研究と比べ,有効鍵長が有意に増加したことを示している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:24:17 GMT)
E(3)-invaraint diffusion model for pocket-aware peptide generation [2.0] コンピュータ支援型インヒビター発見の新しい手法として,de novo pocket-aware peptide structureとシーケンス生成ネットワークを提案する。
以上の結果から,本手法は最先端モデルに匹敵する性能を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:59:09 GMT)
Inapproximability of Sparsest Vector in a Real Subspace [2.0] 我々は、実部分空間において最も狭い非零ベクトルを見つけるための強い不近似性を確立する。
任意の定数係数内の部分空間における最も遠いベクトルを近似することはNP-Hardであることが示される。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:27:33 GMT)
Inapproximability of Sparsest Vector in a Real Subspace [2.0] 我々は、実部分空間において最も狭い非零ベクトルを見つけるための強い不近似性を確立する。
任意の定数係数内の部分空間における最も遠いベクトルを近似することはNP-Hardであることが示される。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:27:33 GMT)
A Cosmic-Scale Benchmark for Symmetry-Preserving Data Processing [2.0] 局所的なクラスタリング環境と長距離相関を同時にキャプチャするグラフニューラルネットワークの能力をベンチマークする。
現在のアーキテクチャでは、ドメイン固有のベースラインと同様に、長距離相関から情報を取得することができません。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:58:48 GMT)
Deep Reinforcement Learning Agents for Strategic Production Policies in Microeconomic Market Simulations [1.6] 複数の生産者と競合する市場で効果的な政策を得るためのDRLベースのアプローチを提案する。
我々のフレームワークは、静的およびランダムな戦略を一貫して上回るいくつかのシミュレーションに適応的な生産ポリシーを学習することを可能にする。
その結果,DRLで訓練したエージェントは生産水準を戦略的に調整し,長期利益率を最大化できることがわかった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:38:05 GMT)
A Multivocal Literature Review on Privacy and Fairness in Federated Learning [1.6] フェデレーション学習は、データ共有の必要性を排除することによって、AIアプリケーションに革命をもたらす手段を提供する。
最近の研究では、プライバシと公平性の間に固有の緊張が示されています。
プライバシーと公正性の関係は無視され、現実世界のアプリケーションにとって重大なリスクをもたらしている、と我々は主張する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 11:08:39 GMT)
Virtual imaging trials improved the transparency and reliability of AI systems in COVID-19 imaging [1.6] 本研究は、CTと胸部X線撮影(CXR)を用いた新型コロナウイルス診断における畳み込みニューラルネットワーク(CNN)の使用に焦点を当てる。
複数のAIモデル、すなわち3D ResNet-likeと2D EfficientNetv2アーキテクチャを開発し、テストした。
最も多様なデータセットでトレーニングされたモデルでは、AUCがCTで0.73から0.76、CXRで0.70から0.73まで、最高の外部テスト性能を示した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:03:16 GMT)
Deconfounding Time Series Forecasting [1.6] 時系列予測は様々な領域において重要な課題であり、正確な予測は情報的な意思決定を促進する。
従来の予測手法は、しばしば将来の結果を予測するために変数の現在の観測に依存している。
本稿では,過去のデータから得られた潜在的共同設立者の表現を取り入れた予測手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:45:42 GMT)
A Model for Intelligible Interaction Between Agents That Predict and Explain [1.3] エージェントを特殊特性を持つオートマチックにすることで相互作用モデルを定式化する。
プロトコルの実行によって実行時に現れるプロパティとして,ワンウェイとツーウェイのインテリジェンスを定義する。
a)インダクティブ論理プログラミング(ILP)で行われているように、論理に基づく説明を提供するMLシステムと対話する人間に関する文献報告における1-および2-Way知能の事例を特定し、(b)1-または2-Way知能に精巧な自然言語に基づく対話モデルで人間と機械間の相互作用をマッピングする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:08:57 GMT)
Search Wide, Focus Deep: Automated Fetal Brain Extraction with Sparse Training Data [1.0] 本稿では,スパースな合成ラベルで訓練されたネットワークにおいて,偽陽性を低減するテストタイム戦略を提案する。
我々は、少数の胎児脳ラベルマップから得られた合成画像を用いて、異なるウィンドウサイズでモデルを訓練する。
本研究の枠組みは, トリメスター胎児のHASTE検査における最先端脳抽出法と一致した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:54:01 GMT)
Logarithmically Quantized Distributed Optimization over Dynamic Multi-Agent Networks [1.0] 対数量子化データ伝送を受けるマルチエージェントネットワーク上での分散最適化ダイナミクスを提案する。
均一な量子化と比較すると、ほぼ最適値を表す精度が高く、分散最適化アルゴリズムの精度も高い。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:01:01 GMT)
Accelerating Direct Preference Optimization with Prefix Sharing [0.9] 我々は、選択された応答を1つのシーケンスとして処理し、共有したプレフィックスを1つのシーケンスとして処理する新しいテクニックである、選好チューニングのためのプレフィックス共有を導入する。
コンバージェンスに影響を与えることなく,一般的なDPOデータセットのトレーニングスループットを1.1$-1.5times$改善する。
私たちの研究は、より広い範囲のアプリケーションやモデルサイズに対して、好みベースの微調整をより使いやすくすることに貢献しています。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:06:17 GMT)
Implementation and Application of an Intelligibility Protocol for Interaction with an LLM [0.9] 我々の関心は、機械学習エンジンと対話する人間-専門家を含む対話型システムの構築である。
これは、科学、環境、医学などにおける複雑な問題に対処する場合に関係している。
本稿では,汎用実装のアルゴリズム記述と,その利用に関する予備実験を2つの異なる領域で実施する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:20:18 GMT)
Privacy-Enhanced Adaptive Authentication: User Profiling with Privacy Guarantees [0.7] 本稿では,プライバシ強化型アダプティブ認証プロトコルを提案する。
リアルタイムリスクアセスメントに基づいて認証要求を動的に調整する。
CCPAなどのデータ保護規則を遵守することにより,セキュリティを向上するだけでなく,ユーザの信頼も向上する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:11:33 GMT)
A hybrid quantum solver for the Lorenz system [0.3] 我々は,ロレンツ系を解くための古典量子ハイブリッド法を開発した。
フォワードオイラー法を用いて系を時間的に離散化し、方程式系に変換する。
本稿では,ハイブリッド法と古典的アプローチを比較し,ロレンツ系を解く数値計算結果について述べる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:05:47 GMT)
Few-Shot Transfer Learning for Individualized Braking Intent Detection on Neuromorphic Hardware [0.2] 本研究では、BrainChip上の畳み込みスパイクニューラルネットワーク(CSNN)をトレーニングし、実装するために、数発の転送学習手法の使用について検討する。
その結果、ニューロモルフィックハードウェアのエネルギー効率は97%以上低下し、レイテンシは1.3*しか増加しなかった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:52:33 GMT)
Low-rank Bayesian matrix completion via geodesic Hamiltonian Monte Carlo on Stiefel manifolds [0.2] 低ランクベイズ行列の効率的な計算を可能にするための新しいサンプリングベース手法を提案する。
提案手法は, 標準ギブスサンプリング器で発生するサンプリング困難を, 行列完備化に使用される一般的な2つの行列因子化のために解決することを示す。
数値的な例は、より優れた混合と定常分布への高速収束を含む優れたサンプリング性能を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:12:53 GMT)
WindTunnel -- A Framework for Community Aware Sampling of Large Corpora [0.0] WindTunnelはYextで開発されたフレームワークで、大きなコーパスのサンプルを生成する。
WindTunnelは現在のサンプリング手法の制限を克服し、より正確な評価を提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:49:52 GMT)
When Less is More: Achieving Faster Convergence in Distributed Edge Machine Learning [0.0] リソース制約のあるエッジデバイス上での分散機械学習(DML)は、現実世界のアプリケーションにとって大きな可能性を秘めている。
本稿では,エッジデバイス上での効率的なDMLのための新しい確率的フレームワークであるHermesを提案する。
実世界の異種資源制約環境に対する評価は,Hermesが最先端の手法に比べて高速な収束を実現することを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:17:03 GMT)
Volume-Preserving Transformers for Learning Time Series Data with Structure [0.0] 我々はトランスフォーマーにインスパイアされたニューラルネットワークを開発し、それを使って力学系を学習する。
我々は,アテンション層の活性化関数を構造保存特性を持つ変圧器に置き換える。
これは、ニューラルネットワークを剛体軌道の学習に応用する際の大きな利点である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:05:07 GMT)
Veagle: Advancements in Multimodal Representation Learning [0.0] 本稿では,既存モデルのマルチモーダル能力を向上するための新しいアプローチを提案する。
提案したモデルであるVeagleは、以前の作品の成功と洞察にインスパイアされたユニークなメカニズムを取り入れています。
以上の結果から,Veagleは既存のモデルよりも優れた性能を示し,性能は5-6%向上した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 06:01:49 GMT)
Uncovering Capabilities of Model Pruning in Graph Contrastive Learning [0.0] 我々は、拡張ビューではなく、異なるモデルバージョンを対比することで、グラフのコントラスト学習の問題を再構築する。
教師なしおよび転送学習によるグラフ分類に関する様々なベンチマークにおいて,本手法を広範囲に検証する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:09:31 GMT)
Towards a Blockchain and Opportunistic Edge Driven Metaverse of Everything [0.0] The Metaverse of Everything (MoE)は、Metaverseの概念とInternet of Everything (IoE)を融合したプラットフォームである。
MoEは生成されたデータと仮想エンティティを統合し、相互接続されたコンポーネントの広範なネットワークを作成する。
研究者や企業が将来のサイバーレジリエンス・オパチュニストのMoEを構築するための主な課題を概説している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:02:14 GMT)
Synthesis of Binary-Input Multi-Valued Output Optical Cascades for Reversible and Quantum Technologies [0.0] 本稿では,Sasao と Saraivanov の群論に基づく手法から分解を拡張し,2値入力型多値出力量子カスケードを設計する。
本手法は,3,5,7値の出力に対して提案するが,一般には奇素値の出力に対して用いることができる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:31:24 GMT)
Symbotunes: unified hub for symbolic music generative models [0.0] Symbotunesは、象徴的な音楽生成モデルのためのオープンソースの統一ハブである。
シンボリック・ミュージック・ジェネレーションのためのよく知られたメソッドのモダンなPython実装を含んでいる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:54:58 GMT)
SuperCoder2.0: Technical Report on Exploring the feasibility of LLMs as Autonomous Programmer [0.0] SuperCoder2.0は、人工知能によるソフトウェア開発を強化するために設計された高度な自律システムである。
システムは、AIネイティブな開発アプローチとインテリジェントエージェントを組み合わせて、完全に自律的なコーディングを可能にする。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 05:57:07 GMT)
Smart Transport Infrastructure Maintenance: A Smart-Contract Blockchain Approach [0.0] インフラの整備は複雑であり、特に道路や鉄道のような広く分散した輸送システムにとってである。
従来、これらの要件は紙上で管理され、各コントラクトステップが手作業でチェックされる。
ブロックチェーンの分散台帳技術に基づくスマートコントラクトは、新しいアプローチを提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:03:33 GMT)
Sequential Large Language Model-Based Hyper-Parameter Optimization [0.0] 本研究では,Large Language Models (LLMs)を活用する革新的なフレームワークSLLMBOを紹介する。
SLLMBOは、最近の完全にLLMベースの手法の制限に対処することにより、より堅牢な最適化を実現する。
ベンチマークでは、GPT-3.5-turbo、GPT-4o、Claude-Sonnet-3.5、Gemini-1.5-flashを含む複数のLCMを評価している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:50:30 GMT)
Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network [0.0] SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
本稿では,空間的および効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
セビカは高い復元品質を維持しながら計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:27:07 GMT)
SIGMA: Single Interpolated Generative Model for Anomalies [0.0] 我々は、背景分布を推定する新しい、完全にデータ駆動で、計算効率のよいSIGMAを提案する。
信号領域の背景モデルを得るために、すべてのデータに対して単一の生成モデルをトレーニングし、そのパラメータをサイドバンド領域に補間する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 18:00:00 GMT)
Quantum many-body simulation of finite-temperature systems with sampling a series expansion of a quantum imaginary-time evolution [0.0] 量子コンピュータは、有限温度で大規模システムをシミュレートすることができると期待されている。
有限温度で観測可能な天体の熱平衡期待値を計算するために,この初期段階の量子デバイスに適した手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 05:44:18 GMT)
Predicting Mortality and Functional Status Scores of Traumatic Brain Injury Patients using Supervised Machine Learning [0.0] 外傷性脳損傷(TBI)は公衆衛生上の重大な課題であり、しばしば死亡または持続性障害を引き起こす。
死亡率や機能的状態尺度(FSS)のスコアなどの予測結果は治療戦略を強化し、臨床的な意思決定を通知することができる。
本研究では,300名の小児TBI患者の現実的データセットを用いて,機械学習(ML)を用いて死亡率とFSSスコアを予測する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:44:45 GMT)
Phonon state tomography of electron correlation dynamics in optically excited solids [0.0] 固体中の電子動力学の診断プローブとしてフォノン状態トモグラフィー(PST)を導入する。
PSTはフォノン応答のみにアクセスする実験で電子的挙動を診断するために用いられる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 12:39:56 GMT)
On the set of reduced states of translation invariant, infinite quantum systems [0.0] 変換不変な無限量子スピン鎖の還元状態の集合は半代数的ではないことを示す。
また,追加の初等超越関数が有限項記述に繋がらないという証拠も提示する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:24:28 GMT)
MidiTok Visualizer: a tool for visualization and analysis of tokenized MIDI symbolic music [0.0] MidiTok Visualizerは、MidiTok Pythonパッケージから様々なMIDIトークン化メソッドの探索と視覚化を容易にするために設計されたWebアプリケーションである。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:00:55 GMT)
Malinowski in the Age of AI: Can large language models create a text game based on an anthropological classic? [0.0] この研究は、社会人類学者の「西太平洋の航海士」(1922年)の独創的な人類学研究を中心としたゲームの3つのプロトタイプを作成した。
評価は, 上級人類学者にこれらのゲームを試してみるよう依頼し, ゲームデザインを改良した。
テストは有望な結果を示したが、重要な課題も浮き彫りにした。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:59:17 GMT)
Majorana fermions solve the tetrahedron equations as well as higher simplex equations [0.0] ヤン・バクスター方程式は量子可積分モデルを定義する。
四面体と高次単純方程式は多次元一般化である。
より低い単純度演算子から高次単純度演算子を構築する体系的手法を開発する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:58:30 GMT)
Language Models And A Second Opinion Use Case: The Pocket Professional [0.0] 本研究は、専門的な意思決定において、正式な第二意見ツールとして、LLM(Large Language Models)の役割を検証する。
この研究は、20ヶ月にわたるMedscapeからの183の挑戦的な医療事例を分析し、クラウドソースされた医師の反応に対して複数のLSMのパフォーマンスをテストした。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 23:48:47 GMT)
Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data [0.0] 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームツインサポートベクトルマシンを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:25:42 GMT)
High quality ECG dataset based on MIT-BIH recordings for improved heartbeats classification [0.0] そこで本稿では,MIT-BIH レコード全48点から高品質な心拍データセットを作成する手法を提案する。
提案手法は,アウトレーヤを除去し,平均値を10秒ウィンドウ上で計算することにより,最適な心拍数を算出する。
新たに構築されたデータセットの品質を評価し,既存のデータセットと比較した。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:41:43 GMT)
Hierarchical Universal Value Function Approximators [0.0] 階層的普遍値関数近似器(H-UVFA)を導入する。
我々は,国家,目標,選択肢,行動の埋め込みを学習するための教師付き強化学習手法を開発する。
我々は,HUVFAの一般化を実証し,それに対応するUVFAよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:37:44 GMT)
Hierarchical Universal Value Function Approximators [0.0] 階層的普遍値関数近似器(H-UVFA)を導入する。
我々は,国家,目標,選択肢,行動の埋め込みを学習するための教師付き強化学習手法を開発する。
我々は,HUVFAの一般化を実証し,それに対応するUVFAよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 16:37:44 GMT)
GUIDE: Graphical User Interface Data for Execution [0.0] GUIDEは、MLLM(Multimodal Large Language Model)アプリケーションの開発に適した、新しいデータセットである。
私たちのデータセットは、Apollo(62.67%)、Gmail(.43%)、Calendar(22.92%)など、さまざまなWebサイトのさまざまなデータを含んでいる。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 05:54:50 GMT)
Fractal and Turbulent Feature Extraction and NFT Label Generation for Pollock Style Migration Paintings Based on VGG19 [0.0] 本稿では, 深層学習, フラクタル解析, 乱流特徴抽出技術を融合した革新的な手法を提案する。
画像の内容とスタイルは,MindSporeディープラーニングフレームワークと事前学習されたVGG19モデルにより抽出される。
本手法は,コンテンツ損失,スタイル損失,フル分散損失を組み合わせ,高品質なPollockスタイルの画像を生成する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:02:11 GMT)
Fine-Tuning and Evaluating Open-Source Large Language Models for the Army Domain [0.0] 現在のLarge Language Models (LLM) は、陸軍のユースケースにおける準最適性能を示している。
我々は、既存のドメイン固有性の欠如に対処するため、陸軍領域での使用にオープンソースLLMを適用する可能性について検討する。
TRACLMとMilBenchの作成に関する予備的な結果、モデル、メソッド、レコメンデーションを共有します。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 00:39:24 GMT)
Evolving interdisciplinary contributions to global societal challenges: A 50-year overview [0.0] 近年、学際的なコラボレーションは、イノベーションと効果的な問題解決の重要な原動力として認識されている。
本研究では,国連の持続可能な開発目標に対する学際的貢献の長期的発展について検討する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:36:36 GMT)
Evaluation of uncertainty estimations for Gaussian process regression based machine learning interatomic potentials [0.0] 機械学習の原子間ポテンシャルの不確実性推定は、導入した追加モデルエラーの定量化に不可欠である。
我々は、クーロンおよびSOAP表現を持つGPRモデルを、ポテンシャルエネルギー表面と分子の励起エネルギーを予測する入力として考える。
我々は,GPRの分散とアンサンブルに基づく不確かさが誤差とどのように関係しているか,また,固定された構成空間から最も不確実なサンプルを選択することによりモデル性能が向上するかを評価する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 10:06:09 GMT)
Encrypted system identification as-a-service via reliable encrypted matrix inversion [0.0] 暗号化された計算は、多数のアプリケーションドメインにわたる有望な道を開く。
特に、算術的同型暗号化はクラウドベースの計算サービスに自然に適合する。
本稿では,少なくとも2乗問題に対する信頼性の高い暗号化ソリューションにより,暗号化されたシステム識別サービスを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:00:04 GMT)
Effective Data Stewardship in Higher Education: Skills, Competences, and the Emerging Role of Open Data Stewards [0.0] 高等教育におけるオープンデータの重要性は、オープンサイエンスへの傾向の変化に起因している。
本稿では,データスチュワードシップのための構造化トレーニングフレームワークと総合カリキュラムを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 07:37:36 GMT)
Domain Specific Data Distillation and Multi-modal Embedding Generation [0.0] ドメイン中心の埋め込みを作成するという課題は、非構造化データの豊富さとドメイン固有の構造化データの不足から生じる。
本稿では,非構造化データからノイズをフィルタリングするために構造化データを活用する新しいモデリング手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 03:47:46 GMT)
Development and Evaluation of a Retrieval-Augmented Generation Tool for Creating SAPPhIRE Models of Artificial Systems [0.0] 本研究では,Large Language Models (LLM) をシステム構造記述に活用する方法を検討する。
本稿では,人工システムのSAPPhIRE構造に関連する情報を生成するための新しい検索拡張生成(RAG)ツールを提案する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 11:28:07 GMT)
Detection of adrenal anomalous findings in spinal CT images using multi model graph aggregatio [0.0] 腰痛はプライマリ・ケアの医師に報告される2番目に多い。
腰痛は生涯の人口の50%から80%に影響を及ぼす。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 19:45:15 GMT)
DNAHLM -- DNA sequence and Human Language mixed large language Model [0.0] 本稿では、GPT-2ネットワーク上でトレーニングされた事前学習モデルについて紹介し、DNA配列と英文の組み合わせについて述べる。
次に、分類やその他の下流タスクをAlpacaフォーマット命令データに変換し、命令の微調整を行う。
このモデルはDNA関連ゼロショット予測およびマルチタスク応用においてその効果を実証している。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 15:53:25 GMT)
Complexity of two-level systems [0.0] スピン、量子ビット、磁気モーメントなどの2段階系の複雑性を解析する。
複雑さはシャノンエントロピーとR'enyiエントロピーの間の差として定義される。
その結果,制御パラメータの選択に要する最大複雑性が得られた。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:32:20 GMT)
Clustering and Alignment: Understanding the Training Dynamics in Modular Addition [0.0] モジュラ付加問題に対する2次元埋め込みを用いた小型ニューラルネットワークのトレーニング力学について検討する。
これらの構造を考察し,2組の埋め込みで示される2つの単純な傾向の結果,それらの出現を説明する。
セットアップにおける体重減少の役割について議論し、正規化とトレーニングのダイナミクスを結びつける新しいメカニズムを明らかにします。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:40:33 GMT)
CloudCast -- Total Cloud Cover Nowcasting with Machine Learning [0.0] 雲は天気予報において重要な役割を担い、農業、太陽光発電、航空などいくつかの分野に影響を与える。
数値天気予報(NWP)モデルの進歩にもかかわらず、雲の形成過程の小さな性質のため、雲全体の被覆を予測することは困難である。
我々は、U-Netアーキテクチャに基づいた畳み込みニューラルネットワーク(CNN)であるCloudCastを紹介し、最大5時間前に全クラウドカバー(TCC)を予測するように設計されている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 14:46:13 GMT)
Characterizing entangled state update in different reference frames with weak measurements [0.0] 本研究では,非破壊的弱測定によるマルチパーティント量子ビット状態の更新状態のキャラクタリゼーションについて検討する。
良く知られたように、中間時の更新状態はフレーム依存であり、射影測定に固有の結果ランダム性は、更新された状態で取得される情報を妨げている。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 13:57:29 GMT)
Bosonic Mpemba effect with non-classical states of light [0.0] ムペンバ効果(Mpemba effect)は、ある条件下では、遠方平衡状態が平衡に近い状態よりも早く平衡に向かって緩和できるという驚くべき観察を指す。
光の古典的状態を利用した量子光学におけるMpemba効果の出現を予測する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 08:03:22 GMT)
Bidirectional quantum teleportation using quantum walks [0.0] 2つの独立な1次元格子上の量子ウォークを用いた1量子ビットの双方向テレポーテーション法を提案する。
近隣のジャンプと隣のジャンプを1枚のコインと2枚のコインで組み合わせた2つの異なる方法について議論する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 04:43:04 GMT)
An approximation of the $S$ matrix for solving the Marchenko equation [0.0] 運動量$q$に対するS$-行列依存の新たな近似が提示される。
近似は有理関数の和であり、トランケートされたシンク級数の和である。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 11:06:28 GMT)
Advancing Towards Green Blockchain: A Practical Energy-Efficient Blockchain Based Application for CV Verification [0.0] この記事では、グリーンブロックチェーンソリューションを説明し、システムを従来のコンピュータにデプロイする際の省エネを定量化する。
社会に多大なコストがかかる学術証明書偽造問題に対処するための解決策が提案されている。
この記事では、従来のコンピュータと2台のSBC(Raspberry Pi 4とOrange Pi One)の性能を比較し、後者の低消費電力デバイスを使用できることを示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:32:20 GMT)
Addressing the Pitfalls of Image-Based Structural Health Monitoring: A Focus on False Positives, False Negatives, and Base Rate Bias [0.0] 本研究では, 画像に基づく構造的健康モニタリング技術(SHM)の限界について検討した。
画像ベースのSHMの信頼性は、偽陽性、偽陰性、環境変動などの課題に影響を受けている。
複数のデータソースを組み合わせたハイブリッドシステムなど、これらの制限を緩和するための戦略について議論する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:15:05 GMT)
Accelerating Nash Equilibrium Convergence in Monte Carlo Settings Through Counterfactual Value Based Fictitious Play [0.0] MCCFVFPと呼ばれる不完全な情報ゲームを解決するための新しいMCベースのアルゴリズムを提案する。
MCCFVFPは、CFRの反実値計算と架空のプレイのベストレスポンス戦略を組み合わせる。
その結果,MCCFVFPは最も先進的なMCCFRよりも約20%$sim$50%速かった。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 09:16:16 GMT)
A successive approximation method in functional spaces for hierarchical optimal control problems and its application to learning [0.0] 本研究では,高次元非線形関数をモデル化するための点推定の学習問題について考察する。
デューコースにおける推定パラメータは、異なるモデル検証データセット上で許容できる予測精度を提供する。
最適化段階における一般化と正規化の両方を適切に考慮する枠組みを提供する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 22:28:07 GMT)
A Path Integral Treatment of Time-dependent Dunkl Quantum Mechanics [0.0] 伝搬器の明示的な表現を開発するため,経路積分を再構成した。
この定式化は、時間依存質量と周波数を持つダンクルハーモニック発振器を含む特定のケースに適用される。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 17:53:08 GMT)
A Framework for Real-Time Volcano-Seismic Event Recognition Based on Multi-Station Seismograms and Semantic Segmentation Models [0.0] 火山モニタリングでは、火山活動を理解し、タイムリーに警告を発する上で、地震事象の効果的な認識が不可欠である。
本研究では, セマンティックモデルを用いて, 多チャンネル1次元信号の2次元表現へのストレートフォワード変換を適用することで, 地震イベント認識を自動化する手法を提案する。
本フレームワークは,5つの地震イベントクラスに対して,検出と分類を同時に行うため,最小限の事前処理でマルチステーション地震データを統合する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 21:02:37 GMT)
A Distribution Semantics for Probabilistic Term Rewriting [0.0] 我々は、よく知られた計算形式主義である項書き換えに焦点を当てる。
従来の書き換え規則と確率を組み合わせたシステムを考える。
与えられた削減のために一連の「説明」を計算する方法を示す。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 02:37:31 GMT)
A Comprehensive Survey on Green Blockchain: Developing the Next Generation of Energy Efficient and Sustainable Blockchain Systems [0.0] この記事では、ブロックチェーンの主要なコンポーネントを分析し、そのエネルギー消費を減らすための戦略を探る。
このような目的のために、コンセンサスメカニズムを比較し、ネットワーク通信エネルギー消費を減らすためのレコメンデーションを提供する。
ブロックチェーンシステムにおける消費電力削減の主な課題と限界について分析する。
論文参考訳(メタデータ) (Sun, 27 Oct 2024 20:22:25 GMT)