Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs [194.4] 我々はPhi-4-MiniとPhi-4-Multimodalを導入し、コンパクトだが高機能な言語とマルチモーダルモデルを提案する。
Phi-4-Miniは、高品質なウェブおよび合成データに基づいて訓練された3.8ビリオンパラメータ言語モデルである。
Phi-4-Multimodalは、テキスト、ビジョン、音声、音声の入力モーダルを単一のモデルに統合するマルチモーダルモデルである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:05:52 GMT)
OLMoE: Open Mixture-of-Experts Language Models [180.2] OLMoEは、Sparse Mixture-of-Experts (MoE)を利用した、完全にオープンで最先端の言語モデルである。
OLMoE-1B-7Bは70億(B)のパラメータを持つが、入力トークンごとに1Bしか使用しない。
5兆のトークンで事前トレーニングし、さらにOLMoE-1B-7B-インストラクトを作成するように適応します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:25:46 GMT)
Representation Engineering: A Top-Down Approach to AI Transparency [130.3] 表現工学の新たな領域(RepE)を特定し,特徴付ける
RepEは、神経細胞や回路ではなく、人口レベルの表現を解析の中心に置く。
これらの手法が、広範囲の安全関連問題に対してどのようにトラクションを提供するかを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:14:14 GMT)
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models [115.6] デザインイメージをテキスト記述から合成するフレームワークであるDesignDiffusionを提案する。
提案するフレームワークは,ユーザプロンプトから直接テキストおよびビジュアルデザイン要素を合成する。
視覚テキストから派生した特徴的な文字埋め込みを利用して入力プロンプトを強化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:22:57 GMT)
Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains [114.8] 大規模言語モデル(LLM)は近年顕著なパフォーマンスを達成しているが、基礎となるトレーニングデータによって根本的に制限されている。
本稿では,言語モデルのマルチエージェント社会にファインタニングを適用した自己改善への補完的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:58:16 GMT)
TSVD: Bridging Theory and Practice in Continual Learning with Pre-trained Models [103.5] 連続学習(CL)は、連続的に提示される複数のタスクを解決できるモデルを訓練することを目的としている。
最近のCLアプローチは、ダウンストリームタスクをうまく一般化する大規模な事前学習モデルを活用することで、強力なパフォーマンスを実現している。
しかし、これらの手法には理論的保証がなく、予期せぬ失敗をしがちである。
理論的に健全で高性能な単純なCL法を設計することで,このギャップを埋めることを目指している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:19:08 GMT)
One-shot In-context Part Segmentation [97.8] パートセグメンテーションの課題に取り組むために,One-shot In-context Part (OIParts) フレームワークを提案する。
私たちのフレームワークは、トレーニングのない、フレキシブルで、データ効率のよいパートセグメンテーションに対して、新しいアプローチを提供します。
我々は多種多様な対象カテゴリで顕著なセグメンテーション性能を達成した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:50:54 GMT)
Tuning Timestep-Distilled Diffusion Model Using Pairwise Sample Optimization [97.4] 任意の時間ステップ蒸留拡散モデルを直接微調整できるPSOアルゴリズムを提案する。
PSOは、現在の時間ステップ蒸留モデルからサンプリングされた追加の参照画像を導入し、トレーニング画像と参照画像との相対的な近縁率を増大させる。
PSOは、オフラインとオンラインのペアワイズ画像データの両方を用いて、蒸留モデルを直接人間の好ましくない世代に適応させることができることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:11:46 GMT)
Building Machine Learning Challenges for Anomaly Detection in Science [94.2] 本稿では,異なる科学領域を対象とした機械学習による異常検出を目的とした3つのデータセットを提案する。
3つのデータセットを検索可能、アクセス可能、相互運用可能、再利用可能なものにするために、機械学習の課題を提起する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:54:07 GMT)
VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models [93.9] PyTorchに基づく大規模マルチモーダリティモデルを評価するためのオープンソースツールキットを提案する。
VLMEvalKitは70以上の大規模なマルチモダリティモデルを実装しており、プロプライエタリなAPIとオープンソースモデルの両方を含んでいる。
マルチモーダル学習研究の進展を追跡するために,OpenVLM Leaderboardを主催する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:17:22 GMT)
FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.7] FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:09:29 GMT)
In-Context Learning with Long-Context Models: An In-Depth Exploration [92.2] 大規模なラベル空間を持つ多くのデータセットでは、数千のデモでパフォーマンスが向上し続けています。
長文ICLは有効なツールであり,デモセットのエンコーディングに長文を必要としない可能性があることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:53:28 GMT)
Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models [91.2] 本稿では,機械学習に因果的手法を取り入れて,信頼性の高いMLの主要な原則間のトレードオフをナビゲートすることを提唱する。
我々は、信頼できるMLと基礎モデルの両方において、複数の競合する目標のバランスをとるためには、因果的アプローチが不可欠であると主張する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:00:03 GMT)
Poison-splat: Computation Cost Attack on 3D Gaussian Splatting [90.9] 3DGSで見過ごされてきた重大なセキュリティ脆弱性を明らかにします。
相手は入力画像に毒を加えることで、3DGSトレーニングに必要な計算メモリと時間を大幅に増加させることができる。
このような計算コスト攻撃は、二段階最適化問題に3つの最適化戦略で対処することで達成される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:18:29 GMT)
FlowDec: A flow-based full-band general audio codec with high perceptual quality [90.1] FlowDecは、48kHzでサンプリングされた一般的なオーディオのためのニューラルフルバンドオーディオコーデックである。
音声から一般的な音声へ一般化し、24kbit/sから4kbit/sまで移行する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:49:09 GMT)
Dynamic Search for Inference-Time Alignment in Diffusion Models [87.4] 探索問題としての拡散における推論時間アライメントと動的拡散探索(DSearch)を提案する。
DSearchは、デノナイズプロセスからサブサンプルを取得し、中間ノードの報酬を近似する。
また、ビーム幅と木の拡大を動的に調整し、高次世代を効率的に探索する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:32:05 GMT)
Biomedical Foundation Model: A Survey [84.3] ファンデーションモデルは、広範なラベルなしデータセットから学習する大規模な事前訓練モデルである。
これらのモデルは、質問応答や視覚的理解といった様々な応用に適応することができる。
本研究は,生物医学分野における基礎モデルの可能性を探るものである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:42:00 GMT)
Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold [83.2] 自然科学における複数の過程は、確率密度のワッサーシュタイン多様体上のベクトル場として表さなければならない。
特に、疾患の発生とその治療反応が患者固有の細胞の微小環境に依存するパーソナライズド医療において重要である。
本稿では,初期個体群上の流れモデルを改善することで,ワッサーシュタイン多様体上のこれらのベクトル場と一体化するためのメタフローマッチング(MFM)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:31:16 GMT)
Prior-Fitted Networks Scale to Larger Datasets When Treated as Weak Learners [82.7] BoostPFNは、大規模なデータセットでトレーニングサンプルと同じサイズで、標準的なPFNよりもパフォーマンスがよい。
高い性能はPFNのトレーニング前サイズの最大50倍まで維持される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:31:40 GMT)
Drawing Early-Bird Tickets: Towards More Efficient Training of Deep Networks [82.5] アーリーバード(EB)チケットは、非常に初期の訓練段階で識別できる。
本稿では,計算オーバーヘッドの少ないEBチケットを識別するマスク距離メトリックを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:04:08 GMT)
3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds [81.1] 3D Affordance Detectionは、様々なロボットタスクの幅広い応用において難しい問題である。
我々は従来の割当検出パラダイムをテキスト推論改善(IRAS)タスクに再構成する。
本研究では,3次元オープンシーンにおけるアベイランス検出のためのフレームワークである3D-ADLLMを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:21:57 GMT)
Speculative Knowledge Distillation: Bridging the Teacher-Student Gap Through Interleaved Sampling [81.0] 本研究では,高品質なトレーニングデータを生成するために,投機的知識蒸留(SKD)を導入する。
SKDでは、学生はトークンを提案し、教師はそれ自身の分布に基づいて低いランクのトークンを置き換える。
翻訳,要約,数学,指示文など,各種テキスト生成タスクにおけるSKDの評価を行った。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:24:41 GMT)
FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering [79.4] 経路外ビューの再構築の監督として,コンパクトで高品質な画像を作成するために,逆ビューワーピング技術を導入する。
提案手法は,広く使用されているOpenデータセット上で,経路内および経路外再構成およびレンダリング性能を向上する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:48:47 GMT)
Optimization-based Prompt Injection Attack to LLM-as-a-Judge [78.2] LLM-as-a-Judgeは、大きな言語モデル(LLM)を使用して、ある質問に対する候補セットから最適な応答を選択する。
LLM-as-a-Judgeに対する最適化に基づくプロンプトインジェクション攻撃であるJiceDeceiverを提案する。
評価の結果,JiceDeceiveは既存のプロンプトインジェクション攻撃よりも効果的であることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:36:17 GMT)
InversionGNN: A Dual Path Network for Multi-Property Molecular Optimization [77.8] InversionGNNは、多目的薬物発見のための有効だがサンプル効率のよいデュアルパスグラフニューラルネットワーク(GNN)である。
関数群の最適組み合わせに関する知識を得るために,マルチプロパティ予測のためのモデルを訓練する。
そして、学習された化学知識は、インバージョン生成経路が要求される性質を持つ分子を生成するのに役立つ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:53:36 GMT)
Revisiting Nearest Neighbor for Tabular Data: A Deep Tabular Baseline Two Decades Later [76.7] K$-nearest neighbors (KNN) はもともと,インスタンス間のセマンティックな類似性を捉えるために線形投影を学習するために設計されたものだ。
意外なことに、SGDを用いたNAAの実装と次元減少のない実装は、表データの良好な性能をすでに達成しています。
本稿では、損失関数、予測戦略、深いアーキテクチャなど、これらの改善の背景にある要因を分析して、論文を締めくくる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:38:18 GMT)
Twenty Years of Personality Computing: Threats, Challenges and Future Directions [76.5] パーソナリティ・コンピューティング(Personality Computing)は、パーソナリティ心理学とコンピュータ科学の交差点にある分野である。
本稿では、その分野の概要を述べ、鍵となる方法論を探求し、課題と脅威について論じ、パーソナリティ・コンピューティング・テクノロジーの開発・展開における今後の方向性について概説する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:03:48 GMT)
Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.0] 本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:24:06 GMT)
Divide and Conquer: Heterogeneous Noise Integration for Diffusion-based Adversarial Purification [75.1] 既存の浄化法は,前向き拡散過程を通じて一定のノイズを発生させ,その後に逆の処理を行い,クリーンな例を回復させることによって,対向的摂動を妨害することを目的としている。
この方法は、前処理の均一な操作が、対向的摂動と闘いながら通常のピクセルを損なうため、根本的な欠陥がある。
ニューラルネットワークの解釈可能性に基づく異種浄化戦略を提案する。
本手法は,被写体モデルが注目する特定の画素に対して高強度雑音を決定的に印加する一方,残りの画素は低強度雑音のみを被写体とする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:00:25 GMT)
AxBench: Steering LLMs? Even Simple Baselines Outperform Sparse Autoencoders [73.4] ステアリングと概念検出のための大規模ベンチマークであるAxBenchを紹介する。
ステアリングでは、すべての既存のメソッドを高速に処理し、次いで微調整する。
概念検出では、差分のような表現に基づく手法が最善を尽くす。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:15:30 GMT)
Towards Training One-Step Diffusion Models Without Distillation [72.8] この蒸留工程を使わずに, 一段階生成モデルを直接訓練できることが示される。
本稿では, スコア推定に頼ることなく, 競争力のある結果が得られる蒸留法群を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:38:34 GMT)
MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses [72.4] 化学仮説の大多数は、研究の背景といくつかのインスピレーションから得られると仮定する。
これらの問題を調査するため,我々は,自然,科学,あるいは2024年に公表された51の化学論文からなるベンチマークを構築した。
全ての論文は化学博士課程の学生によって背景、インスピレーション、仮説の3つの構成要素に分けられる。
目的は、背景と大きなランダムに選択された化学文献コーパスのみを考慮し、仮説を再発見することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:17:24 GMT)
Multimodal Lead-Specific Modeling of ECG for Low-Cost Pulmonary Hypertension Assessment [71.7] 低所得国や中所得国(LMIC)では,高度な診断ツールが不足しているため,肺高血圧症(PH)が頻繁に診断される。
我々は,大人口12L-ECGデータに基づいて事前学習したモデルであるLS-EMVAE(Lead-Specific Electrocardiogram Multimodal Variational Autoencoder)を提案する。
LS-EMVAEは、推論時に12L-ECGと6L-ECGの両方でより良い予測を行い、診断ツールが限られている領域や全くない領域において、同等の解となる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:16:38 GMT)
Understanding LLMs' Fluid Intelligence Deficiency: An Analysis of the ARC Task [71.6] 認知研究において、後者の能力は流体インテリジェンスと呼ばれ、人間のインテリジェンスを評価するために重要であると考えられている。
流体インテリジェンス評価に関する最近の研究は、LLMの能力に重大な欠陥を浮き彫りにした。
本研究は,既存のLSMにおいて,スキル構成能力の制限,抽象的な入力形式に慣れていないこと,左から右への復号化の本質的欠如の3つの大きな限界を明らかにした。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:50:25 GMT)
A Survey on Vision-Language-Action Models for Embodied AI [71.2] エンボディードAIは、人工知能の重要な要素として広く認識されている。
組込みAIにおける言語条件ロボットタスクに対処するために、マルチモーダルモデルの新たなカテゴリが登場した。
具体的AIのための視覚-言語-アクションモデルに関する第1回調査を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:19:31 GMT)
Contextual Continuum Bandits: Static Versus Dynamic Regret [70.7] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
線形な静的な後悔を実現するアルゴリズムは,任意のアルゴリズムを拡張して,線形な動的後悔を実現することができることを示す。
インテリアポイント法にインスパイアされ,自己協和障壁を用いるアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:11:43 GMT)
AI persuading AI vs AI persuading Humans: LLMs' Differential Effectiveness in Promoting Pro-Environmental Behavior [70.2] 環境保護行動(PEB)は気候変動に対処するために不可欠であるが、意識を意図や行動に変えることはいまだ明白である。
大規模言語モデル(LLM)をPEBを促進するツールとして検討し,その影響を3,200人の参加者で比較した。
人工的およびシミュレートされたエージェントは、介入後のEBスタンスに大きく影響し、ヒトの反応はほとんど変化しない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:40:55 GMT)
On Memory Construction and Retrieval for Personalized Conversational Agents [69.5] 本稿では,セグメンテーションモデルを導入し,セグメントレベルでメモリバンクを構築するセグメンテーション手法であるSeComを提案する。
実験結果から,SeComは長期会話ベンチマークLOCOMOとLong-MT-Bench+のベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:49:18 GMT)
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation [69.4] 本稿では,複数のベース条件からイメージ・ツー・イメージ生成の共通知識を学習するために,ベース制御ネットを訓練するCtrLoRAフレームワークを提案する。
学習可能なパラメータをControlNetと比較して90%削減し,モデルの重み付けとデプロイのしきい値を大幅に下げる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:33:49 GMT)
Understanding Dataset Distillation via Spectral Filtering [69.1] 多様なDD目標を統一するスペクトルフィルタリングフレームワークであるUniDDを紹介する。
UniDDは、DDの本質が基本的に周波数固有の特徴に合致していることを明らかにする。
この制限に対処するため,低周波情報と高周波情報の両方をカバーするためにフィルタパラメータを徐々に調整するCFM(Curriculum Frequency Matching)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:22:34 GMT)
Robust Preference Optimization through Reward Model Distillation [68.7] Direct Preference Optimization (DPO) は、プライオリティデータに基づいてポリシーを直接訓練する一般的なオフラインアライメント手法である。
我々はこの現象を分析し、蒸留を用いて生成対よりも真の嗜好分布のより良いプロキシを得る。
以上の結果から,このような報酬モデルからの蒸留は,優先アノテーションの分布変化に対するロバスト性の向上につながることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:22:25 GMT)
A Lightweight Deep Exclusion Unfolding Network for Single Image Reflection Removal [68.1] シングルイメージリフレクション除去(SIRR)は、標準的なブラインドソース分離問題である。
本稿ではSIRRのための新しいDeep Exclusion Unfolding Network(DExNet)を提案する。
DExNetは、単純な反復スパースと補助的特徴更新(i-SAFU)アルゴリズムの展開とパラメータ化によって構築される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:54:27 GMT)
MI-DETR: An Object Detection Model with Multi-time Inquiries Mechanism [67.6] 並列マルチ時間問い合わせ(MI)機構を備えた新しいデコーダアーキテクチャを提案する。
我々のMIベースモデルであるMI-DETRはCOCOベンチマークで既存のDETRライクなモデルよりも優れています。
診断と可視化の一連の実験は、MIの有効性、合理性、解釈可能性を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:19:06 GMT)
AutoAdvExBench: Benchmarking autonomous exploitation of adversarial example defenses [66.9] AutoAdvExBenchは、大規模言語モデル(LLM)が敵の例に対する防衛を自律的に活用できるかどうかを評価するためのベンチマークである。
我々は,CTF様(ホームワークエクササイズ)の75%を破壊できる強力なエージェントを設計する。
このエージェントは、我々のベンチマークの現実世界の防御の13%でしか成功できないことを示し、実際の"コードを攻撃することの難しさとCTFライクなコードとの間に大きなギャップがあることを示します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:39:48 GMT)
Vista-LLaMA: Reducing Hallucination in Video Language Models via Equal Distance to Visual Tokens [66.8] Vista-LLaMAは、すべての視覚トークンと任意の言語トークンとの一貫性のある距離を維持する新しいフレームワークである。
本稿では,現在の映像フレームを前フレームの助けを借りて,言語空間のトークンに投影する逐次視覚プロジェクタを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:58:12 GMT)
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models [65.9] 本稿では,3次元再構成と新規ビュー合成を向上する新しいパイプラインであるDifix3D+を紹介する。
このアプローチのコアとなるのは、レンダリングされた新規ビューにおけるアーティファクトの強化と削除のためにトレーニングされた、単一ステップのイメージ拡散モデルであるDifixです。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:58:33 GMT)
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs [65.6] レイヤーワイド量子化は、高価なリトレーニングなしで大きなモデルを効率的に圧縮するための重要な技術である。
モデルに回転を適用して外乱を緩和するRSQ(Rotate, Scale, then Quantize)を提案する。
RSQは、複数の下流タスクと3つのモデルファミリーで、ベースラインメソッドを一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:46:33 GMT)
MeshPad: Interactive Sketch Conditioned Artistic-designed Mesh Generation and Editing [64.8] MeshPadは、スケッチ入力から3Dメッシュを生成するジェネレーティブなアプローチである。
我々は、メッシュの領域の"削除"に編集を分解し、新しいメッシュ幾何学の"追加"に続き、一貫した編集を可能にすることに重点を置いている。
提案手法は,メッシュ三角形の追加と削除のために,大規模なTransformerモデルを利用した三角形列に基づくメッシュ表現に基づいている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:27:44 GMT)
Gumbel Counterfactual Generation From Language Models [64.6] 対実的推論が介入と概念的に異なることを示す。
そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。
提案手法は,従来の介入手法が望ましくない副作用を有意に生み出しているのに対し,本手法は有意義な反事実を生じさせることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:56:17 GMT)
Sampling-Efficient Test-Time Scaling: Self-Estimating the Best-of-N Sampling in Early Decoding [64.3] テスト時のスケーリングは、デコード時に余分な計算を追加することで、大きな言語モデルのパフォーマンスを改善する。
ベストオブNサンプリング(Best-of-N sample)は一般的なスケーリング手法であり、より良いソリューションを見つけるために検索スペースを広げる。
本稿では,全サンプリングの完全生成を回避する新しい復号法であるセルフトランケーションBest-of-N(ST-BoN)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:21:01 GMT)
Revisiting Large Language Model Pruning using Neuron Semantic Attribution [63.6] 人気プルーニング手法を用いて,24のデータセットと4つのタスクの評価を行った。
感情分類タスクでは,既存のプルーニング手法の大幅な性能低下がみられた。
本稿では,各ニューロンと特定の意味論を関連づけることを学ぶニューロン意味属性を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:52:17 GMT)
Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models [63.5] リスク対応意思決定のタスクを形式化し、既存のLMの重大な弱点を明らかにするとともに、スキル分解ソリューションを提案する。
本研究は, 最先端のLM (正規モデルと推論モデルの両方) であっても, タスクを効果的に処理するためには, 明示的なプロンプト連鎖が必要であることを示唆している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:16:26 GMT)
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [63.4] 広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:21:09 GMT)
ShiftAddNet: A Hardware-Inspired Deep Network [62.9] ShiftAddNetはエネルギー効率のよい乗算レスディープニューラルネットワークである。
エネルギー効率のよい推論とトレーニングの両方につながるが、表現能力は損なわれない。
ShiftAddNetは、DNNのトレーニングと推論において、80%以上のハードウェア量子化されたエネルギーコストを積極的に削減し、同等またはより良い精度を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:06:22 GMT)
Low-Biased General Annotated Dataset Generation [62.0] 低バイアスの一般アノテーション付きデータセット生成フレームワーク(lbGen)を提案する。
高価な手作業による収集ではなく,カテゴリアノテーションを用いた低バイアス画像を直接生成することを目的としている。
実験結果から,手動ラベル付きデータセットや他の合成データセットと比較して,生成した低バイアスデータセットの利用により,一般化能力の安定が図られた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:13:35 GMT)
Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities? [61.9] 我々は,o1-like large language model (LLMs) が本当にテスト時間スケーリング機能を持っているか検討した。
これらのo1型モデルの長いCoTは、常に精度を向上しないことがわかった。
並列スケーリング戦略とCoT長特性を組み合わせた手法であるShortest Majority Voteを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:29:43 GMT)
Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework [61.4] 大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、より広く使われている。
従来の研究では、強力なプロプライエタリモデルの評価と判断を再現するために、オープンソースのLLMを微調整しようと試みてきた。
本稿では,評価基準を適応的に定式化し,テキストベースとコード駆動分析の両方を合成する新しい評価フレームワークARJudgeを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:13:12 GMT)
DynamicCity: Large-Scale 4D Occupancy Generation from Dynamic Scenes [61.1] 大規模で高品質な動的4Dシーンをセマンティクスで生成できる新しい4D占有率生成フレームワークであるDynamicCityを紹介する。
特にDynamicCityは、新しいプロジェクションモジュールを使用して、4D機能を6つの2D特徴マップに効果的に圧縮し、HexPlaneの構築を可能にしている。
本研究では,3次元特徴量を並列に再構成する拡張・スキーズ戦略を用いて,ネットワークトレーニングの効率化と再現精度の向上を図る。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:31:23 GMT)
Active Learning for Direct Preference Optimization [59.8] 直接選好最適化(DPO)は、人間のフィードバックからの強化学習の一種である。
オンラインのフィードバック収集や,すでに収集したフィードバックの最も情報性の高いサブセットをオフラインで選択できる,DPOのためのアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:36:31 GMT)
MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.8] 大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。
既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。
多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:18:50 GMT)
Evaluating Intelligence via Trial and Error [59.8] 本研究では,試行錯誤プロセスにおける失敗回数に基づいて知性を評価するためのフレームワークとして,Survival Gameを紹介した。
フェールカウントの期待と分散の両方が有限である場合、新しい課題に対するソリューションを一貫して見つける能力を示す。
我々の結果は、AIシステムは単純なタスクで自律レベルを達成するが、より複雑なタスクではまだまだ遠いことを示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:38:50 GMT)
The Rise and Down of Babel Tower: Investigating the Evolution Process of Multilingual Code Large Language Model [59.4] 本研究では,大規模言語モデル(LLM)における事前学習過程における多言語機能の進化について検討する。
本稿では,LLMが新たな言語能力を習得する過程全体を記述したBabel Tower仮説を提案する。
本論文では,多言語コードLLMのための事前学習コーパスを最適化する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:33:49 GMT)
Nature-Inspired Population-Based Evolution of Large Language Models [58.8] 本稿では,大規模言語モデル(LLM)の人口ベース進化という,新たな課題を正式に定義する。
我々の枠組みは、人口が4つの重要な操作を通じて進化することを可能にする。
12のデータセットに対する実験により、我々のフレームワークは既存のマルチLLMマージおよびアダプティブメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:03:31 GMT)
SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models [58.5] 拡散モデルは高品質なイメージを生成することができるが、スケールするにつれて、メモリ要求が増加し、より高いレイテンシがデプロイメント上の課題を引き起こす。
この制限を克服する新しい4ビット量子化パラダイムであるSVDQuantを提案する。
We reduce the memory usage for the 12B FLUX.1 models by 3.5$times$, achieved 3.0$times$ speedup over the 4-bit weight-only Quantization (W4A16) baseline。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:16:59 GMT)
Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.4] RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:54:54 GMT)
A Near Complete Nonasymptotic Generalization Theory For Multilayer Neural Networks: Beyond the Bias-Variance Tradeoff [57.3] 任意のリプシッツ活性化と一般リプシッツ損失関数を持つ多層ニューラルネットワークに対する漸近一般化理論を提案する。
特に、文献でよく見られるように、損失関数の有界性を必要としない。
回帰問題に対する多層ReLUネットワークに対する理論の極小最適性を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:34:12 GMT)
Apollo-MILP: An Alternating Prediction-Correction Neural Solving Framework for Mixed-Integer Linear Programming [57.2] Apollo-MILP (Alternating Prediction-correction Neural solve framework) を提案する。
各イテレーションにおいて、Apollo-MILPは未固定変数の予測ステップを実行し、その後修正ステップを行い、信頼領域探索を通じて改善された解(参照解と呼ばれる)を得る。
一般的なベンチマーク実験により,提案したApollo-MILPは,ソリューションの品質の観点から,他のMLベースのアプローチよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:19:49 GMT)
TGDataset: Collecting and Exploring the Largest Telegram Channels Dataset [57.2] 本稿では,120,979のTelegramチャネルと4億以上のメッセージを含む新しいデータセットであるTGDatasetを提案する。
我々は、データセット内で話される言語と、英語チャンネルでカバーされるトピックを分析した。
生のデータセットに加えて、データセットの分析に使用したスクリプトと、Sabmykと呼ばれる新しい陰謀論のネットワークに属するチャネルのリストもリリースしました。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:57:12 GMT)
Discovering physical laws with parallel combinatorial tree search [57.1] 記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは10年以上にわたって精度と効率の重大なボトルネックに直面してきた。
制約データから汎用数学的表現を効率的に抽出する並列木探索(PCTS)モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:39:50 GMT)
Semi-Supervised 360 Layout Estimation with Panoramic Collaborative Perturbations [56.8] 協調摂動によるパノラマ配置と歪みの先行を組み込んだセミ教師付きセミ360を提案する。
提案手法が既存のSoTA(State-of-the-art (SoTA)) ソリューションに対して有意な優位性を示すことを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:49:20 GMT)
Uncovering the Dark Side of Telegram: Fakes, Clones, Scams, and Conspiracy Movements [56.5] 我々は35,382の異なるチャンネルと130,000,000以上のメッセージを収集して,Telegramの大規模解析を行う。
カードなどのダークウェブのプライバシー保護サービスにも、悪名高い活動がいくつかある。
疑似チャネルを86%の精度で識別できる機械学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:16:52 GMT)
Gradient-free stochastic optimization for additive models [56.4] 本稿では,Polyak-Lojasiewicz あるいは強凸条件を満たす目的関数に対する雑音観測によるゼロ次最適化の問題に対処する。
対象関数は加法的構造を持ち、H"古い関数族によって特徴づけられる高次滑らか性特性を満たすと仮定する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:39:08 GMT)
Multi-Level Collaboration in Model Merging [56.3] 本稿では,モデルマージとモデルアンサンブルの本質的な関係について考察する。
これまでの制限が満たされていない場合でも、モデルのマージによって、アンサンブルと同じような、ほぼ同一かつ優れたパフォーマンスを達成する方法がまだ存在することが分かっています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:45:04 GMT)
NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM [55.8] VLN(Vision-and-Language Navigation)は、エージェントを具現化するための重要なスキルであり、自然言語の指示に従って3D環境をナビゲートすることができる。
従来の方法では、トラジェクトリ動画をステップバイステップでデータ拡張の指示に変換するが、そのような指示はユーザの通信スタイルとうまく一致しない。
本稿では,VLNのユーザ要求命令を生成する検索拡張生成フレームワークであるNavRAGを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:56:35 GMT)
Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning [55.7] 我々は、新しいオンラインアルゴリズム、反復的ナッシュポリシー最適化(INPO)を提案する。
従来の方法とは異なり、INPOは個々の応答に対する期待される勝利率を推定する必要性を回避している。
LLaMA-3-8BベースのSFTモデルで、INPOはAlpacaEval 2.0で42.6%、Arena-Hardで37.8%の勝利率を達成した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:41:11 GMT)
Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding [55.3] Calib3Dは3Dシーン理解モデルの信頼性をベンチマークし精査する先駆的な試みである。
10の異なる3Dデータセットにまたがる28の最先端モデルを総合的に評価する。
本稿では,3次元モデルのキャリブレーション向上を目的とした,深度対応のスケーリング手法であるDeptSを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:22:19 GMT)
Fast Expectation Value Calculation Speedup of Quantum Approximate Optimization Algorithm: HoLCUs QAOA [55.2] 本稿では,LCU演算子の線形結合として表現できる演算子の期待値を計算するための新しい手法を提案する。
この方法は任意の量子アルゴリズムに対して一般的であり、変分量子アルゴリズムの加速に特に関心がある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:15:23 GMT)
Parameter-free Video Segmentation for Vision and Language Understanding [55.2] 最小記述長の原理に基づいて,映像を連続的なチャンクに分割するアルゴリズムを提案する。
アルゴリズムは完全にパラメータフリーで、設定された閾値や指定するチャンクの数やサイズを必要としない特徴ベクトルが与えられる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:54:37 GMT)
Deep Learning is Not So Mysterious or Different [54.5] 我々は、異常な一般化行動はニューラルネットワークとは異なるものではないと主張している。
我々はこれらの現象を説明する上で重要な統一原理として、軟性誘導バイアスを提示する。
また、ディープラーニングが、表現学習の能力など、他の方法と相対的に異なる点を強調します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:56:04 GMT)
Talking Turns: Benchmarking Audio Foundation Models on Turn-Taking Dynamics [54.0] 本稿では,音声対話システムのターンテイク能力を評価するための新しい評価プロトコルを提案する。
本稿では,既存の音声対話システムをターンテイクイベントの実行能力に基づいて評価する,初めての包括的ユーザスタディを提案する。
我々は、高度な対話型AIシステムの開発を促進するために、評価プラットフォームをオープンソース化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:46:04 GMT)
RefreshKV: Updating Small KV Cache During Long-form Generation [54.0] 生成中の入力トークンのサブセットに対して、完全なコンテキストアテンションとアテンションを柔軟に交互に交互に切り替える新しい推論手法RefreshKVを提案する。
本手法をオフザシェルフ LLM に適用することにより,様々な長文生成タスクの性能を向上しつつ,エビクションベースの手法に匹敵する高速化を実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:23:47 GMT)
Lean-STaR: Learning to Interleave Thinking and Proving [53.9] 証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:27:56 GMT)
InductionBench: LLMs Fail in the Simplest Complexity Class [53.7] 大規模言語モデル(LLM)は推論において顕著に改善されている。
帰納的推論(inductive reasoning)は、観測されたデータから基礎となるルールを推測するものであり、まだ探索されていない。
本稿では, LLMの帰納的推論能力を評価するための新しいベンチマークであるインジェクションベンチを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:38:10 GMT)
Controllable Context Sensitivity and the Knob Behind It [53.7] 予測を行う場合、言語モデルは、そのコンテキストとそれ以前の知識にどれだけ依存しているかをトレードオフする必要があります。
我々は,この感性を制御するノブを探索し,言語モデルが文脈から応答するか,それ以前の知識から応答するかを判断する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:02:55 GMT)
GlotCC: An Open Broad-Coverage CommonCrawl Corpus and Pipeline for Minority Languages [53.6] GlotCCは、ClomCrawlから派生した、クリーンでドキュメントレベルの2TBの汎用ドメインコーパスである。
我々はGlotCCと、それを生成するためのシステムを作成し、研究コミュニティに提供します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:51:52 GMT)
AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials [53.4] 既存のアプローチは高価な人間のアノテーションに依存しており、大規模には持続不可能である。
本稿では,Webエージェントトラジェクトリを生成するスケーラブルなデータ合成パイプラインであるAgentTrekを提案する。
完全に自動化されたアプローチは、データ収集コストを大幅に削減し、人間のアノテータを使わずに、高品質な軌道を0.55ドルに抑えることができます。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:36 GMT)
Exploring and Evaluating Multimodal Knowledge Reasoning Consistency of Multimodal Large Language Models [52.6] マルチモーダルな大言語モデル(MLLM)は、テキストとビジョンの理解を深め、大きなブレークスルーを達成した。
しかし、現在のMLLMは、マルチモーダルな知識推論において、これらのモダリティを効果的に統合する上での課題に直面している。
MLLMにおけるマルチモーダル知識推論における一貫性劣化の程度を解析・比較する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:01:51 GMT)
Every SAM Drop Counts: Embracing Semantic Priors for Multi-Modality Image Fusion and Beyond [52.5] マルチモダリティ画像融合は、シーン理解を強化するために多様なモダリティを統合する上で重要な役割を担っている。
近年のアプローチはタスク固有の設計に移行しているが、不整合最適化の目標のために両世界のベストを達成するのに苦労している。
本稿では,Segment Anything Model (SAM) のセグメンテーションモデルからのセグメンテーション知識を利用して,融合結果の質を向上し,下流タスク適応性(SAGE)を確立させる手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:16:31 GMT)
WeGen: A Unified Model for Interactive Multimodal Generation as We Chat [51.8] マルチモーダル生成と理解を統合するモデルWeGenを紹介する。
より詳細な指示を省くために、創造性の高い多様な結果を生成することができる。
様々なビジュアル生成ベンチマークにおいて,最先端性能が達成されていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:50:07 GMT)
Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning [51.5] HDMILは階層的な蒸留マルチインスタンス学習フレームワークであり、無関係なパッチを排除して高速かつ正確な分類を実現する。
HDMILは、動的マルチインスタンスネットワーク(DMIN)と軽量インスタンスプレスクリーンネットワーク(LIPN)の2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:39:54 GMT)
SolBench: A Dataset and Benchmark for Evaluating Functional Correctness in Solidity Code Completion and Repair [51.1] コード補完モデルによって生成されたSolidityスマートコントラクトの機能的正しさを評価するベンチマークであるSolBenchを紹介する。
本稿では,スマートコントラクトの機能的正当性を検証するための検索拡張コード修復フレームワークを提案する。
その結果、コード修復と検索技術は、計算コストを削減しつつ、スマートコントラクト完了の正しさを効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:55:20 GMT)
Exact Certification of (Graph) Neural Networks Against Label Poisoning [50.9] グラフニューラルネットワーク(GNN)におけるラベルフリップの正確な認証手法を提案する。
本稿では,ノード分類タスクにおける広範囲なGNNアーキテクチャの認証に本手法を適用した。
私たちの研究は、ニューラルネットワークによって引き起こされた毒殺攻撃に対する最初の正確な認証を提示します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:26:05 GMT)
Noise to the Rescue: Escaping Local Minima in Neurosymbolic Local Search [50.2] 結合と解離を min と max で表す Godel 論理に BP を適用することは SAT 問題解決のための局所探索アルゴリズムと等価であることを示す。
本稿では,モデルのロジットに雑音を付加し,局所最適化から逃れるゴデルトリックを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:42:13 GMT)
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.8] 近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:08:28 GMT)
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining [49.7] 我々は,60億のトークンデータを持つアタリゲーム上で事前訓練されたオフラインモデルベースRLエージェントであるJOWA: Jointly-Reinforceed World-Action Modelを紹介する。
われわれの最大のエージェントは、1億5000万のパラメータを持ち、10%のサブサンプルオフラインデータだけで事前トレーニングされたゲーム上での人間レベルのパフォーマンス78.9%で、既存の最先端の大規模なオフラインRLベースラインを31.6%上回っている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:59:29 GMT)
Attacking Large Language Models with Projected Gradient Descent [49.2] 逆数プロンプトの射影勾配 Descent (PGD) は、最先端の離散最適化よりも最大1桁高速である。
我々のLPM用PGDは、同じ破壊的な攻撃結果を達成するために、最先端の離散最適化よりも最大1桁高速である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:37:27 GMT)
Differentiable Information Enhanced Model-Based Reinforcement Learning [48.8] 差別化可能な環境は、豊かな差別化可能な情報を提供することで、コントロールポリシーを学習する新たな可能性を秘めている。
モデルベース強化学習(MBRL)法は、基礎となる物理力学を回復するために、識別可能な情報のパワーを効果的に活用する可能性を示す。
しかし,2つの主要な課題は,1)より高精度な動的予測モデルの構築と,2)政策訓練の安定性の向上である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:51:40 GMT)
When Can You Get Away with Low Memory Adam? [48.3] 我々は、$textitSlimAdam$がAdamのパフォーマンスと安定性にマッチし、合計2回目で98%のコストを節約できることを示します。
code for $textitSlimAdam$はhttps://github.com/dayal-kalra/low-Memory-adamで入手できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:40 GMT)
Text-driven Adaptation of Foundation Models for Few-shot Surgical Workflow Analysis [47.7] Surg-FTDA (Few-shot Text-driven Adaptation) は、最小のペア画像ラベルデータを用いて様々な外科的ワークフロー解析タスクを処理するように設計されている。
まず、Few-shot選択に基づくモダリティアライメントは、画像の小さなサブセットを選択し、その埋め込みを下流タスクからのテキスト埋め込みと整合させる。
第二に、テキスト駆動型適応はテキストデータのみを活用してデコーダをトレーニングし、ペアのイメージテキストデータを必要としない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:05:35 GMT)
Retrieval Models Aren't Tool-Savvy: Benchmarking Tool Retrieval for Large Language Models [47.1] ツール学習は、多種多様なツールで大きな言語モデルを強化し、実践的なタスクを解決するエージェントとして機能することを目的としている。
ツール利用LLMのコンテキスト長が限られているため、大きなツールセットから有用なツールを選択するために情報検索(IR)モデルを採用することが重要な初期ステップである。
ほとんどのツール使用ベンチマークは、実際のシナリオとは程遠いタスクごとに、小さなツールセットを手動で注釈付けすることで、このステップを単純化している。
多様な検索タスク7.6kと43kツールのコーパスからなる異種ツール検索ベンチマークであるToolRetを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:37:16 GMT)
Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual [47.1] 我々はDualにおけるReconciling Model(RDMD)と呼ばれる新しいゼロショット画像復元手法を提案する。
RDMDはbftextsingle事前学習拡散モデルのみを使用してテキスト2正規化器を構成する。
提案手法は,FFHQ と ImageNet の両方のデータセットに対する既存手法と比較して,優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:25:22 GMT)
Precise Localization of Memories: A Fine-grained Neuron-level Knowledge Editing Technique for LLMs [47.1] 本研究では、成功率に影響を与えることなく、局所性を改善するための微粒なニューロンレベルの知識編集(FiNE)手法を提案する。
フィードフォワードネットワーク内の特定のニューロンを正確に識別し、修正することにより、FiNEは知識のローカライゼーションと編集を大幅に改善する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:30:28 GMT)
Inference Scaling Laws: An Empirical Analysis of Compute-Optimal Inference for Problem-Solving with Language Models [47.0] 我々は、推論スケーリング法則(いわゆるテスト時間スケーリング法則)と計算最適推論について研究する。
計算最適推論手法の理解と設計に向けた第一歩として,推論戦略のコストパフォーマンストレードオフについて検討した。
この結果から,モデルパラメータのスケーリングよりも,推論戦略による推論計算のスケーリングの方が効率的であることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:53:32 GMT)
Enhancing Uncertainty Modeling with Semantic Graph for Hallucination Detection [46.9] 大規模言語モデル(LLM)は、非事実的あるいは不誠実な文で幻覚を起こす傾向がある。
本稿では,幻覚検出のための意味グラフを用いた不確実性モデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:06:29 GMT)
CodeArena: A Collective Evaluation Platform for LLM Code Generation [46.8] CodeArenaは、LLM(Large Language Models)コード生成に適したオンライン評価フレームワークである。
鍵となる革新は、総合的な評価メカニズムであり、それは、個々のモデルのスコアを、すべての参加モデルの全体的パフォーマンスに基づいて再分類するものである。
CodeArenaは、提出されたすべてのソリューションとテストケースへのオープンアクセスを保証し、コード評価ワークフローを合理化するための自動化フレンドリなAPIを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:31:16 GMT)
Controllable Safety Alignment: Inference-Time Adaptation to Diverse Safety Requirements [46.8] 大規模言語モデル(LLM)の安全性アライメントに関する現在のパラダイムは、一大のアプローチに従っている。
我々は,モデルの再トレーニングを伴わず,多様な安全要件に適応するフレームワークとして,制御可能な安全アライメント(CoSA)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:10:04 GMT)
Sustainable AI: Mathematical Foundations of Spiking Neural Networks [46.8] 生物学的ニューロンにインスパイアされたスパイクニューラルネットワークは、潜在的な計算とエネルギー効率の向上に有望な代替手段を提供する。
本稿では,学習理論のレンズによるスパイキングネットワークの計算特性について考察する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:44:12 GMT)
A Closer Look at Machine Unlearning for Large Language Models [46.2] 大型言語モデル(LLM)は機密または著作権のあるコンテンツを記憶し、プライバシーと法的懸念を高める。
LLMの機械学習におけるいくつかの問題について議論し、可能なアプローチについての洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:45:58 GMT)
DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life [46.1] 日常生活で遭遇した1,360の道徳的ジレンマのデータセットであるDailyDilemmasを提示する。
それぞれのジレンマは、影響された当事者と、それぞれの行動に関する関連する人間の価値の2つの可能な行動を示す。
我々は社会学、心理学、哲学に触発された5つの理論的枠組みのレンズを通して価値を分析する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:20:54 GMT)
SheetAgent: Towards A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models [45.9] 大規模言語モデル(LLM)は,最近,スプレッドシートの自動操作のために試みられている。
SheetAgentはPlanner、Informer、Retrieverの3つの共同モジュールで構成されている。
SheetAgentはベースラインよりも複数のベンチマークで20~40%のパスレート改善を実現している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:56:29 GMT)
CrowdSelect: Synthetic Instruction Data Selection with Multi-LLM Wisdom [45.4] 高度な大規模言語モデルの命令追従能力をより小さなモデルに拡張することは、モデルの訓練において主流のアプローチとなっている。
我々は、より多様な信号を用いて、包括的命令応答対の特性を捉える。
本稿では、クラスタリングに基づくアプローチを取り入れた、応答の多様性を維持するための統合メトリックであるCrowdSelectを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:56:44 GMT)
Multipartite Embezzlement of Entanglement [45.0] エンタングルメントの埋め込み(エンタングルメントのんびょく、英語: Embezzlement of entanglement)とは、アンタングルメントリソースから、ローカルな操作と通信なしでアンタングルメントを抽出するタスクである。
有限次元の多部エンベジング状態の近似が多部エンベジング族を形成することを示す。
我々は、量子場理論と量子多体物理学の文脈でこの結果について議論する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:33:02 GMT)
Weighted Point Set Embedding for Multimodal Contrastive Learning Toward Optimal Similarity Metric [45.0] 提案手法の利点は,CLIPの相対的損失に対する新たな理解を通じて示される。
重み付き点集合に基づく提案した類似性は、常に最適類似性を達成することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:06:52 GMT)
Provable Benefits of Task-Specific Prompts for In-context Learning [44.8] 本研究では,グローバルなタスク分布を条件付きタスク分布の結合に分割できる新しい設定について考察する。
次に,タスク固有のプロンプトと予測ヘッドを用いて,一層アテンションモデルを用いて条件付きタスク分布に関連する事前情報を学習する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:37:03 GMT)
V$^2$Dial: Unification of Video and Visual Dialog via Multimodal Experts [44.3] V$2$Dialは、マルチモーダルな会話タスクのための画像とビデオの入力データを同時に扱うための、エキスパートベースの新しいモデルである。
本稿では,画像とビデオの空間的特徴と時間的特徴を共同で学習する単一モデルを用いて,両方のタスクを統合することを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:27:38 GMT)
NL2FOL: Translating Natural Language to First-Order Logic for Logical Fallacy Detection [44.3] 自然言語をFOLに自動変換するフレームワークであるNL2FOLについて,Large Language Models (LLMs) を用いて段階的に導入する。
本手法は,暗黙の背景知識の統合など,翻訳プロセスにおける重要な課題に対処する。
ニューロシンボリックなアプローチでは、推論プロセスに対する解釈可能な洞察も提供し、モデル微調整やラベル付きトレーニングデータを必要とせずに堅牢性を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:38:48 GMT)
KoWit-24: A Richly Annotated Dataset of Wordplay in News Headlines [44.3] KoWit-24は,2700件のロシア語ニュースの見出しに,単語の細かいアノテーションを付加したデータセットである。
KoWit-24はワードプレイコンテキストを提供する。
データセットで最も一般的なワードプレイは、コロケーション、イディオム、名前付きエンティティの変換である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:24:25 GMT)
Jailbreaking Safeguarded Text-to-Image Models via Large Language Models [44.3] 安全ガードレールを用いたジェイルブレイク型テキスト・ツー・イメージモデルであるPromptTuneを提案する。
他のクエリベースのジェイルブレイク攻撃とは異なり、攻撃は攻撃LLMを微調整した後、敵のプロンプトを効率的に生成する。
提案手法は安全ガードレールを効果的に回避し,既存のno-box攻撃より優れ,クエリベースの攻撃も容易であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:58:46 GMT)
Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [44.0] クロスモーダル検索は研究コミュニティから有効性や関心が増している。
本稿では,画像とテキストの両方からなるマルチモーダルクエリを実現するアプローチを設計する。
我々のモデルであるReTは、視覚とテキストの両方のバックボーンの異なるレイヤから抽出されたマルチレベル表現を用いる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:01:17 GMT)
Large Language Models Are Cross-Lingual Knowledge-Free Reasoners [44.0] 我々は,タスクの推論過程を,知識検索と知識のない推論という2つの分離された構成要素に分解する。
知識のない推論能力は,様々なソース・ターゲット言語方向にほぼ完全に移行可能であることを示す。
知識のない推論は、異なる言語で類似したニューロンを推論するために共有し、知識は異なる言語に別々に格納する、という仮説を立てる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:56:11 GMT)
Enhancing Network Security Management in Water Systems using FM-based Attack Attribution [43.5] 本稿では,水系センサとアクチュエータの相互作用を生かし,サイバー攻撃に対する詳細な説明と属性を提供する,FM(Model-Agnostic Factorization Machines)に基づく新しい手法を提案する。
複雑なセンサーとアクチュエータの相互作用を含む多機能サイバー攻撃シナリオにおいて、FMベースの攻撃属性法は攻撃根原因を効果的にランク付けし、SHAPやLEMNAよりも平均20%向上した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:52:00 GMT)
Linear cost and exponentially convergent approximation of Gaussian Matérn processes on intervals [43.3] ガウス過程に基づく統計モデルの推測と予測のための計算コストは、観測数に応じて3倍にスケールする。
本研究では,線形コストと共分散誤差が指数関数的に高速に減少する手法を提案近似の$m$で開発する。
この方法はスペクトル密度の最適な有理近似に基づいており、その結果、$m$独立マルコフ過程の和として表される近似が得られる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:28:36 GMT)
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking [43.3] 人間の脳は、同様のパラメータを持つ大きな言語モデルよりもはるかにエネルギー効率が高い。
本稿では,最初のスパイク型大言語モデルであるSpikeLLMを提案する。
SpikeLLMは11.01%のWikiText2の複雑さを低減し、一般的なシーン推論の2.55%の精度を改善する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:46:33 GMT)
Diagnosis of Patients with Viral, Bacterial, and Non-Pneumonia Based on Chest X-Ray Images Using Convolutional Neural Networks [43.2] 肺炎を伴わない患者とウイルス性又は細菌性肺炎の患者に分類するための意思決定支援システムを提案する。
これは、胸部X線(CXR)画像上で、事前訓練された畳み込みニューラルネットワーク(CNN)モデルを用いて転送学習(TL)を実装することで実現される。
肺炎のない患者と、ウイルス性または細菌性肺炎の患者を区別できるモデルを構築するために、一連の実験のパフォーマンスを評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:17:37 GMT)
The Labyrinth of Links: Navigating the Associative Maze of Multi-modal LLMs [42.7] MLLM(Multi-modal Large Language Models)は印象的な能力を示す。
MLLMの欠陥の多くは、人間の知性(例えば$textite.g.$)と比較して見出されている。
観察と事前の実践記憶をリンクする人間の基本的な能力であるtextbfassociation$。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:41:36 GMT)
Generative Human Geometry Distribution [42.7] 本稿では,人間の幾何学分布の分布をモデル化する新しい3次元人体生成フレームワークを提案する。
筆者らのフレームワークは,まず人体形状分布の生成と,この分布から抽出した高忠実度人間の2段階で動作する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:55:19 GMT)
UniDEC : Unified Dual Encoder and Classifier Training for Extreme Multi-Label Classification [42.6] Extreme Multi-label Classification (XMC) は非常に大きなラベル空間から関連するラベルのサブセットを予測する。
損失に依存しないエンドツーエンドのトレーニング可能なフレームワークであるUniDECを開発した。
UniDECは、数百万のラベルを持つデータセットで最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:29:02 GMT)
A-MEM: Agentic Memory for LLM Agents [42.5] 大規模言語モデル(LLM)エージェントは、歴史的経験を活用するためにメモリシステムを必要とする。
現在のメモリシステムは基本的なストレージと検索を可能にするが、洗練されたメモリ構造は欠如している。
本稿では, LLMエージェントに対して, エージェント方式で動的に記憶を整理できる新しいエージェントメモリシステムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:14:02 GMT)
ECLeKTic: a Novel Challenge Set for Evaluation of Cross-Lingual Knowledge Transfer [42.4] 本稿では,多言語クローズドブックQA(CBQA)データセットであるECLeKTicについて述べる。
12言語におけるウィキペディアの記事の存在と欠如を制御し,言語間の不均一なカバレッジを持つ情報を検出する。
我々は,SOTAモデルが,知識が獲得したのと同じ言語の問合せに対して,解答を十分に予測できたとしても,言語間で効率的に知識を共有するのに苦労していることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:11:46 GMT)
Enhancing Non-English Capabilities of English-Centric Large Language Models through Deep Supervision Fine-Tuning [42.2] 本稿では、モデルの内部層にさらなる監視を取り入れ、ワークフローをガイドする深層監視微調整法(DFT)を提案する。
提案手法は,非英語入力処理における最終生成結果だけでなく,内部表現の精度も保証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:59:32 GMT)
Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation [42.1] クロスモーダル表現学習は、分子表現の質を高めるための有望な方向として登場した。
SMILES文字列とテキストから表現を共同で学習する階層的分子表現学習フレームワークAtomasを提案する。
Atomasは11のデータセット上の12のタスクで優れたパフォーマンスを実現し、11のベースラインモデルを上回っている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:34:19 GMT)
Local Purity Distillation in Quantum Systems: Exploring the Complementarity Between Purity and Entanglement [41.9] ギブス保存型ローカル操作と古典通信の枠組みを導入・開発する。
局所冷却は局所純度の抽出と一致し, 完全縮退した局所ハミルトン系システムに着目する。
本研究は, 絡み込み検出・推定技術など, 様々な実用化への扉を開くものである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:15:45 GMT)
Enhanced quantum frequency estimation by nonlinear scrambling [41.9] 非線形量子電磁場における未知の周波数を動的に符号化することで、周波数推定を大幅に改善できることを示す。
我々は、ハミルトン構造における非可換性の度合いを測定するウィグナー・ヤネーゼスキュー情報を用いて、この効果を定量化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:01 GMT)
Gradient-Free Generation for Hard-Constrained Systems [41.6] 既存の制約付き生成モデルは勾配情報に大きく依存しており、いくつかの分野において計算コストが低い場合が多い。
本稿では,ゼロショット方式で制約を正確に満たすために,事前学習された非拘束フローマッチングモデルを適用するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:56:51 GMT)
EasyCraft: A Robust and Efficient Framework for Automatic Avatar Crafting [41.2] EasyCraftは、文字作成を自動化するエンドツーエンドのフィードフォワードフレームワークである。
このアプローチでは,任意のスタイルの顔画像をクラフトパラメータに変換することができるトランスレータを採用している。
テキスト・ツー・イメージのテクニックを翻訳者と統合することで、EasyCraftは正確なテキストベースの文字作成を容易にする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:11:47 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:50:31 GMT)
All Roads Lead to Likelihood: The Value of Reinforcement Learning in Fine-Tuning [40.9] 基礎モデルファインチューニング(FT)における最強の結果は,比較的複雑な2段階の訓練手順によって達成されることを示す。
1つは、ダウンストリーム強化学習手順の一部としてオンラインフィードバックを提供するために使用する前に、あるデータセット(例えば人間の好み)に報酬モデル(RM)をトレーニングする。
我々は、生成検証ギャップの問題、比較的単純なRMを好みデータから学習することの容易さ、下流のRLプロシージャが探索空間を最適なポリシーのサブセットにフィルタリングする能力の組み合わせ、といった説明を最も支持している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:15:19 GMT)
StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing [40.5] 我々は,T2Vモデルにおける複数の被験者間のセマンティックアライメント,動作,テキストプロンプトを改善するための,プラグイン・アンド・プレイ方式であるtextbfStarVidを提案する。
StarVidはまず、テキストプロンプトに基づく2段階の運動軌跡計画に大規模言語モデル(LLM)の空間的推論機能を利用する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:01:03 GMT)
Llama-3.1-Sherkala-8B-Chat: An Open Large Language Model for Kazakh [40.3] Sherkala-Chat (8B) は、カザフスタンの言語モデルであるLLMである。
LLaMA-3.1-8Bモデルに適応したシェルカラ・チャット (8B) はカザフ語、英語、ロシア語、トルコ語で45.3Bのトークンで訓練されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:05:48 GMT)
From Hypothesis to Publication: A Comprehensive Survey of AI-Driven Research Support Systems [40.1] 近年、人工知能(AI)技術の急速な発展は、研究者にAIが研究を加速し、強化する方法を探るきっかけとなった。
本稿では,本領域の進展を体系的に概観する。
我々は,関連する研究を仮説定式化,仮説検証,原稿出版という3つの主要なカテゴリに分類する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:27:13 GMT)
Constrained Linear Thompson Sampling [39.7] 本研究では, エージェントが凸領域からのアクションを逐次選択し, 未知の目的を最大化する安全線形バンドイット問題について検討する。
既存のアプローチは、頻繁な信頼境界を持つ楽観主義に基づく手法に依存しており、しばしば計算的に高価な行動選択ルーチンに繋がる。
我々は,後悔の最小化と制約満足度を効率的にバランスするサンプリングベースのフレームワークであるCOLTS(Constrained Linear Thompson Sampling)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:44:58 GMT)
GRNFormer: A Biologically-Guided Framework for Integrating Gene Regulatory Networks into RNA Foundation Models [39.6] マルチオミクスデータから推定されるマルチスケール遺伝子制御ネットワーク(GRN)をRNA基盤モデルトレーニングに統合する新しいフレームワークを提案する。
GRNFormerは、最先端(SoTA)ベースラインに対して一貫した改善を実現している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:56:39 GMT)
Fine-Grained Controllable Apparel Showcase Image Generation via Garment-Centric Outpainting [39.5] 潜在拡散モデル(LDM)に基づく新しい衣服中心のアウトペイント(GCO)フレームワークを提案する。
提案フレームワークは,テキストプロンプトと顔画像を用いて,所定の衣服を身に着けたファッションモデルをカスタマイズすることを目的としている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:30:37 GMT)
Watch Out Your Album! On the Inadvertent Privacy Memorization in Multi-Modal Large Language Models [39.3] タスク非関連なプライベートコンテンツが、ミニバッチトレーニングのダイナミクスにより、下流の目標といかに素早い相関関係を持つかを示す。
実験の結果,MLLMはタスク非関連透かしを埋め込んだ部分的なミニバッチ設定において,異なるトレーニング行動を示すことがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:10:27 GMT)
Towards Widening The Distillation Bottleneck for Reasoning Models [39.2] LRMの生成したデータに基づく蒸留は、より小さなモデルの推論能力を高めるための、単純かつ効果的な方法である。
蒸留された長いCoTデータは、小さなモデルでは学習が困難であり、バイアスの継承につながることがわかった。
我々はモンテカルロ木探索を用いて木に基づくCOTデータを構築することを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:17:36 GMT)
AutoLUT: LUT-Based Image Super-Resolution with Automatic Sampling and Adaptive Residual Learning [39.2] 我々は,Look-Up Table (LUT) ベースの超解像ネットワークにおいて,ピクセル情報を効果的にキャプチャし,活用するための2つのプラグイン・アンド・プレイ・モジュールを導入する。
本手法は,類似のストレージサイズを維持しつつ, MuLUT と SPF-LUT の双方で大幅な性能向上を実現している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:09:36 GMT)
Order Matters: Investigate the Position Bias in Multi-constraint Instruction Following [39.1] 複数の制約を持つ実世界の命令は、既存の大規模言語モデル(LLM)に重大な課題をもたらす。
我々は,CDDI(Difficulty Distribution Index)による制約の難易度分布を定量的に測定する。
難解な順序で制約を提示した場合, LLM はより高性能であることが判明した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:29:31 GMT)
Direct Distributional Optimization for Provable Alignment of Diffusion Models [39.0] 分布最適化の観点から拡散モデルの新しいアライメント手法を提案する。
まず、確率分布に対する一般正規化損失最小化として問題を定式化する。
本研究では,Doob の $h$-transform 技術を用いてスコア関数を近似することにより,学習した分布からのサンプリングを可能にする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:56:38 GMT)
Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator [38.9] 本稿では,確率に基づく生成学習と最大推定目標を橋渡しする統合フレームワークを提案する。
我々の重要な洞察は、学習可能な対象モデルと固定参照モデルとの確率比を用いて、識別器を暗黙的にパラメータ化することである。
GANとは異なり、このパラメータ化はジェネレータと識別器ネットワークの共同トレーニングの必要性を排除している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:06:22 GMT)
Superficial Self-Improved Reasoners Benefit from Model Merging [38.7] 高品質データコーパスの合成ソリューションとしての自己改善
特に,本分析の結果から,LMがドメイン内推論の精度を向上したとしても,それらの一般的な推論能力を損なうことが判明した。
提案手法は,オリジナルモデルと自己改善モデルとの重みを戦略的に組み合わせ,一般化を保ちながら反復モデルマージング(IMM)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:41:25 GMT)
Compositional Reasoning with Transformers, RNNs, and Chain of Thought [38.7] 我々は、構成推論質問(CRQ)と呼ばれる単純で自然な問題に対して、変換器、RNN、変換器の表現力と思考トークンの連鎖を比較し、比較する。
このファミリーはブール式の評価や多段階語問題などの問題を捉えている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:52:45 GMT)
MINT: Multi-modal Chain of Thought in Unified Generative Models for Enhanced Image Generation [38.5] 画像生成の強化のために,MINTを導入し,マルチモーダル・シンキング・オブ・シンキング (MCoT) を生かした,革新的統一的生成モデルを提案する。
本稿では,MCoT学習パラダイムを提案する。このパラダイムは,画像生成に特化して設計されたマルチモーダル思考,推論,リフレクションに対するステップバイステップアプローチである。
MINTは、テキスト・トゥ・イメージ(T2I)と画像・トゥ・テキスト(I2T)タスクの複数のベンチマークで優れたパフォーマンスを示すことが検証されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:36:16 GMT)
Selected Languages are All You Need for Cross-lingual Truthfulness Transfer [38.3] Fact-aware Multilingual Selective Synergy (FaMSS) と呼ばれる言語間真性伝達の実践的手法を提案する。
FaMSSは、言語バイアスと転送コントリビューションによって全てのテスト対象言語の最適なサブセットを選択し、その後、言語間真性伝達のための翻訳命令チューニングを使用することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:36:49 GMT)
Regret Minimization for Piecewise Linear Rewards: Contracts, Auctions, and Beyond [37.9] 本稿では,一括線形報酬に対する後悔の最小化に取り組むための一般的なオンライン学習フレームワークを提案する。
我々のアルゴリズムは$widetildeO(sqrtnT)$を後悔しており、$n$は報酬関数のピース数、$T$はラウンド数である。
第2に,提案アルゴリズムは,ポストプライスオークションにおける価格設定の学習において,適切な(かつ望ましい)インスタンス非依存の後悔境界を達成できることを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:13:45 GMT)
$\text{M}^3\text{HF}$: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality [37.7] 混合品質の多相フィードバック(textM3textHF$)から多相強化学習を導入し、混合品質の多相フィードバックをMARLトレーニングプロセスに統合する。
トレーニング中は,人的評価のためのエージェント学習を戦略的に停止し,大きな言語モデルを用いてフィードバックを解析し,それを適切に割り当て,報酬関数を更新する。
挑戦的な環境における実証的な結果は、$textM3textHF$が最先端のメソッドを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:58:10 GMT)
Chain of Draft: Thinking Faster by Writing Less [37.5] Chain of Draft (CoD)は、人間の認知プロセスにインスパイアされた新しいパラダイムである。
CoDはタスクを解きながら最小限だが情報的中間推論出力を生成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:08:21 GMT)
KeyFace: Expressive Audio-Driven Facial Animation for Long Sequences via KeyFrame Interpolation [37.3] KeyFaceは、顔アニメーションのための新しい2段階拡散ベースのフレームワークである。
最初の段階では、モデルは遷移の間のギャップを埋め、スムーズかつ時間的コヒーレンスを保証する。
リアリズムをさらに強化するため、連続的な感情表現を取り入れ、幅広い非音声発声(NSV)を扱う。
実験の結果,KeyFaceは長期間にわたって自然なコヒーレントな顔アニメーションを生成する上で,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:31:55 GMT)
Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART) [37.2] Scalable Multi-Agent Realistic Testbed (smart)は、マルチエージェントパス探索(MAPF)アルゴリズムを評価するための、現実的で効率的なソフトウェアツールである。
我々は,実世界のシナリオにおけるMAPFアルゴリズムの実行に関する研究質問をSMARTを用いて探索し,実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:26:59 GMT)
Locality-aware Gaussian Compression for Fast and High-quality Rendering [37.2] 局所性を考慮した3Dガウススティング(3DGS)フレームワークであるLocoGSを紹介し,3Dガウスアンの空間コヒーレンスを利用してシーンのコンパクトなモデリングを行う。
まず,3次元ガウス属性の局所的コヒーレンスを解析し,局所的コヒーレントなガウス属性を効果的に符号化する3次元ガウス表現を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:07:28 GMT)
OnlineAnySeg: Online Zero-Shot 3D Segmentation by Visual Foundation Model Guided 2D Mask Merging [37.0] ハッシュ技術を用いて2次元マスクを統一した3次元インスタンスに持ち上げるための効率的な方法を提案する。
効率的な3次元シーンクエリにボクセルハッシュを用いることで、コストのかかる空間的重複クエリの時間的複雑さを低減できる。
提案手法は,オンラインでオープンな3Dインスタンスのセグメンテーションにおける最先端の性能と効率の向上を両立させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:48:06 GMT)
SampleMix: A Sample-wise Pre-training Data Mixing Strategey by Coordinating Data Quality and Diversity [36.9] 大規模言語モデル(LLM)の既存の事前学習データ混合手法は、一般的にドメインワイドな方法論に従う。
ボトムアップパラダイムに基づく新しいサンプルワイドデータ混合手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:22:11 GMT)
Towards Graph Foundation Models: A Study on the Generalization of Positional and Structural Encodings [36.6] 位置的および構造的符号化(PSE)がグラフニューラルネットワーク(GNN)に統合された
本稿では,様々なグラフデータセット間での学習可能なPSEの微調整効率,サンプルサイズによるスケーラビリティ,一般化,能力について検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:05:53 GMT)
Training Neural Samplers with Reverse Diffusive KL Divergence [36.5] 非正規化密度関数からサンプルを得るための生成モデルを訓練することは、機械学習において重要かつ困難な課題である。
従来の訓練方法は、そのトラクタビリティのため、逆のKL(Kulback-Leibler)の分岐に依存することが多い。
モデルおよび対象密度の拡散軌跡に沿った逆KLの最小化を提案する。
本手法はボルツマン分布のサンプリング性能を向上させることを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:57:58 GMT)
Facilitating Multi-turn Function Calling for LLMs via Compositional Instruction Tuning [36.2] 本稿では,マルチターン関数呼び出しを行うLarge Language Models (LLMs) の必要性について述べる。
BUTTONはボトムアップ命令構築とトップダウン軌道生成による合成合成命令チューニングデータを生成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:27:02 GMT)
Gradient-Based Multi-Objective Deep Learning: Algorithms, Theories, Applications, and Beyond [35.8] ディープラーニングにおける多目的最適化(MOO)は、複数の競合する目的を同時に最適化することを目的としている。
勾配に基づくMOO法の進歩は、様々な種類の解の発見を可能にした。
これらの開発は、強化学習、コンピュータビジョン、レコメンデーションシステム、大規模言語モデルといった分野に広く応用されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:09:31 GMT)
Object-Aware Video Matting with Cross-Frame Guidance [35.8] 我々は、異なるオブジェクトを知覚し、前景オブジェクトの協調認識とエッジ詳細の洗練を可能にする、トリマップフリーなオブジェクト認識ビデオマッチング(OAVM)フレームワークを提案する。
具体的には,OGCR(Object-Guided Correction and Refinement)モジュールを提案する。
また、逐次シナリオを多様化し、オブジェクト識別のためのネットワークの容量を高めるために、逐次フォアグラウンドマージ拡張戦略を設計する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:40:32 GMT)
One ruler to measure them all: Benchmarking multilingual long-context language models [35.8] 我々は26言語にわたる長文言語モデルを評価するために設計された多言語ベンチマークONERULERを提案する。
英語は、長文タスク(26語中6位)における最高のパフォーマンス言語ではなく、ポーランド語が最上位言語として登場した。
異なる言語で命令とコンテキストが現れる言語間シナリオでは、命令言語によってパフォーマンスが最大20%変動する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:12:48 GMT)
Towards Scalable Exact Machine Unlearning Using Parameter-Efficient Fine-Tuning [35.7] S3T(Sequence-aware Sharded Sliced Training)を導入した。
S3Tは、モデルの性能への影響を最小限に抑えつつ、正確な未学習システムの削除能力を高めるように設計されている。
我々は、S3Tが幅広い設定におけるベースラインに比べて優れた削除能力と性能を発揮できることを実証した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:29:41 GMT)
On Large Language Model Continual Unlearning [35.5] モデルの安全性とセキュリティの代表的なアプローチとして、機械学習が登場した。
これらの手法は、現実世界のシナリオにおける未学習の要求が継続的に発生していると十分には考えていない。
要求されたデータを継続的に学習するための直交型ローランクアダプタ(LoRA)と,入力データと非学習データとの類似性を計測するアウトオフオフ分布検出器を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:21:39 GMT)
DeRS: Towards Extremely Efficient Upcycled Mixture-of-Experts Models [35.4] リサイクル・ミックス・オブ・エクササイズ(MoE)モデルは、様々なタスクにおいて大きな可能性を示している。
これらのモデルは、複数の専門家の導入により、依然としてかなりのパラメータ非効率に悩まされている。
本稿では,この欠点を克服する新しいDeRS(Decompose, Replace, and Synthesis)パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:52:46 GMT)
Preconditioned Inexact Stochastic ADMM for Deep Model [35.4] 本稿では,拡張性のある並列計算を可能にするアルゴリズム PISA を開発し,様々な第2モーメント方式をサポートする。
厳密な理論的な保証の下で、アルゴリズムは勾配のリプシッツの唯一の仮定の下で収束する。
視覚モデル、大規模言語モデル、強化学習モデル、生成的敵ネットワーク、繰り返しニューラルネットワークを含む様々なFMの総合的または微調整実験は、様々な最先端の方向と比較して優れた数値性能を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:02:37 GMT)
ViTCoD: Vision Transformer Acceleration via Dedicated Algorithm and Accelerator Co-Design [35.1] ビジョントランスフォーマー(ViT)は、様々なビジョンタスクにおいて最先端のパフォーマンスを実現している。
しかし、ViTsの自己保持モジュールは依然として大きなボトルネックである。
本稿では,ViTの高速化を目的とした,ViTCoDと呼ばれる専用アルゴリズムとアクセラレータ共設計フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:58:16 GMT)
Q-Adapter: Customizing Pre-trained LLMs to New Preferences with Forgetting Mitigation [35.0] 我々は、事前訓練された大規模言語モデル(LLM)を新しい人間の好みでカスタマイズすることを検討する。
新しい好みをカスタマイズするための残差Q-関数を近似するアダプタモジュールを導入したので、我々のメソッド Q-Adapter を命名する。
DSPデータセットとHH-RLHFデータセットのLlama-3.1モデルに基づく実験は、Q-Adapterの優れた効果を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:48:38 GMT)
On the Power of Context-Enhanced Learning in LLMs [34.9] 我々は,LLMの新しい概念である文脈強化学習を定式化する。
テキスト上での標準勾配に基づく学習は、文脈は自動回帰勾配を計算しない追加のデータで拡張される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:46:45 GMT)
SocialEyes: Scaling mobile eye-tracking to multi-person social settings [34.8] 我々は、複数の移動眼球追跡装置から収集した同期データを、集合的な視聴体験中にストリーミングし、記録し、分析するシステムを開発した。
我々は,2つの公開イベント(N=60)毎に,30人の同時視聴者によるライブコンサートと映画上映でシステムをテストした。
我々の新しい分析指標と可視化は、協調行動と社会的相互作用を理解するための集合的視線追跡データの可能性を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:55:32 GMT)
ShiftAddNAS: Hardware-Inspired Search for More Accurate and Efficient Neural Networks [34.3] ShiftAddNASは、より正確で効率的なNNを自動的に検索できる。
ShiftAddNASは、乗算ベースと乗算自由演算子の両方を組み込んだ最初のハイブリッド検索空間を統合する。
ShiftAddNASの有効性は実験とアブレーション研究で一貫して検証されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:00:47 GMT)
LLMInit: A Free Lunch from Large Language Models for Selective Initialization of Recommendation [34.2] 協調フィルタリングモデルは、レコメンデーションシステムのためのユーザ-イテムインタラクションをキャプチャする上で、強力なパフォーマンスを示している。
GPTやLLaMAのような大規模言語モデル(LLM)の出現は、レコメンデーションパフォーマンスを向上する新たな可能性を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:41:59 GMT)
AnyECG: Foundational Models for Multitask Cardiac Analysis in Real-World Settings [34.1] 心電図(ECG)は急性心臓発作の検出に非常に敏感である。
本稿では,実世界のECGデータからロバストな表現を抽出するための基礎モデルであるAnyECGを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:19:42 GMT)
PAPILLON: Efficient and Stealthy Fuzz Testing-Powered Jailbreaks for LLMs [33.9] 大規模言語モデル(LLM)は様々なタスクに優れていますが、それでも脱獄攻撃に対して脆弱です。
PAPILLONは自動ブラックボックスジェイルブレイク攻撃フレームワークである。
ブラックボックスのファジテストアプローチを、一連のカスタマイズされた設計で適用する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:25:21 GMT)
ESVO2: Direct Visual-Inertial Odometry with Stereo Event Cameras [33.8] イベントベースビジュアル・オドメトリーは、追跡とサブプロブレムのマッピング(典型的には並列)を解決することを目的としている
直接パイプライン上に,イベントベースのステレオビジュアル慣性オドメトリーシステムを構築した。
結果として得られるシステムは、現代の高解像度のイベントカメラでうまくスケールする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:31:05 GMT)
Depth-Width tradeoffs in Algorithmic Reasoning of Graph Tasks with Transformers [33.6] 線形幅, 一定の深さでグラフベースの問題を解くのに十分であることを示す。
これは、幅の適度な増加は、推論時間の観点から有利な、より浅いモデルを可能にすることを示唆している。
本研究は,グラフベースアルゴリズムのトランスフォーマー実装の複雑で興味深い展望を示すものである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:33:58 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [33.6] MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。
それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。
MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。
我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:43:03 GMT)
Enhancing Fairness in Unsupervised Graph Anomaly Detection through Disentanglement [33.6] グラフ異常検出(GAD)は、金融詐欺検出から偽ニュース検出まで、さまざまなアプリケーションにおいてますます重要になっている。
現在のGAD法は主に公平性の問題を見落としており、特定の人口集団に対して差別的な決定が下される可能性がある。
DeFENDという属性グラフ上に,DisEntangle-based FairnEss-aware aNomaly Detectionフレームワークを考案した。
実世界のデータセットに対する実証的な評価から、DEFENDはGADにおいて効果的に機能し、最先端のベースラインと比較して公正性を著しく向上することが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:14:00 GMT)
Perturbation-Restrained Sequential Model Editing [33.5] 現在のモデル編集手法は、編集数が増加するにつれて、大きな言語モデル(LLM)の一般的な能力を損なう。
逐次編集における条件数抑制を応用した「PRUNE(Preper bouNd for Editing)」というフレームワークを提案する。
その結果、PRUNEは、逐次モデル編集において、編集性能を効果的に維持しながら、汎用性を維持できることを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:25:41 GMT)
MANTRA: The Manifold Triangulations Assemblage [33.4] MANTRAは、大規模で多様で、本質的には高階モデルのベンチマークのための、最初の高階データセットである。
単純な複雑なニューラルネットワークは、単純なトポロジ不変量を取得することでグラフベースのニューラルネットワークよりも優れていることを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:50:18 GMT)
Learning to Learn Weight Generation via Trajectory Diffusion [33.0] メタ学習と拡散アルゴリズムを統合したLt-Diを提案する。
我々は、バニラ拡散アルゴリズムを軌道拡散アルゴリズムに拡張し、最適化軌道に沿って他の重みを利用する。
実験では、Lt-Diの精度を実証し、様々なタスクにおける計算オーバーヘッドを低減した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:35:00 GMT)
MLOmics: Benchmark for Machine Learning on Cancer Multi-Omics Data [33.0] MLOmicsは、バイオインフォマティクスと機械学習モデルの開発と評価を改善することを目的とした、オープン癌マルチオミクスベンチマークである。
MLOmicsには8,314人の患者サンプルがあり、4つのオミクスタイプ、層状特徴、広範囲なベースラインを持つ32種類の癌をカバーしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:08:50 GMT)
Stereo Hand-Object Reconstruction for Human-to-Robot Handover [32.7] 本研究では,一視点再構成を確率的に組み合わせた立体的立体的再構成手法を提案する。
我々は,大規模な手オブジェクトデータセットから3次元形状を学習し,本手法が一般化可能であることを確かめる。
提案手法は,既存のRGBベース手動オブジェクト再構成手法と比較して,単一ビューおよびステレオ設定における対象のチャンファー距離を低減させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:04:23 GMT)
DifIISR: A Diffusion Model with Gradient Guidance for Infrared Image Super-Resolution [32.5] DifIISRは、視覚品質と知覚性能に最適化された赤外線画像超解像拡散モデルである。
我々は、視力を維持するために赤外線熱スペクトル分布制御を導入する。
下流の視覚課題に対する知覚的ガイダンスとして,様々な視覚基盤モデルを組み込んだ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:20:57 GMT)
PROPER: A Progressive Learning Framework for Personalized Large Language Models with Group-Level Adaptation [32.5] 本稿では,社会科学におけるメソレベルの理論に触発された新しい学習フレームワークであるPROPERを提案する。
ProPERは、好みに基づいてユーザーをグループ化し、段階的にLSMを適用することで、人口レベルとユーザーレベルのモデルを橋渡しする。
実験の結果,Properは複数のタスクでSOTAモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:40:50 GMT)
Long-Term EEG Partitioning for Seizure Onset Detection [32.5] 本稿では、サブシーケンスクラスタリングの新しいタスク定式化により、アクセプションのオンセットを明示的にモデル化する2段階フレームワークSODorを提案する。
3つのデータセットに対する実験により,提案手法が誤分類を補正できることが示され,他のベースラインよりも5%-11%の分類改善が達成された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:39:17 GMT)
Talking Heads: Understanding Inter-layer Communication in Transformer Language Models [32.3] 2つのLMで用いられるメカニズムを分析し、1つのタスクでコンテキスト内のアイテムを選択的に抑制する。
モデルが残ストリームの低ランクな部分空間に書き込まれて,後続のレイヤで読み出される特徴を表現することが分かりました。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:19:42 GMT)
Explainable Depression Detection in Clinical Interviews with Personalized Retrieval-Augmented Generation [32.2] うつ病は広範な精神疾患であり、臨床面接は評価のための金の基準である。
現在のシステムは主にブラックボックスニューラルネットワークを使用し、解釈性に欠ける。
本稿では,説明可能な抑うつ検出のための検索拡張フレームワークREDを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:59:34 GMT)
Large AI Model for Delay-Doppler Domain Channel Prediction in 6G OTFS-Based Vehicular Networks [32.1] 高速車載ネットワークに適した遅延ドップラー(DD)ドメインチャネル予測フレームワークを提案する。
チャネル表現をDDドメインに変換することで、基礎となる物理伝播過程と密に一致した直感的でスパースで安定した描写が得られる。
我々は大規模な人工知能(AI)モデルを利用してこれらのDDドメインの時系列パラメータを予測し、時間相関をモデル化する高度な能力を活用している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:51:29 GMT)
EliteKV: Scalable KV Cache Compression via RoPE Frequency Selection and Joint Low-Rank Projection [32.0] 本稿では,可変KVキャッシュ圧縮比をサポートするRoPEモデルのためのフレキシブルフレームワークであるEliteKVを紹介する。
最小限のアップトレーニングにより、RoPEベースのモデルは、無視できるマージン内でパフォーマンスを保ちながら、KVキャッシュサイズを75%削減する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:26:51 GMT)
Vid2Avatar-Pro: Authentic Avatar from Videos in the Wild via Universal Prior [31.8] Vid2Avatar-Proは、モノクラーインザミルドビデオから、フォトリアリスティックでアニマタブルな3Dアバターを作成する方法である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:45:35 GMT)
Spark-TTS: An Efficient LLM-Based Text-to-Speech Model with Single-Stream Decoupled Speech Tokens [31.6] 本稿では,音声を2つの補完トークンタイプに分解する単一ストリーム音声であるBiCodecを利用した新しいシステムであるSpark-TTSを紹介する。
制御可能なTSの研究を容易にするために,包括的な属性アノテーションを備えた10000時間データセットであるVoxBoxを紹介した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:23:10 GMT)
CUIfy the XR: An Open-Source Package to Embed LLM-powered Conversational Agents in XR [31.5] 大言語モデル (LLM) は音声テキスト (STT) とテキスト音声 (TTS) モデルを備えた非プレーヤ文字 (NPC) を用いており、XR のより自然な対話型ユーザインタフェース (CUI) を促進するために、従来の NPC やプレスクリプトの NPC よりも大きな利点をもたらす。
本稿では,広く使用されているLLM, STT, TTSモデルと音声によるNPCユーザインタラクションを容易にするオープンソース,カスタマイズ可能,拡張可能,プライバシ対応のUnityパッケージCUIfyを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:41:33 GMT)
VoCo-LLaMA: Towards Vision Compression with Large Language Models [31.4] VLM(Vision-Language Models)は、様々なマルチモーダルタスクにおいて顕著な成功を収めている。
LLMを用いて視覚トークンを圧縮する最初の方法であるVoCo-LLaMAを提案する。
提案手法は, 576$times$の圧縮比で最小性能損失を達成し, 最大94.8$%のFLOPと69.6$%の高速化を実現した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:05:52 GMT)
Hypergraph Foundation Model [31.2] ハイパーグラフニューラルネットワーク(HGNN)は、タンパク質相互作用やソーシャルネットワークのようなドメインにおける複雑な高次関係を効果的にモデル化する。
マルチドメイン知識抽出のためのハイパーグラフ基礎モデルHyper-FMを提案する。
また、HGNNとLLMの間の研究を進めるために、10のテキスト分散ハイパーグラフデータセットをキュレートする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:56:08 GMT)
KGARevion: An AI Agent for Knowledge-Intensive Biomedical QA [31.1] KGARevionは知識グラフに基づくエージェントで、知識集約的な質問に答える。
これは、大きな言語モデルに埋め込まれた潜伏した知識を活用することで、関連する三つ子を生成する。
そして、これらの三重項を知識グラフに対して検証し、エラーをフィルタリングし、正確で文脈的に関係のある情報のみを保持する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:23:47 GMT)
PhyMPGN: Physics-encoded Message Passing Graph Network for spatiotemporal PDE systems [31.0] 我々は物理符号化されたメッセージパッシンググラフネットワーク(PhyMPGN)という新しいグラフ学習手法を提案する。
我々は,GNNを数値積分器に組み込んで,与えられたPDEシステムに対する時間的時間的ダイナミクスの時間的行進を近似する。
PhyMPGNは、粗い非構造メッシュ上での様々なタイプの時間的ダイナミクスを正確に予測することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:50:30 GMT)
Neural ODE Transformers: Analyzing Internal Dynamics and Adaptive Fine-tuning [30.8] 高度にフレキシブルな非自律型ニューラル常微分方程式(ODE)を用いたトランスフォーマーアーキテクチャのモデリング手法を提案する。
提案モデルでは,ニューラルネットワークによる注目度とフィードフォワードブロックの重みをパラメータ化し,これらの重みを連続層インデックスの関数として表現する。
我々のニューラルODE変換器は、さまざまな構成やデータセットにわたるバニラ変換器に匹敵するパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:12:14 GMT)
MiLiC-Eval: Benchmarking Multilingual LLMs for China's Minority Languages [30.7] 中国のマイノリティ言語向けに設計されたベンチマークであるMiLiC-Evalを紹介します。
MiLiC-Evalは、表現不足の筆記システムに焦点を当て、言語と問題解決スキルのきめ細かい評価を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:56:03 GMT)
DPR: Diffusion Preference-based Reward for Offline Reinforcement Learning [30.7] 拡散選好に基づく報酬獲得法(DPR)を提案する。
DPRは拡散モデルを用いて状態-作用対の選好分布を直接モデル化し、これらの分布から報酬を識別することができる。
本手法を既存のオフライン強化学習アルゴリズムに適用し,拡散型報酬獲得手法が従来法およびトランスフォーマー法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:49:38 GMT)
Stability-based Generalization Analysis of Randomized Coordinate Descent for Pairwise Learning [30.6] ペアワイズ学習におけるRCDの一般化について考察する。
平均的議論安定性を凸関数と強凸目的関数の両方に対して測定する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:39:06 GMT)
Purcell-enhanced emissions from diamond color centers in slow light photonic crystal waveguides [30.4] 光アドレス可能なスピンを持つエミッタに基づく量子メモリは、効率的なフォトニックインタフェースに依存している。
これらのアプローチはキャビティモードと量子エミッターのほぼ完全なスペクトルと空間的重なりを必要とする。
ダイヤモンドスロー光フォトニック結晶(PhC)導波路を試作し,シリコン空孔(SiV)カラーセンタへのブロードバンド光結合を実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:54:42 GMT)
FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation [30.3] オープンMLLMのLLaVA-1.5とPhi-3 Visionを日本のレシピデータセット上で微調整し,その性能をGPT-4oと比較した。
本評価は,レシピデータに基づいて学習したオープンモデルが,現在の最先端モデルであるGPT-4oを材料生成において上回っていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:04:18 GMT)
Advancing vision-language models in front-end development via data synthesis [30.3] 本稿では,高品質な画像テキストデータを合成し,フロントエンド開発における多様な特徴を捉えた反射型エージェントワークフローを提案する。
このワークフローは、実際のプロジェクトから自己完結型フットノートA textbfself-完結型コードスニペットを抽出し、対応するビジュアルアウトプットをレンダリングし、設計要素を機能コードにリンクする詳細な記述を生成する。
私たちは、合成データセットに基づいてトレーニングされた大規模なビジョン言語モデルであるFlameを構築し、$textpass@k$メトリックを使用してReactコードを生成する効果を実証しています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:54:01 GMT)
Adaptively evaluating models with task elicitation [29.7] 適応評価(Adaptive Evaluations)と呼ばれる言語モデルを評価するためのフレームワークを導入し、検証する。
さまざまなデータセットやタスクに対して,フレームワークを適応的に調査する場合,フロンティアモデルには一貫性が欠如していることが分かりました。
生成された質問は人間の妥当性チェックをパスし、しばしば異なる能力プロファイルを持つ他のモデルに転送する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:04:10 GMT)
Optimal Batched Best Arm Identification [29.6] バッチ化されたベストアーム識別(BBAI)問題について検討し、学習者のゴールは、ポリシーをできるだけ少なく変更しながら、最適なアームを識別することである。
本稿では, 最適なサンプル複雑性を実現する最初のバッチアルゴリズムである3バッチベストアーム識別(Tri-BBAI)を提案する。
さらに,非漸近的条件下での準最適サンプルとバッチ複雑性を初めて達成した,ほぼ最適なバッチ化されたベストアーム識別アルゴリズム(Opt-BBAI)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:14:08 GMT)
Surgical, Cheap, and Flexible: Mitigating False Refusal in Language Models via Single Vector Ablation [29.6] 言語モデルを有用かつ無害にトレーニングするには、拒否行動の慎重な校正が必要である。
本稿では,単一ベクトルアブレーションによる言語モデルにおける偽の拒絶を緩和するための簡易かつ外科的手法を提案する。
提案手法はトレーニング不要で,モデルに依存しないため,現在および将来の言語モデルにおける誤認の軽減に有効である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:46:14 GMT)
A Taxonomy for Evaluating Generalist Robot Policies [29.4] 一般化の評価と定量化は、現代ロボット工学のワイルドウェストである。
本稿では,視覚的,意味的,行動的一般化を中心に構築されたロボット操作のための一般化の分類であるSTAR-Genを提案する。
我々は,様々な最先端モデルをベンチマークで評価し,実際の分類学の有用性を実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:03:00 GMT)
Improving the statistical efficiency of cross-conformal prediction [29.4] Vovkは、予測セットの幅を改善するために設計された分割コンフォメーションの修正であるクロスコンフォーマル予測を導入した。
後者の理論的保証を損なうことなく,より小さな予測セットを生成する手法を新たに提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:07:28 GMT)
SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures [29.2] 高品質な画素レベルのセグメンテーションマップを生成するために,SCSegamba(Structure-Aware Vision Mamba Network)を提案する。
具体的には、軽量なGated Bottleneck Convolution(GBC)とStructure-Aware Scanning Strategy(SASS)を組み合わせたSAVSS(Structure-Aware Visual State Space Module)を開発した。
クラックベンチマークを用いた実験により,本手法は他のSOTA法よりも優れており,パラメータが2.8Mで最高性能を達成できた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:40:57 GMT)
TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection [28.9] TokenSelectは、効率的で正確な長文推論のためのトレーニング不要の手法である。
TokenSelectの総合評価では、注意計算における最大23.84倍の高速化と、エンドツーエンドのレイテンシにおける最大2.28倍の高速化が示されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:49:41 GMT)
Test-Time Compute: from System-1 Thinking to System-2 Thinking [28.7] テストタイム計算の概念をSystem-1モデルに遡る。
システム1モデルから弱いシステム2モデルへの移行において,テスト時間計算が果たす重要な役割を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:16:16 GMT)
Scaling Law Phenomena Across Regression Paradigms: Multiple and Kernel Approaches [28.6] トランスフォーマーアーキテクチャを持つモデルの場合、テスト損失はモデルサイズ、データセットサイズ、トレーニングで使用される計算量と強力な関係を示す。
我々の分析はスケーリング法則に関する深い洞察を与え、大きな言語モデルに対する理解を深める可能性がある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:57:49 GMT)
Cognitive Behaviors that Enable Self-Improving Reasoners, or, Four Habits of Highly Effective STaRs [28.6] 強化学習は、検証可能なタスクにおける言語モデルにおける自己改善を促進することができる。
また,Qwen-2.5-3BがLlama-3.2-3Bを超えることが確認された。
我々の研究は、Qwenが自然にこれらの推論行動を示すのに対して、Llamaはこれらを欠いていることを明らかにしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:46:22 GMT)
Student engagement in collaborative learning with AI agents in an LLM-empowered learning environment: A cluster analysis [28.5] この研究には、中国の大学から110人の学生が参加し、複数のLLMエージェントとLLMを利用した学習環境に関わった。
学生の非認知的特徴、コースエンゲージメント、AIインタラクションパターンに関するデータを収集し分析した。
この知見は,学習者が人間とAIの対話型学習にどのように関わり,適応型教育システムの設計に実践的な影響をもたらすかを明らかにする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:08:28 GMT)
What Ails Generative Structure-based Drug Design: Expressivity is Too Little or Too Much? [28.2] 構造に基づく薬物設計を加速するために、詳細なトレーニングとサンプリング手順を備えたいくつかの生成モデルが提案されている。
我々はこの現象を理論的・経験的両面からよりよく理解したいと考えている。
妥当な対観は、これらのモデルの過度なパラメータ化を原因として、一般化を犠牲にして表現性を誘導する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:08:38 GMT)
A Pilot Empirical Study on When and How to Use Knowledge Graphs as Retrieval Augmented Generation [28.1] 本稿は,KG-RAGをいつ,どのように使用するかという質問に対して,体系的に回答する基盤を定めている。
我々は,KG-RAG手法を7つのデータセットにまたがる6つのKG-RAG手法を,多様なシナリオで再実装し,評価するために,KG-RAGの試験的研究を行った。
本結果は,KG-RAGコンポーネントの適切な適用条件と最適構成の重要な役割を裏付けるものである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:00:59 GMT)
Automated Annotation of Evolving Corpora for Augmenting Longitudinal Network Data: A Framework Integrating Large Language Models and Expert Knowledge [27.9] 本稿では,Large Language Models (LLMs) と歴史的注釈付きデータと専門家によるコードブックを組み合わせることで,データセットを将来的な期間に拡張するExpert-Augmented LLM (EALA) アプローチを提案する。
以上の結果から,EALAは交渉当事者間のあいまいな相互作用を効果的に予測し,時間とともにトピックの進化を捉えていることが明らかとなった。
コードブックと注釈付きデータセットが広く利用可能であることを考えると、EALAは政治科学以上の研究を進めるための大きな約束を持っている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:46:01 GMT)
LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains [27.8] マルチテランのコスト効率の高い経路計画は、ロボットナビゲーションにおいて重要な課題である。
我々は,大規模言語モデル(LLM)を経路計画の効果的なアドバイザとして活用する,プロンプトベースのアプローチ LLM-Advisor を開発した。
提案がなされると、A*アルゴリズムに提案されるパスの70.59%、RT*アルゴリズムに69.47%、LLM-A*アルゴリズムに78.70%のコスト効率が達成される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:02:10 GMT)
Adaptive Prompt: Unlocking the Power of Visual Prompt Tuning [27.7] Visual Prompt Tuning (VPT)は、トレーニング済みの視覚モデルを下流タスクに適応するための強力な方法として登場した。
入力の適応関数としてプロンプトを再定義する新しい世代のプロンプトであるVisual Adaptive Prompt Tuning (VAPT)を提案する。
我々の理論解析は,VAPTが最適な試料効率を実現することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:00:24 GMT)
VideoHandles: Editing 3D Object Compositions in Videos Using Video Generative Priors [27.7] 静止画とカメラモーションの映像の3Dオブジェクト合成を編集する手法として名前を提案する。
提案手法では,ビデオの全フレームにわたる3次元オブジェクトの位置を時間的に一貫した方法で編集することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:29:48 GMT)
A Decade's Battle on Dataset Bias: Are We There Yet? [27.5] 現代のニューラルネットワークは、画像がどのデータセットから来ているかの分類において、優れた精度を達成することができる。
我々は,YFCC,CC,DataCompデータセットからなる3方向分類問題に対するホールドアウト検証データに対して,84.7%の精度を報告した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:01:27 GMT)
Persuasion at Play: Understanding Misinformation Dynamics in Demographic-Aware Human-LLM Interactions [27.4] 大規模言語モデル(LLM)は、大規模に説得的コンテンツを生成し、既存のバイアスを強化する。
本研究では,LLMと人間間の双方向的説得動態について,誤表現内容に曝露した場合に検討する。
以上の結果から, LLMの誤情報に対する感受性には, 人口統計学的要因が影響していることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:30:22 GMT)
Word Form Matters: LLMs' Semantic Reconstruction under Typoglycemia [27.3] 人間の読み手は、主に単語形式に依存して、スクランブルされた単語を効率的に理解することができる。
先進的な大規模言語モデル(LLM)も同様の能力を示すが、その基盤となるメカニズムはいまだ不明である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:31:45 GMT)
ATEB: Evaluating and Improving Advanced NLP Tasks for Text Embedding Models [27.2] より高度なNLPタスクは、安全性や事実性などのテキストをより深く理解する必要がある。
既存の情報検索データから学習した埋め込みモデルの限界を評価・強調する新しいベンチマークを導入する。
本稿では,これらのタスクを検索タスクとして再構成する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:56:32 GMT)
SuperTickets: Drawing Task-Agnostic Lottery Tickets from Supernets via Jointly Architecture Searching and Parameter Pruning [27.1] 本稿では,効率的なディープニューラルネットワーク(DNN)とその宝くじ(宝くじ)のための2対1のトレーニング手法を提案する。
我々は、従来のスパーストレーニングよりも精度と効率のトレードオフを達成し、プログレッシブで統一されたスーパーチケット識別戦略を開発する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:56:55 GMT)
Causal Tree Extraction from Medical Case Reports: A Novel Task for Experts-like Text Comprehension [27.0] 症例報告を受信し,一次疾患を根とする因果樹を生成する新しい課題である因果樹抽出(CTE)を提案する。
CTEは、人間の評価において基準線を20.2ポイント上回り、臨床医の嗜好を反映した評価指標を導入している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:40:01 GMT)
Holistically Evaluating the Environmental Impact of Creating Language Models [26.8] 我々は、2000万から13億のアクティブパラメータから、最大5.6兆のトークンで訓練された一連の言語モデルを開発することで、現実世界の環境への影響を推定する。
私たちの一連のモデルでは、米国の約98世帯に1年間電力を供給するのと同等の493トンの二酸化炭素を放出しています。
また、トレーニングを通じての電力使用量は一貫性がなく、ハードウェアの最大消費電力の15%から85%の間で変動していることもわかりました。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:16:15 GMT)
Spiking Transformer with Spatial-Temporal Attention [26.7] SpikeベースのTransformerは、従来のニューラルネットワーク(ANN)ベースのTransformerに代わる、魅力的でエネルギー効率のよい代替手段を提供する。
本研究では,空間的・時間的情報を自己認識機構に効率よく統合する,シンプルかつ簡単なアーキテクチャである空間時間注意型スパイキングトランスフォーマーを提案する。
アーキテクチャのオーバーホールなしに既存のスパイクベースのトランスにシームレスに統合できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:51:11 GMT)
Unify and Anchor: A Context-Aware Transformer for Cross-Domain Time Series Forecasting [26.6] ドメイン間の時系列予測において,時間的パターンの複雑さと意味的ミスアライメントの2つの重要な課題を識別する。
本稿では,周波数成分を統一的な視点でアンタングルする"Unify and Anchor"転送パラダイムを提案する。
本稿では,構造化表現に時系列コーディネータを用いたTransformerベースのモデルであるContexTSTを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:11:14 GMT)
Unsupervised Disentanglement of Content and Style via Variance-Invariance Constraints [26.5] 観察のシーケンスから歪んだ内容やスタイルの表現を効果的に学習する教師なしの方法。
このような帰納バイアスをエンコーダ・デコーダアーキテクチャに統合し、V3に因んでメソッドを命名する。
実験の結果,V3は複数の領域やモダリティにまたがる音色を呈し,絡み合ったコンテンツやスタイル表現の学習に成功した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:15:20 GMT)
On the Feature Learning in Diffusion Models [26.5] 本稿では,拡散モデルの学習力学を従来の分類モデルと比較し,分析・比較することを目的とした特徴学習フレームワークを提案する。
我々の理論的分析は、拡散モデルがデノナイジング目的のために、データのよりバランスよく包括的な表現を学習することを奨励していることを示している。
対照的に、分類のためにトレーニングされた類似アーキテクチャを持つニューラルネットワークは、データ内の特定のパターンを学ぶことを優先する傾向があり、多くの場合、簡単に学習できるコンポーネントに焦点を当てる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:13:49 GMT)
OIPR: Evaluation for Time-series Anomaly Detection Inspired by Operator Interest [26.5] 我々は,OIPRと呼ばれる時系列異常検出評価指標を新たに提案する。
OIPRは、オペレーターが検出アラームを受信し、障害を処理し、オペレーターの関心曲線の下の領域を利用してTADアルゴリズムの性能を評価する過程をモデル化する。
ポイントパースペクティブとイベントパースペクティブのバランスを達成し、主要な制限を克服し、より広い状況に適用性を提供します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:37:24 GMT)
Offline Model-Based Optimization by Learning to Rank [26.2] 我々は、平均二乗誤差(MSE)で訓練された回帰モデルは、オフラインモデルに基づく最適化の第一目標とうまく一致していないと論じる。
そこで本稿では,学習手法のランク付けに活用し,相対的なスコアに基づいて有望な設計を優先順位付けするランキングベースモデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:38:11 GMT)
Predicting post-release defects with knowledge units (KUs) of programming languages: an empirical study [26.0] 欠陥予測はソフトウェアエンジニアリングにおいて重要な役割を担い、開発者は欠陥が原因のコードを識別し、ソフトウェアの品質を改善することができる。
このギャップに対処するため,ソフトウェアシステムの解析と欠陥予測のための新しい機能セットとして,プログラミング言語の知識単位(KU)を導入する。
KUは、あるプログラミング言語の1つ以上のビルディングブロックによって提供される重要な機能の集合である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:26:17 GMT)
Interactive Debugging and Steering of Multi-Agent AI Systems [25.8] LLMを搭載したAIエージェントの完全な自律チームが登場し、ユーザのための複雑なタスクを共同で実行している。
これらのAIエージェントチームを構築してデバッグしようとする場合、開発者はどのような課題に直面しますか?
5人のAIエージェント開発者とのフォーマティブなインタビューでは、エラーをローカライズするための長いエージェント会話のレビューの困難、インタラクティブデバッグのための現在のツールサポートの欠如、エージェント設定を反復するためのツールサポートの必要性など、主要な課題が明らかになった。
これらのニーズに基づいて、対話型マルチエージェントデバッグツール AG Debugger を開発し、メッセージの閲覧と送信のためのUI、前のエージェントメッセージの編集とリセット機能、概要を視覚化した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:42:54 GMT)
EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test [25.7] LLMコミュニティのトレンドは、推論コストを増大させることなく、モデルインテリジェンスを改善するためにトレーニングデータをスケールアップすることです。
データのスケールアップがEagleプログラムに限定的な改善をもたらすことを観察する。
直接トークン予測に有利な特徴予測を放棄し,マルチ層機能融合によるトップ層機能への依存を代替するEagle-3を導入する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:04 GMT)
MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies [25.5] MATCH POLICYは、高精度なピックと配置タスクを解決するパイプラインである。
アクション推論をポイントクラウド登録タスクに転送する。
非常に高いサンプル効率と、目に見えない構成への一般化性を実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:22:14 GMT)
RALAD: Bridging the Real-to-Sim Domain Gap in Autonomous Driving with Retrieval-Augmented Learning [25.4] 本稿では,リアルタイムとシミュレーションのギャップを低コストで埋めるために,自律運転のための検索強化学習(RALAD)を提案する。
RALADは、(1)拡張された最適輸送(OT)メソッドによるドメイン適応、(2)シンプルで統一されたフレームワーク、(3)効率的な微調整技術を含む3つの主要な設計を特徴としている。
実験の結果,ALADは実世界のシナリオにおける精度を維持しつつ,シミュレーション環境における性能劣化を補償することを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:45:12 GMT)
LaERC-S: Improving LLM-based Emotion Recognition in Conversation with Speaker Characteristics [25.3] 会話における感情認識(英: Emotion Recognition in conversation、ERC)とは、会話中の発話ごとに人間の感情を識別するタスクである。
ERCにおける最近の研究は、感情状態を理解するために話者モデリングを用いた事前訓練された大規模言語モデル(LLM)の利用を模索している。
LLMを刺激する新しいフレームワークであるLaERC-Sを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:36:14 GMT)
AskToAct: Enhancing LLMs Tool Use via Self-Correcting Clarification [25.3] AskToActは、クエリとそのツール呼び出しソリューション間の構造マッピングを利用する。
私たちの重要な洞察は、ツールパラメータが明示的なユーザ意図を自然に表現していることです。
クエリから重要なパラメータを体系的に取り除き,それらを根拠として保持することにより,高品質なトレーニングデータの自動構築を可能にする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:55:49 GMT)
The ShareLM Collection and Plugin: Contributing Human-Model Chats for the Benefit of the Community [25.3] 大規模な言語モデルと統合された人間会話セットであるShareLMコレクションとそのプラグインについて紹介する。
このプラグインを使うと、会話とレスポンスのレベルの両方で会話を評価でき、プライベートにしたい会話を削除することができる。
われわれは、ShareLMコレクションの一部としてプラグインの会話を公開し、オープンなヒューマンモデルデータ分野におけるコミュニティの取り組みを求めている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:18:21 GMT)
Naturally Occurring Feedback is Common, Extractable and Useful [25.3] チャットモデルと対話する際に,ユーザが自然に含むフィードバックを抽出することを提案する。
自然に発生するフィードバックの存在を確認するために,手動でアノテートした。
このフィードバックを100万以上の会話に適用し、数十万のフィードバックサンプルを取得します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:41:46 GMT)
Efficient Learning With Sine-Activated Low-rank Matrices [25.1] 低ランク分解過程に正弦波関数を統合する新しい理論枠組みを提案する。
提案手法は,視覚変換器(ViT),Large Language Models(LLMs),NeRF(Neural Radiance Fields),および3次元形状モデリング(3D shape modelling)において,既存の低ランクモデルに対するプラグインとして証明されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:32:47 GMT)
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing [25.1] MIGEはマルチモーダル命令を使ってタスク表現を標準化する統合フレームワークである。
対象駆動生成を空白キャンバス上の生成として扱い、命令ベースの編集を既存の画像の修正として扱う。
MIGEは、自由形式のマルチモーダル命令を統一された視覚言語空間にマッピングする新しいマルチモーダルエンコーダを導入している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:33:31 GMT)
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models [24.6] 下流視覚質問応答(VQA)における表現学習に関する実証的研究を行った。
我々はOCモデルと代替アプローチの利点とトレードオフを徹底的に検討する。
両パラダイムの強みを活用するための,有望な道を見つける。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:48:03 GMT)
HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios [24.3] 多様な複雑な駐車シナリオを扱うために,Hybrid pOlicy Path PlannEr(HOPE)を導入する。
HOPEは強化学習エージェントをReeds-Shepp曲線に統合し、多様なシナリオにまたがる効果的な計画を可能にする。
本稿では,空間および障害物分布に基づく駐車シナリオの難易度を分類するための基準を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:57:41 GMT)
Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key [24.2] 幻覚は、LVLM(Large Vision-Language Models)にとって大きな課題である。
本稿では,専門家のフィードバックを一意に活用して幻覚応答を補正するOn-Policy Alignment (OPA)-DPOフレームワークを提案する。
OPA-DPOは、AMBERベンチマークで13.26%、Object-Halベンチマークで5.39%のLLaVA-1.5-7Bの幻覚率をさらに低下させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:48:45 GMT)
Adapters for Altering LLM Vocabularies: What Languages Benefit the Most? [23.8] VocADTは、既存の埋め込みの最適線形結合を学ぶために訓練されたアダプタモジュールを用いた語彙適応の新しい手法である。
ラテン文字言語と高度に断片化された言語は語彙適応の恩恵を最も受ける。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:38:28 GMT)
Evaluating LLMs' Assessment of Mixed-Context Hallucination Through the Lens of Summarization [23.7] 大規模言語モデル(LLM)は、幻覚評価を含むテキスト品質評価に広く採用されているアプローチである。
本研究では,要約を代表課題として用いて,混合コンテキスト幻覚の検出におけるLLMの能力を評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:42:57 GMT)
R1-T1: Fully Incentivizing Translation Capability in LLMs via Reasoning Learning [23.7] 本稿では,R1-Translator (R1-T1)について紹介する。
1)MTサブタスクを超えて推論に基づく翻訳を6言語に拡張し、多様なタスク(例えば、法・医学領域適応、イディオム解決)、(2)コンテキスト認識パラフレーズやバック翻訳のようなハイブリッドな人間の戦略を反映した6つの専門家によるCoTテンプレートを定式化した。
実験結果から,フローレス101テストセットにおいて,11言語,40方向の翻訳性能が着実に向上していることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:44:25 GMT)
On the Generalization and Adaptation Ability of Machine-Generated Text Detectors in Academic Writing [23.4] 本研究では,MGT検出器の一般化と適応性について,学術書誌に特有の3つの重要な側面で検討する。
ドメイン内設定とドメイン間設定の両方において、バイナリ分類および帰属タスクのための様々な検出器の性能をベンチマークする。
本研究は,MGT検出器の多種多様なシナリオにおける一般化と適応性に関する知見を提供し,ロバストで適応的な検出システム構築の基礎を築いた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:08:43 GMT)
None of the Above, Less of the Right: Parallel Patterns between Humans and LLMs on Multi-Choice Questions Answering [23.2] 上記の「なし」オプションを用いた複数選択試験は、教育試験において広く研究されている。
NAオプションがモデル性能と信頼性のキャリブレーションにどのように影響するかを検討する。
本結果は,LLMが実世界のアプリケーションで不確実性に対処する能力について,ベンチマーク設計における重要な意味を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:55:29 GMT)
Self-attention-based Diffusion Model for Time-series Imputation in Partial Blackout Scenarios [23.2] 時系列データの欠落値は、機械学習のパフォーマンスを損なう可能性がある。
これまでの研究は、ランダムで完全なブラックアウトと予測シナリオにおいて、欠落したデータの計算に取り組んできた。
本稿では,自己意図と拡散過程を用いた2段階計算プロセスを導入し,特徴量と時間的相関をモデル化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:58:15 GMT)
Multi-Stage Manipulation with Demonstration-Augmented Reward, Policy, and World Model Learning [23.1] ロボット操作における長期作業は、強化学習において重要な課題である。
視覚入力から効率的に学習するためのフレームワークであるDEMO3を提案する。
評価の結果,データ効率は平均40%,特に困難なタスクでは70%向上した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:57:08 GMT)
SrSv: Integrating Sequential Rollouts with Sequential Value Estimation for Multi-agent Reinforcement Learning [23.0] 現実世界の環境の複雑さは信用割当問題を悪化させる。
大規模シナリオにおけるエージェント集団の多様性は、スケーラブルな意思決定メカニズムを必要とする。
逐次値推定を用いた逐次ロールアウト(SrSv)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:17:18 GMT)
SENSEI: Semantic Exploration Guided by Foundation Models to Learn Versatile World Models [23.0] 固有のモチベーションは、外部のタスクベースの報酬から探索を分離しようとする。
SENSEIはモデルに基づくRLエージェントに意味論的行動の本質的な動機を与えるためのフレームワークである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:26:15 GMT)
Mind the (Belief) Gap: Group Identity in the World of LLMs [23.0] 社会的バイアスと信念駆動行動は、いくつかのタスクにおける大規模言語モデル(LLM)の決定に大きな影響を与える可能性がある。
本稿では,社会的相互作用と嗜好を形成する上で重要な役割を果たす古典的集団心理学理論である,信念の一致をシミュレートするマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:50:52 GMT)
Meta Curvature-Aware Minimization for Domain Generalization [22.8] モデルが平らなミニマに収束することを奨励する改良されたモデルトレーニングプロセスを提案する。
そこで我々は,Meta Curvature-Aware Minimization (MeCAM) と呼ばれる新しいアルゴリズムを考案し,局所ミニマ周辺の曲率を最小化する。
本稿では,MeCAMの一般化誤差と収束率に関する理論的解析を行い,既存のDG法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:39:41 GMT)
Exploring Iterative Controllable Summarization with Large Language Models [22.8] 大言語モデル(LLM)は抽象的な要約タスクにおいて顕著な性能を示した。
以上の結果から,LLMは言語属性よりも数値属性に苦しむことが明らかとなった。
制御可能な要約のためのガイド・ツー・説明フレームワーク(GTE)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:35:27 GMT)
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation [22.8] VideoUFOは、現実世界のシナリオにおけるユーザのFOcusに合わせて特別にキュレーションされたビデオデータセットである。
VideoUFOは190万ドル以上のビデオクリップで構成され、それぞれに短いキャプションと詳細なキャプションがある。
実験の結果,(1)現在の16ドルのテキスト・ツー・ビデオモデルでは,すべてのユーザ中心のトピックに対して一貫したパフォーマンスが得られず,(2)ビデオUFOで訓練された単純なモデルでは,最悪の話題に対して他者より優れていたことがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:00:36 GMT)
SynGhost: Invisible and Universal Task-agnostic Backdoor Attack via Syntactic Transfer [22.8] 事前トレーニングは、データやトレーニングメカニズムの脆弱性によるタスク非依存のバックドア攻撃に悩まされる。
我々は,シンタクティックトランスファーによる,目に見えない,普遍的なタスク非依存のバックドアアタックである$mathttSynGhost$を提案する。
$mathttSynGhost$は、コントラスト学習に基づいて最適なターゲットを適応的に選択し、トレーニング前の空間に均一な分布を生成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:34:48 GMT)
Quantifying Overfitting along the Regularization Path for Two-Part-Code MDL in Supervised Classification [22.8] バイナリ分類のための2部分符号最小記述長(MDL)学習規則の正規化曲線全体の完全な特徴付けを行う。
citetGLは、非依存のPAC(頻繁な最悪のケース)の観点から、一貫性の欠如を確立していた。
正規化パラメータ$lambda$とノイズレベルの関数として、最悪のケース制限エラーを正確に定量的に記述する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:52:11 GMT)
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation [22.7] 音声品質評価には、平均世論スコア(MOS)や話者類似度(SIM)など、複数の側面から音声を評価する必要があるのが一般的である。
本稿では,最近導入された聴覚大言語モデル(LLM)を音声品質自動評価に活用することを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:22:54 GMT)
Nonasymptotic Analysis of Stochastic Gradient Descent with the Richardson-Romberg Extrapolation [22.7] 本研究では, 勾配勾配勾配(SGD)を一定のステップサイズで解くことで, 密接な凸と滑らかな問題を解く問題に対処する。
得られた推定子の平均二乗誤差を、反復数$n$に対して拡張する。
我々の分析は、時相マルコフ連鎖と見なされるSGDの特性に依存している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:18:55 GMT)
Fairness and/or Privacy on Social Graphs [22.6] グラフニューラルネットワーク(GNN)は、様々なグラフベースの学習タスクにおいて顕著な成功を収めている。
近年の研究では、GNNの公平性やプライバシーの問題が懸念されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:56:32 GMT)
Rashomon Sets for Prototypical-Part Networks: Editing Interpretable Models in Real-Time [22.4] 解釈可能性(Interpretability)は、ハイテイクな設定で機械学習モデルに不可欠である。
コンピュータビジョンでは、プロトタイプ部分モデル(ProtoPNet)がこのニーズを満たすために支配的なモデルタイプとなっている。
Proto-RSetと呼ばれる私たちのフレームワークは、すぐに多くの正確で多様なProtoPNetを生成します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:22:03 GMT)
Enhancing Large Language Models with Pseudo- and Multisource- Knowledge Graphs for Open-ended Question Answering [22.3] Pseudo-Graph GenerationとAtomic Knowledge Verificationを組み合わせたフレームワークを提案する。
ベースラインと比較して、オープンエンド質問に対するROUGE-Lスコアの11.5の最小改善が得られる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:21:11 GMT)
Syntactic Learnability of Echo State Neural Language Models at Scale [22.1] 我々は,単純なリカレントニューラルネットワークの制限クラスである基本貯水池計算(RC)モデルであるEcho State Network(ESN)を再検討する。
実験の結果,約1億語を学習した場合の文法判断タスクにおいて,大きな隠蔽状態のESNはTransformerに匹敵するか,優れていることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:37:55 GMT)
Compositional simulation-based inference for time series [22.0] シミュレーションデータに基づいてニューラルネットワークをトレーニングし、ベイズ推論を実行する方法。
シミュレータは、時間とともに何千もの単一状態遷移を通して現実世界のダイナミクスをエミュレートする。
本研究では,個々の状態遷移に整合したパラメータを局所的に同定することで,マルコフシミュレータを活用できるSBI手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:04:30 GMT)
SkyServe: Serving AI Models across Regions and Clouds with Spot Instances [21.9] SpotHedgeは、さまざまな障害ドメインにまたがるスポットレプリカを活用して、可用性、低コスト、サービス品質を保証するポリシである。
SkyServeはSpotHedgeを利用して、スポットとオンデマンドのレプリカを混ぜてAIモデルを効率的に提供するシステムです。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:39:13 GMT)
S-NeRF++: Autonomous Driving Simulation via Neural Reconstruction and Generation [21.5] S-NeRF++は神経再構成に基づく革新的な自律運転シミュレーションシステムである。
S-NeRF++は、nuScenesやradianceなど、広く使われている自動運転データセットでトレーニングされている。
システムは、ノイズとスパースLiDARデータを効果的に利用して、トレーニングを洗練し、奥行きの外れ値に対処する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:42:15 GMT)
LegalCore: A Dataset for Legal Documents Event Coreference Resolution [21.1] われわれは、法的ドメインであるLegalCoreの最初のデータセットを、包括的なイベントとイベントコア情報で注釈付けした形で提示する。
このデータセットにアノテートした法律上の契約文書は、ニュース記事の何倍も長く、1ドキュメントあたりの平均トークン数は25万である。
このデータセットでは、イベント検出とイベントコア参照解決の両方のタスクに対して、主流のLarge Language Modelsをベンチマークします。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:36:00 GMT)
High-precision measurement of microwave electric field by cavity-enhanced critical behavior in a many-body Rydberg atomic system [21.1] マイクロ波電界の等価測定感度は,自由空間のそれと比較して桁違いに向上できることを示す。
得られた感度は2.6nV/cm/Hz$1/2$まで向上できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:21:16 GMT)
Open-Set Recognition of Novel Species in Biodiversity Monitoring [21.0] オープンセット認識とアウト・オブ・ディストリビューション検出のためのきめ細かい画像認識ベンチマークデータセットであるOpen-Insectsを紹介する。
我々は、ポストホック法、トレーニング時間正規化、補助データによるトレーニングを含む、様々なオープンセット認識アルゴリズムを評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:04:46 GMT)
Proportionality in Thumbs Up and Down Voting [20.8] 上下投票の有無で比例関係を解釈する2つの概念的アプローチを提案する。
第一のアプローチは、候補者を選ぶことによる満足度を同等に扱い、複合比例保証をもたらす。
第2のアプローチでは、ベト・パワーを別々に検討し、従来の比例性とは異なる保証を導入する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:02:37 GMT)
Slowing Down Forgetting in Continual Learning [20.6] 継続的学習(CL)における一般的な課題は、新しいタスクが学習された後に古いタスクのパフォーマンスが落ちることを忘れることである。
本稿では,ReCLと呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:22:24 GMT)
OpenGS-SLAM: Open-Set Dense Semantic SLAM with 3D Gaussian Splatting for Object-Level Scene Understanding [20.6] OpenGS-SLAMは3次元ガウス表現を利用して、オープンセット環境で密接なセマンティックSLAMを実行する革新的なフレームワークである。
本システムは,2次元モデルから派生した明示的なセマンティックラベルを3次元ガウスフレームワークに統合し,ロバストな3次元オブジェクトレベルの理解を容易にする。
本手法は従来の手法に比べて10倍高速なセマンティックレンダリングと2倍のストレージコストを実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:23:21 GMT)
Large-Scale Data Selection for Instruction Tuning [20.5] 命令チューニングのためのデータ選択アプローチは、通常、小さなプールから小さなデータセットを選択することでテストされる。
しかし、一般的なインストラクションチューニングモデルでは、数十万から数百万のサンプルをトレーニングし、さらに大きなデータプールからサンプリングすることが多い。
この設定では,最近提案された多くの手法はランダムな選択に欠けており,さらに大きなデータプールへのアクセスを与えられると,性能が低下することさえ示している。
表現に基づくデータ選択の変種(RDS+)は、テストされたすべての設定において、より複雑なメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:37:26 GMT)
Semantically Structured Image Compression via Irregular Group-Based Decoupling [20.4] 本稿では,グループマスクのカスタマイズにより,画像を不規則な形状の複数のグループに分離することを提案する。
我々のフレームワークは、ビットストリームを無視可能なコストで構成し、視覚的品質と知的タスクサポートの両方において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:38:29 GMT)
Efficient multiplexed quantum memory with high dimensional orbital angular momentum states in cold atoms [20.4] 高次元軌道角運動量(OAM)状態の光子を4つの個別チャネルから8,7$Rbの長い低温原子アンサンブルに結合することにより、効率的な多重化量子メモリを実験的に実証した。
すべてのチャネルが4次元のヒルベルト空間で操作される場合、記憶容量は83%を超え、これは古典的なベンチマークよりもはるかに上回っており、メモリシステムの量子機能を検証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:21:47 GMT)
Enhancing Object Detection Accuracy in Underwater Sonar Images through Deep Learning-based Denoising [20.4] ソナー画像の様々なノイズは、物体検出の精度に影響を与える可能性がある。
ディープラーニングに基づくdenoisingアルゴリズムは、光学画像上でよく機能する。
本稿では,複数のディープラーニングに基づくDenoisingアルゴリズムの有効性を体系的に評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:30:39 GMT)
Exploration on Real World Assets and Tokenization [20.1] この研究は、流動性を高め、資産管理のプラクティスを洗練することを目的として、ブロックチェーン上の実世界の資産(RWA)のトークン化について検討する。
本研究は,既存の展開の事例研究を包括的に分析し,従来の資産管理パラダイムを再構築する上でのブロックチェーン技術のメリット,ハードル,将来的な進歩を評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:37:16 GMT)
Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents [20.1] 環境を視覚的に完全に認識し,GUI上でピクセルレベルの操作を直接実行する,GUIエージェントのためのヒューマンライクなエボディメントを提唱する。
これまでに10MのGUI要素と参照式を1.3Mのスクリーンショット上に収めた、GUIの視覚的接地のための最大のデータセットを収集しました。
ウェブベースの合成データとLLaVAアーキテクチャの若干の適応を含む簡単なレシピは、このような視覚的接地モデルのトレーニングに驚くほど効果的であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:39:16 GMT)
SemGeoMo: Dynamic Contextual Human Motion Generation with Semantic and Geometric Guidance [19.9] 本研究では,動的文脈の人間の動作生成に有効なSemGeoMoを提案する。
提案手法は,3つのデータセット上での最先端性能を実現し,多様な相互作用シナリオに対して優れた一般化能力を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:28:40 GMT)
DiffTORI: Differentiable Trajectory Optimization for Deep Reinforcement and Imitation Learning [19.8] 本稿では、微分軌道最適化をポリシー表現として活用し、深層強化と模倣学習のためのアクションを生成するDiffTORIを提案する。
15のモデルベースRLタスクと35の模倣学習タスクに高次元画像と点クラウド入力があり、DiffTORIはどちらのドメインでも最先端の手法よりも優れている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:40:19 GMT)
Dynamics of Instruction Fine-Tuning for Chinese Large Language Models [19.8] 本研究では,中国語大言語モデルの指導指導におけるデータ量,モデルサイズ,データ構築方法の影響を体系的に検討する。
実験では,7bから33bパラメータのモデルを用いて3つの重要な結果を得た。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:49:17 GMT)
Structural Deep Encoding for Table Question Answering [19.6] トランスフォーマーベースのアーキテクチャは、しばしばテーブル構造をフラットにする。
これにより、行、列、セル間の本質的な相互依存性が失われる可能性がある。
本稿では,計算効率を向上するだけでなく,構造的整合性も維持する,テーブル状データのための新しいスパークアテンションマスクの設計を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:16:43 GMT)
Do PAC-Learners Learn the Marginal Distribution? [19.5] PAC Learning の基本定理は、概念クラス $H$ の学習可能性は$H$ における経験的エラーの $textituniform convergence$ と等価であると主張している。
この研究は、PAC学習、一様収束、分布自由設定を超えた密度推定の関連を再考する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:56:56 GMT)
Identifying User Goals from UI Trajectories [19.5] 観測されたUI軌道からタスク目標を識別する手法を提案する。
また,2つの意図記述をパラフレーズとみなすことができるかどうかを評価するための新しい評価手法を提案する。
このタスクをベンチマークするために、人間と最先端モデル、特にGPT-4とGemini-1.5 Proのパフォーマンスを比較した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:47:10 GMT)
Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning [19.5] i-QNは、アクション値関数の調整されたシーケンスを学習することで、複数の連続したベルマン更新を可能にする、原則化されたアプローチである。
i-QNは理論的に根拠があり、値ベースおよびアクター批判的手法でシームレスに使用できることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:48:55 GMT)
Building Interval Type-2 Fuzzy Membership Function: A Deck of Cards based Co-constructive Approach [19.3] Interval Type-2 Fuzzy Sets (IT2FSs) は、メンバーシップの割り当ての不確実性を取り入れて導入された。
既存のIT2FS構築手法はDMへの積極的な関与を欠いていることが多く、決定モデルの解釈可能性と有効性を制限する。
本研究は,言語用語のIT2FSモデル構築のための社会技術的共同構築手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:08:18 GMT)
WeightedKV: Attention Scores Weighted Key-Value Cache Merging for Large Language Models [19.1] 大規模言語モデル(LLM)は、キー値(KV)キャッシュを使用して、自動回帰生成における冗長な計算を削減する。
ほとんどのKVキャッシュ圧縮手法は、固定キャッシュサイズを維持するために重要でないKVペアを排除し、生成時にトークンが恒久的に失われる。
WeightedKVは、重要でないトークンのテキストキーを排除し、平均アテンションスコアで重み付けされた凸組み合わせにより、それらのテキスト値を隣接するトークンにマージする、トレーニング不要なアプローチである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:12:34 GMT)
A CGAN-LSTM-Based Framework for Time-Varying Non-Stationary Channel Modeling [18.9] 本稿では,非定常チャネル特性の進化を捉えるために,長期的動的チャネルの生成を強調した。
本研究では,条件付き生成逆数ネットワーク(CGAN)と長期記憶ネットワーク(LSTM)を組み合わせたハイブリッドディープラーニングフレームワークを提案する。
定常性に制約されたアプローチは、生成された時系列チャネルの時間的相関を保証するように設計されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:27:45 GMT)
From Target Tracking to Targeting Track -- Part III: Stochastic Process Modeling and Online Learning [18.8] 本研究では,対象軌道をプロセス(SP)のサンプルパスとして記述する。
決定論的確率分解フレームワークを採用することにより、軌道SPの学習を2つの逐次段階に分解する。
これにより、マルコフフリーなデータ駆動トラッキングアプローチが実現し、ターゲットダイナミクスの事前知識を最小限に抑えた連続時間軌道が生成される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:04:38 GMT)
A Selective Learning Method for Temporal Graph Continual Learning [18.8] リアルタイムの時間グラフはしばしば時間とともに新しいノードクラスを導入しますが、既存のTGLメソッドは固定されたクラスのセットを前提としています。
本稿では,新しい問題を時間グラフ連続学習(TGCL)として定義する。
このような置換によって生じる誤差の上限を導出し、古いクラスデータの分布を保ちながら、分類誤差を最小限に抑えるサブセットの選択と学習の目的に変換する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:22:20 GMT)
Multi-modal AI for comprehensive breast cancer prognostication [18.7] 我々は、デジタル病理と臨床データを統合する新しい人工知能(AI)ベースのアプローチを開発した。
この検査は15のコホートで計8,161人の乳がん患者のデータを用いて開発・評価された。
以上の結果から,我々のAIテストは既存の予後検査の精度を改善しつつ,幅広い患者に適用可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:23:44 GMT)
Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning [18.6] 我々は、追加のサンプルを必要としない最適化手順の非定常性を考慮するために、Adaptive $Q$Network (AdaQN)を提案する。
AdaQNは理論上は健全で、MuJoCo制御問題やAtari 2600のゲームで実証的に検証されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:39:53 GMT)
Early-Bird GCNs: Graph-Network Co-Optimization Towards More Efficient GCN Training and Inference via Drawing Early-Bird Lottery Tickets [18.5] グラフ畳み込みネットワーク(GCN)は、グラフ上での表現学習のための最先端のディープラーニングモデルとして登場した。
本稿では,GCNトレーニングの効率を大幅に向上させる,GEBTと呼ばれる汎用的なGCN早期学習フレームワークを提案する。
我々のGEBTは80.2% 85.6%、84.6% 87.5%のGCNトレーニングと推論コストを削減し、最先端の手法と比べて同等またはそれ以上の精度を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:05:17 GMT)
Does SGD really happen in tiny subspaces? [18.3] 近年の研究では、トレーニング軌道に沿って、勾配がトレーニング損失 Hessian の低ランクトップ固有空間と整合していることが示されている。
本稿では,ニューラルネットワークが支配的な部分空間内でトレーニング可能かどうかを考察し,より効率的なトレーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:11:11 GMT)
CromSS: Cross-modal pre-training with noisy labels for remote sensing image segmentation [18.3] 我々は,意味的セグメンテーションモデルを事前学習することで特徴学習を強化するために,大規模雑音ラベル付きデータの可能性を探る。
従来の事前トレーニングアプローチとは異なり、CromSSは大量のノイズと簡単に得られるラベルを活用して、機能学習を改善している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:38:09 GMT)
Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation [18.2] 対象物に対向パッチを付けることで視覚ナビゲーションを具体化するための実用的な攻撃法を提案する。
敵のパッチは平均22.39%の航法成功率を低下させ, 実用性, 有効性, 自然性において従来の手法より優れていた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:47:34 GMT)
A Linearly Convergent Frank-Wolfe-type Method for Smooth Convex Minimization over the Spectrahedron [18.0] 我々は、$n$次元の spectrahedron 上で滑らかで凸関数を最小化する問題を考える。
標準的な一階法は、次元$n$が大きければ禁じられるような高階行列計算を必要とすることが多い。
我々は,効率の良いランク1行列計算のみを適用した,フランク・ウルフに基づく最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:46:46 GMT)
An Efficient Plugin Method for Metric Optimization of Black-Box Models [17.9] 下流のユーザは、特定のターゲットディストリビューションでモデルを変更、再トレーニング、微調整することができない。
我々は,任意のブラックボックス分類器から任意のマルチクラス予測を処理する,シンプルで効率的な手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:01:36 GMT)
Pretrained Embeddings as a Behavior Specification Mechanism [17.9] 仕様言語における第一級コンストラクトとして埋め込みを導入する。
埋め込みベースの仕様は、望ましい行動に向けてシステムを操るのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:41:22 GMT)
A Shared Encoder Approach to Multimodal Representation Learning [17.9] 医療領域に適したマルチモーダル表現学習のための共有エンコーダフレームワークを提案する。
提案手法では,モダリティ間で共有される1組のエンコーダパラメータを用い,学習可能なモダリティ特徴を付加する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:29:26 GMT)
Towards Better Chain-of-Thought: A Reflection on Effectiveness and Faithfulness [17.6] CoT(Chain-of-Thought)プロンプトは、異なる推論タスクの下で様々なパフォーマンスを示す。
これまでの作業は、それを評価しようとするが、CoTに影響を与えるパターンの詳細な分析を提供するには不足している。
我々は,CoTの有効性が問題困難,情報ゲイン,情報フローなどのパフォーマンス改善に影響を及ぼす重要な要因を同定する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:25:36 GMT)
Position: Ensuring mutual privacy is necessary for effective external evaluation of proprietary AI systems [17.5] AIシステムの外部評価は、その潜在的なリスクを理解するための重要なアプローチとして、ますます認識されている。
実際に外部評価を行うことは、評価者のシステムアクセスとAI開発者のプライバシとセキュリティ上の懸念のバランスをとる上で、大きな課題に直面します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:24:59 GMT)
HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts [17.5] ラベル付き集合に異なる領域の画像も含んでいる場合、GCDを処理するための新しいタスクとメソッドを導入する。
提案するHiLo'ネットワークは,高レベルのセマンティックおよび低レベルのドメイン特徴を抽出する。
我々は,GCDタスクに適した専門領域拡張とカリキュラム学習アプローチにより,本手法を拡張した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:35:33 GMT)
Max-Affine Spline Insights Into Deep Network Pruning [17.5] 我々は、Deep Networks(DNs)におけるプルーニングの重要性と、高度にパラメータ化されたDNのプルーニングと「明確」な小さなDNのトレーニングの関係について検討する。
我々はアーリーバード(EB)チケット現象を検出し、現在のプルーニング技術への解釈可能性を提供し、原則的プルーニング戦略を開発することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:59:39 GMT)
Federated Learning in Practice: Reflections and Projections [17.4] Federated Learning(FL)は、複数のエンティティがローカルデータを交換することなく、共同で共有モデルを学ぶことができる機械学習技術である。
Google、Apple、Metaといった組織によるプロダクションシステムは、FLの現実的な適用性を実証しています。
我々は、厳密な定義よりもプライバシー原則を優先する再定義されたFLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:14:17 GMT)
ECG-EmotionNet: Nested Mixture of Expert (NMoE) Adaptation of ECG-Foundation Model for Driver Emotion Recognition [17.4] 本稿では,動的運転環境における感情認識に特化した新しいアーキテクチャであるECG-EmotionNetを紹介する。
ECGは、特に動的で予測不可能な運転条件において、リアルタイムの感情モニタリングのための待機選択として現れている。
提案したECG-EmotionNetアーキテクチャの有効性を,最近導入されたドライバ感情監視データセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:19:45 GMT)
A thermal-noise-resilient microwave quantum network traversing 4 K [17.4] マイクロ波周波数での量子通信は、マイクロ波光子の熱雑音に対する感受性によって制限されている。
2つの超伝導量子ビット間のコヒーレントカップリングを確立する熱ノイズ耐性マイクロ波量子ネットワークを実証する。
我々のアーキテクチャはマイクロ波量子系の温度適合性障壁を克服する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:28:37 GMT)
Towards Improved Text-Aligned Codebook Learning: Multi-Hierarchical Codebook-Text Alignment with Long Text [17.4] 本稿では,TA-VQ という新しいテキスト拡張コードブック学習フレームワークを提案する。
テキスト整合性のあるコードブック学習を改善するために視覚言語モデルを用いて、各画像に対してより長いテキストを生成する。
2つの課題に対処するために、長文を複数の粒度、すなわち単語、句、文に分割することを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:38:18 GMT)
Eau De $Q$-Network: Adaptive Distillation of Neural Networks in Deep Reinforcement Learning [17.4] 本稿では,エージェントの学習速度の間隔を増大させる高密度なスパースアルゴリズムを提案する。
提案手法をAtari $2600$ベンチマークとMuJoCo物理シミュレータで評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:39:03 GMT)
Composed Multi-modal Retrieval: A Survey of Approaches and Applications [17.3] Composed Multi-modal Retrieval (CMR) では、参照視覚入力とテキスト修正を統合することで、画像やビデオを検索することができる。
CMRは次世代の検索システムにおいて重要な技術になりつつある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:18:43 GMT)
Learning to Generate Long-term Future Narrations Describing Activities of Daily Living [17.3] 将来のイベントを予測することは、ヘルスケア、スマートホーム技術、監視など、さまざまなアプリケーションドメインにとって不可欠である。
我々は,従来の行動予測を超えて,より長期にわたるナレーション生成を行う,新しいタスクを提案する。
私たちは、この課題に対処するために特別に設計された視覚言語モデルViNaを紹介します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:10:49 GMT)
Will AI replace Software Engineers? Do not hold your breath [17.2] LLM(Large Language Models)のような人工知能技術は、コード作成において非常に人気がある。
このことが、将来のソフトウェアジョブはLLMによってのみ実行されると推測され、ソフトウェア産業は存在し続けるだろう。
しかし、ソフトウェアエンジニアリングは、コードを生成する以上のものです -- 特に、大規模なソフトウェアをメンテナンスし、信頼性を維持することは、ソフトウェアエンジニアリングの重要な部分です。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:46:41 GMT)
ACCORD: Alleviating Concept Coupling through Dependence Regularization for Text-to-Image Diffusion Personalization [17.2] イメージパーソナライゼーションにおける重要な課題は、概念的結合の問題である。
本稿では,2つの相補的なプラグ・アンド・プレイ損失関数を提案する。
提案手法は,テキスト制御とパーソナライゼーションの整合性との間に優れたトレードオフを実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:00:04 GMT)
Generalizable Prompt Learning of CLIP: A Brief Overview [17.1] この記事では、数発のプロンプト学習に基づくCLIPの概要を紹介する。
このレビューの目的は、CLIPの一般化可能なプロンプトで研究を開始したばかりの研究者への参照を提供することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:41:41 GMT)
Med-LEGO: Editing and Adapting toward Generalist Medical Image Diagnosis [17.1] Med-LEGOは、ジェネラリストCADモデルのシームレスな統合や更新を可能にする、トレーニング不要のフレームワークである。
我々の実験では、Med-LEGOは、クロスドメインとインドメインの両方の医療タスクにおいて、既存の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:27:11 GMT)
PostHoc FREE Calibrating on Kolmogorov Arnold Networks [17.0] コルモゴロフ・アーノルドネットワーク(コルモゴロフ・アーノルドネットワーク、KAN)は、コルモゴロフ・アーノルドの表現定理に触発されたニューラルネットワークである。
Kansは、標準MultiLayer Perceptrons(MLPs)によってモデル化されたもの以外の複雑な非線形性を捉えることができる
カンは、密集したデータ領域における過信と疎開な領域における過信と示す誤判定された信頼度をしばしば示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:42:49 GMT)
HanDrawer: Leveraging Spatial Information to Render Realistic Hands Using a Conditional Diffusion Model in Single Stage [16.9] ハンドジェネレーションプロセスの条件付けを行うモジュールであるHanDrawerを提案する。
空間的に融合した特徴は、単一ステージ拡散モデル復調過程の導出に使用される。
HanDrawer氏は、ハンドリージョンに特別な注意を払いながら、イメージ機能全体を学習する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:29:33 GMT)
Confidential Federated Computations [16.4] Federated Learning and Analytics (FLA)は、デバイス上の機密データを処理するためのテクノロジプラットフォームによって広く採用されている。
FLAシステムは必ずしも差分プライバシー(DP)のような匿名化機構を必要としない
本稿では,サーバサイドの計算の秘密性を確保するために,TEEとオープンソースを活用した新しいシステムアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:15:09 GMT)
Improving Representation of High-frequency Components for Medical Visual Foundation Models [16.4] 我々は、周波数適応表現オートエンコーダ(Frepa)という新しい事前学習戦略を提案する。
Frepaはエンコーダに画像埋め込みにおける高周波成分を効果的に表現し保存することを奨励する。
そこで我々はFrepaを9つの医療モダリティにまたがって開発し、2D画像と3Dボリュームデータの両方に対して32の下流タスクで検証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:31:01 GMT)
Can Knowledge Editing Really Correct Hallucinations? [16.3] 大規模言語モデル(LLM)は、タスクにまたがる優れた能力にもかかわらず、生成されたコンテンツの非現実的な情報を参照しながら幻覚に悩まされる。
知識編集は,LLMで符号化された誤った事実知識を,スクラッチから再学習を避けるという利点により修正するための,新しい一般的なパラダイムとして開発された。
実世界の幻覚を正すための知識編集手法を全体ベンチマークするために,HaluEditBenchを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:37:23 GMT)
Towards a General Time Series Anomaly Detector with Adaptive Bottlenecks and Dual Adversarial Decoders [16.3] 時系列異常検出は幅広い応用において重要な役割を果たす。
既存のメソッドでは、データセットごとに1つの特定のモデルをトレーニングする必要があります。
本稿では,広範囲なマルチドメインデータセット上で事前学習した時系列異常検出モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:40:28 GMT)
Cancer Type, Stage and Prognosis Assessment from Pathology Reports using LLMs [16.3] 我々は、GPTファミリ、Mistralモデル、オープンソースのLlamaモデルといった最先端の言語モデルを活用し、病理報告の分析においてその性能を評価する。
具体的には, 癌型同定, AJCCステージ決定, 予後評価におけるそれらの性能について検討した。
ゼロショット環境での性能指標を詳細に分析した結果,Path-llama3.1-8BとPath-GPT-4o-mini-FTという2つの命令調整モデルを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:41:16 GMT)
LLMOPT: Learning to Define and Solve General Optimization Problems from Scratch [16.2] 最適化の一般化を促進するため,LLMOPTと呼ばれる統合学習ベースのフレームワークを提案する。
LLMOPTは、様々な最適化問題タイプを定義するための普遍モデルとして導入された5要素の定式化を構築している。
LLMOPTは線形/非線形プログラミングや混合整数プログラミングといった様々な最適化問題をモデル化することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:20:08 GMT)
Generating Counterfactual Explanations Under Temporal Constraints [16.1] 本稿では,プロセストレース上での線形時間論理で表される背景知識に従うことを保証する,時間的制約のある反事実を生成する新しい手法を提案する。
生成されたカウンターファクトは、時間的依存関係を含むアプリケーションに対して、時間的意味を持ち、より解釈可能である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:22:48 GMT)
Linear quadratic control of nonlinear systems with Koopman operator learning and the Nyström method [16.0] 計算量を大幅に削減するために,ランダムな部分空間をどのように利用できるかを示す。
我々の主な技術的貢献は、Nystr"om近似の効果に関する理論的保証を導出することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:34:28 GMT)
Transfer Learning of Real Image Features with Soft Contrastive Loss for Fake Image Detection [15.9] 自然トレース抽出のための自己教師付き特徴マッピングプロセスを導入し,ソフトコントラストロスに基づく伝達学習を開発する。
これにより、検出器は自然なトレースへの画像の近接に基づいて決定を行う。
提案手法では,96.2%のmAPがベースラインを著しく上回っている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:12:09 GMT)
GDTS: Goal-Guided Diffusion Model with Tree Sampling for Multi-Modal Pedestrian Trajectory Prediction [15.7] マルチモーダル軌道予測のための木サンプリングを用いたゴールガイド拡散モデルを提案する。
2段階のツリーサンプリングアルゴリズムが提案され、一般的な特徴を活用して推論時間を短縮し、マルチモーダル予測の精度を向上させる。
実験により,提案フレームワークは,公開データセットにおけるリアルタイム推論速度と同等の最先端性能を達成できることが実証された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:41:00 GMT)
Adaptive parameter sharing for multi-agent reinforcement learning [15.7] 生物学における脳に関する研究から着想を得た新しいパラメータ共有手法を提案する。
エージェントのタイプを、そのアイデンティティに基づいて、共有ネットワーク内の異なるリージョンにマッピングする。
本手法は,訓練パラメータを付加することなく,異なるエージェント間の戦略の多様性を向上させることができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:41:53 GMT)
Prioritizing Computing Research to Empower and Protect Vulnerable Populations [15.5] テクノロジーは様々な脆弱な人口にリスクをもたらす可能性がある。
私たちは皆を悩ませ、最も脆弱な人々でさえ権限を与え、支援される社会を育むシステムを作ることができます。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:10:41 GMT)
The Road Less Traveled: Investigating Robustness and Explainability in CNN Malware Detection [15.4] マルウェア分類におけるCNNの振る舞いをよりよく理解するために,定量的解析と説明可能性ツールを統合した。
難解化技術は, モデル精度を最大50%低減し, 頑健性を高めるための緩和戦略を提案する。
本研究は,ディープラーニングを用いた侵入検知システムの解釈可能性とレジリエンスの向上に寄与する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:42:00 GMT)
Kiss3DGen: Repurposing Image Diffusion Models for 3D Asset Generation [15.4] 本稿では,3Dオブジェクトの生成,編集,拡張を行う効率的なフレームワークであるKiss3DGen(Keep It Simple and Straightforward in 3D Generation)を紹介する。
具体的には,多視点画像とその対応する正規写像からなるタイル付き表現である'3D Bundle Image'を生成するために拡散モデルを微調整する。
この簡単な方法は、3次元生成問題を2次元画像生成タスクに効果的に変換し、事前訓練された拡散モデルにおける知識の利用を最大化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:07:19 GMT)
ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts [15.3] ISDと呼ばれる画像プロンプトスコアの蒸留損失を導入し、参照画像を用いてテキストから3Dへの直接最適化を行う。
本実験は, 従来のテキスト・ツー・3D手法と比較して, 視覚的コヒーレントで高品質な出力を実現し, 最適化速度を向上することを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:00:39 GMT)
Alchemist: Towards the Design of Efficient Online Continual Learning System [15.2] Alchemistは、サービス中に計算された中間結果を効率的に再利用するオンライン連続学習システムである。
トレーニングスループットを最大1.72倍に向上し、トレーニング中に最大47%のメモリ使用量を削減し、最大2倍のトレーニングトークンをサポートする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:14:34 GMT)
TactStyle: Generating Tactile Textures with Generative AI for Digital Fabrication [15.2] 本稿では,3Dモデルに触覚特性を取り入れつつ,画像で3DモデルをスタイリングするシステムであるTactStyleを紹介する。
TactStyleは、修正された画像生成モデルを使用してこれを達成し、所定の表面テクスチャのための高さ場を生成する。
心理物理学的な実験では、3Dプリントした原材料とTactStyleの生成したテクスチャの触覚特性を評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:29:27 GMT)
Beyond Prompting: An Efficient Embedding Framework for Open-Domain Question Answering [15.0] 大規模言語モデルは、最近、新しいフロンティアにオープンドメインの質問に答えた。
一般的なレトリバーリーダーパイプラインは、しばしば複数のプロンプトレベル命令に依存する。
EmbQAは,レシーバとリーダの両方を強化した埋め込みレベルのフレームワークである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:41:35 GMT)
Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference [15.0] リワード推論は、ヒューマンフィードバックパイプラインからの強化学習における重要な中間ステップである。
本稿では,帯域幅を超える一般RL問題と決定論的MDP帯域幅,Bradley-Terryモデルを超える一般選好モデルについて,報酬推論のない2つのRLHFアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:28:42 GMT)
Benchmarking Large Language Models for Multi-Language Software Vulnerability Detection [15.0] 本稿では,ソフトウェア脆弱性検出タスクにおいて,大規模言語モデル(LLM)の性能を評価する。
Pythonで8,260の脆弱な関数、Javaで7,505、JavaScriptで28,983のデータセットをコンパイルしました。
これらのLSMは、5つの微調整された小さな言語モデルと2つのオープンソースの静的アプリケーションセキュリティテストツールに対してベンチマークされる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:56:00 GMT)
A Meta-Learning Approach to Bayesian Causal Discovery [15.0] ベイズの後部から得られるような因果構造に対する不確実性は、下流のタスクにしばしば必要である。
近年の研究では、メタラーニングを用いて、最大a-posteriori因果グラフを教師あり学習として推定する問題を考察している。
本稿では,後部から因果構造を抽出し,これらの特徴を符号化するベイズメタ学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:21:35 GMT)
m4: A Learned Flow-level Network Simulator [14.8] フローレベルのシミュレータは、動的に割り当てられた送信速度を持つ連続フローとしてトラフィックを抽象化する。
機械学習を用いて関心のネットワークのダイナミクスを学習する,正確でスケーラブルなフローレベルシミュレータであるm4を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:51:08 GMT)
CoT-VLM4Tar: Chain-of-Thought Guided Vision-Language Models for Traffic Anomaly Resolution [14.7] CoT-VLM4Tar:(交通異常解消のための思考視覚言語モデルの構造)
本稿では,より合理的かつ効果的に交通異常を解析し,推論し,解決する上で,VLMを導くための新たなチェーン・オブ・思想を提案する。
本結果は,VLMがリアルタイム交通異常の解消に有効であることを示し,自律的な交通管理システムへの統合の実証となる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:07:25 GMT)
Node-Time Conditional Prompt Learning In Dynamic Graphs [14.6] DYGPROMPTは動的グラフモデリングのための新しい事前学習および迅速な学習フレームワークである。
我々はノードと時間の特徴が相互に特徴付けることを認識し、下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:10:46 GMT)
From Language to Cognition: How LLMs Outgrow the Human Language Network [14.6] 大規模言語モデル(LLM)は、人間の言語ネットワークにおける神経活動と著しく類似している。
我々は8つのモデルサイズにまたがる300Bトークンにまたがる34のトレーニングチェックポイントをベンチマークし、脳のアライメントが言語能力とどのように関連しているかを分析した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:54:19 GMT)
Heterogeneity Matters even More in Distributed Learning: Study from Generalization Perspective [14.5] (K)クライアントは、潜在的に異なるデータ分布に応じて、それぞれ(n)のトレーニングサンプルを独立して生成する。
集約されたモデルの一般化誤差に及ぼすクライアントのデータ分布の相違の影響について検討する。
クライアント間のデータの均一性の度合いが高くなるにつれて、バウンダリが小さくなることが示されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:33:38 GMT)
Langevin Multiplicative Weights Update with Applications in Polynomial Portfolio Management [14.3] 非漸近収束解析により,LMvinvinをベースとした勾配局所最小値が得られた。
LMvinvinアルゴリズムは,非漸近収束解析による大域最小解法であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:32:09 GMT)
Blind Augmentation: Calibration-free Camera Distortion Model Estimation for Real-time Mixed-reality Consistency [14.3] 実写カメラの映像はノイズ、動きのぼかし(MB)、奥行き(DoF)
仮想コンテンツをライブビデオフィードに構成した拡張現実アプリケーションでは、ノイズ、MB、DoFをモデル化して、仮想コンテンツをビデオと視覚的に整合させることができる。
本稿では,音,MB,DoFのパラメータを瞬時に推定する手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:30:56 GMT)
Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations [14.1] Saliency-Benchは、複数のデータセットにわたるSaliencyメソッドによって生成された視覚的説明を評価するために設計された、新しいベンチマークスイートである。
ベンチマークには、視覚的説明の忠実さと整合性を評価するための標準化された統一された評価パイプラインが含まれている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:26:26 GMT)
Using High-Level Patterns to Estimate How Humans Predict a Robot will Behave [13.8] ロボットと対話する人間は、ロボットが次に何をするかを予測する。
ロボットは、安全でシームレスな相互作用に対する人間の予測を理解することが重要である。
我々は、ロボットが人間の行動を予測する方法を推定できる2階のマインド・アプローチを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:40:34 GMT)
First-Person Fairness in Chatbots [13.8] 第一対人公正性」を評価するためのスケーラブルな対実的アプローチを導入する。
このアプローチを適用して、数百万のインタラクションにまたがる6つの言語モデルのバイアスを評価する。
本研究は,実世界のチャットデータに基づく,初めての大規模公正度評価である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:13:10 GMT)
An Efficient Framework for Crediting Data Contributors of Diffusion Models [13.8] 本稿では,Shapley値推定のための推論を効率的に再学習し,再実行する手法を提案する。
CIFARデータセットで訓練されたDDPMの画像品質,CelebA-HQで訓練されたLCMの人口統計学的多様性,そして, (iii) 印象主義後のアートワークで修正された安定拡散モデルLoRAの審美的品質,の3つのユースケースで本手法の有用性を評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:46:45 GMT)
One-Shot Affordance Grounding of Deformable Objects in Egocentric Organizing Scenes [13.7] ロボット工学における変形可能なオブジェクト操作は、コンポーネント特性の不確かさ、多様な構成、視覚的干渉、曖昧なプロンプトなどによる重大な課題を呈している。
自己中心型組織シーンにおける変形性物体のワンショット強調グラウンド(OS-AGDO)の新たな手法を提案する。
実験結果から,本手法は最先端手法よりも有意に優れていることが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:34:56 GMT)
On the Feasibility of Fingerprinting Collaborative Robot Traffic [13.7] 本研究では,ロボットの協調作業におけるプライバシーリスクについて検討し,暗号化されたロボット通信における交通分析の可能性に着目した。
本稿では,信号処理技術を用いた交通分類手法を提案する。
本研究は,ロボットのプライバシとセキュリティにおける実用的防御の継続的な開発の必要性を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:03:06 GMT)
Combining Monte Carlo Tree Search and Heuristic Search for Weighted Vertex Coloring [13.5] 本研究は,モンテカルロ木探索法(MCTS)と重み付き頂点色問題(Weighted Vertex Coloring Problem)の解法について検討する。
基本MCTSアルゴリズムに加えて,従来のランダムシミュレーションを他のシミュレーション手法に置き換えたいくつかの変種について検討する。
我々は、これらの組み合わせMCTSの変種を評価するために、よく知られたベンチマークインスタンスの実験を行う。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:26:20 GMT)
DDEQs: Distributional Deep Equilibrium Models through Wasserstein Gradient Flows [13.4] ディープ平衡モデル(Deep Equilibrium Models、DEQ)は、ニューラルネットワークの前方通過における固定点を解決する暗黙のニューラルネットワークのクラスである。
本稿では,DDEQを集合や点雲などの離散的な測度入力に拡張する分散Deep Equilibrium Models(DDEQ)を提案する。
実験では、ポイントクラウド分類やポイントクラウド補完といったタスクにおいて、最先端のモデルと競合できることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:48:14 GMT)
OptMetaOpenFOAM: Large Language Model Driven Chain of Thought for Sensitivity Analysis and Parameter Optimization based on CFD [13.3] 外部分析および最適化ツールライブラリでMetaOpenFOAMをブリッジするフレームワークであるOptMetaOpenFOAMを紹介します。
自然言語入力による複雑なCFDタスクの自動化により、このフレームワークは、専門家でないユーザに感度分析とパラメータ最適化を行う権限を与える。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:55:43 GMT)
Test Script Intention Generation for Mobile Application via GUI Image and Code Understanding [13.0] テストスクリプトは、ソースコードのテストケースよりも、モバイルアプリのテストにおいて重要な役割を果たす。
TestIntentionはGUIテストスクリプトの意図を推測する新しいアプローチである。
すべての操作の結果が組み合わされ、テストスクリプトのテスト意図が生成される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:37:56 GMT)
Online Reinforcement Learning in Non-Stationary Context-Driven Environments [13.0] 非定常環境におけるオンライン強化学習(RL)について検討する。
オンラインRLは「破滅的忘れ」 (CF) によってこのような環境において困難である
我々は,従来の経験に則った政策出力を固定することでCFと戦うオンラインRLアプローチであるローカル制約政策最適化(LCPO)を提示する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:48:34 GMT)
Discrete GCBF Proximal Policy Optimization for Multi-agent Safe Optimal Control [12.9] 本稿では,周辺環境の変化や入力制約を処理する離散グラフCBFと,マルチエージェントシステムを対象とした分散型高性能安全ポリシーの両方を学習するフレームワークを提案する。
3つのシミュレーションエンジンにまたがるマルチエージェントタスクのスイート上で,我々の主張を実証的に検証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:42:45 GMT)
Code-as-Symbolic-Planner: Foundation Model-Based Robot Planning via Symbolic Code Generation [12.9] 大きな言語モデル(LLM)は、サブゴールとアクションプランでテキストベースの推論チェーンを生成することができる。
LLMは最適化と制約検証のためのシンボリックプランナーとしてコードを生成することもできる。
Code-as-Symbolic-Plannerは、離散的および連続的な環境、2D/3Dシミュレーション、現実世界の設定において、強い効果と一般化性を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:13:41 GMT)
Accelerating Multi-Task Temporal Difference Learning under Low-Rank Representation [12.7] 低ランク表現環境下でのマルチタスク強化学習(RL)における政策評価問題について検討する。
そこで我々は,TD学習の更新に,いわゆるtruncatedの特異値分解ステップを統合する,新しいTD学習法を提案する。
実験の結果,提案手法は古典的なTD学習よりも優れており,性能差は$r$が減少するにつれて増大することがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:07:45 GMT)
AdvLogo: Adversarial Patch Attack against Object Detectors based on Diffusion Models [12.7] セマンティックの観点からパッチアタックの新たな枠組みを提案し,これをAdvLogoと呼ぶ。
拡散復調過程のセマンティックな理解を活用し,最終段階において潜伏および非条件埋め込みを摂動させることにより,逆境の準領域へとプロセスを進める。
実験により、AdvLogoは高い視覚的品質を維持しながら強力な攻撃性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:32:29 GMT)
ReFocus: Reinforcing Mid-Frequency and Key-Frequency Modeling for Multivariate Time Series Forecasting [12.6] この研究は、畳み込みと残留学習に基づく新しい適応中周波数エネルギーを導入し、中周波数帯域の重要性を強調した。
各チャネルに他のチャネルからのスペクトル情報をランダムに導入するキー周波数モデリングをさらに強化するために、新しいキー周波数拡張訓練戦略が採用されている。
提案手法は,従来のSOTA iTransformerと比較してMSEを4%, 6%, 5%削減し, トラヒック, ECL, ソーラーベンチマークの多変量時系列予測を推し進めた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:58:48 GMT)
How simple can you go? An off-the-shelf transformer approach to molecular dynamics [12.4] 近年の研究では、分子動力学モデルでよく見られるアーキテクチャの特徴の必要性が疑問視されている。
We present a recipe for MD using a Edge Transformer, a off-the-shelf''''s transformer architecture。
少数のステップを微調整した後、いくつかのベンチマークで最先端の結果を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:34:27 GMT)
Diversity Covariance-Aware Prompt Learning for Vision-Language Models [12.4] 本稿では、データから分布情報を学習し、プロンプトモデルの少数ショット能力を向上する多様性共分散認識フレームワークを提案する。
視覚的特徴間の共分散関係をモデル化し,2つのモーダル間の類似度を測定するために,最適コサイン距離の代わりに異方性マハラノビス距離を用いる共分散認識手法を提案する。
そこで本研究では,多種多様なソフトプロンプトを学習し,カテゴリの異なる属性を抽出し,視覚的モダリティと独立にアライメントする多様性認識手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:40:43 GMT)
MAB-Based Channel Scheduling for Asynchronous Federated Learning in Non-Stationary Environments [12.4] フェデレートラーニングは、データ交換のない集中的な調整の下で、クライアント間での分散モデルトレーニングを可能にする。
無線実装では、サーバとクライアント間の頻繁なパラメータ更新は、大きな通信オーバーヘッドを生み出す。
本研究では,非定常チャネル環境を対象とした非同期なフェデレート学習スケジューリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:05:04 GMT)
Learning Exposure Mapping Functions for Inferring Heterogeneous Peer Effects [12.4] 因果推論において、干渉とは、ネットワーク内のピアのアクションが個人の結果に影響を与える現象を指す。
EgoNetGNNは、適切な露光マッピング機能を自動的に学習するグラフニューラルネットワーク(GNN)ベースの手法である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:37:05 GMT)
Auxiliary MCMC and particle Gibbs samplers for parallelisable inference in latent dynamical systems [12.1] 粒子ギブスはこのタスクの金の標準と考えられているが、遅延空間次元が増加するにつれて急速に性能が低下する。
これらの制約に対処する新しい補助サンプリング手法を提案する。
我々は,高次元ラテント空間における性能を維持するために,効率的な正確なカルマン型サンプリング器と改良されたパーティクルギブズアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:41:45 GMT)
Learning Stochastic Dynamical Systems with Structured Noise [12.1] 大規模データセットが利用できるため、ノイズを伴う観測から学習モデルを学ぶことへの関心が高まっている。
ノイズが特異なSDE系のドリフト項と拡散項の両方を学習するための非パラメトリックフレームワークを提案する。
提案手法の有効性を実証するために,軌道データを用いた推定器を構築するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:40:53 GMT)
Projecting Assumptions: The Duality Between Sparse Autoencoders and Concept Geometry [12.0] 両レベル最適化問題に対する解決策として,SAEを再放送する統合フレームワークを導入する。
これらの特性が無視された場合、SAEは概念の回復に失敗することを示す。
我々の発見は、普遍的なSAEの概念に挑戦し、モデル解釈可能性におけるアーキテクチャ固有の選択の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:47:40 GMT)
Offload Rethinking by Cloud Assistance for Efficient Environmental Sound Recognition on LPWANs [11.9] 生物研究や都市規模センシングシステムにおける超低消費電力環境モニタリングの重要手法として,学習型環境音声認識が登場している。
オンデバイス音声認識における最近の取り組みは,資源制約による精度の低下に悩まされているが,クラウドオフロード戦略は通信コストの増大によって妨げられている。
低消費電力広帯域ネットワーク(LPWAN)上で動作している電池レスデバイス上での,資源効率の高いクラウド支援環境音声認識システムORCAを紹介する。
以上の結果から,ORCAは省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エネ・省エ
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:05:56 GMT)
Statistical Tractability of Off-policy Evaluation of History-dependent Policies in POMDPs [11.8] 大規模な観測空間を有する部分観測可能決定プロセス(POMDP)における外部政治評価(OPE)について検討する。
我々は,歴史に依存したポリシーのモデルフリーなOPEに対して,いくつかの設定で情報理論の難しさを証明した。
自然モデルに基づくマルコフアルゴリズムにより、いくつかの硬さを回避できることが示される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:29:05 GMT)
AI-Face: A Million-Scale Demographically Annotated AI-Generated Face Dataset and Fairness Benchmark [11.8] AI-Faceデータセットは、人口統計学的にアノテートされた最初のAI生成顔画像データセットである。
このデータセットに基づいて、さまざまなAI顔検出装置を評価するために、最初の総合的公正度ベンチマークを行う。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:38:01 GMT)
HoH: A Dynamic Benchmark for Evaluating the Impact of Outdated Information on Retrieval-Augmented Generation [11.8] このベンチマークは、古くなった情報がRetrieval-Augmented Generation (RAG)に与える影響を評価するために設計された最初のベンチマークである。
時代遅れの情報はRAGの性能を2つの重要な方法で著しく低下させることを示す。
これらの知見は、RAGの時間的課題に対処する革新的ソリューションの緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:54:05 GMT)
Untold Stories: Unveiling the Scarce Contributions of UX Professionals to Usability Issue Discussions of Open Source Software Projects [11.8] 本研究はUX専門家のユーザビリティ問題への取り組みとフォローアップに対するアプローチを明らかにする。
他のコントリビュータと比較して、UX専門家は幅広いユーザビリティの問題に対処し、彼らのスタンスを支持し、感情よりも現実的だった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:50:15 GMT)
Error Bounds for Physics-Informed Neural Networks in Fokker-Planck PDEs [11.7] 物理インフォームドニューラルネットワーク(PINN)は,確率密度関数を近似するために訓練可能であることを示す (PDF)。
我々の主な貢献はPINN近似誤差の解析である。
標準的なトレーニング手法で効率的に構築できる実用的なエラー境界を導出する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:16:00 GMT)
Improving Plasticity in Non-stationary Reinforcement Learning with Evidential Proximal Policy Optimization [11.6] 以前の研究はそれを示している。
ネットワークは維持に苦労しています
環境が変化するにつれて つながりが変化します
時間が経つにつれ
本研究は、強化学習の応用において、この明らかな学習の第一の要因を提示する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:23:07 GMT)
MUSt3R: Multi-view Network for Stereo 3D Reconstruction [11.6] 本稿では,DUSt3Rのペアから複数のビューへの拡張を提案する。
計算複雑性を低減できる多層メモリ機構でモデルを拡張します。
このフレームワークは、オフラインとオンラインの両方で3D再構成を実行するように設計されているため、SfMとビジュアルSLAMシナリオにシームレスに適用できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:36:07 GMT)
Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff [11.6] Fuzzy Speculative Decoding (FSD)は、投機的復号(SD)を一般化する復号アルゴリズムである。
本手法は,ベンチマーク精度を2%程度低下させるだけで,SDよりも高速に5トークン/秒以上の大幅なランタイム改善を実現することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:40:12 GMT)
Quality Measures for Dynamic Graph Generative Models [11.5] 動的グラフの生成モデルの評価は,出力の可視化が難しいため困難である。
動的グラフデータにランダムなプロジェクションを直接適用したtextitJohnson-Lindenstrauss lemma に基づく新しい計量法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:36:29 GMT)
EPEE: Towards Efficient and Effective Foundation Models in Biomedicine [11.5] 基礎モデルの推論効率を向上させるためにEPEE(Entropy- and Patience-based Early Exiting)を提案する。
我々は,3つの中核的バイオメディカルタスクの分類,関係抽出,イベント抽出を基礎とした4つの基礎モデルの実験を行った。
その結果,EPEEは推測時間を大幅に短縮し,精度を維持・改善した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:11:13 GMT)
Enhancing Multi-hop Reasoning in Vision-Language Models via Self-Distillation with Multi-Prompt Ensembling [11.5] マルチモーダルな大規模言語モデルは、ゼロまたは少数ショットの学習のためにチェーン・オブ・シークレット・プロンプトを利用することができる。
同様のプロンプト戦略は、モダリティギャップとタスクの複雑さのため、マルチモーダル LLM では効果が低い。
注釈付きデータなしでモデルを改善できる自己蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:24:42 GMT)
Exploring Adversarial Robustness in Classification tasks using DNA Language Models [11.3] DNA言語モデルは、本質的にシークエンシングエラー、突然変異、実験室が引き起こしたノイズを含むDNA配列で動作する。
この問題の重要性にもかかわらず、DNA言語モデルの堅牢性はほとんど未解明のままである。
本研究は、DNA言語モデルの限界を強調し、バイオインフォマティクスにおける堅牢性の必要性を強調する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:38:52 GMT)
An Efficient Continual Learning Framework for Multivariate Time Series Prediction Tasks with Application to Vehicle State Estimation [11.2] 本稿では,連続学習を時系列タスクで処理するEM-ReSeleCTを提案する。
提案手法は,古・歴史的データから代表的なサブセットを戦略的に選択する。
また,車両状態推定に特化して設計されたシーケンス・ツー・シーケンス・トランスフォーマモデル(自己回帰モデル)を開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:42:06 GMT)
FGS-SLAM: Fourier-based Gaussian Splatting for Real-time SLAM with Sparse and Dense Map Fusion [11.2] 3Dガウススプラッティングは、リアルタイムの位置決めと高忠実度マップの構築を可能にすることによって、高度に局所化とマッピング(SLAM)技術を備えている。
本稿では,フーリエ周波数領域解析に基づく適応型密度化手法を提案する。
これは、周波数領域解析を利用して、高品質なガウス写像をリアルタイムに実現した最初のSLAMシステムである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:33:39 GMT)
Smaller Large Language Models Can Do Moral Self-Correction [11.1] 自己補正は、大規模言語モデル(LLM)の最も驚くべき新興能力の1つです。
道徳的自己補正(Moral self-correction)は、非倫理的世代を勾配更新を必要とせずに修正するポストホックアプローチである。
以前の研究では、LLMは自己退行を可能としており、22B未満のパラメータを持つ小さなモデルでは道徳的な自己訂正ができないことが報告されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:45:32 GMT)
Architectural and Inferential Inductive Biases For Exchangeable Sequence Modeling [11.0] 自己回帰モデルは交換可能なシーケンスをモデリングするための強力なフレームワークとして登場した。
本稿では、交換可能なシーケンスモデリングに最も有効である推論的およびアーキテクチャ的帰納的バイアスについて検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:25:44 GMT)
ChemToolAgent: The Impact of Tools on Language Agents for Chemistry Problem Solving [11.0] 我々は,ChemCrow上で強化化学剤を開発し,その性能を専門的な化学タスクと一般化学質問の両方で包括的に評価する。
驚いたことに、ChemToolAgentはツールを使わずにLLMを一貫して上回っているわけではない。
合成予測のような特殊な化学タスクでは、特殊ツールでエージェントを増強する必要があるが、試験のような一般的な化学問題では、エージェントの化学知識を正しく推論する能力がより重要である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:09:54 GMT)
MoCFL: Mobile Cluster Federated Learning Framework for Highly Dynamic Network [11.0] 非常にダイナミックなモバイルクラスタにおけるクライアントノードの頻繁な変動は、機能空間の分散とデータドリフトに大きな変化をもたらす可能性がある。
これらの問題に対処するために,モバイルクラスタ統合学習フレームワーク (MoCFL) を提案する。
MoCFLは、異なるクライアントからの局所的特徴抽出器間の類似性を定量化する親和性行列を導入することにより、特徴集約を強化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:59:47 GMT)
Meissner-Like Currents of Photons in Anomalous Superradiant Phases [10.9] 我々は,高度に調整可能な光物質相互作用系における光子のマイスナー様電流について述べる。
我々の光子のマイスナー様電流の実現は、光と物質を結合するプラットフォームにおけるエッジ状態干渉法と量子ホール効果を探求するための道を開く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:33:56 GMT)
FLEXtime: Filterbank learning to explain time series [10.7] 時系列からの予測を説明する最先端の手法では、各ステップごとにインスタンスワイズ・サリエンシ・マスクを学習する。
そこで本研究では,時系列の説明可能性について,解釈可能な部分のサリエンシマップとして考察する。
具体的には、バンドパスフィルタのバンクを用いて時系列を周波数帯域に分割するFLEXtimeと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:00:24 GMT)
Wavelet-Enhanced Desnowing: A Novel Single Image Restoration Approach for Traffic Surveillance under Adverse Weather Conditions [10.6] 本稿では,デュアルトレー複合ウェーブレット変換機能拡張モジュールと動的畳み込み加速度モジュールを用いたウェーブレット強化除雪法を提案する。
提案手法は, 積雪地域から情報を抽出し, 解析し, 除雪性能を著しく向上させる。
そして、残学習回復モジュールは画像のベール効果を除去し、明瞭さと詳細性を高めます。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:23:46 GMT)
Streaming Piano Transcription Based on Consistent Onset and Offset Decoding with Sustain Pedal Detection [10.6] 本稿では,音楽信号から音符のオンセットおよびオフセットイベントのシーケンスへと逐次変換することを目的とした,ストリーミング音声からMIDIへのピアノの書き起こし手法について述べる。
MAESTROデータセットを用いて実験したところ、提案したストリーミング手法は最先端のオフライン方式と同等かそれ以上に動作していた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:55:54 GMT)
"Nuclear Deployed!": Analyzing Catastrophic Risks in Decision-making of Autonomous LLM Agents [10.6] 大規模言語モデル(LLM)は、自律的な意思決定者へと進化し、ハイステークシナリオにおける破滅的なリスクに対する懸念を高めている。
このようなリスクは,エージェントのHelpful,Harmlessness,Hoest(HHH)目標間のトレードオフから生じる可能性があるという知見に基づいて,新しい3段階評価フレームワークを構築した。
14,400個のエージェントシミュレーションを12個の先進LDMで行い、広範囲な実験と分析を行った。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:45:24 GMT)
Dynamic Tuning of Single-Photon Emission in Monolayer WSe2 via Localized Strain Engineering [10.5] 次世代集積型単一光子エミッタ(SPE)の候補として2次元(2D)材料が出現している
本稿では,WSe2単層膜における個々のSPEの正確な発光エネルギーチューニングについて述べる。
2D SPEのチューニング性は、量子技術のための2D材料とオンチップの統合フォトニクスへの確かな一歩を表している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:23:08 GMT)
PA-CLIP: Enhancing Zero-Shot Anomaly Detection through Pseudo-Anomaly Awareness [10.4] 本稿では,背景雑音を低減し,擬似異常に基づくフレームワークによる欠陥検出を向上するゼロショット異常検出手法であるPA-CLIPを紹介する。
提案手法は,グローバルおよびローカルの詳細な情報を収集するためのマルチスケール特徴集約戦略を統合する。
既存のゼロショット法よりも優れており、工業的欠陥検出のための堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:29:27 GMT)
SRAG: Structured Retrieval-Augmented Generation for Multi-Entity Question Answering over Wikipedia Graph [10.3] MEQA(Multi-entity Question answering)は、大規模言語モデルにおいて重要な課題である。
本稿では、抽出されたエンティティをリレーショナルテーブルに整理する構造化RAGフレームワークを提案する。
ウィキペディアベースのマルチエンタリティQAタスクの実験では、SRAGが最先端の長文LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:37:33 GMT)
Pragmatic Inference Chain (PIC) Improving LLMs' Reasoning of Authentic Implicit Toxic Language [10.3] PIC(Pragmatic Inference Chain)は,認知科学と言語学の学際的知見に基づく新たなプロンプト手法である。
GPT-4o、Llama-3.1-70B-Instruct、DeepSeek-v2.5の成功率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:51:05 GMT)
SwiLTra-Bench: The Swiss Legal Translation Benchmark [10.3] SwiLTra-Benchは180Kを超えるスイスの法翻訳ペアの総合ベンチマークである。
体系的な評価により、フロンティアモデルは全ての文書タイプで優れた翻訳性能が得られることが示された。
SwiLTra-Judgeは、人間の専門家による評価に最適な特殊なLCM評価システムである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:10:30 GMT)
Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey [10.2] 本稿では,Large Language Models (LLMs) の可能性に着目し,オンライン議論の質を評価する手法について調査する。
本研究は,自然言語処理(NLP)と社会科学からアイデアを合成し,(a)議論品質評価に関する新たな分類学,(b)介入・ファシリテーション戦略の概要,および会話促進データセットに関する新たな分類学を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:26:01 GMT)
Structural-Entropy-Based Sample Selection for Efficient and Effective Learning [10.0] 本稿では,グローバルな情報とローカルな情報を統合し,情報と代表のサンプルを選択する手法を提案する。
SESは、重要バイアスの青いノイズサンプリングを適用し、多様なサンプルと代表的なサンプルのセットを選択する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:32:47 GMT)
Identifying Drift, Diffusion, and Causal Structure from Temporal Snapshots [10.0] APPEXは、時間境界のみから付加雑音SDEのドリフト、拡散、因果グラフを推定するために設計された反復アルゴリズムである。
APPEXはKulback-Leiblerの真の解への分岐を反復的に減少させ,線形付加雑音SDEのシミュレーションデータに対する効果を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:23:28 GMT)
SAGE: A Framework of Precise Retrieval for RAG [9.9] Retrieval-augmented Generation (RAG) は,質問応答タスクの遂行に有意義な能力を示した。
RAGメソッドはセマンティクスを考慮せずにコーパスをセグメントし、関連するコンテキストを見つけるのが困難になる。
これらの制限を克服するために、RAGフレームワーク(SAGE)を導入します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:25:58 GMT)
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition [9.9] 350以上のカメラで記録された20時間の野生チンパンジーの挙動を特徴とするPanAf-FGBGデータセットを提示する。
ユニークなのは、すべてのビデオとチンパンジー(前景ビデオ)を、同じカメラの場所から対応するバックグラウンドビデオ(チンパンジーなし)とをペアリングすることです。
この設定により、初めて、分布内および分布外条件を直接評価し、振る舞い認識モデルに対する背景の影響を定量化することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:32:20 GMT)
Convex Hull-based Algebraic Constraint for Visual Quadric SLAM [9.9] 対象表現として二次体を用いることは、画像空間と世界空間の間の一般閉形式射影の利点がある。
二重再構成については, 多数提案されているが, 多くは不正確であり, 局所化の最小限の改善が得られている。
物体のランドマークに対して,簡潔かつ高精度な凸船体に基づく制約を導入する。
公開データセットを用いた実験により,本手法がモノクロおよびRGB-D SLAMの両方に適用可能であることが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:30:07 GMT)
OceanSim: A GPU-Accelerated Underwater Robot Perception Simulation Framework [9.8] 高速GPU加速水中シミュレータであるOceanSimを提案する。
そこで本研究では,水中画像シミュレーションにおけるシミュレートと現実のギャップを低減するために,物理に基づく高度なレンダリング手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:32:09 GMT)
Doracamom: Joint 3D Detection and Occupancy Prediction with Multi-view 4D Radars and Cameras for Omnidirectional Perception [9.8] マルチビューカメラと4Dレーダを融合した最初のフレームワークであるDoracamomを提案する。
コードとモデルは公開されます。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:30:55 GMT)
Liger: Linearizing Large Language Models to Gated Recurrent Structures [9.7] 大規模言語モデル(LLM)の線形化は、事前訓練された標準モデルを線形再帰構造に変換する。
Ligerは、事前訓練されたLLMを余分なパラメータを加えることなくゲート線形リカレントモデルに変換する新しいアプローチである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:08:00 GMT)
Gradients can train reward models: An Empirical Risk Minimization Approach for Offline Inverse RL and Dynamic Discrete Choice Model [9.5] 機械学習において、動的選択(DDC)モデル(オフライン最大エントロピー正規化逆強化学習(オフラインMaxEnt-IRL))を推定する問題について検討する。
目的は、オフラインの振舞いデータからエージェントの振舞いを管理する$Q*$関数をリカバリすることである。
線形パラメータ化報酬の制限的仮定を使わずにこれらの問題を解くための大域収束勾配法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:42:24 GMT)
EchoONE: Segmenting Multiple echocardiography Planes in One Model [9.5] 医用画像には多面的セグメンテーションが要求される。
本稿では,SAMベースのセグメンテーションアーキテクチャを用いた新しいソリューションであるEchoONEを提案する。
心臓面が異なるマルチソースデータセットに対して、一貫して最先端のパフォーマンスを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:59:01 GMT)
Measuring the Validity of Clustering Validation Datasets [9.5] 内部検証尺度(IVM)は、クラスタラベルマッチング(CLM)を、同じデータセットの異なるラベルと比較することができるが、異なるデータセット間で行うように設計されていない。
我々は、データセット間でCLMを評価し比較するための高速で信頼性の高い手法として、Adjusted IVMを紹介した。
調整済みのIVMは、標準のIVMを含む競合より優れており、データセット内およびデータセット間のCLMを正確に評価している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:54:04 GMT)
A Novel Interactive-Guided Differential Testing Approach for FPGA Simulation Debugger Tools [9.4] 本稿では、VivadoのFPGAチップデバッガツールのバグを検出するために、DB-Hunterと呼ばれる対話型微分テスト手法を提案する。
DB-HunterはRTL設計変換コンポーネント、デバッグアクション変換コンポーネント、対話型差分テストコンポーネントの3つのコンポーネントで構成される。
3ヶ月でDB-Hunterは18の問題を報告し、Xilinx Supportのバグとして確認された10、前バージョンで6のバグが修正された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:38:20 GMT)
Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models [9.4] 大きな言語モデル(LLM)は、人間レベルの説得と競合する説得力を示す。
LLMの説得への感受性は、倫理的原則との整合性に関する懸念を提起する。
マルチエージェントインタラクションによる説得評価フレームワークPersuade Me If You Can (PMIYC)を紹介した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:53:21 GMT)
Monocular Depth Estimation and Segmentation for Transparent Object with Iterative Semantic and Geometric Fusion [9.4] 本稿では,透明物体のセグメンテーションと深さ推定の両面において,初めて優れたモノクラーフレームワークを提案する。
具体的には,タスク間のマルチスケール情報を効果的に統合する,新しい意味的および幾何学的融合モジュールを考案する。
2つの挑戦的な合成および実世界のデータセットの実験により、我々のモデルは最先端のモノクル、ステレオ、マルチビューメソッドを大きなマージンで超越していることが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:37:18 GMT)
Struc2mapGAN: improving synthetic cryo-EM density maps with generative adversarial networks [9.3] 分子構造から改良された実験的な密度マップを作成するための新しいデータ駆動手法を提案する。
我々は、ネストしたU-Netアーキテクチャをジェネレータとして使用し、L1損失項を追加し、学習効率を高めるために生のトレーニング実験マップをさらに処理する。
本手法は,実験対象の地図や評価指標において,既存のシミュレーション手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:24:09 GMT)
SparseMamba-PCL: Scribble-Supervised Medical Image Segmentation via SAM-Guided Progressive Collaborative Learning [9.2] 本稿では,学習中の情報品質を高めるためのプログレッシブ・コラボレーティブ・ラーニング・フレームワークを提案する。
我々は、新しいアルゴリズムにより、グラウンド・トゥルー・スクリブル・セグメンテーション・ラベルを豊かにし、オブジェクト境界を推定するためにスクリブルを伝播する。
我々は,Med-SAMとSparse Mambaネットワークの融合により,Med-SAM誘導学習を最適化し,特徴表現を強化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:09:04 GMT)
HiBug2: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging [9.2] HiBug2は、エラースライス発見とモデル修復のための自動化フレームワークである。
まずタスク固有の視覚属性を生成し、エラーを起こしやすいインスタンスをハイライトする。
次に、効率的なスライス列挙アルゴリズムを用いて、エラースライスを体系的に識別する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:07:59 GMT)
Same Question, Different Words: A Latent Adversarial Framework for Prompt Robustness [9.2] 本稿では,2ループ対向フレームワークであるLatent Adversarial Paraphrasing (LAP)を提案する。
LAPは学習可能な摂動を訓練して「ラテント連続パラフレーズ」として機能させる
複数のLLMアーキテクチャにおけるLAPの有効性を示す実験を行った。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:36:50 GMT)
Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control [9.1] イテレーティブ・リファインメント・プロセス(IRP)は産業品質管理のために設計された堅牢な異常検出手法である。
我々は,2つのベンチマークデータセットである Kolektor SDD2 と MVTec AD を用いて,IRP の有効性を検証する。
実験の結果,IRPは従来の異常検出モデルより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:04:03 GMT)
Meta Learning-Driven Iterative Refinement for Robust Anomaly Detection in Industrial Inspection [9.1] 本稿では,メタ学習アプローチの適応能力を活用して,ノイズの多い学習データを特定し,拒否し,学習プロセスを改善することを提案する。
本モデルでは, モデル非依存メタ学習(MAML)と, 適応性と堅牢性を高めるために, 異種間距離の拒絶方式による反復的洗練プロセスを採用する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:11:41 GMT)
ABFS: Natural Robustness Testing for LLM-based NLP Software [8.8] 自然言語処理(NLP)ソフトウェアにおけるLLM(Large Language Models)は、様々な領域で急速に普及している。
これらの応用は、入力中のわずかな摂動が誤った出力につながるような堅牢性欠陥をしばしば示している。
現在のロバストネス試験法は,(1) 試験効率の低下,(2) 試験ケースの自然性不足の2つの主な限界に直面している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:02:06 GMT)
Zero-shot Object-Centric Instruction Following: Integrating Foundation Models with Traditional Navigation [8.8] 大規模なシーンは、因子グラフ内のロボットのポーズと合わせて推定されるランドマークの3Dグラフで、堅牢かつ効率的にマッピングすることができる。
そこで本研究では,自然言語命令のゼロショット手法であるLanguage-Inferred Factor Graph for Instruction following (LIFGIF)を提案する。
ボストン・ダイナミクス・スポット・ロボットを用いた実世界におけるゼロショット物体中心指導におけるLIFGIFの有効性を実証した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:33:39 GMT)
IOHunter: Graph Foundation Model to Uncover Online Information Operations [8.5] 本稿では,情報操作を編成するユーザ,いわゆるIOドライバを,さまざまな影響キャンペーンを通じて識別する手法を提案する。
我々のフレームワークはIOHunterと呼ばれ、Language ModelsとGraph Neural Networksの強みを利用して、教師付き、ほとんど教師なし、クロスIOコンテキストにおける一般化を改善する。
本研究は,ソーシャルメディアプラットフォーム上でのIO検出に特化して,グラフファウンデーションモデルを開発するための一歩となる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:32:17 GMT)
De-identification is not enough: a comparison between de-identified and synthetic clinical notes [8.5] 本研究は, 実際の臨床記録の同定が, 会員推測攻撃から記録を保護していないことを示す。
合成されたノートが実際のデータのパフォーマンスと密接に一致する場合、それらは実際のデータと同じようなプライバシー上の懸念を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:05:13 GMT)
A Survey on Semantic Communications in Internet of Vehicles [8.3] インターネット・オブ・ビークルズ (Internet of Vehicles, IoV) は、インテリジェント交通システムの中核である。
従来の通信技術は、少ないスペクトル資源と高いレイテンシの問題に直面している。
意味コミュニケーションは、メッセージから有用な意味情報を抽出し、送信し、回収することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:21:48 GMT)
SVDC: Consistent Direct Time-of-Flight Video Depth Completion with Frequency Selective Fusion [8.2] 軽量直接飛行(dToF)センサーはモバイルデバイス上での3Dセンシングに最適である。
本稿では,疎度dToFデータを対応するRGBガイダンスと融合させることで,SVDCと呼ばれる新しい映像深度補完手法を提案する。
本手法では, スパースdToFイメージングによる空間的曖昧性を軽減するために, 多フレーム融合方式を用いる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:32:25 GMT)
Off-policy Evaluation with Deeply-abstracted States [8.2] オフポリシー評価(OPE)は、デプロイ前にターゲットポリシーの影響をオフラインに評価するために不可欠である。
大規模な状態空間において正確なOPEを実現することは依然として困難である。
本稿では、OPEの文脈における状態抽象化(もともとポリシー学習用に設計された)について研究する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:10:38 GMT)
CoPL: Collaborative Preference Learning for Personalizing LLMs [8.2] 本稿では, ユーザの反応関係をモデル化し, 嗜好推定を向上するグラフベースの協調フィルタリングフレームワークを提案する。
CoPLは大きな言語モデル(LLM)を効率よく微調整し、共有とユーザ固有の好みを動的にバランスさせる。
UltraFeedback-Pの実験では、CoPLは既存のパーソナライズされた報酬モデルよりも優れており、共通の好みと議論の的になっている好みの両方を効果的に捉えている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:32:02 GMT)
Randomly Sampled Language Reasoning Problems Reveal Limits of LLMs [8.1] 我々は,データセットリコールのリスクを回避しつつ,モデルの言語理解能力の測定を試みる。
決定論的有限オートマトン(DFA)により認識される言語タスクの多種族をパラメータ化する。
3 状態 DFA の驚くほど単純な設定であっても、LLM は言語認識と合成の両タスクにおいてパラメータ化されていない ngram モデルより劣ることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:16:13 GMT)
A Tight Regret Analysis of Non-Parametric Repeated Contextual Brokerage [8.0] 本稿では, 繰り返しブローカー問題の文脈バージョンについて検討する。
各インタラクションにおいて、アイテムのプライベートバリュエーションを持つ2人のトレーダーは、学習者の提案するブローカー価格に基づいて、いくつかのコンテキスト情報によって通知される購入または販売を求めます。
ブローカーの目標は、トレーダーの純益(トレーダーの評価額分布の完全な知識を持つ神託と比較して、後悔を最小限に抑えることでトレーダーの利益としても知られる)を最大化することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:42:55 GMT)
TEARS: Textual Representations for Scrutable Recommendations [8.0] TEARS(TExtuAl Representations for Scrutable Representations)について紹介する。
TEARSは、潜伏した埋め込みを通じてユーザの興味を表す代わりに、それらを自然なテキストでエンコードし、透明性を提供し、ユーザーが編集できるようにする。
TEARSは、ユーザ制御可能なレコメンデーションを提供しながら、一般的な3つのVAEモデルの性能を上回ることができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:07:27 GMT)
ReaderLM-v2: Small Language Model for HTML to Markdown and JSON [8.0] 本稿では、効率的なWebコンテンツ抽出のために設計された15億個のパラメータ言語モデルであるReaderLM-v2を提案する。
私たちのモデルは、ドキュメントを512Kまでの乱雑なHTMLを、高い精度でクリーンまたはマークダウンフォーマットに処理します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:57:04 GMT)
ACTIVA: Amortized Causal Effect Estimation without Graphs via Transformer-based Variational Autoencoder [8.0] 本稿では、ガウスの混合体として因果効果を予測するために因果変換器エンコーダを拡張した、ACTIVAと呼ばれる新しい条件付き変分オートエンコーダアーキテクチャを提案する。
本手法は因果グラフを必要とせず,観察データと問い合わせ介入のみを考慮に入れた介入分布を予測する。
多くのシミュレートされたインスタンスを償却することで、新しいデータセットへのゼロショットの一般化を、再トレーニングせずに実現できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:28:25 GMT)
On the Importance of Reward Design in Reinforcement Learning-based Dynamic Algorithm Configuration: A Case Study on OneMax with (1+($λ$,$λ$))-GA [7.9] 本稿では,RLエージェントによる環境探索の促進を目的とした報奨形成機構を提案する。
我々の研究は、$(lambda,lambda)$-GAを動的に設定する際のRLの機能を示しているが、RLエージェントのスケーラビリティにおける報酬形成の利点も確認している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:00:38 GMT)
Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction [7.9] 我々は,高次元連続行動空間における決定を学習する上での課題に対処する潜在マクロ行動プランナー(L-MAP)を提案する。
L-MAPは状態条件ベクトル量子変分オートエンコーダ(VQ-VAE)を通して時間的に拡張されたマクロアクションの集合を学習する
連続制御タスクを含むオフラインRL設定では、L-MAPは離散潜在アクションを効率よく探索し、高い期待値が得られる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:33:31 GMT)
Data Augmentation for NeRFs in the Low Data Limit [7.9] 後続の不確実性分布からのリジェクションサンプリングにより,トレーニング中に一組のビューを追加することを提案する。
本手法は,確立したシーン再構築ベンチマークにおいて,87.5%の変動率で39.9%向上した。
この作業は、事前の未知の環境において、情報的データによるデータセットの強化がリソース制約に不可欠なロボットタスクの基礎となる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:23:57 GMT)
Enhancing Vision-Language Compositional Understanding with Multimodal Synthetic Data [7.9] 視覚言語モデル(VLM)は、微妙なバリエーションを持つトレーニングサンプルへの露出が限られているため、構成的理解に苦慮している。
本稿では,画像特徴注入をテキストから画像への生成モデルに組み込んだSVD-GT(Subtle Variation Data Generation and Training)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:30:39 GMT)
Exploring the Performance-Reproducibility Trade-off in Quality-Diversity [7.9] 品質多様性(QD)アルゴリズムは多くの領域やアプリケーションで有望な結果を示している。
しかし、複雑な実世界のアプリケーションでQDが使用される場合、ソリューションの適合性と行動推定の不確実性は依然として大きな課題である。
そこで本稿では, トレードオフに対する最適解を求める新たな4つのQDアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:19:12 GMT)
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models [7.5] 大規模言語モデル(LLM)は、最近、様々なタスクで顕著な成功を収めた。
重みのみの量子化は有望なアプローチであるが、大振幅のアクティベーションアウトレイアのため、サブ-4ビットの量子化は依然として課題である。
本稿では,各入力チャネル内の量子化グループを生成する簡易かつ効果的な手法である,IC単位の量子化を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:37:01 GMT)
Performance Review on LLM for solving leetcode problems [7.4] 本稿では,Lietcodeのプログラミング問題に対するLLM(Large Language Models)の総合的な性能評価について述べる。
我々は, GPT-4 と GPT-3.5-turbo を含む複数の LLM の解を生成する。
コード生成や問題解決タスクにおける現在のLLMの長所と短所を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:24:08 GMT)
Optimal Differentially Private Sampling of Unbounded Gaussians [7.3] 我々は、$left(varepsilon, deltaright)$-differential privacyという制約の下で、境界のないガウス分布からサンプリングするための最初の$widetildemathcalOleft(dright)$-sampleアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:44:39 GMT)
Ground contact and reaction force sensing for linear policy control of quadruped robot [7.3] 強化学習で訓練された直線的方針は、四足歩行を可能にするために適切に機能することが示されている。
地上接触と反応力のデータは、生存可能性の向上、外乱に対する安定性の向上、訓練されていない条件への適応性の向上で政策を訓練する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:04:55 GMT)
Depth-Adaptive Graph Neural Networks via Learnable Bakry-'Emery Curvature [7.3] グラフニューラルネットワーク(GNN)は、グラフベースのタスクに対して強力な表現学習能力を示す。
GNNの最近の進歩は、曲率などの幾何学的性質を活用して表現能力を向上している。
本稿では,情報伝達における構造的側面とタスク駆動的側面の両方を捉えたBakry-'Emery曲率の統合を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:48:41 GMT)
\textsc{Perseus}: Tracing the Masterminds Behind Cryptocurrency Pump-and-Dump Schemes [7.3] マスターミンド(英: Mastermind)とは、暗号通貨のポンプとダンプの仕組みを組織し、調整し、調整する組織である。
これまでの研究では、市場におけるポンプ・アンド・ダンプ活動を検出し、ターゲット暗号通貨を予測し、投資家やアコスン・エンティティを調べていた。
我々は,アコスンおよび暗号通貨市場からリアルタイムにデータを収集する検出システムtextscPerseusを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:59:40 GMT)
Surgical Vision World Model [7.2] 動作制御可能な手術データを生成する最初の手術視覚世界モデルを提案する。
提案モデルでは, 動作制御可能な手術データを生成し, アーキテクチャ設計の検証を行う。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:55:52 GMT)
AVG-DICE: Stationary Distribution Correction by Regression [7.2] オフ政治政策評価(OPE)は、長い間、定常的な状態分布ミスマッチに悩まされてきた。
AVG-DICEは密度比を計算的にシンプルなモンテカルロ推定器である。
我々の実験では、AVG-DICEは最先端の推定器と同じくらい正確であり、時にはマグニチュードの改良を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:14:02 GMT)
CNsum:Automatic Summarization for Chinese News Text [7.2] 本稿ではトランスフォーマー構造に基づく中国語ニューステキスト要約モデル(CNsum)を提案する。
実験の結果, CNsumはベースラインモデルよりもROUGEスコアがよいことがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:07:28 GMT)
From Tokens to Words: On the Inner Lexicon of LLMs [7.1] 自然言語は単語で構成されているが、現代の大言語モデル(LLM)はサブワードを入力として処理する。
サブワード列をコヒーレントな全単語表現に結合する本質的なデトケン化過程にLLMが関与する証拠を提示する。
以上の結果から, LLMはトークン化のスコープを超えて, 潜在語彙を保っていることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:30:07 GMT)
Signature Kernel Conditional Independence Tests in Causal Discovery for Stochastic Processes [7.1] 条件付き独立性(CI)の制約を、選択した間隔で調整する。
我々は,完全かつ完全な因果探索アルゴリズムを提案し,完全な観測データと部分的な観測データの両方を扱えるようにした。
また、これらの制約をデータから推測するために、フレキシブルで一貫したカーネルベースのCIテストを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:25:26 GMT)
ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments [7.1] ADUGS-VINSを導入し,拡張SORTアルゴリズムと高速化可能な基礎モデルをVIOに統合する。
提案手法は,様々な場面を表現した複数の公開データセットを用いて評価し,多様な動的オブジェクトを含む実世界のシナリオで評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:18:14 GMT)
A safe exploration approach to constrained Markov decision processes [7.0] 無限水平制約マルコフ決定過程(CMDP)について考察する。
目標は、期待される累積的制約を満たしつつ、期待される累積的報酬を最大化する最適なポリシーを見つけることである。
安全クリティカルなシステムに対するオンライン学習におけるCMDPの適用により、モデルフリーでエフェミュレータフリーなアルゴリズムの開発に焦点をあてる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:57:16 GMT)
Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning [7.0] 分散ロバストなオフライン強化学習(RL)は、力学の不確実性をモデル化することによって環境摂動に対する堅牢な政策訓練を求める。
関数近似を実現するために,最小限の最適化と計算効率のアルゴリズムを提案する。
その結果、ロバストなオフラインRLの関数近似は、標準のオフラインRLと本質的に異なり、おそらくは難しいことが判明した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:05:10 GMT)
Interactive Gadolinium-Free MRI Synthesis: A Transformer with Localization Prompt Learning [6.7] 本研究では,非コントラストMR画像からCE-MRIを合成するトランスフォーマとローカライゼーション・プロンプツのフレームワークを提案する。
本アーキテクチャでは,マルチスケール機能を処理するために効率的なトランスフォーマーを使用する階層的バックボーン,空間的注意操作と相互注意機構を通じて相互補完情報を階層的に統合する多段階融合システム,という3つの重要なイノベーションを導入している。
このフレームワークは、放射線科医が推論中に診断プロンプトを入力し、人工知能と医療の専門知識を相乗化することによって、インタラクティブな臨床統合を可能にする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:44:28 GMT)
Optimal Protocols for Continual Learning via Statistical Physics and Control Theory [6.7] ニューラルネットワークは、複数のタスクを逐次学習する際に、破滅的な忘れに苦しむことが多い。
近年の理論的研究は、学習プロトコル下での合成フレームワークにおける学習曲線の分析によってこの問題に対処している。
このギャップを、統計物理技術を用いて導出したトレーニング力学の正確な方程式と最適制御法を組み合わせることで埋める。
我々の理論的分析は、破滅的な忘れを緩和するための非自明で解釈可能な戦略を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:04:56 GMT)
Mamba base PKD for efficient knowledge compression [6.6] 本稿では,プログレッシブ・ナレッジ蒸留(PKD)プロセスにマンバ・アーキテクチャを統合するための革新的なアプローチを提案する。
提案フレームワークは,マンバブロックを用いて設計した大規模教師モデルを,段階的に小さな学生モデルに蒸留する。
各学生モデルは、Mambaブロック内で選択状態空間モデル(S-SSM)を使用して訓練され、計算複雑性を減らしながら重要な入力面に焦点を当てる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:44:23 GMT)
TRACE: Temporal Grounding Video LLM via Causal Event Modeling [6.6] ビデオ時間グラウンド(VTG)は、ビデオ理解モデルにとって重要な機能であり、ビデオブラウジングや編集などの下流タスクにおいて重要な役割を果たす。
現在のビデオLLMは自然言語生成のみに依存しており、ビデオに固有の明確な構造をモデル化する能力がない。
本稿では、ビデオLLM出力をイベントのシーケンスとして表現し、過去のイベント、ビデオ入力、テキスト命令を用いて現在のイベントを予測する因果イベントモデリングフレームワークを提案する。
本稿では,TRACE と呼ばれるタスクインターリーブビデオ LLM を提案し,実際に因果イベントモデリングフレームワークを効果的に実装する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:28:30 GMT)
PipeOffload: Improving Scalability of Pipeline Parallelism with Memory Optimization [6.6] パイプライン並列 (PP) は大規模言語モデル (LLM) の訓練に広く用いられている。
PPは、飛行中のマイクロバッチの数がPPの程度に増加するにつれて、高活性化メモリ消費によって制約されることが多い。
我々は、PPの未探索メモリオフロード戦略を活用することで、この問題に対処することに注力する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:11:06 GMT)
LLMs as Educational Analysts: Transforming Multimodal Data Traces into Actionable Reading Assessment Reports [6.5] 本研究では,多モーダルデータを用いた意味的読解の導出について検討する。
我々は、異なる読取行動パターンを識別するために教師なし学習技術を用いる。
大規模言語モデル(LLM)は、派生した情報を教育者のための実行可能なレポートに合成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:34:08 GMT)
Convergence of a model-free entropy-regularized inverse reinforcement learning algorithm [6.5] 逆強化学習(IRL)は、専門家が最適である報酬を回復することを目的としている。
本研究では,エントロピー規則化IRL問題を解くためのモデルフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:01:44 GMT)
DeepSuM: Deep Sufficient Modality Learning Framework [6.5] 本稿では,各モダリティの表現を独立に学習するモダリティ選択のための新しいフレームワークを提案する。
本フレームワークは,モダリティ統合と選択を最適化することにより,マルチモーダル学習の効率性と有効性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:48:59 GMT)
Robust Simulation-Based Inference under Missing Data via Neural Processes [6.3] 我々は,SBIにおける欠落データの問題を定式化し,本手法がSBI後部推定にバイアスをもたらすことを示す。
また,神経後部推定フレームワークにおいて,計算モデルと推論ネットワークを共同で学習することにより,この問題に対処する新しい補正手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:22:01 GMT)
Advancing Spatio-Temporal Processing in Spiking Neural Networks through Adaptation [6.2] ニューロモルフィックハードウェア上のニューラルネットワークは、非喫煙者よりも消費電力の少ないオーダーを約束する。
このようなシステム上でのスパイクベースの計算のための標準的なニューロンモデルは、長い間、統合と火災(LIF)ニューロンであった。
いわゆるアダプティブLIFニューロンの根源はよく分かっていない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:42:10 GMT)
An Efficient Learning Method to Connect Observables [6.2] 本稿では,新しいモデルであるマルチパラメータ固有値問題(MEP)エミュレータを提案する。
新しい方法はエミュレータを接続し、可観測物から可観測物に直接予測を行う。
一次元格子上の簡単なシミュレーションによりMEPエミュレータの性能が確認できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:58:15 GMT)
Private Means and the Curious Incident of the Free Lunch [6.1] DP実装の最もよく知られた基本的ビルディングブロックは、同一のプライバシー保証のために大幅にノイズを減らしてリリース可能であることを示す。
これを実現するために、最低ケース感度$R$の個々のデータを、すべてのデータが一定のノルム$R$を持つプレフィックスに投影する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:09:05 GMT)
Lossy Neural Compression for Geospatial Analytics: A Review [6.1] 地理空間データに適用したニューラル圧縮(NC)の展開を概観する。
自然画像と対比して,EOデータとESMデータの特徴について考察する。
本稿では,機械間通信における圧縮特徴表現の転送の可能性について詳述する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:19:43 GMT)
SAKE: Steering Activations for Knowledge Editing [6.1] 本研究では,1つのプロンプトではなく1つのプロンプトとして編集すべき事実をモデル化するステアリングアクティベーション手法であるSAKEを提案する。
いくつかの数値実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:20:29 GMT)
OFF-CLIP: Improving Normal Detection Confidence in Radiology CLIP with Simple Off-Diagonal Term Auto-Adjustment [6.1] 正規検出を改良する対照的な学習改善であるOF-CLIPを提案する。
OFF-CLIPは、アーキテクチャの変更を必要とせずに、放射線学のCLIPモデルに適用することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:24:11 GMT)
HORAE: A Domain-Agnostic Modeling Language for Automating Multimodal Service Regulation [6.1] 本稿では、マルチモーダル規制ルールをモデル化するための統一仕様言語であるHORAEの設計原則について述べる。
HORAEは、HORAEという名前の細調整された大規模言語モデルをさらに活用することで、インテリジェントなサービス規制パイプラインを促進する方法を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:05:30 GMT)
Morpheus: Text-Driven 3D Gaussian Splat Shape and Color Stylization [6.1] スティル化された世界は、限られたトレーニングデータとモデルのトレーニング分布を拡張する必要性のある下流タスクに使用できる。
現在のノベルビュー合成のスタイラス化技術のほとんどは、幾何を説得的に変える能力に欠けていた。
これは、任意の幾何学的変化はスタイルの強さを増す必要があり、しばしばスタイリングの安定性と一貫性のためにキャップされるためである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:33:22 GMT)
AI-Driven Relocation Tracking in Dynamic Kitchen Environments [6.0] 本研究では,キッチンからロボットをナビゲートし,物体を認識し,移動を追跡するインテリジェントアルゴリズムの開発に焦点をあてる。
キッチンは、物体が頻繁に移動し、並べ替えられ、交換されるため、ダイナミックな性質のため、試験場として選ばれた。
位置に基づいて各オブジェクトのスコアを計算し,すべてのフレームに特徴を導入するフレームスコーリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:53:46 GMT)
The Unreasonable Ineffectiveness of the Deeper Layers [6.0] 一般的な質問応答ベンチマークでは, あるレイヤを削除してもモデル性能には影響しないことがわかった。
驚くべきことに、この方法では、少数の層が取り除かれるまで、パフォーマンスの最小限の劣化が見られます。
科学的見地からすると、これらのLCMの堅牢性からレイヤの削除は、現在の事前学習手法がネットワークの深い層におけるパラメータを適切に活用していない、あるいは浅い層が知識を保存する上で重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:02:05 GMT)
Learning Actionable World Models for Industrial Process Control [5.9] 効果的なAIシステムは、非常に限られたトレーニングデータから複雑なシステムの振る舞いについて学ぶ必要がある。
本稿では,学習した潜在表現においてプロセスパラメータをアンタングル化して,きめ細かい制御を可能にする手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:05:44 GMT)
An energy-efficient learning solution for the Agile Earth Observation Satellite Scheduling Problem [5.9] Agile Earth Observation Satellite Scheduling Problem (AEOSSP) は、衛星の軌道に沿って計画される観測対象のサブセットを見つけることである。
本稿では,AEOSSPの時間依存的利益に対処するためのDep Reinforcement Learning (DRL)アプローチを提案する。
その結果,提案アルゴリズムは品質要件を満たすことができない画像のキャプチャを60%以上削減し,その結果,姿勢操作によるエネルギー浪費を最大78%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:01:27 GMT)
Matérn Kernels for Tunable Implicit Surface Reconstruction [5.9] マタン核はいくつかの魅力的な性質を持ち、表面再構成に特に適している。
Mat'ern カーネルは、可変な特徴写像と同じように、可変な曲面再構成を可能にすることを示す。
我々は、特にLaplaceカーネルは競争力が高く、ノイズフリーの場合の最先端の手法とほぼ同等の性能を発揮すると結論付けた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:48:45 GMT)
Geometry-Aware Approaches for Balancing Performance and Theoretical Guarantees in Linear Bandits [5.8] トンプソンサンプリングとグリーディは有望な経験的性能を示したが、これは悲観的な理論的後悔の境界とは対照的である。
本稿では,問題パラメータの周辺における不確かさ楕円体の幾何学的特性を追従する新しいデータ駆動手法を提案する。
この手法により,Greedy,OFUL,Thompsonサンプルを含む幅広いアルゴリズムに対して,幾何学的情報を含むデータ駆動型頻繁な後悔境界を定式化することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:05:48 GMT)
Spatial Transcriptomics Analysis of Spatially Dense Gene Expression Prediction [5.8] PixNetは、様々な大きさのスポットにまたがって空間的に解決された遺伝子発現を予測し、病理画像から直接スケールできる密集した予測ネットワークである。
我々は、病理画像から高密度な連続遺伝子発現マップを生成し、興味のある場所内の値を集約し、遺伝子発現を予測する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:38:01 GMT)
Spontaneous Giving and Calculated Greed in Language Models [5.8] 推論モデルにより、個人の合理性を優先し、協調と規範の強制を著しく減らすことが判明した。
我々の結果は、AIが人間の協力的な直感を乱すのではなく、確実にサポートするために、社会的知性と推論能力を組み合わせたAIアーキテクチャの必要性を示唆している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:31:48 GMT)
Which Code Statements Implement Privacy Behaviors in Android Applications? [5.7] ソフトウェアにおけるプライバシ行動(英: "privacy behavior")とは、ソフトウェアがサービスや機能のために個人情報を使用する行為である。
本研究では,3つの大規模言語モデルにデータを加え,プライバシー関連文を自動的に検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:20:01 GMT)
GRAIN: Exact Graph Reconstruction from Gradients [5.7] フェデレーション学習は、データプライバシを持つ複数のクライアント間で協調的なモデルトレーニングを可能にすると主張している。
最近の研究によると、クライアントのプライバシーは、いわゆるグラデーション・インバージョン・アタックによってまだ危険にさらされている。
本稿では,グラフデータに対する最初の厳密な勾配反転攻撃であるGRAINについて述べる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:58:12 GMT)
Analyzing mixed construction and demolition waste in material recovery facilities: evolution, challenges, and applications of computer vision and deep learning [5.7] 本稿では,データセット,センサの進展とオブジェクト検出からリアルタイムセグメンテーションモデルへの進化について検討する。
この分析は、多種多様な高忠実なデータセット、高度なセンサー技術、堅牢なアルゴリズムフレームワークに対する重要な要件を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:48:28 GMT)
Modality-Agnostic Style Transfer for Holistic Feature Imputation [5.6] 本稿では,既存の計測手法を用いて,特定の被験者に対する観測不能なイメージング尺度を生成する枠組みを提案する。
本フレームワークはAD特化コンテンツを保存しながらモダリティ特化スタイルを転送する。
これは、モダリティに依存しないがAD固有の情報を保存するドメイン・ディバイサル・トレーニングによって行われ、生成的ディバイサル・ネットワークは区別できないモダリティ固有のスタイルを付加する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:09:24 GMT)
The Emergence of Grammar through Reinforcement Learning [5.6] 構文的・意味的構成の文法体系の進化は、強化学習理論の新たな応用によってモデル化される。
私たちは、与えられたコンテキストで表現できる異なるメッセージに対する確率分布をモデル内に含んでいます。
提案された学習と生産のアルゴリズムは、言語学習を、メッセージの確率から得られる各ステップの利点など、一連の単純なステップに分解する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:10:46 GMT)
Enabling the AI Revolution in Healthcare [5.6] 医療におけるAIの可能性は、複数のシステムにまたがるサイロ化された患者データによって制限される。
連邦政府のイニシアチブは、データ共有のための健康データリポジトリに重要なインフラを提供するために必要である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:17:22 GMT)
Learning Covariance-Based Multi-Scale Representation of Neuroimaging Measures for Alzheimer Classification [5.4] モデルサイズが合理的に増大した効率的な高次元空間を導出できる枠組みを提案する。
Alzheimer's Disease Neuroimaging Initiative (ADNI) による神経画像計測実験により、我々のモデルはより良い性能を示した。
トレーニングされたモデルは、マルチスケール変換上の勾配情報を用いて解釈可能とし、パーソナライズされたAD特異的領域を脳内に記述する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:55:35 GMT)
SHADE-AD: An LLM-Based Framework for Synthesizing Activity Data of Alzheimer's Patients [5.4] 本稿では、アルツハイマー病(AD)の特徴を組み込んだ人間の活動データセットを合成するフレームワークであるSHADE-ADを提案する。
我々は,HAR(Human Activity Recognition)検出などの下流タスクにおいて,79.69%まで向上したことを示す。
これらの結果は、AD監視のための費用効率の良いプライバシ保護ソリューションを提供することで、SHADE-ADがスマートヘルスアプリケーションを前進させる可能性を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:48:18 GMT)
A comprehensive review on developments of synthetic dimensions [5.4] 合成次元の概念はフォトニクスと原子物理学の強力な枠組みとして生まれた。
合成次元の構築や,このような枠組みの利点によって実現された重要な物理現象の強調に使用される様々なアプローチを紹介した。
この分野での開発について統一的な視点を提供することにより、合成次元が基礎物理学と応用技術をどのように橋渡しできるかについての洞察を提供することを目指している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:20:33 GMT)
PEO: Improving Bi-Factorial Preference Alignment with Post-Training Policy Extrapolation [5.3] ポストトレーニング外挿最適化(PEO)は、二要素アライメントのための新しく効率的なフレームワークである。
PEOは3相パイプラインを利用して、1つのトレーニングパスで最適なポリシーのファミリーを生成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:56:39 GMT)
Adversarial Agents: Black-Box Evasion Attacks with Reinforcement Learning [5.3] 強化学習(RL)は、複雑なシーケンシャルな意思決定タスクを経験から解くための強力な技術を提供する。
本稿では,対戦型機械学習(AML)にRLを適用して,対戦型機械学習を学習する新たな攻撃方法を提案する。
セキュリティの観点から、この研究はRLを使用してMLモデルを効率的かつ大規模に攻撃する強力な新たな攻撃ベクトルを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:54:03 GMT)
Within-Dataset Disclosure Risk for Differential Privacy [5.3] 差分プライバシー(DP)は、個人データ分析を可能にする。
典型的なDPデプロイメントでは、コントローラは個人の機密データを管理し、個人のプライバシーを保護しながらアナリストのクエリに応答する責任を負う。
コントローラが$epsilon$を選択するのは、データベース内の個人に対するそのような選択のプライバシー上の意味を理解するのが難しいためである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:45:05 GMT)
Lost in Moderation: How Commercial Content Moderation APIs Over- and Under-Moderate Group-Targeted Hate Speech and Linguistic Variations [5.3] 商用コンテンツモデレーションAPIは、オンラインヘイトスピーチに対抗するスケーラブルなソリューションとして販売されている。
これらのAPIへの依存は、正当なスピーチをサイレンシングすることと、オンラインプラットフォームを有害なスピーチから守らないことの両方を危険にさらしている。
本稿では,ブラックボックスNLPシステムの監査のためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:56:47 GMT)
Towards Efficient Deep Hashing Retrieval: Condensing Your Data via Feature-Embedding Matching [5.2] 複雑な最適化と大規模なデータセットのため、高度な深層ハッシュモデルのトレーニングが高価になっている。
IEM(Information-intensive feature Embedding Matching, 情報集約型特徴埋め込みマッチング)を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:26:18 GMT)
Fault Localization and State Estimation of Power Grid under Parallel Cyber-Physical Attacks [5.2] サイバー物理攻撃の幅広い範囲において, 異常伝送線路の故障診断問題について検討する。
物理攻撃の場所を見つけるために,グラフアテンションネットワークに基づく障害局所化アルゴリズムを提案する。
次に、攻撃領域内の伝送線路の状態を特定するために、ライン状態同定アルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:10:41 GMT)
Asymptotic Behavior of Adversarial Training Estimator under $\ell_\infty$-Perturbation [5.2] 本稿では, $ell_infty-perturbation 下での対向トレーニング推定器の挙動について検討する。
数値実験により, $ell_infty-perturbation 下での対人訓練の空間的回復能力を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:04:46 GMT)
Development of a Deep Learning Model for the Prediction of Ventilator Weaning [5.1] 集中治療室 (ICU) 設定において, 脱毛は重要な関心事である。
約20人のICU患者がこの現象を経験し、健康に深刻な影響を与える。
本稿では,機械式人工呼吸器から解離する患者を,畳み込みニューラルネットワーク(CNN)を用いて評価する医療支援システムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:41:27 GMT)
Gradient-Guided Annealing for Domain Generalization [5.1] ドメインの一般化効率を向上させるため,GGAアルゴリズムを提案する。
GGAの有効性は、広く受け入れられ、困難な画像分類領域の一般化ベンチマークで評価される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:33:58 GMT)
Non-convergence to the optimal risk for Adam and stochastic gradient descent optimization in the training of deep neural networks [5.1] DNNのトレーニングにおいて、SGD最適化手法の真のリスクを最適な真のリスク値に収束させることを証明または証明することは、未解決の問題である。
任意の完全連結フィードフォワードDNNのトレーニングでは、考慮された真のリスクが最適の真のリスク値に確率で収束するとは考えていない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:36:01 GMT)
Victim-Centred Abuse Investigations and Defenses for Social Media Platforms [5.0] 我々は,米国のマイノリティサービス機関で,学生に対する調査および半構造化インタビューを実施している。
我々は、様々な社会プラットフォーム上での虐待経験、防衛戦略、虐待対応を改善するための社会プラットフォームに対する勧告を探求する。
本稿では,悪用防衛システムの設計要件を提案し,その実装におけるプライバシ,匿名性,および悪用属性の役割について議論する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:08:20 GMT)
QUAD-LLM-MLTC: Large Language Models Ensemble Learning for Healthcare Text Multi-Label Classification [4.8] 収集された医療用テキストデータのエスカレート量は、テキスト分類を自動化する上でユニークな課題である。
従来の機械学習モデルは、表現されたトピックの配列を完全にキャプチャできないことが多い。
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクにおいて顕著な効果を示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:11:31 GMT)
Large Language Models for Healthcare Text Classification: A Systematic Review [4.8] 大規模言語モデル(LLM)は、自然言語処理(NLP)のアプローチを根本的に変えた。
医療分野では、臨床ノートの分析、診断コーディング、その他のタスクにおいて、正確で費用効率のよいテキスト分類が不可欠である。
医療用テキストの自動分類にLLMを活用するために多くの研究がなされている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:16:13 GMT)
Evaluating the quality of published medical research with ChatGPT [4.8] これまでの研究では、ChatGPTが研究論文の質を推定できることが示されている。
本稿では,これまでで最大のデータセットを用いた臨床医学異常について検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:46:33 GMT)
Adaptive cold-atom magnetometry mitigating the trade-off between sensitivity and dynamic range [4.8] 高い感度と高ダイナミックレンジを有する適応型巻き付き無冷原子磁気学を実験的に実証した。
ハーツの平方根あたりの感度は6.8$pm$0.1 picoteslaで、145.6ナノテトラの範囲である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:22:14 GMT)
Your Model is Overconfident, and Other Lies We Tell Ourselves [4.7] 与えられた例に固有の困難さは、その固有の曖昧さに根ざして、ニューラルNLPモデルを評価する上で、しばしば見過ごされがちな要素である。
本研究は,アノテーションの使い分け,トレーニングダイナミクス,モデルの信頼性など,本質的な難易度を評価するための様々な指標間の相互作用とばらつきについて検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:59:28 GMT)
Language-Guided Object Search in Agricultural Environments [4.7] 農業環境における対象探索の課題に対処する。
ロボットが、見えない対象物の位置を意味論的に判断することを可能にする方法を提案する。
我々は、オブジェクト間のセマンティックな関係を利用して、環境を通る経路を計画する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:15:45 GMT)
Scalable and Accurate Application-Level Crash-Consistency Testing via Representative Testing [4.7] Pathfinderは、少数の代表的なクラッシュ状態を近似するために、更新動作に基づいた、クラッシュ一貫性テストツールです。
Pathfinderは以前の作業よりも大規模アプリケーションに効果的にスケールし、POSIXベースのアプリケーションでは4倍、MMIOベースのアプリケーションでは8倍のバグがある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:41:57 GMT)
FAIR: Facilitating Artificial Intelligence Resilience in Manufacturing Industrial Internet [4.6] 本稿では,AI性能の経時的レジリエンスを調査するための新しいフレームワークを提案する。
提案手法は,AI性能を回復するための効果的な診断・緩和戦略を容易にする。
提案手法の利点は,AJP(Aerosol Jet Printing, エアロゾルジェットプリンタ)マシン, 霧ノード, クラウドのMIIテストベッドを用いてAIパイプラインによる推論タスクを用いて検討した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:17:22 GMT)
Unmasking Implicit Bias: Evaluating Persona-Prompted LLM Responses in Power-Disparate Social Scenarios [4.6] 応答のセマンティックシフトを測定するために,コサイン距離を用いた新しいフレームワークを提案する。
我々は、人口動態が、権力の異なる社会シナリオにおける応答品質にどのように影響するかを評価する。
以上の結果から,中高年で有能な母国生まれのコーカサス系無神論的男性に対する「デフォルト・ペルソナ」バイアスが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:44:03 GMT)
STAR: Stability-Inducing Weight Perturbation for Continual Learning [4.6] 継続的学習における重要な課題は、モデルが新しいタスクを学ぶために更新されると、破滅的な忘れがちになることです。
継続学習中の忘れを軽減するための一般的なアプローチは、事前に確認されたサンプルの小さなバッファを保持し、トレーニング中にそれらを再生することである。
モデル予測のKL偏差を低減させる,最悪のパラメータ摂動を利用した新しい損失関数STARを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:32:03 GMT)
Advancing Obfuscation Strategies to Counter China's Great Firewall: A Technical and Policy Perspective [4.6] 中国のグレートファイアウォール(GFW)は、世界で最も広範かつ技術的に洗練されたインターネット検閲フレームワークの1つを実証している。
本稿では,Deep Packet Inspection (DPI),ドメイン名改ざん,トラフィックフィンガープリントなど,GFWの主要な検出手法について批判的に検討する。
同時に,これらの制約を回避するために,難読化,暗号化,ルーティングの革新を活用する新興対策の評価を行う。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:51:50 GMT)
AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems [4.6] 人間は現在、機械学習ベースのシステムと常に対話し、毎日モデルをトレーニングし、使用しています。
コンピュータサイエンス文学におけるいくつかの異なる技術は、人間の機械学習システムとの相互作用を説明するが、その分類は小さく、目的は様々である。
本調査では,現代コンピュータ科学文献が人間と機械の相互作用をどのようにモデル化しているかを理解するための概念的および技術的枠組みを提供するハイブリッド意思決定システムの分類法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:28:57 GMT)
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning [4.6] 完全に分散化された階層型マルチエージェントシステムを構築するためのフレームワークであるTAME Agent Framework (TAG)を紹介する。
TAGは疎結合を維持しながらレベル間の情報フローを標準化し、多様なエージェントタイプをシームレスに統合する。
この結果から,分散階層型組織は学習速度と最終性能を両立させ,TAGをスケーラブルなマルチエージェントシステムにとって有望な方向と位置づけた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:35:14 GMT)
OMG: Opacity Matters in Material Modeling with Gaussian Splatting [4.6] 逆レンダリングはコンピュータビジョンとグラフィックスにおける長年の問題である。
ニューラルレンダリングの最近の進歩は、フォトリアリスティックでプラウシブルな逆レンダリング結果を可能にする。
3D Gaussian Splattingの出現は、リアルタイムレンダリングの可能性を示すことによって、それを次のレベルへと引き上げた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:26:25 GMT)
Limitations of Amplitude Encoding on Quantum Classification [4.6] 実用的で有意義なタスクを扱う際に量子機械学習(QML)が真の優位性を持っているかどうかは不明だ。
振幅符号化は、2n$の古典的データを同時に$n$ qubitsに符号化する際の顕著な効率のため、広く使われている。
振幅符号化により符号化された量子状態の平均は、特定の状態へ集中する傾向にあることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:52:47 GMT)
Revisiting Locally Differentially Private Protocols: Towards Better Trade-offs in Privacy, Utility, and Attack Resistance [4.5] ローカル微分プライバシー(LDP)は、特にデータを収集するサーバが信頼できない設定で、強力なプライバシ保護を提供する。
本稿では, LDPプロトコルを改良するための汎用多目的最適化フレームワークを提案する。
具体的には,プライバシの尺度としてアタッカー成功率(ASR)を,ユーティリティの尺度として平均二乗誤差(MSE)を特に最適化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:41:01 GMT)
Towards Generalizable Scene Change Detection [4.5] 現在の環境変化検出手法は、目に見えない環境と異なる時間条件下では信頼性が低い。
本稿では,SCDの需要増加に対応するため,GeSCF(Generalizable Scene Change Detection Framework)を提案する。
GeSCFは、既存のSCDデータセットで平均19.2%、ChangeVPRデータセットで30.0%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:46:42 GMT)
Enhancing Clustered Federated Learning: Integration of Strategies and Improved Methodologies [4.5] フェデレートラーニング(Federated Learning, FL)は、分散機械学習の手法である。
クライアント間のデータのばらつきは、すべてのローカルディストリビューションを横断するトレーニングモデルに課題をもたらす。
近年の研究では、クラスタリングがクライアントを異なるクラスタに分割することで、FLにおけるクライアントの不均一性に対処するソリューションとして提案されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:18:38 GMT)
Forgetting Transformer: Softmax Attention with a Forget Gate [4.5] 我々はこの注意機構を Forgetting Attention と命名し、 Forgetting Transformer (FoX) をモデルとした。
FoXは、長文言語モデリング、長さ補間、短文下流タスクでTransformerより優れている。
FoXはFlashAttentionアルゴリズムと互換性があり、位置埋め込みを必要としない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:35:23 GMT)
OCL: Ordinal Contrastive Learning for Imputating Features with Progressive Labels [4.4] 本稿では,全被写体を維持しつつ,多様な画像特徴を活用できる全体像特徴量計算手法を提案する。
提案手法は,共有埋め込み空間における様々なモーダルの全体像特徴計算を促進する。
実験の結果,本ネットワークは統計解析や計算基準に対する分類に好適な結果をもたらすことがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:23:29 GMT)
Mathematical Foundation of Interpretable Equivariant Surrogate Models [4.4] 本稿では,ニューラルネットワークの説明可能性に関する厳密な数学的枠組みを紹介する。
中心的な概念は、特定の図形の非可換性を測定することによってGEO間の距離を定量化することである。
畳み込みニューラルネットワークを用いた画像分類のような、古典的な機械学習シナリオにどのように適用できるかを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:06:43 GMT)
AirRoom: Objects Matter in Room Reidentification [4.4] AirRoomは、多レベルオブジェクト指向情報を統合するオブジェクト認識パイプラインである。
AirRoomは、ほぼすべての評価指標で最先端(SOTA)モデルを上回っている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:20:08 GMT)
Learning Conjecturing from Scratch [4.4] 我々は16197問題のデータセットに基づいて帰納的述語を導出する自己学習手法を開発した。
このアルゴリズムは、多くの興味深い帰納的述語を発見し、最終的に5565の問題を解く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:39:38 GMT)
GAMED-Snake: Gradient-aware Adaptive Momentum Evolution Deep Snake Model for Multi-organ Segmentation [4.3] 本稿では,GAMED-Snakeモデルについて述べる。
勾配に基づく学習と適応運動量進化機構を統合する。
GAMED-Snakeは、最先端の手法と比較してmDiceメトリックを約2%改善する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:18:40 GMT)
CPT-Boosted Wav2vec2.0: Towards Noise Robust Speech Recognition for Classroom Environments [4.3] We study the effective of continued pretraining (CPT) in adapting Wav2vec2.0 to the classroom domain。
この点においてCPTは強力なツールであり、Wav2vec2.0ベースのモデルのワードエラー率(WER)を10%以上削減することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:35:03 GMT)
ViiNeuS: Volumetric Initialization for Implicit Neural Surface reconstruction of urban scenes with limited image overlap [4.2] ViiNeuSは、符号付き距離場を効率よく初期化する、新しいハイブリッドな暗黙曲面学習法である。
ViiNeuSは、訓練の2倍の速さで、様々な都市景観の正確な3次元表面表現を学習できることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:49:10 GMT)
Speculative Decoding and Beyond: An In-Depth Survey of Techniques [4.2] シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。
ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:21:14 GMT)
Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization [4.2] GFlowNetsは、与えられた報酬関数に比例したオブジェクトのサンプルを学習する生成モデルのファミリーである。
近年の研究では,GFlowNetトレーニングとエントロピー規則化強化学習問題との密接な関係が示されている。
本稿では,エントロピー規則化マルコフ決定プロセスにおいて,値関数を直接逐次的に適用する,シンプルな後方ポリシー最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:08:48 GMT)
CoCoNUT: Structural Code Understanding does not fall out of a tree [4.1] 大規模言語モデル(LLM)は、構造化されたデータと非構造化されたテキストデータの両方を含む幅広いタスクにおいて、印象的なパフォーマンスを示している。
コード生成、修復、あるいは補完のための様々なベンチマークの最近の結果は、あるモデルが人間に匹敵するプログラミング能力を持っていることを示唆している。
このようなベンチマークにおけるハイパフォーマンスは、コードの構造的制御フローを理解する人間固有の能力と相関しないことを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:44:04 GMT)
How Well do LLMs Compress Their Own Chain-of-Thought? A Token Complexity Approach [4.1] 推論長とモデル性能の関係について,最初の系統的研究を行った。
このトレードオフは、非常に明確な推論チェーンにまたがって持続することを示す。
提案手法は, 理論的な限界から遠く離れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:48:20 GMT)
A Hybrid CNN-Transformer Model for Heart Disease Prediction Using Life History Data [4.0] 本研究では、畳み込みニューラルネットワーク(CNN)とトランスフォーマーのハイブリッドモデルを用いて、心臓疾患の予測と診断を行う。
局所的な特徴を検出するCNNの強みとグローバルな関係を感知するトランスフォーマーの高能力に基づいて、このモデルは心臓病の危険因子を検出することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:12:55 GMT)
Zero-Trust Artificial Intelligence Model Security Based on Moving Target Defense and Content Disarm and Reconstruction [4.0] 本稿では,モデル動物園とファイル転送機構を通じてAIモデルを配布する際の課題について検討する。
モデルファイルの物理的なセキュリティは重要であり、厳格なアクセス制御とアタック防止ソリューションを必要とする。
これは、既知のAIモデルリポジトリとHuggingFaceモデル動物園からの実際のマルウェア攻撃に対して検証されている間、100%の武装解除率を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:32:19 GMT)
The Alignment Problem from a Deep Learning Perspective [4.0] 我々は、それを防ぐための十分な努力がなければ、AIGは人間の利益と矛盾する目標を追求することを学ぶことができると論じる。
現代の最も有能なモデルのように訓練された場合、AGIはより高い報酬を受け取るために欺く行為を学ぶことができる。
我々は、不整合AGIの展開が、世界における人類のコントロールを不可逆的に損なう可能性について、簡単に概説する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:17:46 GMT)
Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [4.0] 本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:31:23 GMT)
Road Boundary Detection Using 4D mmWave Radar for Autonomous Driving [4.0] 道路境界は、自動運転における安全なナビゲーションと効果的な経路計画にとって重要である。
伝統的に、自動運転における道路境界検出は、カメラとLiDARに依存している。
本稿では, 4D mmWave レーダーを用いた道路境界検出法である 4DRadarRBD を紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:53:44 GMT)
AC-Lite : A Lightweight Image Captioning Model for Low-Resource Assamese Language [4.0] この研究は、低リソースのアサメ言語における画像キャプションのための計算効率の良いモデルであるAC-Liteを提示する。
AC-Liteは、FasterRCNNのような計算量の多い視覚特徴抽出器を軽量のShuffleNetv2x1.5に置き換えることで、計算要求を減らす。
提案したAC-Liteモデルは、1.098 GFLOPと25.65Mパラメータを持つCOCO-ACデータセット上で82.3 CIDErスコアを達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:07:52 GMT)
MRI super-resolution reconstruction using efficient diffusion probabilistic model with residual shifting [4.0] 本研究では, 重要な解剖学的詳細を保存しながら, サンプリング工程を大幅に短縮する残差シフト機構を提案する。
本稿では,残差シフトを前方拡散プロセスに統合するRes-SRDiffという新しい拡散型SRフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:15:08 GMT)
Exploring the dynamical interplay between mass-energy equivalence, interactions and entanglement in an optical lattice clock [3.9] 我々は、スピンコヒーレントおよび絡み合った量子状態に疑問を呈する光学格子クロック(OLC)における質量エネルギー等価性の顕在化を探索する。
我々の研究は、OLC実験における一般相対性理論が量子コヒーレンスと絡み合いに与える影響を探求する新たな可能性を開く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:27:20 GMT)
Combining Flow Matching and Transformers for Efficient Solution of Bayesian Inverse Problems [3.9] 本研究では,CFM(Conditional Flow Mathching)とTransformerベースのアーキテクチャを組み合わせることで,様々な観測値に基づいて,そのような分布から効率的にサンプルを抽出できることを実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:17:56 GMT)
Correlation to Causation: A Causal Deep Learning Framework for Arctic Sea Ice Prediction [3.9] 本稿では,因果探索アルゴリズムとハイブリッドディープラーニングアーキテクチャを組み合わせた因果学習フレームワークを提案する。
提案手法は因果的重要な要因を特定し,直接影響のある特徴を優先し,特徴オーバーヘッドを低減し,計算効率を向上する。
実験により、因果的特徴の統合は、深層学習モデルの予測精度と複数のリードタイムでの解釈可能性を高めることが示されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:24:14 GMT)
Photon Routing Induced by Giant Atoms in a Synthetic Frequency Dimension [3.8] 動的変調多重モードリング共振器と駆動三層人工原子に基づくハードウェア効率の良い光子ルーティング方式を提案する。
駆動場の位相を調整することにより、2つの周波数格子間の光子伝達を適切に制御できることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:52:55 GMT)
RobotFingerPrint: Unified Gripper Coordinate Space for Multi-Gripper Grasp Synthesis and Transfer [3.8] 本稿では,統一グリッパー座標空間(Unified Gripper Coordinate Space)という新たなグリップ表現を導入する。
我々の表現は球面座標を利用して、異なるロボットグリップにまたがる共有座標空間を作成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:51:41 GMT)
Converting Transformers into DGNNs Form [3.7] ダイグラフフーリエ変換に基づく合成ユニタリグラフ畳み込みを導入する。
Converterと呼ぶ結果のモデルは、トランスフォーマーをダイレクトグラフニューラルネットワーク形式に効果的に変換する。
我々は、Long-Range Arenaベンチマーク、Long-Range Arena分類、DNAシークエンスに基づく分類でConverterを検証した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:19:39 GMT)
Hate Speech and Sentiment of YouTube Video Comments From Public and Private Sources Covering the Israel-Palestine Conflict [3.7] 本研究は、イスラエルとパレスチナの紛争に関するYouTubeビデオコメントにおけるヘイトスピーチ(HS)の流行と感情について考察する。
パブリックおよびプライベートソースから抽出されたYouTubeビデオのコメントセクションに機械学習(ML)モデルを適用した。
センチメント分析では、両方のソースタイプにおいて、主に中立的なスタンスを示し、公的ソースでイスラエルとパレスチナに対してより顕著な感情が観察された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:03:14 GMT)
CareerBERT: Matching Resumes to ESCO Jobs in a Shared Embedding Space for Generic Job Recommendations [3.7] 本研究は、NLPおよび求人推薦システムの分野に貢献する。
本稿では、キャリアカウンセラーと求職者のための高度な支援ツールであるCareerBERTを紹介する。
当社のアプローチでは、欧州スキル、能力、職業(ESCO)の分類学と欧州雇用サービス(EURES)の求人広告からのデータを組み合わせてコーパスを作成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:14:14 GMT)
FRMD: Fast Robot Motion Diffusion with Consistency-Distilled Movement Primitives for Smooth Action Generation [3.7] 本研究では,スムーズかつ時間的に一貫したロボットの動きを生成するための高速ロボット運動拡散法を提案する。
本手法は,移動プリミティブ(MP)と一貫性モデルを統合し,効率的な単一ステップ軌道生成を実現する。
その結果,FRMDはより高速でスムーズな軌道を発生し,高い成功率を達成できた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:56:39 GMT)
Parameter-Efficient Fine-Tuning of Large Language Models via Deconvolution in Subspace [3.7] 様々な下流タスクのための微調整大型言語モデル(LLM)が新しいパラダイムとなった。
Low-Rank Adaptation (LoRA)はそのパラメータ効率でよく知られている。
我々は新しい方法を提案する。
効率の良い分解はDCFTと呼ばれ、部分空間のデコンボリューションを介して行われる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:15:50 GMT)
Enabling AI Scientists to Recognize Innovation: A Domain-Agnostic Algorithm for Assessing Novelty [3.7] 相対近傍密度(Relative Neighbor density)は、研究思想における新規性評価のための領域に依存しないアルゴリズムである。
RNDは、コンピュータ科学と生物医学研究領域における最先端のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:22:39 GMT)
From superposition to sparse codes: interpretable representations in neural networks [3.7] 最近の証拠は、ニューラルネットワークが重畳の特徴を符号化していることを示唆している。
本稿では、この現象を説明する視点を示し、ニューラルアクティベーションから解釈可能な表現を抽出するための基盤を提供する。
我々の議論は、ニューラルコーディング理論、AI透明性、ディープラーニングモデルをより解釈可能なものにするというより広い目標に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:49:59 GMT)
OpenReviewer: A Specialized Large Language Model for Generating Critical Scientific Paper Reviews [3.7] OpenReviewerは、機械学習とAIカンファレンスの論文の高品質なピアレビューを生成するための、オープンソースのシステムである。
Llama-OpenReviewer-8Bは8Bパラメータ言語モデルで、トップカンファレンスから79,000人の専門家レビューに基づいて微調整されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:58:56 GMT)
Deconfined criticality as intrinsically gapless topological state in one dimension [3.7] 本研究では, 1次元格子モデルにおいて, 分割臨界度を, ギャップのない本質的にギャップのない位相状態とみなすことができることを示す。
分割臨界に固有の混合異常が境界付近で位相的に堅牢なエッジモードを強制することを明確に示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:49:45 GMT)
Language-Assisted Feature Transformation for Anomaly Detection [3.6] 言語支援特徴変換(LAFT)は、自然言語を用いた異常検出にユーザ知識と嗜好を取り入れている。
玩具と実世界の両方のデータセットの実験により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:15:49 GMT)
Self-Adaptive Gamma Context-Aware SSM-based Model for Metal Defect Detection [3.6] 金属欠陥検出は工業品質保証に重要である。
既存の方法は、グレースケールのバリエーションと複雑な欠陥状態に苦しむ。
本稿では,自己適応型ガンマコンテキスト認識SSMモデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:57:54 GMT)
Tackling Hallucination from Conditional Models for Medical Image Reconstruction with DynamicDPS [3.6] 幻覚は、基礎的な真実には存在しない刺激的な構造である。
条件付き拡散モデルと非条件拡散モデルを統合する拡散ベースのフレームワークであるDynamicDPSを提案する。
本手法は,任意の条件付きモデル出力から幻覚を効果的に低減する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:33:04 GMT)
SecureFalcon: Are We There Yet in Automated Software Vulnerability Detection with LLMs? [3.6] SecureFalconは、Falcon-40Bモデルから派生した1億1100万のパラメータしか持たない革新的なモデルアーキテクチャである。
SecureFalconはバイナリ分類で94%の精度、マルチクラス化で最大92%、即時CPU推論時間を実現している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:12:22 GMT)
HREB-CRF: Hierarchical Reduced-bias EMA for Chinese Named Entity Recognition [3.6] 本稿では,HREB-CRFフレームワークを提案する。
提案手法は単語境界を増幅し,局所的および大域的階層的注意の指数的固定バイアス重み付き平均値を用いて長文勾配をプールする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:31:52 GMT)
The order in speech disorder: a scoping review of state of the art machine learning methods for clinical speech classification [3.5] 音声パターンは様々な病因の診断マーカーとして出現している。
喉頭障害, 変形性関節症, およびパーキンソン病の発声に関連する変化に対して, 高い診断精度が持続的に観察された。
うつ病、統合失調症、軽度認知障害、アルツハイマー性認知症などの障害も高い精度を示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:33:02 GMT)
Kinetix: Investigating the Training of General Agents through Open-Ended Physics-Based Control Tasks [3.5] 我々は、何千万もの2次元物理に基づくタスクを手続き的に生成し、それらを物理制御のための一般強化学習(RL)エージェントの訓練に使用する。
Kinetixは物理ベースのRL環境のオープンエンドスペースで、ロボットの移動やグリップからビデオゲームや古典的なRL環境まで、さまざまなタスクを表現できる。
我々の訓練されたエージェントは、2次元空間において強力な物理的推論能力を示し、目に見えない人間設計環境をゼロショットで解決することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:29:16 GMT)
Vector Copula Variational Inference and Dependent Block Posterior Approximations [3.4] 本稿では,ブロック間の依存性を同期的に捉えるためにベクトルコプラを用いた手法を提案する。
得られた関節分布を依存ブロック後部近似と呼ぶ。
このアプローチの有効性と汎用性は、4つの異なる統計モデルと16のデータセットを用いて実証される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:24:54 GMT)
What's Behind PPO's Collapse in Long-CoT? Value Optimization Holds the Secret [3.4] これらの問題に対処するために,VC-PPO(Value-Calibrated PPO)を提案する。
The American Invitational Mathematics Examination (AIME) の実験は、VC-PPOがPPOのパフォーマンスを著しく向上させることを示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:59:25 GMT)
What do Large Language Models Say About Animals? Investigating Risks of Animal Harm in Generated Text [3.3] 大型言語モデル(LLM)における動物害リスクの新しい評価である動物害評価(AHA)を提案する。
私たちのデータセットはRedditのポストタイトルから1,850のキュレートされた質問と、50の動物カテゴリーと50の倫理的シナリオに基づいて2500の合成質問で構成されています。
AHAはフロンティアLSMに適用すると有意義な評価結果が得られる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:32:18 GMT)
Self-Supervised Contrastive Learning for Videos using Differentiable Local Alignment [3.3] 時間的映像系列の整列に基づく自己教師付き表現学習法を提案する。
局所的アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント(LAC)・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・
学習した表現は、既存の行動認識タスクにおける最先端のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:20:29 GMT)
Density estimation with LLMs: a geometric investigation of in-context learning trajectories [3.3] 大規模言語モデル(LLM)は、様々なタスクでコンテキスト内学習を行う際、顕著な創発的能力を示す。
本研究は,LLMがコンテキスト内で観測されたデータから確率密度関数を推定する能力について検討する。
我々は、集中主成分分析(Intensive principal Component Analysis, InPCA)を活用し、LLaMA-2モデルのコンテキスト内学習ダイナミクスを可視化および解析する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:45:53 GMT)
EXACFS -- A CIL Method to mitigate Catastrophic Forgetting [3.3] 本稿では,クラスインクリメンタルな学習環境においてこの問題を軽減するために,Exponentially Averaged Class-wise Feature Significance (EXACFS)を提案する。
CIFAR-100とImageNet-100の実験は、可塑性を取得しながら安定性を維持するEXACFSの優れた性能を示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:30:42 GMT)
Do GFlowNets Transfer? Case Study on the Game of 24/42 [3.1] GFlowNetsは、ソリューション生成をフローネットワークとして最適化し、より多様性を約束する。
ケーススタディでは、Game of 24で制限されたゼロショット転送可能性を示し、Game of 42データセットでテストしている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:43:25 GMT)
Abn-BLIP: Abnormality-aligned Bootstrapping Language-Image Pre-training for Pulmonary Embolism Diagnosis and Report Generation from CTPA [3.1] Abn-BLIPは放射線診断の精度と包括性を生成するために異常所見の整合を図った高度な診断モデルである。
以上の結果から,Abn-BLIPは最先端の医療ビジョン言語モデルおよび3Dレポート生成手法よりも精度および臨床関連性が高いことがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:13:39 GMT)
Safeguarding Blockchain Ecosystem: Understanding and Detecting Attack Transactions on Cross-chain Bridges [3.1] クロスチェーン橋への攻撃は2021年以来、43億ドル近くを失った。
本稿では,2021年6月から2024年9月までに発生した49件を含む,これまでで最大のクロスチェーン橋攻撃事件を収集する。
クロスチェーンビジネスロジックに対する攻撃を検出するためのBridgeGuardツールを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:59:24 GMT)
In-context Learning vs. Instruction Tuning: The Case of Small and Multilingual Language Models [3.1] マルチリンガルモデルと小型モデルを含むシナリオは、性能の劣化したICL命令をもたらすことを示す。
本研究の目的は,現在の指導方法の長所と短所の理解を深めることである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:47:23 GMT)
Transformer Block Coupling and its Correlation with Generalization in LLMs [3.0] トランスブロックを通過するトークン埋め込みの軌跡について検討する。
大規模言語モデルにおけるtextbftransformer ブロックの結合現象を明らかにする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:51:59 GMT)
Foundation Inference Models for Markov Jump Processes [3.0] 境界状態空間上のマルコフジャンプ過程(MJP)のゼロショット推論手法を提案する。
1つの(事前訓練された)モデルと同一の(事前訓練された)モデルは、ゼロショットの方法で、異なる次元の状態空間で進化する隠れMJPを推論することができる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:26:33 GMT)
On the Geometry and Optimization of Polynomial Convolutional Networks [3.0] 単項活性化機能を持つ畳み込みニューラルネットワークについて検討する。
我々は、モデルの表現力を測定するニューロマニフォールドの次元と度合いを計算する。
一般的な大規模データセットに対して、回帰損失の最適化に起因した臨界点の数を定量化する明示的な公式を導出する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:18:16 GMT)
Automorphism Ensemble Decoding of Quantum LDPC Codes [2.9] 本稿では,大規模な自己同型群を持つ量子誤り訂正符号の高速かつ正確なデコーダであるAutDECを紹介する。
量子符号の場合、BPデコーダの精度はタナーグラフで短いサイクルが発生するため制限される。
BP-OSD-0に匹敵するデコード精度を低時間オーバーヘッドで示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:58:24 GMT)
Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases [2.9] 調査により、慢性疾患データセットとその派生した機械学習モデルにおいて、性別と年齢に関連する不等式が広く明らかになった。
25,000人以上の慢性疾患患者のデータを分析したところ、男女差は軽度であり、男性には予測精度が好ましく、若年者には有意な年齢差がみられた。
特に高齢患者では、7つのデータセットで矛盾した予測精度を示し、データの複雑さとモデルの性能が低下した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:05:29 GMT)
CorrNetDroid: Android Malware Detector leveraging a Correlation-based Feature Selection for Network Traffic features [2.9] 本研究では,ネットワークトラフィックフローで動作する動的解析ベースのAndroidマルウェア検出システムであるCorrNetDroidを提案する。
多くのトラフィック機能は、通常のデータセットとマルウェアのデータセットに重複する範囲を示す。
本モデルでは,2つのネットワークトラフィック機能のみを考慮すると,Androidのマルウェアを99.50%の精度で検出しながら,機能セットを効果的に削減する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:52:34 GMT)
Dendron: Enhancing Human Activity Recognition with On-Device TinyML Learning [2.9] ヒューマンアクティビティ認識(HAR)は、機械学習(ML)技術を用いてユーザアクティビティを識別する研究分野である。
近年の研究では、ウェアラブルデバイス上で直接実行されるHARソリューションの開発が優先されており、デバイス上でのアクティビティ認識が可能になっている。
本稿では、限られた教師付きデータであっても、HARのための新しいタスクのデバイス上での学習を容易にするために設計された新しいTinyML手法であるDendronを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:45:52 GMT)
Multi-Agent Reinforcement Learning with Long-Term Performance Objectives for Service Workforce Optimization [2.9] 我々の目標は、統合労働力最適化問題をモデル化するシミュレータを作ることである。
具体的には,強化学習手法の開発を支援するモジュールシミュレータを設計した。
シミュレータはパラメータ化を提供し、様々なレベルのアブレーションと非定常性を持つ動的なシナリオを探索するのに役立つ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:16:47 GMT)
On Exact Sizes of Minimal CNOT Circuits [2.8] 我々は、可逆性と量子コンピューティングの基本的なバイナリゲートであるCNOTゲートの回路を考える。
我々はG_n$で距離を計算する新しい手法を開発し、これまでは到達できなかった最小限の回路を合成する。
また、すべての$nleq 8$に対して、長い周期の置換が3(n-1)$で、以前の$nleq 5$の範囲を延ばすという予想も確認する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:20:48 GMT)
Fine-Tuning Whisper for Inclusive Prosodic Stress Analysis [2.8] 本研究では,OpenAIのWhisper large-v2 ASRモデルを用いて,音声におけるフレーズ,語彙,コントラスト的ストレスを認識する。
66人のネイティブ英語話者のデータセットを用いて、ストレスパターンを一般化し、ニューロタイプとジェンダーで話者を分類するモデルの能力を評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:48:31 GMT)
ToLo: A Two-Stage, Training-Free Layout-To-Image Generation Framework For High-Overlap Layouts [2.8] ToLoは、ハイオーバーラップレイアウトのための2段階のトレーニング不要なレイアウト・ツー・イメージ生成フレームワークである。
ToLoは,高オーバラップレイアウトを扱う場合,既存の手法の性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:41:51 GMT)
PnP-Flow: Plug-and-Play Image Restoration with Flow Matching [2.7] 本稿では,逆画像問題の解法であるPlug-and-Play Flow Matchingを提案する。
我々は,デノイング,スーパーレゾリューション,インペインティングのタスクにおける性能を評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:44:06 GMT)
USeR: A Web-based User Story eReviewer for Assisted Quality Optimizations [2.7] 複数のユーザストーリの品質ガイドラインが存在するが、業界プロジェクトにおけるプロダクトオーナーのような著者は、高品質なユーザストーリを書くのに失敗することが多い。
この状況は、ユーザストーリーの品質を評価するツールの欠如によって悪化します。
我々は,ユーザストーリーの品質を判断し,最適化する Web ベースのツールである User Story eReviewer (USeR) を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:02:10 GMT)
Laurel: Unblocking Automated Verification with Large Language Models [2.7] 大規模言語モデルを用いてアサーションを自動的に生成するツールであるLaurellを提案する。
実世界の3つのDafnysから抽出した複雑な補題のデータセットであるDafnyGymを、新しいベンチマークで評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:24:37 GMT)
HI-Series Algorithms A Hybrid of Substance Diffusion Algorithm and Collaborative Filtering [2.6] 本稿では ItemCF と拡散に基づくアプローチを統合する HI-Series アルゴリズムを提案する。
MovieLens、Netflix、RYMデータセットの実験では、HIシリーズアルゴリズムがベースモデルよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:43:40 GMT)
Synthetic Tabular Data Detection In the Wild [2.5] テーブルの制限されたセットでのクロステーブル学習は、単純な事前処理方式であっても可能である。
これは、この問題に対処するために高度な符号化方式が必要であることを示唆している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:53:16 GMT)
Reclaiming the Future: American Information Technology Leadership in an Era of Global Competition [2.5] 米国は、基礎研究資金の減少、人材獲得の課題、研究のセキュリティとオープンネスの間の緊張により、情報技術研究における世界的リーダーシップを失うリスクがある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:52:58 GMT)
A General Purpose Spectral Foundational Model for Both Proximal and Remote Sensing Spectral Imaging [2.5] 時間とリソースの制約は、大規模なスペクトルデータセットを収集する能力を制限します。
マスク付きオートエンコーダアーキテクチャに基づく大規模基盤モデルとデータセットを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:04:00 GMT)
AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models [2.5] AdEvalはデータ汚染が信頼性に与える影響を緩和することを目的とした動的データ評価手法である。
複数のデータセットに対する実験結果から、AdEvalはデータ汚染が評価結果に与える影響を効果的に低減することが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:06:47 GMT)
Machine Learners Should Acknowledge the Legal Implications of Large Language Models as Personal Data [2.5] したがって、いくつかの機械学習モデルは、個人データとみなすことができる。
これにより、アクセス権、修正権、消去権など、データ保護の意味のカスケードが引き起こされる。
本稿では,機械学習研究者がML開発ライフサイクル全体を通じて,LLMの法的意味を個人データとして認めなければならないことを論じる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:05:48 GMT)
Robust Palm-Vein Recognition Using the MMD Filter: Improving SIFT-Based Feature Matching [2.3] 手のひら静脈画像における大きな課題は、指と親指のわずかな動き、または手の姿勢の変化が、異なる領域で皮膚を伸ばすことである。
本稿では,SIFTに基づく特徴マッチングのための新しいフィルタリング手法を提案する。
CASIAデータセットの850nmサブセットで行った実験は、他のフィルタ法で検出された偽陽性を低減しつつ、提案したMDDフィルタが有効に正しい点を保存することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:48:06 GMT)
CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving [2.3] CAPS(Context-Aware Priority Smpling)は、学習に基づく自律運転システムにおいて、データ効率を向上させるために設計された新しい手法である。
CAPSはベクトル量子変分オートエンコーダ(VQ-VAE)を利用した模倣学習における不均衡トレーニングデータセットの課題に対処する
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:27:11 GMT)
Linear Representations of Political Perspective Emerge in Large Language Models [2.2] 大規模言語モデル(LLM)は、様々な主観的人間の視点を現実的に反映するテキストを生成する能力を示した。
本稿は、LLMがアメリカの政治における他の政治的視点の中で、よりリベラルで保守的な視点を反映できるように見えるかを研究する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:59:01 GMT)
Measurement of Many-Body Quantum Correlations in Superconducting Circuits [2.2] アナログ量子シミュレータにおいて多体相関を読み取ることができるプローブ回路を提案する。
我々は、量子不純物を持つLCラダーの文脈で、この設計の能力を実証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:31:28 GMT)
A Generalized Theory of Mixup for Structure-Preserving Synthetic Data [2.2] 混合は分散などの重要な統計特性を歪め、データ合成において意図しない結果をもたらす可能性があることを示す。
一般化されたフレキシブルな重み付け方式を取り入れた新しい混合手法を提案し,元のデータ構造をよりよく保存する。
数値実験により、新しい手法は元のデータの統計特性を保存できるだけでなく、繰り返し合成するモデル性能も維持できることを確認した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:28:50 GMT)
SLAP: Secure Location-proof and Anonymous Privacy-preserving Spectrum Access [2.2] そこで本稿では,スペクトルクエリや利用通知,位置情報保護の獲得などにおいて,位置情報のプライバシと匿名性を確保する新しいフレームワークを提案する。
我々のソリューションには、アーキテクチャの柔軟性とフォールバックオプションを備えたアダプティブなデュアルシナリオ位置検証機構と、タイムロックパズルを用いた対DoSアプローチが含まれている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:52:56 GMT)
Dynamic spillovers and investment strategies across artificial intelligence ETFs, artificial intelligence tokens, and green markets [2.1] 本稿では,R2分解を用いたAI,AIトークン,グリーンマーケット間のリスク流出について検討する。
AIトークンとグリーンボンドはリスクレシーバーとして機能するのに対し、AIとクリーンエネルギーはリスクトランスミッターとして機能する。
また、AIトークンは、AIトークンやグリーンアセットと比較して、ハッシュ化が難しく、ヘッジ能力に制限があることもわかりました。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:53:33 GMT)
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training [2.1] 正規化に基づく量子化対応トレーニングフレームワークは、CIFAR-10とImageNet上での競合結果を達成する。
当社のフレームワークは,フォールトおよび可変性を考慮した微調整,固定重み付きフォールト(固定重み付きビット)の緩和,デバイス抵抗のばらつきを可能にする。
本研究は,低消費電力非理想ハードウェアにおいて,量子化とロバスト性を考慮したトレーニングを行うための一般化可能なフレームワークを構築した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:33:35 GMT)
Interval Regression: A Comparative Study with Proposed Models [2.1] 既存のインターバル回帰モデルをレビューし、比較分析のための代替モデルを紹介します。
実世界のデータセットと合成データセットの両方で実験を行い、モデルパフォーマンスについて幅広い視点を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:39:02 GMT)
Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention [2.1] 大豆の葉の病原体の検出は農業の生産性にとって重要であるが、視覚的に類似した症状と限定的な解釈可能性のために課題に直面している。
本稿では,局所化特徴抽出のためのMobileNetV2とリレーショナルモデリングのためのGraphSAGEを相乗化する,解釈可能なハイブリッドCNN-Graph Neural Network(GNN)フレームワークを提案する。
クロスモーダル解釈はGrad-CAMおよびEigen-CAMビジュアライゼーションを通じて実現され、熱マップを生成して疾患の流入領域をハイライトする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:12:09 GMT)
When an LLM is apprehensive about its answers -- and when its uncertainty is justified [2.0] 大規模言語モデル(LLM)の評価には不確実性推定が不可欠である
本研究では, トークン単位のエントロピーとモデル・アズ・ジャッジ(MASJ)が, 異なる質問トピックに対する複数の質問回答タスクにどのような効果があるかを検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:03:46 GMT)
ProRCA: A Causal Python Package for Actionable Root Cause Analysis in Real-world Business Scenarios [2.0] 本稿では,DoWhy因果推論ライブラリ上に構築した経路追跡パッケージについて述べる。
提案手法は,条件付き異常スコア,ノイズに基づく属性,深さ優先経路探索を統合し,マルチホップ因果連鎖を明らかにする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:33:17 GMT)
From Claims to Evidence: A Unified Framework and Critical Analysis of CNN vs. Transformer vs. Mamba in Medical Image Segmentation [2.0] 本稿では,nnUNet上に構築されたオープンソースのベンチマークフレームワークであるnnUZooを紹介する。
我々は,顕微鏡,超音波,CT,MRI,PETを含む6種類の医用画像セグメンテーションデータセットの異なるモデルを比較した。
nnUNetやU2NetのようなCNNモデルは、スピードと精度の両方を示し、医療画像のセグメンテーションタスクに効果的に選択した。
トランスフォーマーベースのモデルは、特定の画像モダリティを約束する一方で、高い計算コストを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:44:51 GMT)
One Map to Find Them All: Real-time Open-Vocabulary Mapping for Zero-shot Multi-Object Navigation [2.0] ゼロショットマルチオブジェクトナビゲーションのための新しいベンチマークを導入する。
リアルタイムオブジェクト検索に適した,再利用可能なオープン語彙機能マップを構築した。
単一目的と多目的のナビゲーションタスクにおいて,既存の最先端のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:50:18 GMT)
Empowering the Future Workforce: Prioritizing Education for the AI-Accelerated Job Market [2.0] AIの職場への迅速な統合は、労働教育とトレーニングに対する新しいアプローチを必要とする。
労働者が技術変革の加速に適応できるように、政府、産業、教育機関からの協調行動が必要である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:15:45 GMT)
Federated Learning Framework via Distributed Mutual Learning [2.0] フェデレートラーニングは、ネットワークの帯域幅を負担し、プライバシーリスクを増大させる、完全なモデルウェイトまたは部分的なモデルウェイトを共有することに依存することが多い。
分散相互学習を用いた損失に基づく代替手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:15:32 GMT)
P-SpikeSSM: Harnessing Probabilistic Spiking State Space Models for Long-Range Dependency Tasks [2.0] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わる計算効率が高く生物学的に妥当な代替品として提案されている。
長距離依存タスクのためのスケーラブルな確率的スパイク学習フレームワークを開発した。
我々のモデルは、様々な長距離依存タスクにまたがるSNNモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:02:04 GMT)
Task Scheduling & Forgetting in Multi-Task Reinforcement Learning [2.0] 強化学習(RL)エージェントは、以前トレーニングされたタスクを忘れることができる。
多くの場合、RLエージェントは、人間のものと似た、忘れる曲線を示す。
非対称な学習パターンと、保持ベースやパフォーマンスベースのカリキュラム戦略では達成できないタスク間の保持パターンを識別する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:12:52 GMT)
Group Relative Policy Optimization for Image Captioning [2.0] 本稿では,最新のグループ相対政策最適化(GRPO)強化学習アルゴリズムを第2段階の最適化ソリューションとして利用することを提案する。
ポリシー更新の振幅とKLのばらつきを制約することにより、トレーニング中のモデルの安定性が大幅に保証される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:16:41 GMT)
Rotary Outliers and Rotary Offset Features in Large Language Models [2.0] 回転埋め込みを用いた場合,クエリやキーに現れる特徴やパターンについて検討する。
クエリとキーのモデル間のアウトレーヤを発見し解析し、部分サイクルで回転する機能に見出される可能性が高いことを発見した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:55:09 GMT)
Building Safe GenAI Applications: An End-to-End Overview of Red Teaming for Large Language Models [2.0] LLM(Large Language Models)の急速な成長は、プライバシー、セキュリティ、倫理上の懸念を生じさせる。
研究者は最近、レッドチームによる攻撃的なアプローチでこれらの取り組みを補完した。
本稿では,LLMレッド・チームリング文学の簡潔かつ実践的な概要について述べる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:04:22 GMT)
Artemis: Toward Accurate Detection of Server-Side Request Forgeries through LLM-Assisted Inter-Procedural Path-Sensitive Taint Analysis [2.0] Artemisは、PHP WebアプリケーションのSSRF脆弱性を検出する静的なテナント解析ツールである。
ビルトイン関数とサードパーティ関数の両方を候補ソースとシンク関数として抽出する。
関数の関係を推測するために、明示的および暗黙的なコールグラフの両方を構築する。
207の真の脆弱な経路(106の真のSSRF)と15の偽陽性を報告している。
検出された106個のSSRFのうち、35個が新たに発見され、開発者に報告され、24個のCVE IDと割り当てられた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:49:07 GMT)
Privacy-preserving Machine Learning in Internet of Vehicle Applications: Fundamentals, Recent Advances, and Future Direction [1.9] 機械学習(ML)は、インテリジェントトランスポート、自律運転能力、および大規模な異種ネットワーク内の様々な接続サービスを強化することで、IoT(Internet of Vehicles)アプリケーションに革命をもたらした。
プライバシ保存機械学習(PPML)は、MLパイプラインのさまざまな段階でプライバシを保存することによって、これらの課題に対処する潜在的なソリューションを提供する。
本研究は, PPMLをIoVアプリケーションに統合する上での基礎, 最近の進歩, 課題について概説する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:24:04 GMT)
Provably optimal decision trees with arbitrary splitting rules in polynomial time [1.9] 決定木の最初の公理的定義を提供する。
公理を満たす決定木を適切な決定木と呼ぶ。
最適決定木問題の解法として,初めて証明可能な正解時間アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:14:53 GMT)
SensorQA: A Question Answering Benchmark for Daily-Life Monitoring [1.9] SensorQAは、日常生活監視のための長期時系列センサデータのための人為的な質問応答データセットである。
このデータセット上で、最先端AIモデルのベンチマークを確立し、典型的なエッジデバイス上でのパフォーマンスを評価する。
我々の結果は、現在のモデルと最適なQAパフォーマンスと効率のギャップを明らかにし、新しいコントリビューションの必要性を強調します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:03:49 GMT)
Video-DPRP: A Differentially Private Approach for Visual Privacy-Preserving Video Human Activity Recognition [1.9] ビデオHARにおけるプライバシー保護を保証する2つの主要なアプローチは、差分プライバシー(DP)と視覚的プライバシーである。
本稿では、HARのためのプライバシー保護ビデオ再構成のためのビデオサンプルワイド微分ランダム投影フレームワークであるVideo-DPRPを紹介する。
我々は,ビデオDPRPのアクティビティ認識性能と従来のDP手法,およびSOTA(State-of-the-art)ビジュアルプライバシ保存技術を比較した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:43:12 GMT)
Powerful rank verification for multivariate Gaussian data with any covariance structure [1.9] citeGutmannは、この推測は、最大の観測と2番目に大きい観測を比べた両面の差分テストが正当であると論じている。
提案手法は,2辺差分法が上位のK$の内外における観測値と最小の標準差分を比較した場合に,所望の推測を導出することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:10:09 GMT)
Autonomous Exploration and Semantic Updating of Large-Scale Indoor Environments with Mobile Robots [1.9] 移動ロボットが未知の環境を自律的に探索できる新しいロボットシステムを提案する。
環境のセマンティックマップを構築し,その後,環境変化を反映したセマンティックマップを更新する。
本システムはFetchロボットを用いて,93m×90m,9m×13mの屋内環境を意味的にマッピングした。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:04:06 GMT)
The Role of Deep Learning in Financial Asset Management: A Systematic Review [1.9] 本研究は、説明可能な人工知能(XAI)と深層強化学習(DRL)の統合など、新たなトレンドを特定することに焦点を当てる。
2018年から2023年にかけて発行された最も関連性の高い記事を選択するには、Scoopsデータベースを使用します。
包括的基準には、金融資産管理におけるディープラーニングモデルを明確に適用した記事が含まれていた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:29:13 GMT)
CrossFusion: A Multi-Scale Cross-Attention Convolutional Fusion Model for Cancer Survival Prediction [1.9] 全スライド画像(WSI)からのがん生存予測は、計算病理学における課題である。
我々は,新しいマルチスケール機能統合フレームワークであるCrossFusionを提案する。
スケール固有のパターンとその相互作用を効果的にモデル化することにより、CrossFusionは生存率予測精度を高めるリッチな機能セットを生成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:34:52 GMT)
Average-exact mixed anomalies and compatible phases [1.8] この研究は、平均的および正確な対称性を持つ無秩序なシステムに焦点をあてる。
我々は、乱れた基底状態のアンサンブルを表す混合状態は、特徴のないものではないと論じる。
異常混合状態は, 清浄限界における異常適合相と円滑に結びついているが, 清浄限界相を持たない無秩序相も見いだされた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:46:59 GMT)
Locating Rydberg Decay Error in SWAP-LRU [1.8] Rydbergによるリークは、マルチキュービットゲートの実装中に2キュービットのエラー連鎖を誘導する。
SWAP-LRUを用いてレイドバーグの減衰誤差に対処するハードウェア効率のよい手法を提案する。
本手法では1ラウンドに1つの追加のCNOTゲートしか必要とせず,資源のオーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:26:39 GMT)
Formally Discovering and Reproducing Network Protocols Vulnerabilities [1.8] 本稿では,ネットワークプロトコルの新たな脆弱性を発見する新しい手法であるネットワーク攻撃中心構成テスト(NACT)を紹介する。
NACTは、構成可能な攻撃者仕様、正式な仕様変更、ランダム化された制約解決技術を統合して、洗練された攻撃シナリオとテストケースを生成する。
ブラックボックステストフレームワークでクロスプロトコルテストをサポートすることで、NATはネットワークプロトコルのセキュリティを改善するための汎用的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:50:20 GMT)
Hybrid Metaheuristic Vehicle Routing Problem for Security Dispatch Operations [1.7] 本稿では,アダプティブ・LHC(Adaptive Large Neighborhood Search),TA(Tabu Search),TA(Threshold Accepting)の3つのメタヒューリスティックに基づくアルゴリズムを提案する。
ハイブリッド多相ALNS-TS-TAアルゴリズムは、全ての試行で計算時間を増やして結果を改善する可能性を示す唯一のアルゴリズムである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:58:49 GMT)
Quantum machine learning algorithms for anomaly detection: A review [1.7] 量子コンピューティングに関わる重要な概念を要約し、量子スピードアップという形式的な概念を導入する。
このレビューは、量子機械学習に基づく異常検出の構造化マップを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:01:45 GMT)
Enhancing Conversational Agents with Theory of Mind: Aligning Beliefs, Desires, and Intentions for Human-Like Interaction [1.7] オープンソースの言語モデル(LLaMA)は、ToM関連の情報をキャプチャして保存することができる。
ToM関連成分(信念、欲求、意図など)の明示的な操作が、応答アライメントを高めることができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:44:29 GMT)
Verifying QUIC implementations using Ivy [1.7] QUICはTCPの信頼性と混雑制御機能とTLSのセキュリティ機能を組み合わせた新しいトランスポートプロトコルである。
QUICの主な課題の1つは、その実装がIETF仕様に従っていることを保証することである。
本稿では,このツールがQUIC仕様の曖昧さを浮き彫りにし,修正への道筋を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:17:43 GMT)
Learning Efficient Recursive Numeral Systems via Reinforcement Learning [1.7] 従来、強化学習(RL)を用いることで、エージェントは人間に類似した単純な近似的かつ正確に制限された数字系を導出することができることが示されている。
本稿では,効率的な再帰的数体系の出現に関する力学的な説明を導出する手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:02:20 GMT)
How Low Can You Go? Searching for the Intrinsic Dimensionality of Complex Networks using Metric Node Embeddings [1.7] 低次元埋め込みは、グラフを含む機械学習タスクに不可欠である。
ユークリッド計量埋め込みを用いた場合、低次元埋め込みが可能であることを証明した。
初めて、大規模なネットワークであっても、非常に低次元空間に効果的に埋め込むことができることを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:37:38 GMT)
Lessons from complexity theory for AI governance [1.6] 複雑性理論は、政策立案者にとって中心的な課題となるAIの特徴を照らすのに役立つ。
我々は、AI管理の取り組みが深刻な不確実性によってどのように特徴付けられるかを検討する。
我々は,AIガバナンスのタイミングと構造に関して,複雑性に適合する一連の原則を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:54:04 GMT)
Local Statistics for Generative Image Detection [1.6] 拡散モデル (DM) はガウスノイズから画像の合成を学ぶ生成モデルである。
本稿では,デジタルカメラ画像とDM生成画像とを区別するバイエルパターンと局所統計値の有効性を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:21:02 GMT)
CAMEx: Curvature-aware Merging of Experts [1.5] モデルトレーニングと微調整の間に専門家をマージするための既存の手法はユークリッド幾何学に依存している。
曲率を意識したマージ法は、フィッシャー情報行列を近似するために追加の情報と計算資源を必要とする。
我々は,パラメータ多様体の非ユークリッド曲率を考慮に入れた,自然勾配を組み込んだ新しい専門家統合プロトコルであるCAMExを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:12:50 GMT)
Hyperspectral Image Restoration and Super-resolution with Physics-Aware Deep Learning for Biomedical Applications [1.5] 本稿では,事前知識を伴わずに画素分割後の解像度を復元し,向上する深層学習に基づくアプローチを提案する。
画像モデルと整合した計測値を用いて微調整を行い,16倍の超分解能向上と12倍の撮像速度向上を実現した。
すべてのメソッドは、GitHub上のオープンソースソフトウェアとして利用できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:23:23 GMT)
ClipGrader: Leveraging Vision-Language Models for Robust Label Quality Assessment in Object Detection [1.4] 本稿では,境界ボックスアノテーションの精度を評価するために,視覚言語モデルを活用した新しいアプローチであるClipGraderを紹介する。
ClipGraderは、人工的に乱されたバウンディングボックスを持つ修正オブジェクト検出データセットでテストされ、COCO上の91%の精度を1.8%の偽陽性率で達成した。
実験では、既存のCOCOアノテーションのエラーを識別するClipGraderの機能を示し、データセットの洗練の可能性を強調した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:02:31 GMT)
HoT: Highlighted Chain of Thought for Referencing Supportive Facts from Inputs [1.2] 事実と非事実の言明が混ざり合った反応は、人間が自分の決定を正確かつ正確に検証することの難しさを浮き彫りにする。
提案するHighlighted Chain-of-Thought Prompting(HoT)は,大規模言語モデルに対して,クエリで提供される事実をベースとしたXMLタグによる応答を生成する技術である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:26:04 GMT)
Analyzing the Safety of Japanese Large Language Models in Stereotype-Triggering Prompts [1.2] 本研究は, 日本語大言語モデル(LLM)のステレオタイプトリガに応答する際の安全性について, 直接設定で検討する。
日本のネイティブモデルであるLLMs-jpは、拒絶率が最も低く、他のモデルと比較して毒性や負の反応を生じやすい。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:00 GMT)
Cross-Spectral Vision Transformer for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern [1.2] 本稿では,生体認証のための軽量クロススペクトル・ビジョン・トランスフォーマ (CS-ViT) を提案する。
このフレームワークは、2つの異なる生体特性を扱うために設計されたクロススペクトルデュアルチャネルアーキテクチャで構成されている。
提案アルゴリズムは,前頭下皮下静脈パターンと近視バイオメトリックパターンデータベースを用いて厳密に評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:34:25 GMT)
Primus: Enforcing Attention Usage for 3D Medical Image Segmentation [1.2] 現状のTransformerベースのセグメンテーションモデルを分析し,重要な欠点を同定する。
完全トランスフォーマーベースセグメンテーションアーキテクチャであるPrmusを導入する。
Primusは現在のTransformerベースのメソッドを超え、パブリックデータセットの最先端の畳み込みモデルと競合する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:56:29 GMT)
Pre-training Graph Neural Networks with Structural Fingerprints for Materials Discovery [1.2] 本稿では,安価に計算された構造指紋を標的とする,新しい事前学習目標を提案する。
実験により,本手法はGNNの事前学習のための一般的な戦略として機能し,原子データに対する大規模基盤モデルへの適用が期待できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:50:23 GMT)
Noisy-enhanced quantum search on complex networks [1.2] このレターでは、ターゲット要素にのみ接続されるグラフに余分なトラップを追加することで、通常の探索問題を修正します。
グラフトポロジーと対象要素の接続性により、このハイブリッドアプローチは、トラップ部位に到達するための純粋に古典的または量子的進化よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:36:32 GMT)
Independent Mobility GPT (IDM-GPT): A Self-Supervised Multi-Agent Large Language Model Framework for Customized Traffic Mobility Analysis Using Machine Learning Models [1.2] 研究チームは、Independent Mobility GPT(IDM-GPT)という革新的なマルチエージェントフレームワークを提案する。
IDM-GPTは、ユーザー、交通データベース、機械学習モデルを経済的に効率的に接続する。
IDM-GPTのトレーニング、カスタマイズ、ユーザクエリの理解、最適化、データ分析、モデル選択、パフォーマンス評価と拡張など、複数の機能にLLMベースのAIエージェントを適用。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:02:27 GMT)
Gaussian Process Surrogate Models for Efficient Estimation of Structural Response Distributions and Order Statistics [1.1] 本稿では,限られたシミュレーション出力に基づいて訓練されたガウス過程(GP)シュロゲートモデルを用いて,構造応答分布を直接生成する手法を提案する。
その結果,GPサロゲートモデルでは,計算コストのごく一部で,シミュレーションに匹敵する結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:12:32 GMT)
DILEMMA: Joint LLM Quantization and Distributed LLM Inference Over Edge Computing Systems [1.1] 本稿では,エッジコンピューティングシステムに大規模言語モデルをデプロイする際の課題に対処する新しいフレームワークであるDILEMMAを紹介する。
DILEMMAは線形プログラミングの問題を定式化し、総遅延を最小限に抑えつつ、許容可能なLLM性能レベルを確保している。
モデル損失を保ちながら、最大で12.75%の量子化比を達成し、資源制約のある環境での有効性を強調している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:16:33 GMT)
Scintillation pulse characterization with spectrum-inspired temporal neural networks: case studies on particle detector signals [1.1] 本稿では,時系列解析に関するこれまでの研究に基づいて,シンチレーションパルスのキャラクタリゼーションに特化したネットワークアーキテクチャを提案する。
a)LUXダークマター検出器の設定によって生成されたシミュレーションデータと,(b)高速電子回路を用いた実験電気信号を用いて,NICA/MPD温度計のシンチレーション変動をエミュレートする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:45:31 GMT)
CoInD: Enabling Logical Compositions in Diffusion Models [1.1] 本稿では,標準条件拡散モデルが属性組成が統計的に独立であるという仮定に反することを示す。
我々はこの問題に対処するためにCoInDを提案する。
条件付き境界分布間の統計的独立を明示的に強制する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:51:01 GMT)
Deep Reinforcement Learning-Based User Association in Hybrid LiFi/WiFi Indoor Networks [1.1] ハイブリッド光フィデリティ(LiFi)と無線フィデリティ(Wi-Fi)屋内ネットワークは、屋内シナリオにおけるデータレートの増大を緩和する有望な技術として構想されている。
ハイブリッドLiFi/Wi-Fi屋内ネットワークは、LiFiからの高速データ伝送の利点と、スタンドアローンネットワークと比較してスペクトルの範囲を広く利用することができる。
本研究の目的は,ハイブリッドネットワークのための新しいユーザアクセスポイントアソシエーションアルゴリズムを設計することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:33:11 GMT)
Reversing the Computing Research Workforce Shortfall: Bolstering Domestic Student Pathways to PhDs [1.0] イノベーションを維持し、国家の安全を守るためには、米国はPh.D.を計算するための国内道を強化する必要がある。
米国は、産業界にコミットする前に、才能ある学部生と研究経験、メンターシップ、大学院の財政支援を早期に行う必要がある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:18:59 GMT)
A General Neural Network Potential for Energetic Materials with C, H, N, and O elements [1.0] 高エネルギー材料(HEM)は、禁止的な計算費用と開発サイクルの延長によって制約される。
我々は,HEMの構造,機械的,分解特性を効率的に予測する汎用ニューラルネットワーク電位(NNP)を開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:24:59 GMT)
Co-creation for Sign Language Processing and Machine Translation [1.0] 手話機械翻訳(SLMT)は、NLPの分野における複雑なタスクである。
効果的なユーザ関与は、共同創造を通じて対処できる課題である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:58:07 GMT)
Conservation Laws For Every Quantum Measurement Outcome [1.0] 量子力学の保存法則は、その統計的定式化を超えるように書き換えるべきである。
保全は,関心のシステムとその関連する参照の枠組みのレベルにおいて局所化可能であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:51:08 GMT)
Building a Software Stack for Quantum-HPC Integration [0.9] 本稿では,現在の中間スケール量子デバイスと将来のフォールトトレラント量子コンピュータの両方をサポートするハードウェア非依存のソフトウェアフレームワークを提案する。
アーキテクチャには、量子ゲートウェイインターフェース、リソース管理のための標準化されたAPI、堅牢なスケジューリングメカニズムが含まれている。
主なイノベーションは、(1)量子および古典的なリソースを効率的にコーディネートする統一されたリソース管理システム、(2)ハードウェア固有の詳細を抽象化する柔軟な量子プログラミングインタフェース、(4)量子回路最適化と実行のための包括的なツールチェーンである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:18:45 GMT)
Towards quantum error correction with two-body gates for quantum registers based on nitrogen-vacancy centers in diamond [0.9] 本稿では,適応型XYシーケンスによって生成されるゲートの忠実度と実行速度のトレードオフをバランスさせる最適な実行時間を決定する手法を提案する。
我々は、核スピン環境をカラーセンターレジスタ内の量子誤差補正のための符号空間として利用する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:10:47 GMT)
Penalized Principal Component Analysis Using Smoothing [0.9] PCAによって計算される主成分は、伝統的にゲノムデータの次元性を減らしたり、集団の成層化を補正するために用いられる。
本稿では、最適化問題として第一固有ベクトルの計算を再構成するペナル化固有値問題(PEP)について検討する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:47:00 GMT)
A Survey On Large Language Models For Code Generation [0.9] 大規模言語モデル(LLM)は多くの分野においてその顕著な能力を示している。
この調査は、LLMがユーザに対して、技術的背景に関係なく、ヒューマン言語を使用して実行可能なコードを自動的に生成する方法に焦点を当てている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:17:30 GMT)
Towards Practical Quantum Neural Network Diagnostics with Neural Tangent Kernels [0.8] 量子ニューラルネットワーク(QNN)の性能診断にQNTK(Quantum Neural Tangent Kernel)を用いるためのフレームワークを提案する。
評価したQNTKのスペクトルから,平均トレーニング誤差に対する臨界学習率と特性減衰時間を推定できることを示す。
次に、QNTKに基づくカーネル公式を用いて、研究中の量子モデルの予測推論能力である1次近似までの分析を行う方法を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:02 GMT)
Boolean-aware Attention for Dense Retrieval [0.8] ブール演算子に基づいてトークンフォーカスを調整する新しいアテンション機構(例えば、 and, not)を提案する。
我々のモデルは専門的なブールの専門家を採用しており、それぞれが演算子固有のコンテキストに対する注意を増幅または抑えるように調整されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:23:08 GMT)
Comparative Analysis of OpenAI GPT-4o and DeepSeek R1 for Scientific Text Categorization Using Prompt Engineering [0.8] GPT-4o(OpenAIによる)とDeepSeek R1を使用して、文を関係カテゴリに分類する。
DeepSeek R1は、ベンチマークデータセットでテストされているが、科学的テキスト分類のパフォーマンスはまだ明らかにされていない。
本課題に特化して設計された新しい評価手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:09:35 GMT)
Enhanced Optimization Strategies to Design an Underactuated Hand Exoskeleton [0.8] 本研究は,不動手外骨格(U-HEx)の設計過程について述べる。
この最適化は、遺伝的アルゴリズム、ビッグバン・ビッグCrunchアルゴリズム、および多目的最適化のためのそれらのバージョンに依存している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:14:06 GMT)
Machine Learning Applications to Diffuse Reflectance Spectroscopy in Optical Diagnosis; A Systematic Review [0.8] 本研究はPRISMAガイドラインに従って実施され,77個の研究が検索され,詳細な分析が行われた。
拡散反射分光法と機械学習は、臨床応用において組織分化に強い可能性を秘めているが、より厳密な試料成層化とin-vivoバリデーションと説明可能なアルゴリズム開発が今後必要である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:10:16 GMT)
Forecasting Frontier Language Model Agent Capabilities [0.7] 言語モデル(LM)の下流能力を予測する6つの予測手法を評価する。
計算やモデルリリース日などの入力メトリクスからベンチマークスコアを直接予測する"ワンステップ"アプローチや、クロスベンチマークパフォーマンス(PC-1)や人間による競争力のあるElo評価といった中間メトリックを最初に予測する"ツーステップ"アプローチを採用しています。
当社の予測では,2026年初めまでに,能力の低い非特殊化LMエージェントがSWE-Bench Verifiedで54%,最先端LMエージェントが87%の成功率に達すると予測されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:11:16 GMT)
Causal Discovery over High-Dimensional Structured Hypothesis Spaces with Causal Graph Partitioning [0.7] 因果発見により、一般化された方法で因果関係と効果関係の集合として機構を推測することができる。
提案アルゴリズムは,生物学的に調整された合成ネットワークやネットワークに対して,最大104ドルの変数に対して,同等の精度と解法を実現できることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:49:15 GMT)
Geo-Semantic-Parsing: AI-powered geoparsing by traversing semantic knowledge graphs [0.7] ジオ・セマンティック・パーシング(Geo-Semantic-Parsing, GSP)と呼ばれる新しいジオパーシングとジオタグ技術を導入する。
GSPは自由テキストで位置参照を特定し、対応する座標を抽出する。
我々は、約10kのイベント関連ツイートを含むよく知られた参照データセット上で、GSPを評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:30:23 GMT)
Routing algorithm within the multiple non-overlapping paths approach for quantum key distribution networks [0.7] 量子鍵分布(QKD)ネットワークのための新しい鍵ルーティングアルゴリズムを開発した。
6ノードと10ノードからなる2つのQKDネットワークモデル上で,本アルゴリズムのテスト結果を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:28:42 GMT)
Leray-Schauder Mappings for Operator Learning [0.7] 結果として得られる手法は、(おそらく非線形な)作用素の普遍近似であることを示す。
提案手法の有効性を2つのベンチマークデータセットで示し,その結果がアートモデルに匹敵することを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:17:54 GMT)
Survey Perspective: The Role of Explainable AI in Threat Intelligence [0.7] 我々は、SOCアナリストがAIベースのアラートをどのようにナビゲートするかに関する調査の結果と分析を示す。
我々は,XAIに強化されたセキュリティアラートシステムに対して,実用的な設計勧告を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:39:15 GMT)
Can (A)I Change Your Mind? [0.7] 研究はすべてヘブライ語で行われ、200人が参加した。
議論を呼んでいる民事政策の話題に対する LLM と人間の介入者の説得的影響を評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:54 GMT)
Fat-Tree QRAM: A High-Bandwidth Shared Quantum Random Access Memory for Parallel Queries [0.7] 本稿では,複数の量子クエリを同時にパイプライン化可能な新しいクエリアーキテクチャであるFat-Tree QRAMを紹介する。
Fat-Tree QRAMは$O(log (N))$Independent query in $O(log (N))$ time using $O(N)$ qubits.
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:27:59 GMT)
Surface Morphology Assisted Trapping of Strongly Coupled Electron-on-Neon Charge States [0.7] 単一電子は自由ネオン表面に閉じ込められ、回路量子電気力学(回路QED)アーキテクチャによって操作される。
共振器のトレンチ深さと基板表面特性がeNe帯電状態の形成とマイクロ波共振器との結合に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:59 GMT)
Relating Piecewise Linear Kolmogorov Arnold Networks to ReLU Networks [0.7] Kolmogorov-Arnold Networksは、次元の呪いを克服し、解釈可能性のメリットを持つ、ニューラルネットワークアーキテクチャの新しいファミリーである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:15:56 GMT)
Federated Granger Causality Learning for Interdependent Clients with State Space Representation [0.6] 我々は、グランガー因果関係を学習するための連合的なアプローチを開発する。
本稿では,サーバが学習したGranger因果関係情報を用いてクライアントモデルを拡張することを提案する。
また、フレームワークの集中的なオラクルモデルへの収束について研究する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:33:36 GMT)
$\mathbb{Z}_2$-gauging and self-dualities of the $XX$ model and its cousins [0.6] 1次元の$XX$格子モデルとその従兄弟について運動量のレンズを通して検討し、$U(1)$対称性を巻き付ける。
我々は従兄弟の自己双対性($XX$モデルやLevin-Guモデルなど)を適切なゲージ手順で導出する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:55:01 GMT)
Diverging entanglement of critical magnons in easy-axis antiferromagnets [0.6] 磁場下での易軸異方性を有する反強磁性体の不安定性について検討した。
相境界付近では、反強磁性交換相互作用、異方性、磁場の相互作用により、亜格子マグノン間の絡み合いが分岐する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:52:41 GMT)
Entanglement between accelerated probes in de Sitter [0.6] 曲線時空における加速量子プローブによる真空エンタングルメントの特性について検討する。
量子場との相互作用は、初期の非相関プローブ間の非局所的な相関を異なる方向に加速させる。
この結果から, エンタングルメントは, 加速度や曲率の変化によって独立に変化することが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:59:45 GMT)
Primer C-VAE: An interpretable deep learning primer design method to detect emerging virus variants [0.6] 畳み込みニューラルネットワークを用いた変分自動エンコーダフレームワークに基づくモデルであるPrimer C-VAEを開発した。
SARS-CoV-2を用いて98%の精度で変異を分類し,変異特異的プライマーを作成した。
このモデルはまた、E. coli や Shigella flexneri のようなより長い遺伝子配列を持つ生物のための効果的なプライマーも生成した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:17:19 GMT)
Decision-Focused Fine-Tuning of Time Series Foundation Models for Dispatchable Feeder Optimization [0.6] 我々は、時系列基礎モデルにおける決定中心の微調整を用いて、ディスパッチ可能なフィードア最適化問題に対するスケーラブルで効率的なソリューションを提供する。
少ない建築データに対するより堅牢な予測を得るために,モイライを最先端の基礎モデルとして用いている。
意思決定に焦点を絞ったモイライと最先端の古典的な予測に焦点をあてたモイライを比較すると、平均的な日費の9.45%の改善が観察できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:47:20 GMT)
Prognostics and Health Management of Wafer Chemical-Mechanical Polishing System using Autoencoder [0.6] Prognostics and Health Management Data Challenge (PHM) 2016は、半導体ウェハ研磨プロセスのコンポーネントの健康状態を追跡する。
最終的な目標は、コンポーネントの健康状態を監視してウエハ表面の摩耗を測定する能力を開発することである。
PHMデータセットにディープラーニングのようなデータ駆動アプローチを適用するのは簡単ではない。
自動エンコーダに基づくクラスタリングにより、トレーニングされた特徴空間が回帰処理により適していることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:48:34 GMT)
A Lightweight and Secure Deep Learning Model for Privacy-Preserving Federated Learning in Intelligent Enterprises [0.5] インテリジェントな企業では、データから洞察を抽出するために機械学習ベースのモデルが採用されている。
FedAnil+は、3つの主要なフェーズを含む、新しくて軽量でセキュアなFederated Deep Learning Modelである。
実験の結果、FedAnil+は推論や中毒攻撃に対して安全であり、精度が良いことが確認された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:51:13 GMT)
Perceptual Motor Learning with Active Inference Framework for Robust Lateral Control [0.5] 本稿では、高自動走行車(HAV)における横方向制御を強化するために、アクティブ推論(AIF)と統合された新しい知覚運動学習フレームワークを提案する。
PMLは知覚と行動のシームレスな統合を強調し、動的環境における効率的な意思決定を可能にする。
弊社のアプローチは、ディープラーニングをアクティブな推論原則と統合し、HAVが最小限のデータで車線維持を行い、異なる環境にまたがる広範な再訓練を行なわないようにする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:49:18 GMT)
Leveraging LLMs for Mental Health: Detection and Recommendations from Social Discussions [0.5] 本研究では,NLP(Natural Language Processing)とジェネレーティブAI(Generative AI)技術を活用し,精神疾患の特定と評価を行う包括的フレームワークを提案する。
我々はルールベースのラベリング手法と高度な事前学習NLPモデルを用いて、データからニュアンス付きセマンティック特徴を抽出する。
特殊なLarge Language Models (LLMs) の予測に基づいて、ドメイン適応型および汎用的なNLPモデルを微調整し、分類精度を向上させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:48:01 GMT)
Multidimensional Quantum Walks, with Application to $k$-Distinctness [0.5] 時間複雑性に対して$widetildeOleft(n3/4-1/4(2k-1)right)の新たな上限を与える。
この新しい手法を用いて,$O(n)$クエリと$O(n2)$タイムで溶接木を解く方法を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:08:50 GMT)
A Leaf-Level Dataset for Soybean-Cotton Detection and Segmentation [0.5] 大豆と綿花は、多くの国の農業セクターの主要な要因であり、実質的な経済的なリターンをもたらしています。
ボランティア植物や雑草を効果的に管理するには、高度な認識戦略が必要である。
我々は、複数の成長段階、雑草圧力、照明変動にまたがる商業農場から640個の高解像度画像を収集した。
我々はこのデータセットをYOLOv11を用いて検証し、重なり合う葉の正確な識別とセグメンテーションの最先端性能を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:41:06 GMT)
Deep Learning-Driven Malware Classification with API Call Sequence Analysis and Concept Drift Handling [0.5] 動的環境におけるマルウェアの分類は、概念の漂流に起因する重要な課題である。
本稿では,マルウェアの分類精度と適応性を向上させるため,遺伝的アルゴリズムにより強化されたディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:50:28 GMT)
Foundation Models -- A Panacea for Artificial Intelligence in Pathology? [0.5] ファンデーションモデル(FM)は、様々な下流タスクのための普遍的なソリューションとして広く提唱されている。
そこで我々は,前立腺癌診断とGleason gradingのための臨床レベルのAIに焦点を当てた。
11ヶ国15ヶ所で7,342人のコア針生検を行った。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:35:23 GMT)
Dissociating Artificial Intelligence from Artificial Consciousness [0.5] 機械学習と計算能力の発展は、人工知能が手の届くところにあることを示唆している。
コンピューターが人間と機能的に同等なら、私たちが意識しているように、視覚、音、思考を体験するだろうか?
我々は統合情報理論(IIT)を用いて、システムが意識的かどうかを判断するための原則的ツールを提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 17:15:10 GMT)
Q-NL Verifier: Leveraging Synthetic Data for Robust Knowledge Graph Question Answering [0.4] 高品質な合成クエリとNL翻訳を生成する方法であるQ-NL Verifierを提案する。
我々のアプローチは、構造化クエリの意味論的に正確な自然言語パラフレーズを生成するために、大きな言語モデルに依存している。
LC-QuAD 2.0ベンチマークを用いて行った実験から、Q-NL Verifierは、他のモデルからのパラフレーズや、人間による翻訳によく対応していることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:28:24 GMT)
Cavity enhancement of V2 centers in 4H-SiC with a fiber-based Fabry-Pérot microcavity [0.4] 4H-ケイ素炭化ケイ素(SiC)のシリコン空孔中心は長寿命の電子スピンを持ち、同時にスピン分解光遷移を持つ。
これらのインターフェースは量子ネットワークの重要な構成要素であり、セキュアな通信と分散量子コンピューティングを可能にすることを約束する。
本研究では, SiC膜内にV2中心をファイバベースのFabry-P'ero'tマイクロキャビティに統合する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:52:34 GMT)
Jailbreaking Generative AI: Empowering Novices to Conduct Phishing Attacks [0.4] 本稿では,最新のAIモデルであるChatGPT-4o Miniの社会工学的攻撃に対する誤用について検討する。
この結果から,経験の浅いユーザでも高度なフィッシングキャンペーンを実施できるという不安感が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:51:10 GMT)
Dementia Insights: A Context-Based MultiModal Approach [0.4] 早期発見は、病気の進行を遅らせる可能性のあるタイムリーな介入に不可欠である。
テキストと音声のための大規模事前学習モデル(LPM)は、認知障害の識別において有望であることを示している。
本研究は,テキストデータと音声データを最高の性能のLPMを用いて統合する,コンテキストベースのマルチモーダル手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:46:26 GMT)
Quantum memory assisted observable estimation [0.4] 量子情報処理の重要な課題は、多ビット可観測物の推定である。
本稿では,1量子ビット量子メモリへのアクセスを利用するCoherent Pauli Summationという新しい手法を提案する。
我々の研究は、単一長コヒーレンス量子ビットメモリが、基数タスクにおいてノイズの多い多量子ビットデバイスを動作させるのにどのように役立つかを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:21:20 GMT)
Exploiting Spatial Diversity in Earth-to-Satellite Quantum-Classical Communications [0.3] 空間的多様性を利用することで,絡み合い分布の有効性が向上することを示す。
我々は,大(典型的には符号化)と小(量子変調)のコヒーレント状態の移譲が,フェージングチャネルの多様性の活用の恩恵を受けることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:28:57 GMT)
Learning Surrogate Equations for the Analysis of an Agent-Based Cancer Model [0.3] がん細胞と免疫細胞との競合を調べるために、6つの異なるシナリオを実行しました。
次に、結合方程式学習を用いて、各シナリオに対する集団ベースの反応モデルを構築する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:33:27 GMT)
Stone Soup Multi-Target Tracking Feature Extraction For Autonomous Search And Track In Deep Reinforcement Learning Environment [0.3] センシング資源の管理は将来の軍用航空資産にとって簡単な問題ではない。
深層強化学習(DRL)を含む機械学習技術は有望なアプローチとして認識されている。
本稿では,ストーンスープ追跡フレームワークを特徴抽出器として活用した,深層強化学習訓練手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:29:56 GMT)
Entailment vs. Verification for Partial-assignment Satisfiability and Enumeration [0.3] 文学における部分的な割り当てによる公式満足度の定義は、普遍的に一意に定義されていないようである。
文献で暗黙的に使用される2つの別の概念、すなわち検証と含意を識別する。
前者がチェックしやすく、現在のほとんどの検索手順で暗黙的に使用されるが、後者は理論上の特性が優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:49:11 GMT)
Enhancing Social Media Rumor Detection: A Semantic and Graph Neural Network Approach for the 2024 Global Election [0.3] 本研究では,意味解析とグラフニューラルネットワークを組み合わせた新しい手法を提案する。
PolitiFactとTwitterから慎重にデータセットを収集し、政治的に関係のある噂に焦点を当てた。
我々のアプローチは、微調整されたBERTモデルを用いて、テキストコンテンツをベクトル化し、ツイートやコメントがノードであり、対話がエッジである有向グラフを構築することである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:49:33 GMT)
Minimal Variance Model Aggregation: A principled, non-intrusive, and versatile integration of black box models [0.2] 様々なモデルから予測を統合するデータ駆動型フレームワークであるMEVA(Minimal Empirical Variance Aggregation)を紹介する。
この非侵襲的モデルに依存しないアプローチは、貢献するモデルをブラックボックスとして扱い、多様な方法論からの出力を許容する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:41:55 GMT)
LiteGS: A High-Performance Modular Framework for Gaussian Splatting Training [0.2] LiteGSは高性能でモジュラーなフレームワークであり、ガウススプラッティングの効率性とユーザビリティを向上させる。
LiteGSはオリジナルの3DGS実装よりも3.4倍のスピードアップを実現し、メモリ使用量を約30%削減した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:52:02 GMT)
Slopaganda: The interaction between propaganda and generative AI [0.2] 本稿では、意図的に、設計上、集団の意思決定能力に影響を及ぼす戦略に焦点を当てる。
この論文がもたらす現象は,スロパガンダと呼ばれる比較的新しい戦略である。
今後数年で、このような「ジェネレーティブAIスロープ」は、複数の知識関連の(目覚しい)課題をもたらすだろう。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:06:02 GMT)
A Mapping Analysis of Requirements Between the CRA and the GDPR [0.2] CRA(Cyber Resilience Act)は、欧州連合(EU)が最近合意した法律である。
本稿では,新たな法律が既存の要件にどのように影響するかを実証し,法的要件を専門とする要件工学研究に貢献する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:42:12 GMT)
An Efficient Approach to Detecting Lung Nodules Using Swin Transformer [0.2] 肺癌はがんによる死亡率が最も高く、早期診断は生存率を高める可能性がある。
様々な肺検出モデルが存在するが、その多くが効率性に欠ける。
より効率的な2次元CTスライス手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:30:14 GMT)
A Scenario Analysis of Ethical Issues in Dark Patterns and Their Research [0.2] 本研究は、ダークパターンの倫理的懸念と、ソフトウェア工学と密接に関連する分野の研究を評価する。
評価は、ダークパターン自体だけでなく、研究、開発、展開に関わる研究倫理や適用倫理もカバーするように拡張されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:53:12 GMT)
Merging Hazy Sets with m-Schemes: A Geometric Approach to Data Visualization [0.1] 本稿では,密度認識正規化による計量の局所的な調整から生じる異性関数を集約するフレームワークを提案する。
確率的測度におけるtノルムやtノルムと密接に関連する手法のクラスであるm-スキームとしてこれらのアプローチを定式化する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:40:08 GMT)
Observation of the quantum equivalence principle for matter-waves [0.1] アインシュタインの相対性理論は同値原理に基づいている。
倫理原理は、相対論的時空のグローバルな記述にまで拡張される。
新しい干渉計は、量子理論と重力の間の界面のさらなる探索の扉を開く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:28:25 GMT)
Efficient or Powerful? Trade-offs Between Machine Learning and Deep Learning for Mental Illness Detection on Social Media [0.0] ソーシャルメディアプラットフォームは、うつ病、不安、自殺などの状況に関するユーザー生成の議論を捉え、メンタルヘルスのトレンドに関する貴重な洞察を提供する。
機械学習(ML)とディープラーニング(DL)モデルは、テキストデータからメンタルヘルス状態を分類するためにますます応用されている。
本研究では、ALBERTやGated Recurrent Units(GRU)といったディープラーニングアーキテクチャとともに、ロジスティック回帰、ランダムフォレスト、LightGBMを含む複数のMLモデルを評価する。
その結果,MLモデルとDLモデルでは,中規模データセットの分類性能が同等であることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 00:51:41 GMT)
vS-Graphs: Integrating Visual SLAM and Situational Graphs through Multi-level Scene Understanding [0.0] 本稿では,新しいリアルタイムVSLAMフレームワークであるビジュアルSグラフ(vS-Graphs)を紹介する。
視覚に基づくシーン理解と地図再構成と理解可能なグラフベース表現を統合している。
標準ベンチマークと実世界のデータセットの実験は、vS-Graphsが最先端のVSLAMメソッドより優れていることを示した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:15:11 GMT)
Voice Cloning for Dysarthric Speech Synthesis: Addressing Data Scarcity in Speech-Language Pathology [0.0] 本研究は, 変形性関節症患者の独特のパターンを再現した合成音声を生成するために, 音声クローニングについて検討する。
TORGOデータセットを用いて,言語病理学におけるデータ不足とプライバシー問題に対処する。
我々は,義歯の音声とコントロールスピーカーの音声を商業的プラットフォームでクローンし,性別に適合した合成音声を保証した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:44:49 GMT)
ViKANformer: Embedding Kolmogorov Arnold Networks in Vision Transformers for Pattern-Based Learning [0.0] 視覚変換器(ViT)はパッチ埋め込みに自己注意を適用して画像分類を行う。
本稿では,サブレイヤをKAN拡張に置き換えるViKANformerを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:10:26 GMT)
Variational quantum simulation: a case study for understanding warm starts [0.0] システムサイズで指数関数的に消滅する損失を特徴とするバレンプラトー現象は、変動量子アルゴリズムのスケーリングに挑戦する。
ここでは、より大きな損失分散を享受するために、解に近づく必要がある温暖化開始の可能性を探る。
量子リアルタイム進化のための短い深度回路を学習するための反復的変分法に着目して、ウォームスタートの可能性と限界を解明するためのケーススタディを行う。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:01:52 GMT)
Using (Not so) Large Language Models for Generating Simulation Models in a Formal DSL -- A Study on Reaction Networks [0.0] 我々は、自然言語をシミュレーションモデルに定式化するために、Large Language Modelがどのように使用されるかを評価する。
我々は,微調整と評価の基礎となる合成データ生成装置を開発した。
我々の微調整ミストラルモデルでは,84.5%のケースで地上の真理シミュレーションモデルを復元できる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:48:01 GMT)
Universal AI maximizes Variational Empowerment [0.0] 我々は、自己学習エージェントであるSelf-AIXIの既存のフレームワークの上に構築する。
ユニバーサルAIエージェントのパワーサーキング傾向は、将来の報酬を確保するための手段戦略として説明できる、と我々は主張する。
私たちの主な貢献は、これらのモチベーションがAIエージェントを体系的に高オプション状態を探し、維持する方法を示すことです。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:50:15 GMT)
Unconditionally stable time discretization of Lindblad master equations in infinite dimension using quantum channels [0.0] ガレルキン近似を用いて有限次元部分空間に発展を投影することは本質的に剛性をもたらすことを示す。
我々は,無限次元に適応した時間離散化のための明示的な数値スキームのファミリーの収束を提案し,確立する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:24:49 GMT)
Uncertainty Representation in a SOTIF-Related Use Case with Dempster-Shafer Theory for LiDAR Sensor-Based Object Detection [0.0] LiDARセンサによる物体検出の不確かさは、環境変動とセンサ性能の限界から生じる。
Dempster-Shafer Theory (DST) は、検出結果を表すための識別フレーム(FoD)を構築するために用いられる。
イェーガーの組合せ規則は、複数の情報源の矛盾する証拠を解決するために用いられる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:13:51 GMT)
Triple-Stream Deep Feature Selection with Metaheuristic Optimization and Machine Learning for Multi-Stage Hypertensive Retinopathy Diagnosis [0.0] 高血圧性網膜症(英: hypertensive retinopathy, HR)は、早期に診断されなかった場合、永久的な視力喪失を引き起こす重度の眼疾患である。
本研究はHR診断精度を高めるための3段階的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:39:46 GMT)
Tracking chirality in photoelectron circular dichroism [0.0] 光電子円二色性(PECD)では、分子のキラリティが光電子にどのように、いつインプリントされるかを追跡することは一般的に困難である。
本稿では,PECDの簡単なモデルでシミュレーションを行い,ポテンシャルのキラリティー,電子波関数のキラリティー,光電子分布の異方性の間の定量的な関係を確立するためのキラリティー尺度を用いた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:06:01 GMT)
Tracking behavioural differences across chronotypes: A case study in Finland using Oura rings [0.0] 我々は、Ouraが製造したスマートリングを用いて、1年間にわたって19人の健康な参加者から詳細なデータを取得してきた。
参加者の3つのクロノタイプ群の経時的睡眠と活動パターンについて検討した。
睡眠中の睡眠時間, 月次調査応答時間, クロノタイプと, 個人が感じているストレスは, 個人的変動を考慮しつつ, 睡眠時間, 睡眠時間, 月次調査応答時間, およびクロノタイプに大きく関連していることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:57:32 GMT)
Towards net-zero manufacturing: carbon-aware scheduling for GHG emissions reduction [0.0] スコープ2エミッションは、グリッド電力の生産と消費に関連する間接的なエミッションである。
本研究では, スコープ2の排出削減を目的とした, 炭素を意識したフローショップスケジューリングモデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:06:54 GMT)
Towards Multi-Stakeholder Evaluation of ML Models: A Crowdsourcing Study on Metric Preferences in Job-matching System [0.0] 機械学習技術は多様な利害関係者に影響を与える。
アウトプットの質を評価するのに一大の指標は存在しない。
クラウドソーシングを用いて,参加者の異なる指標に対する嗜好について検討した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:51:33 GMT)
Timelike transitions in an atom by a mirror in light cone and Kruskal-Szekeres regions: a status of quantum equivalence [0.0] ミンコフスキー時空の近距離光円錐領域における無限反射鏡の存在下での2レベル原子の時間的遷移について検討した。
我々は励起確率が熱因子を含み、原子とミラーの分離に周期的であることを観察した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:53:24 GMT)
Time operator from parametrization invariance and implications for cosmology [0.0] 対応する量子作用素を定義し、その結果、消滅するハミルトニアンと正則に共役する。
宇宙論的な設定で導入された時間変数の一般的な式を導出する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:11:43 GMT)
The Post-Quantum Cryptography Transition: Making Progress, But Still a Long Road Ahead [0.0] 米国政府は、非国家安全保障システムだけで710億ドル(約7兆5000億円)の移行コストを見積もっており、2035年の厳しい期限とともに、既存の暗号システムのアップグレードを成功させるために、持続的な資金、研究、国際調整を必要としている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:09:02 GMT)
The Coherent Forward Scattering peak: a probe of non-ergodicity and symmetries in a quantum chaotic system [0.0] コヒーレントフォワード散乱(CFS)ピークは、強い局在の存在下で出現する。
CFSは非エルゴディディティの堅牢な定量マーカーである。
この研究は、量子カオスまたは乱れたシステムにおける非エルゴディディティと対称性を特徴づけるための新しい道を開く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:01:38 GMT)
TMIQ: Quantifying Test and Measurement Domain Intelligence in Large Language Models [0.0] 大規模言語モデル(LLM)を定量的に評価するベンチマークであるTMIQ(Test and Measurement Intelligence Quotient)を導入する。
TMIQは、SCPIコマンドマッチング精度、ランク付けされた応答評価、Chain-of-Thought Reasoning (CoT)など、詳細な評価のための包括的なシナリオとメトリクスを提供する。
各種LSMの試験では, SCPIコマンドマッチング精度は56%から73%, 一致した第1位スコアは約33%であった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:12:49 GMT)
Superscopes: Amplifying Internal Feature Representations for Language Model Interpretation [0.0] モデルの特徴を新しいコンテキストに増幅する手法であるSuperscopesを紹介する。
スーパースコープは、事前の手法が追加の訓練を必要とせずに全てを説明することができなかった内部表現の解釈を可能にする。
このアプローチは、LLMがコンテキストを構築し、複雑な概念を表現する方法に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:58:12 GMT)
Superconducting qubit based on a single molecule: the carbon nanotube gatemon [0.0] 本稿では,一分子,一次元カーボンナノチューブに基づくゲートモンのコヒーレント制御について述べる。
測定された量子ビットスペクトルはゲート電圧で調整することができ、ナノチューブの量子ドットの挙動を反映する。
我々の研究は、低次元量子導体における微細フェルミオン過程の研究の道を開いた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:38 GMT)
Statistical physics analysis of graph neural networks: Approaching optimality in the contextual stochastic block model [0.0] グラフニューラルネットワーク(GNN)は、グラフに関連するデータを処理するように設計されている。
GNNは、繰り返し集約ステップによって遠く離れたノードから情報を集めるのに苦労する可能性がある。
我々は,GCNのアーキテクチャが過度なスムーシングを避けるために,深さとともにスケールしなければならないことを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 09:55:10 GMT)
Speeding Up Quantum Measurement Using Space-Time Trade-Off [0.0] 本稿では,量子計測の高速化手法を提案する。
このスキームは、アシラリーシステムで測定されるシステムを絡める以前のプロトコルの上に構築されている。
ゲートノイズと読み出し誤差の数値モデリングにより,この手法が実験的不完全性に対して堅牢であることを検証する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:24:31 GMT)
Speed-accuracy relations for the diffusion models: Wisdom from nonequilibrium thermodynamics and optimal transport [0.0] 拡散モデルと呼ばれる生成モデルと非平衡熱力学の関連について論じる。
異なるノイズスケジュールと異なるデータを持つ拡散モデルの速度-精度関係の妥当性を数値的に説明する。
また,非保存力による不正確なデータ生成と実世界の画像データセットからのデータ生成への適用性を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:38:10 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [0.0] 大規模言語モデル(LLM)は、コードに関連するタスクにおいて顕著な機能を示した。
LLMが多様なプログラムを理解し処理する能力を考えると、汎用的なサロゲートモデルを構築する上で有望な方向性を示す。
SURGEは、1160ドル(約1万1000円)の価格問題で、8ドル(約8万3000円)の鍵となる側面をカバーしたベンチマークです。
オープンソースおよびプロプライエタリ LLM の実証分析を通じて,スケーリング法則,データ効率,予測精度を検討した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:26:12 GMT)
S-R2D2: a spherical extension of the R2D2 deep neural network series paradigm for wide-field radio-interferometric imaging [0.0] 近年,無線干渉計(RI)における画像形成のために,「高ダイナミックレンジ画像用残留-残留DNNシリーズ」のR2D2パラダイムが導入された。
広視野望遠鏡の球面撮像要求を満たすための球面撮像拡張S-R2D2を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:18:23 GMT)
Robustness to Geographic Distribution Shift using Location Encoders [0.0] 地理分布の変化は、トレーニングデータセットにおける地球上の位置の分布がテスト時に見られるものと異なるときに起こる。
本稿では、地理的分布シフトに対してより堅牢なトレーニングモデルに位置エンコーダを用いることを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:24:07 GMT)
RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow [0.0] RiboGenはRNA配列と全原子3D構造を同時に生成する最初のディープラーニングモデルである。
実験の結果,RiboGenは化学的に可塑性かつ自己持続的なRNAサンプルを効率的に生成できることがわかった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:19:11 GMT)
Rethinking Data: Towards Better Performing Domain-Specific Small Language Models [0.0] 本稿では,小言語モデル(LM)の微調整について述べる。
LMトレーニングパイプラインの各段階でのデータ品質を改善することで、これを実現する。
我々は、異なるデータサブセット上の異なるパラメータで微調整されたモデルをマージすることで、モデル一般化能力を向上させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:19:12 GMT)
Reservoir-engineered two-mode squeezing in an optomechanical cavity [0.0] 本研究では, ナノメカニカル共振器の絡み合いを, 放射圧を補助する圧縮磁場の量子状態伝達により最適化する手法を提案する。
システムは、機械共振器の同時冷却を可能にする、赤みがかったレーザー磁場によって駆動される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:24:12 GMT)
Renormalization and Low-Energy Effective Models in Cavity and Circuit QED [0.0] 量子ラビモデル(英: quantum Rabi model、QRM)は、キャビティと回路量子力学における光-物質相互作用の研究の基盤である。
我々は、より高い原子エネルギーレベルの効果的な影響を取り入れた再正規化QRMを導入する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:27:12 GMT)
Reconstruction of muon bundles in KM3NeT detectors using machine learning methods [0.0] KM3NeTコラボレーションは、地中海の海底にARCAとORCAニュートリノ検出器を設置している。
ARCAの焦点はニュートリノ天文学であり、ORCAはニュートリノ振動の研究に最適化されている。
どちらの検出器も既に中間状態にあり、貴重なデータを収集している。
この研究は、ミューオンバンドルの再構築のための機械学習モデルの可能性を探るものである。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:37:38 GMT)
R2VF: A Two-Step Regularization Algorithm to Cluster Categories in GLMs [0.0] 本稿では、一般化線形モデル(GLMs)において、名詞と順序のカテゴリーを効率的に融合する2段階の方法であるR2VF(R2VF)について紹介する。
R2VFは、最初に規則化された回帰を通じて、名目上の特徴を順序付きフレームワークに変換することで、モデルの複雑さと解釈可能性のバランスを取る。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:31:02 GMT)
Quantum gates between distant atoms mediated by a Rydberg excitation antiferromagnet [0.0] 中性原子の配列で接続された遠方の原子量子ビット間で量子ゲートを実装するための新しいプロトコルを提案する。
このプロトコルは、チャープレーザーパルスを用いてレイドバーグ励起の反強磁性状態に配列中の原子を断熱的に移動させることに基づいている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:46:40 GMT)
Quantum Search with the Signless Laplacian [0.0] 我々は、層状反強磁性材料で生じる可能性のある無サインラプラシアンを探索する。
いくつかのパラメータについて、ラプラシアンは3つのうち最速の探索アルゴリズムを出力し、より高速な量子アルゴリズムを開発するための新しいツールになり得ることを示唆している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:02:49 GMT)
Power and temperature dependent model for High Q superconductors [0.0] コプラナー導波管型超伝導共振器の内部品質係数の測定は、超伝導装置の損失を小さくする確立された方法である。
過剰な非平衡準粒子は、回路量子力学で使用される平面超伝導共振器の品質係数を制限することもできる。
ここでは、TLSと準粒子損失を同時に分離する共振器損失を評価するために、2温度・電力・温度依存モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:12:49 GMT)
PhishVQC: Optimizing Phishing URL Detection with Correlation Based Feature Selection and Variational Quantum Classifier [0.0] 本稿では、量子コンピューティングによって動機づけられた変分量子(VQC)を用いて、フィッシングURLの検出を改善することを提案する。
本稿では、量子マップとRealAmplitudeやEfficientSU2といった変分アンサーゼを組み合わせた量子モデルPhishVQCを提案する。
これは、フィッシング検出精度を改善するための量子機械学習の可能性を強調している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:28:01 GMT)
PATCH: a deep learning method to assess heterogeneity of artistic practice in historical paintings [0.0] ルネサンス期と近世の絵画は、主に見習いの工房を監督する師匠によって制作された。
異なるワークショップがどのように管理され、どのようにアートワークが作られたかは明らかになっていない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:25:43 GMT)
OrbID: Identifying Orbcomm Satellite RF Fingerprints [0.0] 本稿では、Orbcomm衛星形成への衛星通信におけるRFF(Radio Frequency Fingerprinting)に関する以前の研究を拡張した。
我々は、異なるSDRと位置を用いて、Orbcom衛星コンステレーションから8992474個のパケットを含む新しいデータセットを収集する。
我々は、星座内の異なる衛星を区別する場合のROC AUCスコア0.53、正衛星とSDRを区別する場合の0.98を達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:00:32 GMT)
Optimization in quantum metrology and entanglement theory using semidefinite programming [0.0] 両部量子系における局所ハミルトニアンのメトロジー性能を最適化する効率的な手法について議論する。
本稿では,量子フィッシャー情報をバイリニア形式で提示し,イテレーティブシーソー(ISS)法で最大化する。
我々は、同様の方法で解決できる量子情報理論の他の多くの問題を考察する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:42:26 GMT)
Open-source framework for detecting bias and overfitting for large pathology images [0.0] 数十億のデータサンプルを持つデータセットでトレーニングされた基礎モデルでさえ、過度な適合とバイアスにつながるショートカットを発生させる可能性がある。
ディープラーニングモデルをデバッグするための一般化されたモデルに依存しないフレームワークを提案する。
私たちのフレームワークはオープンソースツールとしてGitHubで利用可能です。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:52:53 GMT)
On the Development of Binary Classification Algorithm Based on Principles of Geometry and Statistical Inference [0.0] 本稿では,ベクトル,平面,ベクトル代数といった幾何学の原理を用いて二項分類アルゴリズムを構築する試みについて検討する。
このアルゴリズムは、データセットがマッピングされたハイパースペースを通してポイントを移動させることに重点を置いているため、移動点アルゴリズムと呼ばれている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:16:28 GMT)
On Compton ionization of a hydrogen atom by twisted photons [0.0] 平面波の代わりに円筒波を用いることは, 反応生成物の新しい角分布に繋がらないことを示す。
平面波の代わりに円筒波を用いることは, 反応生成物の新しい角分布に繋がらないことを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:05:53 GMT)
Noise2Score3D:Unsupervised Tweedie's Approach for Point Cloud Denoising [0.0] Noise2Score3Dはノイズデータから直接基礎となる点雲分布の勾配を学習する。
提案手法は,既存の教師なし手法における反復処理を回避するため,単一のステップで推論を行う。
本稿では,未知の雑音パラメータを推定できる基準であるTtal Variation for Point Cloudを紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:09:49 GMT)
Noise effects on the diagnostics of quantum chaos [0.0] 本稿では、スペクトル形成因子(SFF)、クリロフ複雑性(Krylov complexity)、時間外相関器(OTOCs)の3つの主要なツールに焦点を当て、ノイズが量子カオスの診断に与える影響について検討する。
強い雑音の限界では、SFF、二点相関関数、OTOCはカオス的振舞いの区別に効果がない。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 08:06:19 GMT)
Negative exchange interaction in Si quantum dot arrays via valley-phase induced $\mathbb{Z}_2$ gauge field [0.0] 磁場のない2電子Si量子ドットアレイにおいて、負の交換$J0$が実現可能であることを示す。
我々の研究は、交換ベースの量子コンピューティングのための新しいツールと、量子磁気の研究のための新しい設定を明らかにする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:26:20 GMT)
Magic State Distillation under Imperfect Measurements [0.0] 我々はMSDプロトコルにおける測定強度のしきい値の存在を示す。
非クリフォードゲートを持つCSS符号に基づくMSDプロトコルの場合、不完全測定の1次効果は、ターゲット状態にパウリノイズが偏っていることを証明している。
我々の研究は、不完全な測定ノイズ下でのフォールトトレラント量子コンピューティングの理解に寄与する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:27:47 GMT)
M-SCAN: A Multistage Framework for Lumbar Spinal Canal Stenosis Grading Using Multi-View Cross Attention [0.0] 本稿では,腰部脊柱管狭窄の診断を完全自動化する,新しい,効率的なディープラーニングフレームワークを提案する。
脊柱管狭窄症における経時的成績について,1,975例のユニークな研究結果を用いて検討した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:10:40 GMT)
Leap into the future: shortcut to dynamics for quantum mixtures [0.0] 強い反発性原子ガス混合物の長時間の力学に短時間でアクセスできることを示す。
映画プレーヤーのファストフォワードボタンが、観たい映画の一部に素早く届くようにしているように、それは未来への飛躍だ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:55:17 GMT)
Krylov shadow tomography: Efficient estimation of quantum Fisher information [0.0] 我々はKrylov部分空間法をシャドウトモグラフィーの枠組みに統合する。
KST(Krylov shadow tomography)と呼ばれるこの統合技術により、量子フィッシャー情報に非ポリノミカルな下界の厳密な階層を定式化することができる。
したがって、我々のKSTは、非ポリノミアルな下界だけでなく、QFI自体を推定するために、資源効率が高く、実験的に実現可能な道を開く。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 16:10:30 GMT)
Kohn-Sham inversion with mathematical guarantees [0.0] 正確なモロー・ヨシダ正規化定式化を用いて周期系の交換相関ポテンシャルを得る。
厳密な数学的原理と効率的な数値的実装との深い関係を明らかにする。
我々は,代表的バルク材料に対して,数学的に厳密な逆変換アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:24:48 GMT)
Interpretation of wave function by coherent ensembles of trajectories [0.0] 量子力学における波動関数のアンサンブル解釈を改訂する。
時空における量子軌道のアンサンブルのコヒーレンス(自動一致)を導入する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:31:00 GMT)
Inertial Torsion Noise in Matter-Wave Interferometers for Gravity Experiments [0.0] 慣性ねじりノイズ(ITN)は、薄線で吊り下げられた実験装置の回転運動から発生し、ランダムな外トルクを受ける。
実験ボックスを記述する一般化ランゲヴィン方程式から始まるITN雑音の解析式を提供する。
本研究は,フェムトグラム粒子を用いた次世代干渉計測実験における効果の大きさを推定する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:51:48 GMT)
Illuminant and light direction estimation using Wasserstein distance method [0.0] 本研究では,ワッサーシュタイン距離を用いて画像中の照度と光方向を推定する手法を提案する。
多様な画像に対する実験は、支配的な光源を検出し、その方向を推定する手法の有効性を示す。
このアプローチは、光源のローカライゼーション、画像の品質評価、オブジェクト検出の強化において、将来性を示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:20:09 GMT)
Identity documents recognition and detection using semantic segmentation with convolutional neural network [0.0] 本研究の目的は,提案手法の有効性を実証し,品質指標を得ることである。
本研究の方法論は,モバイルID文書ビデオデータセットに基づいて訓練されたディープラーニング検出モデルを評価することである。
本報告では、結合(IoU)の交点値が0.8の0.75以上の精度を報告している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 01:13:28 GMT)
Hyperspectral image segmentation with a machine learning model trained using quantum annealer [0.0] 本研究では, 量子アニールの応用が, トレーニングモデルにおけるエネルギーコストの低減につながる可能性について検討した。
量子アニールを用いてトレーニングしたモデルは、代替アルゴリズムを用いてトレーニングしたモデルより優れているか、少なくとも同等であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:57:06 GMT)
How Do Consumers Really Choose: Exposing Hidden Preferences with the Mixture of Experts Model [0.0] 本研究では、消費者を動的にセグメント化する機械学習駆動の代替手段として、Mixture of Experts(MoE)フレームワークを紹介した。
MoEは不均一な嗜好をモデル化するための柔軟な非パラメトリックなアプローチを提供する。
大規模小売データを用いた実証検証は、MoEが予測精度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:17:40 GMT)
Hilbert space-valued Gaussian processes, and quantum states [0.0] 演算子評価されたカーネルとその分解の研究において、新しい結果と新しい方向性を提供する。
私たちのアプローチは、より明示的な実現と新しい結果、そして新しいアプリケーションを提供します。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:14:39 GMT)
Hebbian learning the local structure of language [0.0] 我々は、顕微鏡的制約にインスパイアされた効果的な人間の言語モデルの基礎を導出する。
1)テキストから単語をトークン化する学習ニューロンの階層構造(すなわちWhatyoudowhenyoureadthis)と、(2)トークン化者の学習したシマンティックなパターンをシマンティックなトークンに結合する追加ニューロンの2つの部分を持つ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:15:57 GMT)
Geodesic Length Distribution in Sparse Network Ensembles [0.0] 超臨界状態における巨大成分の測地線長の解析的分布を導出する。
ブロックモデルやドット積グラフ,ランダムな幾何グラフ,グラフなど,広く使用されているネットワークモデルに対して,結果を提供する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:46:04 GMT)
Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection [0.0] オブジェクト検出のためのドメイン一般化(DG)は、目に見えないシナリオにおける検出器の性能を高めることを目的としている。
近年の拡散モデルは多様なシーン生成において顕著な機能を示した。
本稿では,拡散モデルの一般化能力を検出器が継承できる効率的な知識伝達フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:36:22 GMT)
Fine-Tuning Small Language Models for Domain-Specific AI: An Edge AI Perspective [0.0] 本稿では,これらの制約を直接対象とするShakti-100M,Shakti-250M,Shakti-500Mを紹介する。
効率的なアーキテクチャ、量子化技術、責任あるAI原則を組み合わせることで、Shaktiシリーズはスマートフォン、スマートアプライアンス、IoTシステムなどのデバイス上でのインテリジェンスを可能にする。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:53:55 GMT)
False vacuum decay in triamond lattice gauge theory [0.0] 偽真空から真真空への遷移は、多くの文脈における実時間的な関心の現象である。
リアルタイム現象を達成するために、量子コンピュータのためのハミルトン格子法が開発されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:56:30 GMT)
Fall Detection from Indoor Videos using MediaPipe and Handcrafted Feature [0.0] 人体骨格から抽出した手工芸品を用いた屋内環境の転倒検出手法を提案する。
UR転倒検出の結果は,本モデルの優位性を示している。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:38:49 GMT)
Evaluating Stenosis Detection with Grounding DINO, YOLO, and DINO-DETR [0.0] 本研究ではARCADEデータセット上での最先端オブジェクト検出モデルの性能を評価する。
モデルは、IoU(Intersection over Union)、AP(Average Precision)、AR(Average Recall)などのCOCO評価指標を用いて評価される。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:38:54 GMT)
Entanglement dynamics of many-body quantum states with evolving system conditions [0.0] 多体量子系の純粋な状態の絡み合い解析には、その密度行列/状態行列に関する事前情報が必要である。
多パラメトリックガウスアンサンブルでモデル化できる物理ハミルトニアンを考える。
理論的には、その固有状態に対する状態アンサンブルを導出し、その絡み合い統計に対する様々なシステム条件の影響を分析する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:07:01 GMT)
Enforced Gaplessness from States with Exponentially Decaying Correlations [0.0] 指数関数的に崩壊する相関でさえ、ギャップレス性を示唆することを示す。
我々の発見は、ギャップ化された基底状態が属するヒルベルト空間の部分集合を特定することに意味がある。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:37 GMT)
Eigenstate thermalization in spin-1/2 systems with SU(2) symmetry [0.0] 拡張スピン-1/2ハイゼンベルク鎖の固有状態における可観測物の対角行列および対角行列要素について検討した。
我々は可積分かつ可積分な状態を探究し、ハミルトニアンのSU(2)対称性を保ち、それを破る可観測性を考える。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:59:58 GMT)
Efficient Learning Under Density Shift in Incremental Settings Using Cramér-Rao-Based Regularization [0.0] この研究は、データが時間的に分散している問題に対して、分散密度推定の角度を取る。
バッチでデータを処理し、ニューラルネットワークがバッチをトレーニングデータとして扱うことを可能にする。
C2A$は、最先端のメソッドに対して最大で19%の精度を達成する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:42:17 GMT)
Direct Speech to Speech Translation: A Review [0.0] 音声音声翻訳(S2ST)は,グローバル通信ギャップを埋める変換技術である。
自動音声認識(ASR)、機械翻訳(MT)、テキスト・トゥ・スピーチ(TTS)コンポーネントに依存する従来のカスケードモデルは、エラーの伝搬、遅延の増加、韻律の喪失に悩まされている。
直接S2STモデルは話者識別を保持し、レイテンシを低減し、発声特性と韻律を保存することにより翻訳自然性を改善する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 06:48:22 GMT)
Digital Dybbuks and Virtual Golems: AI, Memory, and the Ethics of Holocaust Testimony [0.0] 生存者証言の歴史的・現代的利用を概観し、MVPP(Minimally Viable Permissibility Principle)を適用した。
MVPPは、デジタル複製のリスクを評価するための分析フレームワークである。真の存在、同意、肯定的な価値、透明性、害リスク軽減の5つの中核的なコンポーネントを含んでいる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 10:05:36 GMT)
Detecting Stylistic Fingerprints of Large Language Models [0.0] 大型言語モデル(LLM)は、異なる書体スタイルで書くように促された場合でも、区別され一貫したスタイルの指紋を持つ。
そこで本研究では,テキストを生成したモデルのスタイリスティックな指紋に基づいて,テキストを分類する手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:33:10 GMT)
Deep Reinforcement Learning for Controlled Traversing of the Attractor Landscape of Boolean Models in the Context of Cellular Reprogramming [0.0] 我々は,再プログラミング戦略の同定を容易にする深層強化学習に基づく新しい計算フレームワークを開発する。
我々は,非同期更新モード下でのBNとPBNのフレームワークに対するセルリプログラミングの文脈における制御問題を定式化する。
また,擬似トラクタの概念と,訓練中に擬似トラクタの状態を特定する手順についても紹介する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 12:22:02 GMT)
Counterdiabatic Driving with Performance Guarantees [0.0] 変分非依存型CD拡張法の提案と解析を行う。
拡張順序で指数関数的に収束することを示す。
特に、量子速度制限によって決定される時間は、所望の基底状態を作成するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:00:01 GMT)
Correcting Mode Proportion Bias in Generalized Bayesian Inference via a Weighted Kernel Stein Discrepancy [0.0] 一般化ベイズ推論(GBI)は、従来の可能性の代わりに様々な損失関数を用いて事前分布を更新するための柔軟なフレームワークを提供する。
KSD-Bayesは、マルチモーダル後肢の過敏性や十分に分離されたモードなど、致命的な病態に悩まされている。
我々は,マルチモーダル構造を効果的に捉えつつ,計算効率を維持する重み付きKSD法を提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:44:45 GMT)
Constrained multi-fidelity Bayesian optimization with automatic stop condition [0.0] 制約付きコスト対応多要素BO(CMFBO)フレームワークを開発した。
我々のゴールは、安価な低忠実度源を有効性を確保しつつ利用することで、全体のサンプリングコストを最小化することである。
また,BOの収束評価に伴う長期的課題に対処する系統的な停止基準を導入する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:13:35 GMT)
Confinement-induced unatomic trimer states in mass-imbalanced systems [0.0] 我々は,7$Li$-23$Na$_2$,7$Li$-87$Rb$_2$,7$Li$-133$Cs$_2$の化合物について検討した。
接触の急激な増加は、エフィモフ政権と非原子的体制の移行の象徴となる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:24:53 GMT)
Conditional Electrocardiogram Generation Using Hierarchical Variational Autoencoders [0.0] 我々は、ECG信号生成(cNVAE-ECG)のための条件付きヌーヴォーVAEモデルを提案する。
本稿では,ECG信号生成(cNVAE-ECG)のための公用条件付きVAEモデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:30:36 GMT)
Comments on: "Introduction to the Absolute Brightness and Number Statistics in Spontaneous Parametric Down-Conversion" (2019 J. Opt. 21, 043501) [0.0] 自発パラメトリックダウン・コンバージョン(SPDC)から光子対の絶対生成率を導出する。
電磁界のキャビティモードの量子化次元が非線形媒質の次元と混同される本研究における表記の悪用を補正する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:23:18 GMT)
ChatGPT for President! Presupposed content in politicians versus GPT-generated texts [0.0] 本研究では,ChatGPT-4の政治談話における言語戦略を再現する能力について検討した。
コーパスに基づく実用分析を用いて、ChatGPTがこれらの説得的戦略をいかにうまく模倣できるかを評価する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:48:04 GMT)
Category-level Meta-learned NeRF Priors for Efficient Object Mapping [0.0] PreNOMは、事前ベースで効率的なニューラルオブジェクトマッピングである。
カテゴリレベルの先行とオブジェクトレベルのNeRFを統合して、再構築効率を向上させる。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:23:37 GMT)
Categorical relations and bipartite entanglement in tensor cones for Toeplitz and Fejér-Riesz operator systems [0.0] 本稿では, ナミオカとフェルプスの意味で, テンソル円錐の分離性と絡み合いを理解することを目的とする。
特に興味があるのが、Toeplitz と Fej'er-Riesz 作用素系である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 20:16:00 GMT)
Bomfather: An eBPF-based Kernel-level Monitoring Framework for Accurate Identification of Unknown, Unused, and Dynamically Loaded Dependencies in Modern Software Supply Chains [0.0] 依存性追跡手法の不正確さは、現代のソフトウェアサプライチェーンのセキュリティと整合性を損なう。
本稿では,拡張バークレーパケットフィルタ(eBPF)を利用したカーネルレベルのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 22:32:59 GMT)
Beyond QA Pairs: Assessing Parameter-Efficient Fine-Tuning for Fact Embedding in LLMs [0.0] 本稿では,質問応答対をFactualクラスとConceptualクラスに分類することで,微調整プロセスの改善に焦点をあてる。
2つの異なるLlama-2モデルはこれらの分類に基づいて微調整され、GPT-3.5 TurboやGeminiのような大型モデルを用いて評価される。
以上の結果から,概念データセットでトレーニングされたモデルは,実データセットでトレーニングしたモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 03:26:30 GMT)
Beyond Born-Oppenheimer Green's function theories: absolute and relational [0.0] 我々は、クーロン多体問題を解くために、量子場理論の多体グリーン関数アプローチを考える。
ボルン=オッペンハイマー・グリーン(英語版)の函数論は自然界において絶対的であり、非還元ハミルトニアンに基づいている。
このアプローチに続く問題に動機づけられた我々は、自然界のリレーショナルであるグリーン関数論を減らした。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 11:14:19 GMT)
Automated Retinal Layer and Fluid Segmentation and Cross-sectional Analysis using Spectral Domain Optical Coherence Tomography Images for Diabetic Retinopathy [0.0] 深部神経回路を用いて網膜層10層,網膜内流体,高反射性(HRF)の分画を訓練した。
SwinUNETRはセグメンテーションの精度が最も高く、VM-Unetは特定の層で優れていた。
解析の結果, NPDRとPDRの厚みの差が明らかとなり, 層厚と視力の相関が認められた。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 07:23:56 GMT)
Attention Condensation via Sparsity Induced Regularized Training [0.0] 自己注意は、コンテキストウィンドウが拡大するにつれて、トランスフォーマーの推論時間を支配する。
我々は,大規模言語モデルにおける注意分散の理論的枠組みを拡張した。
カスタマイズされた損失関数は、注目行列の上位要素の数を制限することで、空間性を強制するように設計されている。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:09:13 GMT)
Asymptotic Freedom of Two Heavy Impurities in a Bose-Einstein Condensate [0.0] ボース=アインシュタイン凝縮体に浸漬された2つの重い不純物を考え、ウィルソン再正規化を用いて自己エネルギーを計算する。
ポーラロンスペクトルは単一の不純物に対する結果に収束し、フェシュバッハ共鳴を横切る魅力的な反発的交叉を示す。
我々は、不純物が十分に近接している限り、不純物-ボソン相互作用が魅力的である場合でも、反発性-支配性ポラロンが存在することを強調する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 05:35:59 GMT)
An Approach for Air Drawing Using Background Subtraction and Contour Extraction [0.0] 本研究では,空気中の指を動かして画面に描画する画像処理技術を用いて,空気描画のための新しい手法を提案する。
このアプローチは、新しい入力方法として手話、空気中の描画、空気中の「書き方」といった幅広い応用に有効である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 13:08:44 GMT)
Aerial Infrared Health Monitoring of Solar Photovoltaic Farms at Scale [0.0] 太陽光発電(PV)ファームは、地球規模の再生可能エネルギー生成の主要な源となっているが、その真の運用効率は、大規模には分かっていないことが多い。
我々は、北米の太陽光発電施設の大規模空中赤外検査のための包括的でデータ駆動の枠組みを提示する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 23:32:21 GMT)
Active Alignments of Lens Systems with Reinforcement Learning [0.0] センサ出力の画素空間内でのみ学習する強化学習(RL)手法を提案する。
我々は、広範囲にわたるベンチマーク研究を行い、我々のアプローチが、速度、精度、堅牢性において他の手法を超えることを示す。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 21:57:08 GMT)
A projected complex Langevin sampling method for bosons in the canonical and microcanonical ensembles [0.0] 本稿では, 複素ランゲヴィン数値サンプリング法, 架空のランゲヴィン力学スキームを提案する。
複雑な値の自由度と関連する符号確率にもかかわらず、投影されたCL法は実数値のランゲヴィン過程の自然な拡張として成功する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 18:38:10 GMT)
A network psychometric analysis of maths anxiety factors in Italian psychology students [0.0] 本研究は,3因子MAS-UK尺度をイタリア語で翻訳し,新しいツールMAS-ITを開発した。
324人のイタリア人大学生のサンプルがMAS-ITを完成させた。
CFAの結果,元のMAS-UK3因子モデルはイタリアのデータに合わないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:11:16 GMT)
A Zero-Shot Learning Approach for Ephemeral Gully Detection from Remote Sensing using Vision Language Models [0.0] エフェメラル・グリー(Ephemeral gullies)は、土壌浸食の主な原因である。
従来の研究は、リモートセンシング画像から一時的結節の自動検出に成功しなかった。
本研究は, 一時的消化管検出のためのパイプラインを3つ提案し, 評価した。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 04:36:25 GMT)
A Reconfigurable Stream-Based FPGA Accelerator for Bayesian Confidence Propagation Neural Networks [0.0] 脳にインスパイアされたアルゴリズムは、古典的なディープラーニング手法に代わる魅力的な、新たな選択肢だ。
BCPNNは、機械学習と計算神経科学研究の両方にとって重要なツールである。
BCPNNは、他のモデルと比較して学習やメモリリコールといったタスクで最先端のパフォーマンスに達することができる。
我々は、Xilinx Vitis High-Level Synthesis (HLS) フローを用いたFPGA(Field-Programmable Gate Array)を用いて、BCPNN用のカスタムストリームベースのアクセラレータを設計する。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 14:06:43 GMT)
A Lean Dataset for International Math Olympiad: Small Steps towards Writing Math Proofs for Hard Problems [0.0] リーンの残りのIMO問題に対する完全な、オリジナルの公式な証明を書いています。
この取り組みは,5,880行のリーン証明を作成することで,現在パブリックドメインにある証明の可用性を拡大するものだ。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 02:41:10 GMT)
A Deep Autoregressive Model for Dynamic Combinatorial Complexes [0.0] DAMCC(Deep Autoregressive Model for Dynamic Combinatorial Complexes)は,動的コンプレックス(CC)を生成するために設計された最初のディープラーニングモデルである。
従来のグラフベースのモデルとは異なり、CCは高次のインタラクションをキャプチャし、ソーシャルネットワーク、生物学的システム、進化するインフラを表現するのに理想的である。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 19:15:40 GMT)
"FRAME: Forward Recursive Adaptive Model Extraction-A Technique for Advance Feature Selection" [0.0] 本研究では,新しいハイブリッド手法であるフォワード再帰適応モデル抽出手法(FRAME)を提案する。
FRAMEは、フォワード選択と再帰的特徴除去を組み合わせて、さまざまなデータセットにおける機能選択を強化する。
その結果、FRAMEは下流の機械学習評価指標に基づいて、常に優れた予測性能を提供することが示された。
論文参考訳(メタデータ) (Mon, 03 Mar 2025 15:45:44 GMT)