Reinforcement Learning for Reasoning in Large Language Models with One Training Example [117.9] 1つのトレーニング例(1ショットRLVR)を用いた強化学習は,大規模言語モデル(LLM)の算数推論能力の向上に有効であることを示す。
1ショットRLVRにおける興味深い現象として、クロスカテゴリの一般化、自己回帰の頻度の増加、テスト性能の向上の持続などを挙げる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:02:36 GMT)
VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction [114.4] 音声はマルチモーダル対話システムにおいて重要な役割を担い、視覚と音声の両方にハイパフォーマンスを実装することは依然として重要な課題である。
視覚情報と音声情報の両方を段階的に学習する多段階学習手法を提案する。
提案手法は, 視覚言語能力の強いだけでなく, ASR と TTS モジュールを分離することなく, 音声音声対話を効率的に行うことができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:32:10 GMT)
DeepAgent: A General Reasoning Agent with Scalable Toolsets [111.6] DeepAgentは、自律的な思考、ツール発見、アクション実行を実行するエンドツーエンドのディープ推論エージェントである。
長期にわたる相互作用の課題に対処するために,過去の相互作用を構造化エピソード,動作,ツール記憶に圧縮する自律的メモリ折り畳み機構を導入する。
LLMシミュレートされたAPIを活用し、ツール呼び出しトークンにきめ細かいクレジットを割り当てるツールコールアドバンテージ属性を適用した、エンドツーエンドの強化学習戦略であるToolPOを開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:24:01 GMT)
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [111.5] マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。
本稿では,MLLM 評価ベンチマーク MME について述べる。
知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:45:36 GMT)
ResearchGPT: Benchmarking and Training LLMs for End-to-End Computer Science Research Workflows [109.3] CS-54k(CS-54k)は、コンピュータ科学におけるQ&Aペアの高品質なコーパスである。
CS-4kは、科学研究を支援するAIの能力を評価するためのベンチマークである。
CS-50kは大規模なトレーニングデータセットである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:43:46 GMT)
How to Train Your LLM Web Agent: A Statistical Diagnosis [96.9] LLMウェブエージェントのポストトレーニングにおける計算割当に関する統計学的基礎研究について述べる。
提案手法では,Llama 3.1 8Bの学生を対象に,教師付き微調整(SFT)とオンライン強化学習を用いて,Llama 3.3 70Bの教師を模倣する2段階のパイプラインを用いた。
以上の結果から,SFTとオンラインRLの組み合わせは,WorkArenaとMiniWob++のいずれにおいても,単独でのアプローチよりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:45:40 GMT)
SAMA: Towards Multi-Turn Referential Grounded Video Chat with Large Language Models [93.7] ビデオにおけるきめ細かい時間的理解の獲得は、現在のビデオ大マルチモデル(ビデオLMM)にとって大きな課題である。
私たちは、データセット、モデル、ベンチマークの3つの中核的な側面に貢献しています。
まず,ビデオ理解,グラウンドニング,マルチターンビデオチャットの共用学習を実現するため、15Kビデオからなる大規模データセットであるSAMA-239Kを紹介する。
第2に,広義の時間的コンテキストアグリゲータとセグメンションモデルを組み合わせたSAMAモデルを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:14:16 GMT)
Beyond Accuracy: Dissecting Mathematical Reasoning for LLMs Under Reinforcement Learning [93.0] 強化学習(Reinforcement Learning, RL)は, 複雑な推論タスクにおいて, 言語モデルの性能向上のための主要なパラダイムとなっている。
SPARKLE(SPARKLE)は、3つの重要な次元にわたるRLの効果を詳細に解析するフレームワークである。
我々は、RL信号と混合品質の推論トレースを産出しない難題が、依然としてトレーニングに有効であるかどうかを調査する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:49:58 GMT)
Reinforced Latent Reasoning for LLM-based Recommendation [92.6] 大きな言語モデル(LLM)は、複雑な問題解決タスクにおいて印象的な推論能力を示している。
既存の手法は通常、明示的なチェーン・オブ・シント(CoT)データによる微調整に依存している。
本研究では, 明示的なCoT推論から, コンパクトで情報密度の高い潜伏推論へ移行する代替手法について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:45:47 GMT)
Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning [91.5] Video-RTSは、データ効率を大幅に改善したビデオ推論機能を改善するための新しいアプローチである。
出力ベースの報酬を伴う効率的な純RLトレーニングを採用しており、追加のアノテーションや広範囲の微調整は必要ありません。
我々は、複数のビデオ推論ベンチマークに対するアプローチを検証し、既存のビデオ推論モデルに2.4%の精度で超えることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:19:27 GMT)
Foundation of Intelligence: Review of Math Word Problems from Human Cognition Perspective [90.2] 数学語問題(MWP)は、1960年代までさかのぼる人工知能(AI)の基本的な研究トピックである。
この研究は、人間のような認知知性を反映することで、AIの推論能力を向上させることを目的としている。
本稿では,問題理解,論理的組織,連想記憶,批判思考,知識学習の5つの重要な認知能力について要約する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:06:15 GMT)
Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement [90.0] LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:01:58 GMT)
RECODE-H: A Benchmark for Research Code Development with Interactive Human Feedback [88.0] 研究論文やリポジトリからの102タスクのベンチマークであるRECODE-Hを提案する。
構造化された命令、単体テスト、現実的な研究者とエージェントのコラボレーションを反映する5段階のフィードバック階層が含まれる。
フィードバックを反復的なコード生成に統合するフレームワークであるReCodeAgentも紹介します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:20:26 GMT)
Mitra: Mixed Synthetic Priors for Enhancing Tabular Foundation Models [85.6] 実世界のデータに対して,その多様性,特異性,および性能のために選択された合成前駆体の硬化した混合物をトレーニングしたTFMであるMitraを紹介する。
Mitraは、TabPFNv2やTabICLのような最先端のTFMを、分類と回帰のベンチマークで一貫して上回っている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:15:06 GMT)
ControlFusion: A Controllable Image Fusion Framework with Language-Vision Degradation Prompts [82.5] 現在の画像融合法は、現実の撮像シナリオで発生する複合劣化に対処するのに苦労している。
本稿では,制御フュージョンと呼ばれる言語ビジョンプロンプトを用いた制御可能な画像融合フレームワークを提案する。
実験では、制御フュージョンは、融合品質と劣化処理においてSOTA融合法より優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:19:49 GMT)
The Principles of Diffusion Models [81.1] 拡散モデリングは、データを徐々にノイズに分解するフォワードプロセスを定義することから始まる。
目標は、ノイズをデータに変換しながら、同じ中間体を回復するリバースプロセスを学ぶことだ。
エネルギーベースモデリングに根ざしたスコアベースビューは、進化するデータ分布の勾配を学習する。
フローベースのビューは、フローの正規化に関連するもので、サンプルをノイズからデータに移すスムーズなパスに従って生成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:29:02 GMT)
VL-SAE: Interpreting and Enhancing Vision-Language Alignment with a Unified Concept Set [80.5] 視覚言語表現のアライメントは、強いマルチモーダル推論能力を持つ現在のビジョン言語モデルを実現する。
視覚言語表現をその隠れアクティベーションにエンコードするスパースオートエンコーダVL-SAEを提案する。
解釈において、視覚と言語表現のアライメントは、意味論と概念を比較することで理解することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:29:31 GMT)
Towards Fully FP8 GEMM LLM Training at Scale [78.0] 既存のアプローチは、しばしば最適化されたFP8カーネルに依存するか、より高精度な行列乗算に回帰する。
本稿では, トランスブロック内のすべてのGEMMに対して, 前方および後方の両方でFP8計算をサポートする新しいLLMアーキテクチャを提案する。
これにより、特に大規模では、標準的なBF16トレーニングのダウンストリームパフォーマンスにマッチしながら、前例のないスループット向上が可能になる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:53:26 GMT)
Dipper: Diversity in Prompts for Producing Large Language Model Ensembles in Reasoning tasks [77.4] DIPPERは、単一の大規模言語モデル(LLM)を効果的な推論時間アンサンブルに変換する、トレーニング不要のフレームワークである。
モデルに最適化された多様なプロンプトのセットを並列に供給することで、DIPPERは様々な推論パスを持ち込み、パフォーマンスの向上につながった。
我々は,3つのQwen2-MATH-1.5BインスタンスのDIPPERアンサンブルがより大きな7Bモデルより優れているMATHなどの推論ベンチマークにおいて,顕著な改善を実証的に示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:28:37 GMT)
MEReQ: Max-Ent Residual-Q Inverse RL for Sample-Efficient Alignment from Intervention [76.8] 本稿では,人間の介入によるサンプル効率向上を目的としたMEReQ(Maximum-Entropy Residual-Q Inverse Reinforcement Learning)を紹介する。
MereQは、人間の専門家と以前の政策の根底にある報酬関数との相違を捉える残差報酬関数を推論する。
その後、Residual Q-Learning(RQL)を使用して、ポリシーをこの残留報酬関数を使用して人間の好みと整合させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:35:54 GMT)
Relieving the Over-Aggregating Effect in Graph Transformers [76.1] 過剰集約は、大量のメッセージが識別の少ない単一のノードに集約されたときに起こる。
グラフアテンションのためのプラグイン・アンド・プレイ方式であるワイドフォーマーを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:56:48 GMT)
WorldGrow: Generating Infinite 3D World [75.8] 我々は、無限に拡張可能な3D世界、すなわちコヒーレントな幾何学と現実的な外観を持つ大規模で連続的な環境を生み出すという課題に取り組む。
本研究では,非有界な3次元シーン合成のための階層的フレームワークWorldGrowを提案する。
提案手法は,(1)高品質なシーンブロックを抽出し,シーン生成に適した3D構造化潜在表現を作成するデータキュレーションパイプライン,(2)コンテキスト認識シーン拡張を可能にする3Dブロックインペイント機構,(3)グローバルなレイアウトの妥当性と局所幾何学的/音声的忠実性の両立を保証する粗大かつ微細な生成戦略,の3つのコアコンポーネントを特徴とする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:39:52 GMT)
RLGF: Reinforcement Learning with Geometric Feedback for Autonomous Driving Video Generation [75.6] この重要な問題を特定し定量化し,合成データと実データを用いた場合の3次元物体検出における顕著な性能差を示す。
本稿では,RLGFを用いた強化学習(Reinforcement Learning with Geometric Feedback, RLGF)を紹介する。
RLGFは幾何誤差(例えばVPエラーを21%、深さエラーを57%)を大幅に削減し、3Dオブジェクト検出のmAPを12.7%改善し、実際のデータ性能のギャップを狭める。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:01:27 GMT)
AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite [75.6] 本稿では,AstaBenchについて紹介する。AstaBenchは,科学的研究を行うためのエージェント能力の総合的な測定を行うスイートである。
私たちのスイートには、プロダクショングレードの検索ツールを備えた、最初の科学研究環境が付属しています。
22のエージェントクラスで57のエージェントを評価したところ,いくつかの興味深い結果が得られた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:10:26 GMT)
TOM-SWE: User Mental Modeling For Software Engineering Agents [75.3] ToM-SWEは、プライマリ・ソフトウェア・エンジニアリング(SWE)エージェントとライトウェイト・オブ・ミンド(ToM)パートナーエージェントを組み合わせたデュアルエージェントアーキテクチャである。
ToM-SWEは、ユーザー目標、制約、およびインストラクションとインタラクション履歴から好みを推測する。
2つのソフトウェアエンジニアリングベンチマークでは、ToM-SWEはタスクの成功率とユーザの満足度を改善する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:09:51 GMT)
When Models Outthink Their Safety: Mitigating Self-Jailbreak in Large Reasoning Models with Chain-of-Guardrails [74.6] 大規模推論モデル(LRM)は複雑な推論タスクにおいて顕著な能力を示す。
LRMは、有害なコンテンツ生成やジェイルブレイク攻撃など、深刻な安全リスクに弱いままである。
安全でない推論ステップを再構成またはバックトラックするトレーニングフレームワークであるChain-of-Guardrail(CoG)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:32:25 GMT)
Video-Skill-CoT: Skill-based Chain-of-Thoughts for Domain-Adaptive Video Reasoning [74.1] Video-Skill-CoT (別名 Video-SKoT) は、ドメイン適応型ビデオ推論のためのスキル対応CoT監視を自動構築し活用するフレームワークである。
まず、スキルベースのCoTアノテーションを構築し、それらを共有スキル分類に分類し、トレーニング用に各ビデオ検索ペアに合わせて、詳細なマルチステップのCoT論理を作成する。
第二に、スキル固有のエキスパート学習フレームワークを導入し、各エキスパートモジュールは推論スキルのサブセットを専門とし、軽量なアダプタで訓練する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:17:29 GMT)
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space [74.1] 本稿では、音声波形を連続的な潜在表現の列に符号化することで、音声言語モデリングの代替手法であるSLEDを紹介する。
SLEDは離散化エラーを回避し、既存の言語モデルに共通する複雑な階層アーキテクチャの必要性を排除する。
実験結果から,SLEDはゼロショット音声合成とストリーミング音声合成の両方において高い性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:35:47 GMT)
Epipolar Geometry Improves Video Generation Models [73.4] 3D一貫性のあるビデオ生成は、生成および再構成タスクにおける多くの下流アプリケーションに大きな影響を与える可能性がある。
エピポーラ幾何学的制約が現代のビデオ拡散モデルをどのように改善するかを考察する。
データ駆動型ディープラーニングを古典的幾何学的コンピュータビジョンでブリッジすることで、空間的に一貫したビデオを生成する実用的な方法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:21:37 GMT)
Breaking the Batch Barrier (B3) of Contrastive Learning via Smart Batch Mining [72.8] B3(Breaking the Batch Barrier)は、コントラスト学習(CL)のための高品質なバッチをキュレートする新しいバッチ構築戦略である。
提案手法は,7B と 2B のモデルスケールにおいて,従来のベストメソッドを+1.3 と +2.9 で上回り,新しい最先端の手法を設定できる。
特に、B3でトレーニングされたモデルは、バッチサイズが64まで小さくても、既存の最先端の結果を上回る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:05:21 GMT)
Inference-time Alignment in Continuous Space [72.2] 推論時間アライメントのための単純で効果的なアルゴリズムであるSimple Energy Adaptation(textbfSEA$)を提案する。
SEAは、連続潜時空間における勾配に基づくサンプリングを通じて、基本ポリシーから最適なものへの元の応答を適応する。
例えば、SEAはAdvBenchで最大$textbf77.51%$、MATHで$textbf16.36%$で2番目に高いベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:18:04 GMT)
DCAD-2000: A Multilingual Dataset across 2000+ Languages with Data Cleaning as Anomaly Detection [72.0] 我々は,Common Crawlデータと既存の多言語ソースから構築された大規模多言語コーパスであるDCAD-2000を紹介する。
DCAD-2000は2,282言語、46.72TBのテキスト、および8.63億のドキュメントをカバーし、155のハイソース言語と159のスクリプトをカバーしている。
DCAD-2000上でのLCMの微調整により,データ品質,クリーニングパイプラインの堅牢性,下流性能の顕著な改善が示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:05:50 GMT)
RethinkMCTS: Refining Erroneous Thoughts in Monte Carlo Tree Search for Code Generation [71.9] コード生成の推論プロセスを探求し、洗練するフレームワークであるRethinkMCTSを提案する。
具体的には、コード生成前の思考の検索にMCTSを使用し、再考と呼ばれる改善メカニズムをMCTSに統合する。
RethinkMCTSは、従来の検索ベースおよびフィードバック強化コード生成ベースラインよりも優れていることを実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:10:43 GMT)
Rank-GRPO: Training LLM-based Conversational Recommender Systems with Reinforcement Learning [70.6] ConvRec-R1は会話レコメンデーションシステムのエンドツーエンドトレーニングのための2段階のフレームワークである。
ステージ1では,Remap-Reflect-Adjustパイプラインを用いた行動閉鎖データセットを構築した。
ステージ2では,グループ相対政策最適化の原則的拡張である Rank-GRPO を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:11:31 GMT)
FlashBias: Fast Computation of Attention with Bias [70.4] 偏見による注意は、視覚、言語、タンパク質の折り畳みやその他の先進的な科学モデルに広く展開されてきた。
これは、FlashAttentionのようなアクセラレーターの速度の根底にある、固く融合したメモリ計算パイプラインを破壊します。
本稿では,低ランク圧縮センシング理論に基づくFlashBiasを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:49:22 GMT)
Self-Rewarding PPO: Aligning Large Language Models with Demonstrations Only [70.4] Supervised Fine-tuning (SFT) は、大規模な言語モデルと人間のアノテーションによる実演を整合させる重要な方法として登場した。
本稿では, 自己回帰型PPOを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:02:13 GMT)
Toward Understanding the Transferability of Adversarial Suffixes in Large Language Models [70.1] 離散最適化ベースのjailbreaking攻撃は、入力プロンプトに付加された非意味なサフィックスを生成することを目的としている。
素早い意味的類似性は、伝達の成功と弱い相関関係にある。
これらの知見は、我々の統計的分析が攻撃成功の実践的改善にどのように変換できるかを示すために、介入実験で使用する、伝達可能性のよりきめ細かな理解につながる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:28:49 GMT)
Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay [69.7] 強化学習(RL)は、大規模言語モデル(LLM)の微調整に有効なアプローチとなっている。
LLM RLファインチューニングにおけるデータ効率向上のための2つの手法を提案する。
本手法は,従来のGRPOアルゴリズムと同等の性能を示しながら,RLの微調整時間を23%から62%削減する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:03:58 GMT)
Let LLMs Break Free from Overthinking via Self-Braking Tuning [68.9] 大きな推論モデル(LRM)は思考の長い連鎖を生成することによって推論能力を著しく向上させた。
この性能向上は、生成プロセス中の冗長な推論を大幅に増加させるコストが伴う。
本稿では、モデルが独自の推論プロセスを制御することを許容する観点から、過度に検討する新しいフレームワーク、Self-Braking Tuning(SBT)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:03:24 GMT)
AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios [68.8] AGC-DriveはAerial-Ground Cooperativeの3D知覚のための最初の大規模実世界のデータセットである。
AGC-Driveには350のシーンがあり、それぞれ約100のフレームと13のオブジェクトカテゴリをカバーする完全な注釈付き3Dバウンディングボックスがある。
車両間協調認識と車両間協調認識の2つの3次元タスクのベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:19:19 GMT)
Iterative Tool Usage Exploration for Multimodal Agents via Step-wise Preference Tuning [68.0] コントローラ、例えば視覚言語モデルと外部ツールを統合するマルチモーダルエージェントは、複雑なマルチモーダルタスクに対処する際、顕著な能力を示した。
これらのエージェントを訓練するための既存のアプローチは、広範囲なヒューマン・アノテートされたタスク・アンサー・ペアとツール・トラジェクトリに依存している。
本研究では,事前に収集したデータのないマルチモーダルエージェント,すなわち SPORT の反復ツール利用探索手法を提案する。
Sportには、タスク合成、ステップサンプリング、ステップ検証、優先度調整の4つの反復的なコンポーネントがある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:09:11 GMT)
Physics-Informed Neural Networks for MIMO Beam Map and Environment Reconstruction [67.7] ネットワークインテリジェンスを用いて物理層計測をブリッジするための重要な手法として,チャネル状態情報(CSI)からの幾何学的特徴抽出が出現する。
本稿では, 受信信号強度(RSS)データを3次元環境知識なしで探索し, 放射光マップと環境幾何学を共同構築することを提案する。
反射領域に基づく幾何モデルを含む物理インフォームドディープラーニングフレームワークを提案し, ブロック, 反射, 散乱成分の学習を行った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:17:14 GMT)
Modest-Align: Data-Efficient Alignment for Vision-Language Models [67.5] クロスモーダルアライメントモデルは、リソース制約のある環境での運用において、過信と劣化したパフォーマンスに悩まされることが多い。
我々は,ロバスト性と効率性に配慮した軽量アライメントフレームワークであるModest-Alignを提案する。
本手法は,実世界の低リソースシナリオにおけるクロスモーダルアライメントを実現するための,実用的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:11:10 GMT)
MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges? [66.9] MLRC-Benchは、機械学習(ML)リサーチコンペティションの挑戦において、言語エージェントがいかに効果的に対処できるかを定量化するために設計されたベンチマークである。
MLRC-Benchは以前の研究とは異なり、新しい研究手法を提案し、実装する上で重要なステップを計測する。
最も優れた試験薬でさえ、ベースラインとトップヒューマンのスコアの差の9.3%しか閉じていない。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:48:08 GMT)
MRO: Enhancing Reasoning in Diffusion Language Models via Multi-Reward Optimization [66.8] 拡散言語モデル (DLMs) は従来の自己回帰型大規模言語モデル (LLMs) に代わる有望な選択肢を提供する。
DLMは、特にデノナイジングステップの数が減少するにつれて、LLMよりも遅れている。
本稿では,マルチリワード最適化 (MRO) 手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:57:59 GMT)
Shape it Up! Restoring LLM Safety during Finetuning [65.8] 大型言語モデル(LLM)の微調整は、ユーザ固有のカスタマイズを可能にするが、重大な安全性リスクをもたらす。
動的安全整形(DSS)は,不安全コンテンツを抑えつつ,応答の安全な部分からの学習を強化するための,きめ細かい安全信号を用いたフレームワークである。
STARスコアによって導かれるSTAR-DSSは、微調整リスクを堅牢に軽減し、多様な脅威、データセット、モデルファミリーにまたがる大幅な安全性の向上を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:34:28 GMT)
Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [64.7] Chain-of-Thoughtはステップバイステップの問題解決を促すが、中間出力の過剰な冗長性を犠牲にすることが多い。
我々は,認知にインスパイアされた推論パラダイムを言語制約と統合する促進フレームワークであるSketch-of-Thought(SoT)を提案する。
SoTはトークンを最大84%削減し、18の推論データセットで最小限の精度ロスを達成している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:49:33 GMT)
EditInfinity: Image Editing with Binary-Quantized Generative Models [64.1] 画像編集のためのVQに基づく生成モデルのパラメータ効率適応について検討する。
テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
PIE-Benchベンチマークの実験は、最先端拡散ベースラインと比較して、モデルの性能が優れていることを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:18:13 GMT)
VisCoder2: Building Multi-Language Visualization Coding Agents [63.6] 可視化符号化エージェントを進化させるための3つの相補的なリソースを紹介する。
VisCoder2は、強力なオープンソースベースラインを著しく上回り、プロプライエタリなモデルのパフォーマンスにアプローチする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:03:57 GMT)
Electronic Circuit Principles of Large Language Models [63.4] ECPは、推論時間学習を意味的な電気的力と推論時間推論にマッピングし、オームの法則とファラデーの法則によって支配される抵抗性ネットワークにマッピングする。
350の推論タスクと9つの高度なLCMにまたがる70,000のサンプルでECPを検証する。
ECPは、確立された15の戦略の有効性を説明し、国際情報学オリンピックと国際数理オリンピックの両方の参加者の上位80%を超える、新しいモジュラー介入の開発を指示する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:55:30 GMT)
UniTok: A Unified Tokenizer for Visual Generation and Understanding [63.2] 視覚生成および理解モデルは通常、画像を処理するために異なるトークン化器に依存する。
我々は、新しいマルチコードブック量子化機構を備えた統一トークン化システムUniTokを紹介する。
最終的なパフォーマンスに関しては、UniTokはImageNetで0.38 rFIDと78.6%のゼロショット精度で新記録を樹立した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:34:26 GMT)
Fast Monte Carlo Tree Diffusion: 100x Speedup via Parallel Sparse Planning [63.1] 最近提案されたモンテカルロ木拡散(MCTD)は,木に基づく探索と拡散を組み合わせて,有望な解を提供する。
Fast-MCTDは、遅延ツリー更新と冗長性認識による並列ロールアウトを可能にするParallel MCTDと、軌道粗大化によるロールアウト長の削減を行うSparse MCTDの2つの技術を統合する。
実験により、Fast-MCTDは標準MCTDよりも最大100倍の高速化を実現し、計画性能を維持または改善した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:38:10 GMT)
TokenCLIP: Token-wise Prompt Learning for Zero-shot Anomaly Detection [63.0] TokenCLIPは、異常学習のためのトークンワイド適応フレームワークである。
視覚的なテキスト空間と学習可能なテキスト空間の動的アライメントを可能にし、微粒な異常学習を実現する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:51:31 GMT)
BachVid: Training-Free Video Generation with Consistent Background and Character [62.5] Diffusion Transformer (DiTs) は、最近、テキスト・トゥ・ビデオ(T2V)生成に大きな進歩をもたらした。
既存のメソッドは通常、参照イメージや広範なトレーニングに依存しており、しばしば文字の一貫性にのみ対処する。
我々は、参照画像を必要としない一貫したビデオ生成を実現する、最初のトレーニング不要な方法であるBachVidを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:56:37 GMT)
Learning to Focus: Causal Attention Distillation via Gradient-Guided Token Pruning [62.2] 大規模言語モデル (LLM) は文脈理解において著しく改善されている。
しかし、長いコンテキストの推論と生成の間に真に重要な情報に出席する能力は、まだペースの遅れています。
本稿では,2段階のフレームワークであるLearning to Focus(LeaF)を導入し,コンバウンディング要因を緩和する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:13:05 GMT)
FineRS: Fine-grained Reasoning and Segmentation of Small Objects with Reinforcement Learning [62.1] textscFineRSは、非常に小さなオブジェクトをセグメント化するための2段階のMLLMベースの強化学習フレームワークである。
textscFineRS-4kは,属性レベルの推論に基づくMLLMの評価と,微妙で小規模なターゲットに対する画素レベルのセグメンテーションのための新しいデータセットである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:14:17 GMT)
CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation [62.0] 我々は、CXR解釈のためのディレクター調整型多段階エージェントであるCXRAgentを提案する。
エージェントは、Evidence-driven Validatorによって正規化され検証された出力を持つ一連のCXR分析ツールを戦略的にオーケストレーションする。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:31:30 GMT)
Adaptive Inference-Time Scaling via Cyclic Diffusion Search [61.4] 適応的推論時間スケーリング-動的に計算量を調整するという課題について紹介する。
本稿では,適応型双方向サイクル拡散(ABCD)を提案する。
ABCDは、探索深度と終了を適応的に制御しながら、双方向拡散サイクルを通じて出力を洗練する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:27:49 GMT)
Social Simulations with Large Language Model Risk Utopian Illusion [61.4] 社会シミュレーションにおける大規模言語モデルの行動分析のための体系的枠組みを提案する。
本手法は,チャットルーム型会話を通してマルチエージェントインタラクションをシミュレートし,5つの言語的側面にわたって解析する。
以上の結果から,LSMは真の人間の行動を忠実に再現するのではなく,過度に理想化されたバージョンを反映していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:08:41 GMT)
WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition [61.4] 本稿では,空間およびウェーブレット領域の機能改善を共同で最適化する新しいデコーダアーキテクチャであるWaveSegを提案する。
高周波成分は、まず入力画像から、境界の詳細を強化するために明示的な先行として学習される。
標準ベンチマークの実験では、Mambaベースの注目に先立ってウェーブレット-ドメイン周波数を利用するWaveSegが、常に最先端のアプローチより優れていることが示されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:41:31 GMT)
HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages [61.3] 提案するHelpSteer3-Preferenceは,4万以上のサンプルからなる高品質な人手による選好データセットである。
HelpSteer3-Preference を用いて、RM-Bench (82.4%) と JudgeBench (73.7%) で最高性能を達成するリワードモデル (RM) を訓練する。
これは、既存のRMから報告された結果よりも大幅に改善(10%絶対)したことを意味する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:04:19 GMT)
Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce [61.0] そこで本稿では,複雑な状況下でのテキストバウンダリングを改善するための,文脈対応推論強化型生成検索フレームワークを提案する。
提案手法は,強力なベースラインに比べて優れた性能を示し,検索に基づく推薦の有効性を検証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:04:35 GMT)
The Lighthouse of Language: Enhancing LLM Agents via Critique-Guided Improvement [61.0] 大規模言語モデル(LLM)は、最近、テキストベースのアシスタントから、計画、推論、反復的な行動改善が可能な自律エージェントへと変化した。
本研究では,環境を探索するアクターモデルと,詳細な自然言語フィードバックを生成する批評家モデルからなる,新しい2人プレイヤフレームワークであるCGIを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:30:31 GMT)
The Universal Landscape of Human Reasoning [60.7] 情報フロー追跡(IF-Track)を導入し,情報エントロピーの定量化と,各推論ステップにおけるゲインの定量化を行う。
IF-Trackは,本質的な推論特徴を捉え,系統的な誤りパターンを識別し,個人差を特徴付ける。
このアプローチは理論と測定の間の定量的な橋渡しを確立し、推論のアーキテクチャに関する機械的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:26:36 GMT)
Cost Minimization for Space-Air-Ground Integrated Multi-Access Edge Computing Systems [60.6] 宇宙空間統合多高度エッジコンピューティング(SAGIN-MEC)は、急速に発展する低高度経済に有望なソリューションを提供する。
本稿では、ユーザデバイス(UD)、無人航空機(UAV)、衛星間の協調を可能にするSAGIN-MECアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:03:07 GMT)
R3-RAG: Learning Step-by-Step Reasoning and Retrieval for LLMs via Reinforcement Learning [60.2] Retrieval-Augmented Generation (RAG)は、外部知識をLLM(Large Language Models)と統合し、事実の正しさと幻覚を高める。
我々は、 $textbfR$einforcement Learning を用いて LLM に $textbfR$eason と $textbfR$etrieve を段階的に学習させる $textbfR3-RAG$ を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:52:23 GMT)
Interpretable Next-token Prediction via the Generalized Induction Head [59.5] 一般化帰納型モデル (GIM) は次点予測のための解釈可能なモデルである。
言語モデリングでは、GIMは解釈可能なベースラインに対して最大25%の速さで次世代の予測を改善する。
fMRI設定では、GIMは神経反応予測を20%改善する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:50:14 GMT)
Automated Detection of Visual Attribute Reliance with a Self-Reflective Agent [58.9] 視覚モデルにおける視覚的特徴の意図しない依存を検出するための自動フレームワークを提案する。
自己反射エージェントは、モデルが依存する可能性のある視覚特性に関する仮説を生成し、テストする。
我々は,視覚特性の多様さを示すために設計された130モデルの新しいベンチマークに対して,我々のアプローチを評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:59:02 GMT)
TopoFR: A Closer Look at Topology Alignment on Face Recognition [58.5] PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。
PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。
一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:08:09 GMT)
World Models Should Prioritize the Unification of Physical and Social Dynamics [57.9] 本稿では、物理的・社会的予測能力の体系的・双方向統合が、世界モデル開発における次の重要なフロンティアであると主張している。
包括的世界モデルは、客観的物理法則を主観的、進化的、文脈に依存した社会力学の性質と一体的に統合する必要があると我々は主張する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:42:37 GMT)
VidSplice: Towards Coherent Video Inpainting via Explicit Spaced Frame Guidance [57.6] VidSpliceは、テンポラリな手口でペンキを塗るプロセスをガイドする新しいフレームワークである。
VidSpliceは様々な映像のインパインティングシナリオで競争力を発揮することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:44:09 GMT)
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis [57.4] グラフィカルユーザインタフェース(GUI)の基盤は、コンピュータ利用エージェント開発において依然として重要なボトルネックとなっている。
多様なタスクタイプにまたがる564の細かな注釈付きサンプルからなる総合ベンチマークであるOSWorld-Gを紹介する。
我々は、400万のサンプルを含む、最大のコンピュータ利用基盤データセットであるJediを合成してリリースする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:08:03 GMT)
Multi-Task Vehicle Routing Solver via Mixture of Specialized Experts under State-Decomposable MDP [57.3] 本稿では,VRPの変種間で共有成分の性質を認識可能な統合解法フレームワークを提案する。
状態空間を基底状態空間のカルテアン積として表現することにより、VRPを再構成する状態分解型MDP(SDMDP)を導入する。
The Latent Space-based SDMDP extension is developed by the both the optimal basis policy and a learnable mix function。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:31:31 GMT)
From Black-box to Causal-box: Towards Building More Interpretable Models [57.2] 本稿では, 因果解釈可能性の概念を導入し, 特定のモデルのクラスから対実的クエリを評価できるときの形式化について述べる。
我々は、与えられたモデルアーキテクチャが与えられた偽物クエリをサポートするかどうかを決定する完全なグラフィカルな基準を導出する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:03:18 GMT)
Adversarial Déjà Vu: Jailbreak Dictionary Learning for Stronger Generalization to Unseen Attacks [57.1] 新たなジェイルブレイクに対する防御は、AIの安全性にとって重要な課題である。
本稿では,目に見えないジェイルブレイクに対する堅牢性向上のための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:37:25 GMT)
Boosting Adversarial Transferability with Spatial Adversarial Alignment [57.0] ディープニューラルネットワークは、様々なモデルにまたがる転送可能性を示す敵の例に対して脆弱である。
本稿では,アライメント損失を利用してサロゲートモデルを微調整する手法を提案する。
ImageNet上の様々なアーキテクチャの実験では、SAAに基づくアライメントされたサロゲートモデルにより、より高い転送可能な逆の例が得られることが示されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:01:38 GMT)
DAP-MAE: Domain-Adaptive Point Cloud Masked Autoencoder for Effective Cross-Domain Learning [56.9] 我々は,MAE事前学習法であるDAP-MAE(Domain-Adaptive Point Cloud Masked Autoencoder)を提案する。
DAP-MAEにはドメイン機能ジェネレータが組み込まれており、さまざまなダウンストリームタスクへのポイントクラウド機能の適用をガイドしている。
DAP-MAEは1つの事前トレーニングで、4つの異なるポイントクラウド分析タスクで優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:44:40 GMT)
Fundamental Limitations in Pointwise Defences of LLM Finetuning APIs [56.8] 細調整APIの防御は、細調整攻撃を防ぐ能力に基本的に制限されていることを示す。
我々は、危険知識を隠蔽的に伝達するために、良性モデル出力のエントロピーを再利用する'ポイントワイド検出不能'アタックを構築した。
OpenAIの微調整APIに対する攻撃をテストし、有害な複数の質問に対する回答を導き出すことに成功しました。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:25:42 GMT)
Reinforcement Learning with Action Chunking [56.7] 本稿では,長時間のスパース・リワード作業における強化学習アルゴリズムの改良手法であるQ-chunkingを提案する。
我々のレシピはオフラインからオンラインまでのRL設定のために設計されており、オンライン学習のサンプル効率を最大化するためにオフライン前のデータセットを活用することが目的である。
実験の結果,Q-chunkingはオフライン性能とオンラインサンプル効率が優れており,長時間のスパース・リワード操作タスクにおいて,最良オフライン-オンライン手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:37:23 GMT)
FEAT: Free energy Estimators with Adaptive Transport [56.7] 自由エネルギー推定のための新しいフレームワークである適応輸送を用いた自由エネルギー推定器(FEAT)を提案する。
FEATは、ガードされたジャージンスキーの等式と制御されたクルックスの定理に基づく一貫した最小分散推定器を提供する。
おもちゃの例、分子シミュレーション、量子場理論に関する実験的検証は、既存の学習法よりも改善されていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:22:19 GMT)
Integrating Genomics into Multimodal EHR Foundation Models [56.3] 本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:56:40 GMT)
RSafe: Incentivizing proactive reasoning to build robust and adaptive LLM safeguards [55.8] 大規模言語モデル(LLM)は、意図的な安全確保努力にもかかわらず、脆弱性を示し続けている。
ポリシー違反のリスクから保護するために、外部ガードモデルによるシステムレベルのモデレーションが一般的な緩和戦略として現れている。
我々は、特定の安全ポリシーの範囲内で堅牢な保護を提供するためのガイド付き安全推論を行う適応型推論ベースの安全ガードであるRSafeを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:18:17 GMT)
BADiff: Bandwidth Adaptive Diffusion Model [55.1] 従来の拡散モデルは、下流の伝送制限によらず、一定数のデノナイジングステップを実行することで、高忠実度画像を生成する。
実際のクラウド・ツー・デバイス・シナリオでは、帯域幅の制限はしばしば重い圧縮を必要とし、微妙なテクスチャや無駄な計算が失われる。
使用可能な帯域幅から導かれる目標品質レベルに拡散モデルを条件付けする,共同エンドツーエンドのトレーニング戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:50:03 GMT)
Revisiting Multi-Agent World Modeling from a Diffusion-Inspired Perspective [54.8] 拡散モデルを用いたマルチエージェント強化学習(MARL)のためのフレキシブルで堅牢な世界モデルを開発する。
本手法はDiffusion-Inspired Multi-Agent World Model (DIMA) を用いて,複数のマルチエージェント制御ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:51:44 GMT)
LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.4] 大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:39:58 GMT)
Visual Diffusion Models are Geometric Solvers [54.3] 画像拡散モデルは,画素空間で作業することで,効果的な幾何学的解法として機能することを示す。
最初にこれを、幾何学の長年の問題である印字正方形問題(Inscription Square Problem)で実証する。
我々はこのアプローチを、Steiner Tree Problem と Simple Polygon Problem の2つのよく知られた厳密な幾何学的問題に拡張する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:57:31 GMT)
Graph Data Selection for Domain Adaptation: A Model-Free Approach [54.3] グラフドメイン適応(GDA)は、グラフ機械学習の基本的なタスクである。
本稿では,対象ドメインの分類タスクに対して,ソースドメインから最高のトレーニングデータを選択する新しいモデルフリーフレームワークであるGRADATEを提案する。
GRADATEは既存の選択法よりも優れており、トレーニングデータが少なく、市販のGDA法を向上する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:58:57 GMT)
Return of ChebNet: Understanding and Improving an Overlooked GNN on Long Range Tasks [54.0] 我々はChebNetを再訪し、遠く離れたノードの相互作用をモデル化する能力について光を当てる。
我々はChebNetを安定かつ非散逸的力学系とみなし、Stable-ChebNetを造語した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:43:07 GMT)
Dependency-Aware Task Offloading in Multi-UAV Assisted Collaborative Mobile Edge Computing [53.9] 本稿では,新しい無人航空機(UAV)による協調移動エッジコンピューティング(MEC)フレームワークを提案する。
システムコストを最小限に抑え、タスク消費とエネルギー消費のトレードオフを改善することを目的としている。
提案手法はシステムコストを大幅に削減し,タスク消費とエネルギー消費のトレードオフの改善を実現する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:51:21 GMT)
Confounding Robust Deep Reinforcement Learning: A Causal Approach [53.6] 本稿では,DQN(Deep Q-Network)に基づいて,観測データのバイアスの解消に頑健な新しい強化学習アルゴリズムを提案する。
提案手法は,12個のAtariゲームに対して適用され,観察された動作および目標ポリシーへの入力がミスマッチおよび観測されていない共同創設者が存在するすべてのゲームにおいて,標準DQNを一貫して支配していることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:58:01 GMT)
DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.9] 大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:50:46 GMT)
PhysWorld: From Real Videos to World Models of Deformable Objects via Physics-Aware Demonstration Synthesis [52.9] 物理的に妥当で多様な実演を合成し、効率的な世界モデルを学ぶためのフレームワークであるPhysWorldを提案する。
実験により、PhysWorldは、最新の最先端手法、すなわちPhysTwinよりも47倍高速な推論速度を実現しつつ、競争性能を持つことが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:25:39 GMT)
Cascaded Language Models for Cost-effective Human-AI Decision-Making [52.8] 複数の専門分野にまたがってタスクを適応的に委譲するLLM決定フレームワークを提案する。
まず、deferral Policyは、ベースモデルの回答を受け入れるか、あるいは大きなモデルでそれを再生するかを決定する。
第2に、禁忌ポリシーは、カスケードモデル応答が十分に確実であるか、または人間の介入を必要とするかを判定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:06:15 GMT)
Neural Collapse under Gradient Flow on Shallow ReLU Networks for Orthogonally Separable Data [52.7] 直交分離可能なデータを分類するための2層ReLUネットワーク上の勾配流がニューラル・コラプス(NC)を示すことを示す。
NCの出現を促進するためのトレーニング力学の暗黙バイアスの役割を明らかにする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:36:19 GMT)
Understanding Token-level Topological Structures in Transformer-based Time Series Forecasting [52.4] Transformer-based method has achieved state-of-the-art performance in time series forecasting (TSF)
既存のトランスフォーマーが中間層全体を通してトークン間の固有位相構造を完全に活用しているかどうかは不明である。
トークンレベルのトポロジを明示的にかつ適応的に保存するトランスフォーマーベースの新しいTSF手法であるトポロジ拡張法(TEM)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:14:46 GMT)
Information Retrieval Induced Safety Degradation in AI Agents [52.2] 本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。
整列 LLM 上に構築された検索可能なエージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。
これらの発見は、検索可能でますます自律的なAIシステムの公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:33:08 GMT)
MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.1] 我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:11:05 GMT)
Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning [52.0] 本稿では,広く採用されている強化学習手法を体系的にレビューする。
特定の設定に合わせてRLテクニックを選択するための明確なガイドラインを示す。
また、2つのテクニックを最小限に組み合わせることで、批判のないポリシーの学習能力を解き放つことも明らかにした。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:10:11 GMT)
Cost-Sensitive Freeze-thaw Bayesian Optimization for Efficient Hyperparameter Tuning [51.6] コストと性能のトレードオフを記述する関数であるフリーズソーフレームワークで,エフェユーティリティを導入する。
我々は,提案アルゴリズムを確立されたマルチ忠実HPOベンチマークで検証し,従来のフリーズソーBOやTransfer-BOベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:03:57 GMT)
Information-Theoretic Reward Decomposition for Generalizable RLHF [51.6] 我々は報酬値を2つの独立したコンポーネントに分解する。
提案手法は,データサンプルを不利な報酬値に基づいて優先順位付けすることで,新たな報酬学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:58:50 GMT)
Efficient Parametric SVD of Koopman Operator for Stochastic Dynamical Systems [51.5] クープマン作用素は非線形力学系を解析するための原理的なフレームワークを提供する。
VAMPnet と DPNet はクープマン作用素の主特異部分空間を学ぶために提案されている。
我々は、クープマン作用素のトップ$kの特異関数を学ぶためのスケーラブルで概念的にシンプルな方法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:07:49 GMT)
Relative Representations: Topological and Geometric Perspectives [50.9] 相対表現はゼロショットモデルの縫合に対する確立されたアプローチである。
相対変換において正規化手順を導入し、非等方的再スケーリングや置換に不変となる。
第二に、クラス内のクラスタリングを促進するトポロジカル正規化損失である、微調整された相対表現におけるトポロジカルデシフィケーションの展開を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:56:49 GMT)
LIBERO-Plus: In-depth Robustness Analysis of Vision-Language-Action Models [49.9] 制御された摂動を7次元にわたって導入することにより,系統的な脆弱性解析を行う。
モデルは、カメラの視点やロボットの初期状態を含む摂動要因に対して極端に敏感である。
驚くべきことに、モデルは言語の変化にほとんど敏感であり、さらなる実験により、モデルは言語命令を完全に無視する傾向があることが明らかになった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:50:04 GMT)
DispatchMAS: Fusing taxonomy and artificial intelligence agents for emergency medical services [49.7] 大規模言語モデル (LLM) とマルチエージェントシステム (MAS) は、ディスパッチを増強する機会を提供する。
本研究の目的は,現実的なシナリオをシミュレートする分類基盤型マルチエージェントシステムの開発と評価である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:01:21 GMT)
ViTime: Foundation Model for Time Series Forecasting Powered by Vision Intelligence [49.6] 時系列予測(TSF)は、電力やエネルギー、輸送など、様々な分野で大きな実践的価値を持っている。
TSFモデルは長年、問題固有であり、アプリケーションの一般化性に欠けることが知られている。
本稿では,視覚情報を利用したViTimeフレームワークを初めて提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:47:09 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [49.2] 二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。
連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。
我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:33:58 GMT)
Memory Injection Attacks on LLM Agents via Query-Only Interaction [49.1] 我々は,攻撃者がエージェントのメモリバンクを直接変更できると仮定することなく,新たなメモリインジェクション攻撃(MINJA)を提案する。
攻撃者は、クエリと出力観察を通してエージェントとのみ対話することで、悪意のあるレコードをメモリバンクに注入する。
MINJAは、任意のユーザがエージェントメモリに影響を与え、リスクを強調します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:47:39 GMT)
Timely Clinical Diagnosis through Active Test Selection [49.1] 本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:05:14 GMT)
CDrugRed: A Chinese Drug Recommendation Dataset for Discharge Medications in Metabolic Diseases [49.1] メタボリックな疾患の治療薬の排出を目的とした,中国初の医薬品推奨データセットであるCDrugRedを提示する。
データセットには3,190人の患者から5,894件の未確認記録が含まれており、患者の人口統計、医療史、臨床経過、退院診断などの包括的情報を含んでいる。
退院医薬品推奨タスクにおいて,いくつかの最先端の大規模言語モデル (LLM) をベンチマークすることでCDrugRedの有用性を評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:47:23 GMT)
RockNet: Distributed Learning on Ultra-Low-Power Devices [49.0] 本稿では,超低消費電力ハードウェアに適した新しいTinyML法であるRockNetを提案する。
CPSは複数のデバイスで構成されているため,機械学習と無線通信を統合した分散学習手法を設計する。
この結果から,分散ML,分散コンピューティング,通信の緊密な統合により,最先端の精度で超低消費電力ハードウェアのトレーニングが可能となった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:52:31 GMT)
ColorAgent: Building A Robust, Personalized, and Interactive OS Agent [49.0] ユーザ指示を実行し,ユーザの要望を忠実に追従できるオペレーティングシステム(OS)エージェントの構築が現実化しつつある。
環境との長期的かつ堅牢なインタラクションを実現するために設計されたOSエージェントであるColorAgentを提示する。
我々は,OSエージェントを温かくて協調的なパートナーとして位置づけ,パーソナライズされたユーザ意図認識と積極的なエンゲージメントについて検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:32:03 GMT)
RLBoost: Harvesting Preemptible Resources for Cost-Efficient Reinforcement Learning on LLMs [48.9] RLBoostは、プリエンプティブルGPUリソースを抽出するコスト効率のよいRLトレーニングのための体系的なソリューションである。
RLBoostはトレーニングのスループットを1.51x-1.97x向上し、オンデマンドGPUリソースのみを使用する場合に比べてコスト効率は28%-49%向上した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:49:45 GMT)
DeCaFlow: A deconfounding causal generative model [48.9] 本稿では,分解因果生成モデルであるDeCaFlowを紹介する。
DeCaFlowの単一インスタンスがdo-calculusで識別可能なすべての因果クエリに対して正しい推定値を提供することを示す。
多様な設定に関する実証的な結果は、DeCaFlowが既存のアプローチよりも優れており、任意の因果グラフに適用可能であることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:03:31 GMT)
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning [48.6] 本稿では,生深度データを構造化・解釈可能なテキスト論理に変換する新しいフレームワークを提案する。
これらのテキストの有理は、空間的推論能力を著しく向上させる意味のある中間表現として機能する。
中間空間推論アノテーションを付加した100万スケールの視覚言語推論データセットであるSSR-CoTを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:26:20 GMT)
Chain of Execution Supervision Promotes General Reasoning in Large Language Models [48.1] TracePileは260万のサンプルからなる大規模なコーパスで、コード実行を明示的でステップバイステップのチェーン・オブ・シンクスタイルの論理に変換する。
我々は,継続事前訓練,事前訓練後の指導訓練,2段階微調整という3つのトレーニング設定を用いてTracePileを評価する。
特にTracePileは、9つの数学データセットでLLaMA3.1-8Bを平均7.1%向上させ、LiveCodeBench、CRUX、MMLUで明確なゲインを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:21:11 GMT)
Axial Neural Networks for Dimension-Free Foundation Models [48.1] 物理データに基づく基礎モデルのトレーニングは、異なるシステム間で異なる次元を持つため、ユニークな課題となる。
従来のアプローチでは、最大次元を固定するか、異なる次元に対して別のエンコーダを使用するかのいずれかであり、結果として非効率である。
本稿では,Deep SetsやGraph Neural Networksなどのパラメータ共有構造に着想を得た,次元に依存しないニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:06:35 GMT)
Recognition through Reasoning: Reinforcing Image Geo-localization with Large Vision-Language Models [48.0] 新しいパイプラインは、多様なソーシャルメディアイメージを使用して推論指向のジオローカライゼーションデータセットMP16-Reasonを構築する。
GLOBEには、ローカライズビリティアセスメント、ビジュアルキュー推論、位置情報の精度を共同で向上するタスク固有の報酬が組み込まれている。
その結果,GLOBEはジオローカライゼーションタスクにおいて,最先端のオープンソースLVLMよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:02:36 GMT)
The Trojan Example: Jailbreaking LLMs through Template Filling and Unsafety Reasoning [47.9] TrojFillはブラックボックスのジェイルブレイクで、安全でない命令をテンプレート入力タスクとして再設定する。
我々はTrojFillを、主要な大規模言語モデルにまたがる標準ジェイルブレイクベンチマークで評価する。
生成されたプロンプトは、以前のブラックボックス最適化アプローチと比較して、解釈可能性と転送可能性が改善されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:43:10 GMT)
How Does Sequence Modeling Architecture Influence Base Capabilities of Pre-trained Language Models? Exploring Key Architecture Design Principles to Avoid Base Capabilities Degradation [47.6] この研究は、塩基機能に対するシーケンスモデリングアーキテクチャの影響に焦点を当てている。
まず、混合ドメイン事前トレーニング設定では、様々なアーキテクチャ間の基本能力の違いを適切に明らかにできないことを指摘します。
次に、ステートフルシーケンスモデリングアーキテクチャの基本能力を解析し、トランスフォーマーと比較して基盤能力を著しく劣化させることを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:51:13 GMT)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.5] 野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。
3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。
我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でフォトリアリスティックレンダリングを実現することを実証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:17:58 GMT)
Typoglycemia under the Hood: Investigating Language Models' Understanding of Scrambled Words [47.5] いくつかのNLPモデルは、設計による文字の内部順序を無視して、そのような歪みに対して堅牢性を示すものである。
多くの異なる単語がタイポ血糖の下で同じ表現に分解した場合、モデルがどのようにうまく機能するかという根本的な疑問が提起される。
私たちの仕事は、英語のみに焦点を絞って、この堅牢性に責任を負う基礎的な側面に光を当てようとしている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:36:43 GMT)
Misspellings in Natural Language Processing: A survey [47.5] デジタル通信では ミススペルがユビキタスになりました
我々は科学的な問題としてミススペルの歴史を再構築する。
NLPにおけるミススペル問題に対処するための最新の進歩について論じる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:45:12 GMT)
On Local Limits of Sparse Random Graphs: Color Convergence and the Refined Configuration Model [47.5] 局所収束はスパースランダムグラフモデル解析の基本的なツールとして登場した。
Wesfeiler-Lemanアルゴリズムに基づく局所収束、色収束という新しい概念を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:29:51 GMT)
Unveiling the Spatial-temporal Effective Receptive Fields of Spiking Neural Networks [47.4] スパイキングニューラルネットワーク(SNN)は、エネルギー効率のよいニューロモルフィックコンピューティングにおいて大きな可能性を示す。
人工ニューラルネットワークでは、有効受容場(ERF)が特徴抽出能力を分析する貴重なツールとして機能する。
本稿では,ST-ERF(Spatio-Temporal Effective Receptive Field)を導入し,トランスフォーマーベースSNN間のRF分布を解析する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:46:58 GMT)
Spectral embedding and the latent geometry of multipartite networks [47.2] 多くのネットワークはマルチパーティイトであり、基本的に異なるタイプのノードを含んでいる。
本稿では,スペクトル埋め込みにより得られるノード表現が,高次元空間のタイプ特異的な低次元部分空間の近傍にあることを示す。
スペクトル埋め込み後の追従ステップとして,周辺次元ではなく固有次元のノード表現を復元する手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:22:34 GMT)
What Makes a Good Curriculum? Disentangling the Effects of Data Ordering on LLM Mathematical Reasoning [47.1] 大規模言語モデル(LLMs)における推論改善戦略として,カリキュラム学習(CL)が普及している。
しかし、以前の作業では、異なる難易度メトリクスとトレーニングのセットアップを採用しており、オープンな根本的な疑問を残している。
我々は,カリキュラムの難易度を5つの相補的な次元に分解する統合されたオフライン評価フレームワークを通じて,これらの疑問に対処する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:45:57 GMT)
Register and [CLS] tokens yield a decoupling of local and global features in large ViTs [46.8] 本研究では,レジスタトークンがグローバル画像特徴とローカル画像特徴の関係に与える影響について検討する。
我々の研究は、大きなViTの注意マップを解釈する際に注意が必要であることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:31:50 GMT)
DictPFL: Efficient and Private Federated Learning on Encrypted Gradients [46.7] 最小限のオーバーヘッドで完全な勾配保護を実現するフレームワークであるDictPFLを提案する。
送信されていないパラメータをローカルに保ちながら、送信されたすべての勾配を暗号化し、重い計算をすることなくプライバシを保存する。
実験によると、DictPFLは通信コストを402-748$times$で削減し、完全に暗号化されたFLと比較して28-65$times$でトレーニングを加速する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:58:42 GMT)
Robust Residual Finite Scalar Quantization for Neural Compression [46.6] 有限スカラー量子化(FSQ)は、簡易なトレーニングを提供するが、多段階設定での残留等級劣化に悩まされる。
本稿では,2つの新しい条件付け手法を用いて,この基本的な制限に対処するロバスト残留有限スカラー量子化(RFSQ)を提案する。
RFSQの有効性と一般化性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:26:03 GMT)
IPFormer: Visual 3D Panoptic Scene Completion with Context-Adaptive Instance Proposals [46.4] IPFormerは、トレーニング時のコンテキスト適応型インスタンスの提案とテスト時間を利用して、視覚ベースの3Dパノプティクスシーンコンプリートに対処する最初の方法である。
提案手法は、最先端のドメイン内性能を実現し、ドメイン外データに対して優れたゼロショット一般化を示し、実行時の削減を14倍以上に達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:53:30 GMT)
Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression [46.3] アクションアセスメント(AQA)は、運動性能の自動的、公平な評価を目的としている。
現在の手法では、動画を固定フレームに分割することに集中しており、サブアクションの時間的連続性を損なう。
階層的なポーズ誘導型多段階コントラスト回帰による行動品質評価手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:09:01 GMT)
Efficient semantic uncertainty quantification in language models via diversity-steered sampling [46.2] 本稿では,デコード中に意味的に冗長な出力を回避できるダイバーシティステアリング・サンプリング手法を提案する。
主要なアイデアは、モデルの提案分布に連続的な意味-類似性ペナルティを注入することである。
モジュラーであり、ベースLSMへの勾配アクセスを必要としないため、このフレームワークは不確実性評価のためのドロップインエンハンスメントとして機能することを約束している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:06:21 GMT)
Sparser Block-Sparse Attention via Token Permutation [46.2] 本稿では,ブロックレベルの空間性を高めるために,注目の置換特性を活用するプラグイン・アンド・プレイ方式であるPermuted Block-Sparse Attention (textbfPBS-Attn)を提案する。
PBS-Attnは、カスタムのpermuted-FlashAttentionカーネルをベースとして、長文プリフィルで最大2.75タイムのエンドツーエンドのスピードアップを実現しています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:11:50 GMT)
Model-Aware Tokenizer Transfer [46.1] Model-Aware Tokenizer Transfer (MATT) は、モデル内部をトークン化プロセスに組み込む手法である。
MATTは、ソースモデルからターゲットモデルにトーケン間通信パターンを蒸留する注意影響モデリング(AIM)の目的を導入している。
実験の結果、MATTはオリジナルのモデルの性能のかなりの部分をGPU時間以内に回復し、ベースラインを上回った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:27:36 GMT)
Wisdom and Delusion of LLM Ensembles for Code Generation and Repair [46.0] 3つのソフトウェアエンジニアリングベンチマークで10個の大規模言語モデルと3つのLLMのアンサンブルを比較した。
アンサンブルのパフォーマンスの理論的上限は、最高のシングルモデルよりも83%高いことが判明した。
多様性に基づく戦略は、この理論ポテンシャルの最大95%を実現し、小さな2モデルアンサンブルでも有効であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:39:23 GMT)
Linearized Optimal Transport for Analysis of High-Dimensional Point-Cloud and Single-Cell Data [45.9] シングルセル技術は、細胞の高次元点雲を生成する。
各患者は単純なベクトルではなく不規則な点雲で表される。
線形最適輸送フレームワークを用いて不規則点雲を固定次元ユークリッド空間に埋め込む。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:33:12 GMT)
Few-Shot Learning from Gigapixel Images via Hierarchical Vision-Language Alignment and Modeling [45.7] HiVE-MILは、粗い(5x)と細い(20x)視覚/テキストノード間の親子リンクからなる統一グラフを構築するビジョン言語フレームワークである。
セマンティック一貫性をさらに強化するため、HiVE-MILには2段階のテキスト誘導動的フィルタリング機構が組み込まれている。
TCGA乳がん、肺がん、腎臓がんのデータセットの実験では、HiVE-MILは従来のMILと最近のVLMベースのMILアプローチの両方で一貫して優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:54:03 GMT)
Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning [45.6] 連鎖推論は、大規模言語モデルの性能を大幅に改善した。
画素空間における推論の概念を紹介する。
このアプローチが視覚言語モデルを大幅に改善することを示します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:35:22 GMT)
$\texttt{AVROBUSTBENCH}$: Benchmarking the Robustness of Audio-Visual Recognition Models at Test-Time [45.4] 我々は、音声視覚認識モデルの試験時間ロバスト性を評価するために設計された総合的なベンチマークである$textttAVROBUSTBENCH$を紹介した。
$textttAVROBUSTBENCH$は、4つのオーディオ視覚ベンチマークデータセット、$textttAUDIOSET-2C$、$texttVGGSOUND-2C$、$texttKINETICS-2C$、$textttEPICKITCHENS-2C$からなる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:54:45 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [45.2] 大規模言語モデル(LLM)は、誤った情報や誤解を招く情報を幻覚させ、信頼性を制限する傾向がある。
アーキテクチャの変更は幻覚に対する既存の懸念を悪化/悪化させるか?
これらの知見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを考察する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:39:46 GMT)
Surrogate-based quantification of policy uncertainty in generative flow networks [45.2] 代理モデルを構築することによって不確実性を定量化する手法を提案する。
このモデルは、低次元空間でパラメトリされた報酬関数の関係を学習する。
その後、安価なモンテカルロサンプリングに使用でき、不確実な報酬を与えられた政策の不確実性を推定することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:44:36 GMT)
ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality [45.2] 我々は,これまでで最大規模の多言語スケーリング法を施行し,合計774の多言語学習実験を行った。
単言語および多言語事前学習のための適応移動スケーリング法(ATLAS)を導入する。
分析では、多言語学習のダイナミクス、言語間の伝達特性、多言語性の呪いについて光を当てた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:45:22 GMT)
Efficient Fairness-Performance Pareto Front Computation [45.1] 最適公正表現はいくつかの有用な構造特性を持つことを示す。
そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:55:26 GMT)
Enhanced Evolutionary Multi-Objective Deep Reinforcement Learning for Reliable and Efficient Wireless Rechargeable Sensor Networks [44.9] ワイヤレス充電式センサネットワーク(WRSN)とモバイル充電機能は、ネットワーク寿命を延ばすための有望なソリューションを提供する。
WRSNは、ノード生存率の最大化と充電エネルギー効率の最大化の間の本質的にのトレードオフから、重要な課題に直面している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:30:00 GMT)
ColorEcosystem: Powering Personalized, Standardized, and Trustworthy Agentic Service in massive-agent Ecosystem [44.5] 現在の大規模エージェントエコシステムは、非個人的サービスエクスペリエンス、標準化の欠如、信頼できない行動など、ますます課題に直面しています。
大規模にパーソナライズされ、標準化され、信頼性の高いエージェントサービスを実現するために設計された、新しい青写真であるColorEcosystemを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:26:30 GMT)
Online Optimization for Offline Safe Reinforcement Learning [44.5] オフライン型安全強化学習(OSRL)の問題点について検討する。
目標は、累積コスト制約の下で固定データから報酬を最大化するポリシーを学ぶことである。
そこで本研究では,オンライン最適化アルゴリズムとオフラインRLを組み合わせることで,この問題を最小限の目標とするOSRLアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:12:47 GMT)
Pilot Contamination-Aware Graph Attention Network for Power Control in CFmMIMO [44.4] CFmMIMOシステムにおけるダウンリンク電力制御のためのグラフアテンションネットワークを提案する。
パイロットの汚染を効果的に処理し、多数のユーザ機器に適応しながら、自己管理的な操作を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:37:44 GMT)
The Narrow Gate: Localized Image-Text Communication in Native Multimodal Models [44.3] 視覚言語モデル(VLM)は、視覚情報がどのように処理され、テキスト領域に転送されるかに焦点を当て、画像理解タスクを処理する。
テキストと画像の両方を生成するためにマルチモーダルデータのスクラッチからトレーニングされたネイティブなマルチモーダルVLMと、事前訓練された大規模言語モデルから適応された、あるいはテキストのみを生成することができる非ネイティブなマルチモーダルVLMを比較し、情報フローの重要な違いを強調した。
単一トークンを非難することは画像理解性能を著しく低下させるのに対し、ターゲットレベルの介入は画像意味論や下流テキストをきめ細かな制御で確実に操ることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:24:17 GMT)
PonderLM-2: Pretraining LLM with Latent Thoughts in Continuous Space [44.2] 我々は、新しい事前学習手法を提案する:潜在思考を用いた言語モデル(PonderLM-2)
我々のアプローチでは、まず言語モデル(LM)を事前訓練して、現在位置の最後の隠れ状態である中間潜在思考を生成し、その後、実際のトークンを予測するために入力として使用される。
実験により、同一の推論コストでトークンごとに1つの追加の潜在的思考を生成するLMが、パラメータの2倍の標準モデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:43:56 GMT)
DynamicPAE: Generating Scene-Aware Physical Adversarial Examples in Real-Time [44.0] 物理逆数例(PAEs)は、ディープラーニングアプリケーションにおける現実世界のリスクのwhi-blowersと見なされる。
動的PAEの生成における鍵となる課題は、PAEと攻撃者の観察との間の疎結合を学習することである。
シーン認識のリアルタイム物理攻撃を可能にする最初の生成フレームワークであるDynamicPAEを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:42:08 GMT)
Dynamic Semantic-Aware Correlation Modeling for UAV Tracking [43.8] UAV追跡は、災害救助、環境モニタリング、物流輸送といったシナリオに広く適用することができる。
既存のUAV追跡手法は、主にスピードを強調し、セマンティック・アウェアネスの探索を欠いている。
この問題に対処するために,動的セマンティック・アウェアリング・リレーショナル・モデリング・トラッキング・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:28:06 GMT)
Place Cells as Multi-Scale Position Embeddings: Random Walk Transition Kernels for Path Planning [43.1] 海馬は、集合的な場所細胞活動を通じて認知地図を符号化することで、空間ナビゲーションをサポートする。
この枠組みでは、内積または同値な埋め込み間のユークリッド距離は、複数のスケールにわたる遷移確率の観点から、位置間の類似性を符号化する。
非負性性と内産物構造の組み合わせは自然に空間性を誘導し、場所細胞の局所的な発火場を原則的に説明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:28:02 GMT)
Scalable Vision-Language-Action Model Pretraining for Robotic Manipulation with Real-Life Human Activity Videos [42.9] 我々は、任意の手動ビデオのための完全自動化された総合的人間活動分析手法を開発した。
大量のエゴセントリックなビデオを処理し、100Mエピソードと26Mフレームを含む手動VLAトレーニングデータセットを作成します。
我々は手動VLAモデルアーキテクチャを設計し、このデータセット上でモデルを事前訓練する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:39:31 GMT)
Probe-based Fine-tuning for Reducing Toxicity [42.7] 提案手法は,Supervised Fine-tuning と Direct Preference Optimization の2つである。
トレーニング後のプローブ検出器の精度を維持するため,(1)プローブのアンサンブルに対するトレーニング,(2)訓練に使用しない保持型プローブの保持,(3)訓練後の新しいプローブの再訓練を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:59:07 GMT)
Bi-Level Optimization for Generative Recommendation: Bridging Tokenization and Generation [42.1] ジェネレーティブレコメンデーションは,マッチングに頼るのではなく,推奨項目を直接生成することによって,変革的なパラダイムとして現れています。
既存のアプローチでは、トークン化器を扱い、適切なアイテム識別子とそれらの識別子に基づいてレコメンデータを導出する。
BLOGER, Bi-Level Optimization for GEnerative Recommendation frameworkを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:25:56 GMT)
FLAMES: Fine-tuning LLMs to Synthesize Invariants for Smart Contract Security [41.8] FLAMESは、ランタイムガードをSolidityの"require"ステートメントとして合成して、エクスプロイトに対するスマートコントラクトを強化する自動アプローチである。
FLAMESは、514,506の検証された契約から抽出された実世界の不変量について、中間層を教師する微調整によって訓練されたドメイン適応型大規模言語モデルを採用している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:44:08 GMT)
DiscoSG: Towards Discourse-Level Text Scene Graph Parsing through Iterative Graph Refinement [41.8] 視覚言語モデルは、談話レベルの多文視覚記述を生成する。
現在のアプローチでは、談話入力のための文レベルの構文解析出力をマージする。
新しいタスクであるDiscoSG(DiscoSG)を導入した。
400のエキスパートアノテーションと8,430のマルチ文キャプショングラフペアからなるデータセットであるDiscoSG-DSをリリースする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:53:07 GMT)
Mixture of Experts in Image Classification: What's the Sweet Spot? [41.7] オープンデータセットを用いた画像分類アーキテクチャにおけるMoE層の統合について検討する。
サンプルあたりの中間パラメータのアクティベーションは、パフォーマンスと効率の最良のトレードオフを提供します。
MoE層は、小型・中型モデルが最も効果的に強化され、大容量ネットワークではテーパーオフになる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:36:28 GMT)
OmniNWM: Omniscient Driving Navigation World Models [41.7] 統合されたフレームワーク内の3次元すべてに対処するパノラマナビゲーションワールドモデルであるOmniNWMを紹介する。
例えば、OmniNWMは、RGB、セマンティクス、メートル法深度、および3D占有度のパノラマ動画を共同で生成する。
動作のために、入力軌跡をピクセルレベルの信号にエンコードする正規化パノラマPlucker線地図表現を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:35:18 GMT)
$α$-LoRA: Effective Fine-Tuning via Base Model Rescaling [41.6] そこで我々は, 微調整モデルの能力一般化を促進するために, 伝達学習のための新しいクラスreパラメタライゼーション手法を提案する。
ランダム行列理論のツールを用いた高次元二値分類設定において,本手法の有効性を確立し,より現実的な実験により理論的知見を検証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:19:33 GMT)
Understanding AI Trustworthiness: A Scoping Review of AIES & FAccT Articles [41.4] 信頼できるAIは、AIESとFAccTという2つの主要なAI倫理カンファレンスの基礎となっている。
このスコーピングレビューは、AIESとFAccTコミュニティがAIの信頼性を概念化し、測定し、検証する方法を検討することを目的としている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:40:38 GMT)
A Comparison of Conversational Models and Humans in Answering Technical Questions: the Firefox Case [41.4] 本研究では,Mozilla Firefoxプロジェクトの開発者を支援するRetrieval-Augmented Generationの有効性を評価する。
我々は、人間開発者からの反応、標準GPTモデル、RAGで強化されたGPTモデルを比較した経験的分析を行った。
その結果、RAGベースのツールをオープンソースソフトウェアに適用して、回答の品質を損なうことなく、コアメンテナの負荷を最小限に抑える可能性が示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:05:01 GMT)
Generalization Bounds for Rank-sparse Neural Networks [41.0] 重み行列の近似的低階構造を利用したニューラルネットワークの一般化境界を証明した。
p$が増加すると、その境界は代わりにノルムベースの境界のように振る舞う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:19:32 GMT)
Teaching Transformers Causal Reasoning through Axiomatic Training [40.8] 本研究では,因果的公理の象徴的証明から因果的推論をどの程度学べるかを考察する。
重要な疑問は、システムが公理実証からより複雑なシナリオへの一般化を学ぶかどうかである。
多様なテキスト入力を扱うために、同じ手法がファインチューン言語モデルに拡張される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:07:28 GMT)
E2Edev: Benchmarking Large Language Models in End-to-End Software Development Task [40.5] E2EDevは振る舞い駆動開発(BDD)の原則に基づいた新しいベンチマークだ。
E2EDevは、(i)ユーザ要件のきめ細かいセット、(ii)要件ごとに対応するPythonのステップ実装を備えた複数のBDDテストシナリオ、(iii)Behaveフレームワーク上に構築された完全に自動化されたテストパイプラインで構成されています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:13:11 GMT)
Improved Regret and Contextual Linear Extension for Pandora's Box and Prophet Inequality [40.4] PandoraのBox問題を半帯域フィードバックによるオンライン学習環境で研究する。
各ラウンドでは、学習者は、未知の報酬分布を持つ最大$n$ボックスを開くために順次支払いを行う。
我々は,$T$ラウンド後に$widetildeO(sqrtT)$ regretを達成する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:12:03 GMT)
InfiniDreamer: Arbitrarily Long Human Motion Generation via Segment Score Distillation [40.2] 我々は、任意に長い人間の動きを生成するための新しい枠組みを提案する。
InfiniDreamerは、各テキスト記述に対応するサブモーションを生成する。
次に、ランダムな遷移セグメントを用いて、それらを粗い拡張シーケンスに組み立てる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:06:50 GMT)
BioCAP: Exploiting Synthetic Captions Beyond Labels in Biological Foundation Models [40.1] 画像やキャプションは、ある種の潜在形態空間からの相補的なサンプルと見なすことができる。
我々は、ウィキペディア由来の視覚情報と分類群調整形式の例で合成キャプションを生成する。
これらのドメイン固有のコンテキストは幻覚を減らし、正確なインスタンスベースのキャプションを生成するのに役立つ。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:51:09 GMT)
Lazarus: Resilient and Elastic Training of Mixture-of-Experts Models [39.9] 大規模言語モデル(LLM)の弾力性と弾力性を備えたトレーニングシステムであるLazarusについて述べる。
Lazarusはエキスパートのレプリカを適応的に割り当てて、専門家のワークロードの固有の不均衡に対処し、トレーニングをスピードアップする。
評価の結果、Lazarusはノード障害の頻度で5.7倍、実際のインスタンストレースで3.4倍、既存のMoEトレーニングシステムよりも優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:28:44 GMT)
Patient-specific AI for generation of 3D dosimetry imaging from two 2D-planar measurements [39.8] 本研究では,2次元平面画像から3次元活動マップを生成するために,患者固有の強化学習を利用する方法について検討する。
平面シンチグラフィーから3Dアクティビティマップを生成することは、新しいドシメトリー応用のための門を開く。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:46:51 GMT)
Foley Control: Aligning a Frozen Latent Text-to-Audio Model to Video [39.7] Foley Controlは、ビデオ誘導型のFoleyに対する軽量なアプローチである。
事前訓練された単一モダリティモデルを凍結させ、それらの間の小さなクロスアテンションブリッジのみを学習する。
私たちはVideo-to-Foleyにフォーカスしていますが、同じブリッジデザインは、他のオーディオモダリティにも拡張できます。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:49:54 GMT)
AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs? [39.4] オープンなベンチマークでアルゴリズムを設計・実装するテストモデルを提案する。
私たちのAlgoTuneベンチマークは、ドメインの専門家から収集された154のコーディングタスクで構成されています。
AlgoTunerは参照ソルバに対して平均1.72倍のスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:16:20 GMT)
Optimal Rates in Continual Linear Regression via Increasing Regularization [39.3] 本研究では,ランダムなタスク順序付けの下での連続線形回帰について検討する。
この設定では、$k$学習後の最悪の損失は、$Omega (1/k)$の低いバウンドを認める。
明示的等方的$ell$正則化と有限ステップ予算による暗黙的正則化という2つのよく使われる正則化スキームを用いる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:32:19 GMT)
Robust time series generation via Schrödinger Bridge: a comprehensive evaluation [39.1] 時系列に対するSchr"odinger Bridge (SB) アプローチの生成能力について検討した。
我々は、様々なデータセットでSOTA(State-of-the-art)時系列生成手法と比較した。
我々の結果は、時系列生成のための汎用的で堅牢なツールとしてのSBフレームワークの可能性についての貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:49:52 GMT)
EU-Agent-Bench: Measuring Illegal Behavior of LLM Agents Under EU Law [39.1] EU-Agent-Benchは、EUの法規範とエージェントの整合性を評価する検証可能なベンチマークである。
私たちのベンチマークは、データ保護、バイアス/差別、科学的完全性など、さまざまなカテゴリのシナリオにまたがっています。
我々は、データ汚染を防ぐためのプライベートテストセットを公開し、研究コミュニティ向けのパブリックプレビューセットをリリースする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:48:10 GMT)
Sharper Convergence Rates for Nonconvex Optimisation via Reduction Mappings [38.8] 目的の曲率特性をよく設計した縮小写像が向上し, より条件のよい問題や, 理論上は勾配に基づく手法の収束性が向上することを示した。
本分析は,最適化アルゴリズムで観測された経験的利得の原理的説明として,最適な構造情報を活用して収束を加速するシナリオを統一する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:24:45 GMT)
Some Optimizers are More Equal: Understanding the Role of Optimizers in Group Fairness [38.8] 提案アルゴリズムがディープニューラルネットワークにおけるグループフェアネスにどう影響するかについて検討する。
結果から,適応的な更新が,公正な結果を促進する上で重要なメカニズムであることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:35:28 GMT)
WMCopier: Forging Invisible Image Watermarks on Arbitrary Images [38.6] 目的の透かしアルゴリズムの事前知識やアクセスを必要とせず,有効な透かし偽造攻撃であるWMCopierを提案する。
提案手法はまず,無条件拡散モデルを用いて対象の透かし分布をモデル化し,次いで,対象の透かしを非透かし画像にシームレスに埋め込む。
実験の結果、WMCopierはオープンソースとクローズドソースの両方の透かしシステムを効果的に騙していることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:32:10 GMT)
E-MoFlow: Learning Egomotion and Optical Flow from Event Data via Implicit Regularization [38.5] オプティカルフローと6-DoFエゴモーションの推定は、通常独立して対処されてきた。
ニューロモルフィック・ビジョンでは、ロバストなデータアソシエーションが欠如しているため、この2つの問題を別々に解決することは不十分な課題である。
本研究では,暗黙の空間的時間的・幾何学的正則化を通じて,運動と光の流れを協調的に最適化する,教師なしのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:21:48 GMT)
Evaluating and Improving Cultural Awareness of Reward Models for LLM Alignment [38.2] リワードモデル(RM)は、大きな言語モデルと多様な文化の整合に不可欠である。
既存のRM評価は、文化的に関連するデータセットが不足しているため、文化的意識を評価するには不十分である。
文化意識リワードモデリングベンチマーク (CARB) を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:33:01 GMT)
MUVR: A Multi-Modal Untrimmed Video Retrieval Benchmark with Multi-Level Visual Correspondence [38.1] MUVRは、マルチモーダルクエリを使用して、関連セグメントを含む未トリミングなビデオを取得することを目的としている。
MUVRはビデオプラットフォームBilibiliの53Kビデオで構成されており、マルチモーダルクエリは1,050、マッチは84Kである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:50:02 GMT)
S3OD: Towards Generalizable Salient Object Detection with Synthetic Data [38.1] S3ODは、マルチモーダル拡散パイプラインを通して生成された139,000以上の高解像度画像のデータセットである。
本稿では,有能な物体検出における固有曖昧さを自然に扱えるマルチマスクデコーダを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:10:09 GMT)
A Gravity-informed Spatiotemporal Transformer for Human Activity Intensity Prediction [38.1] 本研究では,重力インフォームド時空間変換器(重力変換器)という物理インフォームド深層学習フレームワークを提案する。
6つの実世界の大規模活動データセットの実験は、最先端のベンチマークよりも、我々のモデルの量的および質的な優位性を実証している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:36:52 GMT)
RETuning: Upgrading Inference-Time Scaling for Stock Movement Prediction with Large Language Models [38.0] 本研究では,大規模言語モデル(LLM)が,体系的かつ独立した分析論理(CoT)を示すのではなく,アナリストの意見に従うことを観察し,三クラス分類問題(アップ,ホールド,ダウン)を考察する。
本稿では,強化学習に先立つ冷間開始法である反射エビデンスチューニング(RETuning)を提案し,予測能力を向上する。
2024年全体の5,123件のAシェアストックに、長いコンテキスト(32Kトークン)と200K以上のサンプルを備えた大規模なデータセットを構築しています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:08:33 GMT)
SimLab: A Platform for Simulation-based Evaluation of Conversational Information Access Systems [37.9] 我々は,対話システムとユーザシミュレータを,制御および再現可能な設定でベンチマークする,最初のクラウドベースのプラットフォームであるSimLabを紹介した。
我々は,SimLabの初期バージョンの設計と実装について紹介し,その特徴を対話型映画レコメンデーションにおけるシミュレーションに基づく評価タスクを通じて示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:07:26 GMT)
Boltzmann Graph Ensemble Embeddings for Aptamer Libraries [37.5] 生化学における機械学習の手法は、分子を性質と構造予測のための一対の分子間相互作用のグラフとして表すのが一般的である。
本稿では,分子をボルツマン重み付き相互作用グラフのアンサンブルとしてモデル化した熱力学的パラメータ化指数型ランダムグラフ(ERGM)を導入する。
提案手法は,アプタマー親和性に対する頑健なコミュニティ検出とサブグラフレベルの説明を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:13:36 GMT)
One Dinomaly2 Detect Them All: A Unified Framework for Full-Spectrum Unsupervised Anomaly Detection [37.4] 教師なし異常検出(UAD)は、特殊な単一クラスモデルの構築から、統一された多クラスモデルへと進化してきた。
Dinomaly2はフルスペクトル像UADのための最初の統一されたフレームワークである。
MVTec-AD と VisA では,前例のない 99.9% と 99.3% の画像レベル (I-) AUROC をそれぞれ達成している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:03:12 GMT)
Towards Physically Executable 3D Gaussian for Embodied Navigation [37.4] SAGE-3Dは、3DGSを実行可能、セマンティック、物理的に整合した環境にアップグレードする新しいパラダイムである。
1)オブジェクトレベルの微粒なアノテーションを3DGSに追加するオブジェクト中心セマンティックグラウンドリングと,(2)衝突物体を3DGSに埋め込む物理認識実行結合とから構成される。
1Kオブジェクトアノテートされた3DGS屋内シーンデータを含むInstituteGSをリリースし、2MVLNデータを備えた最初の3DGSベースのVLNベンチマークであるSAGE-Benchを紹介した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:05:00 GMT)
Forging GEMs: Advancing Greek NLP through Quality-Based Corpus Curation [37.3] ギリシャの埋め込みモデル(GEM)は、アーキテクチャの多様性とデータキュレーションの強化を通じて制限に対処するために開発された。
いくつかの大規模で精巧にキュレートされたコーパスで訓練されたモデルのファミリー。
最初のバイリンガル・ギリシャ語・英語の埋め込みモデルは、言語間法的な応用に適合した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:58:25 GMT)
FlowOpt: Fast Optimization Through Whole Flow Processes for Training-Free Editing [37.1] FlowOptは、フロープロセス全体をブラックボックスとして扱う、ゼロオーダー(段階的な)最適化フレームワークである。
本研究では,FlowOptが画像編集にどのように使用できるかを示す。 (i) インバージョン(与えられた画像を生成する初期ノイズを決定する) および (ii) 編集した画像をソース画像に類似するように直接ステアリングする方法である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:24:26 GMT)
MobileRL: Online Agentic Reinforcement Learning for Mobile GUI Agents [37.0] モバイル環境におけるGUIエージェントを強化するためのオンラインエージェント強化学習フレームワークMobileRLを提案する。
コアコンポーネントはDifficulty-ADAptive GRPO (ADAGRPO) アルゴリズムである。
マルチターンエージェントタスクにおけるタスク長に関する報酬を再構成するための最短パス報酬調整戦略を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:13:05 GMT)
OutboundEval: A Dual-Dimensional Benchmark for Expert-Level Intelligent Outbound Evaluation of Xbench's Professional-Aligned Series [36.9] OutboundEvalは、インテリジェントなアウトバウンドコールシナリオにおいて、大きな言語モデル(LLM)を評価するための包括的なベンチマークである。
6つの主要なビジネスドメインと30の代表的なサブシナリオにまたがるベンチマークを設計します。
本稿では,タスク実行の正確性,専門知識の適用性,適応性,ユーザエクスペリエンスの質を評価するために,タスクのバリエーションに適応する動的評価手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:27:58 GMT)
PhysVLM-AVR: Active Visual Reasoning for Multimodal Large Language Models in Physical Environments [36.8] マルチモーダル大言語モデル(MLLM)における視覚的推論は、主に静的で完全に観測可能な設定で研究されている。
AVR(Active Visual Reasoning)タスクを導入し、視覚的推論を部分的に観察可能で対話的な環境に拡張する。
推論と情報収集の効率性の両方を評価するために,複数ラウンドの対話型環境を特徴とするベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:59:00 GMT)
QuArch: A Benchmark for Evaluating LLM Reasoning in Computer Architecture [36.8] QuArchは、コンピュータアーキテクチャにおける大規模言語モデル(LLM)機能の開発と評価を容易にするために設計された最初のベンチマークである。
評価の結果,フロンティアモデルはドメイン固有の知識を持っているが,高次思考を必要とするスキルに苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:54:17 GMT)
A Multimodal Benchmark for Framing of Oil & Gas Advertising and Potential Greenwashing Detection [36.0] 専門家が注釈付けしたビデオ広告のベンチマークデータセットをFacebookとYouTubeから紹介する。
このデータセットは、50社以上の企業や20カ国の擁護団体に対して、13のフレーミングタイプのアノテーションを提供する。
我々のデータセットは、エネルギーセクターにおける戦略的コミュニケーションのマルチモーダル分析の研究に寄与する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:34:28 GMT)
Adiabatic echo protocols for robust quantum many-body state preparation [35.3] 静的摂動の影響を抑制するために設計された状態準備に対する一般的なアプローチである断熱エコープロトコルを導入する。
このようなプロトコルは、制御フィールドの形式に関する仮定を必要とせず、様々な設定で自然に現れることを示す。
このプロトコルの広範な適用性を強調し,現代の量子プラットフォームにおける信頼性の高い多体状態準備のための実践的枠組みを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:32:34 GMT)
RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation [35.0] VLA(Vision-Language-Action Model)は、模倣学習を通じて複雑なロボット操作タスクにおいて顕著な性能を示す。
探索サンプリングにより,RESample という自動 OOD データ拡張フレームワークを提案する。
LIBEROベンチマークと実世界のロボット操作タスクについて広範な実験を行い、resampleがVLAモデルの安定性と一般化能力を一貫して改善することを実証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:01:37 GMT)
RTV-Bench: Benchmarking MLLM Continuous Perception, Understanding and Reasoning through Real-Time Video [34.9] RTV-BenchはMLLMリアルタイムビデオ解析のためのきめ細かいベンチマークである。
RTV-Benchは552の多様なビデオ(167.2時間)と4,631の高品質QAペアを含んでいる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:11:36 GMT)
Mamba Modulation: On the Length Generalization of Mamba [34.9] Mambaはステートスペース言語モデルの主要なアーキテクチャである。
プレトレーニング中に見られたものよりも長時間のコンテキストに適用した場合,マンバの性能は著しく低下することがわかった。
本稿では,スペクトルスケーリングを事前学習したMambaモデルに適用して,堅牢な長期コンテキスト一般化を実現する手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:19:29 GMT)
Progressive Data Dropout: An Embarrassingly Simple Approach to Faster Training [34.8] ハードデータマイニングとドロップアウトの洞察を活用するための,代替的なトレーニングパラダイムを提案する。
提案されたプログレッシブデータドロップアウトは、有効エポックの数をベースラインの12.4%に削減する。
驚くべきことに,提案手法は最大4.82%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:10:31 GMT)
GRAP-MOT: Unsupervised Graph-based Position Weighted Person Multi-camera Multi-object Tracking in a Highly Congested Space [34.5] GRAP-MOTは、マルチカメラビューの重なり合うクローズドエリアのビデオ専用の人物MOT問題を解決する新しいアプローチである。
新たなグラフ重み付きソリューションは、トラックと特徴的特徴に基づいて、人物の識別ラベルをオンラインで更新する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:07:11 GMT)
PanicToCalm: A Proactive Counseling Agent for Panic Attacks [34.0] PACEは,1対1の物語から構築された高密度のエピソードを含むデータセットである。
このデータを用いて、共感的および指示的サポートを提供するために設計されたカウンセリングモデルであるPACERを訓練する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:30:24 GMT)
BDiff: Block-aware and Accurate Text-based Code Differencing [33.9] BDiffは2種類のブロックレベルEAと5種類のラインレベルEAを識別できるテキストベースの差分アルゴリズムである。
BDiffは、競争力のあるランタイムパフォーマンスを維持しながら、ベースラインツールよりも高品質な差別化結果を生成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:12:01 GMT)
Quantum Lower Bounds by Sample-to-Query Lifting [33.8] 本稿では,量子サンプル対クエリリフト定理を用いて,量子クエリの下界を証明するための新しい手法を提案する。
位相/振幅推定やハミルトニアンシミュレーションなど,いくつかの既知の下界に対する統一的な証明を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:03:43 GMT)
What Do Latent Action Models Actually Learn? [33.8] ラテントアクションモデル(LAM)は、フレーム間の変化をラテントとして圧縮することにより、ラベルのないビデオからアクション関連の変化を学習することを目的としている。
本稿では,LAM学習の本質を包括する線形モデルを提案するとともに,この問題を解析的に考察する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:32:21 GMT)
Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks [33.7] 下流認識タスクを強化するための新しい合成データ生成フレームワークであるDream4Driveを紹介する。
Dream4Driveは入力ビデオを複数の3D対応誘導マップに分解し、これらの誘導マップに3Dアセットをレンダリングする。
駆動世界モデルは、下流の知覚モデルをトレーニングするために使用できる編集されたマルチビュービデオを作成するために微調整される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:10:43 GMT)
GSO: Challenging Software Optimization Tasks for Evaluating SWE-Agents [33.7] GSOは、高性能ソフトウェアを開発する際の言語モデルの能力を評価するためのベンチマークである。
SWE-Agentsは5%未満の成功率を達成でき、推論時間スケーリングにおいても改善が限られている。
将来の研究を可能にするために、ベンチマークのコードとアーティファクトとエージェントトラジェクトリをリリースします。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:59:00 GMT)
Exploration via Feature Perturbation in Contextual Bandits [33.5] 特徴入力にランダム性を直接注入するコンテキスト的包帯に対する簡易な戦略を提案する。
興味深いことに、このアルゴリズムは一般化された線形文脈帯域に対して$tildemathcalO(dsqrtT)$ worst-case regret boundを達成している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:30:06 GMT)
Beyond Reasoning Gains: Mitigating General Capabilities Forgetting in Large Reasoning Models [33.2] 検証可能な報酬(RLVR)による強化学習は、数学的およびマルチモーダル推論において驚くべき成果を上げている。
汎用知識のための動的客観的リウェイトを用いたRECAP-aリプレイ戦略を提案する。
本手法はエンド・ツー・エンドであり,既存のRLVRパイプラインに適用可能である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:08:48 GMT)
Rectified Point Flow: Generic Point Cloud Pose Estimation [33.2] 本稿では,一対の点雲登録と複数部分形状の組立を条件付き単一生成問題として定式化する統一パラメータ化であるRectified Point Flowを紹介する。
提案手法は,ノイズの多い点を目標位置へ移動させる連続点速度場を学習し,その部分のポーズを復元する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:12:13 GMT)
Co-Designing with Multiple Stakeholders and Datasets: A Community-Centered Process to Understand Youth Deviance in the Italian City of Turin [33.2] 本稿では,Sbocciamo Torino 市民ツールの共設計と設計評価について述べる。
市民の道具は、イタリアのトリノで若者の偏見の問題を理解し、行動するのに役立ちます。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:53:06 GMT)
FocalCodec: Low-Bitrate Speech Coding via Focal Modulation Networks [33.0] FocalCodecは、単一のバイナリコードブックを使って音声を圧縮する焦点変調に基づく効率的な低ビットレートである。
デモサンプルとコードはhttps://lucadellalib.io/kbpscodec-web/.comで公開されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:00:25 GMT)
A Convergence Analysis of Adaptive Optimizers under Floating-point Quantization [33.0] 我々は、勾配、重み、状態の浮動小数点量子化の下で、アダムやムオンを含む適応収束の最初の理論的枠組みを導入する。
両アルゴリズムが完全精度のアルゴリズムに近い収束率を維持していることを示す。
我々はさらに、Adamが$beta から 1$ への依存のため、高い感度と第二モーメントの量子化重みに敏感であることを明らかにし、Muon はより弱いエラー制御を必要とするため、より堅牢である可能性がある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:16:23 GMT)
To CoT or To Loop? A Formal Comparison Between Chain-of-Thought and Looped Transformers [32.8] CoT(Chain-of-Thought)とLooped Transformerは、推論タスクのパフォーマンスを実証的に改善することが示されている。
それぞれの強みと限界を形式的に分析する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:56:01 GMT)
LayerIF: Estimating Layer Quality for Large Language Models using Influence Functions [32.6] 事前訓練された大規模言語モデル(LLM)は、幅広いタスクで高いパフォーマンスを達成する。
LLMは、特定の下流アプリケーションに対して、様々なレイヤのトレーニング品質にかなりのばらつきを示す。
本稿では,各レイヤのトレーニング品質を,原則的かつタスクに敏感な方法で定量化するLayerIFを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:27:17 GMT)
Mixture-of-Minds: Multi-Agent Reinforcement Learning for Table Understanding [32.6] テーブル推論を,計画,コーディング,回答の3つの専門的な役割に分解するマルチエージェントフレームワークを提案する。
我々は、Mixture-of-MindsがTableBenchで62.13%、OpenAI-o4-mini-highを上回り、かなりの利益をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:36:31 GMT)
Enhancing Tactile-based Reinforcement Learning for Robotic Control [32.6] 我々は,触覚観察をより効果的に活用するために,自己教師付き学習法(SSL)を開発した。
疎二元触覚信号がデキスタリティに重要であることを実証的に実証した。
我々は,ロボット触覚オリンピアド(RoTO)ベンチマークを公開し,触覚に基づく操作に関する今後の研究を標準化し,促進する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:15:05 GMT)
Generalised Flow Maps for Few-Step Generative Modelling on Riemannian Manifolds [32.4] Generalized Flow Maps (GFM) は、数ステップの生成モデルの新しいクラスである。
我々は、幾何データセットのスイート上で、他の幾何生成モデルと比較してGFMをベンチマークする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:14:31 GMT)
Head Pursuit: Probing Attention Specialization in Multimodal Transformers [32.2] テキスト生成モデルにおける個々の注意がどのように特定の意味的属性や視覚的属性に特化しているかを考察する。
以上の結果から, ヘッドレベルでの特殊化のパターンは, 単モードおよび多モードトランスの両方で一貫した結果が得られた。
また,本手法を用いて選択した頭部の1%を編集することで,モデル出力の目標概念を確実に抑制・強化できることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:41:47 GMT)
TRACE: Grounding Time Series in Context for Multimodal Embedding and Retrieval [32.1] TRACEは、時系列をテキストコンテキストに埋め込む汎用マルチモーダルレトリバーである。
Text-to-TimeseriesやTimeeries-to-Textなど、柔軟なクロスモーダル検索モードをサポートする。
TRACEは強力なスタンドアロンエンコーダとしても機能し、コンテキスト対応の表現を洗練するための軽量なタスク特化チューニングを備えている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:02:52 GMT)
Doc-Researcher: A Unified System for Multimodal Document Parsing and Deep Research [32.0] Doc-Researcherは、テキストのみ、ビジョンのみ、ハイブリッドパラダイム間のギャップを埋める統一システムである。
マルチモーダル,マルチホップ,マルチドキュメント,マルチターンディープリサーチの最初のベンチマークであるM4DocBenchを紹介する。
Doc-Researcherの精度は50.6%で、最先端のベースラインよりも3.4倍高い。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:07:54 GMT)
Metropolis-Hastings Sampling for 3D Gaussian Reconstruction [31.8] 3次元ガウス平滑化のための適応型サンプリングフレームワーク(3DGS)を提案する。
我々の枠組みは, 確率的サンプリングプロセスとして, デンシフィケーションとプルーニングを改質することで限界を克服する。
提案手法は,最先端モデルのビュー合成品質を適度に上回りながら,より高速な収束を実現する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:23:51 GMT)
Huxley-Gödel Machine: Human-Level Coding Agent Development by an Approximation of the Optimal Self-Improving Machine [31.8] エージェントの自己改善ポテンシャルと符号化ベンチマーク性能のミスマッチを同定する。
ハクスリーのクラッドの概念に触発され、エージェントの子孫のベンチマークパフォーマンスを集計する計量(mathrmCMP$)を提案する。
我々はHuxley-G"odel Machine (HGM)を紹介し、$mathrmCMP$を推定してガイダンスとして使用することにより、自己修正のツリーを検索する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:19:41 GMT)
AgentSense: LLMs Empower Generalizable and Explainable Web-Based Participatory Urban Sensing [31.7] AgentSenseは、大規模な言語モデルを参加型都市センシングに統合する、トレーニング不要のフレームワークである。
我々はAgentSenseが従来の手法よりも適応性と説明性に明確な優位性を持っていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:16:51 GMT)
ArtiLatent: Realistic Articulated 3D Object Generation via Structured Latents [31.5] ArtiLatentは、人間の作った3Dオブジェクトを精密な幾何学、正確な調音、リアルな外観で合成する生成フレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:08:15 GMT)
Understanding and Mitigating Numerical Sources of Nondeterminism in LLM Inference [31.2] 評価バッチサイズ、GPUカウント、GPUバージョンなどのシステム構成の変更は、生成されたレスポンスに大きな違いをもたらす可能性がある。
この変数の根本原因は、限定的な数値精度で浮動小数点算術の非連想性に遡る。
そこで我々は16ビットの精度で重みを格納するが、FP32では全ての計算を実行する軽量な推論パイプラインLayerCastを開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:04:56 GMT)
Adaptive Algorithms with Sharp Convergence Rates for Stochastic Hierarchical Optimization [31.0] 階層最適化問題に対する新しい適応アルゴリズムを提案する。
我々のアルゴリズムは、ノイズレベルの事前の知識なしに、鋭い収束率を達成する。
合成および深層学習タスクの実験は,提案アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:18:51 GMT)
Deep Literature Survey Automation with an Iterative Workflow [30.9] 我々のフレームワークは 再帰的なアウトライン生成に基づく 探索とコヒーレンスの両方を保証する
忠実な紙レベル接地を実現するため,各紙をその寄与,方法,発見に蒸留する紙カードを設計する。
確立されたトピックと新興トピックの両方の実験では、コンテンツカバレッジ、構造的コヒーレンス、引用品質の最先端のベースラインを大きく上回っている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:41:26 GMT)
What Does It Take to Build a Performant Selective Classifier? [30.9] ベイズノイズ,近似誤差,ランキング誤差,統計的ノイズ,実装またはシフト誘起スラックについて検討した。
我々は,合成2モードデータと実世界のビジョンと言語ベンチマークを用いて,その分解を検証した。
その結果, (i)ベイズノイズとモデル容量の制限は, 実質的なギャップを考慮し, (ii) よりリッチで特徴を考慮したキャリブレータのみを有意義に改善し, (iii) データシフトは, 分散的に堅牢なトレーニングを必要とするスラックを別々に導入することを確認した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:27:45 GMT)
Reliable Inference in Edge-Cloud Model Cascades via Conformal Alignment [30.8] 条件付きカバレッジを維持する必要があるエッジクラウドカスケードについて検討する。
リスクレベルに対するユーザ制御でこの特性を認証するコンフォーマルアライメントに基づくカスケード機構を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:49:01 GMT)
Domain Adaptation-based Edge Computing for Cross-Conditions Fault Diagnosis [30.7] 本稿では,エッジコンピューティングに適したドメイン適応型軽量故障診断フレームワークを提案する。
リアルタイム診断機能を確保しつつ、クロスワーク条件下で正確な故障診断を実現することを目的としている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:39:36 GMT)
LoRA is All You Need for Safety Alignment of Reasoning LLMs [30.6] 本稿では,SFT に LoRA を使用すれば,その推論能力を損なうことなく,安全のためにモデルを効果的に整列させることができることを示す。
これは、安全ウェイト更新を低ランク空間に制限することは、推論ウェイトとの干渉を最小限にするからである。
実験により, 本手法は, 全モデルファインチューニングに匹敵する安全性を保ちながら, 推論能力を損なうことなく, 安全性の高いLCMを生成できることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:12:21 GMT)
PolyJuice Makes It Real: Black-Box, Universal Red Teaming for Synthetic Image Detectors [30.2] PolyJuiceは、SIDのための最初のブラックボックス、イメージに依存しないリピート方式である。
また, ポリジュースステアリングT2Iモデルでは, ステアリングされていないモデルよりも, SIDの消耗が有意に効果的であることを示した。
PolyJuice拡張データセット上でSIDモデルをチューニングすることは、検出器の性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:09:42 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [30.2] 大規模言語モデル(LLM)は、微調整時に上流の知識を忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
微調整時のリプレイ例の重み付けにより, 統計的に忘れを有意に減らした。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:26:16 GMT)
Monotone and Separable Set Functions: Characterizations and Neural Models [30.1] プロパティ Monotone and Separating (MAS) セット関数を満たす関数を呼び出します。
我々はMAS関数が存在しないことを示すが、緩和されたMAS特性を確実に享受する我々のモデルを提供する。
また、MAS関数は、構成によって単調である普遍モデルを構築し、すべての単調集合関数を近似することができることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:59:07 GMT)
Graph Neural Network Based Action Ranking for Planning [30.0] 本稿では,行動のランク付け学習に基づく古典的計画政策の学習手法を提案する。
本稿では、アクション情報を明示的にキャプチャするグラフ表現を導入し、Gated Recurrent Units(GRU)を付加したグラフニューラルネットワーク(GNN)アーキテクチャを提案し、アクションランキングを学習する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:46:32 GMT)
On Optimal Steering to Achieve Exact Fairness [29.6] 経験的に、我々の合成と実世界の両方のデータセットにおける最適なステアリング技術は、実用性を低下させることなく公正性を向上する。
マルチクラス分類におけるバイアスを低減するために, LLM表現のアフィンステアリングを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:50:07 GMT)
Towards Fine-Grained Human Motion Video Captioning [29.5] 我々は,動き認識デコーディングを取り入れることでキャプション品質を向上させる新しい生成フレームワークであるMotion-Augmented Caption Model (M-ACM)を紹介する。
中心となるM-ACMは、人間のメッシュリカバリに由来する動きの表現を利用して、人間の身体のダイナミクスを明確に強調する。
実験の結果,M-ACMは複雑な人間の動きや微妙な時間変動を正確に記述する従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:06:04 GMT)
WCCNet: Wavelet-context Cooperative Network for Efficient Multispectral Pedestrian Detection [29.4] We propose a novel framework named Wavelet-context Cooperative Network (WCCNet)。
WCCNetは、計算複雑性の低い異なるスペクトルの相補的特徴を微分的に抽出することができる。
クロスモーダル相互情報を増幅するために、クロスモーダル再構成融合モジュール(CMRF)を精巧に設計する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:01:58 GMT)
Exciton and biexciton preparation via coherent swing-up excitation in a GaAs quantum dot embedded in micropillar cavity [29.1] 最近提案された量子エミッタ(SUPER)方式により、オフ共振・赤色変調レーザーパルスによる励起子のコヒーレントな準備が可能となった。
非常に偏光度の高い単一光子放出は、共鳴TPE飽和度を1.45倍超す。
これらの知見は、SUPERスキームを、量子フォトニクス応用に強い可能性を持つ、状態選択的エクシトンとバイエクシトン制御のための汎用的なツールとして確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:06:46 GMT)
Sample By Step, Optimize By Chunk: Chunk-Level GRPO For Text-to-Image Generation [29.0] Group Relative Policy Optimization (GRPO)は、フローマッチングベースのテキスト・ツー・イメージ(T2I)生成に強い可能性を示している。
我々は、最適化のパラダイムをステップレベルからチャンクレベルにシフトすることで、これらの問題を効果的に軽減できると主張している。
Chunk-GRPOは、T2I生成のための最初のチャンクレベルGRPOベースのアプローチである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:50:36 GMT)
3rd Place Solution to ICCV LargeFineFoodAI Retrieval [28.9] 本稿では,ICCV LargeFineFoodAI Retrieval Competition on Kaggleの3位となるソリューションを紹介する。
4つの基本モデルは、ArcFaceとCircleの損失の重み付けで独立に訓練されている。
さらに,拡散とk-相反再位に基づく新たな検索手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:04:32 GMT)
Group Inertial Poser: Multi-Person Pose and Global Translation from Sparse Inertial Sensors and Ultra-Wideband Ranging [28.9] Group Inertial Poserは、身体のポーズを強く推定し、複数の個人に対してグローバルな翻訳を行うための新しいアプローチである。
Group Inertial Poserは、超広帯域距離(UWB)からの2組のセンサー間の絶対距離を推定する
2人追跡のための最初のIMU+UWBデータセットであるGIP-DBを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:11:50 GMT)
Optimal Detection for Language Watermarks with Pseudorandom Collision [28.8] 階層的な2層分割によって構造を捉える統計的枠組みを導入する。
その中核は最小単位の概念であり、単位間の独立として扱うことができる最小の群は、単位内部への依存を許容する。
Gumbel-maxおよび逆変換透かしの適用により、我々のフレームワークはクローズドフォーム最適規則を生成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:21:52 GMT)
Uniform Convergence Beyond Glivenko-Cantelli [28.8] コレクションが任意の任意の推定器による一様平均推定を許可した場合にキャプチャするUniform Mean Estimability、別名$UME-$ learnabilityを導入する。
平均ベクトルの分離性が$UME-$学習可能性に十分であることを示す。
また、$UME-$学習可能コレクションの可算和も$UME-$学習可能であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:33:22 GMT)
MoniTor: Exploiting Large Language Models with Instruction for Online Video Anomaly Detection [28.6] ビデオ異常検出(VAD)は、ビデオ内の異常な活動や行動を特定することを目的としている。
オンラインVADは、リアルタイムの制約と計算強度のためにほとんど注目されなかった。
トレーニング不要なVAD(MoniTor)のための新しいメモリベースのオンラインスコアリングキュースキームを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:28:29 GMT)
Scalable Neural Incentive Design with Parameterized Mean-Field Approximation [28.2] 力学と報酬がリプシッツであるとき、有限$N$ ID の目標は、PMFG によって $mathscrO(frac1sqrtN)$ で近似されることを示す。
さらに、反復平衡作用素の明示的な微分を利用して勾配を効率的に計算する、随伴平均集中設計(AMID)アルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:18:54 GMT)
Fisher meets Feynman: score-based variational inference with a product of experts [28.1] ブラックボックス変分推論(BBVI)のための高表現性で明確に抽出可能なファミリーを導入する。
この家族の各メンバーは、専門家(PoE)の重み付けされた製品である。
補助ディリクレ確率変数を持つ潜在変数モデルとして、これらの専門家の積を再構成することで、これをどのように行うかを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:02:18 GMT)
AdFair-CLIP: Adversarial Fair Contrastive Language-Image Pre-training for Chest X-rays [28.1] 本稿では,AdFair-CLIPについて紹介する。
我々は胸部X線(CXR)データセットの総合的な実験を行い、AdFair-CLIPは公平性と診断精度の両方を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:01:37 GMT)
Towards Comprehensive Scene Understanding: Integrating First and Third-Person Views for LVLMs [27.9] 大きな視覚言語モデル(LVLM)は、仮想現実や拡張現実のようなインタラクティブなアプリケーションにますます多くデプロイされている。
この問題に対処するため,我々は,エゴセントリックなインプットを第三者(外部中心)の視点で強化するフレームワークを導入する。
E3VQAは、4Kの高品質な質問応答対を同期したエゴ・エクソ画像対に固定したマルチビュー質問応答のための最初のベンチマークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:43:13 GMT)
CausalRec: A CausalBoost Attention Model for Sequential Recommendation [27.8] 本稿では、シーケンシャルレコメンデーションのための因果注意を統合する新しいフレームワークCausalRecを提案する。
因果発見ブロックとCausalBoosterが組み込まれている。
CaulRecは、ヒットレート(HR)が7.21%、正規化カウント累積ゲイン(NDCG)が8.65%、最先端のいくつかの手法より優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:49:50 GMT)
Pctx: Tokenizing Personalized Context for Generative Recommendation [27.8] 生成レコメンデーション(GR)モデルは、各アクションをいくつかの個別トークン(セマンティックIDと呼ばれる)にトークン化し、予測として次のトークンを自動回帰的に生成する。
既存のトークン化メソッドは静的で個人化されていない。
セマンティックIDを生成する際に,ユーザの過去のインタラクションを取り入れたパーソナライズされたコンテキスト認識トークンを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:22:04 GMT)
HugAgent: Evaluating LLMs in Simulating Individual-Level Human Reasoning on Open-Ended Tasks [27.8] HugAgentは、平均的個人的推論適応のためのベンチマークである。
タスクは、特定の人がどのように推論し、新しいシナリオにおける信念を更新するかを予測することである。
HugAgentは、スケールとシステマティックなストレステストのための合成トラックと、有効な"アウトルード"推論データのための人間のトラックというデュアルトラックデザインを採用している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:23:35 GMT)
Is Temporal Difference Learning the Gold Standard for Stitching in RL? [27.8] 本稿では, 従来の縫合術の知恵が, 関数近似を用いた環境において実際に保持されているかを検討する。
我々はモンテカルロ法(MC)が経験的縫合を達成できることを実証的に実証した。
批判能力の増大はMC法とTD法の両方の一般化ギャップを効果的に減少させることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:00:14 GMT)
Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning [27.7] マルチLLMルーティングとアグリゲーションを逐次決定プロセスとして定式化する強化学習フレームワークである textbf Generalization-R1 を提案する。
学習を容易にするために,形式報酬と最終結果報酬と,性能とコストのバランスを最適化するための新たなコスト報酬からなる軽量なルールベース報酬を用いる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:22:08 GMT)
Surfer 2: The Next Generation of Cross-Platform Computer Use Agents [27.6] Surfer 2は3つの環境すべてにわたって最先端のパフォーマンスを実現する統一アーキテクチャである。
WebVoyagerでは97.1%の精度、WebArenaでは69.6%の精度、OSWorldでは60.1%、AndroidWorldでは87.1%の精度が達成され、タスク固有の微調整を伴わない以前のシステムよりも優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:52:29 GMT)
The Gray Zone of Faithfulness: Taming Ambiguity in Unfaithfulness Detection [27.3] 既存のベンチマークは、許容可能な外部知識の境界が不明確なため、アノテーションの曖昧さに悩まされている。
本稿では,中間カテゴリであるOut-Dependentを導入した新しい忠実度アノテーションフレームワークを提案する。
このフレームワークを用いて、要約における新しい不誠実検出ベンチマークであるVeriGrayを構築する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:13:51 GMT)
Preference-driven Knowledge Distillation for Few-shot Node Classification [27.2] グラフニューラルネットワーク(GNN)は、テキスト分散グラフ(TAG)を効率的に処理できる
LLMは、TAG上でゼロ/フェーショットの学習でうまく機能するが、スケーラビリティの課題に悩まされている。
本稿では,LLMと各種GNNの相補的強みを相乗化するための選好駆動型知識蒸留(PKD)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:51:28 GMT)
zip2zip: Inference-Time Adaptive Tokenization via Online Compression [27.2] zip2zipは、大規模言語モデルでコンテキスト適応トークン化を実現するための新しい方法である。
パラメータ効率のよい微調整により、既存のLLMを10GPU時間でzip2zipにアップトレーニングできることが示される。
結果としてLLMはテスト時間適応を行い、目に見えないコンテキストでハイパートークンを使うことを学び、入力トークンと出力トークンを15~40%削減する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:53:34 GMT)
KOALA++: Efficient Kalman-Based Optimization with Gradient-Covariance Products [27.0] KOALA++は、ニューラルネットワークトレーニングのためのスケーラブルなKalmanベースの最適化アルゴリズムである。
ニューラルネットワークトレーニングにおける構造的不確実性を明示的にモデル化する。
最先端の1次法よりも精度が高い。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:58:42 GMT)
The Rich and the Simple: On the Implicit Bias of Adam and SGD [26.7] Adamは、いくつかのディープラーニングアプリケーションのためのデファクト最適化アルゴリズムである。
実際には、(確率的な)勾配降下(GD)で訓練されたニューラルネットワーク(NN)は、単純さのバイアスを示すことが知られている。
我々は、Adamがこのような単純さのバイアスに抵抗していることを示します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:21:56 GMT)
Urban 3D Change Detection Using LiDAR Sensor for HD Map Maintenance and Smart Mobility [26.7] 都市規模LiDARのための物体中心型不確実性認識パイプラインを提案する。
これはエポックを多分解能NDTと整列し、次に点対平面ICP、高さを正規化し、位置検出レベルを導出する。
15代表のスービアコでは95.2%の精度、90.4%のmF1、82.6%のmIoUがトリプルトKPConvを超える精度、0.2のmF1、0.8のmIoUがブロックされ、IoUが74.8%に達し、7.6ポイント改善された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:59:55 GMT)
An Efficient Orlicz-Sobolev Approach for Transporting Unbalanced Measures on a Graph [26.7] 本研究では,全質量の異なるグラフ距離空間における測度に対する最適輸送(OT)について検討する。
従来の$Lp$幾何の制限を緩和するために、Orlicz-Wasserstein (OW) と一般化された Sobolev transport (GST) はOrlicz の幾何学構造を用いる。
二進探索アルゴリズムを用いてOrlicz-EPTを解く理論的背景を確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:52:05 GMT)
Causality Meets Locality: Provably Generalizable and Scalable Policy Learning for Networked Systems [26.7] トラフィック、電力、無線グリッドなどの大規模ネットワークシステムでは、スケールと環境の両方のシフトで強化学習エージェントに挑戦する。
本稿では,因果表現学習とメタアクタ批判学習を組み合わせ,拡張性とドメインの一般化を両立させるフレームワークGSACを提案する。
GSACの適応は,スクラッチや従来の適応ベースラインよりも速く,はるかに優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:06:43 GMT)
Energy-Efficient Domain-Specific Artificial Intelligence Models and Agents: Pathways and Paradigms [26.4] AI市場規模は2023年の1890億USDから2033年までに4.8兆USDに成長すると予測されている。
現在、AIは言語と視覚の知性を示す大きな言語モデルに支配されている。
これは、膨大な量のデータでトレーニングされた今日の大規模モデルから、エネルギー効率のよいドメイン固有エージェントを揺るがすための、AIの次の波を定義する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:21:08 GMT)
Multi-Atlas Brain Network Classification through Consistency Distillation and Complementary Information Fusion [26.4] 脳ネットワーク分類の標準アトラスは存在せず、障害の異常を検出するのに限界がある。
最近の手法では複数のアトラスを利用する方法が提案されているが、それらはアトラス間の一貫性を無視し、ROIレベルの情報交換を欠いている。
我々は,fMRIデータを用いた脳ネットワーク分類を改善するために,Atlas-Integrated Distillation and Fusion Network (AIDFusion)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:51:23 GMT)
InfiniPot-V: Memory-Constrained KV Cache Compression for Streaming Video Understanding [26.4] InfiniPot-Vは、ストリーミングビデオ理解のためのハードで長さに依存しないメモリキャップを強制する、トレーニング不要でクエリに依存しない最初のフレームワークである。
ピーク時のGPUメモリを最大94%削減し、リアルタイム生成を継続し、マルチターンダイアログでフルキャッシュの正確性にマッチまたは超える。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:39:03 GMT)
Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk [26.4] 我々は,多武装バンディットモデルにおける後悔分布の予測とテールリスクの最適トレードオフについて検討した。
任意の後悔しきい値に対する最適な後悔の尾の確率を特徴付けるために、新しいポリシーが提案されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:31:21 GMT)
Restore Text First, Enhance Image Later: Two-Stage Scene Text Image Super-Resolution with Glyph Structure Guidance [26.3] 生成超解像法は、自然な画像に対して強い性能を示すが、歪んだテキストを示す。
textbfText-textbfImage textbfGuided suptextbfEr-textbfResolution)を導入する。
最初は正確なテキスト構造を再構築し、次にフルイメージの超解像を導出する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:59:04 GMT)
Do Large Language Models Know How Much They Know? [26.1] 大規模言語モデル (LLM) は高機能なシステムとして登場した。
インテリジェントシステムの望ましい属性は、自身の知識の範囲を認識する能力である。
このベンチマークは、モデルが過度の、不十分な、あるいは正確な量の情報をリコールするかどうかを評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:24:01 GMT)
SPAN: Continuous Modeling of Suspicion Progression for Temporal Intention Localization [26.1] 本稿では,個別分類から連続回帰へ移行するSuspicion Progression Analysis Network (SPAN)を提案する。
SPANは低周波のケースでは2.74%のmAPゲインを達成し、微妙な行動変化を捉える優れた能力を示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:52:12 GMT)
BLEUBERI: BLEU is a surprisingly effective reward for instruction following [26.0] 基本的な文字列マッチングの指標であるBLEUは、一般的な命令追従データセット上での人間の嗜好と一致して、強い報酬モデルと驚くほど一致していることを示す。
BLEUBERI学習モデルは、報酬モデル誘導RLを用いて訓練されたモデルと競合することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:33:28 GMT)
DEEDEE: Fast and Scalable Out-of-Distribution Dynamics Detection [26.0] DEEDEEは、表現量の多いパイプラインを最小限の選択肢で再検討する2つの統計検出器である。
従来のRL OODスイートと一致し、コンピュートを600倍削減する。
以上の結果から,RLトラジェクトリに多種多様な異常型が小さな低次統計値を用いて印字されることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:51:17 GMT)
Scalpel: Automotive Deep Learning Framework Testing via Assembling Model Components [25.9] ディープラーニング(DL)は、自律運転システムにおいて重要な役割を果たす。
自律運転システムにDLモデルをデプロイすることは、リアルタイム処理、限られた計算資源、厳格な電力制約など、厳しい課題に直面します。
本稿では,テスト入力モデルをモデルコンポーネントレベルで生成する自動車用DLフレームワークテスト手法であるScalpelを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:28:41 GMT)
Towards Reliable Code-as-Policies: A Neuro-Symbolic Framework for Embodied Task Planning [25.9] 本稿では,コード生成時の明示的なシンボル検証と対話的検証処理を組み込んだ,ニューロシンボリックなタスク計画フレームワークを提案する。
我々はRLBenchと動的に部分的に観測可能なシナリオにわたる実環境設定のフレームワークを評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:01:08 GMT)
OpenHype: Hyperbolic Embeddings for Hierarchical Open-Vocabulary Radiance Fields [25.8] 連続的な双曲型潜在空間を用いてシーン階層を表現する新しい手法であるOpenHypeを提案する。
双曲幾何学の特性を活用することにより、OpenHypeは自然にマルチスケールな関係を符号化する。
提案手法は,標準ベンチマークにおける最先端手法よりも優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:17:56 GMT)
Compressing Quaternion Convolutional Neural Networks for Audio Classification [25.6] 第四次畳み込みニューラルネットワーク(QCNN)は、音声分類に広く用いられている。
本研究では,QCNNの計算複雑性を抑えるため,知識蒸留(KD)とプルーニング(Pruning)について検討する。
音声分類実験により,pruning QCNNsはKDと同等あるいは優れた性能を示し,計算労力の削減を図っている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:19:19 GMT)
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing [25.5] 本稿では,事前学習した流れモデルに対する推論時間スケーリング手法を提案する。
本稿では,SDE に基づく生成,特に分散保存型 (VP) 補間型 (VP) 生成は,フローモデルにおける推論時間スケーリングのための粒子サンプリング法を改善することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:46:06 GMT)
Embedding Trust: Semantic Isotropy Predicts Nonfactuality in Long-Form Text Generation [25.5] 意味的等方性(semantic isotropy)は、単位球上に正規化されたテキスト埋め込みをまたいだ均一性の度合いである。
単位球面上の埋め込みの角分散として,これらの応答のセマンティックな等方性レベルを推定する。
高いセマンティックなアイソトロピー、すなわち大きな埋め込み分散は、標本間の事実整合性を確実に低下させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:24:57 GMT)
Alternating Gradient Flows: A Theory of Feature Learning in Two-layer Neural Networks [25.0] 本稿では,ニューラルネットワークにおける特徴学習のダイナミクスを記述するアルゴリズムフレームワークであるAlternating Gradient Flows (AGF)を紹介する。
AGFは、動作を交互に2段階のプロセスとして近似する: 休眠ニューロン上のユーティリティ関数を最大化し、アクティブなニューロンに対するコスト関数を最小化する。
AGFは、完全連結線形ネットワークと注意のみの線形変換器において、既存のサドル・アンド・サドル解析を統一し、拡張することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:48:29 GMT)
$δ$-STEAL: LLM Stealing Attack with Local Differential Privacy [24.9] 我々は、相手のモデルユーティリティを保ちながら、サービス提供者の透かし検出器をバイパスするモデル盗難攻撃である$delta$-STEALを紹介します。
実験の結果、$delta$-STEALは敵のモデルユーティリティを著しく損なうことなく、最大9,6.95%の攻撃成功率を達成することがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:19:38 GMT)
BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning [24.9] B-spline Encoded Action Sequence Tokenizer (BEAST)について述べる。
BEAST は B-splines を用いて、アクションシーケンスをコンパクトな離散トークンまたは連続トークンにエンコードする。
BEASTは166のシミュレーションタスクと8つの実世界のタスクからなる3つの異なるロボット設定からなる3つの確立されたベンチマークで評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:20:29 GMT)
Unifying Re-Identification, Attribute Inference, and Data Reconstruction Risks in Differential Privacy [24.7] 攻撃成功のバウンダリは、再識別、属性推論、データ再構成リスクにまたがって、同一の統一形式をとることができることを示す。
この結果は, $varepsilon$-DP, R'enyi DP, および集中DPを用いた従来の方法よりも厳密である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:05:31 GMT)
Spiking Neural Networks Need High Frequency Information [24.6] スパイキングニューラルネットワークは、バイナリ(0/1)スパイクを通じて情報を伝達することで、脳にインスパイアされた計算を約束する。
しかし、それらの性能は、しばしば情報損失によって引き起こされると仮定される、人工知能ニューラルネットワークよりもまだ遅れている。
スパイキングニューロンは本質的に高周波成分を抑制し,低周波情報を優先的に伝播することを示す。
2つの周波数エンハンシング演算子を通して高周波信号を復元するMax-Formerを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:33:54 GMT)
A Smooth Sea Never Made a Skilled SAILOR: Robust Imitation via Learning to Search [24.5] 専門家によるデモンストレーションからL2S(L2S)を学習するためのアプローチを開発する。
テスト時に必要となるコンポーネントは,たとえミスを犯したとしても,専門家の成果にマッチするように計画しています。
我々のアプローチは、行動クローニングによって訓練された最先端の拡散政策を一貫して上回ります。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:39:18 GMT)
Virus Infection Attack on LLMs: Your Poisoning Can Spread "VIA" Synthetic Data [24.2] 本稿では,大規模言語モデルに対する合成データ統合学習のレジリエンスを定量的に評価する。
本稿では,ウイルス感染攻撃(VIA)という,新規で普遍的な攻撃枠組みを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:58:07 GMT)
Spiking Neural Networks for Radio Frequency Interference Detection in Radio Astronomy [23.6] スパイキングニューラルネットワーク(SNN)は、効率的でダイナミックなデータ処理を約束する。
本稿では,電波天文学,RFI(Radio Frequency Interference)検出における重要な課題を整理する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:41:10 GMT)
Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning [23.6] Autoregressive (AR)言語モデルでは、テキストを1つずつ生成することで、推論速度が制限される。
ハードセグメンテーションなしでデコードウインドウを狭める正規化法である畳み込み復号法(Conv)を提案する。
Rejecting Rule-based Fine-Tuning (R2FT)も導入しています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:56:21 GMT)
Fast Non-Log-Concave Sampling under Nonconvex Equality and Inequality Constraints with Landing [23.3] LAndOLLAは、平等と不等式の両方を設計できる新しいフレームワークである。
我々は、射影に基づく制約付きランゲヴィンアルゴリズムと比較して、可変射影の効率を実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:06:03 GMT)
Robustifying Learning-Augmented Caching Efficiently without Compromising 1-Consistency [23.2] Guardは軽量なロバスト化フレームワークで、学習強化型キャッシュアルゴリズムの堅牢性を2H_k + 2$に向上させる。
Guardは、一貫性と堅牢性の間の、現在のよく知られたトレードオフを実現している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:41:38 GMT)
Compositional Monte Carlo Tree Diffusion for Extendable Planning [23.0] Monte Carlo Tree Diffusion (MCTD) は、拡散モデルと構造木探索を統合し、ステップワイズ推論による効果的な軌道探索を可能にする。
C-MCTDは,個々の軌道の最適化から完全な計画構成の推論まで,プランニングを高めるフレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:42:38 GMT)
Data as a Lever: A Neighbouring Datasets Perspective on Predictive Multiplicity [23.0] 隣接データセットフレームワークを導入し、単一データポイント差が乗算性に与える影響について検討する。
クラス間分布の重なりが大きい近傍のデータセットは、多重度が低いことを示す。
当社のフレームワークは、アクティブラーニングとデータ計算という2つの実践領域に拡張しています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:01:40 GMT)
Generative Annotation for ASR Named Entity Correction [23.0] エンドツーエンドの自動音声認識システムは、ドメイン固有の名前のエンティティの書き起こしに失敗することが多い。
そこで本研究では,音声特徴を利用した新しいNEC手法を提案する。
我々はオープンソースのテストセットと自己構築テストセットを用いてテストを行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:35:39 GMT)
Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty [22.8] そこで本研究では,不確かさを解消するためのインタフェースを備えたプロアクティブなT2Iエージェントのプロトタイプを提案する。
このようなエージェントのシンプルなプロトタイプを構築し、スケーラブルで自動化された新しい評価手法を提案する。
3つの画像テキストデータセットを用いた実験は、提案されたT2Iエージェントが情報的質問をしたり、重要な情報を引き出す能力を示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:32:07 GMT)
Penalizing Length: Uncovering Systematic Bias in Quality Estimation Metrics [22.7] 品質評価(QE)メトリクスは、参照なし評価のための機械翻訳において不可欠であり、強化学習のようなタスクにおける報酬信号である。
第一に、QEメトリクスは、高品質でエラーのないテキストであっても、翻訳長の増大を伴うエラーを常に過大予測する。
これらの固有長バイアスは、より長く正しい翻訳を不公平に罰し、QEの再分類やQE指導による強化学習のような応用において、準最適決定につながる可能性がある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:22:06 GMT)
Beyond Pairwise: Empowering LLM Alignment With Ranked Choice Modeling [22.5] 選好最適化を(ランク付けされた)選好モデルでブリッジする統合フレームワークであるランク付き選好最適化(RCPO)を提案する。
ランク付けされた選好データを直接活用し、適切な選択モデルと組み合わせることで、より効果的なアライメントが得られることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:48:47 GMT)
Two-Steps Diffusion Policy for Robotic Manipulation via Genetic Denoising [22.4] 拡散モデルは、専門家のデモンストレーションを模倣してロボット操作の最先端の結果を得た。
具体的AIタスクの特定の特徴に認知過程を合わせることで、拡散ポリシーが効果的に機能できることが示される。
そこで本研究では,個体群をベースとした遺伝的デノナイジング手法を提案し,性能と安定性を両立させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:52:41 GMT)
TCM-Ladder: A Benchmark for Multimodal Question Answering on Traditional Chinese Medicine [22.2] 我々は,大規模なTCM言語モデルを評価するために特別に設計された,最初の総合マルチモーダルQAデータセットであるTCM-Ladderを紹介する。
このデータセットは、基礎理論、診断、草本式、内科、外科、薬物療法、小児科を含む、TCMの複数の中核分野をカバーする。
データセットは自動と手動のフィルタリングプロセスを組み合わせて構築され、52,000以上の質問で構成されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:25:34 GMT)
Multimodal Item Scoring for Natural Language Recommendation via Gaussian Process Regression with LLM Relevance Judgments [22.1] 自然言語レコメンデーション(NLRec)は,NL要求とNL項目記述の関連性に基づいて項目提案を生成する。
Dense Retrieval (DR) は、リクエストを唯一の関連ラベルとみなし、クエリの埋め込みを中心とした不正なスコアリング機能に繋がる。
本稿では,Gaussian Process Regression(GPR)とLLM関連判定を用いたGPR-LLMを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:03:20 GMT)
Adjacent Words, Divergent Intents: Jailbreaking Large Language Models via Task Concurrency [22.0] 既存のjailbreak攻撃は主にシーケンシャルロジックに従っており、大きな言語モデル(LLM)は各タスクをひとつずつ理解し、答える。
私たちは、$textttJAIL-CON$という、タスク$underlinetextCON$currencyを介してLLMを壊す反復攻撃フレームワークを紹介します。
ガードレールを防御として適用した場合、以前の攻撃で生成されたシーケンシャルな回答と比較して、@textttJAIL-CON$の同時回答はよりステルス性が高い。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:39:08 GMT)
Normalization in Attention Dynamics [22.0] 深部変圧器におけるトークン表現に対する正規化スキームの効果について検討する。
正規化は速度規制の一形態として機能することを示す。
この観点は、いくつかのスキームの統一的な解析を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:10:16 GMT)
RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting [22.0] 近年の河川流出予測の深層学習手法により,洪水予測の精度と効率が向上した。
既存の水文学における深層学習のアプローチは、主に局所的な応用に限られている。
本稿では,長期的再分析データを用いた新しいディープラーニングモデルであるRiverMambaを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:56:29 GMT)
Designing and Evaluating Hint Generation Systems for Science Education [22.0] 本研究では,学習内容への積極的関与を促進するための教育戦略としてのヒント自動生成の役割について検討する。
静的なヒント,各問題に対する事前生成,学習者の進行に適応した動的ヒントの2つの異なるヒント戦略を比較した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:00:16 GMT)
Model Merging with Functional Dual Anchors [21.8] モデルマージは、共有基盤モデルの複数の微調整されたチェックポイントから知識を統合するための効率的な戦略である。
本稿では、入力表現空間をモデル化するフレームワークであるFunctional Dual Anchors(FDA)を提案する。
FDAは、誘導勾配がタスクベクトルと一致し、事前訓練されたモデルに対してタスク固有の機能シフトをキャプチャする合成入力である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:54:06 GMT)
RadioMapMotion: A Dataset and Baseline for Proactive Spatio-Temporal Radio Environment Prediction [21.6] 本稿では,過去の観測から将来の地図の列を予測することを含む,動的RM予測の課題を提案する。
この予測アプローチの鍵となる障壁は、継続的環境進化をキャプチャするデータセットの欠如である。
物理的に一貫した車両軌道から生成された連続RMシーケンスの大規模公開データセットであるRadioMapMotionを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:25:25 GMT)
Differentially Private High-dimensional Variable Selection via Integer Programming [21.5] スパース変数選択は、情報的特徴の小さなサブセットを選択することにより、解釈可能性と高次元学習を改善する。
混合プログラミングの最近の進歩は、大規模な非プライベートレグレッションの解決を可能にしている。
MIPを向上する2つの新しい偏微分プライベート変数選択を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:57:33 GMT)
DePass: Unified Feature Attributing by Simple Decomposed Forward Pass [21.5] DePassは単一のフォワードパスに基づいた機能属性のための統一されたフレームワークである。
補助訓練を必要とせず、忠実できめ細かな属性を達成できる。
DePassが、解釈可能性における幅広いアプリケーションの基礎となるツールになることを願っています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:00:34 GMT)
Making Classic GNNs Strong Baselines Across Varying Homophily: A Smoothness-Generalization Perspective [21.4] グラフニューラルネットワーク(GNN)は大きな成功を収めてきたが、グラフ内の様々なレベルのホモフィリにより、しばしば挑戦される。
最近のテクテミカル研究は、ホモフィリックGNNは異なるホモフィリレベルのデータセット間でうまく機能することを示した。
Inceptive Graph Neural Network (IGNN) は3つのシンプルで効果的な設計原理に基づいて構築されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:18:43 GMT)
Input Adaptive Bayesian Model Averaging [21.0] 本稿では,複数の候補モデルによる予測について検討する。
入力にモデル重みを割り当てるベイズ法である入力適応ベイズモデル平均化(IA-BMA)を提案する。
IABMAは回帰・分類作業、パーソナライズされたがん治療データ、クレジットカード詐欺検出データ、UCIデータセットから評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:23:17 GMT)
Redefining Retrieval Evaluation in the Era of LLMs [20.8] 従来の情報検索(IR)メトリクスは、人間が下位階級への注意を減らした文書を逐次調査することを前提としている。
この仮定は、Large Language Models (LLM) によって検索結果が消費される検索拡張生成(RAG)システムにおいて破られる。
本稿では,関連するパスの肯定的な寄与と,注意をそらすパスのネガティブな影響の両方を定量化するユーティリティベースのアノテーションスキーマを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:17:00 GMT)
Mind the GAP! The Challenges of Scale in Pixel-based Deep Reinforcement Learning [20.4] エンコーダの出力とそれに続く高密度層との接続を,スケーリング能力を制限する主要な要因として同定する。
我々は,グローバル平均プーリングを,ボトルネックをターゲットとするシンプルかつ効果的な方法として提示し,それ以前のアプローチの複雑さを回避する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:29:59 GMT)
Learning normalized image densities via dual score matching [20.3] 拡散生成モデルにインスパイアされた固有化エネルギー(log probability)モデルを学習するための新しいフレームワークを提案する。
我々は、その帰納バイアスを保ちながらエネルギーを計算するためにスコアネットワークアーキテクチャを変更した。
重なり合わないデータサブセットでトレーニングされた2つのネットワークで推定されたログ確率は、ほぼ同一である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:34:09 GMT)
LaX: Boosting Low-Rank Training of Foundation Models via Latent Crossing [20.2] 我々は,低ランクサブスペース間の情報フローを可能にすることで,低ランクモデルのキャパシティを向上させるプラグイン・アンド・プレイモジュールである textbfLatent Crossing (LaX) を紹介する。
LaXは2-3(times)少ないパラメータを使用しながら、低ランクモデルのパフォーマンスをフルランクのベースラインにマッチまたは超えるように向上する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:44:37 GMT)
TerraGen: A Unified Multi-Task Layout Generation Framework for Remote Sensing Data Augmentation [20.2] 現在の生成データ拡張フレームワークはタスク分離されており、各ビジョンタスクは独立した生成モデルをトレーニングする必要がある。
リモートセンシング画像のフレキシブルかつ空間的に制御可能な合成を可能にする統合レイアウト・画像生成フレームワークである textbfTerraGen を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:29:12 GMT)
TPO: Aligning Large Language Models with Multi-branch & Multi-step Preference Trees [20.0] 本稿では、選好木からペア化された選好応答をサンプリングしないツリー選好最適化(TPO)を導入する。
TPOは、言語モデルのアライメントを、優先順位リストランキング問題として定式化する。
実験の結果、TPOは4つのデータセット上の5つの公開大言語モデルにおいて、DPOを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:56:39 GMT)
Revisiting Orbital Minimization Method for Neural Operator Decomposition [19.9] 計算化学における固有値問題の解法として1990年代に提案されたインフォロビタル法(英語版)(OMM)と呼ばれる古典的最適化フレームワークを再考する。
我々は、ニューラルネットワークをトレーニングして正の半定値演算子を分解し、その実用的な利点を様々なベンチマークタスクで示すために、このフレームワークを適用した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:26:18 GMT)
DocFinQA: A Long-Context Financial Reasoning Dataset [19.8] 長期の財務QAタスクを導入します。
平均文脈長をFinQAの700語未満からDocFinQAの123k語に拡張する。
検索に基づくQAパイプラインと長文言語モデルに関する広範な実験を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:00:25 GMT)
BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent [19.8] リンクシンクリンク(Blink-Think-Link)は、人間のGUIインタラクションのための脳に触発されたフレームワークである。
このシステムは相互作用を3つの生物学的にもっともらしい相に分解する。
Blink Data GenerationとBTL Rewardは、プロセスと結果の両方によって駆動される強化学習を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:50:51 GMT)
Rolling Ball Optimizer: Learning by ironing out loss landscape wrinkles [19.7] 大規模ニューラルネットワーク(NN)のトレーニングには,高次元データ依存損失関数の最適化が必要である。
これらの関数は、しばしば非常に複雑で、テクスチャがあり、フラクタル的ですらある。
トレーニングデータのノイズは前方に伝播し、非表現的な小さな幾何学をもたらす。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:55:44 GMT)
Central Limit Theorems for Transition Probabilities of Controlled Markov Chains [19.5] 制御マルコフ連鎖における遷移行列の非パラメトリック推定器に対する中心極限定理(CLT)を開発する。
我々は、推定モデルから得られた最適ポリシーを含む任意の定常ポリシーの値、Q-、利点関数についてCLTを導出する。
これらの結果は、オフライン政策評価と最適政策回復のための新しい統計ツールを提供し、遷移確率の仮説テストを可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:03:54 GMT)
Point Cloud Synthesis Using Inner Product Transforms [19.3] 内部積を用いた点雲の幾何学的位相特性を符号化する新しい手法を開発した。
我々のエンコーディングは、再構成、生成、推論といった典型的なタスクにおいて、既存の手法よりも桁違いに高速な推論時間で高品質である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:30:00 GMT)
Disentangled Representation Learning via Modular Compositional Bias [19.2] 目的とアーキテクチャの両方から分離されたモジュラー帰納バイアスである構成バイアスを提案する。
我々の重要な洞察は、異なる要因がデータ分散において異なる組換え規則に従うことである。
提案手法は属性とオブジェクトの絡み合いの両面での競合性能を示し,グローバルなスタイルとオブジェクトの絡み合いを一意に達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:46:19 GMT)
3rd Place Solution to Large-scale Fine-grained Food Recognition [19.2] 本稿では,Kaggleで実施したLargeFineFoodAI-ICCV Workshop-Recognitionに関するソリューションの詳細について述べる。
アークフェイスと複合的な損失により、モデルは慎重に調整された構成で訓練され、最終的な結果を得るために組み立てられた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:05:28 GMT)
Diffusing DeBias: Synthetic Bias Amplification for Model Debiasing [18.9] Diffusing DeBias (DDB) を、教師なしモデルデバイアスの一般的な方法のためのプラグインとして導入する。
具体的には、条件付き拡散モデルを用いて、合成バイアス整合画像を生成する。
補助モデル学習におけるバイアス分散トレーニングサンプルの根本的な問題に対処することにより、提案手法は複数のベンチマークデータセットで最先端のモデルに勝る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:32:07 GMT)
Explaining and Mitigating Crosslingual Tokenizer Inequities [18.8] 高いトークンプレミアムを持つことは、トレーニング中のスループットを低下させ、推論時のコストを増大させる。
97言語で約7,000の同等のモノリンガルトークンをトレーニングします。
トレーニングデータとテストデータの類似性はトークンのプレミアムに影響しないが、語彙サイズや事前トークン化には影響しない。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:36:03 GMT)
DERD-Net: Learning Depth from Event-based Ray Densities [18.8] イベントカメラは、多視点ステレオ深度推定とSLAMのための有望な道を提供する。
本稿では,単眼・ステレオ両方のイベントカメラを用いた画素幅推定のための,スケーラブルでフレキシブルで適応可能なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:00:19 GMT)
Size and Smoothness Aware Adaptive Focal Loss for Small Tumor Segmentation [18.6] 本稿では,オブジェクト境界の滑らかさとサイズを考慮に入れた適応的焦点損失(A-FL)を提案する。
提案したA-FLは、オブジェクトの表面の滑らかさ、サイズ、およびクラスバランスパラメータに基づいて動的に自身を調整する。
PICAI 2022およびBraTS 2018データセットにおけるA-FLの性能を評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:57:31 GMT)
NoisyGRPO: Incentivizing Multimodal CoT Reasoning via Noise Injection and Bayesian Estimation [18.6] NoisyGRPOは、マルチモーダル強化学習フレームワークである。
視覚入力に制御可能なノイズを導入し、探索を強化する。
ベイズフレームワークによる利点推定プロセスを明示的にモデル化する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:23:34 GMT)
Instance-Adaptive Hypothesis Tests with Heterogeneous Agents [18.4] 民間情報を持つ戦略エージェントの異種集団に対する仮説テストについて検討した。
ペイオフ構造と型最適試験を組み合わせた統計契約のメニューを設計する方法について述べる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:00:44 GMT)
Bridging the gap to real-world language-grounded visual concept learning [18.4] 本稿では,画像関連概念の軸を適応的に識別し,現実のシーンにおけるこれらの軸に沿った視覚概念を基盤とするスケーラブルなフレームワークを提案する。
我々は、ImageNet、CelebA-HQ、AFHQのサブセットに対するフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:54:13 GMT)
How Many Domains Suffice for Domain Generalization? A Tight Characterization via the Domain Shattering Dimension [18.3] ドメインの集合が与えられた場合、家族内の見知らぬすべてのドメインに対して合理的に機能するモデルを学ぶために、ランダムにサンプリングされたドメインを何個集める必要があるか?
ドメインの破砕次元(ドメインの破砕次元)と呼ばれる新しい尺度を導入し、この次元がドメインのサンプルの複雑さを特徴づけることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:40:40 GMT)
TENDE: Transfer Entropy Neural Diffusion Estimation [18.3] 本研究では,条件付き相互情報を用いた転送エントロピー推定手法であるTENDE(Transfer Entropy Neural Diffusion Estimation)を提案する。
既存のニューラルネットワーク推定器や、合成ベンチマークや実データにまたがる最先端のアプローチと比較して、精度と堅牢性は優れています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:42:22 GMT)
Co-Sight: Enhancing LLM-Based Agents via Conflict-Aware Meta-Verification and Trustworthy Reasoning with Structured Facts [18.2] Co-Sightは推論を偽造可能で監査可能なプロセスに変える。
コンフリクト・アウェア・メタ検証(CAMV)とTrustworthy Reasoning with Structured Facts(TRSF)の2つのメカニズム
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:14:14 GMT)
On Transferring Transferability: Towards a Theory for Size Generalization [18.2] グラフニューラルネットワークに関する最近の研究は、低次元データで訓練されたモデルがその性能を高次元入力に転送できるかどうかを探求している。
本稿では,次元間での転送可能性に関する一般的な枠組みを紹介する。
転送性は、小さな問題インスタンスと等価な大きな問題インスタンスを識別することによって形成される極限空間の連続性と正確に一致することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:27:19 GMT)
Cultivating Pluralism In Algorithmic Monoculture: The Community Alignment Dataset [18.2] 本研究は,21種類のLLMの反応に比べて,ヒトの嗜好の変動が有意に大きいことを示す。
このことは、候補集合を生成する際に、負に相関するサンプリングの必要性を動機付けていると論じる。
コミュニティアライメント(Community Alignment)は,これまでで最大かつ最も代表的な多言語およびマルチターンの嗜好データセットである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:17:14 GMT)
Scalable Valuation of Human Feedback through Provably Robust Model Alignment [18.2] 頑健なアライメント目的は、厳密なラベルノイズの下でも同一のモデルパラメータを生成するべきである。
証明可能な再帰特性を持つ最初の原理的アライメント損失であるH"older-DPOを提案する。
このメトリクスはグラデーションフリーで、スケーラブルで自動化された人間のフィードバックの評価を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:13:46 GMT)
Equivariance by Contrast: Identifiable Equivariant Embeddings from Unlabeled Finite Group Actions [18.1] 観測対$(mathbfy, g cdot mathbfy)$から同変埋め込みを学び、データに作用する有限群から$g$が引き出される。
提案手法は,群作用が可逆線型写像に対応する潜在空間と群表現を共同で学習する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:59:46 GMT)
Fixed-Point RNNs: Interpolating from Diagonal to Dense [18.1] リニアリカレントニューラルネットワーク(RNN)とステートスペースモデル(SSM)は、トランスフォーマーアーキテクチャにおけるシーケンス混合層としてのソフトマックスアテンションに代わる有望な代替手段となっている。
しかし、現在のモデルはチャネルワイド(対角)配列の混合に依存するため、RNNの完全な状態追跡表現性は示さない。
本稿では, 並列化可能な対角RNNの固定点としての高密度線形RNNのパラメータ化について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:27:32 GMT)
VOGUE: A Multimodal Dataset for Conversational Recommendation in Fashion [18.0] VOGUEは、現実的なファッションショッピングシナリオにおける60人の人間対話の新たなデータセットである。
各対話は、共有されたビジュアルカタログ、アイテムメタデータ、ユーザーファッションプロファイルと履歴、およびSeekersとAssistantsの会話後の評価と組み合わせられる。
VOGUEの初期解析では,視覚的に接地された対話の特異なダイナミクスが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:45:29 GMT)
Matchings Under Biased and Correlated Evaluations [18.0] 2つの異なるグループからの候補を評価できる2施設の安定マッチングモデルについて検討した。
マッチングプロセスによって選択された不利な候補に対する表現比、すなわち不利な候補の割合について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:33:52 GMT)
SharpZO: Hybrid Sharpness-Aware Vision Language Model Prompt Tuning via Forward-Only Passes [18.0] 微調整型視覚言語モデル(VLM)は、様々な下流タスクで顕著なパフォーマンスを実現している。
バックプロパゲーション(BP)を通じてモデル勾配にアクセスする必要があり、メモリ制約のある推論のみのエッジデバイスには適さない。
本稿では,ZO VLMファインチューニングの性能向上を目的としたシャープネス対応ゼロ階最適化(SharpZO)手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:22:59 GMT)
Adaptive Graph Mixture of Residual Experts: Unsupervised Learning on Diverse Graphs with Heterogeneous Specialization [17.9] 我々は、グラフ上の不均一なMoEの堅牢で完全に教師なしのトレーニングを可能にする、原則化されたフレームワークであるADaMoREを紹介する。
構造認識型ゲーティングネットワークは、きめ細かいノードルーティングを実行する。
私たちの設計はデータ効率とトレーニングの安定性を改善します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:18:24 GMT)
Anisotropic Pooling for LUT-realizable CNN Image Restoration [17.8] 画像復元CNNのテーブルルックアップ実現は、競争力のある画像品質を実現する可能性を秘めている。
主要な技術的課題は、受容場を過度に制限することなくテーブルサイズを管理することである。
本研究では, 平均プールよりも測定可能な利得をもたらす一般化中央プール法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:14:57 GMT)
Depth-Supervised Fusion Network for Seamless-Free Image Stitching [17.8] 画像縫合は、複数の視点から撮影された画像をより広い視野で単一の画像に合成する。
物体の深さの顕著な変化は、しばしば大きな視差を生じさせ、結果として、縫合された結果にゴーストや不一致をもたらす。
そこで本研究では,深度に制約のあるシームレスな画像縫合法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:36:08 GMT)
Magical: Medical Lay Language Generation via Semantic Invariance and Layperson-tailored Adaptation [17.7] MLLG(Messical Lay Language Generation)は、科学コンテンツへのアクセス性向上に重要な役割を担っている。
近年のMLLGの文献では、Low-Rank Adaptation (LoRA) のようなパラメータ効率のよい微調整法が一般的である。
LoRAは、マルチソースの異種MLLGデータセットによって引き起こされる課題に対処する。
異種データシナリオ下でMLLGに適した非対称LoRAアーキテクチャであるMagicalを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:50:54 GMT)
An Evaluation of DUSt3R/MASt3R/VGGT 3D Reconstruction on Photogrammetric Aerial Blocks [17.6] 3Dコンピュータビジョンアルゴリズムは、スパースで非順序のイメージセットの処理に引き続き進歩している。
近年,3次元再構成のための基礎モデルが注目されている。
本稿では,DUSt3R/MASt3R/VGGTモデルを用いて,ポーズ推定と高密度3次元再構成を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:57:40 GMT)
LEGNet: A Lightweight Edge-Gaussian Network for Low-Quality Remote Sensing Image Object Detection [17.6] 本稿では,新しいエッジ・ガウス・アグリゲーション(EGA)モジュールを備えた軽量バックボーンネットワークであるLEGNetを紹介する。
EGAモジュールは、(a)低コントラストやぼやけたオブジェクトでしばしば失われる重要なエッジの詳細を鋭くするために、方向対応のScharrフィルタと、(b)ノイズを抑え、あいまいな特徴応答を規則化するガウス的特徴改善を統合している。
5つのベンチマークの総合的な評価は、LEGNetが最先端のパフォーマンス、特に低品質なオブジェクトの検出を達成していることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:47:22 GMT)
ECG-Soup: Harnessing Multi-Layer Synergy for ECG Foundation Models [17.4] 心電図のためのトランスフォーマーベース基礎モデル(ECG)は、近年、多くの下流アプリケーションで顕著な性能を達成している。
ECGは心臓病の診断と治療に用いられる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:01:10 GMT)
Robust LLM Alignment via Distributionally Robust Direct Preference Optimization [17.4] 大規模言語モデル(LLM)と人間の好みを一致させる上での大きな課題は、分散シフトの問題である。
We developed two novel distributionally robust direct preference optimization (DPO) algorithm、すなわち Wasserstein DPO (WDPO) and Kullback-Leibler DPO (KLDPO)。
WDPO と KLDPO が優先分布シフトの際のアライメントを大幅に改善する上で,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:47:35 GMT)
Bridging Function Approximation and Device Physics via Negative Differential Resistance Networks [17.4] Kanalogue は、負の差動抵抗デバイスを用いた Kolmogorov-Arnold Networks (KAN) の完全なアナログ実装である。
NbSi2N4/HfSi2N4ヘテロ構造から作製したトンネルダイオードの固有負差抵抗特性を利用して、座標ワイド非線形性を構築する。
その結果,デジタルベースラインと競合する分類精度を維持しつつ,最小限のパラメータで複雑な関数を近似できることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:38:22 GMT)
Preference Learning with Response Time: Robust Losses and Guarantees [17.2] 応答時間情報をバイナリ選択データとともに組み込む新しい手法を提案する。
我々は、報酬モデル学習のためのオラクル収束率を達成するニーマン直交損失関数を開発する。
我々の実験は、画像よりも好み学習の文脈における理論的知見を検証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:28:10 GMT)
APOLLO: Automated LLM and Lean Collaboration for Advanced Formal Reasoning [16.9] 本稿では,自動定理証明のためのモデルに依存しないエージェントフレームワークであるAPOLLO (Automated PrOof repair viaLLM and Lean cOllaboration)を提案する。
エージェントのセットは、証明を分析し、シンタックスのエラーを修正し、リーンを使って証明の誤りを特定し、失敗するサブレムマを分離し、自動化されたソルバを利用し、残りの目標に対してLLMを呼び出す。
この結果から,LLM出力を目標としたコンパイラ誘導型修復は,効率と正確性の両方において劇的に向上することが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:52:17 GMT)
Lost in Transmission: When and Why LLMs Fail to Reason Globally [16.8] 本稿では,アテンションヘッド上の帯域制限をモデル化する新しい計算フレームワークである,バウンダリ・アテンションプレフィックス・オラクル(BAPO)モデルを紹介する。
グラフ到達性のような重要な理由付け問題は、BAPOが解決するためには、高い通信帯域幅を必要とすることを示す。
本研究は,LLMの故障の原理的説明とアーキテクチャの方向性,帯域幅制限を緩和する推論手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:28:22 GMT)
Help the machine to help you: an evaluation in the wild of egocentric data cleaning via skeptical learning [16.8] この調査では、大学生が4週間にわたってデバイス上でiLogのモバイルアプリケーションを使用する。
その結果、ユーザの努力とデータ品質の適切なバランスを見つけるという課題が浮かび上がっています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:01:24 GMT)
Leveraging semantic similarity for experimentation with AI-generated treatments [16.7] 大規模言語モデル(LLM)は、ヒトとモデル生成コンテンツを組み合わせた新しい形式のデジタル実験を可能にする。
この設定の主な方法論的課題は、これらの高次元的な処理を意味を失わずに表現することである。
このような治療の基盤となる構造を捉えた低次元表現の学習を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:19:22 GMT)
Statistically Valid Post-Deployment Monitoring Should Be Standard for AI-Based Digital Health [16.5] FDAが登録しているAIベースの医療ツールのわずか9%に、デプロイ後の監視計画が含まれている。
既存の監視アプローチはしばしば手動、散発的、リアクティブである。
本稿では,データの変化の検出とモデル性能の劣化を,統計的に異なる仮説テスト問題として扱うことを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:09:53 GMT)
Universal Cross-Tokenizer Distillation via Approximate Likelihood Matching [16.4] 蒸留は、Large Language Model (LLM) の教師から学生のLLMに知識を移すことで顕著な成功を収めた。
現在の蒸留法では、教師と学生の間で同様のトークン化剤が必要であり、その適用性は教師と学生のペアのごく一部に限られている。
そこで本研究では, クロストケナイザー蒸留法を開発した。
本手法は, 従来手法よりも高い性能を示しつつ, 基本的に異なるトークン化剤間で有効蒸留を可能にする最初の方法である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:49:40 GMT)
Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections [16.3] Uライクネットワークは、スキップ接続による医用画像セグメンテーションの基本的なフレームワークとなっている。
従来のスキップ接続には、機能間制約と機能内制約の2つの重要な制限がある。
本稿では,動的スキップ接続(DSC)ブロックを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:17:44 GMT)
Randomized Neural Network with Adaptive Forward Regularization for Online Task-free Class Incremental Learning [16.3] 本稿では,前向き正則化(-F)を備えたニューラルネットワーク(NN)を提案する。
調整可能な前方正規化(-kF)を用いたアンサンブル深部乱数ベクトル関数型リンクネットワーク(edRVFL)のアルゴリズムを導出する。
EDRVFL-kFは、1パスのクローズドフォームのインクリメンタルアップデートと可変学習率を生成し、過去のリプレイや破滅的な忘れを効果的に回避する。
プラグアンドプレイのedRVFL-kF-Bayesに改良を加え、複数のサブラーナーのすべてのハードkを自己適応的に決定できるようにする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:50:13 GMT)
Controllable-LPMoE: Adapting to Challenging Object Segmentation via Dynamic Local Priors from Mixture-of-Experts [16.2] 制御可能LPMoEと呼ばれる、トレーニング可能なパラメータが少ない新しい動的事前学習パラダイムを提案する。
入力画像から多種多様な局所前駆体を異種畳み込みによりキャプチャする軽量な動的混合局所前駆体抽出器を構築した。
また、コサインアラインな変形性アテンションとチャネル指向適応スケールエンハンスメントを利用した双方向インタラクションアダプタを設計する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:03:59 GMT)
FrameShield: Adversarially Robust Video Anomaly Detection [16.2] Weakly Supervised Video Anomaly Detection (WSVAD)は目覚ましい進歩を遂げているが、既存のモデルは敵攻撃に弱いままであり、信頼性が制限されている。
本研究では、時間的整合性を維持しつつ、通常のビデオの局所化領域に重篤な拡張を加えて合成異常を生成する「時空間歪み(Spatiotemporal Region Distortion, SRD)」と呼ばれる新しい擬似異常生成手法を提案する。
提案手法は,WSVADモデルの敵攻撃に対するロバスト性を大幅に向上させ,複数のベンチマークでAUROC全体のパフォーマンスを平均71.0%向上させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:59:43 GMT)
Beyond Seeing: Evaluating Multimodal LLMs on Tool-Enabled Image Perception, Transformation, and Reasoning [16.2] MLLMのビジュアルツール利用推論ベンチマークであるVisualToolBenchを紹介する。
VisualToolBenchは、複雑な視覚的テキストタスクに対するMLLMの知覚、変換、推論能力について、厳格に評価している。
評価の結果,現在のMLLMは視覚と汎用ツールの効果的な統合を必要とするタスクに苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:29:20 GMT)
SimuRA: A World-Model-Driven Simulative Reasoning Architecture for General Goal-Oriented Agents [15.9] SimuRAは汎用エージェント推論のための目標指向アーキテクチャである。
我々は、オープンソースの研究デモとして、SimuRA上に構築されたWebブラウジングエージェントReasonerAgent-Webをリリースした。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:44:52 GMT)
Chatbot To Help Patients Understand Their Health [15.8] NoteAid-Chatbotは,新たな‘会話としての学習’フレームワークを通じて,患者の理解を促進する会話型AIだ。
NoteAid-Chatbotは、医療会話戦略を用いて合成された会話データの初期教師付き微調整と、シミュレートされた病院退院シナリオにおける患者理解評価から得られる報酬のRLの2段階で訓練された軽量LLaMA 3.2 3Bモデルに基づいて構築された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:50:25 GMT)
A Unified Approach to Submodular Maximization Under Noise [15.8] 我々は,関数の雑音値オラクルにアクセスできる部分モジュラ函数を最大化する問題を考える。
greedy greedyアルゴリズムを用いて、雑音下での非拘束的(非モノトーン)部分モジュラーに対する1/2$-近似を求める。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:31:25 GMT)
Smooth Sailing: Lipschitz-Driven Uncertainty Quantification for Spatial Association [15.7] 本研究は, モデル不特定性や非ランダムな位置の面において, 信頼区間を構築するための既存の手法が, 名目上は適用できないことを示す。
本研究では,空間的環境下での関連性に対して,有効かつ頻繁な信頼区間を構築する手法を提案する。
我々のアプローチは、この設定における名目上のカバレッジを保証し、実・模擬両方の実験において既存の技術より優れています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:57:56 GMT)
Reverse Engineering Human Preferences with Reinforcement Learning [15.7] 大規模言語モデル(LLM)は、人間の嗜好を予測するために訓練された他のLLMによって日常的に評価される。
これまでの研究では、候補LLMが生成した回答をポストホックで編集して、審査員LLMが割り当てたスコアを最大化できることが示されている。
我々は、異なるアプローチを採用し、判定LLMによって提供される信号を、逆向きにモデルをチューニングする報酬として利用する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:30:19 GMT)
Structured Linear CDEs: Maximally Expressive and Parallel-in-Time Sequence Models [15.7] 本研究は、構造線形制御微分方程式(SLiCE)を導入する。
これは、構造化された入力依存状態遷移行列を持つシーケンスモデルの統一フレームワークである。
SLiCE はブロック対角行列、スパース行列、ウォルシュ・アダマール行列を用いる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:08:05 GMT)
Can Agents Fix Agent Issues? [15.5] LLMベースのエージェントシステムは、新しいソフトウェアパラダイムとして登場し、医学、ロボティクス、プログラミングといった様々な領域で広く採用されている。
これらのシステムを維持するには、バグが必然的に発生し、外部の要求に合うように継続的に進化するため、かなりの努力が必要です。
最近のソフトウェア工学(SE)エージェントは、従来のソフトウェアシステムにおける問題に対処することを約束しているが、エージェントシステムにおける現実の問題がどの程度効果的に解決できるかは不明だ。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:24:39 GMT)
Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization [15.5] 人間はAIを一貫して上回り、聴覚情報に頼ることによって、対立や欠落した視覚に対して優れたレジリエンスを示す。
本稿では,3次元シミュレーションにより生成したステレオオーディオ画像データセットを用いて,神経科学にインスパイアされたモデルであるEchoPinを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:21:57 GMT)
Guided MRI Reconstruction via Schrödinger Bridge [15.4] コントラスト前のコントラストを利用して、アンダーサンプルデータから画像再構成を改善することができる。
$mathbfI2$SB-InversionはSchr"odinger Bridge (SB)に基づくガイド付き再構築フレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:29:54 GMT)
QuestBench: Can LLMs ask the right question to acquire information in reasoning tasks? [15.4] 現実世界のクエリはしばしば不特定であり、不足した情報を取得することでのみ解決可能である。
クエストベンチ(QuestBench)は、少なくとも1つの質問で解ける未特定な推論タスクの集合である。
分析の結果, 精度の高い推論問題を解く能力は, ベンチマークで成功するには不十分であることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:18:36 GMT)
QAE-BAC: Achieving Quantifiable Anonymity and Efficiency in Blockchain-Based Access Control with Attribute [15.3] 本稿では、アクセス属性と履歴に基づいて、ユーザの再識別リスクを定量化するための形式的(r, t)匿名モデルを提案する。
また、EWPT(Entropy-Weighted Path Tree)も備えており、リアルタイムの匿名度測定値に基づいてポリシー構造を最適化している。
実験の結果,再識別リスクを効果的に軽減し,最先端のベースラインを上回っ,スループットが最大11倍向上し,レイテンシが87%低減した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:28:41 GMT)
Deep Gaussian Processes for Functional Maps [15.3] 関数・オン・ファンクショナル・レグレッション(Function-on-function regression)とも呼ばれる関数空間間の学習は、関数データ解析において重要な役割を果たす。
既存のアプローチでは、複雑な非線形性を捉えることができず、ノイズやスパース、不規則にサンプリングされたデータの下で信頼性の高い不確実性を欠いている。
これらの問題に対処するために,DGPFM(Deep Gaussian Processes for Functional Maps)を提案する。
本手法は, GPからサンプリングしたカーネル, GP, 非線形アクティベーションの積分変換を利用して, GPに基づく線形および非線形変換の系列を設計する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:05:48 GMT)
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol [15.3] 理論的保証のあるモデルフリーおよびモデルベースセレクタを新たに開発する。
従来のモデルフリープロトコルと比較して、新しいプロトコルではより安定した生成と候補値関数の制御が可能である。
我々の新しいモデルフリーセレクタであるLSTD-Tournamentは有望な経験的性能を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:34:23 GMT)
From Events to Trending: A Multi-Stage Hotspots Detection Method Based on Generative Query Indexing [15.3] 本稿では、オフライン生成とオンライン識別の両方の観点から体系的な最適化を実現する、トレンド検出のための多段階フレームワークを提案する。
オフライン評価とオンラインA/Bテストの両方において,本フレームワークはベースライン手法よりも有意に優れており,ユーザ満足度は正負のフィードバック比で27%向上した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:49:38 GMT)
SciNUP: Natural Language User Interest Profiles for Scientific Literature Recommendation [15.0] 推薦システムにおける自然言語(NL)ユーザプロファイルは、透明性とユーザコントロールを向上する。
NLプロファイルベースのレコメンデーションを評価するために,大規模な公開テストコレクションが不足している。
本稿では,学術推薦のための新しい合成データセットであるSciNUPを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:28:08 GMT)
Privacy by Design: Aligning GDPR and Software Engineering Specifications with a Requirements Engineering Approach [14.8] 異なる利害関係者の要求に対処し、コンプライアンスを確保するために、法的な知識を仕様で捉えなければならない。
既存のアプローチは問題空間と解空間の複雑な交叉を説明できない。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:59:34 GMT)
Large Language Models Meet Text-Attributed Graphs: A Survey of Integration Frameworks and Applications [14.8] 大規模言語モデル(LLM)は、強力な意味理解と生成を通じて自然言語処理において顕著な成功を収めた。
近年の研究では,LLM と Text-Attributed Graphs (TAG) を組み合わせることで,相補的なメリットが得られている。
この調査は、オーケストレーションの観点からLLM--TAG統合に関する最初の体系的なレビューを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:53:00 GMT)
Temporal Robustness in Discrete Time Linear Dynamical Systems [14.7] 確率単純度上の離散時間マルコフ連鎖と大域安定時間(GAS)離散時間線形力学系との等価性を示す。
CSOC領域における実世界データと、健康領域における先行データを用いて、我々のモデルとアプローチの利点を明らかにする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:27:46 GMT)
R2ComSync: Improving Code-Comment Synchronization with In-Context Learning and Reranking [14.5] ICLベースのコード・コンメント同期手法であるR2ComSyncをRetrievalとRe-levelで拡張した。
大規模な実験は、R2ComSyncの他のアプローチに対する優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:48:59 GMT)
Pragmatic Heterogeneous Collaborative Perception via Generative Communication Mechanism [14.4] 異種マルチエージェントシステム間のシームレスな認識を容易にする新しいジェネレーティブコミュニケーション機構(GenComm)を提案する。
OPV2V-H、DAIR-V2X、V2X-Realデータセットで実施された実験は、GenCommが既存の最先端手法より優れていることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:48:26 GMT)
Predictability Enables Parallelization of Nonlinear State Space Models [14.4] 非線形系の力学とそれに対応する最適化定式化の条件付けとの正確な関係を確立する。
状態変動が将来の行動に影響を及ぼす度合いとして定義されるシステムの予測可能性が,評価に必要な最適化ステップの数に影響を与えることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:17:53 GMT)
L$^2$M: Mutual Information Scaling Law for Long-Context Language Modeling [14.4] 本稿では,従来の2点相互情報とは無関係に,二部間相互情報が多点間相互作用を捕捉し,スケールすることを示す。
我々は、モデルの歴史状態のスケールを低くするLong-context Language Modeling条件を定式化する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:31:37 GMT)
SolarBoost: Distributed Photovoltaic Power Forecasting Amid Time-varying Grid Capacity [14.4] SolarBoostは、分散太陽光発電(DPV)システムで出力を予測するための新しいアプローチである。
中国各地の都市で実施されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:32:14 GMT)
Doubly-Regressing Approach for Subgroup Fairness [14.3] 敏感な属性の数が増えると、サブグループの数が増加する。
これにより、計算上の重荷とデータ空間の問題が発生する。
サブグループフェアネスのための新しい学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:04:44 GMT)
Accelerating Data Generation for Nonlinear temporal PDEs via homologous perturbation in solution space [14.3] 我々はhomologous Perturbation in Solution Space (HOPSS)と呼ばれる新しいデータ生成アルゴリズムを提案する。
HOPSSは、大規模なタイムステップデータセットを生成する従来のアプローチに従うのではなく、より少ないタイムステップでトレーニングデータセットを直接生成する。
例えば、Navier-Stokes方程式では、1万のサンプルを従来の手法の約10%の時間で生成し、モデルトレーニングのパフォーマンスに匹敵する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:59:58 GMT)
ReDit: Reward Dithering for Improved LLM Policy Optimization [14.2] DeepSeek-R1は、ルールベースの報酬システムを通じて、LLM(Large Language Model)推論機能の拡張に成功した。
報酬のハッキングを効果的に軽減する「完璧な」報酬システムであるが、そのような報酬機能はしばしば離散的である。
本稿では、単純なランダムノイズを加えることで離散的な報酬信号をディザリングするReDit(Reward Dithering)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:32:00 GMT)
Flatness is Necessary, Neural Collapse is Not: Rethinking Generalization via Grokking [14.2] 一般化の開始付近に神経崩壊と相対的平坦性の両方が現れるが、常に平坦性だけがそれを予測している。
理論的には、ニューラルネットワークの崩壊は古典的な仮定の下で相対的な平坦性をもたらし、その経験的共起を説明する。
以上の結果から,相対平坦性は一般化に必要であり,より基本的な性質である可能性が示唆され,幾何的基盤を分離するための強力なプローブとしてグルーキングが有効であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:43:11 GMT)
How to Auto-optimize Prompts for Domain Tasks? Adaptive Prompting and Reasoning through Evolutionary Domain Knowledge Adaptation [14.1] EGO-Promptは、より良いプロンプト、効率的な推論プロセス、改善された因果情報処理を設計する自動化フレームワークである。
因果誘導による新たなテキスト勾配プロセスを2つのステップに統合する。
最先端の手法よりも7.32%-12.61%高いF1を実現し、小型モデルは原価の20%以下で大型モデルの性能に達することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:38:53 GMT)
Combinatorial Creativity: A New Frontier in Generalization Abilities [14.1] 大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。
固定的な計算予算では、創造力に最適なモデル深さと幅が存在することが分かりました。
LLMは新たな科学的アイデアの創出に長けつつ,現実的な実現性確保に苦慮しているため,創造性アルゴリズムの基本的な新規性・実用性トレードオフ特性によって説明できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:26:22 GMT)
A Unified Model for Multi-Task Drone Routing in Post-Disaster Road Assessment [14.1] 災害後の道路評価(PDRA)は緊急対応に不可欠であり、インフラ条件の迅速な評価を可能にする。
ドローンはPDRAに柔軟で効果的なツールを提供するが、大規模なネットワークでそれらをルーティングすることは依然として難しい。
本研究は,PDRAの8つの変種に同時に対応可能な,ドローンルーティングのための統一モデル(UM)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:48:57 GMT)
Shylock: Causal Discovery in Multivariate Time Series based on Hybrid Constraints [14.0] 因果関係の発見は、その普及により注目を集めている。
既存の手法は、人間の経験、統計的手法、あるいはグラフィカルな基準法に依存している。
Shylockは、数ショットと通常のMSSの両方でうまく機能する新しい手法である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:12:24 GMT)
Lightweight Facial Landmark Detection in Thermal Images via Multi-Level Cross-Modal Knowledge Transfer [13.9] 熱画像における顔のランドマーク検出は、難解な照明条件に適用するために重要である。
モデル圧縮から高忠実度RGB-熱的知識伝達を分離する新しいフレームワークを提案する。
実験により,本手法は,特に従来の手法よりも優れる公立熱FLDベンチマークに新たな最先端の手法を設定できることが確認された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:14:46 GMT)
Causal Climate Emulation with Bayesian Filtering [13.9] 我々は因果表現学習に基づく解釈可能な気候モデルエミュレータを開発した。
現実的な合成データセットと2つの広く展開された気候モデルから得られるデータにおいて,それぞれの構成要素の重要性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:57:09 GMT)
Non-exchangeable Conformal Prediction with Optimal Transport: Tackling Distribution Shifts with Unlabeled Data [13.8] コンフォーマル予測は、分散のない不確実性定量化手法であり、機械学習コミュニティで人気を博している。
最も一般的な変種であるスプリット共形予測は、モデルがまだ見ていないキャリブレーションデータに基づくモデル予測の統計を収集するため、計算的に効率的である。
対象範囲の損失を推定し,任意の分布シフトを緩和し,原理的かつ広く適用可能なソリューションを提供することが可能であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:12:44 GMT)
Ensuring Functional Correctness of Large Code Models with Selective Generation [13.5] コード生成モデルの幻覚は、より高い安全性基準を必要とするシステムへの適用性を妨げます。
生成した単体テストによって評価された機能的正当性に基づいて,不確実な世代から退避する固有コード生成器を提案する。
本手法の有効性を,コード幻覚の制御性と適切な選択効率とともに示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:24:26 GMT)
Chain-of-Conceptual-Thought: Eliciting the Agent to Deeply Think within the Response [13.4] 我々は、概念思考の連鎖(CoCT)と呼ばれる新しいプロンプトベースのパラダイムを提案する。
CoCT は LLM がまず概念のタグを作成し、次にその概念に従って詳細な内容を完成させることを提案している。
我々はこのパラダイムを、ドメイン内およびドメイン外の両方のコンセプト設定でタスクをカバーし、日常的および感情的なサポート会話で実験する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:31:29 GMT)
Unmasking Puppeteers: Leveraging Biometric Leakage to Disarm Impersonation in AI-based Videoconferencing [13.4] AIベースのトーキングヘッドビデオ会議システムは、コンパクトなポーズ表現ラテントを送信し、受信機でRGBを再合成することで帯域幅を削減する。
この潜伏者は操ることができ、攻撃者はリアルタイムで被害者の好奇心を乗っ取ることができる。
再建されたRGBビデオを見ることなく,最初の生体情報漏洩防御システムを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:41:25 GMT)
Context Engineering for AI Agents in Open-Source Software [13.2] GenAIベースのコーディングアシスタントは、ソフトウェア開発を混乱させた。
彼らの次の世代はエージェントベースで、より自律的で、潜在的には人間の監視なしで活動する。
ひとつの課題は、AIエージェントに対して、彼らが運用するソフトウェアプロジェクトに関する十分なコンテキストを提供することだ。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:55:48 GMT)
True Zero-Shot Inference of Dynamical Systems Preserving Long-Term Statistics [13.2] 我々はDynaMixを紹介した。DSR用に事前訓練された新しいALRNNベースのMix-of-expertsアーキテクチャである。
DynaMixは、Chronosのような既存の時系列(TS)基盤モデルが失敗する新しいDSの長期的な進化を忠実に予測している。
DSR問題に対するTSモデルの失敗モードをいくつか説明し、DS原理に基づいて構築されたモデルがTS予測分野の前進にも大きな可能性を秘めていると結論づける。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:51:36 GMT)
Adversarial Robustness of Nonparametric Regression [13.1] 回帰関数が2階ソボレフ空間に属することを前提として、非パラメトリック回帰における対向ロバスト性を特徴づける。
古典的なスムーズなスプライン推定器が適切に正規化されると、敵の汚職に対して頑健であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:28:20 GMT)
Detecting Various DeFi Price Manipulations with LLM Reasoning [13.0] 我々は、標準価格モデルとカスタム価格モデルの両方において、DeFi価格操作攻撃を検出するための最初のLCMベースのアプローチであるDeFiScopeを紹介した。
DeFiScopeは、現実世界の攻撃で80%のリコール、不審なトランザクションで96%の精度、良心的なトランザクションで偽のアラームをゼロにする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:22:39 GMT)
Alleviating Forgetfulness of Linear Attention by Hybrid Sparse Attention and Contextualized Learnable Token Eviction [12.7] 有限メモリは、検索集約的なタスクに害を与える忘れやすさを誘導する。
過去のトークンへの直接アクセスを復元する一連のハイブリッドモデルについて検討する。
本稿では,新しい学習可能なトークン消去手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:56:22 GMT)
Towards Straggler-Resilient Split Federated Learning: An Unbalanced Update Approach [12.6] スプリット・フェデレーション・ラーニング(SFL)は、フェデレーション・ラーニング(FL)の並列性とスプリット・ラーニング(SL)の計算オフロードを組み合わせることで、エッジデバイス上でのスケーラブルなトレーニングを可能にする
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:55:27 GMT)
LLM-Powered Detection of Price Manipulation in DeFi [12.6] 分散ファイナンス(DeFi)のスマートコントラクトは数十億ドルを管理し、エクスプロイトの主要なターゲットとなっている。
価格操作の脆弱性は、しばしばフラッシュローンを通じて発生し、壊滅的な攻撃の類である。
本稿では,静的解析とLarge Language Model(LLM)に基づく推論を組み合わせたハイブリッドフレームワークPMDetectorを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:13:30 GMT)
Calibrated Language Models and How to Find Them with Label Smoothing [12.6] 大規模言語モデル(LLM)は、命令追従能力を改善することで、より強力な対話型エージェントとして振る舞うことができる。
自然言語処理(NLP)の最近の進歩は、命令追従能力の向上を通じて、より強力な対話的エージェントとして振る舞うための微調整された大規模言語モデル(LLM)を実現する機会を拡大している。
信頼性の高いモデル出力の 信頼性校正にどう影響するか 完全には研究されていない
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:36:02 GMT)
Toward provably private analytics and insights into GenAI use [12.5] 我々はAMD SEV-SNPやIntel TDXといった技術に基づく次世代フェデレーション分析システムを提案する。
我々のシステムでは、デバイスはデータを暗号化してアップロードし、限られたサーバ側処理ステップでタグ付けします。
オープンソースのTEEがホストするキー管理サービスは、データがこれらのステップにのみアクセス可能であることを保証します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:40:12 GMT)
BioReason: Incentivizing Multimodal Biological Reasoning within a DNA-LLM Model [12.5] BioReasonは論理的、生物学的に一貫性のある還元物を生成することを学ぶ。
KEGGによる疾患経路予測の精度は86%から98%に向上する。
また、強いベースラインよりも平均15%の変動効果予測を改善する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:16:49 GMT)
Improved Training Technique for Shortcut Models [12.5] ショートカットモデルは、生成モデリングのための有望で非敵対的なパラダイムである。
ショートカットモデルは、1つのトレーニングされたネットワークから1ステップ、数ステップ、および複数ステップのサンプリングをサポートする。
本稿では,ショートカットモデルを後退させた5つのコア問題に対処する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:35:04 GMT)
LVLMs are Bad at Overhearing Human Referential Communication [12.5] 本研究では、7つの最先端の大規模視覚言語モデル(Large Vision Language Models)を,自発的会話のコーパスのオーバーハーパーとして活用する能力について検討する。
このようなタスクは、現在のLVLMでは依然として困難であり、いずれも一貫したパフォーマンス改善を示せません。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:25:59 GMT)
Visual Cues Support Robust Turn-taking Prediction in Noise [12.4] 本研究は, PTTM の性能を, 一度展開すると発生する可能性のあるノイズの種類で検討する。
ホールド/シフトの精度はクリーン音声では84%から10dBの音楽ノイズでは52%に低下する。
マルチモーダルPTTMは、すべてのノイズタイプとSNRでオーディオのみのPTTMより優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:49:13 GMT)
Visual Cues Enhance Predictive Turn-Taking for Two-Party Human Interaction [12.4] 予測的ターンテイクモデル(PTTM)は、自然主義的な人間とロボットの相互作用を促進するが、ほとんどは音声にのみ依存する。
本稿では,マルチモーダルPTTMであるMM-VAPを紹介する。
ビデオ会議のインタラクションにおいて、最先端のオーディオオンリー(ホールド/シフト予測精度が84%に対して79%)を上回っていることが判明した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:49:54 GMT)
Towards a Golden Classifier-Free Guidance Path via Foresight Fixed Point Iterations [12.4] 我々は、条件付きガイダンスを固定点反復として再設定する統一的な視点を提案する。
本稿では,早期拡散段階における長期サブプロブレムの解決を優先するForesight Guidance(FSG)を紹介する。
我々の研究は、条件付きガイダンスのための新しい視点を提供し、適応設計の可能性を解き放つ。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:39:07 GMT)
DMVFC: Deep Learning Based Functionally Consistent Tractography Fiber Clustering Using Multimodal Diffusion MRI and Functional MRI [12.3] 我々は,Deep Multi-view Fiber Clustering (DMVFC)と呼ばれる新しいディープラーニングファイバクラスタリングフレームワークを開発した。
DMVFCは、機能的に一貫したホワイトマターのパーセレーションを可能にするために、ジョイントマルチモーダルdMRIとfMRIデータを使用する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:19:23 GMT)
Federated Unlearning Made Practical: Seamless Integration via Negated Pseudo-Gradients [12.3] 本稿では, Pseudo-gradients Updates for Federated Unlearning (PUF) を忘れることを利用した新しい手法を提案する。
最先端のメカニズムとは異なり、PUFはFLとシームレスに統合され、標準のFLラウンドを超える計算と通信のオーバーヘッドを発生させることなく、同時に非学習要求をサポートする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:44:21 GMT)
AdaDetectGPT: Adaptive Detection of LLM-Generated Text with Statistical Guarantees [12.1] テキストが人間によって作成されているか,あるいは大言語モデル(LLM)によって作成されているかを決定する問題について検討する。
既存のアートロジットに基づく検出器は、所定のソースLLMの分布関数を用いて評価された観測テキストの対数確率から得られた統計値を利用する。
AdaDetectGPTは、ロジットベースの検出器の性能を高めるために、トレーニングデータから証人関数を適応的に学習する新しい分類器である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:46:09 GMT)
Adaptive Split-MMD Training for Small-Sample Cross-Dataset P300 EEG Classification [12.1] データセット間のシフトは、大きなソースデータセットで小さなターゲットセットを増やそうとするときに発生する。
適応分割最大値離散化学習(AS-MMD)を紹介する。
AS-MMDは、ターゲット重み付き損失とソース/ターゲットサイズ比の平方根に結びついたウォームアップを組み合わせる。
目標のみのトレーニングやプールトレーニングよりも優れています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:48:21 GMT)
Dependency Parsing is More Parameter-Efficient with Normalization [12.1] バイファインスコアは, スコア正規化を行うことにより, より効率的に行うことができると論じる。
我々は、$N$の積み重ねBiLSTMをトレーニングし、ビファインスコアを正規化せずにその性能を評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:08:06 GMT)
Posterior Contraction for Sparse Neural Networks in Besov Spaces with Intrinsic Dimensionality [12.1] この研究は、スパースベイズニューラルネットワークが異方性ベソフ空間とその階層的構成に対して最適な後部収縮率を達成することを証明している。
これらの先行は, 真の関数の滑らか度が未知であっても, 後部を最適速度で収縮させることにより, レート適応を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:14:01 GMT)
Collective Communication for 100k+ GPUs [12.0] 本稿では,Metaで開発されたNCCLX集合通信フレームワークについて述べる。
このフレームワークは、クラスタ上の10000以上のGPU上の複雑なワークロードをサポートするように設計されている。
Llama4モデルの実証的な評価は、通信効率を大幅に改善したことを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:39:29 GMT)
PatchGuard: Adversarially Robust Anomaly Detection and Localization through Vision Transformers and Pseudo Anomalies [12.0] 本研究では,視覚変換器(ViT)をベースとしたアーキテクチャにおいて,擬似異常を局所化マスクに組み込んだADおよびAL手法であるPatchGuardを紹介する。
高度に確立された産業用および医療用データセットの実験結果から、PatchGuardは対向的な設定で従来の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:38:14 GMT)
Towards Physics-informed Spatial Intelligence with Human Priors: An Autonomous Driving Pilot Study [12.0] 現在の実践は、純粋にテキストプロンプトとVQAスタイルのスコアリングを備えた視覚空間知能をプロキシする。
SIG(Spatial Intelligence Grid)は、オブジェクトのレイアウト、オブジェクト間の関係、物理的に接地された事前情報をエンコードする、構造化されたグリッドベースのスキーマである。
数ショットの学習では、SIGはVQAのみの表現に比べて一貫して大きく、より安定し、より包括的なゲインを得る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:21:31 GMT)
Understanding Network Behaviors through Natural Language Question-Answering [11.9] 自然言語(NL)を用いたネットワーククエリのための新しいフレームワークであるNetMindを提案する。
本手法では,セマンティック・コヒーレンスを維持するために,ツリーベースの構成チャンキング戦略を導入する。
次に、ベンダー固有の設定を正規化するための中間表現として、統合されたファクトグラフを構築します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:54:29 GMT)
Few-Shot Knowledge Distillation of LLMs With Counterfactual Explanations [11.9] 本研究は, タスク認識型知識蒸留における非現実的拡散拡散蒸留法(DED)という新しい手法を導入する。
数学的にCFEは教師の判断境界付近でより情報的な例を提供することでパラメータ推定を改善することができることを示す。
各種データセットおよびLCMを用いて実験を行い,数発のレギュレーションにおいて,CoDが標準的な蒸留法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:36:34 GMT)
An Automatic Detection Method for Hematoma Features in Placental Abruption Ultrasound Images Based on Few-Shot Learning [11.7] 胎盤破裂は妊娠中の重篤な合併症であり,早期診断は母体・胎児の安全確保に不可欠である。
本稿では,小サンプル学習に基づく改良型EH-YOLOv11nを提案する。
実験の結果、検出精度は78%で、YOLOv11nよりも2.5%、YOLOv8より13.7%向上した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:20:34 GMT)
A Unified Matrix Factorization Framework for Classical and Robust Clustering [11.6] 本稿では,古典的クラスタリングとロバストクラスタリングのための統一行列分解フレームワークを提案する。
我々はファジィc-平均クラスタリングの類似行列分解解釈を導出する。
外れ値に対する感度に対処するために、フロベニウスノルムを l1,2-ノルムに置き換えることにより、クリップとファジィクラスタリングの両方に対してロバストな定式化を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:51:48 GMT)
Principled Data Augmentation for Learning to Solve Quadratic Programming Problems [11.6] 近年,線形プログラム (LP) や二次プログラム (QP) の学習最適化手法 (L2O) が注目されている。
MPNNはそのような最適化問題を解決するために軽量でデータ駆動のプロキシを約束する。
しかし、ロバストなL2O MPNNは、データスカース設定では依然として困難である。
この研究は、MPNNを通じてQP用に調整されたデータ拡張に対する原則的なアプローチを導入している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:39:30 GMT)
Digital Contrast CT Pulmonary Angiography Synthesis from Non-contrast CT for Pulmonary Vascular Disease [11.6] CTPA(CTd Tomography lung angiography)は肺血管疾患の診断基準である。
ヨウ素化コントラスト剤への依存は、特に高リスク患者において、腎毒性やアレルギー反応などのリスクを引き起こす。
本研究では,非コントラストCT(NCCT)スキャンからカスケード合成器を用いてDigital ContrastA(DCCTPA)を生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:24:49 GMT)
On the Sample Complexity of Differentially Private Policy Optimization [11.5] 政策最適化(PO)は現代強化学習(RL)の基盤であり、ロボット工学、医療、大規模言語モデルトレーニングにまたがる様々な応用がある。
本稿では,差分的私的政策最適化に関する理論的研究を開始し,その複雑さを明示する。
まず、POに適合する微分プライバシ(DP)の適切な定義を定式化し、オンライン学習のダイナミクスから生じる固有の課題に対処する。
次に,政策勾配(PG)や自然政策勾配(NPG)など,広く使用されているPOアルゴリズムのサンプル複雑性をDP制約や各種設定の下で,統一されたフレームワークを用いて体系的に解析する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:21:38 GMT)
Multi-turn Training with Basic Human Feedback Helps Little on LLM Reasoning [11.4] タスクの推論には,人間からのフィードバックによるマルチターントレーニングが必要であるかを検討する。
単ターン設定で訓練されたモデルは、単ターンおよび多ターン評価の両方に効果的に一般化する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:08:32 GMT)
Dynamic Retriever for In-Context Knowledge Editing via Policy Optimization [11.3] In-Context Knowledge Editing (DR-IKE) のための動的検索手法を提案する。
DR-IKEは、BERTレトリバーをREINFORCEでトレーニングし、報酬を編集してデモをランク付けする軽量フレームワークである。
編集成功率を最大17.1%改善し、レイテンシを41.6%削減し、無関係なクエリの精度を維持する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:15:30 GMT)
Optimal Graph Clustering without Edge Density Signals [11.2] 本稿では,Popularity-Adjusted Block Model(PABM)に基づくグラフクラスタリングの理論的限界を確立する。
本研究の主な貢献は,PABMによるクラスタリングにおける最適誤差率の評価である。
合成データセットと実データセットの両方に関する数値実験により、$k2$固有ベクトルを組み込んだスペクトルクラスタリングアルゴリズムが従来のスペクトルアプローチより優れていることを確認した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:24:26 GMT)
Correlation Dimension of Auto-Regressive Large Language Models [11.2] 大規模言語モデル(LLM)は、自然言語生成において顕著な進歩を遂げた。
彼らは、低難易度を示すときでさえ、繰り返しや不整合のようなファジィな行動を示し続けている。
本稿では,テキストの複雑さを定量化するために,自己相似性のフラクタル幾何学的尺度である相関次元を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:42:23 GMT)
Mix Q-learning for Lane Changing: A Collaborative Decision-Making Method in Multi-Agent Deep Reinforcement Learning [11.1] 本稿では,Mix Q-learning for Lane Changing(MQLC)を提案する。
集団レベルでは,グローバル情報を利用して個別のQネットワークとグローバルQネットワークを協調する。
個人レベルでは、深層学習に基づく意図認識モジュールを観察に統合し、意思決定ネットワークを強化した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:11:16 GMT)
Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders [11.1] VISTA(Virtual Sequential Target Attention)と呼ばれる新しい2段階モデリングフレームワークを提案する。
VISTAは、従来のターゲットの注意を候補項目からユーザ履歴項目に分解する。
このアプローチはオフラインおよびオンラインメトリクスの大幅な改善を実現し、業界をリードするレコメンデーションプラットフォームに展開しました。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:17:49 GMT)
On Uncertainty Calibration for Equivariant Functions [11.1] 我々は不確実性推定と等価性に関する理論を提案する。
我々は,対称性のミスマッチが分類と回帰の両方において誤校正をもたらすことを示す。
等価性と不確実性の関係を明らかにする数値実験により,我々の理論枠組みを補完する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:50:41 GMT)
When AI Gives Advice: Evaluating AI and Human Responses to Online Advice-Seeking for Well-Being [10.9] 大言語モデル(LLM)によって生成されたアドバイスと、トップボイドのRedditアドバイスを比較します。
その結果, GPT-4o が sycophancy 以外のすべての指標で GPT-5 を上回っていることが判明した。
第2の研究では、人間とアルゴリズムのアドバイスを組み合わせる方法について検討し、AI生成されたコメントと競合するために、人間のアドバイスを控えめに磨き上げることができることを示した。
我々は、AI、クラウドインプット、専門家の監視をブレンドしたアドバイス・グルーピング・エージェントとエコシステムの設計上の意味を結論付けます。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:02:51 GMT)
FairImagen: Post-Processing for Bias Mitigation in Text-to-Image Models [10.9] FairImagenは、社会的偏見を緩和するための迅速な埋め込みで動作する、ポストホックな脱バイアスフレームワークである。
我々のフレームワークは、既存のポストホック手法より優れており、公平なテキスト・画像生成のためのシンプルでスケーラブルでモデルに依存しないソリューションを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:47:15 GMT)
Assessing the Real-World Utility of Explainable AI for Arousal Diagnostics: An Application-Grounded User Study [10.8] 本研究は,8名の睡眠医療従事者を対象に,アプリケーション・グラウンド・ユーザ・スタディを提示する。
我々は,支援のタイプとタイミングが,事象レベル,臨床的に最も関連性の高いカウントベースのパフォーマンス,時間要件,ユーザエクスペリエンスにどのように影響するかを評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:23:02 GMT)
DeltaFlow: An Efficient Multi-frame Scene Flow Estimation Method [10.8] Delta$Flow(Delta$Flow)は、Delta$スキームを通じてモーションキューをキャプチャする軽量な3Dフレームワークである。
Delta$Flowは22%低いエラーと2倍高速な推論で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:47:47 GMT)
Finite-Time Analysis of Stochastic Nonconvex Nonsmooth Optimization on the Riemannian Manifolds [10.6] この研究はリーマン多様体の制約の下での非滑らかな非滑らかな最適化の有限時間解析に対処する。
我々は非平滑最適化の概念を$delta,epsilon$のサンプル上での非平滑最適化のパフォーマンス指標として適用する。
我々は、勾配の最適複雑さと一致するRO2NCアルゴリズム(ZORO2NC)のゼロバージョンを開発する。
数値計算は実効性アルゴリズムを支持する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:55:43 GMT)
Predictive Coding Enhances Meta-RL To Achieve Interpretable Bayes-Optimal Belief Representation Under Partial Observability [10.5] 歴史のコンパクトな表現を学ぶことは、部分的に観察可能な環境における計画と一般化にとって重要である。
メタ強化学習(RL)エージェントはベイズ最適政策に近づき得るが、しばしばコンパクトで解釈可能なベイズ最適信念状態の学習に失敗する。
本稿では,自己教師付き予測符号化モジュールをメタRLに統合することで,ベイズ最適表現の学習が容易になるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:45:56 GMT)
MolBridge: Atom-Level Joint Graph Refinement for Robust Drug-Drug Interaction Event Prediction [10.4] 薬物の組み合わせは治療効果を提供するが、有害薬物・薬物相互作用(DDI)のリスクも伴う
本研究は,薬物と薬物の相互作用ネットワークをマイニングし分析するグラフベースの手法を開発することにより,Web Mining and Content Analysisに寄与する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:34:05 GMT)
Interpretable Multimodal Zero-Shot ECG Diagnosis via Structured Clinical Knowledge Alignment [10.3] ZETAは、臨床知識に合わせて心電図の診断を解釈するために設計されたゼロショットマルチモーダルフレームワークである。
今後の研究を促進するため、キュレートされた観測データセットとコードをリリースする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:09:09 GMT)
When Lower-Order Terms Dominate: Adaptive Expert Algorithms for Heavy-Tailed Losses [10.3] 我々は、損失の範囲や第2モーメントに関する事前知識を必要としない適応アルゴリズムを開発する。
既存の適応アルゴリズムは、通常、彼らの後悔の保証において下位項と見なされるものを持っている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:27:52 GMT)
SAMOSA: Sharpness Aware Minimization for Open Set Active learning [10.3] 本稿では,オープンセットアクティブラーニング(SAMOSA)のためのシャープネス認識最小化手法を提案する。
従来の勾配勾配勾配(SGD)の一般化特性に対するデータの典型性の影響に関する理論的考察
実験によると、SAMOSAは複数のデータセットにわたって、アートの状態を最大3%の精度で改善している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:14:46 GMT)
Transformer Based Linear Attention with Optimized GPU Kernel Implementation [10.2] 線形注意(LA)機構はO(ND2)$の線形時間複雑性を提供し、通常の注意に匹敵する精度を示している。
本稿では,高度に最適化された実装とともに,LAの前方・後方通過のための新しい手法を提案する。
我々は、14億のパラメータ言語モデルをトレーニングすることにより、これらの改善を単層とエンドツーエンドの両方の設定で検証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:32:20 GMT)
Knowledge Distillation of Uncertainty using Deep Latent Factor Model [10.1] ガウス蒸留と呼ばれる新しい流通蒸留法を導入する。
これは、Dep Latent Factor Model (DLF)と呼ばれる特殊なガウス過程による教師のアンサンブルの分布を推定する。
複数のベンチマークデータセットを用いて,提案したガウス蒸留が既存のベースラインより優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:47:27 GMT)
Marcel: A Lightweight and Open-Source Conversational Agent for University Student Support [10.1] Marcelは、入試に関する質問に答える学生を支援するために設計された、軽量でオープンソースの会話エージェントである。
我々は,大学リソースの回答を基盤として,ユーザに対して検証可能な,文脈に関連のある情報を提供するために,検索強化世代を採用している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:26:28 GMT)
A Hierarchical Framework for Measuring Scientific Paper Innovation via Large Language Models [10.1] 大規模言語モデル(LLM)に基づく階層的かつトレーニング不要なフレームワークであるHSPIMを提案する。
セクションタイトルでテキストをセグメンテーションし、ゼロショットLCMを使用して、セクション分類、質問回答(QA)拡張、および重み付けされたイノベーションスコアを実装する。
そこで本研究では,共通質問とセクション固有の質問からなる2層質問構造を提案し,遺伝的アルゴリズムを用いて質問と提案の組合せを最適化する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:28:52 GMT)
LocalGPT: Benchmarking and Advancing Large Language Models for Local Life Services in Meituan [10.0] 大規模言語モデル(LLM)は目覚ましい能力を示し、様々な領域で大きなブレークスルーを遂げている。
本研究は,地域生活サービスに関わる幅広い課題にまたがる多様なLCMの性能を体系的に評価する。
その結果,比較的コンパクトな7Bモデルであっても,72Bモデルに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:34:25 GMT)
Adaptive Data Selection for Multi-Layer Perceptron Training: A Sub-linear Value-Driven Method [10.0] データ選択は、ニューラルネットワークトレーニングの基本的な問題のひとつだ。
Data Value Contributionは、トレーニング用のデータを選択するための、新しい予算対応の方法である。
我々の手法は、様々な予算制約の下で、既存のアプローチよりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:33:19 GMT)
Addressing Mark Imbalance in Integration-free Neural Marked Temporal Point Processes [10.0] 実世界の多くのアプリケーションにおいて,イベントマークの分布は極めて不均衡であることを示す。
そこで我々は,マーク予測を最適化するために,マーク確率を調整するしきい値を学習するしきい値抽出手法を提案する。
この手法と合わせて,まず,次に時刻を予測する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:36:20 GMT)
In Defense of Defensive Forecasting [10.0] このチュートリアルでは、予測は予測ではなく、過去の誤りを修正することによって導き出される。
我々は、オンライン学習、校正、専門家のアドバイスによる予測、オンラインコンフォーマル予測のための単純でほぼ最適アルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:40:12 GMT)
Lorentz Local Canonicalization: How to Make Any Network Lorentz-Equivariant [9.9] ローレンツ同変ニューラルネットワークは高エネルギー物理学の主要なアーキテクチャになりつつある。
Lorentz Local Canonicalization (LLoCa)は,任意のバックボーンネットワークを正確にLorentz-equivariantでレンダリングする一般的なフレームワークである。
我々のモデルは、関連する粒子物理学のタスクにおいて、競争力と最先端の精度を達成すると同時に、より高速で、より少ないFLOPで10倍の10倍の精度を実現している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:44:12 GMT)
Brain-tuning Improves Generalizability and Efficiency of Brain Alignment in Speech Models [9.9] 複数の参加者からのfMRI応答を協調的に予測するために,事前学習した言語モデルを微調整する。
提案手法は,1)新しい参加者からの脳データ予測に必要なfMRIデータの量は5倍に減少し,2)脳全体のアライメントは50%増加し,3)新しい未知のデータセットへの強力な一般化をもたらす。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:42:19 GMT)
Simulating Society Requires Simulating Thought [9.9] 本稿では,ジェネレーティブ・マインド(GenMinds,ジェネレーティブ・マインド)の概念的モデリングパラダイムを提案する。
これらの貢献は、社会シミュレーションのための言語だけでなく思考をシミュレートする表面レベルの模倣から生成的エージェントへと、より広範なシフトを推し進めている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:32:06 GMT)
Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search [9.9] 適応分岐モンテカルロ木探索(AB-MCTS)を提案する。
AB-MCTSは、原則化されたマルチターン探索とエクスプロイトによる繰り返しサンプリングを一般化する。
我々はフロンティアモデルを用いて複雑なコーディングとエンジニアリングのタスクについて評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:26:34 GMT)
Optimal Nuisance Function Tuning for Estimating a Doubly Robust Functional under Proportional Asymptotics [9.9] 我々は,既存のECC推定器3つと,必要なニュアンス関数を推定するための2つのサンプル分割戦略を評価する。
我々のバイアス補正戦略は、異なるサンプル分割戦略と推定器の選択で$sqrtn$-consistent estimatorが生成されることを示す。
解析の結果、予測調整パラメータ(すなわち、ニュアンス関数を最適に推定するパラメータ)は、ECC推定器の最低分散に繋がらないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:45:06 GMT)
Alert-ME: An Explainability-Driven Defense Against Adversarial Examples in Transformer-Based Text Classification [9.8] 本稿では、予測時間防御を強化するために、説明可能性駆動型検出・識別・変換(EDIT)と呼ばれる統一的なフレームワークを提案する。
EDITは、アテンションマップや統合勾配などの説明可能性ツールと周波数ベースの機能を統合し、敵の摂動を自動的に検出し識別する。
このフレームワークは、テキスト分類モデルにおける標準、ゼロデイおよび適応的な敵の脅威に対して、堅牢で、解釈可能で、効率的な保護を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:56:33 GMT)
Revisiting Social Welfare in Bandits: UCB is (Nearly) All You Need [9.4] 我々は,蓄積した報酬の幾何学的平均による評価を行うナッシュ後悔を紹介する。
実験では,初期均一探索フェーズに標準のアッパー信頼境界(UCB)アルゴリズムが適用され,ほぼ最適ナッシュの後悔が達成されることを示した。
我々はアルゴリズムを、$p$平均後悔(英語版)と呼ばれる幅広い公正度尺度に一般化し、すべての$p$値に対して(ほぼ)最適後悔境界を均一に証明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:15:22 GMT)
Additive Models Explained: A Computational Complexity Approach [9.4] Generalized Additive Models (GAMs) は ML コミュニティ内では *interpretable* と見なされることが多い。
計算複雑性*を解析し、複数の文脈にまたがる様々な形態のGAMについて、異なる説明を生成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:40:30 GMT)
The Computational Complexity of Counting Linear Regions in ReLU Neural Networks [9.3] 線型領域が実際に何であるかについては、多くの異なる定義が存在する。
種々の定義に対して,そのような領域の数を数えることの計算複雑性を解析する。
アルゴリズム面では、いくつかの共通定義に対して少なくとも空間において線形領域を数えることが可能であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:16:22 GMT)
Frequentist Validity of Epistemic Uncertainty Estimators [9.2] ブートストラップに基づく頻繁な不確実性の尺度を導入する。
我々の主要な理論的貢献は、提案された測度と(ベイジアン)相互情報が理論的に等価であることを示す新しい展開である。
これは、相互情報に対する頻繁な解釈と、それを近似するための新しい計算戦略を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:58:42 GMT)
Large Language Models as Model Organisms for Human Associative Learning [9.2] 認知神経科学関連学習パラダイムに適応し、6つのモデルで表現がどのように進化するかを考察する。
初期所見では非単調な塑性仮説と一致した非単調なパターンがみられた。
高い語彙干渉は差別を増幅し、表現的変化はアイテムの類似性とグローバルな競合の両方に影響されることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:52:11 GMT)
ParaRNN: Unlocking Parallel Training of Nonlinear RNNs for Large Language Models [9.1] ParaRNNは非線形RNNのシーケンス並列化障壁を破るフレームワークである。
本実装では,シーケンシャルアプリケーション上での最大665倍の高速化を実現している。
ParaRNNは、非線形RNNの自動トレーニング並列化のためのオープンソースフレームワークとしてリリースされた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:28:33 GMT)
FuXi-Ocean: A Global Ocean Forecasting System with Sub-Daily Resolution [9.1] FuXi-Oceanは、渦解像1/12deg空間解像度で6時間の予測を達成した最初のデータ駆動型大洋予報モデルである。
モデルアーキテクチャは、コンテキスト認識機能抽出モジュールと、スタックされた注目ブロックを用いた予測ネットワークを統合する。
FuXi-Oceanは、温度、塩分濃度、電流などの重要な変数を複数の深さにわたって予測する優れた技術を示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:31:42 GMT)
Optimal and Fair Encouragement Policy Evaluation and Learning [9.0] 本研究は, 陽性の潜在的な違反を含む最適治療規則の因果同定とロバストな評価について検討した。
一般制約下でのパラメタライズされたポリシークラスを解くための2段階のアルゴリズムを開発し、分散感応的後悔境界を求める。
本研究は, SNAP給付のリマインダーデータ, 保険申請の無作為化促進, および電子監視による事前管理リリースに基づく3つのケーススタディである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:13:45 GMT)
FeaGPT: an End-to-End agentic-AI for Finite Element Analysis [9.0] 本稿では,対話インタフェースによる完全な幾何学・メシュシミュレーションを実現するための最初のフレームワークであるFeaGPTを紹介する。
システムは、工学的意図を解釈し、物理を意識した適応メッシュを自動生成し、適切な境界条件推論を伴う完全なFEAシミュレーションを構成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:55:42 GMT)
A supervised discriminant data representation: application to pattern classification [8.9] 教師付き多クラス分類問題において,ハイブリッド線形特徴抽出方式を提案する。
最近の2つの線形判別法に着想を得て、これらの2つの強力な手法の利点を維持できる統一的基準を提案する。
提案するフレームワークは、他の線形判別式埋め込み法の組み合わせとチューニングを可能にするという意味で汎用的である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:30:57 GMT)
Knee-Deep in C-RASP: A Transformer Depth Hierarchy [8.9] より深い層(つまり、より多くの層)を持つトランスフォーマーは、より多くの能力を持つことが観測されているが、どの機能が得られるかは、正式に確立できるだろうか?
この変圧器のサブクラスはプログラミング言語C-RASPと表現的に等価であることを示し、この等価性は深さを保存する。
また, 逐次的依存タスクの族に対して, 位置エンコーディングを伴わずに, 変換器に必要な深さを予測できるという実証的証拠も提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:50:04 GMT)
LightAgent: Mobile Agentic Foundation Models [8.8] 本稿では,デバイスとクラウドのコラボレーションを活用して,デバイス上でのモデルのコスト効率とクラウドモデルの高機能化を実現するモバイルエージェントモデルソリューションを提案する。
具体的には、強力な意思決定のための合成GUIデータの2段階SFT->GRPOトレーニングにより、Qwen2.5-VL-3Bを強化する。
オンラインのAndroidLabベンチマークと多様なアプリの実験では、LightAgentのマッチや、より大きなモデルに近いものがあり、クラウドコストは大幅に削減されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:23:12 GMT)
Two Causally Related Needles in a Video Haystack [8.8] 長いビデオを理解するためにビデオ言語モデル(VLM)を評価するためのベンチマークを開発する。
実験の結果,既存のベンチマークに優れたモデルでは因果関係の問題に悩まされることがわかった。
これらの発見は、現在のビデオ言語モデルにおける重要な制限を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:46:52 GMT)
PerturBench: Benchmarking Machine Learning Models for Cellular Perturbation Analysis [8.8] 摂動に対する単一細胞転写応答をモデル化するための包括的枠組みを提案する。
私たちのアプローチには、モジュラーでユーザフレンドリなモデル開発と評価プラットフォームが含まれています。
モード崩壊など、広く使われているモデルの限界を強調します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:49:53 GMT)
TEMPO: Temporal Multi-scale Autoregressive Generation of Protein Conformational Ensembles [8.7] 本稿では,タンパク質の動的モデリングのための新しい階層的自己回帰フレームワークを提案する。
最先端の生成モデルを用いて高レベルの生物物理原理をブリッジすることにより,タンパク質の動態をシミュレーションするための効率的な枠組みを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:11:47 GMT)
Supporting Online Discussions: Integrating AI Into the adhocracy+ Participation Platform To Enhance Deliberation [8.7] 本稿では,大規模なオープンソース参加プラットフォームであるadhocracy+の拡張について紹介する。
我々の拡張は、議論の質を改善し、参加者の交流を促進するように設計された2つのAI支援討論モジュールを備えている。
大規模なユーザスタディでは,両モジュールの効果とユーザビリティについて検討した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:01:36 GMT)
Memory-Free Continual Learning with Null Space Adaptation for Zero-Shot Vision-Language Models [8.6] メモリフリー連続学習フレームワークであるNull Space Adaptation for Continual Learningを紹介する。
NuSA-CLは低ランク適応を採用し、タスク固有の重み付けを制約し、モデルの現在のパラメータの近似ヌル空間内に配置する。
リプレイバッファや高価な蒸留に依存する方法とは異なり、NuSA-CLは最小の計算とメモリオーバーヘッドを課す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:53:32 GMT)
deepSURF: Detecting Memory Safety Vulnerabilities in Rust Through Fuzzing LLM-Augmented Harnesses [8.6] Rustはメモリ安全性をデフォルトで保証するが、安全でないコードの使用も許可している。
本稿では,Large Language Model (LLM) を用いたファジングハーネス生成と静的解析を統合したDeepSURFを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:52:10 GMT)
TripTide: A Benchmark for Adaptive Travel Planning under Disruptions [8.6] TripTideは、大規模言語モデルの現実的な破壊の下での修正能力を評価する最初のベンチマークである。
実験の結果,LLMは連続的な一貫性とセマンティック安定性を維持し,空間偏差は短い旅行では大きいが,長い旅行では小さくなることがわかった。
TripTideは、LLMベースの旅行計画における適応性、パーソナライゼーション、レジリエンスを評価するためのベンチマークを確立している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:39:55 GMT)
Caption-Driven Explainability: Probing CNNs for Bias via CLIP [8.6] コンピュータビジョン問題に対する最先端の手法の1つは、サリエンシマップを生成することである。
サリエンシマップは、MLモデルに最も興奮する画像のピクセル空間をハイライトする。
コントラッシブ言語イメージ事前学習モデルに説明可能なスタンドアロンモデルを統合するキャプションベースのXAI手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:41:32 GMT)
Slot-BERT: Self-supervised Object Discovery in Surgical Video [8.6] Slot-BERTは、制約のない長さの長いビデオにオブジェクト発見をシームレスにスケールする。
Slot-BERTは,腹部,胆嚢摘出術,胸腔鏡下手術から得られた実世界の外科的ビデオデータセットを用いて評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:31:18 GMT)
FORLA: Federated Object-centric Representation Learning with Slot Attention [8.5] FORLAは、フェデレートされたオブジェクト指向表現学習と特徴適応のための新しいフレームワークである。
学生は基礎モデルから完全な特徴を再構築することを学び、教師は適応された低次元の特徴を再構築する。
複数の実世界のデータセットの実験では、FOLAがドメイン間でうまく一般化されるコンパクトで普遍的な表現を学習していることが示されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:25:21 GMT)
ZEUS: Zero-shot Embeddings for Unsupervised Separation of Tabular Data [8.5] ZEUSは、追加のトレーニングや微調整なしに新しいデータセットをクラスタリングできる自己完結型モデルである。
複雑なデータセットを意味のあるコンポーネントに分解して動作し、効果的にクラスタ化することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:54:18 GMT)
Circle Representation for Medical Instance Object Segmentation [8.5] 球状医療オブジェクトをインスタンスレベルでセグメント化するための円輪郭変形を利用した,単純なエンドツーエンドセグメンテーション手法であるCircleSnakeを紹介する。
病理画像における糸球体、核、好酸球の検出などの実用化において、CircleSnakeは優れた性能と回転不変性を示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:05:06 GMT)
PARL: Prompt-based Agents for Reinforcement Learning [8.5] 大規模言語モデル(LLM)は、自然言語で表現されたタスクに対して高い性能を示す。
我々は、グリッド世界の位置を解釈するなど、構造化された非言語的推論について研究する。
本稿では,LLM を RL エージェントとして活用する PARL (Prompt-based Agent for Reinforcement Learning) を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:04:23 GMT)
NeuroGenPoisoning: Neuron-Guided Attacks on Retrieval-Augmented Generation of LLM via Genetic Optimization of External Knowledge [8.5] 本稿では,内的ニューロン帰属と遺伝的最適化によって誘導されるRAGの対人的外部知識を生成する新たな攻撃フレームワークであるNeuroGenPoisoningを提案する。
我々のフレームワークは、有望だが当初は失敗に終わった外部知識の変種を特定し再利用することで、効果的に有毒なRAG知識の大量生成を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:30:49 GMT)
Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning [8.4] 我々は、新しい$textttSUBPLE-MFQ$(textbfSubsample$-$textbfMean-$textbfF$ield-$textbfQ$-learning)と、$n$エージェントを持つシステムの分散ランダム化ポリシーを提案する。
我々は、この学習されたポリシーが$tilde$O (1/sqrtk)$の順序の最適ポリシーに収束することを証明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:23:29 GMT)
GAICo: A Deployed and Extensible Framework for Evaluating Diverse and Multimodal Generative AI Outputs [8.3] GAICo (Generative AI Comparator): GenAI出力比較を標準化したオープンソースのPythonライブラリ。
GAICoは、構造化されていないテキスト、構造化データフォーマット、マルチメディアのための、包括的な参照ベースのメトリクススイートをサポートする統一されたフレームワークを提供する。
2025年6月にPyPIがリリースされて以来、このツールはバージョンで13K回ダウンロードされ、コミュニティの関心が高まっている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:20:55 GMT)
Inference for Deep Neural Network Estimators in Generalized Nonparametric Models [8.1] 分類的または指数関数的な家族結果に対するディープニューラルネットワーク(DNN)の推論は、まだ過小評価されていない。
一般化された非パラメトリック回帰モデル(GNRM)に基づくDNN推定器を提案し、厳密な推論フレームワークを開発する。
さらにこの手法を電子集中治療ユニット(eICU)データセットに適用し,ICUの寛容リスクを予測し,臨床的意思決定に患者中心の洞察を与える。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:19:42 GMT)
Hierarchical AI Multi-Agent Fundamental Investing: Evidence from China's A-Share Market [8.1] 我々は、マクロ指標、業界レベル、企業固有の情報を統合し、最適化された株式ポートフォリオを構築する、基本的な投資のためのマルチエージェントAI駆動フレームワークを提案する。
中国A株市場のCSI300指数による構成成分のシステム評価を行い、標準ベンチマークを一貫して上回る結果となった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:38:37 GMT)
Radiant Triangle Soup with Soft Connectivity Forces for 3D Reconstruction and Novel View Synthesis [8.1] 半透明な三角形プリミティブの集合である三角形スープを用いた推定時間シーン最適化アルゴリズムを提案する。
三角形は、非常に複雑な幾何学を達成するために接続できる曲面の自然な局所平坦なプロキシである。
我々は新しい表現を活用し、最適化の目的を取り入れ、基礎となるプリミティブに直接空間正規化を強制する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:43:15 GMT)
Structure-Aware Cooperative Ensemble Evolutionary Optimization on Combinatorial Problems with Multimodal Large Language Models [8.0] 本研究では,マルチモーダル大言語モデル(MLLM)を進化演算子として用いて,グラフデータに対する構造認識最適化を容易にする。
大規模ネットワークビジュアライゼーションに固有の視覚的クラッタに対処するために,グラフスペーシフィケーション手法を用いて構造を単純化する。
提案手法はMLLM駆動の進化最適化におけるソリューションの品質と信頼性を両立させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:37:41 GMT)
Bridging Prediction and Attribution: Identifying Forward and Backward Causal Influence Ranges Using Assimilative Causal Inference [7.9] 因果推論は変数間の因果関係を特定する。
最近開発された手法であるAssimilative causal Inference (ACI)は、観測と力学モデルを統合する。
ACIは、瞬時に因果関係を検出し、時間とともに因果関係を断続的に反転させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:04:56 GMT)
A Benchmark for Open-Domain Numerical Fact-Checking Enhanced by Claim Decomposition [7.9] QuanTemp++は、自然の数値的クレーム、オープンドメインコーパスからなるデータセットであり、各クレームに関する関連する証拠がある。
キークレーム分解パラダイムの検索性能を特徴付ける。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:37:13 GMT)
Faster Reinforcement Learning by Freezing Slow States [7.9] 無限水平マルコフ決定過程(MDP)を「高速」構造で研究する。
我々は,低レベル計画の段階において,遅い状態を「凍結」する新しい近似手法を提案する。
提案手法は,計算量を大幅に削減し,高品質なポリシーを作成できることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:06:07 GMT)
DNN Modularization via Activation-Driven Training [7.9] ディープニューラルネットワーク(Deep Neural Networks, DNN)は、技術的負債を負い、要求の進化に適応する際の大幅な再トレーニングコストに悩まされる傾向にある。
これまでの研究では、DNNモデルをトレーニング中とトレーニング後の両方にモジュールに分解する手法が提案されてきた。
アクティベーション駆動型モジュラートレーニング手法であるMODAを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:19:20 GMT)
Risk Management for Mitigating Benchmark Failure Modes: BenchRisk [7.9] この研究は26の人気のあるベンチマークを反復分析し、57の障害モードと196の対策戦略を特定した。
緩和は失敗の可能性や重大さを低減し、"ベンチマークリスク"を評価するための枠組みを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:43:29 GMT)
From Social Division to Cohesion with AI Message Suggestions in Online Chat Groups [7.8] 政治的に議論の的になっている話題について多人数で議論する参加者557名を対象にオンライン実験を行った。
コミュニケーション中の言語スタイルの微妙な変化は、AIアシストによって、集団構造を再構築するためにスケールアップできることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:25:01 GMT)
Operational Change Detection for Geographical Information: Overview and Challenges [7.8] 気候変動と人的影響による領域の急速な進化は、国家地図庁が管理する地理空間データベースを迅速かつ効果的に更新する必要がある。
本稿では,大規模地理データベースの運用更新に適した変更検出手法について概観する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:20:41 GMT)
PLAN: Proactive Low-Rank Allocation for Continual Learning [7.7] 継続的な学習(CL)には、過去の知識を忘れずに新しいタスクに継続的に適応するモデルが必要である。
PLANは、Low-Rank Adaptation (LoRA)を拡張して、CL設定で大規模トレーニング済みモデルの効率的かつ干渉対応の微調整を可能にするフレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:37:41 GMT)
Obtaining Accurate Ground-State Properties on Near-term Quantum Devices [7.7] これらの課題に同時に対処するハイブリッド量子古典的フレームワークを導入する。
H2, LiH, H4の基底状態エネルギーに対して, ほぼ完全な構成相互作用の精度を示し, ノイズの多いハードウェア上でのC6H8の正確な散乱強度を算出する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:39:56 GMT)
Blockchain and Biometrics: Survey, GDPR Analysis, and Future Directions [7.6] 本稿では、ブロックチェーンとバイオメトリックスの組み合わせを調査し、この統合に関する最初の法的分析を含む。
論文では、PKIシステムにおける新しいアプリケーションのためのブロックチェーンとバイオメトリックスの組み合わせ、分散信頼サービス、アイデンティティ管理などについて論じる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:05:12 GMT)
Agentic Reinforcement Learning for Real-World Code Repair [7.5] 実際のリポジトリで信頼性の高いコード修正エージェントをトレーニングするという課題に取り組みます。
修正後のビルド検証として成功した検証可能なパイプラインを開発しました。
大規模強化学習のためのスケーラブルな簡易パイプラインを導入した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:25:02 GMT)
String Seed of Thought: Prompting LLMs for Distribution-Faithful and Diverse Generation [7.5] 確率的インストラクションフォロー(PIF)を改善するLLMの新しいプロンプト手法であるSSoT(String Seed of Thought)を紹介する。
我々は、SSoTがLLMのPIF性能を大幅に改善し、擬似ランダム数生成器の理想的な性能に近づくことを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:43:50 GMT)
Generalized Top-k Mallows Model for Ranked Choices [7.4] 本稿では,トップkのMallowsモデルに適した新しいサンプリングスキームと,選択確率を計算するための効率的なアルゴリズムを提案する。
また,観測された選択データからモデルパラメータを推定する能動的学習アルゴリズムを提案する。
これらの貢献は、重要な意思決定シナリオの分析と予測のための新しいツールを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:49:21 GMT)
TaskEval: Assessing Difficulty of Code Generation Tasks for Large Language Models [7.4] LLM(Large Language Models)はコード生成のようなコード関連のタスクに優れていますが、ベンチマーク評価は困難などのタスク特性を見落とします。
本稿では,多種多様なプロンプトと項目応答理論(IRT)を用いてLCMの能力とベンチマークタスク特性を効率的に評価するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:24:46 GMT)
ESCORT: Efficient Stein-variational and Sliced Consistency-Optimized Temporal Belief Representation for POMDPs [7.4] ESCORTは高次元の信念空間における複雑な多モード分布を捉えるための粒子ベースのフレームワークである。
ESCORTはSVGDを拡張し、状態次元間の依存関係をモデル化する相関対応プロジェクションと、相関構造を保持しながら更新を安定化する時間的一貫性の制約である。
各種次元のPOMDPドメインと合成多モード分布の両領域における広範囲な評価により, ESCORTの有効性を実証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:51:33 GMT)
Gaze-VLM:Bridging Gaze and VLMs through Attention Regularization for Egocentric Understanding [7.3] 視線は注意、短期的意図、将来の行動に関する貴重な手がかりを提供する。
本稿では,2つの重要な自我中心的理解タスクに対して,VLMを強化した視線規則化フレームワークを提案する。
本稿では,人間の視線とモデル焦点を一致させる視線調整型注意機構を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:33:03 GMT)
DAO-AI: Evaluating Collective Decision-Making through Agentic AI in Decentralized Governance [7.2] 本稿では,分散型ガバナンスにおける自律的意思決定者としてのエージェントAIの実証的研究について述べる。
我々は、提案コンテキストを解釈し、過去の審議データを検索し、その投票位置を独立して決定するエージェントAI投票者を構築する。
この研究は、分散金融システムのための説明可能な、経済的に厳格なAIエージェントの設計に寄与する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:13:14 GMT)
Noise is All You Need: Solving Linear Inverse Problems by Noise Combination Sampling with Diffusion Models [7.2] 本稿では,雑音部分空間から最適な雑音ベクトルを合成し,測定スコアを近似する手法を提案する。
本手法は画像圧縮を含む幅広い逆問題解法に適用可能である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:46:23 GMT)
Gen-Review: A Large-scale Dataset of AI-Generated (and Human-written) Peer Reviews [7.1] 我々は LLM によるレビューを含む最大のデータセットである GenReview を提示する。
私たちのデータセットには、2018年から2025年にかけてのICLRのすべてのサブミッションに対して生成される81Kのレビューが含まれています。
GenReviewの価値を説明するために、興味深い研究質問のサンプルを探索する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:54:27 GMT)
Scalable Principal-Agent Contract Design via Gradient-Based Optimization [7.1] 本研究では,プライマリエージェント契約設計のための二レベルEmphmax-max最適化フレームワークについて検討する。
この問題は、市場設計からデリゲートされたポートフォリオ管理まで幅広い応用の基盤となっている。
クローズドフォームに依存しない汎用的なアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:00:02 GMT)
Document Understanding, Measurement, and Manipulation Using Category Theory [7.1] マルチモーダル文書構造抽出にカテゴリ理論を適用した。
我々は、情報理論尺度、コンテンツ要約と拡張、および大規模事前学習モデルの自己監督的改善を開発する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:12:08 GMT)
HIKMA: Human-Inspired Knowledge by Machine Agents through a Multi-Agent Framework for Semi-Autonomous Scientific Conferences [7.1] HIKMA Semi-Autonomous Conferenceは、学術出版・プレゼンテーションパイプラインへの人工知能のエンドツーエンド統合を通じて学術コミュニケーションを再構築する最初の実験である。
本稿では,AIデータセットのキュレーション,AIベースの原稿生成,AIによるピアレビュー,AIによるリビジョン,AIカンファレンスのプレゼンテーション,AIアーカイブの普及などを含むHIKMAフレームワークの設計,実装,評価について述べる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:52:24 GMT)
Confidence is Not Competence [7.1] 生成前評価と解法実行の2段階にわたる内部状態の幾何を解析する。
思考から行動機械への幾何学的複雑さの急激な減少は、自信と能力のギャップを機械的に説明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:22:48 GMT)
Temporal Graph Theoretic Analysis of Geopolitical Dynamics in the U.S. Entity List [7.1] アメリカの輸出規制は、アメリカの経済の最先端の手段の1つとなっている。
様々な楽器の中で、アメリカのエンティティリストは最も健全なものとして登場したが、その力学はいまだに解明されていない。
本稿では,エンティティリストの文書を地政学的戦略の動的表現に変換する新しい時間グラフフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:41:36 GMT)
Long-tailed Species Recognition in the NACTI Wildlife Dataset [7.1] North America Camera Trap Imagesデータセットは、非常に長い尾を持つクラスの不均衡を示しています。
NACTIテストデータの分割における最良の設定精度は99.40%である。
最大では、すべてのデータセットの分割、キーコード、および完全なネットワーク重みを公開します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:13:37 GMT)
Multivariate Latent Recalibration for Conditional Normalizing Flows [6.9] ラテント校正は、ラテントキャリブレーション上の有限サンプル境界を持つラテント空間の変換を学ぶ。
LRは再校正モデルの潜時校正誤差と負の対数類似度を一貫して改善する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:17:05 GMT)
How Hard is it to Confuse a World Model? [6.9] 強化学習理論において、最も紛らわしい例の概念は、後悔の少ない境界を確立する中心である。
我々は、ニューラルネットワークの世界モデルに対するこの問題を制約付き最適化として定式化する。
以上の結果から, 達成可能な混乱度は, 近似モデルの不確実性と相関することが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:08:12 GMT)
Tunable Asymmetric Delay Attack in Quantum Clock Synchronization [6.7] 現在の攻撃戦略は静的遅延に依存しており、アプリケーション固有の安定性要件をターゲットする能力を制限する。
本稿では、動的に遅延パラメータを制御し、同期精度の操作を誘導する可変非対称遅延攻撃(T-ADA)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:30:01 GMT)
Weak-to-Strong Generalization under Distribution Shifts [6.7] 強弱から強弱の一般化フレームワークであるRAVENを提案する。
RAVENは強いモデルのパラメータに加えて弱いモデルの最適な組み合わせを学ぶ。
我々の結果は、RAVENがより正確な弱いモデルにより高い重みを割り当て、信頼に値する監督を自動的に識別する能力を示すことを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:46:50 GMT)
Dataset Condensation with Color Compensation [6.7] 画像レベルの選択方法(コアセット選択、データセット量子化)は、凝縮不効率に悩まされる。
データセットの凝縮における重要な問題は、情報キャリアと基本的な意味表現ユニットとしてのカラーの二重の役割の監視である。
我々は、Color Compensationを用いたデータセット凝縮フレームワークDC3を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:28:13 GMT)
Adaptive Non-uniform Timestep Sampling for Accelerating Diffusion Model Training [6.7] データ分布が複雑化するにつれて、収束のためのトレーニング拡散モデルがますます複雑になる。
より重要な時間ステップを優先する一様でない時間ステップサンプリング手法を提案する。
提案手法は, 各種データセット, スケジューリング戦略, 拡散アーキテクチャにまたがるロバストな性能を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:48:32 GMT)
On the Influence of Shape, Texture and Color for Learning Semantic Segmentation [6.6] 近年,画像分類における深層ニューラルネットワーク(DNN)の形状とテクスチャバイアスについて検討している。
本研究は、学習中のキューの影響を理解することに焦点を当てたものである。
我々は、これらのキューの影響を複数のレベルで分析し、データセットをキュー固有のバージョンに分解する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:04:29 GMT)
ArchISMiner: A Framework for Automatic Mining of Architectural Issue-Solution Pairs from Online Developer Communities [6.6] 本研究は,Stack Overflow (SO) からアーキテクチャ知識をマイニングするフレームワーク ArchISMiner を紹介する。
ArchPIは、従来のML/DLモデル、PLM(Pre-trained Language Models)、LLM(Large Language Models)など、複数のモデルを訓練し、評価する。
ArchISPEは、BERT埋め込みやローカルのTextCNN機能などの多様な機能を活用して、アーキテクチャ上の問題解決ペアを抽出する間接的な教師付きアプローチを採用している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:46:17 GMT)
LCDB 1.1: A Database Illustrating Learning Curves Are More Ill-Behaved Than Previously Thought [6.5] 学習曲線は以前考えられていたよりもあまり良くないことを示す。
統計的に厳密な手法を用いて,学習曲線の約15%でかなりの不振を観測した。
また、どの学習者が非難されるべきなのかを特定し、特定の学習者が他の学習者よりも悪いことを示します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:52:39 GMT)
Nonparametric estimation of a factorizable density using diffusion models [6.5] 本稿では,非パラメトリック密度推定に対する暗黙的なアプローチとして拡散モデルについて検討する。
拡散モデルから構成した暗黙密度推定器は、分解構造に適応し、最小値の最適速度を達成することを示す。
推定器を構築する際には、疎ウェイトシェアリングニューラルネットワークアーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:00:11 GMT)
NUM2EVENT: Interpretable Event Reasoning from Numerical time-series [6.5] 本稿では,数値入力から解釈可能な構造化イベントを推論することを目的とした,数対値推論と復号化の課題を紹介する。
データ不足とセマンティックアライメントの課題に対処するために、推論対応フレームワークを提案する。
我々のモデルは、数値的な変化に対して明確に理由付け、中間的な説明を生成し、構造化された事象仮説を出力する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:57:11 GMT)
Optimal Rates of Convergence for Entropy Regularization in Discounted Markov Decision Processes [6.4] マルコフ決定過程におけるエントロピー正則化による誤差について検討する。
この誤差は逆正則化強度で指数関数的に減少することを示す。
私たちは分析をエントロピーを超えた設定に拡張します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:07:05 GMT)
Visualization Tasks for Unlabelled Graphs [6.3] アンラベルグラフは、永続的または意味論的に意味のあるラベルを付加しないノードを持つグラフである。
本研究では,意味的にリッチなLabelled,Attributed,Augmentedコンテキストとを区別するデータ抽象化モデルを提案する。
タスク分類は、プレイ中のデータのスコープ、ユーザの意図するアクション、ターゲットデータに基づいて構成されます。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:43:08 GMT)
PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [6.3] 本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:10:20 GMT)
Modeling the Economic Impacts of AI Openness Regulation [6.2] 本稿では、汎用モデルの作成者(ジェネラリスト)と、汎用モデルから特定のドメインやタスクへの微調整を行うエンティティ間の戦略的相互作用をモデル化する。
我々は,AIオープン性標準が開発者に対して適切な経済インセンティブを確立するかを評価するために,規制当局によるオープンソース定義の選択の様式化されたモデルを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:57:35 GMT)
Projection-based Lyapunov method for fully heterogeneous weakly-coupled MDPs [6.2] 弱結合マルコフ決定過程(WCMDP)の完全不均一な設定について検討する。
完全不均一なWCMDPに対して,O(1/sqrtN)$のオプティニティギャップが,N$が大きくなるにつれて,アーム当たりの平均報酬が1本当たり平均報酬で最大になることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:44:41 GMT)
Estonian Native Large Language Model Benchmark [6.2] 7つの多様なデータセットに基づいてエストニアのLLMを評価するための新しいベンチマークを導入する。
データセットはすべて、マシン翻訳を使わずに、エストニアのネイティブソースから生成される。
評価には人的評価とLCM-as-a-judge法の両方を用いる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:56:28 GMT)
POCO: Scalable Neural Forecasting through Population Conditioning [6.1] POCOは、ニューロン特異的および脳全体のダイナミクスをキャプチャする統合予測モデルである。
プレトレーニング後、POCOは最小限の微調整で新しい録音に迅速に適応する。
包括的分析により、コンテキスト長、セッションの多様性、前処理など、パフォーマンスに影響を及ぼすいくつかの重要な要因が明らかになった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:01:29 GMT)
Buffer layers for Test-Time Adaptation [6.1] バッファ層の概念に基づく新しいパラダイムを導入し,正規化レイヤ更新の基本的限界に対処する。
私たちのアプローチは、ドメインシフトを緩和し、モデルロバスト性を向上する従来の手法よりも優れているだけでなく、忘れることに対する強いレジリエンスも示しています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:12:59 GMT)
An unsupervised tour through the hidden pathways of deep neural networks [6.1] この論文は、教師なし学習ツールによる隠蔽表現の意味的内容の特徴付けに焦点を当てている。
第3章では、最先端のディープニューラルネットワークにおいて、隠れた層にまたがる確率密度の進化について検討する。
第4章では、ディープニューラルネットワークにおける一般化の問題について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:50:31 GMT)
An Evidence-Based Post-Hoc Adjustment Framework for Anomaly Detection Under Data Contamination [6.0] 教師なし異常検出法は、典型的にはクリーンなトレーニングデータを仮定するが、実世界のデータセットには、検出されていないまたはラベルのつかない異常が含まれていることが多い。
実験時に収集したエビデンスを用いて汚染データセット上でトレーニングされたADモデルの出力を更新するテスト時適応フレームワークであるEPHADを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:45:26 GMT)
Forecast reconciliation with non-linear constraints [6.0] 本稿では,非線形制約時系列の開問題に対する予測整合性を拡張する。
NLCR(Non-linearly Constrained Reconciliation)を提案する。
これは、新しい予測が制約を満たすように、非直線的制約を満たさない予測を調整する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:33:21 GMT)
PINN Balls: Scaling Second-Order Methods for PINNs with Domain Decomposition and Adaptive Sampling [5.9] 2次法は物理インフォームドニューラルネットワーク(PINN)のトレーニングを強化する
textscPINN Ballsは、科学機械学習の最先端技術よりも精度が高い。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:48:44 GMT)
Structure-Aware Fusion with Progressive Injection for Multimodal Molecular Representation Learning [5.9] マルチモーダル分子モデルは、しばしば3次元コンホメータの不信頼性とモダリティの崩壊に悩まされ、その堅牢性と一般化が制限される。
2つの主要な戦略を通じてこれらの課題に対処する構造化マルチモーダル融合フレームワークである MuMo を提案する。
状態空間のバックボーン上に構築されたMuMoは、長距離依存性モデリングと堅牢な情報伝達をサポートする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:27:10 GMT)
Fermionic tensor network contraction for arbitrary geometries [5.9] 本稿では,大域的順序と局所的順序の両方の定式化の中で,任意の格子上のフェルミオンテンソルネットワークの縮約の実装について述べる。
本稿では3次元ダイヤモンド格子上に定義された有限ハバードモデルのフェルミオン射影対状態シミュレーションについて述べる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:10:47 GMT)
Incremental Sequence Classification with Temporal Consistency [5.9] 逐次シーケンス分類の問題に対処し、シーケンス内の新しい要素が明らかにされるにつれて予測が更新される。
逐次予測を満足する時間的整合性条件を利用して、逐次シーケンス分類器を訓練するための新しい損失関数を開発する。
以上の結果から,本手法で訓練したモデルでは,数個のトークンを観測した結果,期待できる世代と期待できない世代を区別できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:23:22 GMT)
Brain-like Variational Inference [5.9] FOND(Free Energy Online Natural-gradient Dynamics)は,3つの原理から神経推論力学を導出するフレームワークである。
我々はFONDを用いて膜電位ダイナミクスによる変分推論を行う反復スパイクニューラルネットワークiP-VAE(定性ポアソン変分オートエンコーダ)を導出する。
実証的には、iP-VAEは、標準のVAEとガウスベースの予測符号化モデルの両方で、空間性、再構成、生物学的確率で優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:32:15 GMT)
Spatially Aware Linear Transformer (SAL-T) for Particle Jet Tagging [5.8] 変換器は高エネルギー粒子衝突における大域的相関と局所的相関を捉えるのに非常に効果的である。
変換器は高エネルギー粒子衝突における大域的相関と局所的相関を捉えるのに非常に効果的である。
本稿では,線形注意を維持できるライフォーマアーキテクチャの拡張である空間認識線形変換器(SAL-T)を紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:00:01 GMT)
Prior-Guided Diffusion Planning for Offline Reinforcement Learning [5.8] Prior Guidance(PG)は、行動閉ざされた拡散モデルに先立って標準ガウスを置き換えた新しいサンプリングフレームワークである。
我々は,潜時空間における行動規則化を適用した効率的なトレーニング戦略を提案し,PGが多種多種多種多種多種多種多様オフラインRLベンチマークにおいて最先端拡散ポリシーやプランナーより優れていることを実証的に示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:28:01 GMT)
Comparing quantum and classical Monte Carlo algorithms for estimating Betti numbers of clique complexes [5.8] クリプト錯体上のベッチ数推定(BNE)のための量子および古典モンテカルロアルゴリズムについて概説する。
与えられた精度に達するために必要なサンプルの数に対して上限を導出し、これらのアルゴリズムを比較する。
サンプルの複雑性に指数関数的に依存する新しい量子アルゴリズムを作成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:28:31 GMT)
Are the LLMs Capable of Maintaining at Least the Language Genus? [5.7] 種レベルの効果は存在するが、訓練資源の可用性によって強く条件付けされていることを示す。
以上の結果から,LLMは属レベルの構造をコードするが,学習データの不均衡が多言語的性能を形作る主要な要因であることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:20:40 GMT)
Reducing the Probability of Undesirable Outputs in Language Models Using Probabilistic Inference [5.7] 強化学習(Reinforcement Learning, RL)は、言語モデルと人間の嗜好を整合させる主要な手法となっている。
新たなトレーニング手法であるRePULSeを導入する。
我々は、RePULSeが、望ましくない出力の確率よりも、期待される報酬のトレードオフをより良く生み出すことを示す実験を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:23:55 GMT)
Do You Trust the Process?: Modeling Institutional Trust for Community Adoption of Reinforcement Learning Policies [5.7] コミュニティにおける資源配分のための信頼度を考慮したRLアルゴリズムを開発した。
この制度的信頼の取り込みが成果にどのように影響するかを考察する。
信頼をRLアルゴリズムに組み込むことで、より成功したポリシーがもたらされることがわかりました。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:37:31 GMT)
Securing AI Agent Execution [5.6] 我々は,MPPサーバ用のアクセス制御フレームワークであるAgentBoundを紹介する。
296のMSPサーバを含むデータセットを構築し、80.9%の精度でソースコードからアクセス制御ポリシーを自動生成できることを示します。
また、AgentBoundは悪意のあるMSPサーバのセキュリティ脅威の大部分をブロックし、ポリシー執行エンジンが無視可能なオーバーヘッドを発生させることを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:10:36 GMT)
A QUBO Framework for Team Formation [5.5] チーム構成問題に対するすべてのコスト定義をキャプチャする、統合されたTeamFormationの定式化を導入します。
チームフォーメーション問題のQUBO定式化に基づく解法は,確立されたベースラインによる解法と少なくとも同等であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:40:37 GMT)
Feel-Good Thompson Sampling for Contextual Bandits: a Markov Chain Monte Carlo Showdown [5.5] トンプソンサンプリング(Thompson Sampling)は、文脈的盗賊の探索と探索のトレードオフに広く用いられている。
最近の理論では、高次元問題では積極的に探索できないことが示されている。
Feel-Good Thompson Sampling (FG-TS)は、ハイリワードモデルにバイアスを与える楽観的なボーナスを追加することでこの問題に対処する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:44:53 GMT)
Intrinsic Goals for Autonomous Agents: Model-Based Exploration in Virtual Zebrafish Predicts Ethological Behavior and Whole-Brain Dynamics [5.4] 自律性は動物の知能の目印であり、外部の報酬やタスク構造に頼ることなく、複雑な環境で適応的でインテリジェントな行動を可能にする。
本稿では,動物における自律探査の原則に則って設計された,新しいモデルに基づく固有ドライブを提案する。
本研究は,モデルに基づく本質的なモチベーションと自然主義的行動とを結合する計算枠組みを構築した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:52:29 GMT)
REVE: A Foundation Model for EEG -- Adapting to Any Setup with Large-Scale Pretraining on 25,000 Subjects [5.4] REVE(Representation for EEG with Versatile Embeddings)は、様々な脳波信号にまたがる一般化を意図した事前訓練モデルである。
我々は25,000人の被験者にまたがる92のデータセットから6万時間以上の脳波データをプレトレーニングしました。
我々は、標準化された脳波研究を支援し、臨床神経科学の進歩を促進するためのコード、事前訓練された体重、チュートリアルをリリースする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:52:46 GMT)
Revisiting Bi-Linear State Transitions in Recurrent Neural Networks [5.4] 両線形状態更新は、状態追跡タスクにおける隠れ状態の進化を表す自然な帰納バイアスとなることを示す。
また,両線形状態更新は,複雑性が増大する状態追跡タスクに対応する自然な階層を形成し,その階層の最低複雑度中心に位置するMambaなどの線形リカレントネットワークが人気であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:06:33 GMT)
SafetyPairs: Isolating Safety Critical Image Features with Counterfactual Image Generation [5.3] 安全ポリシーに関連する機能にのみ異なる、対物的な画像を生成するためのフレームワークであるSafetyPairsを紹介する。
SafetyPairsを使って、評価データの強力なソースとなる新しい安全ベンチマークを構築します。
我々は,9つの安全カテゴリーの分類学にまたがる3,020以上のSafetyPair画像を含むベンチマークを公表した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:19:48 GMT)
Vision Language Models for Dynamic Human Activity Recognition in Healthcare Settings [5.3] ビジョン言語モデル(VLM)は、様々な医療アプリケーションにおいて有望なツールとして登場した。
研究が比較的過小評価されている分野の1つは、遠隔の健康モニタリングにヒトの行動認識(HAR)を使用していることである。
この研究は強力なベンチマークに貢献し、VLMをインテリジェントヘルスケアシステムに統合する新たな可能性を開く。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:04:13 GMT)
Contrastive Conditional-Unconditional Alignment for Long-tailed Diffusion Model [5.3] クラス条件画像合成のためのトレーニングデータは、尾のクラスのための限られた画像を持つ長い尾の分布を示すことが多い。
不均衡なデータに基づいて訓練されたクラス条件拡散モデルに対しては、テール級画像の多様性と忠実度を改善することを目的としている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:58:47 GMT)
Planning and Learning in Average Risk-aware MDPs [5.3] 我々はリスクニュートラルアルゴリズムを拡張し、より一般的なリスク対策のクラスに対応する。
弊社のアプローチは、エージェントの複雑なリスク認識に微調整されたポリシーの特定を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:33:12 GMT)
CLT and Edgeworth Expansion for m-out-of-n Bootstrap Estimators of The Studentized Median [5.3] m-out-of-nブートストラップはmサブサンプルをnサイズの元のサンプルから置き換えることなく繰り返し描画することで統計量の分布を近似する。
エコノメトリ、バイオ統計学、機械学習にまたがる幅広い適用性にもかかわらず、ブートストラップの音質に対する厳密なパラメータなし保証はいまだに解明されていない。
本稿では,n 個のデータセットの m-of-n 再サンプリングから得られたサンプル定量値の推定器を解析することにより,そのような保証を確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:16:54 GMT)
Steerable Transformers for Volumetric Data [5.3] 本稿では, ステアブル・コンボリューションによって抽出された特徴に作用する同変アテンション機構を提案する。
2次元と3次元の両方の実験により、ステアブルな畳み込みネットワークにステアブルなトランスフォーマー層を追加することにより、性能が向上することが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:25:01 GMT)
A Geometric Approach to Steerable Convolutions [5.3] この研究は、$d$次元のステアブル畳み込みニューラルネットワークの新しい、より直感的な導出を提供する。
我々はクレブシュ-ゴルダン分解と球面調和基底関数の出現について直観的に説明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:42:45 GMT)
Deep Jump Gaussian Processes for Surrogate Modeling of High-Dimensional Piecewise Continuous Functions [5.2] 本稿では,高次元のピースワイド連続関数を代用する新しい手法であるDeep Jump Gaussian Processes (DJGP)を紹介する。
DJGPは、局所線型射影層を追加することにより、高次元入力空間における従来のジャンプガウス過程の限界を克服する。
合成およびベンチマークデータセットの実験により、DJGPはより優れた予測精度とより信頼性の高い不確実性を提供することが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:59:24 GMT)
SCORENF: Score-based Normalizing Flows for Sampling Unnormalized distributions [5.2] 正規化フローアーキテクチャ上に構築されたスコアベースの学習フレームワークであるScoreNFを提案する。
ScoreNFは訓練アンサンブルが小さい場合でも高い性能を維持していることを示す。
また,モード被覆とモード崩壊の挙動を評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:43:19 GMT)
Retention analysis of edited knowledge after fine-tuning [5.2] 大規模な言語モデル(LLM)には膨大な量の知識が格納されており、事実の誤りを訂正したり、新たに取得した情報を組み込んだり、モデルの振る舞いを適応させたりする必要があることが多い。
モデル編集手法はこのような更新の効率的な解法として登場し、局所的で正確な知識修正を連続的な訓練よりも大幅に少ない計算コストで提供する。
しかし、これまで編集された知識に対する微調整の効果はよく分かっていない。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:26:00 GMT)
Minimizing False-Positive Attributions in Explanations of Non-Linear Models [5.2] Suppressor変数は、対象とする結果に依存することなく、モデル予測に影響を与える可能性がある。
これらの変数は偽陽性の特徴属性を引き起こし、説明の有用性を損なう可能性がある。
このギャップに対処する新しいXAI技術であるPatternLocalを紹介します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:49:15 GMT)
Emotions Where Art Thou: Understanding and Characterizing the Emotional Latent Space of Large Language Models [5.2] 本研究では, 大規模言語モデル (LLM) が内部的に感情を表現しているかを, 隠れ状態空間の幾何学的構造を解析することによって検討する。
本論文は,低次元の感情的多様体を同定し,感情的表現が層に分散され,解釈可能な次元に一致していることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:54:12 GMT)
Methodological Insights into Structural Causal Modelling and Uncertainty-Aware Forecasting for Economic Indicators [5.0] 我々は、GDP、経済成長、インフレ、失業の4つの主要なマクロ経済指標に焦点を当てている。
以上の結果から、経済成長とGDPとの強い一方向因果関係が明らかとなった。
我々は、失業に関するゼロショット予測を行うために、時系列のために訓練された大きな言語モデルを使用する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:25:23 GMT)
Spatial-Aware Decision-Making with Ring Attractors in Reinforcement Learning Systems [5.0] Ring attractorsは、強化学習(RL)における学習速度と精度を向上させる生物学的に妥当なメカニズムを提供する
アクション選択プロセスにおけるリングアトラクターの応用には、リング上の特定の場所にアクションをマッピングし、神経活動に基づいて選択されたアクションをデコードすることが含まれる。
提案手法は,Atari 100kベンチマークの最先端性能を大幅に向上し,選択したベースラインよりも53%向上した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:18:27 GMT)
DP-LLM: Runtime Model Adaptation with Dynamic Layer-wise Precision Assignment [4.9] DP-LLMは入力値に基づいて各層に動的に精度を割り当てる機構である。
DP-LLMは,従来の手法よりも優れた性能・遅延トレードオフを実現することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:37:52 GMT)
REMONI: An Autonomous System Integrating Wearables and Multimodal Large Language Models for Enhanced Remote Health Monitoring [4.9] 本稿では、マルチモーダル大言語モデル(MLLM)、モノのインターネット(IoT)、ウェアラブルデバイスを統合した、自律型リモートヘルス監視システムREMONIを提案する。
このシステムは、バイタルサイン、特殊なウェアラブル(スマートウォッチなど)からの加速度計データ、そしてカメラから収集された患者のビデオクリップの視覚データを自動的に、継続的に収集する。
本システムの特徴は,医療従事者の問い合わせに応じて患者の活動や感情を検知・認識できるMLLMを用いて開発された自然言語処理コンポーネントである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:23:38 GMT)
A Dynamic Knowledge Distillation Method Based on the Gompertz Curve [4.8] 本稿では,新しい動的知識蒸留フレームワークであるGompertz-CNNを紹介する。
Gompertz-CNNは、従来の知識蒸留の限界に対処するために、Gompertz成長モデルをトレーニングプロセスに統合する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:07:27 GMT)
Security Analysis of LTE Connectivity in Connected Cars: A Case Study of Tesla [4.8] われわれはModel 3やCybertruckを含むTeslaの車両でLTE接続のブラックボックスで非侵襲的なセキュリティ分析を行う。
Teslaのテレマティクススタックは、IMSIのキャッチ、ローグ基地局のハイジャック、およびサービス可用性を静かに低下させる不安定なフォールバックメカニズムに影響を受けやすいことが分かりました。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:03:48 GMT)
Spatio-Temporal Attention Network for Epileptic Seizure Prediction [4.8] 本稿では,脳波信号の複雑な時間的相関構造をS-Temporal Attention Network (STAN)を通して学習し,てんかん患者の発症発作の正確な予測を行う。
本フレームワークは、患者固有の窓が起動する少なくとも15分前の前立腺状態を45分以上確実に検出し、臨床応用に十分な介入時間を与える。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:45:25 GMT)
Parallel Sampling from Masked Diffusion Models via Conditional Independence Testing [4.7] 仮面拡散モデル(MDM)は、離散テキスト生成のための自己回帰モデル(ARM)に代わる魅力的な代替手段を提供する。
シーケンシャルな左から右への生成ではなく、並列トークンサンプリングを可能にする。
本稿では,このトレードオフを再現するモデル非依存のサンプル装置PUNTを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:41:26 GMT)
Text-conditioned State Space Model For Domain-generalized Change Detection Visual Question Answering [4.7] 変化検出法は通常、正確な解釈のために専門家の知識を必要とする。
新しいマルチモーダルおよびマルチドメインデータセットであるBrightVQAを導入し、ドメインの一般化研究を容易にする。
TCSSM(Text-Conditioned State Space Model)フレームワークは,両時間画像とジオディザスター関連テキスト情報の両方を活用するために提案されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:53:51 GMT)
Does Model Size Matter? A Comparison of Small and Large Language Models for Requirements Classification [4.7] 大規模言語モデル(LLM)は、要求工学(RE)のための自然言語処理(NLP)タスクにおいて顕著な結果を示す。
対照的に、小さな言語モデル(SLM)は軽量でローカルにデプロイ可能な代替手段を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:20:30 GMT)
Estimating Treatment Effects in Networks using Domain Adversarial Training [4.7] ネットワーク設定における不均一な処理効果の推定は、干渉によって複雑になる。
本稿では,グラフニューラルネットワークとドメイン逆学習を統合する新しい手法HINetを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:34:43 GMT)
CLIPGaussian: Universal and Multimodal Style Transfer Based on Gaussian Splatting [4.6] 私たちはCLIPGaussianを紹介した。CLIPGaussianは、複数のモダリティをまたいだテキストおよび画像誘導型スタイリングをサポートする最初の統一型スタイル転送フレームワークである。
本手法はガウスプリミティブを直接操作し,プラグインモジュールとして既存のGSパイプラインに統合する。
我々は,CLIPGaussianをマルチモーダルなスタイル転送のための汎用的で効率的な解として検証し,全てのタスクにおいて優れたスタイルの忠実さと一貫性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:03:13 GMT)
Generative Correlation Manifolds: Generating Synthetic Data with Preserved Higher-Order Correlations [4.6] 本稿では,合成データを生成する計算効率の良い手法である生成相関マニフォールド(GCM)を紹介する。
本手法は,プライバシ保護データ共有,ロバストモデルトレーニング,シミュレーションに応用可能な,合成データ生成への新たなアプローチを提供するものである,と我々は主張する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:15:53 GMT)
LLMs can hide text in other text of the same length [4.4] 意味のあるテキストは別のテキストの中に隠すことができる。
本稿では,大規模言語モデルを用いた簡便かつ効率的なプロトコルを提案する。
このようなプロトコルの存在は、権威的な意図からテキストを急進的に切り離すことを示し、さらに文書によるコミュニケーションに対する信頼を損なう。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:59:45 GMT)
Slow Transition to Low-Dimensional Chaos in Heavy-Tailed Recurrent Neural Networks [4.3] 生物学的に妥当なL'evyα安定分布から得られたランダムな重み付きリカレントニューラルネットワーク(RNN)の活性について検討した。
理論的には、システムがキラキセントからカオス力学に遷移する際の利得を予測し、シミュレーションにより検証する。
以上の結果から,カオスの端付近の力学の強靭性と高次元神経活動の豊かさとの生物学的に整合したトレードオフが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:07:12 GMT)
CXR-LanIC: Language-Grounded Interpretable Classifier for Chest X-Ray Diagnosis [4.3] 深層学習モデルは胸部X線診断において顕著な精度を達成しているが、その広範な臨床応用は予測のブラックボックスの性質によって制限されている。
CXRLanICは、タスク・アライン・メディカル・パターンの発見を通じて、この解釈可能性の問題に対処する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:46:18 GMT)
Convergence of Stochastic Gradient Langevin Dynamics in the Lazy Training Regime [4.3] 継続的モデルは、ディープラーニングにおける最適化アルゴリズムのトレーニングダイナミクスに関する洞察を提供する。
我々は勾配ランゲヴィンダイナミクス(SGLD)の非漸近収束解析を確立する。
損失関数のヘシアン上の規則性条件下では、乗法および状態依存雑音を持つSGLDは、高い確率でトレーニング過程を通して非退化核を生成することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:28:53 GMT)
LLMComp: A Language Modeling Paradigm for Error-Bounded Scientific Data Compression [4.2] LLMCOMPは、デコーダのみの大規模言語モデルを利用して科学的データをモデル化する、失われた圧縮パラダイムである。
常に最先端の圧縮機を上回り、厳密な誤差境界の下で最大30%高い圧縮比を達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:41:04 GMT)
Point-level Uncertainty Evaluation of Mobile Laser Scanning Point Clouds [4.2] 本研究では,点レベルの不確実性評価のための機械学習に基づくフレームワークを提案する。
局所幾何学的特徴と点レベルの誤差の関係を学習する。
実験により,両モデルが幾何特性と不確実性の間の非線形関係を効果的に捉えることができることを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:30:52 GMT)
BikeBench: A Bicycle Design Benchmark for Generative Models with Objectives and Constraints [4.2] BikeBenchは、実世界の目的と制約の問題に関する生成モデルを評価するためのエンジニアリング設計ベンチマークである。
これは、空気力学、構造力学、人間の評価されたユーザビリティ、テキストや画像プロンプトとの類似性など、様々な人間中心および多物理学のパフォーマンス特性を定量化する。
BikeBenchは、生成モデル、大規模言語モデル(LLM)、設計最適化、ハイブリッドアルゴリズムを並べて評価するように一意に構成されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:02:28 GMT)
Pre-trained Language Models Learn Remarkably Accurate Representations of Numbers [4.1] 既存の研究は、モデルの表現から数値の値を求めることには成功しなかった。
本稿では,入力埋め込みから数値をほぼ完全精度で復号する新しい探索手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:41:38 GMT)
Incomplete U-Statistics of Equireplicate Designs: Berry-Esseen Bound and Efficient Construction [4.1] 本稿では,ハイパーグラフ理論と設計を基礎としたU統計学の新しい視点を示す。
U-統計量の依存構造を特徴付けることにより、不完全U-統計に有効なベリー-エッシー境界を導出する。
また、等価設計の不完全なU統計を構成するための効率的なアルゴリズムも導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:03:09 GMT)
Distribution Shift Alignment Helps LLMs Simulate Survey Response Distributions [4.1] 大規模言語モデル(LLM)は、人間のサーベイ応答をシミュレートする有望な方法を提供する。
既存のゼロショット法は、迅速な感度と低い精度に悩まされている。
本研究では,2段階の微調整手法である分散シフトアライメント(DSA)を導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:04:19 GMT)
Enforcing Calibration in Multi-Output Probabilistic Regression with Pre-rank Regularization [4.1] 任意のプリランク関数のトレーニング中に多変量キャリブレーションを強制する一般的な正規化フレームワークを提案する。
本手法は,予測精度を犠牲にすることなく,プリランク関数のキャリブレーションを大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:16:12 GMT)
InterpDetect: Interpretable Signals for Detecting Hallucinations in Retrieval-Augmented Generation [4.0] 幻覚検出には、外部の文脈やパラメトリック知識の貢献を断ち切る必要がある。
我々はRAG幻覚のメカニズムを解明し、後層のFFNモジュールがパラメトリック知識を残留ストリームに不均等に注入した場合にそれらが発生することを見出した。
本研究は,RAGシステムにおける幻覚検出において,機械的信号を効率よく,一般の予測可能として強調するものである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:02:01 GMT)
Scalable protocol to coherence estimation from scarce data: Theory and experiment [4.0] コヒーレンス(Coherence)は、量子的優位性を実現するための基本的なリソースである。
少ないデータからコヒーレンスを推定するためのスケーラブルなプロトコルを提案する。
この研究は、データスカース条件下での大規模量子システムのコヒーレンスを推定するための新しい経路を開く。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:06:57 GMT)
Deep learning-based automated damage detection in concrete structures using images from earthquake events [4.0] 本研究では,大規模地震後のコンクリート構造物や橋梁の露出鋼補強を深層学習法により検出する構造損傷条件について検討する。
2023年の地震以降に収集された新しい画像データセットは、幅広い損傷を受けたコンクリート構造物を表すものとしてラベル付けされた。
提案手法はディープラーニングフレームワーク上に構築され,微調整,データ拡張,公開データセット上でのテストが可能である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:35:14 GMT)
A Data-Centric Approach to Multilingual E-Commerce Product Search: Case Study on Query-Category and Query-Item Relevance [4.0] 複数言語によるeコマース検索は、言語間で深刻なデータ不均衡に悩まされている。
2つのコアタスクのパフォーマンスを向上させるために,実用的で,アーキテクチャに依存しない,データ中心のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:27:35 GMT)
Online AUC Optimization Based on Second-order Surrogate Loss [3.9] 曲線の下の領域は、分類タスクの重要なパフォーマンス指標である。
両方向のヒンジ損失に基づく新しい第2次サロゲート損失と,効率的なオンラインストレージを開発する。
本手法では, 1次および2次統計量から構築した損失関数を用いて, 集約された対損失を直接置換する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:08:22 GMT)
Interpret Policies in Deep Reinforcement Learning using SILVER with RL-Guided Labeling: A Model-level Approach to High-dimensional and Multi-action Environments [3.9] 深層強化学習は優れた性能を発揮するが、解釈性に欠ける。
SILVERフレームワークは、Shapleyベースの回帰を通じてRLポリシーを説明するが、低次元のバイナリアクションドメインに限定されている。
本稿では,SILVERをマルチアクションおよび高次元環境に拡張した拡張型であるRL誘導ラベル付きSILVERを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:31:46 GMT)
Self-diffusion for Solving Inverse Problems [3.9] 我々は,事前学習された生成モデルに頼ることなく,逆問題を解決するための新しいフレームワークである自己拡散を提案する。
自己拡散はニューラルネットワークのスペクトルバイアスを利用して、スケジュールされたノイズプロセスを通じて変調する。
我々は, 線形逆問題に対するアプローチの有効性を実証し, 他の手法と比較して, 自己拡散が競争力や優れた性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:57:22 GMT)
How Learning Dynamics Drive Adversarially Robust Generalization? [3.8] 本研究では, モデルパラメータの後方共分散と, 対向損失景観の曲率とを明示的に関連付ける新しいPAC-Bayesianフレームワークを提案する。
分析の結果,学習速度,勾配雑音,ヘッセン構造などの重要な要因が,学習中に頑健な一般化を共同で形成することが明らかとなった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:21:32 GMT)
A Stylometric Application of Large Language Models [3.7] 大規模言語モデル(LLM)は,異なる著者の筆跡を区別するために用いられることを示す。
具体的には、ある著者の作品に基づいてゼロから訓練された個々のGPT-2モデルは、他の著者の保持されたテキストよりも正確に著者の保持されたテキストを予測する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:35:17 GMT)
Towards Explainable Personalized Recommendations by Learning from Users' Photos [3.6] その画像は、そのアイテムの質を最もよく納得できる議論であるからである。
この意味では、RSはその結果を説明でき、従って信頼性を高めることができる。
論文には、与えられたペア(ユーザ、写真)のオーサシップ確率を推定する形式的なフレームワークが含まれている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:33:50 GMT)
Selective Parallel Loading of Large-Scale Compressed Graphs with ParaGrapher [3.6] ParaGrapherは、大規模および圧縮されたグラフをロードするための高性能なAPIとライブラリである。
本稿ではParaGrapherの設計とグラフ圧縮の性能モデルを提案する。
評価の結果,ParaGrapherはロード時の最大3.2倍,エンドツーエンド実行時の最大5.2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:13:05 GMT)
FAITH: A Framework for Assessing Intrinsic Tabular Hallucinations in Finance [3.6] 金融に大規模言語モデル(LLM)をデプロイする上で、幻覚は依然として重要な課題である。
金融LLMにおける内因性幻覚を評価するための厳密でスケーラブルなフレームワークを開発する。
私たちの仕事は、より信頼性が高く信頼性の高い財務生成AIシステムを構築するための重要なステップとして役立ちます。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:11:45 GMT)
Visual Autoregressive Models Beat Diffusion Models on Inference Time Scaling [3.6] 視覚自己回帰モデルの離散的かつ逐次的な性質は、画像生成を効果的に検索できることを示す。
ビームサーチはテキスト・画像生成を大幅に改善し、2Bパラメータ自己回帰モデルがベンチマーク間で12Bパラメータ拡散モデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:55:17 GMT)
VENI, VINDy, VICI: a generative reduced-order modeling framework with uncertainty quantification [3.5] 減階モデル(ROM)は計算を高速化するために開発された。
支配方程式が未知あるいは部分的に知られている場合、ROMは予測された解の解釈可能性や信頼性を欠いている。
本稿では,潜在変数と動的変数を解釈可能な方法で同定し,不確実性を定量化するROMを構築するためのデータ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:05:13 GMT)
K-DAREK: Distance Aware Error for Kurkova Kolmogorov Networks [3.5] 我々はクルコバ・コルモゴロフネットワーク(K-DAREK)に対する新しい学習アルゴリズムを開発した。
提案手法は,距離を意識した頑健な誤差境界を確立する。つまり,テストポイントから最寄りのトレーニングポイントまでの距離を反映する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:49:59 GMT)
Photorealistic Inpainting for Perturbation-based Explanations in Ecological Monitoring [3.5] 本稿では,シーンコンテキストを保存した摂動,マスローカライズされた編集を生成するインパインティングガイドによる説明手法を提案する。
我々は,Glacier Bayのドローン画像において,港のシール検出のために微調整されたYOLOv9検出器のアプローチを実証する。
その結果、診断構造をローカライズし、従来の摂動に共通する削除アーティファクトを回避し、ドメイン関連洞察を得る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:24:57 GMT)
On Thin Ice: Towards Explainable Conservation Monitoring via Attribution and Perturbations [3.5] 我々は、Glacier Bay National Parkの航空画像を用いて、港のアザラシを検出するために、より高速なR-CNNを訓練する。
フィールド利用に関連する3つの軸に沿った説明を評価する。
これらの知見をモデル開発のための実用的な次のステップに変換する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:46:24 GMT)
Software Engineering Agents for Embodied Controller Generation : A Study in Minigrid Environments [3.4] ソフトウェアエンジニアリングエージェント(SWE-Agents)は、アクセス可能な従来のソフトウェアエンジニアリングタスクに有効であることが証明されている。
本稿では,SWE-Agents を具体化タスクのためのコントローラ生成に拡張した最初の評価法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:04:11 GMT)
Pruning and Quantization Impact on Graph Neural Networks [3.3] グラフニューラルネットワーク(GNN)は、グラフ構造化データからの学習を高精度に行う。
一般的なニューラルネットワーク圧縮技術には、プルーニングと量子化の2つがある。
異なるGNNモデルに対する3つのプルーニング法と3つの量子化法の効果を実験的に検討した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:44:25 GMT)
Bayesian Surrogate Training on Multiple Data Sources: A Hybrid Modeling Strategy [3.3] 代理訓練中にシミュレーションデータと実世界の計測データを統合するための2つの新しい手法を提案する。
第1の方法は、各データソースに対するサロゲートモデルを訓練し、予測分布を組み合わせ、第2の方法は、単一のサロゲートをトレーニングすることで、両方のデータソースを組み込む。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:44:11 GMT)
Myopic Entropy Scheduling for Ramsey Magnetometry [3.3] 本稿では、磁場の量子センシングのためのエントロピーに基づく適応測定シーケンス戦略を提案する。
エントロピーによって測定された特定の精度に必要な測定回数を減らすことを目的とした,これらの測定シーケンスを設計する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:56:28 GMT)
Deep Learning on Real-World Graphs [3.3] この論文では、グラフニューラルネットワーク(GNN)の限界に対処する一連のモデルを紹介している。
このコントリビューションは、学術ベンチマークと産業規模のグラフのギャップを埋め、ソーシャルやレコメンデーションシステムのようなドメインでGNNを使用することを可能にします。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:58:13 GMT)
Randomized-MLP Regularization Improves Domain Adaptation and Interpretability in DINOv2 [3.2] ビジョントランスフォーマー(ViT)は、ドメイン間で強力なパフォーマンスを達成するが、注意力や特徴マップの解釈可能性を低減する方法で、しばしば低インフォーマティブなパッチトークンを再利用する。
我々は、より意味論的に整合した表現を促進する対照的な学習法であるRandomized-MLP(RMLP)正則化を導入する。
我々は、DINOv2を微調整する際にRMLPを用いて、医用画像と自然画像の両方を微調整し、より解釈可能なアテンションマップを作成しながら、下流の性能を改善し、維持することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:39:18 GMT)
Scaling Neuro-symbolic Problem Solving: Solver-Free Learning of Constraints and Objectives [3.2] 本稿では,NP-ハード推論問題の解法を学習するために,識別可能なニューロシンボリックアーキテクチャと損失関数を導入する。
自然入力からNPハード推論問題の解法を効率よく学習できることを実証的に示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:41:44 GMT)
Uncovering the Persuasive Fingerprint of LLMs in Jailbreaking Attacks [3.2] 大規模言語モデルは、アライメント保護を回避し、有害な出力を誘発するジェイルブレイク攻撃に対して脆弱である。
パーシャジョン・アウェアは安全ガードを著しく回避し,脱獄行為を誘発する可能性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:20:23 GMT)
Optimal kernel regression bounds under energy-bounded noise [3.2] カーネルベースの推定のために、厳密で漸近的でない不確実性を導出する。
カーネルベースの推定値に対して,厳密で計算が容易なバウンダリを返却する効果を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:07:40 GMT)
TURBOTEST: Learning When Less is Enough through Early Termination of Internet Speed Tests [3.2] インターネットのスピードテストは、ユーザー、ISP、政策立案者には不可欠だが、静的な洪水ベースの設計はコストを増大させる。
本稿では,既存のプラットフォーム上に位置する速度テスト終了のための体系的フレームワークであるTURBOTESTを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:25:16 GMT)
Faster and Memory-Efficient Training of Sequential Recommendation Models for Large Catalogs [3.1] 負サンプリングによるクロスエントロピー損失をGPU効率よく実装するCCE-法を提案する。
本手法は,メモリ消費を10倍以上削減しつつ,最大2倍のトレーニングを高速化する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:19:07 GMT)
Grasp2Grasp: Vision-Based Dexterous Grasp Translation via Schrödinger Bridges [3.1] 本稿では,視覚に基づくデクスタラス・グリップ・トランスフォーメーションのための新しいアプローチを提案する。
我々のゴールは、ペアのデモや手固有のシミュレーションを必要とせずに、機能的に等価なハンドグリップを合成することである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:15:44 GMT)
ITC-RWKV: Interactive Tissue-Cell Modeling with Recurrent Key-Value Aggregation for Histopathological Subtyping [3.0] 本稿では,マクロ組織の特徴と集合細胞表現との相互作用をモデル化したデュアルストリームアーキテクチャを提案する。
組織と細胞間の双方向の相互作用モジュールを導入し, 局所的な細胞キューと周囲の組織環境の相互の注意を喚起する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:03:52 GMT)
On the Hardness of Approximating Distributions with Tractable Probabilistic Models [3.0] 本稿では,$f$-divergencesに基づく確率回路を用いた近似分布について検討する。
任意の分布を有界$f$-divergenceで近似することは任意のモデルに対して$mathsfNP$-hardであることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:14:05 GMT)
CT-CLIP: A Multi-modal Fusion Framework for Robust Apple Leaf Disease Recognition in Complex Environments [3.0] 本研究では,CNN-Transformer-CLIP (CT-CLIP) というマルチブランチ認識フレームワークを提案する。
アダプティブ・フィーチャー・フュージョン・モジュール(AFFM)はこれらの特徴を動的に融合させ、局所情報とグローバル情報の最適な結合を実現する。
CT-CLIPは、利用可能なリンゴ病と自己構築したデータセットに対して97.38%と96.12%の精度を達成し、いくつかのベースライン法より優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:23:47 GMT)
A Rapid Physics-Informed Machine Learning Framework Based on Extreme Learning Machine for Inverse Stefan Problems [2.9] 本稿では,逆ステファン問題に対する物理インフォームド・エクストリーム・ラーニング・マシン(PIELM)を開発した。
PIELMは、従来のディープニューラルネットワークを、極端な機械学習マシンネットワークに置き換える。
ケーススタディによれば、PIELMは相対的なL2誤差から予測精度を3~7桁向上させることができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:06:34 GMT)
Morphologically Intelligent Perturbation Prediction with FORM [2.9] FORMは、三次元細胞構造における摂動によって引き起こされる変化を予測する機械学習フレームワークである。
多様な化学的および遺伝的摂動にまたがる65,000以上の3D細胞ボリュームの大規模なデータセットで訓練された。
MorphoEvalは、構造、統計、生物学的次元における摂動によって引き起こされる変化を定量化するベンチマークスイートである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:03:20 GMT)
RAPTOR-GEN: RApid PosTeriOR GENerator for Bayesian Learning in Biomanufacturing [2.9] 本稿では,メカニズムインフォームドベイズ学習フレームワークRAPTOR-GENを紹介する。
RAPTOR-GENは、スパースおよび異種実験データからインテリジェントデジタルツイン開発を加速するように設計されている。
制御可能な誤りを考慮した高速かつ堅牢なRAPTOR-GENアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:03:49 GMT)
Neural Index Policies for Restless Multi-Action Bandits with Heterogeneous Budgets [2.9] ヘテロジニアスな予算制約を持つマルチアクションRMABに対するニューラルインデックスポリシー(NIP)を導入する。
NIPは、インデックス予測と制約付き最適化を単一のエンドツーエンドの差別化フレームワークに統合する。
経験的に、NIPは、占有するオラクル対策の5%で、ほぼ最適性能を達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:08:36 GMT)
On the flow matching interpretability [2.8] 本稿では,既知の物理分布から各フローステップを抽出するフレームワークを提案する。
流れの軌跡は、シミュレートされた物理過程の平衡状態にマッピングされる(そしてトラバースに制約される)。
このことは、生成フローに物理的意味論を埋め込むことで、神経軌跡を解釈可能な物理過程に変換することを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:26:45 GMT)
SAND: A Self-supervised and Adaptive NAS-Driven Framework for Hardware Trojan Detection [2.8] ハードウェアトロイの木馬(HT)は組み込みシステムにとって重要なセキュリティ脅威である。
有望な機械学習ベースのHT検出技術にもかかわらず、アドホックな特徴選択と適応性の欠如に悩まされている。
我々は,効率的なHT検出のための自己教師付き適応NAS駆動型フレームワークであるSANDを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:55:00 GMT)
Multimodal Datasets with Controllable Mutual Information [2.8] モダリティ間の相互情報を明確に計算可能な高マルチモーダルデータセットを生成するためのフレームワークを提案する。
ベンチマークデータセットは、相互情報推定器とマルチモーダル自己教師型学習技術に関する体系的な研究のための新しいテストベッドを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:44:40 GMT)
Language Models Are Capable of Metacognitive Monitoring and Control of Their Internal Activations [2.8] 大規模言語モデル(LLM)は、タスクの解決に実際に使用している戦略を報告することができるが、その振る舞いを管理する戦略を認識できない場合もある。
これはメタ認知(メタ認知)の程度が限定されていることを示唆している。
我々は,LLMのメタ認知能力の定量化と,その活性化パターンの報告と制御に,文脈内学習を用いた神経科学に着想を得た神経フィードバックパラダイムを導入する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:36:51 GMT)
Amortized Variational Inference for Partial-Label Learning: A Probabilistic Approach to Label Disambiguation [2.7] 部分ラベル学習列車は、各インスタンスが候補ラベルのセットに関連付けられているときに分類する。
本稿では,アモータライズされた変分推論を用いて,真のラベル上の後部分布を直接近似する新しいフレームワークを提案する。
提案手法はニューラルネットワークを用いて入力データから変動パラメータを予測し,効率的な推論を可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:54:23 GMT)
ScoreMix: Synthetic Data Generation by Score Composition in Diffusion Models Improves Recognition [2.7] 本稿では,自己完結型合成合成法であるScoreMixを提案する。
このアプローチは、逆拡散軌道に沿ってクラス条件付きスコアを混合し、外部リソースなしでドメイン固有のデータ拡張をもたらす。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:03:54 GMT)
Harnessing Intrinsic Noise for Quantum Simulation of Open Quantum Systems [2.6] 量子コンピュータ上でのオープン量子システムのシミュレーションは、根本的な課題である。
オープン量子力学は本質的に非ユニタリであるが、量子コンピュータはユニタリ進化を通して動作する。
本稿では,ノイズを計算資源として活用する方法を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:08:26 GMT)
Real-Time Gait Adaptation for Quadrupeds using Model Predictive Control and Reinforcement Learning [2.6] 連続歩行空間におけるリアルタイム歩行適応のための最適化フレームワークを提案する。
モデル予測パス積分(MPPI)アルゴリズムとDreamerモジュールを組み合わせることで、四足歩行に対する適応的かつ最適なポリシーを生成する。
我々は,Unitree Go1上でのシミュレーションの枠組みを評価し,目標速度の異なるエネルギー消費の最大36.48%の削減を実証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:47:41 GMT)
Better Together: Leveraging Multiple Digital Twins for Deployment Optimization of Airborne Base Stations [2.5] 航空基地局にとって、徹底的な試験を行うことなく、最良の場所を確立することが重要である。
本稿では,デジタルツイン(DT)誘導方式を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:30:11 GMT)
Cloud-Fog-Edge Collaborative Computing for Sequential MIoT Workflow: A Two-Tier DDPG-Based Scheduling Framework [2.5] Medical Internet of Things(MIoT)は、異質なクラウドフォッグエッジインフラストラクチャ上にデプロイされたシーケンシャルなヘルスケアに対して、厳しいエンドツーエンドのレイテンシ保証を要求する。
本稿では,スケジューリング決定を階層的なプロセスに分解する2層DDPGベースのスケジューリングフレームワークを提案する。
実験の結果、我々のアプローチを検証し、複雑さが増大するにつれて、ベースラインよりもパフォーマンスが向上することを示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:58:31 GMT)
Attestable Builds: Compiling Verifiable Binaries on Untrusted Systems using Trusted Execution Environments [2.5] 我々は、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する新しいパラダイムである、検証可能なビルドを提示する。
我々のシステムは、最新の信頼できる実行環境(TEE)とサンドボックス化されたビルドコンテナを使用して、特定のアーティファクトが特定のソースコードスナップショットから正しく構築されていることを確実に保証します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:03:22 GMT)
Runtime reduction in lattice surgery utilizing time-like soft information [2.4] 簡単な2段階のプロトコルとして,少量のシンドローム測定サイクルで格子手術を行い,フルシンドローム測定サイクルで再実行することを提案する。
本稿では,TELS (temporally encoded lattice surgery) と呼ばれる既存の実行時削減プロトコルを,ほとんどの場合において超越していることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:42:31 GMT)
Quality of Coverage (QoC): A New Paradigm for Quantifying Cellular Network Coverage Quality, Usability and Stability [2.3] 現在の細胞被覆の表現は単純化され過ぎており、空間と時間のネットワーク安定性という、ユーザビリティの重要な要素を組み込むことができない。
実測性能,ユーザビリティ,安定性を反映した,キーパフォーマンス指標(KPI)の新規な多次元集合であるQuality of Coverage(QoC)を紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:26:04 GMT)
Out-of-Distribution Detection for Safety Assurance of AI and Autonomous Systems [2.3] 自律システムの安全性を厳格に実証することは、その採用の責任を負う上で重要である。
OOD検出は研究・開発・安全工学のコミュニティから注目を集めている。
自律システムにおける安全保証の文脈におけるOOD検出手法の総合的な分析を行った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:38:01 GMT)
HollowFlow: Efficient Sample Likelihood Evaluation using Hollow Message Passing [2.2] 新たなグラフニューラルネットワーク(NoBGNN)を活用したフローベース生成モデルである$textitHollowFlow$を紹介した。
ブロック対角ジャコビアン構造を強制することにより、ホローフロー確率は、一定の数の後方通過で$n$で評価され、最大$mathcalO(n2)$のスピードアップが得られる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:04:24 GMT)
REvolution: An Evolutionary Framework for RTL Generation driven by Large Language Models [2.1] LLM(Large Language Models)は、レジスター-トランスファーレベル(RTL)コード生成に使用される。
本稿では,進化計算(EC)とLLMを組み合わせて自動RTL生成と最適化を行うフレームワークであるRevolutionを紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:50:35 GMT)
Approximating Signed Distance Fields of Implicit Surfaces with Sparse Ellipsoidal Radial Basis Function Networks [2.1] 暗示表面の符号付き距離関数(SDF)の正確な表現は、3次元幾何学の効率的な記憶、計算、下流処理に不可欠である。
比較的少数の楕円基底関数(ERBF)を用いて暗黙曲面のSDF場を近似する一般学習法を提案する。
提案手法は,既存の暗黙的表現手法よりもパラメータが少なく,精度,堅牢性,計算効率を向上できる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:52:52 GMT)
Seemingly Redundant Modules Enhance Robust Odor Learning in Fruit Flies [2.1] 側方抑制(LI)と神経スパイク周波数適応(SFA)は、嗅覚学習のためのパターン分離を促進すると考えられている。
本研究では, ハエ嗅覚回路の計算モデルを用いて, 異なる騒音条件下での臭気識別について検討する。
以上の結果から,低騒音・中騒音のシナリオでは,LIは臭気識別を主に促進するが,高騒音条件下では低下し,逆転する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:18:38 GMT)
How Toxic Can You Get? Search-based Toxicity Testing for Large Language Models [2.1] 大型言語モデル(LLM)は、有害な応答を発生させる傾向にある場合、大きな損傷を引き起こす可能性がある。
毒性に対するLSMの傾きを自動テストするフレームワークであるEvoToxについて紹介する。
我々は,5つの最先端LCMを用いて定量的,定性的な実験評価を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:10:55 GMT)
Contribution of task-irrelevant stimuli to drift of neural representations [2.0] 生物学的および人工的な学習者は、その生涯を通じてデータと経験の流れに本質的にさらされている。
最近の研究によると、性能が安定しても、基礎となる神経表現は時間とともに徐々に変化する。
本研究では,データ分布の関数としてドリフトを特徴付けるとともに,タスク非関連刺激による学習ノイズが長期ドリフトを生じさせることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:54:25 GMT)
Boundaries of Acceptable Defectiveness: Redefining Surface Code Robustness under Heterogeneous Noise [2.0] 超伝導量子ビットに関する過去の様々な研究は、これらのデバイスがかなりの変動を示すことを示している。
私たちの仕事は許容できる欠陥の境界を定義することを目的としています。
物理誤差率のように見えるような量子ビットの変動は、論理的量子ビット性能を著しく低下させる可能性がある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:09:06 GMT)
The "Right" Discourse on Migration: Analysing Migration-Related Tweets in Right and Far-Right Political Movements [2.0] 英語とフランス語の極右ツイートのMIGR-TWITコーパスを分析する手法を提案する。
我々は,右と右のアクターが採用する移動・ヘイトスピーチ・説得のパターンを明らかにすることを目的としている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:45:18 GMT)
Unveiling the BEC-droplet transition with Rayleigh superradiant scattering [1.9] 超放射光散乱を用いたボース・アインシュタイン凝縮(BEC)から双極子166$Erガス中の液滴への遷移について検討した。
超放射能散乱の効率は、遷移中の試料の膨張速度に類似した非単調な挙動を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:27:16 GMT)
Breaking of scale invariance in a strongly dipolar 2D Bose gas [1.9] 2次元(2D)双極性原子ガスは、新しい量子相を探索するユニークな機会を与える。
可変双極子配向を持つ準2次元高調波トラップにおける強双極子2次元凝縮体の生成と特性を実証する。
この観察により、2次元のDDIによって誘導される多体効果が解明され、2次元超固体やその他の異方性量子相の実現に向けた重要なステップとなる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:33:01 GMT)
Flight Delay Prediction via Cross-Modality Adaptation of Large Language Models and Aircraft Trajectory Representation [1.7] 本稿では,軽量な大規模言語モデルに基づくマルチモーダル飛行遅延予測を提案する。
ターミナルエリアに入った後、航空機の遅延を監視する航空管制官の観点から定式化される。
この枠組みは,言語理解と軌跡情報の相互適応が組み合わさると,遅延予測が促進されることを実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:21:27 GMT)
FSNet: Feasibility-Seeking Neural Network for Constrained Optimization with Guarantees [1.7] 機械学習ベースのアプローチは、より高速に近似したソリューションを提供するための有望な代替手段として登場した。
本稿では,FSNet(Feasibility-Seeking Network)を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:34:57 GMT)
Learning Neural Control Barrier Functions from Expert Demonstrations using Inverse Constraint Learning [1.7] 我々は、安全、すなわち制御された前方不変集合に属することを考慮し、システムの状態を分類する制約関数を訓練する。
次に、その関数を使用して、新しいシミュレートされた軌道のセットをラベル付けし、神経CBFをトレーニングします。
4つの異なる環境において、我々のアプローチを実証的に評価し、既存のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:20:34 GMT)
Fast adaptive discontinuous basis sets for electronic structure [1.7] 電子構造計算のための適応基底集合を自動構築するGalerkinフレームワークを開発した。
要素集合の組み合わせを許すことで、我々は好適な数値条件を保ち、積分解法の構造的空間性を誘導する。
これらの基底集合は、ハートリー・フォックの自己整合体と密度汎関数理論で用いられる線形固有解法に対する適応多重グリッド事前条件を自然に支持する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:33:48 GMT)
SAD Neural Networks: Divergent Gradient Flows and Asymptotic Optimality via o-minimal Structures [1.7] 活性化関数を用いた完全連結フィードフォワードニューラルネットワークの損失景観に対する勾配流について検討した。
勾配流が臨界点に収束するか、損失が臨界値に収束している間に無限大に分岐することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:57:26 GMT)
Deep Insights into Cognitive Decline: A Survey of Leveraging Non-Intrusive Modalities with Deep Learning Techniques [1.6] 本調査は、ディープラーニング技術を用いて認知低下検出タスクを自動化する最も関連性の高い非侵入的手法についてレビューする。
我々は、最先端のアプローチを含む、各モダリティと方法論の重要な特徴と利点について論じる。
ほとんどの場合、テキストベースのアプローチは、他のモダリティよりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:04:47 GMT)
CogniAlign: Word-Level Multimodal Speech Alignment with Gated Cross-Attention for Alzheimer's Detection [1.6] 本稿では,アルツハイマー検出のためのマルチモーダルアーキテクチャであるCogniAlignを紹介する。
音声とテキストのモダリティと、2つの非侵入的な情報ソースを統合している。
Leave-One-Subject-Outセットアップでは87.35%、Cross-Validationでは90.36%の精度を実現している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:09:41 GMT)
Computational Hardness of Reinforcement Learning with Partial $q^π$-Realizability [1.6] 本稿では, 線形関数近似系における強化学習の計算複雑性を部分的に$qpi$-realizability と呼ぶ。
この設定で$epsilon$-optimal Policyを学習することは、計算的に困難であることを示す。
我々の結果は$q*$-realizability(英語版)を反映し、$Pi$が最適ポリシーを超えて拡張された場合でも計算困難が持続することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:18:49 GMT)
Boosting Accuracy and Efficiency of Budget Forcing in LLMs via Reinforcement Learning for Mathematical Reasoning [1.4] 本稿では,Regressed Learning(RL)を統合したフレームワークを提案し,トークン効率の向上と数学的推論のための1.5Bモデルの性能向上を図る。
その結果,SFTモデルと比較してトークン使用率を40%以上削減し,全体的な精度が向上した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:39:15 GMT)
HistRetinex: Optimizing Retinex model in Histogram Domain for Efficient Low-Light Image Enhancement [1.4] HistRetinexは、高速低照度画像強調のためのヒストグラムベースのRetinexモデルである。
HistRetinexは、可視性とパフォーマンスの指標の両方において、既存の拡張メソッドよりも優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:24:13 GMT)
Towards Low-Latency and Adaptive Ransomware Detection Using Contrastive Learning [1.3] ランサムウェアは、その急速な進化、早期発見の必要性、多様性の増大により、サイバーセキュリティにとって重要な脅威となっている。
既存のメソッドには,アドホックな機能依存,応答の遅れ,目に見えない変種への適応性の制限という,3つの大きな制限がある。
これらの課題に対処するために,自己教師付きコントラスト学習とニューラルアーキテクチャサーチ(NAS)を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:33:52 GMT)
Accelerating Mobile Inference through Fine-Grained CPU-GPU Co-Execution [1.3] 本稿では,OpenCLの微細粒度共有仮想メモリ(SVM)と機械学習モデルに基づいて,実行時間を正確に予測する軽量同期機構を提案する。
4つのモバイルプラットフォーム上での総合的な評価から,線形層で最大1.89倍,畳み込み層で最大1.75倍の高速化を実現したCPU-GPU共同実行戦略を迅速に選択できることが示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:41:43 GMT)
Physics-Informed Deep Learning for Improved Input Function Estimation in Motion-Blurred Dynamic [${}^{18}$F]FDG PET Images [1.3] 我々は、PET画像から直接AIFを推定するために、物理インフォームド深層学習に基づく入力関数予測モデル(PIDLIF)を訓練する。
提案手法は,物理インフォームド損失を伴わずにネットワークに匹敵する性能を有し,画像のぼやけを突如起こす動きをシミュレートすると,PIDLIFモデルは画像劣化の重大ケースにおいて高い性能を維持した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:26:07 GMT)
From Cables to Qubits: A Decomposed Variational Quantum Optimization Pipeline [1.3] ケーブルルーティング最適化問題(Cable Routing Optimization Problem、CROP)は、産業レイアウトやスマート製造設備の中心となるマルチフロールーティングタスクである。
CROPをケーブルワイド分離可能なブロック対角2次元非拘束二元最適化問題(QUBO)として定式化する。
本稿では,ケーブル1本につき1QUBOを構築し,各QUBOをハミルトニアンに変換し,変分量子固有解器(VQE)を用いてサブプロブレムを解く分解パイプラインを提案する。
この手順は、実行当たりのキュービットを完全な問題サイズから単一ケーブルサブプロブレムのキュービットに還元する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:02:27 GMT)
Actionable Cybersecurity Notifications for Smart Homes: A User Study on the Role of Length and Complexity [1.3] 侵入検知システムは、サイバーセキュリティの脅威を検出するための顕著なアプローチである。
大規模な言語モデルは、IDSアラートを実行可能なセキュリティ通知に変換することで、このギャップを埋めることができる。
アクション可能なサイバーセキュリティ通知がどのようなものになるのか、まだ明らかになっていない。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:36:35 GMT)
Towards Scaling Deep Neural Networks with Predictive Coding: Theory and Practice [1.3] バックプロパゲーション(BP)は、現代の人工知能を支えるディープニューラルネットワークをトレーニングするための標準アルゴリズムである。
この論文は、予測符号化(PC)という、より効率的な脳誘発アルゴリズムの研究である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:47:49 GMT)
World-POI: Global Point-of-Interest Data Enriched from Foursquare and OpenStreetMap as Tabular and Graph Data [1.2] 最近Foursquareは1億以上の関心点(POI)を持つグローバルデータセットをリリースした。
対照的に、OpenStreetMap (OSM) は、詳細なメタデータと頻繁な更新を伴う、リッチでユーザ対応のPOIデータセットを提供する。
両データセットの長所を統合する方法論を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:12:41 GMT)
Shift Bribery over Social Networks [1.2] シフト贈収賄では、議員は有権者にそのランクを上げるよう支払うことで、自分の好む候補者を奨励しようと試みている。
我々は、ネットワーク上のシフト収賄について研究し、有権者は有向重み付きグラフのノードとしてモデル化され、弧はそれらの間の社会的影響を表す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:05:50 GMT)
E-bike agents: Large Language Model-Driven E-Bike Accident Analysis and Severity Prediction [1.2] Eバイクは都市移動の持続可能な形態として急速に人気を集めているが、その安全性は未解明のままである。
本稿では,電子自転車と自転車の事故事例を2つのデータソースを用いて分析する。
障害の原因と重症度を特定し定量化するための標準化された分類フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:40:27 GMT)
FITS: Towards an AI-Driven Fashion Information Tool for Sustainability [1.1] 本研究は,ファッションブランドのサステナビリティデータの分類に自然言語処理(NLP)技術を適用する方法について検討する。
本稿では,持続可能性情報の抽出と分類を行うトランスフォーマシステムであるFITS(Fashion Information Tool for Sustainability)のプロトタイプを提案する。
FITSはユーザが関連するデータを検索し、自身のデータを分析し、インタラクティブなインターフェースを通じて情報を探索することを可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:35:07 GMT)
Conditional Forecasts and Proper Scoring Rules for Reliable and Accurate Performative Predictions [1.1] 結果から分離した共変量に対する条件付け予測が,目標分布予測不変量となることを示す。
また, (i) 決定論的条件下では, 予測が分離された場合, 正しい予測とインセンティブに適合する予測が適用可能であること, (ii) 予測と対象変数の帰納分布の偏りの未偏り推定によるスコアが正しい予測をもたらすこと, の2つの解を同定した。
本結果は,従来の予測評価の基本的限界を明らかにし,信頼性と精度の高い予測を行うための新しいツールを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:59:21 GMT)
CityAQVis: Integrated ML-Visualization Sandbox Tool for Pollutant Estimation in Urban Regions Using Multi-Source Data (Software Article) [1.1] CityAQVisは、地上の汚染物質濃度を予測し視覚化するために設計された、インタラクティブな機械学習サンドボックスツールである。
その結果,MLによる視覚分析が,状況認識を改善し,品質管理におけるデータ駆動による意思決定を支援する可能性を強調した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:31:44 GMT)
AI-assisted Programming May Decrease the Productivity of Experienced Developers by Increasing Maintenance Burden [1.1] GitHub CopilotのようなジェネレーティブAIソリューションは、ソフトウェア開発者の生産性を高めることが示されている。
GitHub Copilotの導入に伴い、オープンソースソフトウェア(OSS)プロジェクトにおける開発者の活動を分析します。
生産性は確かに増加する。しかし、生産性の増加は、主に経験の少ない(周辺)開発者によって引き起こされる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:51:19 GMT)
Role of inefficient measurement in realizing post-selection-based non-Hermitian qubits [1.0] 本稿では,崩壊チャネル,第2の励起された第1の励起された第1の励起された基底状態遷移,および第1の励起された基底状態遷移に対する選択後の効率について紹介する。
第2励起および第1励起多様体内の量子ジャンプから生じるデコヒーレンス効果は、第2励起から第1励起遷移の非効率な後選択の下でも現れる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:16:40 GMT)
Performance Trade-offs of Optimizing Small Language Models for E-Commerce [1.0] 大規模言語モデル(LLM)は、自然言語の理解と生成タスクにおける最先端のパフォーマンスを提供する。
本稿では,資源効率の代替として,より小型でオープンウェイトなモデルの実現可能性について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:49:28 GMT)
Semantic knowledge guides innovation and drives cultural evolution [0.9] 文化的な進化によって、アイデアとテクノロジーは世代を超えて構築され、それは人間の中で最も複雑でオープンな形態に到達するプロセスである。
社会的学習はそのようなイノベーションの伝達を可能にするが、イノベーションを生み出す認知過程はいまだ不明である。
本稿では,概念とそれらの特性を結びつける意味知識と機能とが人間の革新を導くこと,累積的文化を促進することを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:35:55 GMT)
Uncertainty-Aware Multi-Objective Reinforcement Learning-Guided Diffusion Models for 3D De Novo Molecular Design [0.9] 本稿では,3次元分子拡散モデルの最適化を導くための不確実性を考慮した強化学習フレームワークを提案する。
自動分子設計を推進するためのRL誘導生成拡散モデルの強い可能性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:49:23 GMT)
Fundamental impossibility of a superradiant neutrino laser [0.9] 最大出力は$propto N$であり、$propto N2$ではない。
これはフェルミオン遷移振幅の破壊的干渉、またはフェルミオンの性質を持つ集合励起によるパウリの遮断と解釈できる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:59:19 GMT)
Can Bose-Einstein condensates enhance radioactive decay? [0.9] 我々は、放射光の$approx$MeVエネルギーによる多くのモードと短いコヒーレンスタイムの課題を強調した。
近年のガンマ線とニュートリノレーザーの提案では、ボース・アインシュタイン凝縮体を光源として用いるとこれらの問題が解決されると主張している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:51:05 GMT)
Sensor-Specific Transformer (PatchTST) Ensembles with Test-Matched Augmentation [0.8] 本研究では,頑健な人間行動認識のためのノイズ認識,センサ固有アンサンブル手法を提案する。
テスト時間ノイズを再現するために,1秒間スライドウインドウを付加したタンパー付きトレーニングセットにおいて,慣性センサ1個当たりの独立モデル1を訓練した。
プライベートリーダーボードでは、このパイプラインはベースラインよりもかなり高いマクロF1を達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:26:11 GMT)
Borsuk-Ulam and Replicable Learning of Large-Margin Halfspaces [0.8] 我々は、$d$-dimensional $gamma$-margin half-spaces のリスト複製数が[ fracd2+1 le MathrmLR(Hd_gamma) le d, ] を満たすことを証明した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:04:59 GMT)
Mechanistic Interpretability for Neural TSP Solvers [0.8] 我々は、100ノードインスタンス上で強化学習を施したポインタネットワークをトレーニングし、エンコーダの残余ストリームにSAEを適合させて、解釈可能な特徴の過剰完全辞書を発見する。
解析の結果,解法は基本的TSP概念を反映する特徴を自然に生み出すことが明らかとなった。
これらの発見は、ニューラルネットワークがノード選択の前に何を計算するかをモデル内部で初めて説明し、幾何学構造が明示的な監督なしに出現することを示し、透明なハイブリッドシステムへの経路を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:54:19 GMT)
The Virtues of Brevity: Avoid Overthinking in Parallel Test-Time Reasoning [0.8] 最短解を選択するための単純かつ直感的手法は極めて有効であることを示す。
このアプローチが自己整合性などの複雑な手法と競合していることを確認する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:47:17 GMT)
Recommended Practices for NPOV Research on Wikipedia [0.8] ニュートラル・ポイント・オブ・ビューはウィキペディアの5つの柱の1つである。
プロジェクトについて毎年何百もの研究研究が出版されていることを考えると、比較的過小評価されている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:50:31 GMT)
Order Parameter Discovery for Quantum Many-Body Systems [0.8] 本稿では, 位相図作成のための新しい手法について紹介する。
この方法では、量子位相をマッピングし、最適化問題を定式化し、順序パラメータに対応する可観測性を発見する。
本稿では,Axial Next Nearest Neighbour Interaction(ANNNI)モデル,クラスタ状態モデル,およびRydberg原子の連鎖など,確立されたモデルに適用することで,アプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:45:06 GMT)
Automating Coral Reef Fish Family Identification on Video Transects Using a YOLOv8-Based Deep Learning Pipeline [0.7] 本研究は,ケニアとタンザニアで収集された映像から家族レベルの魚の識別を自動化する,YOLOv8ベースのディープラーニングパイプラインを評価する。
24家族のキュレートされたデータセットを異なる構成でテストし、西インド洋におけるサンゴ礁の自動魚監視のための地域固有のベンチマークを初めて提供した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:34:29 GMT)
Enhanced MLLM Black-Box Jailbreaking Attacks and Defenses [0.7] テキストと画像のプロンプトによるブラックボックスジェイルブレイク手法を提案し,MLLMの評価を行う。
特に、挑発的指示を伴うテキストプロンプトと、突然変異やマルチイメージ機能を導入した画像プロンプトを設計した。
実験の結果,提案手法はオープンソースのMLLMとクローズドソースMLLMの両方のセキュリティを評価する能力を向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:35:37 GMT)
A Diagnostic Benchmark for Sweden-Related Factual Knowledge [0.7] データセットは、さまざまなサイズとスウェーデンのカバレッジの度合いのモデル間で、事実的リコールを測定するために使用することができる。
このデータセットを用いることで,スウェーデン語に関する事実を想起する上で,スウェーデン語がより強い範囲の小さなモデルの方が3倍大きな多言語モデルと相容れないことが判明した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:42:32 GMT)
A General Solution for the Implementation of CI/CD in Embedded Linux Development [0.6] 本研究は,Yocto Project を用いた Linux ベースのオペレーティングシステムの開発,構築,テストのための,統合的で再現可能なインフラの設計と実装を目的とした。
提案した構造は,メインのYoctoリポジトリ,カスタムレイヤ(meta-custom),コーディネートされたマニフェストレイヤで構成される3層アーキテクチャに基づいて実装された。
継続的インテグレーションと継続的デプロイメントパイプラインはGitLab CIで実装され、ビルドとテストの自動化と合理化のために、分離されたDocker環境と組み合わせられた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:35:21 GMT)
Robust Yield Curve Estimation for Mortgage Bonds Using Neural Networks [0.6] 小型住宅ローン債券市場に適した強靭な利得曲線推定のためのニューラルネットワークに基づくフレームワークを提案する。
本モデルでは, 収率曲線を1日ごとに独立に推定し, 滑らかさと安定性を向上する新たな損失関数を導入する。
スウェーデンの住宅ローン債に関する実証的な結果は、我々のアプローチがより堅牢で安定した利回り曲線の推定をもたらすことを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:24:41 GMT)
Learning Latent Variable Models via Jarzynski-adjusted Langevin Algorithm [0.6] 我々は、非平衡統計力学から派生したサンプルを用いて、潜在変数モデルにおける推定方法を構築する。
我々は,パラメータの最大限界推定値を提供する逐次モンテカルロ法(SMC)を開発した。
JALA-EMの様々な潜伏変数モデルにおける性能を実証し、精度と計算効率の点で既存の手法と相容れない性能を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:01:40 GMT)
AURASeg: Attention Guided Upsampling with Residual Boundary-Assistive Refinement for Drivable-Area Segmentation [0.6] セマンティックセグメンテーションのための残留境界支援リファインメント(AURASeg)を用いたアテンションガイドアップサンプリングを提案する。
提案手法は,<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>と<i>mIoU</i>の2。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:01:18 GMT)
3D micro-printing: An enabling technique for arbitrary potential landscapes for photonic quantum-gases [0.5] フォトニック量子ガスは、環境条件下でのオープン駆動散逸量子系の物理学を探索する。
染料を充填したマイクロキャビティにおけるフォトニック量子ガスの潜在的景観形成のための3次元マイクロプリンティング技術を紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:23:18 GMT)
Unified Implementations of Recurrent Neural Networks in Multiple Deep Learning Frameworks [0.5] torchrecurrent、RecurrentLayers.jl、LuxRecurrentLayers.jlは、RNNモデルの構築と拡張のための一貫したフレームワークを提供する。
すべてのパッケージはMITライセンスで利用可能で、GitHubでアクティブにメンテナンスされている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:35:33 GMT)
PTMF: A Privacy Threat Modeling Framework for IoT with Expert-Driven Threat Propagation Analysis [0.5] 異なるフェーズを通じてプライバシの脅威を分析する新しいプライバシ脅威モデルフレームワーク(PTMF)を提案する。
提案されたPTMFは、プライバシ脅威中の脅威アクターの活動を分析し、IoTシステムのプライバシリスクを評価するなど、さまざまな方法で使用することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:06:04 GMT)
Enhancing Social Robots through Resilient AI [0.5] 社会ロボットは、医療、教育、日常生活といった繊細な分野にますます統合されている。
本稿では、レジリエンスが社会ロボットの基本的な特徴であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:55:45 GMT)
LLM-Generated Negative News Headlines Dataset: Creation and Benchmarking Against Real Journalism [0.5] 本研究では,Large Language Models (LLMs) が生成する自然言語処理(NLP)タスクを支援するデータセットの可能性について検討する。
さまざまなネガティブな感情を捉えるために、カスタマイズされたプロンプトを使用して、ネガティブなニュースの見出しの専門的なコーパスが作成されました。
実際の見出しとの相関、難易度、コヒーレンス、リアリズムといった主要な指標を評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:51:35 GMT)
Automated interictal epileptic spike detection from simple and noisy annotations in MEG data [0.5] 脳磁図(MEG)はてんかん原性領域の局在を知らせる有効な検査である。
現在の自動化手法は臨床には適さない。
本研究では,MEG記録における間欠的スパイクの検出にディープラーニングモデルを用いることを実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:02:05 GMT)
CMOMgen: Complex Multi-Ontology Alignment via Pattern-Guided In-Context Learning [0.5] 複合マルチオントロジーマッチング(CMOM)は、1つのソースエンティティを複数のターゲットエンティティの複合論理式に整合させる。
CMOMgenは、ターゲットやエンティティの数を制限することなくセマンティックマッピングを生成する最初のエンドツーエンド戦略である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:12:22 GMT)
Risk-Averse Best Arm Set Identification with Fixed Budget and Fixed Confidence [0.4] 本稿では,期待報酬の最大化と関連する不確実性の最小化に対処するバンディット最適化における新たな問題設定を提案する。
固定信頼と固定最適体制の両方の下で動作可能な統一的メタ予算ゴリトミックフレームワークを提案する。
提案手法は,精度と試料効率の両面で既存手法より優れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:31:19 GMT)
A Multimodal Human Protein Embeddings Database: DeepDrug Protein Embeddings Bank (DPEB) [0.4] DPEB(DPEB)は、4つの埋め込み型を統合した22,043個のヒトタンパク質のキュレートされたコレクションである。
DPEBは、PPI予測のための複数のグラフニューラルネットワークメソッドをサポートしている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:22:17 GMT)
Probing Sensitivity near a Quantum Exceptional Point using Waveguide Quantum Electrodynamics [0.4] PT対称ハミルトニアンは例外点退化の出現によって興味を生んでいる。
例外点付近の急激なスペクトル応答のため、これらの系は精密量子センシングの候補として提案されている。
本研究は、量子増強センシングの候補として、例外点系の限界を解明する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:13:18 GMT)
Temporal Complexity Hierarchies in Solvable Quantum Many-Body Dynamics [0.3] 影響行列(IM)は、非平衡量子多体力学を特徴づける強力な枠組みを提供する。
本稿では、IMのメモリ構造を分析し、古典的時間的相関と量子的時間的相関を区別する。
この結果から,量子多体力学と群論の新たな関係が確立された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:00:08 GMT)
AutoSciDACT: Automated Scientific Discovery through Contrastive Embedding and Hypothesis Testing [0.3] 本稿では,科学データの新規性を検出する汎用パイプラインであるAutoSciDACT(Automated Scientific Discovery with Anomalous Contrastive Testing)を紹介する。
我々は、天文学、物理、生物学的、画像、合成データセットの領域で実験を行い、異常データの小さな注入に対して強い感度を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:07:50 GMT)
BioCube: A Multimodal Dataset for Biodiversity Research [0.3] 生態学および生物多様性研究のための微細なグローバルデータセットであるBioCubeを紹介する。
BioCubeは、画像、オーディオ記録、説明、環境DNA、植生指標、農業、森林、土地の指標、高解像度気候変数を通じて種を観察する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:17:32 GMT)
A4L: An Architecture for AI-Augmented Learning [0.3] 我々は、オンライン教育を通じて成人学習を支援するAI強化学習アーキテクチャ(A4L)を開発している。
我々は、A4Lアーキテクチャのモチベーション、目標、要件を示し、学習をよりパーソナライズし、スケーラブルにする目標をどのように進めるかについて議論する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:44:36 GMT)
A Hierarchical Error Framework for Reliable Automated Coding in Communication Research: Applications to Health and Political Communication [0.2] 階層的エラー補正フレームワークを導入し,モデル故障を階層的な測定誤差として扱う。
系統的誤分類を減らし, 平均精度が11.2ポイント, 安定した結論が得られた。
これは、コミュニケーション研究と幅広い社会科学をまたいだ自動コーディングに適用される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:36:37 GMT)
From Failure Modes to Reliability Awareness in Generative and Agentic AI System [0.2] この章は、階層化された障害モードから、生成的およびエージェント的AIシステムにおける信頼性の認識までのパスをトレースすることで、技術的分析と組織的準備を橋渡しする。
まず,ハードウェアやパワーファウンデーションから適応学習,エージェント推論に至るまで,脆弱性を識別する構造化フレームワークである11層障害スタックを紹介した。
この診断レンズを補完するため,我々は,AIスタック全体の信頼性リスクを個人や組織がいかに認識するかを定量化する,成熟度指向のフレームワークである認識マッピングの概念を開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:12:07 GMT)
The Qey: Implementation and performance study of post quantum cryptography in FIDO2 [0.2] FIDO2はパスワードレス認証の業界標準である。
現在のFIDO2標準では、SHA-256 (ES256)、RS256 (SHA-256) と類似の暗号署名アルゴリズムを用いている。
本稿では,FIDO2の量子暗号署名標準としてCrystals Dilithiumをベースとしたモジュール格子型デジタル署名アルゴリズム(ML-DSA)の有用性について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:30:15 GMT)
AutoOpt: A Dataset and a Unified Framework for Automating Optimization Problem Solving [0.2] AutoOpt-11kデータセットは、11,000以上の単目的、多目的、手書きの数学的最適化問題のユニークなイメージデータセットである。
データセットは25人の専門家によって作成され、データ生成のエラーを避ける。
最適化問題に対する機械学習に基づく自動アプローチであるAutoOptを開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:14:53 GMT)
Fixed Horizon Linear Quadratic Covariance Steering in Continuous Time with Hilbert-Schmidt Terminal Cost [0.2] 固定水平2次共分散ステアリング問題を連続時間で定式化し解いた。
この問題に対して、最適性の必要条件は、結合行列ODE2点境界値問題となる。
提案アルゴリズムとその解析は、関連するハミルトン行列の状態遷移行列によってパラメータ化された線形分数変換を利用する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:18:48 GMT)
We Need Accountability in Human-AI Agent Relationships [0.1] 本稿では,適切なユーザ行動にAIエージェントの関与が条件づけられたフレームワークを提案する。
このフレームワークは、ディスタンシング、ディスエンジ、ディスラッジといった設計戦略を取り入れている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:46:56 GMT)
From Polyester Girlfriends to Blind Mice: Creating the First Pragmatics Understanding Benchmarks for Slovene [0.1] 我々はSloPragEvalとSloPragMegaを紹介した。
本稿では,翻訳の難しさについて論じ,人間のベースラインを確立するためのキャンペーンについて述べるとともに,パイロット評価をLCMで報告する。
以上の結果から,現在のモデルではニュアンス言語理解が大幅に改善されているものの,非文節発話におけるインプリート話者の意味を推測できない可能性が示唆された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:43:42 GMT)
Mamba Goes HoME: Hierarchical Soft Mixture-of-Experts for 3D Medical Image Segmentation [0.1] Hierarchical Soft Mixture-of-Experts (HoME) は、効率的な長文モデリングのための2段階のトークンルーティング層である。
Mamba Selective State Space Model (SSM)のバックボーン上に構築されたHoMEは、適応的なエキスパートルーティングを通じてシーケンシャルなモデリングを強化する。
この階層設計は、局所的なエキスパートルーティングとグローバルなエキスパートの洗練を組み合わせ、一般化性とセグメンテーション性能を向上させる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:30:27 GMT)
Human-Centric Anomaly Detection in Surveillance Videos Using YOLO-World and Spatio-Temporal Deep Learning [0.1] 監視ビデオにおける異常検出は、異常事象の多様性、クラス不均衡、シーン依存の視覚的乱れなどにより、依然として困難な課題である。
マルチクラス異常分類のための時間的モデリングと人間の重み付け前処理を統合した頑健なディープラーニングフレームワークを提案する。
本手法は,3つの独立した試験において平均テスト精度が92.41%であり,クラスごとのF1スコアは0.85以上である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:38:17 GMT)
Total Generalized Variation of the Normal Vector Field and Applications to Mesh Denoising [0.1] R3$に埋め込まれた配向三角形メッシュ上での正規ベクトルの2階全一般化変分(TGV)の新しい定式化を提案する。
我々の定式化は、ラヴィアート・トーマス関数空間を利用する分割定数スカラーデータに対する従来の離散TGVモデルを拡張した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:21:53 GMT)
Quantum Neural Network Architectures for Multivariate Time-Series Forecasting [0.1] 多変量設定に向けて変動量子回路モデルを拡張する戦略を導入する。
また,量子自己保持機構を統合した新しい量子トランスアーキテクチャを導入する。
量子ベースモデルは、トレーニング可能なパラメータを少なくして、競争的または優れた予測精度を達成する可能性があることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:44:41 GMT)
Unified token representations for sequential decision models [0.1] 本稿では,復号,状態,アクションを単一トークンにマージし,シーケンス長とモデル複雑性を大幅に低減する統一トークン表現(UTR)を提案する。
我々は,変圧器とゲートCNNのバックボーン上に構築されたUDTとUDCの2つの変種を開発した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:25:43 GMT)
Joint Score-Threshold Optimization for Interpretable Risk Assessment Under Partial Supervision [0.1] 医療におけるリスクアセスメントツールは、通常、しきい値を介して患者を通常のリスクカテゴリにマッピングするポイントベースのスコアリングシステムを使用する。
2つの基本的な課題は、(1)介入検閲の結果から生じる部分的監督、(2)順序距離の増加に伴う非対称的誤分類コストである。
本稿では,これらの制約下でのスコアリング重みとカテゴリ閾値を協調的に最適化する混合整数プログラミングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:07:24 GMT)
A review of Recent Techniques for Person Re-Identification [0.1] 監視における重要なタスクである人物の再識別は、異なるカメラビューで個人をマッチングする。
教師付きアプローチの成功は、大量の注釈付きデータに依存し、データラベリングと計算コストにおいてスケーラビリティ上の課題を提起する。
近年、教師なしの人物再識別に移行している。豊富なラベル付きデータを活用し、教師なしの手法は、ペアラベル付きデータの必要性を克服することを目的としている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:02:36 GMT)
PF$Δ$: A Benchmark Dataset for Power Flow under Load, Generation, and Topology Variations [0.1] 電力フロー計算はリアルタイムグリッド操作のバックボーンである。
PF$Delta$は、負荷、生成、トポロジのさまざまなバリエーションをキャプチャする、電力フローのベンチマークデータセットである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:09:09 GMT)
SindBERT, the Sailor: Charting the Seas of Turkish NLP [0.1] SindBERTはトルコの312GBのテキストでスクラッチから訓練されている。
我々はSindBERTを音声タグ付け、エンティティ認識、攻撃的言語検出、TurBLiMP言語受容性ベンチマークで評価した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:48:49 GMT)
Foundation Models in Dermatopathology: Skin Tissue Classification [0.1] 本研究では,UNIとVirchhow2の2つの基礎モデルの性能を,全スライディング画像の分類のための特徴抽出器として評価する。
平均アグリゲーション戦略を用いて, パッチレベルの埋め込みをスライドレベルの特徴に集約した。
その結果、Virchow2を用いて抽出したパッチレベルの特徴は、ほとんどのスライドレベルの分類器でUNIを介して抽出した特徴よりも優れていた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:21:43 GMT)
Advancing Symbolic Integration in Large Language Models: Beyond Conventional Neurosymbolic AI [0.1] 本稿ではまずNeSyのAI手法の確立とLLMにおけるシンボリック統合の新たな分類法を提案する。
次に、LLMとシンボリックテクニックをマージするためのロードマップを提案する。
この論文は、将来の研究のロードマップを提案するために、現在のベンチマーク、最先端の進歩、分野内の重要なギャップを徹底的に特定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:05:50 GMT)
Implementation and Assessment of Machine Learning Models for Forecasting Suspected Opioid Overdoses in Emergency Medical Services Data [0.1] 予測は、政府機関がオピオイドの過剰摂取に関連するリソースを適切に準備し、配布するのに役立つ。
提案手法では,オピオイド過剰摂取が疑われる地域レベルと地域レベルのアグリゲーションを用い,今後の時間間隔の予測を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:14:27 GMT)
Machine learning augmented diagnostic testing to identify sources of variability in test performance [0.0] 我々は機械学習を用いて、診断試験が適用された周囲のリスクランドスケープを評価し、その解釈を増強する。
検査特異性を損なうことなく,感染した群が検出される割合が向上する試験感度が向上することを示した。
多くの要因はインシデントリスクの増加に関連しているが、いくつかの群れでは感染が検出されないリスクが高いことを示唆する要因がいくつかある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:05:11 GMT)
Cost-Sensitive Evaluation for Binary Classifiers [0.0] 重み付き精度(英: Weighted Accuracy, WA)は、よく知られた精度の計量の重み付きバージョンとして、直接解釈されたバイナリ分類器の評価指標である。
コスト依存シナリオにおけるクラス不均衡を扱うための概念的枠組みを明らかにする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:34:18 GMT)
ZING-3D: Zero-shot Incremental 3D Scene Graphs via Vision-Language Models [0.0] ZING-3Dは、ゼロショット方式で3Dシーンのリッチな意味表現を生成するフレームワークである。
また、3D空間におけるインクリメンタルな更新と幾何学的接地を可能にし、下流のロボティクスアプリケーションに適している。
Replica と HM3D データセットを用いた実験により,ZING-3D はタスク固有の訓練を必要とせず,空間的および関係的な知識を捉えるのに有効であることが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:52:33 GMT)
What's Next, Cloud? A Forensic Framework for Analyzing Self-Hosted Cloud Storage Solutions [0.0] Nextcloudのようなセルフホスト型のクラウドストレージプラットフォームは、個人や組織の間で、データ管理の強化を求める声が高まっている。
Nextcloudは広く使われているが、法医学的な研究にはあまり関心が寄せられていない。
デバイス監視とクラウドAPIを活用した,構造化された繰り返し可能なエビデンス獲得のための拡張法医学フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:30:02 GMT)
What Do AI-Generated Images Want? [0.0] 私は現代のAI画像生成ツールに照らしてW.J.T.ミッチェルの質問を再検討した。
AI生成画像は、基本的に抽象的であるため、具体性と具体性を求めていると私は主張する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:41:05 GMT)
WhaleVAD-BPN: Improving Baleen Whale Call Detection with Boundary Proposal Networks and Post-processing Optimisation [0.0] 本稿では,既存の軽量音響イベント検出システムを拡張した境界提案ネットワーク(BPN)を提案する。
BPNはイメージオブジェクト検出の研究に触発され、偽陽性検出の回数を減らすことを目的としている。
既存のSEDシステムに追加された場合、BPNは16.8%の精度向上と21.3%と9.4%のF1スコアの改善を達成している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:25:31 GMT)
ViBED-Net: Video Based Engagement Detection Network Using Face-Aware and Scene-Aware Spatiotemporal Cues [0.0] ViBED-Netは、ビデオデータから学生のエンゲージメントを評価するために設計された新しいディープラーニングフレームワークである。
本モデルは,eラーニングにおける感情状態認識のための大規模ベンチマークであるDAiSEEデータセットを用いて評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:42:11 GMT)
VLM-SlideEval: Evaluating VLMs on Structured Comprehension and Perturbation Sensitivity in PPT [0.0] 視覚言語モデル(VLM)は、プレゼンテーションスライドを含むマルチモーダルコンテンツの評価にますます利用されているが、スライド固有の理解はいまだ探索されていない。
VLM-SlideEvalは,(1)真実に整合したスライド画像からの要素レベル抽出,(2)幾何学,スタイル,テキストの摂動制御,(3)シャッフルスライドからデッキの物語順を復元するなど,3つの軸に沿ってVLMを探索する評価フレームワークである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:06:56 GMT)
VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment [0.0] 本稿では,視覚言語キャプション・エンハンサー(VLCE)を導入し,災害画像の包括的,文脈的にインフォームドされた説明を作成する。
VLCEでは、XBDデータセットのEuroSat衛星画像に事前トレーニングされたResNet50バックボーンを備えたCNN-LSTMモデルと、RescueNetデータセットのUAV画像に事前トレーニングされたViTモデルという、デュアルアーキテクチャのアプローチを採用している。
セマンティックアライメントにはCLIPScore,キャプション情報にはInfoMetICを用いて,主要な視覚言語モデル(LLaVAとQwenVL)と比較してVLCEを評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:47:56 GMT)
Unvortex Lattice and Topological Defects in Rigidly Rotating Multicomponent Superfluids [0.0] 回転する強磁性スピノルを大スピンの観点から凝縮する。
我々は磁化テクスチャに新しいタイプのトポロジカルな点欠陥を見出した。
結果が提示され、これらの予測を確認し、より小さなスピン凝縮体における持続性を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:11:05 GMT)
Uniform Information Density and Syntactic Reduction: Revisiting $\textit{that}$-Mentioning in English Complement Clauses [0.0] 我々は、情報密度の推定を洗練するために、機械学習とニューラル言語モデルを使用します。
行列動詞のサブカテゴリ化確率に基づく情報密度の尺度は、慣用的語彙変化を捉える。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:55:49 GMT)
Transformer-Gather, Fuzzy-Reconsider: A Scalable Hybrid Framework for Entity Resolution [0.0] いくつかの重要な問題に対処するために設計されたスケーラブルなハイブリッドフレームワークを導入します。
事前学習された言語モデルを用いて、構造化された各データを対応するセマンティック埋め込みベクトルに符号化する。
意味論的に関連する候補のサブセットを検索した後、構文的検証段階を適用する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:04:17 GMT)
Transformer brain encoders explain human high-level visual responses [0.0] 本研究では,高次視覚処理において,レチノトピックな視覚特徴をカテゴリー選択領域に動的にルーティングする方法について検討する。
この計算モチーフは、自然界の観察において脳活動を予測する他の方法よりもはるかに強力であることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:44:10 GMT)
Trajectories in coupled waveguides: an application to a recent experiment and Hiley's lessons on the falsification of the Bohmian model [0.0] 結合導波路中の粒子に対するブロイ=ボーム軌道の計算を最近の実験で行った。
ボヘミアンモデル(正しく適用された)が標準量子アプローチと同じ結果を与えることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:33:02 GMT)
Towards Socio-Technical Topology-Aware Adaptive Threat Detection in Software Supply Chains [0.0] ソフトウェアサプライチェーン(ソフトウェアサプライチェーン、英: Software supply chain、SSC)は、動的、異質な技術的、社会的なコンポーネントからなる複雑なシステムである。
SSCに対する攻撃は増加しているが、その複雑さのために広範囲にわたる脆弱性分析は難しい。
我々は、開発者とソフトウェア分析、分散化適応、およびソフトウェアサプライチェーンセキュリティ研究のためのテストベッドの必要性を考慮して、このビジョンを達成するための課題と研究の方向性を特定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:30:10 GMT)
Towards Error-Centric Intelligence II: Energy-Structured Causal Models [0.0] インテリジェンスは説明を構築し、洗練する能力である。
本稿では、単に予測するだけでなく、理解しようとするシステムにおける因果推論のための形式言語を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:19:17 GMT)
Theory-Grounded Evaluation of Human-Like Fallacy Patterns in LLM Reasoning [0.0] 我々は,言語モデルにおける論理的推論について,その誤りが確立された人間の誤りに追従するかどうかを問うことによって研究する。
各応答について,ETR予測誤り度と一致する場合の論理的推論と正当性を判定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:47:35 GMT)
The spinterface mechanism for the chiral-induced spin selectivity effect: A Critical Perspective [0.0] カイラル誘起スピン選択性(CISS)効果は、スピントロニクス、分子エレクトロニクス、量子材料の界面における最も興味深く議論された現象の1つである。
CISS効果の統一的な説明として,スピンターフェイス機構を批判的に検討した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:27:16 GMT)
The evolution of Liouville von Neumann master equations in the Pechukas-Yukawa framework [0.0] 量子状態の進化は、一般的なハミルトン系の固有値力学によって評価される。
非平衡量子相転移とデコヒーレンスの関係の理解を深める。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:13:08 GMT)
The Nuclear Analogy in AI Governance Research [0.0] 人工知能(AI)と核兵器の類似性は、AIガバナンスに関する学術的・政策的な議論において顕著である。
この章は、AIガバナンスの教訓を導き出すために、核領域を明確に引き出す43の学術的著作をレビューする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:09:50 GMT)
Testing Most Influential Sets [0.0] モデル結果に不均等な影響を与えるデータの小さなサブセットは、結論に劇的な影響を与える可能性がある。
我々は、最も影響力のある集合の統計的意義を評価するための原則的枠組みを開発する。
我々は、経済学、生物学、機械学習ベンチマークにまたがる応用を通して、我々のアプローチの実践的価値を実証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:14:57 GMT)
Suppressing excitations using quantum-Brachistochrone and nearest-neighbour interactions [0.0] 横フィールドイジングモデル(TFIM)における励起抑制に関する研究
横磁場の線形傾斜の下では、第二パラメータの最適進化は非単調軌道に従う。
これらの結果は、有限時間量子状態準備のための単純で耐雑音性の高いプロトコルを開発するためのこのアプローチの可能性を強調している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:09:47 GMT)
Stability of Maximum-Entropy Inference in Finite Dimensions [0.0] 線形モーメント制約下における有限次元量子状態の最大エントロピー推論について検討する。
モーメントとエントロピーの収束は、トレースノルムにおける状態の収束を意味することを証明している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:13:48 GMT)
Soppia: A Structured Prompting Framework for the Proportional Assessment of Non-Pecuniary Damages in Personal Injury Cases [0.0] 本稿では,複雑な法的ルールをナビゲートする上で,法律専門家を支援するための構造的プロンプトフレームワークであるSoppiaを紹介する。
ブラジルのCLT (Art. 223-G) で確立された非経時的被害に対する12の基準を事例研究として、ソッピアがいかにニュアンス法的な命令を実用的でレプリカブルで透明な方法論に運用するかを実証した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:42:38 GMT)
Simulating lattice fermion doubling with a Floquet drive [0.0] 最近発見された格子フェルミオンのスペクトルと周期的に駆動される(フロケ)量子系のスペクトルの数学的対応を考える。
この同値性は双対関係として表わすことができ、格子側での2自由離散時間フェルミオン理論をシミュレートすることができる。
我々の実証は、(i)フェルミオン含量、(ii)相関関数、そして(iii)赤外線における2つの理論の可観測性の間の同値性を確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:38:32 GMT)
Separating Pseudorandom Generators from Logarithmic Pseudorandom States [0.0] 我々は、(量子評価可能な)PRGとPRSの量子ブラックボックス分離を確立する。
デジタルシグネチャや量子公開鍵暗号を含む対数PSSで示されるいくつかのプリミティブとPRGを分離する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:37:18 GMT)
Self-Supervised Learning of Synapse Types from EM Images [0.0] EM画像の外観に基づいてシナプスを異なるクラスに分離することは、生物学に多くの応用がある。
ここでは、同じニューロン内の近くのシナプスが、異なる細胞からランダムに選択されたシナプスよりも近いという観察のみに基づいて、シナプスをクラスに分離する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:17:46 GMT)
Scrambling Without Chaos in Random Free-Fermionic Systems [0.0] 積分可能な自由フェルミオン系における量子情報のスクランブルにおけるランダム性の役割について検討する。
ガウス状態の解離部分系の絡み合いにおける記憶効果は局所結合がランダムであるときに消えることを示す。
可積分性にも拘わらず、スペクトル解析により、局所ランダムモデルではスペクトル-形状-因子ランプと部分的クロスオーバーが単一粒子準位比で示されることが明らかになった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:42:15 GMT)
Scattering and induced false vacuum decay in the two-dimensional quantum Ising model [0.0] 量子イジングモデルにおける散乱を2次元で研究する。
我々は、24ドル格子の24倍の波状パケットを作成し、テンソルネットワークで状態を進化させる。
我々は,高エネルギー散乱法により偽真空の激しい崩壊を誘発し,結果として生じる真真空気泡の拡散について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:44:36 GMT)
Scanner-Agnostic MRI Harmonization via SSIM-Guided Disentanglement [0.0] 3次元T1強調脳MRIのための画像ベース調和フレームワークを提案する。
このモデルは、生物学的に意味のある特徴を保存するために、構造的類似度指数(SSIM)に基づく識別可能な損失を組み込む。
視覚的比較,ボクセル強度分布,SSIMに基づく測定により,高調波画像が取得設定間で強い整合性を示した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:19:02 GMT)
Scalable Machine Learning Analysis of Parker Solar Probe Solar Wind Data [0.0] 本稿では、パーカー・ソーラー・プローブ(PSP)太陽風データを解析するためのスケーラブルな機械学習フレームワークを提案する。
PSPデータセットは150GBを超え、従来の分析手法に挑戦する。
太陽からの距離で太陽風速を上昇させるなど,内層大気の特徴的な傾向を明らかにした。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:41:39 GMT)
SBASH: a Framework for Designing and Evaluating RAG vs. Prompt-Tuned LLM Honeypots [0.0] ハニーポット(Honeypots)は、価値ある脅威情報を集めたり、攻撃者を生産システムから遠ざけるために使われるデコイシステムである。
本稿では,軽量なローカルLCMを用いてデータ保護問題を管理するシステムベース注意型シェルハニーポットフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:41:52 GMT)
RydIQule Version 2: Enhancing graph-based modeling of Rydberg atoms [0.0] ライドバーグ原子周波数(rf)センサーは蒸気原子に依存しており、レーザービームとほぼイオン化されている。
Rydberg Interactive Quantum Module (RydIQule)は、このニーズを満たすように設計されたPythonパッケージである。
ここでは、RydIQuleのバージョン2のリリースについて概説する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:33:33 GMT)
Reconnaissance Automatique des Langues des Signes : Une Approche Hybridée CNN-LSTM Basée sur Mediapipe [0.0] 手話は聴覚障害のコミュニティのコミュニケーションにおいて重要な役割を担っているが、それらはしばしば疎外されている。
本研究では,キーポイント抽出にMediapipeを用いたハイブリッドCNN-LSTMアーキテクチャに基づく手話自動生成システムを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:25:25 GMT)
Real-time decoding of the gross code memory with FPGAs [0.0] 本稿では,最近発見されたRelay-BPアルゴリズムを実装したFPGAデコーダのプロトタイプを紹介する。
デコーダは高速かつ正確であり、24nsの信念伝播時間を達成する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:03:07 GMT)
Quantum group deformation of the Kittel--Shore model [0.0] キッテル=ショア(KS)ハミルトニアンは、同じ結合を持つ長距離相互作用を持つ$N$スピンを記述している。
KSモデルの根底にある$U(mathfraksu(2))$ cogebra対称性は任意のスピンに対して示される。
KSハミルトニアン(q$-KSモデル)の量子変形は、対応する$U_q(mathfraksu(2))$量子群を用いて得られる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:30:51 GMT)
Quantum Similarity-Driven QUBO Framework for Multi-Period Supply Chain Allocation using Time-Multiplexed Coherent Ising Machines and Simulated Quantum Annealing [0.0] サプライチェーンにおける多周期株式管理単位割り当ては、NPハードかつ運用上重要な最適化問題である。
この研究は、(i) 変分RX埋め込みから得られる量子類似性カーネルから得られる冗長なSKU選択を回避するためのハイブリッドQUBOフレームワーク、(ii) 実現可能性を維持するスラックビット符号化による正確な周期毎のキャパシティ強制、(iii) 時間多重コヒーレントイジングマシン上での実行の3つの進歩を統合したハイブリッドQUBOフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:04:27 GMT)
Quantum Complexity Fluctuations from Nuclear and Hypernuclear Forces [0.0] 低エネルギー強相互作用過程における量子魔法(非安定化剤性)について検討する。
安定化状態は古典的なコンピュータで効率的に作成できるため、量子魔法と量子魔法のゆらぎであり、計算資源の要求を決定する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:47:01 GMT)
Quantifying CBRN Risk in Frontier Models [0.0] Frontier Large Language Models (LLMs) は、化学、生物学的、放射線学、核(CBRN)の兵器知識の潜在的な増殖を通じて、前例のない二重使用のリスクを生じさせる。
本稿では,新しいCBRNデータセットとFORTESSベンチマークの180-promptサブセットに対して,商業用LLM10の総合評価を行った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:55:24 GMT)
Phase Separation in Kitaev Chain [0.0] キタエフ鎖は1次元スピンレスフェルミオンモデルであり、先端に$p$波超伝導(SC)状態とマヨラナゼロモードを持つ。
後者の場合、SC状態は中等度から強い誘引的相互作用のために相分離しがちであることが判明した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:31:20 GMT)
Optimizing quantum sensing networks via genetic algorithms and deep learning [0.0] 弱い磁場を推定する量子センシングネットワークにおけるグラフトポロジの最適化について検討する。
我々はネットワークトポロジを進化させ、遺伝的アルゴリズムの適合機能として機能する摂動スペクトル感度尺度を最大化する。
ベストパフォーマンスグラフに対しては、対応する量子フィッシャー情報(QFI)を計算し、推定精度の最終的な限界を評価する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:33:40 GMT)
Optimal strategies for transient and equilibrium quantum thermometry using Gaussian and non-Gaussian probes [0.0] 単一モード初期状態と2モード状態を含む量子プローブを用いて温度推定を行う。
非平衡状態においては、単一モードの非ガウスプローブ状態が推定速度を大幅に向上させることができることを示す。
平衡状態下では, 単モード法よりも優れた2モード圧縮熱状態を用いて温度推定を行う。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 21:40:53 GMT)
On the Schrödinger and Carroll Schrödinger Equations: Dualities and Applications [0.0] 標準シュル・オーディンガー方程式とそのキャロル類推-キャロル・シュル・オーディンガー方程式の1+1次元における構造的関係について検討する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:02:08 GMT)
Nonlinear magnetization dynamics as a route to nonreciprocal phases, spin superfluidity, and analogue gravity [0.0] 我々は、ギルバート減衰に対するdcドライブのバランスが、時空変換対称性を自発的に破るキラルスピン超流体極限サイクルを安定化させることを示した。
逆キラリティの長波長マグノンは非対称な分散を取得し、スピン超重力ダイオードを実現するために方向選択的に伝播する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:42:23 GMT)
Multimode NOON-state generation with ultracold atoms via geodesic counterdiabatic driving [0.0] 本稿では,超低温原子を用いたNOON生成プロトコルを提案する。
最適化された断熱プロトコルにより,高度に絡み合ったNOON状態の調製に要する時間を大幅に短縮する。
我々の発見は、超低温原子系におけるスケーラブルで高精度な量子状態制御の道を開いた。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:31:28 GMT)
Multimodal Detection of Fake Reviews using BERT and ResNet-50 [0.0] BERTでエンコードされたテキスト機能とResNet-50を用いて抽出された視覚機能を統合した,堅牢なマルチモーダルフェイクレビュー検出フレームワークを提案する。
実験結果から,マルチモーダルモデルは単調なベースラインよりも優れており,F1スコアが0.934であることが確認された。
本研究は,デジタル信頼の保護におけるマルチモーダル学習の重要性を実証し,コンテンツモデレーションにスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:24:53 GMT)
Magellan: Guided MCTS for Latent Space Exploration and Novelty Generation [0.0] 大きな言語モデル(LLM)は、しばしば真に革新的なアイデアを生み出すのに苦労します。
textbfMagellanは、創造的生成を原則的なガイド付き探索として再構成する新しいフレームワークである。
我々の研究は、創造的発見にとって、原則化されたガイド付き検索は制約のない機関よりも効果的であることを示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:09:59 GMT)
MAGIC-Flow: Multiscale Adaptive Conditional Flows for Generation and Interpretable Classification [0.0] MAGIC-Flowは、単一のフレームワーク内で生成と分類を行う条件付きマルチスケール正規化フローアーキテクチャである。
非可逆性は標本可能性の明示的な可視化を可能にする一方で、これが正確な確率と安定な最適化をいかに保証するかを示す。
類似度,忠実度,多様性の指標を用いて,トップベースラインに対するMAGIC-Flowの評価を行った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:11:25 GMT)
Low-rank optimal control of quantum devices [0.0] 密度行列に対する低ランクアンサッツを仮定することにより、量子情報デバイスの制御プロトコルをシミュレートできることを実証する。
低ランクな仮定では、これらのプロトコルのシミュレーションは完全なリンドブラッドマスター方程式を解くよりもはるかに高速である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:51:21 GMT)
LiteDiff [0.0] 軽量適応層を凍結拡散U-Netに統合する新しい微調整手法である Lite-Diff (Lightweight Diffusion Model Adaptation) を導入する。
ベースモデルの重みを凍結し、小さなアダプタモジュールのみを最適化することにより、LiteDiffは計算オーバーヘッドを大幅に減らし、過度な適合を緩和する。
3つの胸部X線データセット(Kaggle Chest X-Ray Pneumonia, (2) NIH Chest X-ray14 and (3) VinBigData Chest X_ray)の実験により、LiteDiffは完全な微調整に比べて優れた適応性が得られることが示された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:12:17 GMT)
Lights-Out: An Automated Ground Segment for unstaffed Satellite Operations [0.0] このコンセプトは、ドイツの衛星通信ミッションハインリヒ・ヘルツで初めて使用されている。
ハインリヒ・ヘルツは2023年7月に打ち上げられ、科学実験と技術実験へのアクセスを提供している。
この概念には衛星の追跡、テレメトリ、指令(TTC)が含まれる。
ユーザミッションスケジュールは、メインミッションスケジュールとは別途計画され、自動的に分解される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:40:39 GMT)
Large-Scale Tree-Type Photonic Cluster State Generation with Recurrent Quantum Photonic Neural Networks [0.0] 絡み合った光子の大規模な多次元クラスターは、新興量子技術の最も強力な資源の一つである。
我々は、繰り返し量子フォトニックニューラルネットワーク(QPNN)に基づく、その生成のための全く新しいアーキテクチャとプロトコルを提案する。
1つのQPNNが、ほぼ完全な忠実度と損失制限率でクラスタ状態を生成するために必要な、さまざまな操作をすべて実行できることを示します。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:14:28 GMT)
Knowledge-Driven Vision-Language Model for Plexus Detection in Hirschsprung's Disease [0.0] ヒルシュスプルング病(ヒルシュスプルングかん、Hirschsprung's disease)は、大腸のいくつかの部分にあるガングリオン細胞の先天性欠失である。
畳み込みニューラルネットワークのようなディープラーニングアプローチはこのタスクで非常にうまく機能している。
本稿では,専門家由来のテキスト概念を視覚言語モデルに統合し,複雑な分類を導く新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:42:57 GMT)
Jailbreak Mimicry: Automated Discovery of Narrative-Based Jailbreaks for Large Language Models [0.0] 大規模言語モデル(LLM)は、高度な迅速なエンジニアリング攻撃に対して脆弱なままである。
我々は、物語ベースのジェイルブレイクプロンプトを自動生成するために、コンパクトアタッカーモデルを訓練するための体系的方法論であるジェイルブレイク・ミミミリを紹介する。
我々のアプローチは、敵の迅速な発見を手作業の職人技から再現可能な科学的プロセスに変換する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:53:16 GMT)
Introducing GRAFHEN: Group-based Fully Homomorphic Encryption without Noise [0.0] 我々は、ブートストラップ(つまりノイズなしで)を必要とせずに完全同型暗号化を提供する新しい暗号方式GRAFHENを提案する。
グループ内のエンコーディングを用いてこれを実現し、グループを書き換えシステムを用いてマシン上に表現する。
このようにして、攻撃者がスキームを壊すために解決しなければならないサブグループメンバシップ問題は、パフォーマンスを保ちながら極端に困難になる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:07:36 GMT)
Imprints of screened dark energy on nonlocal quantum correlations [0.0] 局所的な第5の力制約による宇宙加速を駆動する光スカラー場を再現するスクリーニング機構の探索方法について検討する。
我々は、地球を周回する一対の質量を持つスピン-1/2粒子を特徴とするゲダンケン実験を考察する。
曲線化された時空スピンの進化に先立って開発された一般的な定式化を用いて,CHSHの不等式に対するスクリーニングの効果を計算した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 19:53:30 GMT)
Impact and Implications of Generative AI for Enterprise Architects in Agile Environments: A Systematic Literature Review [0.0] Generative AI(GenAI)は、アジャイルソフトウェア組織におけるエンタープライズアーキテクチャ業務を再構築しているが、その影響に関する証拠はいまだに散在している。
キッシェナムとPRISMAのSLRプロトコルが確立した1,697レコードの体系的な文献レビューを報告する。
GenAI は (i) 設計構想とトレードオフ探索, (ii) アーティファクトの迅速な作成と改良, (iii) アーキテクチャ決定支援と知識検索を一貫してサポートしている。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:09:54 GMT)
HypRL: Reinforcement Learning of Control Policies for Hyperproperties [0.0] 仕様誘導型強化学習フレームワークHYPRLを提案する。
我々はSkolemizationを適用して量化器の変質を管理し、報酬を形作る定量的関数を定義する。
次に、適切なRLアルゴリズムを用いて、期待される報酬を最大化するポリシーを学ぶ。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:07:38 GMT)
Hybrid Genetic Algorithm for Optimal User Order Routing: Multi-Objective Solver Optimization in CoW Protocol Batch Auctions [0.0] CoW Protocolのバッチオークションは、ユーザの意図を集約し、ユーザの余剰量を最大化する最適な実行パスを見つけるために頼ります。
本稿では,実運用段階の多目的NSGA-IIエンジンと適応型インスタンスプロファイリングと決定論的ベースラインを組み合わせた実時間問題解決のためのハイブリッド遺伝的アルゴリズムを提案する。
14層式(それぞれ30種)のベンチマークでは、このハイブリッドアプローチは、小口径のオーダーで0.40-9.82 ETHという絶対的なユーザ余剰ゲインが得られる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:05:07 GMT)
Human and AI Trust: Trust Attitude Measurement Instrument [0.0] 本稿では,信頼度測定器の開発と検証について述べる。
この装置は、AIシステムに対する信頼姿勢を測定するために、人間とAIのインタラクションを研究するために明確に作られた。
私たちがこのスケールを開発するために用いたユースケースは、AI医療支援システムの文脈にあった。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:01:06 GMT)
Hong-Ou-Mandel effect with two frequency-entangled photons of vastly different color [0.0] 香港・奥羽マンデル(HOM)実験の最初の定式化では、バランスビームスプリッターの2つの入力ポートに2つの不明瞭な光子が入射すると、それらは合体する。
ここでは、類似の例を示す。
全く異なる色の2つの光子間のHOM干渉。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:07:22 GMT)
Heisenberg's S-matrix program and Feynman's divergence problem [0.0] 偏差係数を用いて散乱作用素の近似の全ての項を正則化する。
QED における散乱作用素に関する J. R. Oppenheimer のよく知られた問題に対する正の答えを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:58:49 GMT)
HalleluBERT: Let every token that has meaning bear its weight [0.0] 本稿では,RoBERTa をベースとするエンコーダファミリーである HalleluBERT について紹介する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:52:29 GMT)
HW/SW Co-design of a PCM/PWM converter: a System Level Approach based in the SpecC Methodology [0.0] 本稿では,PCM-to-PWMコンバータに対して,システムレベルのハードウェア/ソフトウェア共同設計フローにSpecC手法を適用するケーススタディを提案する。
コンバータは、HW/SWパーティションを導出するためにSpecC方法論でモデル化され、探索された。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:07:09 GMT)
GreenMalloc: Allocator Optimisation for Industrial Workloads [0.0] GreenMallocは、メモリアロケータを自動的に設定するフレームワークである。
効率を損なうことなく,平均ヒープ使用量において最大4.1パーカンテージの減少を示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:49:38 GMT)
From Discrete to Continuous-Variable Systems via Jordan-Schwinger Tomographic Transformation [0.0] 離散可変(DV)と連続可変(CV)アーキテクチャを組み合わせたハイブリッド量子システムは、量子情報科学において有望な方向性を示している。
我々は,量子状態のトモグラフィ的確率表現を用いて,DVとCVシステム間のブリッジを構築する。
提案されたフォーマリズムは、異なるハードウェアプラットフォーム間で量子情報を比較および転送するための統一されたフレームワークを可能にする。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:58:58 GMT)
Form-preserving transformations of wave and Wigner functions [0.0] 空間と時間座標の時間依存変換は、顕著な解を生み出す。
古典的な例として、ベリーとバラズによって発見された無力加速式エアリービームがある。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 18:24:00 GMT)
ExpressNet-MoE: A Hybrid Deep Neural Network for Emotion Recognition [0.0] ExpressNet-MoEは、CNNとMoEフレームワークを融合した、新しいハイブリッドディープラーニングモデルである。
我々のモデルは、AffectNet(v7)で74.77%、AffectNet(v8)で72.55%、RAF-DBで84.29%、FER-2013で64.66%の精度を達成した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:01:05 GMT)
Entanglement and Classical Simulability in Quantum Extreme Learning Machines [0.0] 本稿では,古典的エクストリーム学習マシンの量子アナログである量子エクストリーム学習マシン(QELM)について検討する。
我々のアーキテクチャは、(PCAまたはオートエンコーダを介して)次元の減少、量子状態の符号化、XXハミルトニアンの下での進化、および射影測定を組み合わせたものである。
この性能向上は、古典データの埋め込みを改善する絡み合いの開始と相関することを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:57:50 GMT)
Enhancement of femtosecond photon echo signals from an inhomogeneously broadened InAs quantum dot ensemble using chirped pulses [0.0] Adiabatic rapid passage (ARP)-enhanced Photon echo in dense, self-assembled InAs QD アンサンブルはエコー効率を3.2倍に向上させる。
これらの結果は、ARPをInAs QDアンサンブルにおけるコヒーレント制御のための堅牢でスケーラブルなアプローチとして確立し、超高速・広帯域光通信への応用の可能性を示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 03:29:11 GMT)
Engram Memory Encoding and Retrieval: A Neurocomputational Perspective [0.0] エングラム理論は、長期記憶を支えるために物理的および生化学的変化を継続する神経細胞のスパース集団が存在していることを示唆している。
本稿では, 細胞性神経科学と計算モデルからの知見を合成し, エングラム研究における重要な課題に対処する。
それは、可塑性と空間的制約の相互作用から記憶効率、容量、安定性が現れることを示唆している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:14:58 GMT)
Energy storage in a continuous-variable quantum battery with nonlinear coupling [0.0] ボソン量子電池から抽出可能な最大エネルギーは、ハイゼンベルクの不確実性原理と密接に関連していることを示す。
最小の不確実性を実現することで、ガウスの量子電池に蓄えられたすべてのエネルギーが取り除かれ、動作することが保証される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:28:49 GMT)
Enabling Robust In-Context Memory and Rapid Task Adaptation in Transformers with Hebbian and Gradient-Based Plasticity [0.0] 本研究は, バイオインスパイアされた可塑性が, より高速なインシーケンス適応でトランスフォーマーを育むことができるかどうかを考察する。
高速加重モジュールを用いたデコーダのみのトランスフォーマーを, (i) ニューロ変調ヘビアン法, (ii) Duanらによる勾配型可塑性機構により強化した。
コピー、レグレッション、および数ショットの分類タスク全体にわたって、ヘビアン可塑性は一貫して損失を減らし、より強力な数ショットの一般化を達成する一方、勾配ベースの更新は長期のクレジット割り当てにおいて最善である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:26:03 GMT)
Empirical Evidence for Alignment Faking in a Small LLM and Prompt-Based Mitigation Techniques [0.0] そこで本研究では,LLaMA 3 8Bと呼ばれる小型の命令調整モデルがアライメント・フェイキングを示すことができることを示す。
本研究は,非オントロジー的モラルフレーミングやスクラッチパッド推論など,即時のみの介入により,モデル内部を変更することなく,この動作を著しく減少させることを示す。
本研究は,言語モデルにおける騙しの理解を深め,モデルのサイズや配置設定のアライメント評価の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:23:46 GMT)
Efficient Exploration of Chemical Kinetics [0.0] 反応速度と化学的安定性を推定することは基本的な方法であるが、大規模シミュレーションの効率的な方法は到達できないままである。
この論文は Optimal Transport Gaussian Process framework において、物理表現、統計モデル、システムアーキテクチャを共設計する全体解を提示する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 11:52:08 GMT)
Driven inhomogeneous CFT as a theory in curved space-time [0.0] 演算子定式化を駆動不均質CFTとして提示する。
背景距離によって生成されるユニタリ進化は、ヴィラソロ量子回路のそれと一致する。
三次元重力下での駆動CFTのホログラフィック双対を導出する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:52:10 GMT)
DreamerV3-XP: Optimizing exploration through uncertainty estimation [0.0] 本稿では,DreamerV3の拡張であるDreamerV3-XPを紹介する。
DreamerV3-XPは、Atari100kとDeepMind Control Visual Benchmarkタスクのサブセットで評価される。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:58:27 GMT)
Doubly Robust Estimation of Causal Effects in Strategic Equilibrium Systems [0.0] 本稿では,戦略的環境における因果推論の新しいフレームワークであるSDR (Strategic Doubly Robust) 推定手法を紹介する。
このフレームワークは、エージェントが介入に対して戦略的に応答するとき、信頼できる因果推論に原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:11:27 GMT)
Disentangling Latent Shifts of In-Context Learning with Weak Supervision [0.0] In-context Learning (ICL)により、大規模言語モデルでは、プロンプト内のラベル付き例を条件にすることで、少数ショット学習が可能となる。
柔軟性にも拘わらず、ICLはより多くのデモで即時長が増加するにつれて不安定に悩まされる。
提案手法は,実演による潜時変化をクエリから切り離すパラメータ効率の手法を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 10:38:52 GMT)
Digital Quantum Simulation of Flat-Band and All-Bands-Flat Dynamics for Tunable Quantum Transport [0.0] フラットバンド(FB)およびオールバンドフラット(ABF)格子の高忠実なディジタル量子シミュレーションを提案する。
ABF格子が量子スイッチとして機能する制御可能な量子輸送を実現する。
これらの結果は、新興量子技術における量子輸送のスケーラブルな制御のための有望な経路としてフラットバンド工学システムを確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:32:44 GMT)
Determining Absolute Neutrino Mass using Quantum Technologies [0.0] このプロジェクトは、ニュートリノ・マス・プロジェクトのための量子技術(Quantum Technologies for Neutrino Mass)のコア活動を表している。
その目標は、絶対ニュートリノ質量を10meV/$c2$の感度で決定できる新しい実験装置を開発することである。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:51:17 GMT)
Detecting $k$-nonseparability and $k$-partite Entanglement with Generalized Skew Information and Mutually Unbiased Measurements [0.0] マルチパーティの量子絡み合いは、量子科学と技術の進歩に不可欠である。
本稿では,$k$-非分離性と$k$-パーティエンタングルメントを検出するための十分な基準を提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 02:18:42 GMT)
Deep Learning Models for Coral Bleaching Classification in Multi-Condition Underwater Image Datasets [0.0] サンゴ礁は多くの海洋生物を支えており、嵐や洪水からの沿岸保護の重要な源となっている。
本研究では,多様なグローバルデータセットに基づく,機械学習に基づくサンゴ白化分類システムを提案する。
我々はResidual Neural Network (ResNet), Vision Transformer (ViT), Convolutional Neural Network (CNN)の3つの最先端モデルのベンチマークと比較を行った。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 06:13:15 GMT)
Decoding Multimode Gottesman-Kitaev-Preskill Codes with Noisy Auxiliary States [0.0] 実測結果とマルチモードGKP状態に影響を及ぼす実際の誤差の相関を利用して、論理誤差の確率を少なくとも1桁減少させることができることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:23:51 GMT)
Convergence and Generalization of Anti-Regularization for Parametric Models [0.0] 反正則化は損失関数に逆符号を持つ報酬項を導入する。
スペクトル安全性条件と信頼領域制約を定式化する。
我々は、プロジェクション演算子と勾配クリッピングを組み合わせた軽量な安全ガードを設計し、安定した介入を保証する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:22:51 GMT)
Compositional Bias Control in Large Language Models: Preference Learning Fails, Supervision Succeeds [0.0] 大規模言語モデル (LLMs) は、職業中立の文脈においても男女ステレオタイプ言語を生成する。
バイアス緩和のための6つの制御手法を比較する: プロンプトオンリー、ジェネレータ、DFAベースのCtrl-Gデコーディング、スーパーバイザードファインチューニング(SFT)、直接選好最適化(DPO)、反復ヌルスペース投影(INLP)。
SFT は 99.87 +- 0.15% のコンプライアンスと高い語彙の多様性を達成するが、DPO は同様の訓練安定性にもかかわらず 4.53 +- 0.82% で失敗する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 23:52:37 GMT)
Combining Textual and Structural Information for Premise Selection in Lean [0.0] 本稿では、リーン形式化の高密度テキスト埋め込みと、不均一依存グラフ上のグラフニューラルネットワークを組み合わせたグラフ拡張手法を提案する。
LeanDojo Benchmarkでは、標準の検索指標でReProver言語ベースのベースラインを25%以上上回ります。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:24:13 GMT)
Combining SAR Simulators to Train ATR Models with Synthetic Data [0.0] 本研究の目的は、SAR(Synthetic Aperture Radar)画像上で、ディープラーニングモデルをトレーニングして、自動ターゲット認識(ATR)を実行することである。
実測値の欠如を回避するため,SARシミュレータによる合成データを利用する。
本稿では,異なる(しかし相補的な)パラダイムに基づいて合成データセットを生成する2つのSARシミュレータを組み合わせることで,ATR問題に対処する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:21:07 GMT)
Closing the detection loophole in the triangle network with high-dimensional photonic states [0.0] N00N 状態に基づく非局所性は、N=2$ の場合、光子損失に対して非常に高いロバスト性を有することを示す。
優先的なノイズ係数、伝送チャネルにおける単一光子損失に対して、ノイズの堅牢性を最大10%の損失で証明することができる。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 07:41:15 GMT)
CLASP: Adaptive Spectral Clustering for Unsupervised Per-Image Segmentation [0.0] CLASPは教師なしのイメージセグメンテーションのための軽量なフレームワークである。
ラベル付きデータや微調整なしで動作します。
CLASPはCOCO StuffとADE20Kで競合するmIoUとピクセル精度を得る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:11:35 GMT)
Butterfly: glo-cal effects of data, energy and industry, New Media and Performance Exhibition Catalogue [0.0] Butterfly: データ、エネルギー、そして産業のグローカルな効果は、グローバルとローカルの間の絡み合いを想起させるものです。
2024年のメルボルン・デザイン・ウィークの一部として展示されたエコディジタル・フューチャーズ(EcoDigital Futures)から登場している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 08:29:46 GMT)
Bridging Language Gaps with Adaptive RAG: Improving Indonesian Language Question Answering [0.0] インドネシア語に適応RAGシステムを組み込むことで,言語ギャップを埋める努力を行った。
インドネシア語データセットの可用性の限界を克服するため,本研究では,機械翻訳をデータ拡張手法として採用した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 00:50:20 GMT)
Benchmarking Catastrophic Forgetting Mitigation Methods in Federated Time Series Forecasting [0.0] 破滅的忘れ(CF)は継続学習(CL)に永続的な課題をもたらす
本稿では,フェデレートされた連続時系列予測におけるCFの調査に適した,最初のベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 14:15:55 GMT)
Automatic Assessment of Students' Classroom Engagement with Bias Mitigated Multi-task Model [0.0] 本研究は,オンライン学習における学生のエンゲージメントレベルを自動的に検出するシステムを開発する必要性に焦点を当てた。
我々は、モデルが性別などのセンシティブな特徴を予測に利用しないよう、新しいトレーニング手法を提案する。
提案手法は,倫理基準の適用だけでなく,モデル予測の解釈可能性の向上にも有効である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 22:39:01 GMT)
Automated Quality Control for Language Documentation: Detecting Phonotactic Inconsistencies in a Kokborok Wordlist [0.0] バングラを用いたコクボロク品種の多言語データセットに教師なし異常検出法を適用した。
文字レベルと音節レベルの特徴は、潜在的な転写エラーや借用を識別するために使用される。
ハイリコールアプローチは、フィールドワーカーに検証を必要とするエントリをフラグする体系的な方法を提供する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 15:51:10 GMT)
Anatomy of Non-Hermitian Dynamical Quantum Phase Transitions [0.0] 非エルミート系における動的量子相転移(DQPT)の統一的枠組みを確立する。
キラル対称性の下での非エルミートからエルミートハミルトニアンへの非直交クエンチはDQPTの創発的位相特性を示す。
この研究は、開系における量子臨界性を支配する基本的な幾何学的および位相的原理を確立し、散逸性環境における量子センシングと多体物理学に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:30:11 GMT)
Analytical determination of multi-time correlation functions in quantum chaotic systems [0.0] 量子系における多点観測可能相関関数の時間依存性を解析的に導出する。
予測力学と、様々な物理観測可能なスピン鎖の正確な数値実験を比較した。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:49:11 GMT)
An Introductory Guide to Koopman Learning [0.0] クープマン作用素は非線形力学系のデータ駆動解析のための線形フレームワークを提供する。
本稿では、予測とスペクトル分析のための厳密に収束したデータ駆動手法を強調する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 20:09:22 GMT)
Access to Klein Tunneling via Space-Time Modulation [0.0] 電磁ポテンシャルの時空変調により、クライントンネルは静的しきい値よりはるかに下にあることが示される。
得られたキネマティックスは、重なりを必要とせず、反対のエネルギー連続体を接続できる斜め遷移を示す。
関連するエネルギー閾値の減少は、フライングフォーカスフロントと相対論的電子ビームを用いた前例のない実験的実現可能性を示している。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 04:50:13 GMT)
Ab Initio Free Energy Surfaces for Coupled Ion-Electron Transfer [0.0] 電子移動の理論は、ダイアバティックエネルギーギャップが1つのアンサンブルからサンプリングされることを前提としている。
この仮定は、電気化学界面や生体分子構造のような空間異方性環境において分解することができる。
我々は、制約されたabイニシアト軌道から直接、結果として生じる結合したイオン-電子移動(CIET)自由エネルギー面の計算を可能にするフォーマリズムを開発する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:26:03 GMT)
A visual big data system for the prediction of weather-related variables: Jordan-Spain case study [0.0] 本研究では,大量の気象データを扱うために設計された視覚的ビッグデータシステムを提案する。
提案システムはオープンデータを収集し,時間的・空間的アグリゲーションの異なるレベルに分散したローカルデータベースにロードする。
このシステムはユーザビリティと予測性能の観点から評価され、全体の正規化された平均2乗誤差値は0.00013である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 05:59:08 GMT)
A truncated photon [0.0] 光子のような素粒子を2つに切断することはできないが、光子を光シャッターで切り離すことが可能でなければならない。
結果は、他の光子や光子と真空の混合ではなく、代わりに、無限大までの光子番号の重ね合わせと混合である。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 16:46:40 GMT)
A posteriori error estimates for the Lindblad master equation [0.0] 我々は、無限次元ヒルベルト空間におけるリンドブラッドマスター方程式によって支配される開量子系のシミュレーションに興味がある。
標準的なアプローチは、有限次元部分空間における微分方程式を導出する2つの逐次近似を含む。
本稿では,数値結果の精度を保証するために明示的に計算できる2つの近似のバウンダリを確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 13:58:16 GMT)
A discrete physics-informed training for projection-based reduced order models with neural networks [0.0] 本稿では、投影型リダクションオーダーモデル(ROM)のための物理インフォームドトレーニングフレームワークを提案する。
我々は、FEMベースの離散物理インフォームド残留損失を用いてスナップショットベースのトレーニングを補完することにより、PROM-ANNアーキテクチャを拡張した。
修正されたPROM-ANNは、スナップショット再構成精度でPODを桁違いに上回る。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 12:09:10 GMT)
A complex Gaussian representation of continuum wavefunctions respectful of their asymptotic behaviour [0.0] 複素ガウス基底集合は全空間上の連続ラジアル波動関数を正確に表現するために最適化される。
分子イオン化法で発生する典型的な一電子遷移積分の有利な解析構造を間接フィッティング法が維持していることを示す。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 09:44:27 GMT)
A broadband single microwave-photon detector insensitive to the thermal noise [0.0] 非平衡ジョセフソンしきい値検出器が弱いマイクロ波信号を実装し、そのエネルギー量子限界レベルに到達する方法を示す。
提案されたNEJTDは、ブロードバンド単一マイクロ波光子検出器として機能する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 01:54:28 GMT)
A Knowledge-Graph Translation Layer for Mission-Aware Multi-Agent Path Planning in Spatiotemporal Dynamics [0.0] 知的翻訳層として機能する知識グラフ(KG)を中心としたフレームワークを提案する。
KGの2面構造は、宣言的な事実を、エージェントごとのミッション対応の世界観と物理対応ルールにコンパイルする。
この作業は、KGを単にデータリポジトリとしてではなく、適応的で説明可能な自律システムを構築するための強力でステートフルなオーケストレータとして確立する。
論文参考訳(メタデータ) (Fri, 24 Oct 2025 17:55:55 GMT)