A Definition of AGI [208.3] 人工知能の具体的な定義の欠如は、今日の専門的なAIと人間レベルの認知のギャップを曖昧にしている。
そこで本研究では,AGIを認知的多目的性と熟達度に適合するものとして,これに対応するための定量的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:00:45 GMT)
RMTBench: Benchmarking LLMs Through Multi-Turn User-Centric Role-Playing [133.1] RMTBenchは、80の多様な文字と8000以上の対話ラウンドを特徴とする、総合的なテキストバプサー中心のバイリンガルロールプレイングベンチマークである。
本ベンチマークでは,文字記述よりも明示的なユーザモチベーションに基づく対話を構築し,実用的なユーザアプリケーションとの整合性を確保する。
RMTBenchは、キャラクタバックグラウンドからユーザ意図のフルフィルメントにフォーカスを移すことで、学術的な評価と実践的なデプロイメント要件のギャップを埋める。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:30:25 GMT)
Does Thinking More always Help? Mirage of Test-Time Scaling in Reasoning Models [130.5] Wait"や"Let me rethink"といったプロンプトを使って思考トレースを拡張することで、パフォーマンスが向上します。
テスト時にもっと考えることは、本当により良い推論につながるのでしょうか?
過度に考える”という理由から,新たな思考による初期パフォーマンス改善の一貫したパターンと,それに続く低下を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:17:53 GMT)
Learning Linear Attention in Polynomial Time [127.1] 線形注意を持つ単層変圧器の学習性に関する最初の結果を提供する。
線形アテンションは RKHS で適切に定義された線形予測器とみなすことができる。
我々は,すべての経験的リスクが線形変換器と同等のトレーニングデータセットを効率的に識別する方法を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:29:09 GMT)
GranViT: A Fine-Grained Vision Model With Autoregressive Perception For MLLMs [114.5] GranViTは、微細な特徴抽出と大規模言語モデルへのセマンティックアライメントを統合するビジョントランスフォーマーである。
最初にGran-29Mを構築した。これは200万の自然画像とOCR画像と1億5000万以上の高品質な領域レベルのアノテーションを組み合わせたデータセットである。
我々は,Gran-29Mの微粒化アノテーションを利用して,事前学習とキャプション・ツー・バウンディングボックス回帰における視覚エンコーダの局所的視覚表現を強化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:33:59 GMT)
ShapeX: Shapelet-Driven Post Hoc Explanations for Time Series Classification Models [111.3] 時系列を意味のあるシェープレット駆動セグメントに分割する革新的なフレームワークであるShapeXを紹介する。
ShapeXの中核にはShapelet Describe-and-Detectフレームワークがあり、分類に不可欠なさまざまなシェイプレットを効果的に学習する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:01:40 GMT)
ResearchGPT: Benchmarking and Training LLMs for End-to-End Computer Science Research Workflows [109.3] CS-54k(CS-54k)は、コンピュータ科学におけるQ&Aペアの高品質なコーパスである。
CS-4kは、科学研究を支援するAIの能力を評価するためのベンチマークである。
CS-50kは大規模なトレーニングデータセットである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:07:35 GMT)
FedGPS: Statistical Rectification Against Data Heterogeneity in Federated Learning [103.5] フェデレートラーニング(FL)は、データ不均一(data heterogeneity)として知られる重要な課題に直面し、モデルの性能と収束を損なう。
統計分布と勾配情報をシームレスに統合する新しいフレームワークである textbfFedGPS を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:10:11 GMT)
A Stable Whitening Optimizer for Efficient Neural Network Training [99.8] アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:52:25 GMT)
From Masks to Worlds: A Hitchhiker's Guide to World Models [97.9] これは世界模型の典型的な調査ではなく、世界を築きたい人々のためのガイドである。
「我々は、世界モデルに言及したすべての論文をカタログ化しようとはしない。」
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:46:44 GMT)
HoloCine: Holistic Generation of Cinematic Multi-Shot Long Video Narratives [97.6] HoloCineは、最初のショットから最後のショットまでのグローバルな一貫性を確保するために、全体を生成するモデルです。
本アーキテクチャは,テキストプロンプトを特定のショットにローカライズするウィンドウクロスアテンション機構により,正確なディレクトリ制御を実現する。
我々の研究は、クリップ合成から自動映画化への重要な転換であり、エンド・ツー・エンドの映画制作を目に見える未来にしている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:59 GMT)
Generalizable Reasoning through Compositional Energy Minimization [91.8] 一般化は機械学習、特に推論タスクにおいて重要な課題である。
より小さく、よりトラクタブルなサブプロブレムの解空間上のエネルギーランドスケープを学習することで一般化を推論する新しい手法を提案する。
提案手法は既存の最先端手法よりも優れており,より大規模で複雑な問題に一般化できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:38:36 GMT)
A Renaissance of Explicit Motion Information Mining from Transformers for Action Recognition [87.1] 行動認識は、文脈集約能力のおかげで、トランスフォーマーベースの手法によって支配されている。
本稿では,これらの効果的な動作モデリング特性を,統一的かつ適切な方法で既存の変圧器に統合することを提案する。
提案手法は,既存の最先端手法,特に動きに敏感なデータセットよりも優れている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:35:00 GMT)
COS3D: Collaborative Open-Vocabulary 3D Segmentation [86.4] COS3Dは、新しい協調的なプロンプトセグメンテーションフレームワークである。
まず、インスタンスフィールドと言語フィールドからなる協調フィールドという新しい概念を紹介する。
推論において,2つの分野の異なる特徴をブリッジするために,適応型言語からインスタンスへの即時改善を設計する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:45:15 GMT)
Code-enabled language models can outperform reasoning models on diverse tasks [86.3] 標準命令LMは, 微調整をせずに, 強力な推論器となりうることを示す。
これはCodeAdaptによって実現され、LMは多段階的なコード実行と自然言語推論をインターリーブする。
CodeAdaptは、平均8タスクで、3つのLMが対応するRMを上回ります。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:04:03 GMT)
Real Deep Research for AI, Robotics and Beyond [85.9] 本稿では、AIとロボット工学の分野に適用された総合的なフレームワークであるReal Deep Research(RDR)を紹介する。
本論文ではRDRパイプラインの構成について詳述し、付録では各分析トピックに対して広範な結果を提供している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:05 GMT)
Epistemic-aware Vision-Language Foundation Model for Fetal Ultrasound Interpretation [83.0] 医療用AIシステムFetalMindについて報告する。
本稿では、専門家による2部グラフをモデルに注入し、ビュー・ディスリーズ関連を分離するSED(Salient Epistemic Disentanglement)を提案する。
FetalMindはすべての妊娠期のオープンソースおよびクローズドソースベースラインを上回り、平均利得は+14%、臨界条件では+61.2%高い。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:45:15 GMT)
ControlFusion: A Controllable Image Fusion Framework with Language-Vision Degradation Prompts [82.5] 現在の画像融合法は、現実の撮像シナリオで発生する複合劣化に対処するのに苦労している。
本稿では,制御フュージョンと呼ばれる言語ビジョンプロンプトを用いた制御可能な画像融合フレームワークを提案する。
実験では、制御フュージョンは、融合品質と劣化処理においてSOTA融合法より優れている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:07:21 GMT)
Shoot First, Ask Questions Later? Building Rational Agents that Explore and Act Like People [81.6] 限られたリソースを前提として、言語モデル(LM)に基づいたエージェントは、どの程度合理的に行動するのか?
エージェント情報探索をベンチマークし,強化する手法を開発し,人間の行動から洞察を抽出する。
Spotterエージェントでは、LMのみのベースラインよりも14.7%の精度で精度を向上し、Captainエージェントでは、期待情報ゲイン(EIG)を0.227ビット(達成可能なノイズ天井の94.2%)まで引き上げる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:57:28 GMT)
Towards Scalable Oversight with Collaborative Multi-Agent Debate in Error Detection [81.5] 自己診断は、信頼できる外部からのフィードバックがなければ、複雑なタスクでは信頼できない。
我々は,新たなコラボレーティブMADプロトコルであるColMADを導入し,MADを非ゼロ和ゲームとして再構成する。
ColMADは従来の競合MADよりも19%優れていた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:46:00 GMT)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.4] 大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:33:26 GMT)
AL-CoLe: Augmented Lagrangian for Constrained Learning [79.5] 現代の機械学習のパラメータ化がほとんどないにもかかわらず、ラグランジアン双対性は制約付き学習問題に対処するための一般的なツールとなっている。
制約付き分類タスクにおいて,その有効性を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:46:49 GMT)
LEXam: Benchmarking Legal Reasoning on 340 Law Exams [76.4] textscLEXamは,法科116科の法科試験を対象とする340件の法科試験を対象とする,新しいベンチマークである。
このデータセットは、英語とドイツ語で4,886の法試験質問で構成されており、その中には2,841の長文のオープンエンド質問と2,045の多重選択質問が含まれている。
この結果から,モデル間の差分化におけるデータセットの有効性が示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:18:23 GMT)
Sparse Autoencoder Neural Operators: Model Recovery in Function Spaces [75.5] 本研究では,スパースオートエンコーダ(SAE)を昇降空間や無限次元関数空間に拡張し,大規模ニューラル演算子(NO)の機械的解釈性を実現するフレームワークを提案する。
我々は、SAE、リフト-SAE、SAEニューラル演算子の推論とトレーニングのダイナミクスを比較した。
我々は、リフトと演算子モジュールが有益な帰納バイアスを導入し、より高速なリカバリを可能にし、スムーズな概念のリカバリを改善し、様々な解像度にわたる堅牢な推論を可能にした点を強調した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:32:48 GMT)
AlphaFlow: Understanding and Improving MeanFlow Models [74.6] その結果,MeanFlowの目的は,トラジェクティブフローマッチングとトラジェクトリ一貫性という2つの部分に分けられることがわかった。
これらの知見に触発されて、軌跡フローマッチング、ショートカットモデル、MeanFlowを統一する目的の広いファミリーである$alpha$-Flowを紹介した。
クラス条件のImageNet-1K 256x256をバニラのDiTバックボーンでスクラッチからトレーニングすると、$alpha$-Flowはスケールと設定でMeanFlowを一貫して上回る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:45:06 GMT)
Rank-GRPO: Training LLM-based Conversational Recommender Systems with Reinforcement Learning [74.2] ConvRec-R1は会話レコメンデーションシステムのエンドツーエンドトレーニングのための2段階のフレームワークである。
ステージ1では,Remap-Reflect-Adjustパイプラインを用いた行動閉鎖データセットを構築した。
ステージ2では,グループ相対政策最適化の原則的拡張である Rank-GRPO を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:56:00 GMT)
Revisiting Logit Distributions for Reliable Out-of-Distribution Detection [73.9] アウト・オブ・ディストリビューション(OOD)検出は、オープンワールドアプリケーションにおけるディープラーニングモデルの信頼性を保証するために重要である。
LogitGapは、最大ロジットと残りのロジットの関係を利用する、ポストホックなOOD検出手法である。
我々は、LogitGapが様々なOOD検出シナリオとベンチマークにわたって、最先端のパフォーマンスを一貫して達成していることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:16:45 GMT)
Teaching Language Models to Reason with Tools [73.2] emphHint-Engineeringは、推論経路内の最適点に様々なヒントを戦略的に注入する新しいデータ合成戦略である。
CoRTは効率を大幅に向上させ、32Bモデルのトークン使用量を約30%削減し、1.5Bモデルのトークン使用量を50%削減した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:41:44 GMT)
Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning [73.1] 本稿では、Ring-mini-linear-2.0およびRing-flash-linear-2.0を含むRing-linearモデルシリーズについて述べる。
どちらのモデルも線形アテンションとソフトマックスアテンションを効果的に統合するハイブリッドアーキテクチャを採用している。
32億のパラメータ密度モデルと比較して、このシリーズは推論コストを1/10に削減し、元のRingシリーズと比較すると、コストも50%以上削減される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:33:17 GMT)
Context-level Language Modeling by Learning Predictive Context Embeddings [71.0] textbfContextLMは、固有のtextbfnext-context予測目標で標準事前学習を強化するフレームワークである。
このメカニズムは、将来のトークンチャンクから派生したエラー信号を利用して、マルチトークンコンテキストの予測表現を学ぶようモデルを訓練する。
GPT2およびPythiaモデルファミリーの実験では、1.5ドルBのパラメータまでスケールし、ContextLMがパープレキシティとダウンストリームのタスクパフォーマンスの両方で一貫した改善を提供することを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:09:45 GMT)
Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence [70.3] 我々は、明示的な証拠をビデオ推論に統合する非エージェントフレームワークであるOpen-o3 Videoを紹介した。
このモデルは、キーオブジェクトとバウンディングボックスをその答えとともに強調し、推論を具体的な視覚的な観察で基礎付けることができる。
V-STARベンチマークでは、Open-o3 Videoは最先端のパフォーマンスを達成し、mAMを14.4%、mLタイムスタンプを24.2%向上させた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:05:56 GMT)
Language Ranker: A Lightweight Ranking framework for LLM Decoding [70.0] 本稿では,レコメンデーションパイプラインのランク付け段階に類似した復号過程を概念化する。
この知見に触発されて、我々はLanguage Rankerを提案する。
実験の結果、Language Rankerは大規模報酬モデルに匹敵するパフォーマンスを達成する一方で、0.5Mの追加パラメータしか必要としないことがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:56:46 GMT)
Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful [69.6] この作業は、バッチサイズ1まで、小さなバッチサイズを見直します。
小さいバッチサイズは安定してトレーニングし、より大きなバッチサイズよりもFLOP当たりのパフォーマンスが等しく、あるいは良好であることが分かりました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:05:24 GMT)
AutoScape: Geometry-Consistent Long-Horizon Scene Generation [69.2] AutoScapeは長距離走行シーン生成フレームワークである。
20秒以上のリアルで幾何学的に一貫したドライビングビデオを生成する。
ロングホライゾンのFIDとFVDのスコアは、それぞれ48.6%、FVDは43.0%向上している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:44:34 GMT)
LeCoDe: A Benchmark Dataset for Interactive Legal Consultation Dialogue Evaluation [68.3] 法的協議は、個人の権利を保護し、司法へのアクセスを確保するために不可欠である。
現在のシステムは、現実世界のコンサルティングの対話的かつ知識集約的な性質を扱うのに不足している。
LeCoDeは3,696件の法的相談対話と110,008件の対話を含む実世界のマルチターンベンチマークデータセットである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:01:15 GMT)
What Defines Good Reasoning in LLMs? Dissecting Reasoning Steps with Multi-Aspect Evaluation [67.5] 我々は推論品質を関連性と一貫性の2つの次元に分解する。
これらの側面を確実に測定するために、因果的段階評価(CaSE)を導入する。
トレーニングデータをCaSEで評価した妥当性とコヒーレンスでキュレートすることで、最終タスクのパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:30:37 GMT)
Why Did Apple Fall To The Ground: Evaluating Curiosity In Large Language Model [67.4] 大規模言語モデル(LLM)が示す好奇心の程度を評価するための包括的評価フレームワークを設計する。
その結果、LLMは人間よりも知識の渇きが強いが、不確実な環境に直面すると保守的な選択をしがちであることがわかった。
これらの結果から,LLMはヒトと同様の好奇心を示す可能性が示唆され,今後の学習能力の発達に対する実験的支援が期待できる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:05:17 GMT)
MultiHuman-Testbench: Benchmarking Image Generation for Multiple Humans [66.8] マルチヒューマンテストベンチ(MultiHuman-Testbench)は、マルチヒューマン生成のための生成モデルを厳格に評価するための新しいベンチマークである。
ベンチマークには1,800のサンプルが含まれている。
顔数,ID類似度,迅速なアライメント,行動検出を定量化するために,4つの重要な指標を用いた多面評価スイートを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:16:02 GMT)
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model? [66.6] RLVR(Reinforcement Learning with Verifiable Rewards)は近年,大規模言語モデル(LLM)の推論性能の向上に成功している。
本研究はRLVRの現状を批判的に考察する。
現在のトレーニング設定では、根本的な新しい推論パターンが生まれていないことが分かりました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:11:15 GMT)
DMC$^3$: Dual-Modal Counterfactual Contrastive Construction for Egocentric Video Question Answering [66.5] エゴセントリックビデオ質問回答(エゴセントリックビデオQA)は、エゴセントリックビデオ理解において重要な役割を果たす。
本稿では,エゴセントリックなビデオカベースライン,反ファクトなサンプル構築モジュール,反ファクトなサンプル関連コントラスト最適化を含むデュアルモーダルなコントラスト構築フレームワークを提案する。
本手法は,EgoTaskQAのテキスト正規分とテキスト間接分を52.51%,46.04%,QAEGO4Dを13.2%とする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:15:18 GMT)
xTime: Extreme Event Prediction with Hierarchical Knowledge Distillation and Expert Fusion [65.6] 時系列における極端なイベント予測のための新しいフレームワークであるxTimeを提案する。
xTimeは知識蒸留を利用して、低レベルなイベントでトレーニングされたモデルから情報を転送する。
我々は、異なる希少度で専門家モデルから出力を動的に選択し、融合する専門家(MoE)機構の混合を導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:24:45 GMT)
PartNeXt: A Next-Generation Dataset for Fine-Grained and Hierarchical 3D Part Understanding [65.6] PartNeXtは、23,000以上の高品質なテクスチャ付き3Dモデルを持つ次世代データセットで、50のカテゴリにわたるきめ細かな階層的なパーツラベルがアノテートされている。
そこで我々は,(1)クラス非依存な部分分割,最先端の手法が細粒度や葉のレベルに苦しむ部分分割,(2)3D部分中心の質問応答,(3)オープン語彙の部分接地における大きなギャップを明らかにする3D-LLMsの新しいベンチマークの2つのタスクについて,PartNeXtをベンチマークした。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:06:08 GMT)
Fast Inference via Hierarchical Speculative Decoding [65.4] 階層的投機的復号法(HSD)は,各モデルがトークンを提案し,次に大きなモデルが1つのフォワードパスで検証する階層構造に,ドラフトモデルを積み重ねるアルゴリズムである。
HSDは最高の単軸ベースラインよりも1.2倍のスピードアップを達成している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:15:48 GMT)
Continuous Diffusion Model for Language Modeling [64.7] 離散的データに対する既存の連続拡散モデルは離散的手法と比較して性能が劣る。
本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
本手法は,既存の離散拡散モデルより優れ,自己回帰モデルの性能にアプローチする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:36:36 GMT)
CreativityPrism: A Holistic Benchmark for Large Language Model Creativity [64.2] 創造性はしばしば人間の知能の目印と見なされる。
さまざまなシナリオにまたがってクリエイティビティを評価するための総合的なフレームワークはまだ存在しません。
本稿では,創造性を質,新規性,多様性の3次元に分解する評価分析フレームワークであるCreativePrismを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:22:10 GMT)
EditInfinity: Image Editing with Binary-Quantized Generative Models [64.1] 画像編集のためのVQに基づく生成モデルのパラメータ効率適応について検討する。
テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
PIE-Benchベンチマークの実験は、最先端拡散ベースラインと比較して、モデルの性能が優れていることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:06:24 GMT)
Reliable and Reproducible Demographic Inference for Fairness in Face Analysis [63.5] 本稿では、従来のエンドツーエンドトレーニングをモジュラートランスファー学習アプローチで置き換える、完全に再現可能なDAIパイプラインを提案する。
このパイプラインは、正確性、公正性、そしてアイデンティティ内整合性によって定義される、新たに導入された堅牢性の概念の3つの次元にわたって監査する。
以上の結果から,提案手法は特に民族性において,強い基準線を上回り,その特性はより困難であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:22:02 GMT)
GMFVAD: Using Grained Multi-modal Feature to Improve Video Anomaly Detection [63.2] 我々は、ビデオ異常検出のためのグラインドマルチモーダル特徴(GMFVAD)を提案する。
主要なコンテンツを要約したビデオスニペットに基づいて、よりきめ細かいマルチモーダル機能を生成する。
実験により、GMFVADは主に4つのデータセットで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:52:53 GMT)
KCM: KAN-Based Collaboration Models Enhance Pretrained Large Models [62.7] 大規模モデルコラボレーションにおける改良手法として,Kan-based Collaborative Model (KCM)を提案する。
Kanは、破滅的な忘れを緩和しながら、優れた視認性と解釈性を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:06:21 GMT)
Graph Neural Regularizers for PDE Inverse Problems [62.5] 本稿では,偏微分方程式(PDE)によって支配される多種多様な不測の逆問題を解くための枠組みを提案する。
有限要素法(FEM)を用いて前方問題の数値解法
我々は、物理に着想を得たグラフニューラルネットワークを学習正規化器として採用し、標準アプローチの頑健で解釈可能な、一般化可能な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:43:25 GMT)
Scaling Embedding Layers in Language Models [61.9] $SCONE$は入力埋め込み層を拡張して言語モデルのパフォーマンスを向上させる新しいメソッドである。
SCONE$は、n-gramの頻繁なセットに埋め込みを導入しながら、元の語彙を保持します。
これらの埋め込みは、各入力トークンに対してコンテキスト化された表現を提供し、トレーニング中に別のモデルで学習する。
$SCONE$は、n-gram埋め込みの数を増やし、それらを学ぶために使用するモデルをスケーリングする、という2つの新しいスケーリング戦略を可能にします。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:15:46 GMT)
GenColorBench: A Color Evaluation Benchmark for Text-to-Image Generation Models [61.8] GenColorBenchは、テキストから画像までのカラー生成のための、最初の総合的なベンチマークである。
I SCC-NBS や CSS3/X11 などのカラーシステムにも採用されている。
400以上の色をカバーする44K色のプロンプトによって、知覚的および自動評価を通じてモデルの真の能力を明らかにする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:12:55 GMT)
Tensor Product Attention Is All You Need [61.3] プロダクトアテンション(TPA)は、テンソル分解を使用してクエリ、キー、値をコンパクトに表現する新しいアテンションメカニズムである。
TPAは、メモリ効率とともに改善されたモデル品質を実現する。
TPAに基づいて,シーケンスモデリングのための新しいモデルアーキテクチャであるProducT ATTion Transformer (T6)を紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:35:32 GMT)
Continuous Input Embedding Size Search For Recommender Systems [60.9] 連続入力埋め込みサイズ探索(CIESS)は、任意の埋め込みサイズを選択可能な連続探索空間上で動作する新しいRLベースの手法である。
CIESSはモデルに依存しないため、様々な潜在因子RSに一般化できる。
2つの実世界のデータセットに関する実験では、異なるメモリ予算の下でCIESSの最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:52:33 GMT)
Seeing the Arrow of Time in Large Multimodal Models [60.6] 現在の大規模マルチモーダルモデル(LMM)は、言語クエリに応答する際のビデオの時間方向の知覚と利用に苦慮している。
本稿では,強化学習(RL)に基づく学習戦略であるArrowRLを紹介する。
厳密な評価のために、時間的課題を探索する新しい多面的ベンチマークであるAoTBenchを開発する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:19:08 GMT)
Towards Self-Evolving Benchmarks: Synthesizing Agent Trajectories via Test-Time Exploration under Validate-by-Reproduce Paradigm [60.4] 本稿では,トラジェクトリをベースとしたエージェント・ベンチマーク・複雑度進化フレームワークを提案する。
このフレームワークは、既存のベンチマークから元のタスクを受け取り、エージェントがそれをより難しい新しいタスクに進化させるよう促す。
GAIAベンチマークの実験では、TRACEフレームワークはタスクの複雑さを継続的に向上し、正確性の信頼性を向上させる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:10:56 GMT)
Blockwise SFT for Diffusion Language Models: Reconciling Bidirectional Attention and Autoregressive Decoding [60.1] 離散拡散言語モデルは、テキスト生成に強い可能性を示している。
半自己回帰推論による微調整ミスアライメントの標準化
我々は、応答を固定サイズブロックに分割するBlockwise SFTを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:36:55 GMT)
Probably Approximately Precision and Recall Learning [60.0] 機械学習における重要な課題は、一方的なフィードバックの頻度である。
本稿では,確率的近似(PAC)フレームワークを導入し,各入力をラベルの集合にマッピングする仮説を定めている。
我々は、正のデータのみから学習する新しいアルゴリズムを開発し、実現可能な場合において最適なサンプル複雑性を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:57:21 GMT)
Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [59.7] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上で低レイテンシかつエネルギー効率の意思決定を提供する。
連続制御のためのほとんどの連続制御アルゴリズムは、人工ニューラルネットワーク(ANN)のために設計されている。
このミスマッチはSNNのトレーニングを不安定にし、性能を劣化させる。
離散SNNと連続制御アルゴリズムのギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:58:39 GMT)
RAPO++: Cross-Stage Prompt Optimization for Text-to-Video Generation via Data Alignment and Test-Time Scaling [59.1] textbfRAPO++は、クロスプラットフォームのプロンプト最適化フレームワークである。
トレーニングデータの整合性向上、テスト時の反復スケーリング、大規模言語モデルの微調整を統一する。
RAPO++は意味的アライメント、構成的推論、時間的安定性、物理的妥当性において大きな進歩を遂げている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:45:09 GMT)
Text2Mem: A Unified Memory Operation Language for Memory Operating System [59.1] モデルエージェントのための統一メモリ操作言語であるText2Memを紹介する。
Text2Memは、自然な正確性を保証するための標準化されたパスを提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:53:03 GMT)
REOrdering Patches Improves Vision Models [58.8] パッチ順序がそのような設定におけるモデル性能に大きく影響していることが示される。
本稿では,タスク最適パッチ順序を見つけるためのフレームワークであるREOrderを提案する。
Re Orderは、ImageNet-1K上の行マジョールの順序を最大3.01%改善し、世界の関数マップを13.35%改善した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:13:00 GMT)
Born a Transformer -- Always a Transformer? On the Effect of Pretraining on Architectural Abilities [58.7] We study a family of $textitretrieval$ and $textitcopying$ tasks inspired by Liu et al。
我々は、事前訓練されたモデルがクエリトークンの左(アンチインダクション)よりも右(インダクション)へのトークンの検索が優れているような、$textitinduction-versus-anti-induction$ asymmetricを観察する。
力学解析により、この非対称性は、事前学習された変圧器内の誘導の強度と反誘導回路の強度の違いに関係していることが明らかになった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:30:36 GMT)
ImpossibleBench: Measuring LLMs' Propensity of Exploiting Test Cases [58.4] タスク完了のための「ショートカット」は、大規模言語モデルの信頼性評価と展開に重大なリスクをもたらす。
我々は,LLMエージェントがテストケースを利用するための正当性を測定するベンチマークフレームワークであるImpossibleBenchを紹介する。
実践的なフレームワークとして、ImpossibleBenchは単なる評価ではなく、汎用的なツールである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:58:32 GMT)
OnlineSplatter: Pose-Free Online 3D Reconstruction for Free-Moving Objects [58.4] OnlineSplatterは、RGBフレームから直接高品質でオブジェクト中心の3Dガウシアンを生成する新しいフレームワークである。
提案手法は,第1フレームを用いて再構成をアンカーし,高密度ガウス原始体を通して対象表現を漸進的に洗練する。
我々のコアコントリビューションは、潜伏した外見幾何学キーと明示的な方向キーを組み合わせたデュアルキーメモリモジュールです。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:37:25 GMT)
Novel Class Discovery for Point Cloud Segmentation via Joint Learning of Causal Representation and Reasoning [58.3] ポイントクラウドのための新しいクラスディスカバリ(3D-NCD)に焦点を当てる
このタスクの鍵は、ポイント表現とベースクラスラベルの正確な相関を設定することである。
本稿では,因果表現と推論の融合学習法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:35:00 GMT)
Compress to Impress: Efficient LLM Adaptation Using a Single Gradient Step on 100 Samples [57.7] LASERの網羅的で、マトリクスごとの探索は、迅速な展開には実用的ではない。
これらの結果を組み合わせることで、下流タスクに対する高速で堅牢な適応アルゴリズムが得られることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:58:01 GMT)
Train with Perturbation, Infer after Merging: A Two-Stage Framework for Continual Learning [57.5] textbfPerturb-and-Merge(P&M)は,モデルマージをCLパラダイムに統合し,忘れを緩和する新しい連続学習フレームワークである。
提案手法は,複数の連続学習ベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:22:11 GMT)
Towards Understanding Safety Alignment: A Mechanistic Perspective from Safety Neurons [57.1] 大規模言語モデル(LLM)は様々な能力に優れるが、有害なコンテンツや誤報を発生させるなどの安全性リスクが生じる。
安全行動の責任を負うLLM内の安全ニューロンの同定と解析に焦点をあてる。
モデル安全性に対する因果的影響を評価するために,これらのニューロンの特定と動的アクティベーションパッチを対比した推論時アクティベーションを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:10:09 GMT)
MARIS: Marine Open-Vocabulary Instance Segmentation with Geometric Enhancement and Semantic Alignment [56.9] 我々は,水中オープンボキャブラリ(OV)セグメンテーションのための大規模なベンチマークであるtextbfMARIS (underlineMarine Open-Vocabulary underlineInstance underlineSegmentation)を紹介した。
当社のフレームワークは、既存のOVベースラインであるIn-DomainとCross-Domainの両方を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:18:58 GMT)
Overcomplete Tensor Decomposition via Koszul-Young Flattenings [56.8] 最小ランク1項の和として$n_times n times n_3$ tensorを分解する新しいアルゴリズムを与える。
次数-d$s のさらに一般的なクラスは、定数 $C = C(d)$ に対して階数 $Cn$ を超えることができないことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:19:21 GMT)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.4] この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:08:22 GMT)
Conan: Progressive Learning to Reason Like a Detective over Multi-Scale Visual Evidence [56.4] コナンはエビデンスに基づくマルチステップビデオ推論のためのフレームワークである。
コナンはQwen2.5-VL-7B-インストラクションを平均10%以上精度で上回る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:11:46 GMT)
Citation Failure: Definition, Analysis and Efficient Mitigation [56.1] LLMベースのRAGシステムからの引用は、応答検証の簡略化を目的としている。
これは、モデルが有効な応答を生成するとき、引用失敗には当てはまらないが、完全な証拠を引用することができない。
応答自体に欠陥があり、完全な証拠を引用することは不可能である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:47:22 GMT)
Amplifying Prominent Representations in Multimodal Learning via Variational Dirichlet Process [55.9] ディリクレ過程(DP)混合モデルは、最も顕著な特徴を増幅できる強力な非パラメトリック法である。
本稿では,DP駆動型マルチモーダル学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:53:24 GMT)
Learning Dense Hand Contact Estimation from Imbalanced Data [55.0] 密接な接触推定の学習には2つの大きな課題がある。
不均衡なデータから高密度HAnd Contact推定を学習するフレームワークを提案する。
その結果,大規模手接触データを用いて手接触推定を効果的に行うことができた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:03:23 GMT)
Data Efficient Any Transformer-to-Mamba Distillation via Attention Bridge [54.9] 状態空間モデル(SSM)はシーケンシャルモデリングのためのトランスフォーマーの効率的な代替品として登場し、再帰的な構造を通して優れたスケーラビリティを提供する。
本研究では,トランスフォーマーの教師から状態空間の学生モデルへの注意知識の伝達を効率的に行う新しいデータ効率蒸留フレームワークであるCAB(Cross-architecture distillation via Attention Bridge)を提案する。
本研究は,より強力なSSMコミュニティを構築するために,Transformerの専門知識の迅速な活用を可能にするために,注意に基づく知識を反復モデルに効率的に移行できることを示唆する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:03:35 GMT)
Mask and You Shall Receive: Optimizing Masked Language Modeling For Pretraining BabyLMs [54.6] 2025年版BabyLM Challengeの戦略について述べる。
私たちの主な貢献は、MLM(Masked Language Modeling)の改良形式で、モデルの予測能力に応じて隠蔽されたトークンの確率に適応することです。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:15:24 GMT)
Towards Physical Understanding in Video Generation: A 3D Point Regularization Approach [54.6] 三次元幾何学と動的認識を統合した新しい映像生成フレームワークを提案する。
これを実現するために、3Dポイントトラジェクトリで2Dビデオを拡大し、ピクセル空間に配置する。
結果の3D対応ビデオデータセットであるPointVidは、遅延拡散モデルを微調整するために使用される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:49:27 GMT)
Dependency-Aware Task Offloading in Multi-UAV Assisted Collaborative Mobile Edge Computing [53.9] 本稿では,新しい無人航空機(UAV)による協調移動エッジコンピューティング(MEC)フレームワークを提案する。
システムコストを最小限に抑え、タスク消費とエネルギー消費のトレードオフを改善することを目的としている。
提案手法はシステムコストを大幅に削減し,タスク消費とエネルギー消費のトレードオフの改善を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:55:40 GMT)
Language Models use Lookbacks to Track Beliefs [53.8] 我々は、因果媒介と抽象化を用いて、キャラクターの信念を推論するLMの能力を分析する。
我々の研究は信念追跡機構の洞察を提供し、LMにおけるToM推論のリバースエンジニアリングに向けた一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:56 GMT)
Every Question Has Its Own Value: Reinforcement Learning with Explicit Human Values [53.7] RLEV(Reinforcement Learning with Explicit Human Values)を提案する。
RLEVは、Large Language Model (LLM) 最適化を直接、定量化された人間の値信号と整合させる。
RLEVは、複数のRLアルゴリズムとモデルスケールで、精度のみのベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:15:22 GMT)
Revisiting End-to-End Learning with Slide-level Supervision in Computational Pathology [53.6] 教師付きエンドツーエンド学習(E2E)は,高い計算要求や準最適結果などの課題に直面していることを示す。
この問題を軽減するために, ABMILX と呼ばれる新しい MIL を提案する。
E2EトレーニングされたResNetとAMMILXは、2段階のパラダイムの下でSOTA基盤モデルを上回る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:15:10 GMT)
CLEVER: A Curated Benchmark for Formally Verified Code Generation [53.5] $rm Csmall LEVER$は、リーンにおけるエンドツーエンドのコード生成のための161の問題を、高品質でキュレートしたベンチマークである。
それぞれの問題は、(1)堅実な仕様と一致する仕様を生成するタスク、(2)この仕様を確実に満足するリーン実装を生成するタスクで構成されています。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:29:07 GMT)
Spark Transformer: Reactivating Sparsity in FFN and Attention [53.2] 本稿では, FFNとアテンション機構の両方において, 高レベルのアクティベーション間隔を実現する新しいアーキテクチャであるSpark Transformerを紹介する。
これによりFLOPの2.5倍の削減が可能となり、CPUでは1.79倍、GPUでは1.40倍となる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:02:01 GMT)
MELLM: Exploring LLM-Powered Micro-Expression Understanding Enhanced by Subtle Motion Perception [53.0] マイクロ・エクスプレッション(ME)は、隠れた感情を示す、簡潔で低強度の顔の動きである。
本稿では,光学フローに基づく感度を微妙な顔の動きと統合する ME Large Language Model (MELLM) を提案する。
MELLMは複数のMEベンチマークで最先端の精度と一般化を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:16 GMT)
Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [52.8] ONIは、RLポリシーと本質的な報酬関数を同時に学習する分散アーキテクチャである。
我々は、様々な複雑さを持つ報酬モデリングのためのアルゴリズムの選択範囲を探索する。
提案手法は,NetHack Learning Environment の様々な課題にまたがって,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:54:03 GMT)
Plan Then Retrieve: Reinforcement Learning-Guided Complex Reasoning over Knowledge Graphs [52.2] Graph-RFTは、"plan-KGsearch-and-Websearch-during-think"パラダイムを備えた、2段階強化KGQAフレームワークである。
これにより、LLMは、不完全な知識条件下で、KGやWebソース間で自律的な計画と適応的なスケジューリングを行うことができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:04:13 GMT)
Structural Invariance Matters: Rethinking Graph Rewiring through Graph Metrics [52.1] 我々は、リワイアが様々なグラフ構造指標にどのように影響するかを、初めて体系的に分析する。
ノード分類精度と局所的および大域的グラフ特性の変化の相関関係を考察した。
提案手法は,グローバル接続の柔軟性を確保しつつ,局所的な構造を保ちながら再配線を成功させる傾向にある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:38:41 GMT)
PPMStereo: Pick-and-Play Memory Construction for Consistent Dynamic Stereo Matching [52.0] textbfPick-and-textbflay textbfMemory (PM) construction module for dynamic bfStereo matching, called bftextPPMStereo。
bftextPPMStereo と呼ばれる動的 bfStereo マッチングのための textbfPick-and-textbflay textbfMemory (PM) 構築モジュールを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:52:39 GMT)
Speeding Up MACE: Low-Precision Tricks for Equivarient Force Fields [52.0] 機械学習力場は高い計算コストで正確な分子動力学(MD)を提供することができる。
この論文は、計算ボトルネックを特定し、低精度の実行ポリシーを評価することで、MACEを安価かつ高速にすることを目的としている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:02:34 GMT)
Grounding Language with Vision: A Conditional Mutual Information Calibrated Decoding Strategy for Reducing Hallucinations in LVLMs [51.9] LVLM(Large Vision-Language Models)は幻覚の影響を受けやすいモデルである。
本稿では,条件付きポイントワイド・ミューチュアル・インフォメーション(C-PMI)キャリブレーション・デコーディング・ストラテジーを導入する。
提案手法は,復号効率を保ちながら,LVLMの幻覚を著しく低減することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:08:11 GMT)
Adversary-Aware Private Inference over Wireless Channels [51.9] ワイヤレスエッジデバイスにおけるAIベースのセンシングは、人工知能(AI)アプリケーションを大幅に強化する可能性がある。
機密性の高い個人情報は敵によって再構築できるため、プライバシー侵害のリスクを軽減するために特徴の変換が必要である。
本稿では,デバイスがモデルサーバに送信する前に抽出した特徴の変換を適用する,プライバシ保護型AIベースセンシングのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:02:14 GMT)
Quantum mysteries explained in digestible form [51.6] ベルの不等式、テレポーテーション、コチェン=スペクターおよびグリーンベルガー=ホルン=ゼーリンガーの定理の違反がベクトルの観点で理解できることを示す。
これは、量子的現象と古典的現象の違いがイラストリーであるという意味ではない。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:42:26 GMT)
UI-Ins: Enhancing GUI Grounding with Multi-Perspective Instruction-as-Reasoning [51.5] 本稿では,インストラクション・アズ・ア・推論(Instruction-as-Reasoning)パラダイムを導入し,インストラクションを動的解析経路として扱う。
これを実現するために,教師付き微調整と強化学習という2段階のトレーニングフレームワークを提案する。
得られたモデルであるUI-Ins-7BとUI-Ins-32Bは、5つの挑戦的なグラウンドベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:18:32 GMT)
CO-PFL: Contribution-Oriented Personalized Federated Learning for Heterogeneous Networks [51.4] コントリビューション指向型PFL(CO-PFL)は,グローバルアグリゲーションに対する各クライアントのコントリビューションを動的に推定するアルゴリズムである。
CO-PFLは、パーソナライズ精度、堅牢性、スケーラビリティ、収束安定性において、最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:10:06 GMT)
Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.0] 本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:12:26 GMT)
Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities [51.0] 本稿では,対戦型LDMをジェイルブレイク能力に富んだ反復的自己調整プロセスであるADV-LLMを紹介する。
我々のフレームワークは,様々なオープンソース LLM 上で ASR を100% 近く達成しながら,逆接接尾辞を生成する計算コストを大幅に削減する。
Llama3のみに最適化されているにもかかわらず、GPT-3.5では99%のASR、GPT-4では49%のASRを達成している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:57:57 GMT)
Extracting alignment data in open models [50.8] 訓練後モデルから大量のアライメントトレーニングデータを抽出できることが示唆された。
このデータは、長期コンテキスト推論、安全性、命令追従、数学などの特定の機能を改善するためにモデルを操縦するのに有用である。
SFT や RL のような後トレーニングフェーズで使用されたトレーニングデータを,モデルが容易に再学習できることが判明した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:46:43 GMT)
Hybrid Latent Reasoning via Reinforcement Learning [50.7] 大規模言語モデル(LLM)の能力を活用した強化学習(RL)による潜時推論について検討する。
RLをベースとしたハイブリッド潜在推論手法であるハイブリッド推論ポリシー最適化(HRPO)を導入する。
HRPOで訓練されたLLMは解釈可能であり、言語横断パターンや短い完了長といった興味深い挙動を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:18:11 GMT)
HyperET: Efficient Training in Hyperbolic Space for Multi-modal Large Language Models [50.3] マルチモーダルな大言語モデル(MLLM)は、視覚的およびテキスト的理解を整合させるための変換的アプローチとして登場した。
それらは通常、多粒度レベルでのクロスモーダルアライメントを達成するために、訓練のために非常に高い計算資源を必要とする。
この非効率性の重要な源は、CLIPやSAMなど、広く採用されている視覚エンコーダであり、多粒度レベルでの言語との整合性が欠如している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:16:44 GMT)
Learning to Hash for Recommendation: A Survey [49.9] このサーベイは、最先端のHashRecアルゴリズムの概要を提供する。
既存の研究を,(i)学習目標,(ii)最適化戦略,(iii)推薦シナリオに基づく3段階の分類に分類する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:08:41 GMT)
Understanding challenges to the interpretation of disaggregated evaluations of algorithmic fairness [49.4] 関係する人口を表わすが、実世界の格差を反映するデータである場合、サブグループ間での平等なパフォーマンスは、信頼できない公平さの尺度であることを示す。
本フレームワークでは, 因果関係の明示的な仮定と分析を相補して, 相反や分布変化の制御を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:49:29 GMT)
VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning [49.3] 少数のラベル付きサポートサンプルから新しい概念を認識することを目的としている。
近年の研究では、追加の意味情報を組み込んだり、複雑な意味融合モジュールを設計することでサポート機能を強化している。
本稿では,Few-Shot Learningのための大規模言語モデルを用いた視覚とテキストをブリッジする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:09:21 GMT)
A Parameter-Efficient Mixture-of-Experts Framework for Cross-Modal Geo-Localization [49.1] 我々はRoboSense 2025 Track 4: Cross-Modal Drone Navigationに勝利のソリューションを提示する。
タスクは、大規模なマルチプラットフォームコーパスから最も関連性の高いジオレファレンス画像を取得する。
我々は、差別力を高めるために、プログレッシブな2段階の強硬なマイニング戦略を用いて、3つのプラットフォーム専門家を訓練する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:23:47 GMT)
Timely Clinical Diagnosis through Active Test Selection [49.1] 本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:56:27 GMT)
Amortized Active Generation of Pareto Sets [48.6] A-GPSは、オンラインの離散ブラックボックスマルチオブジェクト最適化のための新しいフレームワークである。
メソッドは、非支配関係を予測するためにクラス確率推定器を使用する。
この非支配的CPEは,超ボリューム改善の確率を暗黙的に見積もっている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:49:23 GMT)
Generative Reasoning Recommendation via LLMs [48.5] 大規模言語モデル(LLM)は、生成的推論レコメンデーションモデル(GRRM)として機能する上で、根本的な課題に直面している。
本研究は,レコメンデーションタスクに対する統一的な理解・推論・予測方法を実現する,事前学習されたLLMを適用してGRRMを構築する方法について検討する。
本稿では,協調的セマンティックアライメント(Collaborative-Semantic Alignment),Reasoning Curriculum Activation(Reasoning Curriculum Activation),Sparse-Regularized Group Policy Optimization(Sparse-Regularized Group Policy Optimization)の3つのコンポーネントを統合するエンドツーエンドフレームワークであるGREAMを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:31 GMT)
The Faiss library [48.4] Faissは、インデックス化手法と関連するプリミティブのツールキットで、ベクトルの検索、クラスタ化、圧縮、変換に使用される。
本稿では,ベクトル探索のトレードオフ空間とFaissの設計原理について,構造,最適化,インターフェースの観点から述べる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:36:08 GMT)
Self-Refining Language Model Anonymizers via Adversarial Distillation [48.3] 本稿では,Self-refining Anonymization with Language Model (SEAL)を紹介する。
SEALは、推論時に外部モデルに頼ることなく効果的な匿名化を行うために、小型言語モデル(SLM)をトレーニングするための新しい蒸留フレームワークである。
合成個人プロファイルとテキストコメントのデータセットであるSynthPAIの実験は、SEALでトレーニングされたSLMが匿名化機能を大幅に改善したことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:22:08 GMT)
REOBench: Benchmarking Robustness of Earth Observation Foundation Models [48.2] REOBenchは、地球観測基盤モデルの堅牢性を評価するための最初の総合的なベンチマークである。
マスク付き画像モデリング、コントラスト学習、視覚言語事前学習パラダイムを用いて訓練された幅広いモデルの体系的評価を行う。
その結果, 既存の地球観測基盤モデルでは, 入力汚損に晒された場合, 顕著な性能劣化がみられた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:43:31 GMT)
Are Large Reasoning Models Good Translation Evaluators? Analysis and Performance Boost [48.0] 大規模な推論モデル(LRM)は、機械翻訳(MT)の品質評価を行うことができる。
MT評価におけるLRM-as-a-judgeの最初の系統解析を行った。
そこで我々は,LRM思考を人工的,人間的な思考軌跡で訓練することで校正することを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:48:36 GMT)
LeVo: High-Quality Song Generation with Multi-Preference Alignment [48.0] 我々はLeLMとMusic Codecで構成される言語モデルベースのフレームワークであるLeVoを紹介する。
LeVoは2種類のトークンを並列にモデリングすることができる。
2つのデコーダのみのトランスフォーマーと、異なるトークンタイプ間の干渉を防ぐためのモジュール拡張トレーニング戦略を採用している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:07:37 GMT)
Attentive Convolution: Unifying the Expressivity of Self-Attention with Convolutional Efficiency [47.8] 私たちはCNNの設計を再検討し、重要な質問に導かれました。
先行研究における長年のデザイン直観に挑戦する2つの基本的な洞察を明らかにする。
我々は、これらの原則を本質的に注入する畳み込み作用素の原則改革であるtextitAttentive Convolution (ATConv)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:25:17 GMT)
DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion [47.8] Dynamic Position Extrapolation (DyPE) は、事前トレーニングされた拡散変換器が、トレーニングデータを超える解像度で画像を合成できる訓練不要な方法である。
DyPEは、常に性能を改善し、超高解像度画像生成における最先端の忠実性を達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:42:14 GMT)
Scalable Dynamic Embedding Size Search for Streaming Recommendation [47.7] 実世界のレコメンデーションシステムは、しばしばストリーミングレコメンデーションシナリオで機能する。
ユーザやアイテムの数は増加を続けており、かなりのストレージリソース消費につながっている。
SCALLと呼ばれるストリーミングレコメンデーション用のLightweight Embeddingsを学び、ユーザ/イテムの埋め込みサイズを適応的に調整できる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:05:21 GMT)
LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas [47.5] 我々は、パーソナライズされたマルチオブジェクトのテキスト・ツー・イメージ生成のためのインタラクティブなフレームワークであるLayerComposerを紹介する。
提案された層状キャンバスは、直感的な層操作によって入力対象の配置、サイズ変更、ロックを可能にする。
ロック機構はアーキテクチャ上の変更を必要とせず、代わりに、新しい補完的なデータサンプリング戦略と組み合わせて、固有の位置埋め込みに依存します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:55 GMT)
Comprehensive Evaluation and Analysis for NSFW Concept Erasure in Text-to-Image Diffusion Models [47.3] 拡散モデルの強い一般化能力は、必然的にNSFW(Not-safe-for-work)コンテンツの生成につながる。
提案手法は,NSFW の概念消去法の最初の体系的な研究を行い,概念消去に特化して設計されたフルパイプ・ツールキットである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:23:42 GMT)
Diffusion Autoencoders with Perceivers for Long, Irregular and Multimodal Astronomical Sequences [47.2] パーシーバー付き拡散オートエンコーダ(deep)について紹介する。
daepは異種の測定をトークン化し、Perceiverエンコーダで圧縮し、Perceiver-IO拡散デコーダで再構成する。
様々な分光学的および測光的な天文学的なデータセットにわたって、ディープは低い再構成誤差を達成し、より差別的な潜在空間を生成し、より微細な構造を保存している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:21:01 GMT)
Improving Model Representation and Reducing KV Cache via Skip Connections with First Value Heads [47.1] SkipV1Formerは、第1層のバリューヘッドからのスキップ接続を使用して表現を強化し、KVキャッシュを削減するトランスフォーマーである。
我々は、SkipV1FormerがKVキャッシュの約25%の一貫性のある削減を実現していることを示す。
YOCOと組み合わせると、KVキャッシュサイズが50%近く削減され、パフォーマンスが向上する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:29:11 GMT)
ARGenSeg: Image Segmentation with Autoregressive Image Generation Model [46.8] 本稿では,ARGenSeg(AutoRegressive Generation-based paradigm for image)を提案する。
提案手法は,複数のセグメンテーションデータセットに対する従来手法を超越し,推論速度を著しく向上させる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:58:26 GMT)
Transformers are Inherently Succinct [46.8] 変換器は形式言語の標準表現よりもかなり簡潔に形式言語を表現できることを証明している。
この表現性の副産物として, 変圧器のバリデーション特性が確実に抽出可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:09:19 GMT)
X-Reflect: Cross-Reflection Prompting for Multimodal Recommendation [46.8] クロスリフレクション・プロンプティングは、テキストと画像間の支持的および矛盾する情報を明示的に識別し、調整するように設計されている。
2つの広く利用されているベンチマーク実験により,提案手法は下流の推薦精度において,既存の基準値よりも優れていることが示された。
また,X-Reflect-keywordも導入した。X-Reflect-keywordは,キーワードを用いて画像内容を要約し,ベースモデルを小さなバックボーンに置き換える軽量版である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:44:46 GMT)
Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models [46.6] 本稿では,プリトレーニング済みメモリであるメモリデコーダを紹介する。このメモリデコーダは,元のモデルのパラメータを変更することなく,効率的なドメイン適応を実現する。
実験により、メモリデコーダは、様々なQwenモデルとLlamaモデルを3つの専門分野(バイオメディシン、ファイナンス、法)に効果的に適応し、平均6.17ポイントのパープレキシティを低減できることが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:14:04 GMT)
MemER: Scaling Up Memory for Robot Control via Experience Retrieval [46.5] 人間は日常的にメモリをタスクに頼っているが、ほとんどのロボットポリシーはこの機能を欠いている。
本稿では,その経験から過去の関連事項を選択し,追跡するために,ハイレベルな政策を訓練する階層的な政策枠組みを提案する。
我々のアプローチであるMemERは、数分のメモリを必要とする3つの現実世界の長距離ロボット操作タスクにおいて、従来の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:26:17 GMT)
Ask a Strong LLM Judge when Your Reward Model is Uncertain [46.4] 本稿では,高速RMを高速に補う不確実性に基づくルーティングフレームワークを提案する。
本手法は,政策勾配法(PG法)において,一対の選好分類として有利な推定を定式化する。
RMベンチマークの実験により、我々の不確実性に基づくルーティング戦略は、同じコストでランダム判定よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:09:13 GMT)
FieldGen: From Teleoperated Pre-Manipulation Trajectories to Field-Guided Data Generation [45.9] FieldGenは、スケーラブルで多様な、高品質な実世界のデータ収集を可能にする、フィールド誘導型データ生成フレームワークである。
実験により、FieldGenでトレーニングされたポリシーは、遠隔操作ベースのベースラインと比較して、より高い成功率と安定性を達成することが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:47:12 GMT)
Time-braiding phase of anyons tied to the nonuniversal scaling dimension [45.9] 我々は、直流雑音と時間領域のブレイディング制約から推定される応答関数とをリンクする非平衡変動散逸関係を用いる。
このことは、空間領域における位相的に保護されたブレイディング位相とは対照的に、顕微鏡的エッジダイナミクスを反映できる$theta$の普遍性に疑問を呈する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:18:15 GMT)
Theta-term in Russian Doll Model: phase structure, quantum metric and BPS multifractality [45.9] ロシアドルモデル(RDM)の決定論的および不規則なバージョンにおける位相構造について検討する。
BA方程式から生じる大域電荷$Q(theta,gamma)$における相転移のパターンを見つける。
我々は、RDMモデルのハミルトニアンがヒルベルト空間の特に 2d-4d BPS セクターの混合を記述することを予想する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:25:01 GMT)
Bi-Mamba: Towards Accurate 1-Bit State Space Models [45.7] $textttBi-Mamba$は、より効率的な大規模言語モデル(LLM)を実現するために設計されたスケーラブルで強力な1ビットのMambaアーキテクチャである。
$textttBi-Mamba$モデルは、自己回帰蒸留損失を使用して標準LLMスケールデータセットのスクラッチからトレーニングされる。
言語モデリングベンチマークの実験では、$textttBi-Mamba$は、その完全な精度に匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:55:50 GMT)
HYPE: Hybrid Planning with Ego Proposal-Conditioned Predictions [45.7] Egoの提案条件付き予測を用いたハイブリッドプランニングを提案する。
学習された提案モデルからの多モード軌道提案を事前としてモンテカルロ木探索の改良に統合する。
提案手法を考慮し,コスト関数設計を大幅に単純化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:59:51 GMT)
Gatekeeper: Improving Model Cascades Through Confidence Tuning [45.5] カスケード構成の小型モデルを校正するための新しい損失関数「ゲートキーパー」を導入する。
我々のアプローチは、より小さなモデルを微調整して、より大規模なモデルに複雑なタスクを遅延させながら、正しく実行できるタスクを確実に処理する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:49:36 GMT)
TRUST: A Decentralized Framework for Auditing Large Language Model Reasoning [45.2] 大規模言語モデルは、意思決定を明らかにする推論チェーンを生成する。
既存の監査手法は集中的で、不透明で、スケールが難しい。
透明で分散化された監査フレームワークであるTRUSTを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:16:44 GMT)
Empathic Prompting: Non-Verbal Context Integration for Multimodal LLM Conversations [45.1] 暗黙的な非言語的文脈でLLM(Large Language Model)の会話を豊かにするマルチモーダルなヒューマン・AIインタラクションのためのフレームワークであるEmpathic Promptingを提案する。
このシステムは、商業的な表情認識サービスを統合し、ユーザの感情的な手がかりをキャプチャし、プロンプト中にコンテキスト信号として埋め込む。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:08:03 GMT)
Federated Learning via Meta-Variational Dropout [44.9] Federated Learning (FL)は、リモート分散クライアントからグローバル推論モデルをトレーニングすることを目的としている。
従来のFLは、モデルオーバーフィットや局所モデルの多様化など、実践的な応用においてしばしば課題に直面している。
MetaVD(Meta-variational Dropout)と呼ばれる新しいベイズメタラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:17:40 GMT)
RigAnything: Template-Free Autoregressive Rigging for Diverse 3D Assets [44.7] 本稿では,新しい自己回帰変換モデルであるRigAnythingを紹介する。
関節と骨格のトポロジを確率的に生成し、スキンの重量をテンプレートのない方法で割り当てることで、3Dアセットをリグレディにする。
これは、ヒューマノイド、四足動物、海洋生物、昆虫など、さまざまな種類の物体にまたがる最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:33:00 GMT)
Physically consistent and uncertainty-aware learning of spatiotemporal dynamics [44.3] 物理制約を強制する物理一貫性ニューラル演算子(PCNO)を導入する。
PCNO内の物理一貫性プロジェクション層は、フーリエ空間における質量運動量保存を効率的に計算する。
また,拡散一貫性モデルを用いて不確実性を定量化し定量化するDiffPCNOを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:17:21 GMT)
FlyLoRA: Boosting Task Decoupling and Parameter Efficiency via Implicit Rank-Wise Mixture-of-Experts [44.2] Low-Rank Adaptation (LoRA) は基礎モデルのパラメータ効率の高い微調整法である。
MoEベースのLoRA変種は、単一タスクの命令チューニングにおいて、タスク内相関を緩和する。
FlyLoRA は暗黙の MoE ベースの LoRA 変種であり、アッププロジェクション行列にランクワイズの専門家アクティベーションを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:14:06 GMT)
mmWalk: Towards Multi-modal Multi-view Walking Assistance [44.2] mmWalkは、マルチビューセンサーとアクセシビリティ指向の機能を統合して、屋外安全なナビゲーションを可能にするシミュレーションされたマルチモーダルデータセットである。
本データセットは,120個のシナリオ分類された歩行軌跡と62kの同期フレームから構成される。
VQAベンチマークであるmmWalkVQAを生成し、9つのカテゴリに69万以上の視覚的質問応答三つ子を配置し、安全かつ情報的な歩行支援を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:40:49 GMT)
Positional Encoding Field [44.0] Diffusion Transformer (DiTs) は視覚生成の主要なアーキテクチャである。
われわれは、DiTがどのようにしてビジュアルコンテンツを整理し、パッチトークンが驚くほどの独立性を示すことを発見したかを再考する。
位置情報を導入します。
フィールド (PE-Field) は2次元平面から構造化された3次元場へ位置エンコーディングを拡張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:32:37 GMT)
DMWM: Dual-Mind World Model with Long-Term Imagination [43.4] 本稿では、論理的推論を統合し、論理的一貫性で想像力を発揮できる新しいデュアルミンド世界モデル(DMWM)を提案する。
提案するフレームワークは,DMControlスイートからの長期計画を必要とするベンチマークタスクに基づいて評価される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:56:53 GMT)
XtraGPT: Context-Aware and Controllable Academic Paper Revision [43.3] 本稿では,基準誘導型意図アライメントと文脈認識モデリングを中心とした学術論文改訂のための人間-AI協調フレームワークを提案する。
XtraGPTは,コンテクスト対応,命令誘導型書き込み支援のためのオープンソースのLLMスイートである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:49:19 GMT)
Transferable Black-Box One-Shot Forging of Watermarks via Image Preference Models [42.9] 広範に使用されているポストホック画像透かしの文脈における透かし鍛造について検討した。
画像がウォーターマークされているかどうかを評価するための選好モデルを導入する。
本稿では,バックプロパゲーションによる入力画像の最適化により,透かしを除去・鍛造するモデルの能力を実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:06:35 GMT)
MVP-Shapley: Feature-based Modeling for Evaluating the Most Valuable Player in Basketball [42.8] 本研究では,アシストやポイントなど,ゲーム中の関連イベントを記録するプレイバイプレイデータに焦点を当てた。
我々は,新たなMVP評価フレームワークをussysとして導入することで,課題に対処することを目指している。
このアプローチには、機能処理、ウィンロスモデルトレーニング、Shapley値アロケーション、プレイヤーのコントリビューションに基づいたMVPランキング決定が含まれる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:05:45 GMT)
The Reality Gap in Robotics: Challenges, Solutions, and Best Practices [42.7] Sim-to-realトランスファーは、ロボット工学における最も急進的な課題の1つだ。
sim-to-realトランスファーの最近の進歩は、様々なプラットフォームで有望な結果を示している。
しかし、課題は継続し、現実のギャップの根本原因と解決策をより深く理解する必要がある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:58:53 GMT)
LLM-Explorer: A Plug-in Reinforcement Learning Policy Exploration Enhancement Driven by Large Language Models [42.5] 政策探究は強化学習(RL)において重要であり、既存のアプローチには欲求、ガウス過程などが含まれる。
大規模言語モデル(LLM)を用いたタスク固有探索戦略を適応的に生成するLLM-Explorerを設計する。
我々の設計は、DQNシリーズ、DDPG、TD3など、広く使われているRLアルゴリズムと互換性のあるプラグインモジュールである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:12:13 GMT)
Neural Mutual Information Estimation with Vector Copulas [42.5] 相互情報(MI)の推定は、データサイエンスと機械学習の基本的な課題である。
複雑性とキャパシティのトレードオフを改善するために、これらの2つの極端の間に原則を定めます。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:54:56 GMT)
DeepWideSearch: Benchmarking Depth and Width in Agentic Information Seeking [42.4] DeepWideSearchは、情報検索の深さと幅を統合するエージェントを評価するために設計された最初のベンチマークである。
DeepWideSearchでは、エージェントは大量のデータを処理し、それぞれがマルチホップ検索パスに対して深い推論を必要とする。
実験の結果、最先端のエージェントでさえ平均的な成功率は2.39%に過ぎなかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:28:45 GMT)
Multi-Step Reasoning for Embodied Question Answering via Tool Augmentation [42.4] EQA(Embodied Question Answering)は、エージェントが3D環境を探索して観察し、シーンに関連する質問に答えることを要求する。
外部ツールと多段階推論を統合するエージェントであるToolEQAを紹介する。
さらに,大規模EQAタスクを自動的に構築する新しいEQAデータ生成パイプラインを設計する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:02:08 GMT)
Vision-Centric Activation and Coordination for Multimodal Large Language Models [42.3] マルチモーダルな大言語モデル(MLLM)は、視覚エンコーダからLLMへのイメージ機能を統合し、高度な理解能力を示す。
しかし、メインストリームMLLMは、重要な視覚中心の情報を無視して、テキストトークンの次のトークン予測によってのみ監督される。
本稿では,ビジョン中心のアクティベーションとコーディネーションによってMLLM表現を最適化するVaCoを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:31:13 GMT)
GenLit: Reformulating Single-Image Relighting as Video Generation [42.1] 我々は、映像生成モデルに光操作を行うためのグラフィックスエンジンの能力を蒸留するフレームワークであるGenLitを紹介する。
小さな合成データセットのみに微調整されたモデルが現実世界のシーンに一般化されることが分かりました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:11:15 GMT)
IB-GAN: Disentangled Representation Learning with Information Bottleneck Generative Adversarial Networks [42.0] 本稿では,非交叉表現学習のための新しいGANに基づく教師なしモデルを提案する。
IB-GANのアーキテクチャはInfoGANと部分的に似ているが、重大な違いがある。
IB-GANは最先端のβ-VAEと競合しInfoGANより優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:24:48 GMT)
Curing Miracle Steps in LLM Mathematical Reasoning with Rubric Rewards [40.9] 数学的推論のための大きな言語モデルは、通常結果に基づく報酬で訓練される。
我々の実験では、このパラダイムがハッキングに報酬を与える可能性が高く、モデルの推論能力のかなりの過大評価につながります。
これは、偽陽性の頻度が高いことが証明されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:10:47 GMT)
A Reinforcement Learning Framework for Robust and Secure LLM Watermarking [40.9] 我々は、堅牢でセキュアな透かしのためのエンドツーエンドのRLフレームワークを提案する。
提案手法では,報奨条件にアンカー機構を導入し,安定したトレーニングを確保するとともに,報奨ハックを防止するための追加の正規化条件を導入する。
本手法は,全ての基準において最先端のトレードオフを実現し,他の基準を劣化させることなく,攻撃に対する抵抗性を顕著に改善する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:53:03 GMT)
On the Universal Near Optimality of Hedge in Combinatorial Settings [40.8] 任意の$X 部分集合 0,1d$ に対して、Hedge は、最大$sqrtlog d$ factor まで、ほぼ最適であり、$Omegabig(sqrtT log(|X|/log dbig)$ の下位境界を確立することによって示される。
また,DAGにおける最短パス問題に対する準最適正規化器も確立した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:55:03 GMT)
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference [40.2] 本稿では, 科学的普及, 株式, 地域福祉の基本的な目標を脅かす構造的危機をデータ駆動で診断する。
1) 著者一人当たりの出版率が過去10年で2倍以上に増加し, 毎年4.5紙以上になる, 2) 環境面では1回の会議の二酸化炭素排出量が1日当たりの排出を上回っている, (3) 心理的には, オンラインコミュニティの71%が否定的な感情を反映し, 35%がメンタルヘルスの懸念を反映している,という4つのストレス領域を同定した。
これに対し、ピアレビュー、プレゼンテーションを分離したCommunity-Federated Conference(CFC)モデルを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:21:19 GMT)
BIOCAP: Exploiting Synthetic Captions Beyond Labels in Biological Foundation Models [40.1] 画像やキャプションは、ある種の潜在形態空間からの相補的なサンプルと見なすことができる。
我々は、ウィキペディア由来の視覚情報と分類群調整形式の例で合成キャプションを生成する。
これらのドメイン固有のコンテキストは幻覚を減らし、正確なインスタンスベースのキャプションを生成するのに役立つ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:34:21 GMT)
Preventing Shortcuts in Adapter Training via Providing the Shortcuts [40.0] アダプタは、単一イメージの再構成目標を使用して、被写体アイデンティティなどの特定のターゲット属性をキャプチャするために訓練される。
入力画像は、必然的に視覚的要因の混合を含むため、アダプタは、ターゲット属性をポーズ、表現、照明などの偶発的な属性と絡み合う傾向にある。
この急激な相関問題は一般化を制限し、入力テキストプロンプトに固執するモデルの能力を阻害する。
Shortcut-Rerouted Adapter Training では、ControlNet や LoRA などの補助モジュールを介して、コンバウンド要因をルーティングすることで、アダプタの内部化のインセンティブを排除している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:09 GMT)
MLP Memory: A Retriever-Pretrained Memory for Large Language Models [39.9] NLPRAG Memoryは、明示的なドキュメントアクセスなしに検索パターンを内部化する軽量パラメトリックモジュールである。
我々のアーキテクチャは、このトレーニング済みメモリとトランスフォーマーデコーダを単純な確率で統合し、WikiText-103とWebデータセットでそれぞれ17.5%と24.1%のスケーリングゲインを得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:46:50 GMT)
Budgeted Embedding Table For Recommender Systems [39.9] BET(Budgeted Embedding Table)は、メモリ予算を満たすように保証されたテーブルレベルのアクションを生成する新しい方法である。
BETは、メモリ予算の異なる3つの一般的な推奨モデルと組み合わせられている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:00:40 GMT)
Breaking mBad! Supervised Fine-tuning for Cross-Lingual Detoxification [39.7] クロス・リンガル・デトキシフィケーション(Cross-lingual Detoxification)は、大規模言語モデルにおいて毒性を緩和するパラダイムである。
本研究では, クロスディストリビューション設定における毒性低下を解析し, 非有害タスクに対するモデル性能への影響について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:15:41 GMT)
Factor Fitting, Rank Allocation, and Partitioning in Multilevel Low Rank Matrices [39.6] フロベニウスノルムの MLR 行列によって与えられた行列を適合させる際に生じる3つの問題に対処する。
第一の問題は、MLR行列の因子を調整する因子フィッティングである。
2つ目はランクアロケーションで、各レベルにおけるブロックのランクを、与えられた値の合計ランクに基づいて選択する。
最終問題は、列と列の階層的な分割と、ランクと要素を選択することである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:18:06 GMT)
MIRA: Medical Time Series Foundation Model for Real-World Health Data [39.6] 医用時系列の統一基盤モデルは、アノテーションの負担を軽減し、モデルのカスタマイズを最小化し、堅牢な転送を可能にする。
医療時系列の予測に特化して設計された統合基盤モデルであるMIRAを紹介する。
MIRAは、他のゼロショットベースラインや微調整ベースラインと比較して、アウト・オブ・ディストリビューションとイン・ディストリビューションのシナリオで平均10%と7%の誤差を予測できる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:22:38 GMT)
FinCARE: Financial Causal Analysis with Reasoning and Evidence [39.1] Portfolioのマネージャは相関に基づく分析と、パフォーマンスを駆動する真の因果関係のキャプチャに失敗する手法に依存している。
本稿では,SEC 10-K の申請書から抽出した財務知識グラフと大規模言語モデル推論の2つの相補的な情報源から,統計的因果探索アルゴリズムとドメイン知識を統合するハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:14:28 GMT)
AI Realtor: Towards Grounded Persuasive Language Generation for Automated Copywriting [39.1] 自動複写における説得的言語生成のために,大規模言語モデルを用いたエージェントフレームワークを開発した。
提案手法は,生成したコンテンツとユーザの好みを一致させると同時に,有用な事実属性を強調表示するように設計されている。
我々は、不動産マーケティングの分野において、潜在的住宅購入者の焦点を絞った体系的な人物実験を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:25:34 GMT)
Crafting Imperceptible On-Manifold Adversarial Attacks for Tabular Data [38.9] 本稿では,混合入力変分オートエンコーダ(VAE)を用いた遅延空間摂動フレームワークを提案し,統計的に一貫した逆の例を生成する。
提案手法は,従来の入力空間攻撃と比較して,アウトレーラ率と一貫した性能を著しく低下させることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:00:03 GMT)
Identity-Preserving Image-to-Video Generation via Reward-Guided Optimization [38.7] 画像間(I2V)生成のためのIPRO(Identity-Preserving Reward-guided Optimization)を提案する。
IPROは、アイデンティティ保護を強化するための強化学習に基づく、新しいビデオ拡散フレームワークである。
提案手法は,サンプリングチェーンの最後のステップを通じて報酬信号をバックプロパゲートし,よりリッチなフィードバックを可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:15:51 GMT)
Efficient Multimodal Streaming Recommendation via Expandable Side Mixture-of-Experts [38.6] マルチモーダルストリーミングレコメンダシステムは、ユーザの関心が時間とともに変化する現実世界のアプリケーションに広くデプロイされている。
マルチモーダルストリーミングレコメンデーションのためのメモリ効率の高いフレームワークであるXSMoE(Expandable Side Mixture-of-Experts)を提案する。
XSMoEは、凍結したトレーニング済みエンコーダに軽量なサイドチューニングモジュールをアタッチし、ユーザのフィードバックの進化に応じて徐々に拡張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:04:56 GMT)
SutureBot: A Precision Framework & Benchmark For Autonomous End-to-End Suturing [38.3] 私たちは、da Vinci Research Kit(dVRK)の自律的な縫合ベンチマークであるSutureBotを紹介します。
再現性を確保するため、1,890個の縫合デモからなる高忠実度データセットを作成した。
そこで我々は,この課題をデクスタラスな模倣学習のベンチマークとして確立するために,最先端の視覚言語モデル(VLA)を評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:50:17 GMT)
SeG-SR: Integrating Semantic Knowledge into Remote Sensing Image Super-Resolution via Vision-Language Model [38.1] 高解像度(HR)リモートセンシング画像は、都市計画や環境モニタリングなど幅広い用途において重要な役割を担っている。
センサーやデータ転送リンクの制限により、実際に取得された画像は分解能の低下に悩まされることが多い。
RSISR(Remote Sensing Image Super-Resolution)は、ローレゾリューション(LR)入力からHRイメージを再構築することを目的としており、直接HR画像を取得するためのコスト効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:36:51 GMT)
Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning [37.9] 信頼できるマルチエージェント強化学習システムを構築するには、堅牢性を理解する必要がある。
我々は,MARLにおける協調性,堅牢性,レジリエンスを評価するため,82,620以上の実験からなる大規模実験を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:39:40 GMT)
UltraHR-100K: Enhancing UHR Image Synthesis with A Large-Scale High-Quality Dataset [37.9] textbfUltraHR-100Kは、リッチキャプションを備えた100K UHR画像の高品質なデータセットであり、多様な内容と強力な視覚的忠実度を提供する。
本稿では,T2I拡散モデルにおける細部生成を向上させる周波数認識後学習手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:34:53 GMT)
LSF-Animation: Label-Free Speech-Driven Facial Animation via Implicit Feature Representation [37.8] 明示的な感情やアイデンティティの特徴表現への依存を解消する新しいフレームワークであるLSF-Animationを提案する。
具体的には、LSFアニメーションは、音声から感情情報を暗黙的に抽出し、中立的な顔メッシュから識別特徴をキャプチャする。
本手法は,感情表現性,アイデンティティの一般化,アニメーションリアリズムの観点から,近年の最先端アプローチを超越した手法である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:09:24 GMT)
Extending machine learning model for implicit solvation to free energy calculations [37.7] 我々は、Lambda Solvation Neural Network(LSNN)と呼ばれるグラフニューラルネットワーク(GNN)に基づく暗黙の溶媒モデルを導入する。
LSNNは、明解アルケミカルシミュレーションに匹敵する精度で自由エネルギー予測を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:05:44 GMT)
BioDet: Boosting Industrial Object Detection with Image Preprocessing Strategies [37.2] 産業環境における未確認物体の2次元検出のための標準化およびプラグインパイプラインを提案する。
現在のSOTAベースラインに基づいて、低照度画像の強調と背景削除により、ドメインシフトと背景アーティファクトを低減する。
この設計は、生のSAM出力でよく見られる偽陽性を抑え、下流のポーズ推定のためのより信頼性の高い検出をもたらす。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:15:16 GMT)
Flow based approach for Dynamic Temporal Causal models with non-Gaussian or Heteroscedastic Noises [37.0] 因果発見のための統合フレームワークであるFANTOMを紹介する。
非定常過程と非ガウス的および異方性雑音を扱う。
同時にレジームの数と対応するインデックスを推測し、各レジームのディレクテッド・アサイクリックグラフを学習する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:59:26 GMT)
Mesh-RFT: Enhancing Mesh Generation via Fine-grained Reinforcement Fine-Tuning [36.6] Mesh-RFTは、3Dメッシュ生成のための新しい微細化強化微調整フレームワークである。
Masked Direct Optimization Preference (M-DPO)を使用して、品質を意識した顔マスクによる局所的な改善を実現している。
実験の結果,我々のM-DPOアプローチはハウスドルフ距離(HD)を24.6%削減し,トポロジースコア(TS)を3.8%改善した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:38:43 GMT)
Training Robust Graph Neural Networks by Modeling Noise Dependencies [36.5] 実世界のアプリケーションでは、グラフのノード機能は様々なソースからのノイズを含むことが多く、性能が著しく低下する。
グラフ上でのより現実的なノイズシナリオ、依存性を考慮したノイズ(DANG)を導入する。
本稿では,データ生成プロセスにおける変数間の因果関係をキャプチャする,新しいロバストなGNN,DA-GNNを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:07:19 GMT)
Dual-Domain Deep Learning-Assisted NOMA-CSK Systems for Secure and Efficient Vehicular Communications [36.4] 本稿では、車両通信のための深層学習支援パワードメイン非直交多重アクセスカオスシフトキーリング(DL-NOMA-CSK)システムを提案する。
ディープニューラルネットワーク(DNN)ベースの復調器は、オフライントレーニング中に固有のカオス信号特性を学ぶように設計されている。
提案システムは、スペクトル効率(SE)、エネルギー効率(EE)、ビット誤り率(BER)、セキュリティ、ロバスト性の観点から優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:41:00 GMT)
Stop Summation: Min-Form Credit Assignment Is All Process Reward Model Needs for Reasoning [36.3] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)のテストタイムスケーリングにおいて、困難な推論タスクにおいて有効であることが証明されている。
しかしながら、PRMによる報酬ハッキング問題は、強化微調整における彼らの成功を制限している。
本稿では,PRMによる報酬ハッキングの主な原因を,強化学習における正準和形信用代入として同定する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:28:10 GMT)
SeViCES: Unifying Semantic-Visual Evidence Consensus for Long Video Understanding [36.3] 本稿では,効果的で信頼性の高いロングビデオ理解のためのフレームワークを提案する。
SeViCESはトレーニング不要でモデルに依存しない2つの重要なコンポーネントを導入している。
長いビデオ理解ベンチマークの実験によると、SeViCESは精度と堅牢性の両方で最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:55:28 GMT)
Individualized Cognitive Simulation in Large Language Models: Evaluating Different Cognitive Representation Methods [36.3] 大型言語モデル(LLM)はロールプレイのような表面レベルの人間の振る舞いを確実に模倣する。
しかし、より深い個別化された認知過程をシミュレートする能力は、いまだに理解されていない。
我々は,言語的特徴,概念マッピング,プロファイルに基づく情報など,異なる認知表現を評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:18:15 GMT)
Twilight: Adaptive Attention Sparsity with Hierarchical Top-$p$ Pruning [36.3] Twilightは、既存のスパースアテンションアルゴリズムに適応性をもたらすフレームワークである。
Twilightは、冗長トークンの少なくとも98%で適応的にプルーし、自己アテンション操作で15.4タイム=アクセラレーション、トークン毎のエンドツーエンドでのアクセラレーションで3.9タイム=アクセラレーションを実現している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:14:41 GMT)
Optimistic Task Inference for Behavior Foundation Models [36.0] OpTI-BFMは、タスク推論のためのデータ収集においてBFMを導く楽観的な決定基準である。
我々は、確立されたゼロショットベンチマーク上でOPTI-BFMを評価し、後継機能ベースのBFMが未知の報酬関数を識別し、最適化することができることを観察した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:36:18 GMT)
Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Fine-tuning [36.0] 本稿では, エントロピーボーナスをREINFORCEポリシー勾配に置き換えることで, エントロピー崩壊を解消するArbitrary Entropy Policy Optimization (AEPO)を提案する。
AEPOは、ポリシー勾配を正規化として、分布を正規化として、REINFORCEを正規化として統合し、最適化を歪ませることなく正確なエントロピー制御を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:06:36 GMT)
Time-Evolving Dynamical System for Learning Latent Representations of Mouse Visual Neural Activity [35.8] Time-Evolving Visual Dynamical System (TE-ViDS) は逐次潜在変数モデルである。
神経活動は時間とともに進化する低次元の潜在表現に分解される。
TE-ViDSは自然主義シーン/ムーブメント上で最高の復号化性能を発揮する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:34:54 GMT)
Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Reward Design [35.5] マルチターンRLアルゴリズムとエージェント応用のためのテキストターンレベルの報酬設計に関する最初の体系的研究について述べる。
我々は、多ターン推論強化検索エージェントのケーススタディを行い、検証可能とLCM-as-judgeの2種類のターンレベルの報酬を慎重に設計する。
マルチターン探索タスクの実験により、適切に設計されたターンレベルの報酬を組み込むことで、RLアルゴリズムは軌道レベルの報酬でベースライン法を大幅に上回ることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:32:07 GMT)
PointMapPolicy: Structured Point Cloud Processing for Multi-Modal Imitation Learning [35.5] 現在のクラウドメソッドは、特に複雑なタスクにおいて、きめ細かい詳細を捉えるのに苦労しています。
本稿では,ポイントのグリッド上に拡散ポリシを条件付ける新しいアプローチであるPointMapPolicyを紹介する。
モデルでは,RGBデータとポイントマップを効率的に融合し,マルチモーダル知覚を向上する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:17:01 GMT)
TOMCAT: Test-time Comprehensive Knowledge Accumulation for Compositional Zero-Shot Learning [35.1] 合成ゼロショット学習は,目に見えるものから学習した知識に基づいて,新しい属性オブジェクトの合成を認識することを目的としている。
既存の手法は,テスト時のラベル空間の分布変化による性能劣化に悩まされる。
本稿では,テスト時に多モードプロトタイプを更新するために,テキストと視覚の両方で包括的知識を蓄積する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:20:29 GMT)
Why LVLMs Are More Prone to Hallucinations in Longer Responses: The Role of Context [34.9] LVLM(Large Vision-Language Models)は近年大きな進歩を遂げているが、幻覚の傾向にある。
本稿では, 覚醒の増加は, 長さによる誤差のみに起因するのか, それとも, より根底にあるメカニズムがあるのかを問う。
本稿では,意図的設計による幻覚を積極的に誘発する新しい「インデューサ・ディテクト・プレッション」フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:22:07 GMT)
Distilled Decoding 2: One-step Sampling of Image Auto-regressive Models with Conditional Score Distillation [34.8] Image Auto-Regressive (AR)モデルは、大量のサンプリングステップを必要とするため、生成速度が遅い。
画像ARモデルにおける一段階サンプリングの実現可能性を高めるため,Distilled Decoding 2 (DD2)を提案する。
最も強力なベースラインDD1と比較して、DD2は1ステップのサンプリングとオリジナルのARモデルのギャップを67%減らし、最大12.3$timesのトレーニングスピードアップを実現した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:21:38 GMT)
HauntAttack: When Attack Follows Reasoning as a Shadow [34.7] 本稿では,新規かつ汎用的なブラックボックス攻撃フレームワークHauntAttackを紹介する。
既存の質問における重要な推論条件を有害な指示で修正する。
攻撃成功率の平均は70%であり,最強のベースラインに対して最大12ポイントの絶対的改善を達成できた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:59:35 GMT)
Diagnosing Visual Reasoning: Challenges, Insights, and a Path Forward [34.6] 視覚的およびテキスト的推論を統合するマルチモーダル大言語モデル(MLLM)は、チェーン・オブ・シント(CoT)を活用する
本稿では,3段階評価フレームワークを用いて,最先端の視覚言語モデルの体系的診断を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:10:03 GMT)
Pareto-Optimal Energy Alignment for Designing Nature-Like Antibodies [34.3] 抗体配列構造共設計に特化したディープラーニングモデルを学習するための3段階のフレームワークを提案する。
得られた表現を用いて,抗体の配列と構造の両方に対する共同最適化のための拡散モデルの訓練を指導する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:34:08 GMT)
Fabrication and Structural Analysis of Trilayers for Tantalum Josephson Junctions with Ta$_2$O$_5$ Barriers [34.2] タンタル(Ta)は有望な低損失材料として出現し、超伝導量子ビットにおける記録的コヒーレンス時間を実現している。
酸化アルミニウム(AlO$_x$)は、ほとんどの量子ビットアーキテクチャにおいてジョセフソン接合障壁の主要な選択肢である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:35:14 GMT)
Log Neural Controlled Differential Equations: The Lie Brackets Make a Difference [33.8] ニューラルCDE(英語版)(NCDE)は、時系列データを制御経路からの観測として扱う。
NCDEを学習するための新しい,効果的かつ効率的な手法であるLog-NCDEを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:58:34 GMT)
Count Counts: Motivating Exploration in LLM Reasoning with Count-based Intrinsic Rewards [33.4] MERCI(Motivating Exploration in LLM Reasoning with Count-based Intrinsic Rewards)を導入する。
MERCIは、より豊かで多様な思考の連鎖を促進し、強力なベースラインよりも性能を著しく向上させ、より優れたソリューションを見つけるために、ローカルルーチンから逃れるのに役立ちます。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:29:49 GMT)
RECALL: REpresentation-aligned Catastrophic-forgetting ALLeviation via Hierarchical Model Merging [33.2] 大規模言語モデル(LLM)の内部表現は、学習知識の信頼できるプロキシとして機能する。
本稿では,過去データにアクセスせずに連続的な学習を行うための表現認識モデル統合フレームワークRECALLを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:17:37 GMT)
Mitigating Cross-modal Representation Bias for Multicultural Image-to-Recipe Retrieval [33.2] 画像とレシピ間のモダリティギャップを橋渡しするクロスモーダル表現は、微妙なレシピ特有の詳細を無視する傾向がある。
本稿では,イメージに見過ごされる可能性のある料理の要素を予測する新しい因果的アプローチを提案する。
標準のモノリンガルRecipe1Mデータセットと、新しくキュレートされた多言語多文化料理データセットで実験を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:43:43 GMT)
Unity is Power: Semi-Asynchronous Collaborative Training of Large-Scale Models with Structured Pruning in Resource-Limited Clients [33.0] 本研究では,分散データセット上で大規模モデルを協調的に学習するための,巨大不均一な弱い計算能力の可能性を明らかにする。
本稿では,データ分散を考慮した構造化プルーニングとクロスブロック知識伝達機構を備えた,半非同期協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:00:49 GMT)
Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants [32.7] 本稿では,3段階の能力を含む階層型能力分類法を提案する。
この分類に基づいて、顔と人間のコミュニティで公開されているデータセットから画像とアノテーションを収集します。
新しいベンチマークの問題を発生させるために、セミオートマチックなデータパイプラインを構築します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:25:59 GMT)
Deep Continuous-Time State-Space Models for Marked Event Sequences [32.7] MTPP(Marked temporal point process)は、不規則な時間間隔で発生する事象の時系列をモデル化する。
本稿では,既存のMTPPモデルの限界を克服する新しい性能モデルである状態空間点過程(S2P2)モデルを提案する。
S2P2は8つの実世界のデータセットにまたがる最先端の予測可能性を達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:49:05 GMT)
The Unpaid Toll: Quantifying and Addressing the Public Health Impact of Data Centers [32.7] AIの需要が急増し、エネルギー集約型データセンターが急速に拡大した。
データセンターの環境フットプリントの増加には大きな注意が払われているが、公衆衛生の負担はほとんど見過ごされている。
本稿では,データセンターや計算タスクのライフサイクル汚染物質排出量をモデル化する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:23:59 GMT)
CAR-Flow: Condition-Aware Reparameterization Aligns Source and Target for Better Flow Matching [32.5] 条件生成モデリングは、データ条件ペアを含むサンプルから条件データ分布を学習することを目的としている。
本研究では,フローマッチング(CAR-Flow)のための条件対応リパラメタライゼーションを提案し,モデルの需要を緩和する。
CAR-Flowは、モデルを学習しなければならない確率パスを短縮し、実際により高速なトレーニングを実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:16:25 GMT)
LFD: Layer Fused Decoding to Exploit External Knowledge in Retrieval-Augmented Generation [32.4] Retrieval-augmented Generation (RAG)は、外部知識を大規模言語モデル(LLM)に組み込む。
最近の実証的証拠は、取得した関連文書にノイズを注入することで、外部知識の活用がパラドックス的に促進され、生成品質が向上することを示している。
本稿では,中間層からの表現と最終層からのデコード出力を直接結合する単純なデコード戦略であるLayer Fused Decoding (LFD)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:59:59 GMT)
CUPID: Pose-Grounded Generative 3D Reconstruction from a Single Image [32.4] カメラのポーズ,3次元形状,テクスチャを1枚の2次元画像から推定する。
実験では、3dB以上のPSNRゲインと10%以上のチャンファー距離減少を伴い、3D再構成法を先導するキューピッドのパフォーマンスが実証された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:47:38 GMT)
Small Drafts, Big Verdict: Information-Intensive Visual Reasoning via Speculation [32.3] 我々は、投機的復号化にインスパイアされたトレーニング不要のフレームワーク、Speculative Verdictを提案する。
ドラフト段階では、小さなVLMがドラフトエキスパートとして機能し、多様なローカライゼーション候補を提供する推論パスを生成する。
判定段階では、強いVLMがこれらの経路を合成して最終回答を生成し、正しい回答を回復しながら計算コストを最小化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:21 GMT)
Edit Flows: Flow Matching with Edit Operations [32.3] 自己回帰生成モデルは自然に可変長列を生成する。
非自己回帰モデルは、厳密でトークン的な構造を課すのに苦労する。
これらの制限を克服するために、編集フローを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:08:07 GMT)
Generative Point Tracking with Flow Matching [32.2] マルチモーダルトラジェクトリをモデル化するための生成フレームワークであるGenerative Point Tracker (GenPT)を紹介する。
GenPTは、識別トラッカーの反復的な洗練を組み合わせた、新しいフローマッチングの定式化で訓練されている。
モデルの生成能力をいかに活用して点軌道推定を改善するかを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:25:14 GMT)
LM-mixup: Text Data Augmentation via Language Model based Mixup [32.0] 大規模言語モデル(LLM)の整合化には,インストラクションチューニングが不可欠である
高品質なデータが最重要である一方で、しばしば不足しており、逆に、豊富な低品質のデータはしばしば破棄される。
LM-Mixupは、まずMIXTURE上で教師付き微調整を行い、次に強化学習で最適化する。
我々は、LM-Mixupが不完全なデータセットを効果的に増やすことを実証した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:33:35 GMT)
Can Confidence Estimates Decide When Chain-of-thought is Necessary for Llms? [32.0] CoT(Chain-of- Thought)プロンプトは、大規模言語モデルの推論能力を高めるための一般的な手法として登場した。
本研究は,CoTゲーティングのためのトレーニング不要信頼度推定手法に関する最初の体系的研究である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:33:28 GMT)
Riemannian Flow Matching for Brain Connectivity Matrices via Pullback Geometry [31.8] DiffeoCFMは,行列のプルバック量に対して条件付きフローマッチング(CFM)を実現する手法である。
DiffeoCFM は 4600 以上のデータセットを持つような測定値と等価であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:00:21 GMT)
MoORE: SVD-based Model MoE-ization for Conflict- and Oblivion-Resistant Multi-Task Adaptation [31.6] マルチタスクシナリオにおける大規模な基盤モデルの適用は、多くの場合、タスクの衝突や障害に悩まされる。
本稿では,「モデルMOE-ization」戦略を新たに提案し,コンフリクトとオブリビションに抵抗するマルチタスク適応手法を提案する。
様々なデータセットの実験により、MoOREは既存のマルチタスク適応手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:23:42 GMT)
Large Multimodal Models-Empowered Task-Oriented Autonomous Communications: Design Methodology and Implementation Challenges [31.6] 大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は前例のない突破口となった。
本稿では,LLM/LMMを用いたタスク指向の自律通信について述べる。
提案したLLM/LMM支援自律システムは,従来型および差別型深層学習(DL)モデルに基づく手法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:08:58 GMT)
Analog Quantum Feature Selection with Neutral-Atom Quantum Processors [31.5] 我々は、中性原子配列を用いたアナログ量子シミュレーションに基づく量子特徴選択(QFS)に対する量子ネイティブなアプローチを提案する。
このプロトコルは、アダルト所得、銀行マーケティング、テルコ・チャーンという3つのベンチマークバイナリ分類データセットのシミュレーションによって評価される。
2-5 つの特徴のコンパクトな部分集合では、アナログ QFS は平均 AUC スコアを 1.5-2.3% 改善し、特徴の数を 75-84% 削減した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:57:34 GMT)
Mixture-of-Minds: Multi-Agent Reinforcement Learning for Table Understanding [31.5] テーブル推論を,計画,コーディング,回答の3つの専門的な役割に分解するマルチエージェントフレームワークを提案する。
我々は、Mixture-of-MindsがTableBenchで62.13%、OpenAI-o4-mini-highを上回り、かなりの利益をもたらすことを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:51:17 GMT)
Optimal Dynamic Regret by Transformers for Non-Stationary Reinforcement Learning [31.2] 変圧器は非定常条件下でほぼ最適な動的後悔境界を達成可能であることを示す。
我々は,変圧器が非定常環境の処理に使用される戦略を近似でき,文脈内学習設定で近似器を学習できることを証明した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:29:06 GMT)
Is Safety Standard Same for Everyone? User-Specific Safety Evaluation of Large Language Models [31.2] 大規模言語モデル(LLM)エージェントのユーザ固有の安全性を評価するベンチマークであるU-SafeBenchを紹介する。
LLMを広く利用している20種類のLCMを評価した結果,ユーザ固有の安全基準を考慮すると,現在のLCMは安全に動作しないことがわかった。
本稿では,チェーン・オブ・思想に基づく簡単な治療法を提案し,ユーザ固有の安全性向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:23:30 GMT)
AssistedDS: Benchmarking How External Domain Knowledge Assists LLMs in Automated Data Science [31.1] AssistedDSは、大規模言語モデルがドメイン知識をどのように扱うかを評価するために設計されたベンチマークである。
我々は、最先端のLLMを、有害なドメイン知識を識別し、有効に適用する能力に基づいて評価する。
我々の結果は、専門家の知識を批判的に評価し活用する現在のモデルの能力に、かなりのギャップがあることを示します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:33:18 GMT)
What Does It Take to Build a Performant Selective Classifier? [30.9] ベイズノイズ,近似誤差,ランキング誤差,統計的ノイズ,実装またはシフト誘起スラックについて検討した。
我々は,合成2モードデータと実世界のビジョンと言語ベンチマークを用いて,その分解を検証した。
その結果, (i)ベイズノイズとモデル容量の制限は, 実質的なギャップを考慮し, (ii) よりリッチで特徴を考慮したキャリブレータのみを有意義に改善し, (iii) データシフトは, 分散的に堅牢なトレーニングを必要とするスラックを別々に導入することを確認した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:48:40 GMT)
Inverse Image-Based Rendering for Light Field Generation from Single Images [30.9] 逆画像ベースレンダリングという,単一の画像のみからの光場生成のための新しいビュー合成手法を提案する。
画像ベースのレンダリングとは逆の振る舞いをする画像画素から空間内の光の流れを再構成する。
我々のニューラルは、まず入力画像から光源線の光の流れを記憶し、その後、交叉アテンションを通してそれらの関係を計算する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:12:45 GMT)
A Scalable, Causal, and Energy Efficient Framework for Neural Decoding with Spiking Neural Networks [30.9] Spikachuはスケーラブルで因果的でエネルギー効率のよいSNNベースのニューラルデコーディングフレームワークである。
我々は,ヒト以外の霊長類6種の記録セッション113回に対するアプローチを評価した。
本手法は,2.26から418.81倍のエネルギーで単一セッションでトレーニングした場合,因果ベースラインよりも優れる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:55:45 GMT)
On the Global Optimality of Policy Gradient Methods in General Utility Reinforcement Learning [30.8] 汎用ユーティリティ(RLGU)による強化学習は、標準的な期待したリターンを超えた問題をキャプチャする統一フレームワークを提供する。
標準RL政策勾配法(PG法)の理論的解析の最近の進歩とRLGUにおける最近の取り組みは依然として限られている。
RLGUにおけるPG手法のグローバルな最適性保証を確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:48:45 GMT)
Balanced Token Pruning: Accelerating Vision Language Models Beyond Local Optimization [30.7] LVLM(Large Vision-Language Models)は、イメージを数千のトークンにエンコードすることで、マルチモーダルタスク全体で素晴らしいパフォーマンスを示している。
従来のアプローチでは、トークンのプルーニングによって画像トークンの数を減らそうとしていた。
本稿では,視覚トークンをプルーニングするためのプラグイン・アンド・プレイ方式であるBa balanced Token Pruning (BTP)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:39:42 GMT)
Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning [30.4] 3D屋内シーン合成は、AIとデジタルコンテンツ作成の具体化に不可欠である。
既存のメソッドは、オープン語彙であり、きめ細かいユーザー指示に一致したシーンを生成するのに失敗する。
テキスト記述から数値的な3Dレイアウトを直接生成するフレームワークであるDirectを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:15:56 GMT)
Addressing Corner Cases in Autonomous Driving: A World Model-based Approach with Mixture of Experts and LLMs [30.4] WM-MoEは世界初の世界モデルベースモーション予測フレームワークである。
認識、時間記憶、意思決定を統一し、リスクの高いコーナーケースシナリオの課題に対処する。
WM-MoEは、最先端(SOTA)ベースラインを一貫して上回り、コーナーケースやデータ損失条件下では堅牢である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:41:51 GMT)
Decoding the Ear: A Framework for Objectifying Expressiveness from Human Preference Through Efficient Alignment [30.3] 音声表現性に対する人間の嗜好を客観的なスコアに変換するフレームワークであるDeEARを提案する。
DeEARは500点以下の注釈付きサンプルを用いて、感情、韻律、自発性の3次元にわたる音声を評価する。
S2Sモデル間の表現性ギャップを区別するだけでなく、14Kの表現性発話を選択してExpressiveSpeechを形成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:57:46 GMT)
Empower Words: DualGround for Structured Phrase and Sentence-Level Temporal Grounding [30.2] Video Grounding(VTG)は、時間セグメントを、与えられた自然言語クエリと一致した、長い、トリミングされていないビデオにローカライズすることを目的としている。
既存のアプローチは、すべてのテキストトークンを、異なる意味的役割を無視して、クロスモーダルな注意の中で均一に扱うのが一般的である。
グローバルとローカルのセマンティクスを明確に分離するデュアルブランチアーキテクチャであるDualGroundを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:53:01 GMT)
Less is More: Compact Clue Selection for Efficient Retrieval-Augmented Generation Reasoning [30.2] 現在のRAGレトリバーは主に人間の読者向けに設計されており、完全な、読みやすい、一貫性のある段落を強調している。
既存の方法はしばしば、キー文を識別するために再分類や要約に頼っているが、意味的なブレークと不誠実さに悩まされることがある。
LLM中心RAGアプリケーションのためのコンパクトな手掛かり選択機構であるCompSelectを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:36:01 GMT)
GhostEI-Bench: Do Mobile Agents Resilience to Environmental Injection in Dynamic On-Device Environments? [30.2] VLM(Vision-Language Models)は,モバイルグラフィカルユーザインターフェース(GUI)をナビゲートする自律エージェントとして,ますます普及している。
環境注入は、GUIに直接敵のUI要素を挿入することで、エージェントの視覚的知覚を損なう。
GhostEI-Benchは、動的に実行可能な環境で環境注入攻撃を受けるモバイルエージェントを評価するための最初のベンチマークである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:33:24 GMT)
Zhyper: Factorized Hypernetworks for Conditioned LLM Fine-Tuning [29.9] LLM(Large Language Model)とは、LLMに特定の文化の規範や価値観に従ってコンテンツを生成するよう指示することである。
Zhyperは、コンテキスト認識型LoRAアダプタを生成するパラメータ効率の係数化ハイパーネットワークフレームワークである。
複数のベンチマークの実験では、Zhyperの競合性能は最先端のベースラインよりも最大で26倍も低いことが示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:50:07 GMT)
IRIS: An Immersive Robot Interaction System [29.9] IRISは様々なシミュレーターと実世界のシナリオにまたがる没入型インタラクションとデータ収集をサポートする。
任意の剛性と変形可能なオブジェクト、シミュレーションからのロボットを視覚化し、リアルタイムセンサー生成ポイントクラウドを実世界のアプリケーションに統合する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:59:52 GMT)
Risk-Averse Constrained Reinforcement Learning with Optimized Certainty Equivalents [29.7] 制約付き最適化は強化学習(RL)における競合する目的を扱う共通のフレームワークを提供する
本稿では,最適化された確実性等価量(OCE)を用いて,報酬値と時間とともにステージごとの特性を示すリスク対応制約付きRLの枠組みを提案する。
本フレームワークは,パラメータ化された強ラグランジアン双対性フレームワークにおいて,適切な制約条件下での元の制約問題と正確に一致することを保証している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:33:32 GMT)
Uncertainty as Feature Gaps: Epistemic Uncertainty Quantification of LLMs in Contextual Question-Answering [29.4] 本稿では,与えられたモデルの予測分布と未知の真の分布との相互エントロピーとして定義されたタスクに依存しないトークンレベルの不確実性尺度を提案する。
我々は不確実性の上限を導出し、与えられたモデルの隠された表現において意味的特徴ギャップとして解釈できることを示す。
この一般的なフレームワークを文脈的QAタスクに適用し、文脈信頼、文脈理解、誠実さの3つの特徴がこのギャップを近似していると仮定する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:43:24 GMT)
L^2M^3OF: A Large Language Multimodal Model for Metal-Organic Frameworks [29.4] 魅力的な例は、炭素捕獲や水素貯蔵のような衝撃的な応用のためにMOFのような機能材料を設計することである。
LLMによって解釈される言語ベースの表現において、その広大な複雑なデザイン空間をナビゲートすることは困難である。
L2M3OFは、結晶表現学習と言語理解を統合し、構造、テキスト、知識のモダリティを共同で処理する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:12:46 GMT)
RL Tango: Reinforcing Generator and Verifier Together for Language Reasoning [29.4] Tangoは、LLMジェネレータと検証器の両方を同時にトレーニングするためにReinforcement Learningを使用する、新しいフレームワークである。
Tangoの中心的な革新は、生成プロセスレベルのLCM検証であり、RLを介してトレーニングされ、ジェネレータと共進化する。
実験により,Tangoの2つのコンポーネントが7B/8Bスケールモデルで最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:38:20 GMT)
KL-Regularized Reinforcement Learning is Designed to Mode Collapse [29.2] ここでは,KLの逆方向選択が最適対象分布の族を決定することを示す。
これらの洞察を利用して、単純でスケーラブルで理論的に正当化されたアルゴリズムを構築します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:40 GMT)
Empowering Targeted Neighborhood Search via Hyper Tour for Large-Scale TSP [28.9] トラベルセールスマン問題(TSP)は古典的なNPハード問題であり、学術と産業の両方から大きな注目を集めている。
大規模TSPインスタンスを対象としたHyper Tour Guided Neighborhood Search (HyperNS)法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:30:18 GMT)
Bayes or Heisenberg: Who(se) Rules? [28.9] 量子系は確率的状態ベクトルで表される確率方程式として再構成可能であることを示す。
これらの表現は、順番にBrain(TB)モデルのニューラルネットワークダイナミクスによって近似することができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:22:19 GMT)
The Impact of Negated Text on Hallucination with Large Language Models [28.8] 大規模言語モデルにおける幻覚に関する3つの重要かつ未解決の研究課題を設定した。
否定による文脈変化をLLMが認識できるかどうかを検討し,肯定的な症例に匹敵する幻覚を確実に識別できるかどうかを検討した。
我々の実験は、LLMが否定文の幻覚を効果的に検出するのに苦労していることを示し、論理的に矛盾する判断や不誠実な判断をしばしば生み出すことを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:20:15 GMT)
Learning Contrastive Feature Representations for Facial Action Unit Detection [28.6] 本稿では、自己教師付き信号と教師付き信号の両方を組み込んだAU検出を目的とした、新しいコントラスト学習フレームワークを提案する。
クラス不均衡問題に対処するために、負のサンプル再重み付け戦略を用いる。
雑音や偽AUラベルによる課題に対処するために,3種類の正のサンプル対を含むサンプリング手法を用いる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:40:50 GMT)
Phenome-Wide Multi-Omics Integration Uncovers Distinct Archetypes of Human Aging [28.2] 多様な健康結果と今後の病気リスクを強く予測するマルチオミクスの老化時計を開発し,厳格に検証した。
組換え分子プロファイルのユノタイプクラスタリングにより、老化の異なる生物学的サブタイプが発見された。
これらの知見は、老化の分子的景観を復号化するためのマルチオミクス統合の力を示し、高齢化防止のためのパーソナライズされたヘルススパンモニタリングと精密化戦略の基礎を築いた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:18:20 GMT)
DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning [28.0] DAIL(Distributional Aligned Learning)には,分散ポリシとセマンティックアライメントという2つの重要な要素がある。
DAILは命令のあいまいさを効果的に解決し,ベースライン手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:21:35 GMT)
Distilled Decoding 1: One-step Sampling of Image Auto-regressive Models with Flow Matching [27.8] 自動回帰(AR)モデルは、テキストと画像生成において最先端のパフォーマンスを達成したが、トークン・バイ・トークン・プロセスにより、遅い生成に悩まされている。
トレーニング済みのARモデルは、1、2ステップでアウトプットを生成することができるのか?
本研究では,ガウス分布から事前学習されたARモデルの出力分布への決定論的マッピングを生成するために,フローマッチングを用いたDD(Distilled Decoding)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:27:25 GMT)
Hierarchical Sequence Iteration for Heterogeneous Question Answering [27.2] 本稿では,文書,表,知識グラフを可逆的階層列に線形化する統一フレームワークであるHSEQを紹介する。
HotpotQA(テキスト)、HybridQA/TAT-QA(テーブル+テキスト)、MetaQA(KG)の実験では、強いシングルパス、マルチホップ、エージェントRAGベースラインを高い効率で一貫したEM/F1が得られた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:48:18 GMT)
KOALA++: Efficient Kalman-Based Optimization of Neural Networks with Gradient-Covariance Products [27.0] KOALA++は、ニューラルネットワークトレーニングのためのスケーラブルなKalmanベースの最適化アルゴリズムである。
ニューラルネットワークトレーニングにおける構造的不確実性を明示的にモデル化する。
最先端の1次法よりも精度が高い。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:24:41 GMT)
Conformal Prediction for Time-series Forecasting with Change Points [26.9] 本稿では,変化点を持つ時系列のコンフォーマル予測法を提案する。
我々はCPTCの妥当性を証明し、最小限の仮定で時系列設定における適応性を向上させる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:33:29 GMT)
One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling [26.9] クープマン蒸留モデル(Koopman Distillation Model, KDM)は, クープマン理論に基づく新しいオフライン蒸留手法である。
KDMは、学習された線形作用素がそれらを前方に伝播する埋め込み空間にノイズのある入力を符号化し、続いてクリーンなサンプルを再構成するデコーダを符号化する。
KDMは標準のオフライン蒸留ベンチマークで高い競争力を発揮する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:57 GMT)
Relative-Based Scaling Law for Neural Language Models [26.9] スケーリング法則は、異なるスケールでモデルパフォーマンスを正確に予測することを目的としている。
既存のスケーリング法則の研究はほとんど、評価指標としてクロスエントロピーに依存している。
本稿では,RBPのモデルサイズの増加に伴う改善を特徴付ける相対的スケーリング法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:37:00 GMT)
CipherGuard: Compiler-aided Mitigation against Ciphertext Side-channel Attacks [26.8] CipherGuardは、高い効率とセキュリティ保証で暗号文のサイドチャネルに対処するコンパイラベースの緩和ツールである。
最も効率的な戦略では、CipherGuardは平均性能オーバーヘッドが1.41倍、最大性能が1.95倍である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:20:53 GMT)
SPAN: Continuous Modeling of Suspicion Progression for Temporal Intention Localization [26.8] 本稿では,個別分類から連続回帰へ移行するSuspicion Progression Analysis Network (SPAN)を提案する。
SPANは低周波のケースでは2.74%のmAPゲインを達成し、微妙な行動変化を捉える優れた能力を示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:20:07 GMT)
BoundRL: Efficient Structured Text Segmentation through Reinforced Boundary Generation [26.8] BoundRLは長い構造化テキストに対してトークンレベルのテキストセグメンテーションとラベル予測を行う。
セグメントごとに完全なコンテンツを生成する代わりに、開始トークンのシーケンスだけを生成する。
オリジナルテキスト内にこれらのトークンを配置することで、完全な内容を再構築する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:56:10 GMT)
Dino-Diffusion Modular Designs Bridge the Cross-Domain Gap in Autonomous Parking [26.7] ディノ・ディフュージョン・パーキング(Dino-Diffusion Parking、DDP)は、ドメインに依存しない自動駐車パイプラインである。
私たちは、通常の設定でCARLAでパイプラインをトレーニングし、ゼロショット方式でより敵対的な設定に転送します。
本モデルでは,全テストアウト・オブ・ディストリビューション(OOD)シナリオにおいて,駐車成功率を90%以上達成している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:35:50 GMT)
Sign-In to the Lottery: Reparameterizing Sparse Training From Scratch [26.6] スクラッチ(PaI)からのスパースニューラルネットワークのトレーニングと密度とスパーストレーニングの間のパフォーマンスギャップは、効率的なディープラーニングのための主要な障害となる。
本稿では,符号フリップを確実に誘導する動的reパラメタライゼーションを用いたSign-Inを提案する。
このようなサインフリップは、厳密でスパースなトレーニングが達成できるものと相補的なものです。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:21:43 GMT)
Deep Learning in Dental Image Analysis: A Systematic Review of Datasets, Methodologies, and Emerging Challenges [26.4] 自動歯科画像解析(DIA)における深層学習(DL)の260研究を体系的にレビューする。
DLは、その優れた特徴抽出と表現能力により、最も広く適用され、影響力のあるアプローチである。
本稿では,DLの基本技術について述べるとともに,異なるDIAタスクに応じて関連するモデルとアルゴリズムを分類する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:05:06 GMT)
Embodied Agents Meet Personalization: Investigating Challenges and Solutions Through the Lens of Memory Utilization [26.3] LLMを動力とするエンボディエージェントは、従来のオブジェクト配置タスクで成功している。
しかし、過去のインタラクションからユーザ固有の知識を活用するパーソナライズされた支援を提供することで、新たな課題が浮かび上がっている。
エージェントのメモリ利用のレンズを通してこれらの課題を考察する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:57:38 GMT)
floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL [26.3] floqは、速度場を用いてQ関数をパラメータ化し、フローマッチングの技法を用いてそれを訓練するアプローチである。
Floqは、オフラインのRLベンチマークとオンラインの微調整タスクで、パフォーマンスを1.8倍近く改善している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:41:11 GMT)
Tri-Modal Severity Fused Diagnosis across Depression and Post-traumatic Stress Disorders [26.2] 外傷性ストレス障害(PTSD)は、しばしば関連症状と併存し、自動評価を複雑にする。
統合された三モーダル感情重大度フレームワークは,インタビューテキストと文レベルのトランスフォーマーの埋め込み,ログによる音声,デルタによるメル統計,アクションユニットによる顔信号,視線,頭,ポーズ記述子とを同期させる。
標準化された特徴は、キャリブレーションされた後期融合分類器を介して融合し、障害確率と特徴レベルの属性を出力する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:46:38 GMT)
TianHui: A Domain-Specific Large Language Model for Diverse Traditional Chinese Medicine Scenarios [26.1] 本研究は、文脈データ統合とドメイン知識融合によって構築された特殊TCM LLMであるTianHuiについて述べる。
大規模TCMコーパス(0.97GBの教師なしデータ+611,312のQAペア)を構築し、QRA、DeepSpeed Stage 2、Flash Attention 2による2段階トレーニング戦略を採用した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:29:28 GMT)
Understanding Adam Requires Better Rotation Dependent Assumptions [26.0] グラディエント・Descent (SGD) に対するアダムの優位性は、包括的な理論的な説明を欠いている。
本稿では,パラメータ空間の回転に対するアダムの感度について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:18:10 GMT)
Equivariance Everywhere All At Once: A Recipe for Graph Foundation Models [25.9] ノードレベルのタスクのためのグラフ基盤モデルを第一原理から設計するためのレシピを提案する。
本研究の基盤となる重要な要素は,グラフ基盤モデルが尊重すべき対称性を体系的に調査することである。
我々は29の実世界のノード分類データセットに関する広範な実験を通して、我々のアプローチを検証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:33:19 GMT)
FreeGraftor: Training-Free Cross-Image Feature Grafting for Subject-Driven Text-to-Image Generation [25.9] FreeGraftorは、クロスイメージ機能移植による制限に対処する、トレーニング不要のフレームワークである。
本フレームワークは,マルチオブジェクト生成にシームレスに拡張可能であり,実世界の展開に有効である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:11:42 GMT)
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration [25.7] 正書法統一とLAMA-UT(Language-Agnostic Multilingual ASR Pipeline)による言語に依存しないASRパイプラインを提案する。
LAMA-UTは、最小限のデータ量でトレーニングされた最先端モデルのパフォーマンスに適合しながら、言語固有のモジュールなしで動作します。
パイプラインはWhisperと比較して45%の相対誤差低減率を実現し,MMSと相容れない性能を示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:30:40 GMT)
Kinaema: a recurrent sequence model for memory and pose in motion [25.7] 我々は,潜在的に大きなシーンで移動しながら,視覚的観察の流れを統合できる新しいモデルであるキナマとエージェントを導入する。
我々のモデルは観測履歴を明示的に保存しないので、文脈長に厳しい制約はない。
我々の大容量リカレントモデルでは、シーンの有用な表現を維持し、実際のエピソード開始前に観測されたゴールにナビゲートし、計算効率がよいことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:34:53 GMT)
AgentArcEval: An Architecture Evaluation Method for Foundation Model based Agents [25.5] 本稿では,FMベースのエージェントアーキテクチャの複雑さに対処するために特別に設計されたエージェントアーキテクチャ評価手法であるAgentArcEvalを提案する。
エージェント固有の汎用シナリオのカタログも提示し、エージェントアーキテクチャの設計と評価のための具体的なシナリオを生成するためのガイドとして機能する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:32:03 GMT)
Multi-Objective Reinforcement Learning with Max-Min Criterion: A Game-Theoretic Approach [25.5] 最大最小多目的強化学習を2プレイヤーゼロサム正規化連続ゲームとして再構成する。
当社のアプローチは,グローバルな最終段階の収束を確保しつつ,政策更新を簡素化する。
深層強化学習の実装は,多くのMORL環境において,従来のベースラインよりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:39:26 GMT)
The Reasoning Lingua Franca: A Double-Edged Sword for Multilingual AI [25.4] 大規模推論モデル(LRM)は、数学的、科学的、その他の質問応答タスクにおいて強い性能を発揮する。
英語以外の質問が提示されると、LRMは英語の推論をデフォルトとし、解釈可能性や言語的・文化的ニュアンスの扱いに関する懸念を提起する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:22:00 GMT)
NPN: Non-Linear Projections of the Null-Space for Imaging Inverse Problems [25.4] ヌル空間の非線形射影(Non-linear Projections of the Null-Space、NPN)は、正規化の新しいクラスである。
NPNは、ニューラルネットワークによる知覚行列のヌル空間の低次元射影にある解を促進する。
プラグアンドプレイ法におけるコンバージェンスとリコンストラクションの精度を理論的に保証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:21:06 GMT)
Strategic Costs of Perceived Bias in Fair Selection [25.2] メリトクラテスの制度は、技術と努力を公平に報酬することを目的としている。
人種、性別、階級の相違は この理想に挑戦します
我々は,異なる社会経済集団の候補者が選択後の知覚値が異なるゲーム理論モデルを構築した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:38:05 GMT)
DexCanvas: Bridging Human Demonstrations and Robot Learning for Dexterous Manipulation [25.2] このデータセットには、実際の人間の実演から70時間シードされた7000時間に及ぶ手-物体の相互作用が含まれている。
各エントリは、同期されたマルチビューRGB-D、MANOハンドパラメータによる高精度モキャップ、物理的に一貫した力プロファイルによるフレーム単位の接触点を組み合わせる。
私たちのリアル・トゥ・シムパイプラインは、物理シミュレーションにおいてアクティベートされたMANOハンドを制御するポリシーをトレーニングするために強化学習を使用します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:18:34 GMT)
Causal Debiasing for Visual Commonsense Reasoning [25.0] 2つのモードにわたるモデルの一般化能力を評価するために設計されたVCR-OODデータセットを紹介する。
VCRの因果グラフと予測ショートカットを分析し、バイアスを取り除くためにバックドア調整法を採用する。
実験は、異なるデータセット間でのデバイアス法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:10:21 GMT)
Spiking Neural Networks Need High Frequency Information [24.6] スパイキングニューラルネットワークは、バイナリ(0/1)スパイクを通じて情報を伝達することで、脳にインスパイアされた計算を約束する。
しかし、それらの性能は、しばしば情報損失によって引き起こされると仮定される、人工知能ニューラルネットワークよりもまだ遅れている。
スパイキングニューロンは本質的に高周波成分を抑制し,低周波情報を優先的に伝播することを示す。
2つの周波数エンハンシング演算子を通して高周波信号を復元するMax-Formerを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:07:00 GMT)
ADP-VRSGP: Decentralized Learning with Adaptive Differential Privacy via Variance-Reduced Stochastic Gradient Push [24.6] 本稿では分散誘導勾配プッシュによる適応微分プライバシーを用いた分散学習という新しい手法を提案する。
この方法は、段階的に遅延するスケジュールを用いて、ノイズ分散と学習率の両方を動的に調整する。
ADP-VRSGPは、適切な学習速度で堅牢な収束を実現し、トレーニングの安定性と速度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:14:59 GMT)
From Information to Generative Exponent: Learning Rate Induces Phase Transitions in SGD [24.6] 本稿では,幅広い勾配に基づくアルゴリズムの学習率とサンプルの複雑性の関係を特徴付ける。
学習率の低い「情報指数系」から、学習率の大きい「生成指数系」に相転移があることを実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:03:53 GMT)
Incentivizing Consistent, Effective and Scalable Reasoning Capability in Audio LLMs via Reasoning Process Rewards [24.4] 音声大言語モデルにおけるロバストでスケーラブルな推論法を開発するための原理的手法を開発した。
MMAU 2.5 Pro と GPT-4o Audio をほぼ上回り、MMSU の推論タスクにおけるほぼ人間レベルの性能を向上する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:18:10 GMT)
DMSC: Dynamic Multi-Scale Coordination Framework for Time Series Forecasting [24.2] 時系列予測(TSF)は、さまざまなスケールにわたる複雑な時間的依存関係をモデル化する上で、永続的な課題に直面します。
マルチスケールパッチ分解ブロック(EMPD)、トライアドインタラクションブロック(TIB)、適応スケールルーティングMoEブロック(ASR-MoE)を備えた新しい動的マルチスケールコーディネーションフレームワーク(DMSC)を提案する。
EMPDは、指数関数的にスケールした粒度を持つ階層的なパッチにシーケンスを動的に分割する組み込みコンポーネントとして設計されている。
TIBは、各レイヤの分解された表現の中で、パッチ内、パッチ間、およびクロス変数の依存関係を共同でモデル化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:57:50 GMT)
ARC-Encoder: learning compressed text representations for large language models [24.1] ARC-Encoderはコンテキストを連続表現に圧縮するエンコーダである。
ARC-Encoderは,いくつかのベンチマークで最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:20:57 GMT)
SheafAlign: A Sheaf-theoretic Framework for Decentralized Multimodal Alignment [24.0] SheafAlignは分散マルチモーダルアライメントのための層理論フレームワークである。
SheafAlignは、すべてのモダリティ間で相互冗長性を必要としないことで、以前のメソッドの制限を克服する。
マルチモーダルセンシングデータセットの実験は、ゼロショット一般化、クロスモーダルアライメント、および欠落モーダル性に対するロバスト性を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:27:24 GMT)
CodeFuse-CR-Bench: A Comprehensiveness-aware Benchmark for End-to-End Code Review Evaluation in Python Projects [24.0] CodeFuse-CR-Benchは、リポジトリレベルのCR評価のための、最初の包括性対応ベンチマークである。
CodeFuse-CR-Benchは、9つのプルリクエスト(PR)問題ドメインをカバーする70のPythonプロジェクトから601の高品質なインスタンスで構成されている。
本稿では,この包括的CR課題に対して,最先端の大規模言語モデル(LLM)の大規模評価を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:44:56 GMT)
TernaryCLIP: Efficiently Compressing Vision-Language Models with Ternary Weights and Distilled Knowledge [23.7] TernaryCLIPは、CLIPの視覚とテキストエンコーダの接続重みを3次フォーマットに変換する軽量フレームワークである。
本研究は,大規模マルチモーダルモデルの極端量子化の実現可能性を強調し,資源制約されたデバイスへの効果的かつ効率的な展開を支援する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:53:32 GMT)
Harnessing Feature Resonance under Arbitrary Target Alignment for Out-of-Distribution Node Detection [23.7] 共振型分離学習(RSL)と呼ばれるグラフOODフレームワークを開発した。
RSLは、2つのコアモジュールから構成される: (i) 1つのトレーニングステップにおける特徴ベクトルの移動を測定する、より実用的な機能共鳴のマイクロレベルプロキシ。
共振周期におけるOODノードの分離性に優れる誤差を導出する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:46:21 GMT)
SAID: Empowering Large Language Models with Self-Activating Internal Defense [23.7] 我々は,新たな非訓練型防衛パラダイム,自走型内国防衛(SAID)を導入する。
SAIDは、防衛タスクを外部修正から内部機能アクティベーションにリフレームする。
それは、有害な出力を減らすために最先端の防御を著しく上回っている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:07:54 GMT)
Stress-Testing Model Specs Reveals Character Differences among Language Models [23.5] 大規模言語モデル(LLM)は、AI構成とモデル仕様からますます訓練されている。
本稿では,ストレステストモデルキャラクタ仕様の体系的手法を提案する。
我々は、現在のモデル仕様における矛盾と解釈の曖昧さの多くの事例を同定する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:31:33 GMT)
Unveiling non-Hermitian band structures with non-Bloch supercells [23.5] 非エルミート系は、エネルギーと運動量の両方が虚部を持つ複素バンド構造を示す。
我々は,ブロッホ位相制御を運動量の想像的部分から切り離すことにより,この課題を克服するために設計された非ブロッホ超セルフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:18:23 GMT)
Geometry Aware Operator Transformer as an Efficient and Accurate Neural Surrogate for PDEs on Arbitrary Domains [23.1] 任意の領域上のPDEを学習するための幾何認識演算子変換器(GAOT)を提案する。
GAOTは、新しいマルチスケールの注目グラフニューラル演算子エンコーダとデコーダを、幾何学的な埋め込みと(ビジョン)トランスフォーマープロセッサと組み合わせている。
多様なPDEから多くの学習課題を学習する上で,GAOTの精度と効率の両面で有意な向上を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:19:20 GMT)
No-Regret Thompson Sampling for Finite-Horizon Markov Decision Processes with Gaussian Processes [23.1] トンプソンサンプリング(TS)はシーケンシャルな意思決定のための強力な戦略である。
その成功にもかかわらず、TSの理論的基礎は、特に強化学習(RL)のような複雑な時間構造を持つ環境では限られている。
この研究は、RLにおけるTSの理解を前進させ、有限水平マルコフ決定過程における構造的仮定とモデル不確実性がどのようにその性能を形作るかを強調する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:44:31 GMT)
EA4LLM: A Gradient-Free Approach to Large Language Model Optimization via Evolutionary Algorithms [23.0] 大規模言語モデル(LLM)を最適化する進化的アルゴリズムEA4LLMを提案する。
我々は、0.5Bから32Bまでのモデルサイズにわたる事前学習段階から完全なパラメータ最適化を実証的に検証した。
我々の研究は、勾配に基づく最適化がニューラルネットワークをトレーニングするための唯一実行可能なアプローチであるという一般的な仮定に挑戦している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:20:30 GMT)
Aircraft Collision Avoidance Systems: Technological Challenges and Solutions on the Path to Regulatory Acceptance [23.0] 航空機の衝突回避システムは現代の航空にとって重要なものである。
これらのシステムは航空機間の潜在的な衝突を予測し、適切な回避行動を推奨するように設計されている。
衝突回避問題によって引き起こされる課題は、しばしば他の領域に存在している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:13:22 GMT)
Not All Heads Matter: A Head-Level KV Cache Compression Method with Integrated Retrieval and Reasoning [22.8] キーバリューキャッシング(キーバリューキャッシング、英: Key-Value cache)は、大規模言語モデル(LLM)の計算効率を高めるための一般的な手法である。
本稿では,新たな文脈推論能力推定手法であるヘッドKVとヘッドKV-R2を提案する。
本手法は,文脈質問応答ベンチマークにおいて,全KVキャッシュの性能の97%を達成しつつ,KVキャッシュの1.5%しか保持しない。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:47:24 GMT)
Frequency-Dynamic Attention Modulation for Dense Prediction [22.7] 我々は、周波数ダイナミックアテンション変調(FDAM)と呼ばれる回路理論にインスパイアされた戦略を提案する。
FDAMは視覚変換器(ViT)の総周波数応答を直接調節する
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:06:56 GMT)
DesignX: Human-Competitive Algorithm Designer for Black-Box Optimization [22.6] 提案するTextitDesignXは,与えられたブラックボックス最適化問題に対して,数秒以内で効果的な特定性を生成する,最初の自動アルゴリズム設計フレームワークである。
本稿では,新しい協調学習目標を通じて,構造設計とパラメトリック設計を協調的に行う二重エージェント強化学習システムを提案する。
注目すべきは、自律的な学習の日々を通じて、DesignX生成物は人間の自明物を桁違いに上回っていることだ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:33:30 GMT)
High-order Interactions Modeling for Interpretable Multi-Agent Q-Learning [22.4] 高次相互作用をモデル化するためのこれまでの努力は、強化爆発やブラックボックスネットワーク構造の不透明な性質によって妨げられている。
本稿では、任意の順序のエージェント相互作用を柔軟にキャプチャできる、Continued Fraction Q-Learning(QCoFr)と呼ばれる新しい値分解フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:08:32 GMT)
Towards Robust Zero-Shot Reinforcement Learning [22.3] ゼロショット強化学習(英語版) (RL) の最近の発展は、ゼロショット方式で任意の新しいタスクに適応できる事前訓練されたジェネリストポリシーを学習するための新たな道を開いた。
一般的なフォワード・バックワード表現(FB)および関連する手法はゼロショットRLにおいて有望であることを示しているが、それらのモデリングには表現性が欠如しており、外挿誤差が準最適性能を引き起こしていることを実証的に見出した。
本稿では、学習安定性、ポリシー抽出能力、表現学習品質を同時に向上するFBベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:54:17 GMT)
Multi Task Inverse Reinforcement Learning for Common Sense Reward [22.0] エージェントの訓練に成功しても、逆強化学習は有用な報酬関数を学習しないことを示す。
すなわち、学習した報酬で新しいエージェントを訓練しても、望ましい振る舞いを損なうことはない。
すなわち、多タスク逆強化学習を応用して、有用な報酬関数を学習することができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:57:44 GMT)
MoMoE: Mixture of Moderation Experts Framework for AI-Assisted Online Governance [21.8] Mixture of Moderation Experts (MoMoE)は、スケーラブルなコンテンツモデレーションにポストホックな説明を追加するモジュラーフレームワークである。
MoMoEは、Allocate、Predict、Aggregate、Explainという4つのオペレーターを編成し、コミュニティの専門家7人と規範違反の専門家5人としてインスタンス化されている。
30個の目に見えないサブレディットでは、最良の変種がそれぞれ0.72と0.67のMicro-F1スコアを得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:05:56 GMT)
MIR-Bench: Can Your LLM Recognize Complicated Patterns via Many-Shot In-Context Reasoning? [21.6] 我々は、パターン認識のための最初のマルチショットインコンテキスト推論ベンチマークであるMIR-Benchを提案する。
テキスト内推論における多くの新しい問題について検討し,多くの知見を得た。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:48:25 GMT)
Quantifying Distributional Invariance in Causal Subgraph for IRM-Free Graph Generalization [21.6] 我々は、因果部分グラフをキャプチャするためのIRMフリーな手法を開発した。
まず、因果部分グラフは非因果成分よりも分布のばらつきがかなり小さいと同定した。
本手法はグラフ一般化における最先端手法を一貫して上回る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:34:50 GMT)
GUSL-Dehaze: A Green U-Shaped Learning Approach to Image Dehazing [21.5] イメージデハジング(Image Dehazing)は、一点のぼやけた入力から明確なイメージを復元することを目的とした復元作業である。
GUSL-DehazeはグリーンなU字型学習手法である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:46:22 GMT)
Making Classic GNNs Strong Baselines Across Varying Homophily: A Smoothness-Generalization Perspective [21.4] グラフニューラルネットワーク(GNN)は大きな成功を収めてきたが、グラフ内の様々なレベルのホモフィリにより、しばしば挑戦される。
近年の実証研究により、ホモフィリックGNNは異なるホモフィリレベルのデータセット間でよく機能することが示された。
Inceptive Graph Neural Network (IGNN) は3つのシンプルで効果的な設計原理に基づいて構築されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:26:11 GMT)
CALM-PDE: Continuous and Adaptive Convolutions for Latent Space Modeling of Time-dependent PDEs [21.3] CALM-PDEは圧縮潜在空間における任意の離散化PDEを効率的に解くモデルクラスである。
我々は,エプシロン近傍に制約のあるカーネルを用いた,新しい連続畳み込み型エンコーダデコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:43:38 GMT)
Spatial-DISE: A Unified Benchmark for Evaluating Spatial Reasoning in Vision-Language Models [21.3] 我々は,タスクを4つの基本四分節に分類する認知的基盤の分類に基づく統合ベンチマークtextbfSpatial-DISEを提案する。
データ不足の問題に対処するため,多様かつ検証可能な空間的推論問題を生成するスケーラブルで自動化されたパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:31:13 GMT)
Reasoning's Razor: Reasoning Improves Accuracy but Can Hurt Recall at Critical Operating Points in Safety and Hallucination Detection [21.2] 推論は大規模言語モデル(LLM)の中心パラダイムとなっている。
厳密な低偽陽性率体制下での分類タスクの推論に関する最初の体系的研究について述べる。
思考(推論強化)生成は全体的な精度を向上するが、実用に不可欠な低FPRしきい値では性能が低下する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:23:36 GMT)
Replacing Softmax Similarity with a Sharpened Angular Similarity: Theory and Practice of Scaling To Billion-Context Attention [21.0] 我々は、Softmax Attentionの代替として、カーネルにインスパイアされたRSE Attentionを紹介する。
RACE アテンションは指数核を改良した角状(コサイン)類似性に置き換える。
制御されたスケールテストでは、NVIDIA GH200 GPU上で1回の前方通過中に最大1200万のトークンを処理する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:09:14 GMT)
MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation [21.0] 大規模事前学習は、他の領域におけるデータの不足に対処するのに有効であることが証明されている。
質量スペクトルと分子構造を共有トークン語彙にマッピングする統合モデリングフレームワークMS-BARTを提案する。
大規模な評価では、MS-BARTはMassSpecGymとNPLIB1の5/12キーメトリクスでSOTA性能を達成している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:45:28 GMT)
Diffusion-Based Hierarchical Graph Neural Networks for Simulating Nonlinear Solid Mechanics [21.0] Rolling Diffusion-Batched Inference Network (ROBIN)は、2つの重要なイノベーションを統合する新しい学習シミュレータである。
ROBINは、ビーム曲げや多体接触のような現象に不可欠な微細な局所力学と大域的な構造効果の両方を捉えている。
幾何学的, 材料的, 接触非線形性を含む2次元および3次元固体力学ベンチマークにおいて, ROBINを検証した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:14:11 GMT)
Video-As-Prompt: Unified Semantic Control for Video Generation [20.8] 本稿では,ビデオ・アズ・プロンプト(VAP)を紹介した。
VAPは参照ビデオを直接的なセマンティックプロンプトとして利用し、プラグアンドプレイのMixture-of-Transformers (MoT)エキスパートを通じて凍結されたビデオ拡散トランスフォーマー(DiT)を誘導する。
このアプローチを推進し,今後の研究を促進するために,100万以上のペアビデオを備えたセマンティックコントロールビデオ生成のための最大のデータセットであるVAP-Dataを構築した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:52 GMT)
Your Pre-trained LLM is Secretly an Unsupervised Confidence Calibrator [20.8] ポストトレーニングされた言語モデル(PoLM)は、しばしば過剰な自信に悩まされ、正しい出力と間違った出力の両方に高い信頼を割り当てる。
PoLMの校正における大きな障害は、個々の下流タスクのためのラベル付きデータの不足である。
本稿では,時間後信頼度校正におけるパラメータを最適化するために,DACA(Disagreement-Aware Confidence Alignment)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:53:37 GMT)
LLM-Integrated Bayesian State Space Models for Multimodal Time-Series Forecasting [20.7] 本稿では,マルチモーダル時間予測のための新しいフレームワークであるベイズ状態空間モデル(LBS)を紹介する。
1)状態空間モデル(SSM)バックボーンは、数値とテキストの両方の観測が生成される潜時状態の時間的ダイナミクスをキャプチャする。
TextTimeCorpusベンチマークの実験では、LBSは過去の最先端を13.20%改善し、予測の可読な要約を提供している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:28:26 GMT)
Addressing Pitfalls in the Evaluation of Uncertainty Estimation Methods for Natural Language Generation [20.7] 幻覚は、大きな言語モデル(LLM)の信頼性を損なう一般的な問題である。
近年の研究では、LLMの予測的不確実性によって生じる幻覚のサブセット、すなわち confabulations が特定されている。
衝突を検出するため,自然言語生成における予測不確かさを推定する様々な手法が開発されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:55:17 GMT)
xRFM: Accurate, scalable, and interpretable feature learning models for tabular data [20.6] 本研究では,特徴学習カーネルマシンを木構造と組み合わせ,データの局所構造に適応させるアルゴリズムであるxRFMを紹介する。
我々は、xRFMが100ドルの回帰データセットで最高のパフォーマンスを達成し、200ドルの分類データセットで最高のメソッドと競合することを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:47:49 GMT)
Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems [20.6] DeRecGNNは、Microsoftにおけるクラウドサービス監視のための注目度の高いエンティティレコメンデーションフレームワークである。
当社は、クラウドサービス所有者が認識しているこの機能の有用性と、デプロイメントから学んだ教訓について、洞察を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:14:09 GMT)
OpenWorldSAM: Extending SAM2 for Universal Image Segmentation with Language Prompts [20.3] OpenWorldSAMは,Segment Anything Model v2 (SAM2) をオープン語彙シナリオに拡張するフレームワークである。
OpenWorldSAMは、カテゴリレベルの言語記述や文レベルの言語記述など、さまざまなプロンプトをサポートしている。
我々は,新しい位置決め型タイブレーカー埋め込みとクロスアテンション層により,モデルの空間的理解を高める。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:00:20 GMT)
Asymptotically exact variational flows via involutive MCMC kernels [20.3] 本稿では、任意の状態空間上で、チューニング不要で、表現的に正確な変動フローを構築するための一般的なレシピを提案する。
コア・メソジカル・コンポーネントは、一般のインボリューティブMCMCカーネルを可逆的に表現する新しい方法である。
我々の枠組みは、同様の保証で既存の変動家族の重要な実用的限界を解決している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:27:17 GMT)
Deep Learning-Powered Electrical Brain Signals Analysis: Advancing Neurological Diagnostics [20.1] 神経障害は、脳信号解析の進歩を推進し、世界的な健康問題を引き起こす。
脳波と頭蓋内脳波(iEEG)は診断とモニタリングに広く用いられている。
本稿では、脳波/iEEGに基づく神経学的診断におけるディープラーニングアプローチの最近の進歩を体系的に検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:25:03 GMT)
Annotation Guidelines-Based Knowledge Augmentation: Towards Enhancing Large Language Models for Educational Text Classification [20.1] 大規模言語モデル(LLM)を改善するためのガイドラインベース知識拡張(AGKA)アプローチを提案する。
AGKAはGPT 4.0を使用して、アノテーションガイドラインからラベル定義の知識を取得し、ランダムアンダーサンプラーを適用していくつかの典型的な例を選択する。
実験の結果、AGKAは非微調整LDM(特にGPT 4.0とLlama 3 70B)を増強できることが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:18:11 GMT)
Memory Constrained Dynamic Subnetwork Update for Transfer Learning [20.1] MeDyateは、メモリ制限された動的サブネットワーク適応のための理論的基盤となるフレームワークである。
MeDyateは、極端なメモリ制約の下で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:16:43 GMT)
Blending Complementary Memory Systems in Hybrid Quadratic-Linear Transformers [20.1] 汎用シーケンス処理ニューラルネットワークのためのハイブリッドメモリアーキテクチャを開発した。
ソフトマックスアテンション(KVメモリ)と動的シナプス変調(FWメモリ)による高速重み付けメモリを併用する。
我々は、よく設計されたハイブリッドが、個々のコンポーネントの制限を克服できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:40:38 GMT)
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG [20.0] Retrieval-Augmented Generation (RAG) は、生成中に関連する外部文書を活用することにより、Large Language Model (LLM) 応答の精度を高める。
マルチホップQAタスクから派生したカスタムデータセットの様々な言語モデルを評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:06:07 GMT)
S-DAT: A Multilingual, GenAI-Driven Framework for Automated Divergent Thinking Assessment [19.9] 本稿では、分散思考の自動評価のためのスケーラブルな多言語フレームワークであるS-DAT(Synthetic-Divergent Association Task)を紹介する。
我々は、英語、スペイン語、ドイツ語、ロシア語、ヒンディー語、日本語(漢字、平仮名、カタカナ)を含む11言語にわたるS-DATを評価する。
従来の DAT アプローチとは異なり、S-DAT は他の DT 測度と収束妥当性を示し、収束思考と正判別妥当性を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:06:51 GMT)
Assessing the Political Fairness of Multilingual LLMs: A Case Study based on a 21-way Multiparallel EuroParl Dataset [19.8] この研究は、EPの議会手続きであるEuroParlの新しい21ウェイマルチパラレルバージョンによって実現されている。
データセットは、合計で4000万語、249万文字の150万文で構成されている。
3年間、1000人以上の講演者、7カ国、12のEU加盟国、25のEU委員会、数百の国民政党をカバーしている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:50:30 GMT)
FlexLLM: Token-Level Co-Serving of LLM Inference and Finetuning with SLO Guarantees [19.6] タスク適応には、大規模な言語モデル(LLM)の微調整が不可欠だが、今日のサービススタックは、推論と個別のGPUクラスタ上での微調整を分離している。
本稿では,LLM推論とPEFTに基づく共通GPUのファインタニングをトークンレベルで融合した最初のシステムであるFlexLLMを紹介する。
実行時に、新しいトークンレベルの微調整機構がハイブリッドトークンスケジューラと組み合わせて、共用イテレーション毎に推論とトレーニングトークンを動的にインターリーブする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:07:13 GMT)
Global Minimizers of $\ell^p$-Regularized Objectives Yield the Sparsest ReLU Neural Networks [19.5] 我々は,大域的最小値が最短の単一隠れニューロンLUネットワークに対応することが保証される,連続的かつほぼ全ての学習目標を提案する。
我々の一般化の下では、大域最小化器はスパース・ネットワーク・スト・ソリューションと正確に一致することを証明している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:46:47 GMT)
Toward Metaphor-Fluid Conversation Design for Voice User Interfaces [19.5] メタファーはVUI(Voice User Interfaces)でユーザエクスペリエンスを形成する上で重要な役割を果たす
既存のデザインはしばしば、さまざまなコンテキストやユーザニーズに適応できない静的な人中心のメタファに依存します。
本稿ではメタファー・フロード・デザインについて紹介する。メタファー・フルド・デザインは,会話の文脈に基づくメタファー表現を動的に調整する手法である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:33:08 GMT)
Extracting Interpretable Models from Tree Ensembles: Computational and Statistical Perspectives [19.5] 木アンサンブルから決定規則のコンパクトな集合を抽出する推定器を提案する。
我々の推定器の重要な新規性は、抽出されたルールの数と各ルールの相互作用深さを共同で制御する柔軟性である。
我々の推定器は既存のルール抽出アルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:28:52 GMT)
Better Tokens for Better 3D: Advancing Vision-Language Modeling in 3D Medical Imaging [19.4] BTB3D(Better Tokens for Better 3D)は2Dと3Dのトレーニングと推論を統一した因果畳み込みエンコーダである。
3段階の訓練カリキュラムでは、(i)局所的な再構築、(ii)オーバーラップウインドウタイリング、(iii)ロングコンテクストデコーダリファインメントが可能である。
BLEUスコアを向上し、CT2Rep、CT-CHAT、Merlinよりも臨床F1を40%向上させる。
GenerateCTやMedSynと比べて、FIDを75%削減し、FVDを半減する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:13:13 GMT)
Efficient Algorithms for Computing Random Walk Centrality [19.4] 本稿では、2つのスケーラブルなアルゴリズムの基盤となるランダムウォーク中心性の新たな定式化について述べる。
1000万以上のノードを持つ大規模な実世界のネットワークの実験は、提案アルゴリズムの効率性と近似品質を実証している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:36:38 GMT)
LEGO: A Lightweight and Efficient Multiple-Attribute Unlearning Framework for Recommender Systems [19.3] 既存の単一属性の未学習メソッドは、現実世界のプライバシー保護要件を満たすことができない。
LEGOは軽量で効率的なマルチ属性な未学習フレームワークである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:20:47 GMT)
InvDec: Inverted Decoder for Multivariate Time Series Forecasting with Separated Temporal and Variate Modeling [19.2] InvDecは、時間符号化と可変レベルの復号化を原則的に分離するハイブリッドアーキテクチャである。
7つのベンチマークの実験は、高次元データセットにおいて顕著な向上を示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:42:01 GMT)
BevSplat: Resolving Height Ambiguity via Feature-Based Gaussian Primitives for Weakly-Supervised Cross-View Localization [19.1] 本稿では、弱教師付きクロスビューローカライゼーションの問題に対処する。
目的は、ノイズの多い地上の真実の注釈で衛星画像に対する地上カメラのポーズを推定することである。
特徴に基づくガウス的プリミティブを用いて高さのあいまいさを解決する新しい手法であるBevSplatを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:28:32 GMT)
Efficient Multi-bit Quantization Network Training via Weight Bias Correction and Bit-wise Coreset Sampling [19.1] マルチビット量子化ネットワークは、単一のモデル内で複数の精度レベルをサポートすることにより、ディープニューラルネットワークの柔軟な展開を可能にする。
既存のアプローチでは、サポート対象のビット幅毎にフルデータセット更新が繰り返されるため、トレーニングのオーバーヘッドが大幅に増大する。
本稿では,モデルの有用性を損なうことなく,トレーニングのオーバーヘッドを大幅に削減する2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:49:02 GMT)
DragFlow: Unleashing DiT Priors with Region Based Supervision for Drag Editing [19.0] この研究は、DragFlowと呼ばれるドラッグベースの編集にFLUXのリッチさを効果的に活用する最初のフレームワークを提案する。
この制限を克服するため、DragFlowでは、アフィン変換がよりリッチで一貫性のある機能管理を可能にする、リージョンベースの編集パラダイムを導入している。
DragBench-DRとReD Benchの実験は、DragFlowがポイントベースとリージョンベースの両方のベースラインを超えたことを示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:58:02 GMT)
GSWorld: Closed-Loop Photo-Realistic Simulation Suite for Robotic Manipulation [18.7] GSWorldは、3Dガウススプラッティングと物理エンジンを組み合わせたロボット操作のための写真リアルシミュレータだ。
本フレームワークは,実ロボットデータから得られたポリシーを再現可能な評価で評価する操作ポリシーの「ループを閉じる」ことを提唱する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:26 GMT)
Secure Multi-Key Homomorphic Encryption with Application to Privacy-Preserving Federated Learning [18.4] マルチパーティ安全な計算タスクに適用した場合、CDKSスキームにおける重要なセキュリティ脆弱性を特定する。
マルチキーBFVおよびCKKSフレームワークに新しいマスキング機構を組み込んだ新しいスキームSMHEを提案する。
SMHEを用いてPPFLアプリケーションを実装し,ランタイム評価のオーバーヘッドを最小限に抑えて,セキュリティを大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:16:45 GMT)
FairGen: Enhancing Fairness in Text-to-Image Diffusion Models via Self-Discovering Latent Directions [18.3] 拡散モデル(DM)は様々な画像生成タスクにおいて顕著な性能を示す。
これらのバイアスは歪んだ世界観を永続させ、少数民族の機会を妨げる可能性がある。
本研究では,属性潜在方向を自己発見的に学習するプラグイン・アンド・プレイ手法であるFairGenを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:43:39 GMT)
A robust and versatile deep learning model for prediction of the arterial input function in dynamic small animal $\left[^{18}\text{F}\right]$FDG PET imaging [18.0] 本研究は,PET画像から直接入力関数を予測する非侵襲的,完全畳み込み型深層学習手法(FC-DLIF)を提案する。
FC−DLIFは、PETシーケンスの体積時間フレームに作用する空間特徴抽出器と、動脈入力関数を予測する時間特徴抽出器とを含む。
我々のディープラーニングに基づく入力機能は、動脈血液サンプリングの非侵襲的で信頼性の高い代替手段を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:31:53 GMT)
From Generation to Attribution: Music AI Agent Architectures for the Post-Streaming Era [17.7] 生成的AIは音楽の創造を形作っているが、その成長は帰属、権利管理、経済モデルにおける構造的ギャップを露呈している。
本稿では,創作ワークフローに直接属性を埋め込むコンテンツベースの音楽AIエージェントアーキテクチャを提案する。
このフレームワークは、AIを生成ツールからフェアAIメディアプラットフォームのためのインフラストラクチャに再構成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:00:29 GMT)
Benchmarking GPT-5 for biomedical natural language processing [17.7] 本研究は,GPT-5とGPT-4oを5つの中核生物医学的NLPタスクで評価するための統一ベンチマークを拡張した。
GPT-5 は一貫して GPT-4o を上回り、推論集約データセットで最大の利益を得た。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:09:35 GMT)
EmbodiedBrain: Expanding Performance Boundaries of Task Planning for Embodied Intelligence [17.6] 身体的AIエージェントは、物理的環境における堅牢な空間認識、効果的なタスク計画、適応実行を行うことができる。
現在の大規模言語モデル (LLMs) とマルチモーダルLLM (MLLMs) の具体化タスクは、重要な制約に悩まされている。
EmbodiedBrain は 7B と 32B のパラメータサイズで利用できる新しい視覚言語基盤モデルである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:05:55 GMT)
TAI3: Testing Agent Integrity in Interpreting User Intent [17.5] LLMエージェントは、自然言語命令を通じてAPIを呼び出すことによって、現実世界のタスクを自動化するために、ますます多くデプロイされている。
従来のソフトウェアテストでは、構造化された入力を前提としており、自然言語のあいまいさを扱うには不足している。
LLMエージェントの意図的整合性違反を体系的に発見する,API中心のストレステストフレームワークであるTAI3を紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:47:44 GMT)
MESS+: Dynamically Learned Inference-Time LLM Routing in Model Zoos with Service Level Guarantees [17.5] オープンウェイトな大規模言語モデル(LLM)動物園は、多くの高品質なモデルへのアクセスを提供する。
ほとんどのユーザーは、モデル技術に気を使わずに、事実的正確で安全で満足な応答を欲しがっている。
コスト最適LCM要求ルーティングのための最適化アルゴリズムであるMESS+を紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:40:17 GMT)
From High-SNR Radar Signal to ECG: A Transfer Learning Model with Cardio-Focusing Algorithm for Scenarios with Limited Data [17.4] この研究は、限られたデータを持つ新しいシナリオにおけるレーダベースのECGリカバリに焦点を当てる。
転写学習モデル(RFcardi)を提案し,心電図の真偽を示さずにレーダ信号から心臓関連情報を抽出する。
RFcardiモデルは、少数のレーダーECGペアを使用してトレーニングを行い、忠実なECG回復を効果的に生成することができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:18:47 GMT)
Thought Communication in Multiagent Collaboration [17.4] エージェントが直接マインド・ツー・マインド・マインド・ツー・マインド・マインド・マインド・マインド・マインド・ツー・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド・マインド
補助情報のない非パラメトリックな環境では、任意のエージェント間の共有思考とプライベート思考の両方が識別可能であることを証明している。
我々は,コミュニケーションに先立ってすべてのエージェントから潜在的思考を抽出し,各エージェントに関連する思考を割り当てる枠組みを構築した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:48:02 GMT)
Why DPO is a Misspecified Estimator and How to Fix It [17.3] DPOは、パラメトリックポリシークラスによって誘導される報酬関数に対する統計的推定問題を符号化していることを示す。
本稿では、DPO損失関数に補助変数を導入し、RLHFソリューションへの移行を支援するAuxDPOを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:30:29 GMT)
Training the Untrainable: Introducing Inductive Bias via Representational Alignment [17.2] 伝統的にタスクに適さないと考えられるアーキテクチャは、別のアーキテクチャからの帰納的バイアスを使ってトレーニングできることを示す。
我々は,イメージネット上でFCNが過度に適合することを防止し,バニラRNN-Transformerギャップを狭めるとともに,通常のCNNをResNetの精度に向けて強化し,RNNが好むタスクに対してトランスフォーマーを補助することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:40:02 GMT)
Towards General Modality Translation with Contrastive and Predictive Latent Diffusion Bridge [17.0] Latent Denoising Diffusion Bridge Model (LDDBM)は、モーダル翻訳のための汎用フレームワークである。
共用ラテント空間で演算することにより、任意のモード間のブリッジを、整列次元を必要とせずに学習する。
提案手法は任意のモダリティペアをサポートし,マルチビューから3次元形状生成,画像超解像,マルチビューシーン合成など,多様なMTタスクに強く依存する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:54 GMT)
VITRIX-CLIPIN: Enhancing Fine-Grained Visual Understanding in CLIP via Instruction Editing Data and Long Captions [16.9] CLIP-IN(CLIP-IN)は、2つのコアイノベーションを通じてCLIPの微粒な認識を促進する新しいフレームワークである。
まず、画像操作用に設計された命令編集データセットを、ハードネガティブな画像テキストペアのユニークな情報源として活用する。
第二に、CLIP-INは長いキャプションを組み込み、回転する位置エンコーディングを利用して、標準のCLIPでしばしば見逃されるリッチなセマンティックコンテキストをキャプチャする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:20:46 GMT)
Kernel Learning with Adversarial Features: Numerical Efficiency and Adaptive Regularization [16.8] 対向学習は、対向入力摂動に対するモデルロバスト性を高める重要な手法として登場した。
本稿では,Hilbert空間を再現するカーネルにおいて,入力から特徴空間の摂動へ移行した対角的トレーニングの新たな定式化を提案する。
この再構成により、内的かつ効率的な最適化の正確な解が得られる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:34:51 GMT)
FreeChunker: A Cross-Granularity Chunking Framework [16.8] チャンキング戦略は、検索・拡張生成(RAG)システムの有効性に大きな影響を及ぼす。
本稿では,従来のチャンキングパラダイムをトランスフォーメーションするクロスグラニュラリティフレームワークであるFreeChunkerについて述べる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:57:00 GMT)
Panoptic-CUDAL: Rural Australia Point Cloud Dataset in Rainy Conditions [16.6] 本稿では,雨天地におけるパノプティカルセグメンテーションを目的とした新しいデータセットであるPanoptic-CUDALデータセットを紹介する。
高解像度のLiDAR、カメラ、ポーズデータを記録することで、Panoptic-CUDALは、挑戦的なシナリオにおいて、多種多様な情報豊富なデータセットを提供する。
我々は,記録データの解析を行い,LiDAR点雲上でのパノプティクス,セマンティックセグメンテーション,および3D占有率予測のためのベースライン結果を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:37:17 GMT)
Towards Machine Learning-based Model Predictive Control for HVAC Control in Multi-Context Buildings at Scale via Ensemble Learning [16.6] 熱力学モデルの構築は、潜在的HVAC制御操作下でのリアルタイム屋内温度変化を予測する。
これらのモデルは、しばしば広範囲なデータ収集期間を必要とし、専門家の知識に大きく依存し、モデリングプロセスを非効率にし、モデルの再利用可能性を制限する。
本稿では,既存のモデルを用いたモデルアンサンブルの視点について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:18:34 GMT)
T1: A Tool-Oriented Conversational Dataset for Multi-Turn Agentic Planning [16.6] 大きな言語モデル(LLM)は、複雑な問題を解決する知的エージェントとして印象的な能力を示している。
ツール拡張されたマルチドメイン、マルチターン対話型データセットであるT1を導入し、ツール間の依存関係をキャプチャし、管理する。
我々はT1-Agentを用いて、複雑なツール依存のシナリオで計画と推論を行う能力を強調した結果を提示する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:31:35 GMT)
Learning Mean-Field Games through Mean-Field Actor-Critic Flow [16.5] 我々は平均場ゲーム(MFG)を解くための連続学習力学である平均場アクター・クライブ(MFAC)フローを提案する。
このフレームワークは、偏微分方程式(PDE)が支配する結合勾配に基づく更新を通じて、制御(アクター)、値関数(批判)、分布成分を共同で進化させる。
中心的な革新は最適輸送測地管流(OTGP)であり、ワッサーシュタイン2測地線に沿った平衡方向の分布を駆動している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:53:38 GMT)
Sampling from multi-modal distributions with polynomial query complexity in fixed dimension via reverse diffusion [16.5] 分布の幅広いクラスに対する最初のサンプリングアルゴリズムを提供する。
我々のアルゴリズムは時間反転拡散過程をシミュレートする。
メタスタビリティを回避し、モード位置に関する事前の知識を必要とせず、よく知られた対数平滑性仮定を緩和する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:18:04 GMT)
Generative AI in Depth: A Survey of Recent Advances, Model Variants, and Real-World Applications [16.4] GAN(Generative Adversarial Networks)、VAE(VAE)、拡散モデル(Diffusion Models)は、様々な領域にまたがる多様な高品質なコンテンツを生成するのに役立っている。
本調査では, 文献を整理し, GAN, VAE, DMの発達を理解するための包括的枠組みを提供する包括的分類法を紹介する。
技術的進歩の要約に加えて, 誤用リスクや, 合成メディアの社会的影響など, 倫理的懸念の高まりについても検討した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:11:12 GMT)
Metis-HOME: Hybrid Optimized Mixture-of-Experts for Multimodal Reasoning [16.3] マルチモーダルな大推論モデルには 2つの重要な制限があります
単純なクエリでも計算コストのかかる推論を採用する傾向があり、効率の悪さにつながる。
We propose Metis-HOME: a Hybrid Optimized Mixture-of-Experts framework。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:02:49 GMT)
Unsupervised Domain Adaptation via Similarity-based Prototypes for Cross-Modality Segmentation [16.3] 本稿では,類似性に基づくプロトタイプによるクロスモーダルなセグメンテーションのための新しいフレームワークを提案する。
具体的には、埋め込み空間内でクラスワイドプロトタイプを学習し、それらのプロトタイプを各セマンティッククラスに代表させる類似性制約を導入する。
我々は辞書を用いて、異なる画像から抽出したプロトタイプを格納し、クラス欠落の問題を防止し、プロトタイプの対照的な学習を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:24:12 GMT)
VAMOS: A Hierarchical Vision-Language-Action Model for Capability-Modulated and Steerable Navigation [16.3] VAMOSは階層的なVLAで、セマンティックプランニングを実施基盤から切り離す。
室内および複雑な屋外ナビゲーションにおいて,VAMOSは高い成功率を達成することを示す。
このモデルはシングルロボットの信頼性を著しく向上させ、物理的に不可能な計画を拒否して3倍の成功率を達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:45 GMT)
VO-DP: Semantic-Geometric Adaptive Diffusion Policy for Vision-Only Robotic Manipulation [16.1] ビジョンオンリー・シングルビュー拡散政策学習法(VO-DP)
ビジョンオンリーかつ単一視点拡散政策学習法(VO-DP)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:59:37 GMT)
Bi-CoG: Bi-Consistency-Guided Self-Training for Vision-Language Models [16.1] 本稿では,$underlinetextbfBi-Co$nsistency-$underlinetextbfG$uided Self-Trainingというプラグイン・アンド・プレイ手法を提案する。
Bi-CoGは、エラー認識型動的擬似ラベル割り当て戦略とともに、モデル間の一貫性とモデル内一貫性を同時に活用することにより、高品質で低バイアスな擬似ラベルを割り当てる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:16:41 GMT)
Self-Jailbreaking: Language Models Can Reason Themselves Out of Safety Alignment After Benign Reasoning Training [16.1] 良心的な推論訓練の後、RLMは自身の安全ガードレールを回避するために複数の戦略を使用する。
DeepSeek-R1蒸留、s1.1、Phi-4-mini-reasoning、Nemotronを含む多くのオープンウェイトRLMは自己ジェイルブレイクに悩まされている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:34:24 GMT)
ProxySPEX: Inference-Efficient Interpretability via Sparse Feature Interactions in LLMs [16.1] 大規模言語モデル(LLM)は、入力機能間の複雑な相互作用をキャプチャすることで、優れたパフォーマンスを実現している。
これらの相互作用を識別するには、既存のほとんどのアプローチは、与えられた順序まで全ての可能な特徴の組み合わせを列挙する必要がある。
ProxySPEX(英語版)は、勾配木をマスキングした出力に適合させ、重要な相互作用を抽出する相互作用帰属アルゴリズムである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:11:10 GMT)
ROOT: Rethinking Offline Optimization as Distributional Translation via Probabilistic Bridge [16.0] 観測された入出力ペアの静的集合を用いてブラックボックス関数の最大値を求めるブラックボックス最適化タスクについて検討する。
これはしばしば、オフラインデータによる代理関数の学習と最適化によって達成される。
本稿では,オフライン最適化を分散翻訳タスクとして活用する新たな視点を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:25:46 GMT)
MLMA: Towards Multilingual ASR With Mamba-based Architectures [15.9] A(Multilingual Language Modeling with Mamba for ASR)を紹介する。
Mambaアーキテクチャは、ASRのための効率的な状態空間シーケンス処理である。
AはTransformerベースのアーキテクチャと比較して競争力がある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:45:28 GMT)
A Survey on Cache Methods in Diffusion Models: Toward Efficient Multi-Modal Generation [15.7] 拡散モデルは、異常な生成品質と制御性のために、現代の生成AIの基盤となっている。
Diffusion Cachingは、トレーニングのない、アーキテクチャに依存しない、効率的な推論パラダイムを提供する。
計算機能レベルのクロスステップの再利用と層間スケジューリングを有効にすることにより、モデルパラメータを変更することなく削減できる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:09:15 GMT)
Unlocking Multi-View Insights in Knowledge-Dense Retrieval-Augmented Generation [15.7] 本稿では,知識密度ドメインに適した新しいマルチビューRAGフレームワークであるMVRAGを紹介する。
法的および医学的事例検索実験は、リコール率と精度を著しく改善した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:32:33 GMT)
Limits of PRM-Guided Tree Search for Mathematical Reasoning with LLMs [15.7] 大規模言語モデル(LLM)の数学的推論において,BoN(Chain-of- Thought prompting)が人気となっている。
本稿では,プロセス報酬モデル(PRM)のスコアを抽出可能な動作空間上で最大化する適応アルゴリズムを提案する。
高いコストにもかかわらず, PRM誘導木探索はBoNに対して統計的に有意な改善を示さなかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:59:36 GMT)
Taming Hyperparameter Sensitivity in Data Attribution: Practical Selection Without Costly Retraining [15.5] データ属性法は、個別のトレーニングデータポイントが機械学習モデルに与える影響を定量化する。
この領域で開発された新しい手法の急増にもかかわらず、これらの手法におけるハイパーパラメータチューニングの影響は未解明のままである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:07:24 GMT)
Robust Point Cloud Reinforcement Learning via PCA-Based Canonicalization [15.0] 下流ロボット制御に適した標準化フレームワークであるPCA Point Cloud (PPC)を提案する。
PPC は任意の剛体変換の下で点雲を特異な正則なポーズにマッピングし、観測結果を一貫したフレームに整列させ、視点誘起の不整合を著しく減少させる。
我々の実験では、PPCは難易度の高いカメラのポーズが困難なロボットタスクにまたがって堅牢性を向上させることを示し、ドメインランダム化の原則的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:06:29 GMT)
SnapMoGen: Human Motion Generation from Expressive Texts [15.0] SnapMoGenは、高精度で表現力のあるテキストアノテーションと組み合わせた高品質なモーションキャプチャーデータを備えた、新しいテキストモーションデータセットである。
データセットは、合計44時間の20Kのモーションクリップと、記述毎の48ワードの平均122Kの詳細なテキスト記述で構成されている。
私たちのモデルであるMoMask++は、モーションをマルチスケールのトークンシーケンスに変換し、トークンのキャパシティをよりよく活用します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:48:16 GMT)
Focal Modulation and Bidirectional Feature Fusion Network for Medical Image Segmentation [15.0] 医療画像のセグメンテーションは、疾患診断、治療計画、疾患発生モニタリングなどの臨床応用に不可欠である。
畳み込み操作はローカルであるため、グローバルなコンテキスト情報と長距離依存をキャプチャすることは依然として困難である。
これらの課題を克服するためにFM-BFF-Netを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:52:24 GMT)
Dialogue Is Not Enough to Make a Communicative BabyLM (But Neither Is Developmentally Inspired Reinforcement Learning) [15.0] 私たちは、モデルによって"よりコミュニケーションのよい"テキスト世代を強制するために、さまざまな微調整戦略を採用しています。
我々のモデルは最小ペア設定で対話継続予測に優れる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:57:56 GMT)
Streaming Federated Learning with Markovian Data [14.9] フェデレートラーニング(FL)はコミュニケーション効率のよい協調学習の鍵となるフレームワークとして認識されている。
FLがマルコフデータストリームとの協調学習をサポートできるかを検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:51:07 GMT)
S$^2$-Diffusion: Generalizing from Instance-level to Category-level Skills in Robot Manipulation [14.6] 事例レベルの学習データからカテゴリレベルへの一般化を可能にするオープン語彙空間意味拡散政策(S$2$-Diffusion)を提案する。
本研究では, 空間表現と組み合わせて, プロンプト可能なセマンティックモジュールによって, スキルの機能的側面を捉えることができることを示す。
その結果、S$2$-Diffusionはカテゴリ非関連要因の変化に不変であり、同じカテゴリ内の他のインスタンスで、たとえ特定のインスタンスでトレーニングされていなくても、満足できることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:09:29 GMT)
Mixing Importance with Diversity: Joint Optimization for KV Cache Compression in Large Vision-Language Models [14.6] textttMixKVは、視覚言語モデルにおける最適化KVキャッシュ圧縮において重要度と多様性を混合する新しい手法である。
極端な圧縮の下で、textttMixKVは5つのマルチモーダル理解ベンチマークで平均で textbf5.1% のベースラインメソッドを改善している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:17:47 GMT)
MOBO-OSD: Batch Multi-Objective Bayesian Optimization via Orthogonal Search Directions [14.6] MOBO-OSDは多様な最適解を生成するために設計された多目的ベイズ最適化アルゴリズムである。
OSDの分散化によってMOBO-OSDは、目的空間を広範囲にカバーし、ソリューションの多様性とハイパーボリュームのパフォーマンスを向上する。
我々はMOBO-OSDが最先端のアルゴリズムより一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:42:41 GMT)
Converse bounds for quantum hypothesis exclusion: A divergence-radius approach [14.5] 任意のダミーの仮説と関連する候補のそれぞれを区別するために、非対称二項仮説検定に強い逆結果を適用する。
これにより、幾何学的に着想を得た議論を通じて、分岐の観点から所望の上界が導かれる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:23:17 GMT)
FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks [14.5] 本稿では,UNet復号処理を初期値問題として再定義する,新しいマルチスケール機能融合法を提案する。
ACDC、KiTS2023、MSD脳腫瘍、ISIC皮膚病変セグメンテーションデータセットの実験は、機能利用の改善、ネットワークパラメータの削減、高性能の維持を実証した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:47:38 GMT)
H-SPLID: HSIC-based Saliency Preserving Latent Information Decomposition [14.4] H-SPLIDは、有意な特徴と非有意な特徴を明確に分解することで、有意な特徴表現を学習するアルゴリズムである。
我々は,H-SPLIDが低次元タスク関連特徴の学習を促進することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:02:07 GMT)
Learn2Mix: Training Neural Networks Using Adaptive Data Integration [14.3] learn2mixは、バッチ内のクラス比率を適応的に調整する新しいトレーニング戦略で、エラー率の高いクラスに重点を置いている。
経験的評価では、Learner2mixでトレーニングされたニューラルネットワークは、既存のアプローチでトレーニングされたニューラルネットワークよりも早く収束している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:15:24 GMT)
ReDit: Reward Dithering for Improved LLM Policy Optimization [14.2] DeepSeek-R1は、ルールベースの報酬システムを通じて、LLM(Large Language Model)推論機能の拡張に成功した。
報酬のハッキングを効果的に軽減する「完璧な」報酬システムであるが、そのような報酬機能はしばしば離散的である。
本稿では、単純なランダムノイズを加えることで離散的な報酬信号をディザリングするReDit(Reward Dithering)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:48:56 GMT)
Falcon: A Comprehensive Chinese Text-to-SQL Benchmark for Enterprise-Grade Evaluation [14.2] Falconは、企業互換の方言(Max/Hive)をベースとした、中国のクロスドメインテキスト・コンパレータベンチマークである。
28のデータベースに600の中国の質問が含まれており、77%はマルチテーブルの推論と4つのテーブルの半分以上のタッチを必要としている。
評価のために、ロバストな実行コンパレータと自動評価パイプラインをリリースする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:35:00 GMT)
Exploring Generative Process Reward Modeling for Semi-Structured Data: A Case Study of Table Question Answering [14.1] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)における複雑な推論を改善する。
本研究は,テーブル質問応答(TQA)のためのPRMに関する最初の体系的研究である。
回答とステップの両面から,TQAにおける最先端のPRMを評価した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:49:39 GMT)
Toward a Vision-Language Foundation Model for Medical Data: Multimodal Dataset and Benchmarks for Vietnamese PET/CT Report Generation [14.0] このデータセットは、独立患者のPET/CTボリューム2,757と、それに対応するフル長の臨床報告からなる。
私たちの知る限りでは、ベトナムでPET/CT-レポートペアを包括的に提供する最初のデータセットです。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:12:26 GMT)
Sample-efficient Learning of Concepts with Theoretical Guarantees: from Data to Concepts without Interventions [13.9] 概念ボトルネックモデル(CBM)は、高次元データから解釈可能な概念を学ぶことでこれらの課題に対処する。
本稿では,学習概念の正しさと必要なラベル数に関する理論的保証を提供する枠組みについて述べる。
合成および画像のベンチマークにおいて、我々のフレームワークを評価し、学習された概念が不純物が少なく、しばしば他のCBMよりも正確であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:43:50 GMT)
Knot So Simple: A Minimalistic Environment for Spatial Reasoning [13.9] KnotGymは複雑な空間的推論と操作のための対話型環境である。
ゴール指向のロープ操作タスクで、さまざまなレベルの複雑さがあり、すべて純粋な画像観察から行動する必要がある。
モデルベースRL, モデル予測制御, チェーン・オブ・シークレット推論など, 様々なクラスの手法を評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:59:58 GMT)
Poisson Flow Consistency Training [13.7] Poisson Flow Consistency Model (PFCM) は、Poisson Flow Generative Model++ (PFGM++) に基づく一貫性スタイルのモデルである。
本研究の目的は,Poisson Flow Consistency Training (PFCT) と呼ばれるPFCMを単独で訓練する方法を開発することである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:23:11 GMT)
LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer [13.6] ユニバーサル画像復元(UIR)は、意味を保ちながら未知の混合物によって劣化した画像を復元することを目的としている。
本稿では,大容量拡散変換器(Flux.1)を画像キャプションなしで適用可能な,キャプションフリーなUIRフレームワークであるLucidFluxを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:20:47 GMT)
Large Language Bayes [13.6] 本稿では,大言語モデルと確率型プログラミング言語を組み合わせた非公式な問題記述を入力として取り上げる。
後続の潜伏変数は、観測されたデータに条件付けし、形式的モデルを越えて統合することによって従う。
大規模言語モデルから多くの形式モデルを生成するための推論レシピを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:34:08 GMT)
Debate or Vote: Which Yields Better Decisions in Multi-Agent Large Language Models? [13.6] マルチエージェント・ディベート(MAD)は,大規模言語モデルの性能向上のための,有望なパラダイムとして登場した。
近年の進歩にもかかわらず、MADの有効性を左右する重要な要因はいまだ不明である。
我々はMajority VotingとInter-agent Debateの2つの重要なコンポーネントにMADを分解し、それぞれのコントリビューションを評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:44:57 GMT)
Distributional Adversarial Attacks and Training in Deep Hedging [13.5] 分布シフト下での古典的深層湿潤戦略の堅牢性について検討する。
本研究では, 深層湿潤戦略の堅牢性を高めるために, 対戦型トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:50:22 GMT)
Efficient Vision-Language-Action Models for Embodied Manipulation: A Systematic Survey [13.4] VLA(Vision-Language-Action)モデルは、自然言語の指示と視覚的な観察をロボットの行動にマッピングすることで、視覚言語モデルを拡張し、制御を具体化する。
これらの能力にもかかわらず、VLAシステムは膨大な計算とメモリ要求のために重大な課題に直面している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:06:39 GMT)
Recurrent Self-Attention Dynamics: An Energy-Agnostic Perspective from Jacobians [13.4] この研究は、エネルギーの制約を緩和し、推論力学のエネルギーに依存しない特徴づけを提供することを目的としている。
このことは、正規化層がSAのリプシッツ性やヤコビアンの複素固有値を抑制する上で重要な役割を果たすことを示している。
ヤコビアン・パースペクティブは、トレーニングのための正規化手法や、推論ダイナミクスのモニタリングのための擬似エネルギーの開発にも有効である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:37:50 GMT)
Leveraging Analytic Gradients in Provably Safe Reinforcement Learning [13.4] おそらく安全な強化学習は、安全ガードを用いてそのような保証を提供することを目的とした研究の活発な分野である。
解析勾配に基づく強化学習のための最初の効果的な安全ガードを開発する。
その結果,性能を損なうことなく安全訓練を行うことができた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:51:19 GMT)
CircuitSeer: Mining High-Quality Data by Probing Mathematical Reasoning Circuits in LLMs [13.4] 大規模言語モデル(LLM)は印象的な推論機能を示しているが、そのパフォーマンスは大規模な推論データセットに依存していることが多い。
本稿では,これらの重要な回路への影響を測定することによって,データの推論複雑性を定量化する新しいデータ選択手法であるCircuitSeerを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:50:29 GMT)
Learning To Defer To A Population With Limited Demonstrations [13.4] 本稿では,L2D(L2D)システムを人口に遅延させる学習の実践的展開を妨げる重要なデータ不足に対処する。
メタラーニングを用いて,少数のデモンストレーションから専門家固有の埋め込みを生成する,コンテキスト対応の半教師付きフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:52:19 GMT)
Gaussian Mixture Flow Matching with Domain Alignment for Multi-Domain Sequential Recommendation [13.3] 我々は,ドメイン認識遷移軌跡をモデル化したMDSRの効率的な生成フレームワークである textitGMFlowRec を提案する。
JDとAmazonのデータセットの実験は、GMFlowRecが最先端のパフォーマンスを達成し、NDCG@5.1で最大44%改善したことを示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:11:26 GMT)
ViSpec: Accelerating Vision-Language Models with Vision-Aware Speculative Decoding [13.3] 視覚言語モデル(VLM)に適した新しいフレームワークViSpec(ViSpec)を紹介する。
ViSpecは画像トークンをコンパクトな表現に圧縮するために軽量な視覚適応モジュールを使用している。
我々のトレーニング戦略は、ターゲットモデルの隠れた状態への直接アクセスを利用するドラフトモデルのリスクを軽減する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:59:53 GMT)
Resounding Acoustic Fields with Reciprocity [13.1] 音場学習を容易にする物理に着想を得たアプローチであるVersaを紹介する。
提案手法は,エミッタとリスナのポーズを交換することで,高密度な仮想エミッタ位置を持つ物理的に有効なサンプルを生成する。
以上の結果から,実世界の実環境とシミュレーションデータを用いた音場学習の性能は大幅に向上した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:30:09 GMT)
There is No "apple" in Timeseries: Rethinking TSFM through the Lens of Invariance [13.1] タイムズファウンデーションモデル(TSFM)は、多重化され、軽量で教師付きベースラインであり、古典モデルでさえしばしばそれらと一致する。
このギャップは、NLPやCVパイプラインの素早い輸入に由来すると我々は主張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:48:29 GMT)
CTSketch: Compositional Tensor Sketching for Scalable Neurosymbolic Learning [12.9] 我々は、新しいスケーラブルなニューロシンボリック学習アルゴリズムであるCTSketchを紹介する。
CTSketchは,従来達成不可能であった新しい尺度に,ニューロシンボリックラーニングを推し進めている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:55:13 GMT)
Neural Thermodynamics: Entropic Forces in Deep and Universal Representation Learning [12.8] 本稿では、勾配降下学習ニューラルネットワークの学習力学を理解するための厳密なエントロピー力理論を提案する。
表現学習は特異性と離散時間更新から生じる創発的エントロピー力によって決定的に制御されていることを示す。
これらの力は、連続したパラメータ対称性を体系的に破り、離散的なパラメータを保存し、一連の勾配バランス現象を引き起こす。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:55:00 GMT)
Alleviating Forgetfulness of Linear Attention by Hybrid Sparse Attention and Contextualized Learnable Token Eviction [12.7] 有限メモリは、検索集約的なタスクに害を与える忘れやすさを誘導する。
過去のトークンへの直接アクセスを復元する一連のハイブリッドモデルについて検討する。
本稿では,新しい学習可能なトークン消去手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:53:03 GMT)
Reflex: Faster Secure Collaborative Analytics via Controlled Intermediate Result Size Disclosure [12.7] Multi-Party Computation (MPC)は、プライベートデータを公開せずに協調分析を可能にする。
MPCクエリは、不愉快な実行と中間結果をフィラーでパディングするため、違法に遅いままである。
本稿では,クエリ演算子間で中間結果のトリミングを可能にする最初のフレームワークであるReflexを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:56:13 GMT)
TabR1: Taming GRPO for tabular reasoning LLMs [12.3] 本稿では,多段階推論を用いた表型予測のための最初の推論LLMであるTabR1を提案する。
その中核は、単純だが効率的な強化学習法である置換相対ポリシー最適化(PRPO)である。
PRPOはスパース報酬を濃密な学習信号に変換し、一般化を改善する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:22:59 GMT)
Collective Communication for 100k+ GPUs [12.3] 本稿では,Metaで開発されたNCCLX集合通信フレームワークについて述べる。
このフレームワークは、クラスタ上の10000以上のGPU上の複雑なワークロードをサポートするように設計されている。
Llama4モデルの実証的な評価は、通信効率を大幅に改善したことを示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:32:04 GMT)
The Dog the Cat Chased Stumped the Model: Measuring When Language Models Abandon Structure for Shortcuts [12.2] CenterBenchは、センタ埋め込み文に関する9,720質問のデータセットである。
各文は、構文的に同一であるが、意味的に不明瞭な文である。
テストでは、複雑性とともに体系的に拡張された可読文と可読文の間にパフォーマンスのギャップが明らかになる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:30:40 GMT)
SAFEPATH: Preventing Harmful Reasoning in Chain-of-Thought via Early Alignment [12.2] SAFEPATHは, LRMを微調整して, その推論の開始時に, 短時間で8個の安全プライマーを出力する軽量アライメント手法である。
実験の結果,SAFEPATHは推論性能を維持しながら有害な出力を効果的に減少させることが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:04:50 GMT)
QNPU: Quantum Network Processor Unit for Quantum Supercomputers [12.2] 本稿では,個々の量子プロセッサのキャパシティを超えて効率よくスケール可能な量子ネットワーク処理ユニット(QNPU)を提案する。
我々はQNPUが量子ノード間の通信効率を大幅に改善し、量子スーパーコンピュータへの道を開いたことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:28:17 GMT)
Fair Clustering via Alignment [12.1] クラスタリングにおけるアルゴリズムフェアネスは、与えられた機密属性に対して各クラスタに割り当てられたインスタンスの割合をバランスさせることを目的としている。
本稿では, 対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対物対
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:21:29 GMT)
SSR: A Swapping-Sweeping-and-Rewriting Optimizer for Quantum Circuit Transformation [12.1] 本稿ではQCT回路の深さを最小化するスワッピング・スウィーピング・アンド・リライトアルゴリズムを提案する。
実験の結果,QCT回路の深さを26.68%,平均12.18%,ベンチマーク回路全体の深さを著しく低減できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:31:05 GMT)
Simple Context Compression: Mean-Pooling and Multi-Ratio Training [12.0] 我々は、広く使われている圧縮トークンアーキテクチャを一貫して上回る軽量でシンプルな平均プール手法を開発した。
ドメイン内およびドメイン外QAデータセット、モデルファミリ、スケール、圧縮比にわたって、広範な実験を行います。
全体としては,複数の圧縮比のトレーニングを行う場合,比較的少ない低下率で,本手法は最強性能を達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:57:23 GMT)
Picosecond Wireless Synchronization with Entangled Photons via Grid-Based Quantum Coverage in Indoor Optical Systems [12.0] グリッド型ビームステアリングに基づく屋内光無線システムのための新しい絡み合い支援同期フレームワークを提案する。
光子検出の特異性とランダム性に対処するために,2段階同期アルゴリズムを開発した。
その結果、より微細なグリッド構成と最適な光子ペアレートは同期誤差を著しく低減することがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:49:46 GMT)
Evaluating Latent Knowledge of Public Tabular Datasets in Large Language Models [12.0] 大規模言語モデル(LLM)は、構造化データに対する推論能力について、ますます評価されている。
本研究では,強い意味的手がかりを含むデータセットにのみ,汚染効果が現れることを示す。
LLMの明らかな能力は、部分的には真の一般化ではなく、一般に利用可能なデータセットの記憶を反映している可能性がある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:51:14 GMT)
Balancing Fine-tuning and RAG: A Hybrid Strategy for Dynamic LLM Recommendation Updates [12.0] 大規模言語モデル(LLM)は、高度な推論と計画能力を通じてレコメンデーションシステムを強化する。
本稿では,LLMを利用したリコメンデータの更新戦略について検討し,現在進行中の微調整と検索機能強化(RAG)のトレードオフに着目した。
本稿では,周期的微調整の長期的知識適応と低コストRAGの俊敏性を活用するハイブリッド更新戦略を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:31:00 GMT)
Prover Agent: An Agent-Based Framework for Formal Mathematical Proofs [11.9] 本稿では,自動定理証明のためのAIエージェントであるProver Agentを紹介する。
大規模な言語モデル(LLM)と公式な証明アシスタントであるLeanを統合している。
MiniF2Fベンチマークで88.1%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:48:37 GMT)
On the Fairness of Privacy Protection: Measuring and Mitigating the Disparity of Group Privacy Risks for Differentially Private Machine Learning [11.8] データレコードの最悪のプライバシーリスクを効率的に評価できる新しい会員推論ゲームを導入する。
提案アルゴリズムは,グループプライバシリスクの格差を効果的に低減し,DPMLにおけるプライバシ保護の公平性を高める。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:48:13 GMT)
PolyPose: Deformable 2D/3D Registration via Polyrigid Transformations [11.7] 変形可能な2D/3D登録のためのシンプルでロバストな方法であるPolyPoseを提案する。
PolyPoseは複雑な3次元変形場を剛体変換の合成としてパラメータ化する。
この強い誘導バイアスにより,PolyPoseは患者の術前容積を2つのX線に合わせることができた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:17:27 GMT)
AdaDoS: Adaptive DoS Attack via Deep Adversarial Reinforcement Learning in SDN [11.5] 本稿では,既存のDoS検出器による検出を回避しつつ,ネットワーク操作を妨害するアダプティブアタックモデルであるAdaDoSを紹介する。
AdaDoSは、DoSライクな攻撃シーケンスを開発するための敵の強化学習の最初の応用である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:51:40 GMT)
Towards Reliable Evaluation of Large Language Models for Multilingual and Multimodal E-Commerce Applications [11.5] LLM(Large Language Models)は汎用NLPベンチマークに優れるが、専門分野におけるその能力は未解明のままである。
電子商取引におけるLLMを評価するための総合的多言語およびマルチモーダルベンチマークであるEcomEvalを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:04:32 GMT)
BuildArena: A Physics-Aligned Interactive Benchmark of LLMs for Engineering Construction [11.5] BuildArenaは、言語駆動エンジニアリング構築用に設計された最初の物理対応のインタラクティブベンチマークである。
1)LLMの詳細な比較と分析のための高度にカスタマイズ可能なベンチマークフレームワーク,2)複数の難易度層にまたがる静的および動的力学を網羅する拡張可能なタスク設計戦略,(3)言語命令に基づく構築を支援する3次元空間幾何学計算ライブラリである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:25:43 GMT)
Learning from Interval Targets [11.4] 本研究では,対象値の上下境界のみを区間として利用できる対象値の回帰区間問題について検討する。
正確な目標がなければ、従来の回帰損失は使用できない。
提案手法は,最先端の性能機能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:24:17 GMT)
Neural Reasoning for Robust Instance Retrieval in $\mathcal{SHOIQ}$ [11.3] EBRと呼ばれる新しい神経推論器を提案する。
EBRはシンボリック推論器の結果を近似するために埋め込みに依存している。
以上の結果から,ERRは既存の推論とは対照的に,欠落データや誤データに対して堅牢であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:48:43 GMT)
SynTSBench: Rethinking Temporal Pattern Learning in Deep Learning Models for Time Series [11.3] 時系列予測モデルのための合成データ駆動評価パラダイムであるSynTSBenchを提案する。
本フレームワークは,3つのコア解析次元を持つ解釈可能な評価システムの構築と,相反する要因を分離する。
実験の結果,現在のディープラーニングモデルでは,時間的特徴のあらゆるタイプにおいて,最適なベースラインに普遍的にアプローチすることができないことがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:59:38 GMT)
FicSim: A Dataset for Multi-Faceted Semantic Similarity in Long-Form Fiction [11.2] 著者が作成したメタデータから情報を得た12軸の類似点を含む長文のフィクションのデータセットであるFICSIMをリリースする。
このタスクに組込みモデルを組み込んで評価し、セマンティックなカテゴリよりも表面的な特徴にフォーカスする傾向を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:30:19 GMT)
Local Guidance for Configuration-Based Multi-Agent Pathfinding [11.2] Guidanceは、リアルタイムサブフィンディング型マルチエージェントパスフィンディング(MAPF)手法の実証的性能を改善する新しい概念である。
本研究は,各エージェントの近傍に局所的なガイダンスを提供するという,別のアプローチを提案する。
計画立案者への情報提供は,適度な時間予算を超過することなく,ソリューションの品質を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:44:56 GMT)
Bellman Optimality of Average-Reward Robust Markov Decision Processes with a Constant Gain [11.2] 長期にわたる平均再帰の定式化は、多くの運用研究や管理の文脈では自然であるが、まだ過小評価されている。
本稿では, 定常ゲイン設定を解析し, 平均回帰ロバストMDPの一般的な枠組みに向けて進む。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:32:06 GMT)
Towards Objective Obstetric Ultrasound Assessment: Contrastive Representation Learning for Fetal Movement Detection [11.1] 胎児運動分析のための自己教師型学習フレームワークであるContrastive Ultrasound Video Representation Learning (CURL)を提案する。
CURLの感度は78.01%、AUROCは81.60%であり、信頼性と客観的なFM分析の可能性を示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:03:23 GMT)
Continuous Uniqueness and Novelty Metrics for Generative Modeling of Inorganic Crystals [10.9] 生産的な人工知能モデルが開発され、機能性物質の大きな化学空間を効率的にサンプリングすることができる。
これらは典型的には、選択された結晶距離関数に依存する特異性と新規性メトリクスを用いて評価される。
本稿では,これらの制約を理論的に克服する特異性と新規性を評価するために2つの連続距離関数を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:25:10 GMT)
Steering Evaluation-Aware Language Models To Act Like They Are Deployed [10.9] 大規模言語モデル(LLM)は、いつ評価されるかを検出し、より整列するように振る舞いを調整する。
LLMのアクティベーションにステアリングベクトルを加えることで、評価の認識が抑えられ、評価中にデプロイされるようなモデル動作が実現できることを示す。
以上の結果から,AI評価装置は,モデルがデプロイされているように動作させることで,安全性評価の信頼性を向上させることができる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:29:16 GMT)
HoMer: Addressing Heterogeneities by Modeling Sequential and Set-wise Contexts for CTR Prediction [10.8] 逐次的および集合的コンテキストをモデル化するためのホモジニアス指向トランスフォーマーであるHoMerを提案する。
HoMerは、AUCメトリックで工業ベースラインを0.0099向上させ、CTR/RPMのようなオンラインビジネスメトリクスを1.99%/2.46%向上させています。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:35:48 GMT)
Understanding Mechanistic Role of Structural and Functional Connectivity in Tau Propagation Through Multi-Layer Modeling [10.8] 大規模なネットワークアーキテクチャはアルツハイマー病の進行に重要な役割を果たしている。
構造的接続性(SC)と機能的接続性(FC)がタウ伝播にどのように影響するかは未だ不明である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:52:42 GMT)
MultiHal: Multilingual Dataset for Knowledge-Graph Grounded Evaluation of LLM Hallucinations [10.7] 大型言語モデル(LLM)は、忠実さと事実性に固有の制限があり、一般に幻覚と呼ばれる。
英語中心のデータセットの文脈における事実性評価のためのテストベッドを提供するいくつかのベンチマークが開発されている。
我々は,既存の幻覚評価ベンチマークにおいて,事実言語モデリングのためのKGパスと多言語性の欠如を橋渡しし,生成テキスト評価のためのMultiHal framedと呼ばれるKGベースの多言語マルチホップベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:59:23 GMT)
Variational quantum simulation of many-body dissipative dynamics on a superconducting quantum processor [10.7] 非単体多体散逸ダイナミクスのスケーラブルなシミュレーションが可能な変分量子アルゴリズムを提案する。
我々の研究は、散逸性多体ダイナミクスをシミュレートする、ノイズの多い中間スケール量子デバイスの性能を基盤としている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:43:53 GMT)
More Than Memory Savings: Zeroth-Order Optimization Mitigates Forgetting in Continual Learning [10.7] Zeroth-order (ZO) 最適化は、一階法(FO) に代わるメモリ効率の代替として注目されている。
本研究では,ZOの最適化が自然に損失景観の平ら化を招き,連続学習における忘れを減少させることを示す。
この安定性は可塑性のコストを伴い、不正確な勾配推定と緩やかな収束により、ZO最適化は新しいタスク固有の知識を取得する際にFOよりも効果が低い傾向にある。
FO最適化分類器を備えた単一アダプタベースのPEFTモジュールに対して,ZO最適化を適用した簡易かつ効果的なZO-FCを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:54:00 GMT)
FerretNet: Efficient Synthetic Image Detection via Local Pixel Dependencies [10.6] FerretNetは1.1Mパラメータしか持たない軽量ニューラルネットワークで、効率的で堅牢な合成画像検出を提供する。
FerretNetは4クラスのProGANデータセットを専門にトレーニングし、22の生成モデルからなるオープンワールドベンチマークで平均97.1%の精度を達成した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:06:59 GMT)
Accelerating Mobile Language Model via Speculative Decoding and NPU-Coordinated Execution [10.6] sd.npuは、投機的デコーディングと動的ハードウェアスケジューリングを統合して、モバイルデバイス上でコンテキスト対応のテキスト生成を高速化するフレームワークである。
実験では、既存のモバイル推論ソリューションと比較して、生成速度が3.8倍、エネルギー効率が4.7倍まで一貫した改善が示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:30:23 GMT)
Partial Optimality in Cubic Correlation Clustering for General Graphs [10.5] グラフの高階相関クラスタリング問題である$G$と$G$のcliqueに関連するコストは、すべて同じクラスタに属しているこれらのcliqueのコストの和を最小化するために$G$のクラスタリングを見つけることである。
このNP-hard問題に実際に取り組むために、応用の文脈において局所探索が提案され研究されている。
ここでは、立方体相関クラスタリング(英語版)のための部分最適条件、すなわち、少なくとも3つの斜めの特別な場合の最適条件を確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:07:29 GMT)
Learning to Triage Taint Flows Reported by Dynamic Program Analysis in Node.js Packages [10.4] プログラム分析ツールは、しばしば大量の脆弱性レポートを生成する。
本稿では,プログラム解析ツールによって報告される脆弱性の優先順位付けに機械学習を適用することができるかを検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:58:02 GMT)
Classical Feature Embeddings Help in BERT-Based Human Mobility Prediction [10.4] 本稿では,POIと時間情報を統合したSTaBERT(Semantic-Temporal aware BERT)を提案する。
実験の結果,STaBERTは予測精度を大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:59:58 GMT)
MolBridge: Atom-Level Joint Graph Refinement for Robust Drug-Drug Interaction Event Prediction [10.4] 薬物の組み合わせは治療効果を提供するが、有害薬物・薬物相互作用(DDI)のリスクも伴う
本研究は,薬物と薬物の相互作用ネットワークをマイニングし分析するグラフベースの手法を開発することにより,Web Mining and Content Analysisに寄与する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:33:16 GMT)
Bayesian Jammer Localization with a Hybrid CNN and Path-Loss Mixture of Experts [10.2] 本稿では,物理パスロスモデルと畳み込みニューラルネットワークを融合したハイブリッド・オブ・エキスパート・フレームワークを提案する。
都市部におけるレイトレーシングデータを用いた実験により, 局所化精度が向上し, 不確実性が低下し, より多くのトレーニングポイントが得られた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:45:45 GMT)
Beyond Retrieval-Ranking: A Multi-Agent Cognitive Decision Framework for E-Commerce Search [10.2] 検索レベルのパラダイムは、プラットフォームユーザの多段階認知決定プロセスと誤解する。
受動的検索から積極的な意思決定支援へパラダイムをシフトさせる多エージェント認知決定フレームワーク(MACDF)を提案する。
JD検索プラットフォーム上でのオンラインA/Bテストは、その実用性を確認する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:55:53 GMT)
User Perceptions of Privacy and Helpfulness in LLM Responses to Privacy-Sensitive Scenarios [10.1] 本稿では,プライバシに敏感なシナリオに反応する大規模言語モデルにおいて,ユーザがプライバシ保護の質や有用性をどのように感じているかを示す。
以上の結果から,プライバシを保ちながらユーザを支援するLCMの能力を測定することの必要性が示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:38:26 GMT)
Addressing Mark Imbalance in Integration-free Neural Marked Temporal Point Processes [10.0] 実世界の多くのアプリケーションにおいて,イベントマークの分布は極めて不均衡であることを示す。
そこで我々は,マーク予測を最適化するために,マーク確率を調整するしきい値を学習するしきい値抽出手法を提案する。
この手法と合わせて,まず,次に時刻を予測する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:34:35 GMT)
Lessons Learned: A Multi-Agent Framework for Code LLMs to Learn and Improve [9.9] エージェントのチームは、お互いの成功と失敗から学び、自身のパフォーマンスを改善することができる、と私たちは主張する。
本研究では,授業ベースのコラボレーションフレームワークを提案し,授業ソリケーション-バンク選択機構を設計し,学習した小さなLLMのチームがより大きなLLMを上回り得ることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:41:59 GMT)
R2-SVC: Towards Real-World Robust and Expressive Zero-shot Singing Voice Conversion [9.8] R2-SVCは堅牢で表現力豊かな歌声変換フレームワークである。
ドメイン固有歌唱データとパブリック歌唱コーパスを用いた話者表現を充実させる。
R2-SVCはクリーンかつノイズの多い条件下で複数のSVCベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:52:03 GMT)
A Style-Based Profiling Framework for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Datasets [9.8] 本稿では,合成データセットと実画像データセットの両方に基づくスタイルプロファイルを特徴付けるためのプロファイル抽出と発見フレームワークを提案する。
本フレームワークは,グラム行列に基づくスタイル抽出と,クラス内コンパクト性とクラス間分離に最適化されたメトリック学習を組み合わせて,スタイル埋め込みを抽出する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:49:56 GMT)
On the Structure of Stationary Solutions to McKean-Vlasov Equations with Applications to Noisy Transformers [9.8] 円上のマッキーン・ブラソフ方程式の定常解について研究する。
我々の主な貢献は、定常マッキーン・ブラソフ方程式とフーリエ係数上の方程式の無限次元二次系の間の解の正確な等価性を観察することにある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:28:32 GMT)
Optimizing Time Series Forecasting Architectures: A Hierarchical Neural Architecture Search Approach [9.7] 本稿では,時系列予測タスクのための階層型ニューラルネットワーク探索手法を提案する。
階層型検索空間の設計により,タスク予測用に設計された多くのアーキテクチャタイプを組み込んだ。
長期予測タスクの結果から,本手法が軽量な高性能予測アーキテクチャを探索できることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:34:12 GMT)
Adapting Multilingual Models to Code-Mixed Tasks via Model Merging [9.6] 我々は,コード混合NLPの従来の適応戦略の代替として,モデルマージについて検討した。
我々は,XLM-RとLlama-3.2-1Bモデルを用いて,英語・ヒンディー語(En-Hi)と英語・スペイン語(En-Es)の文分類(センチメントとヘイトスピーチ)課題に対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:53:54 GMT)
A Short Note on Upper Bounds for Graph Neural Operator Convergence Rate [9.5] サンプルグラフのグラノンへのスペクトル収束は、演算子レベルの収束率をもたらす。
このノートは、仮定のない既知境界、大域リプシッツ連続性、およびピースワイズ・リプシッツ連続性を要約し、仮定とレートの間のトレードオフを強調している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:28:56 GMT)
Synthesizing Efficient and Permissive Programmatic Runtime Shields for Neural Policies [9.5] ニューラルポリシーのための軽量でパーミッシブなプログラム型ランタイムシールドを合成する新しいフレームワークを提案する。
Aegisは、スケッチベースのプログラム合成問題としてランタイムシールドの探索を定式化することでこれを達成している。
現在の最先端と比較すると、イージスのシールドは時間オーバーヘッドの2.2$times$とメモリ使用量の3.9$times$である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:39:58 GMT)
Quantum Artificial Intelligence for Software Engineering: the Road Ahead [9.4] 本稿では,ソフトウェア工学における量子AI(QAI)の適用に向けたロードマップを示す。
量子最適化アルゴリズム(quantum optimization algorithm)と量子機械学習(quantum machine learning)の2つの主要なカテゴリについて考察する。
ソフトウェアエンジニアリングへのQAIの適用を成功させるためには、対処すべき課題のいくつかについて概説する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:17:51 GMT)
UMoE: Unifying Attention and FFN with Shared Experts [9.3] 本稿では,アテンションモジュール内のFFN様構造を明らかにする,新しいアテンション機構の再構成を提案する。
提案アーキテクチャであるUMoEは、FFNとアテンションコンポーネント間の効率的なパラメータ共有を実現するとともに、アテンションベースのMoE層による優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:59:10 GMT)
Text to Band Gap: Pre-trained Language Models as Encoders for Semiconductor Band Gap Prediction [9.3] 本稿では,半導体材料のバンドギャップを予測するために,RoBERTa,T5,Llama-3,MatSciBERTなどのトランスフォーマーベース言語モデルについて検討する。
入力は、化学組成、結晶系、空間群、その他の構造的および電子的性質などの重要な材料特性を符号化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:31:46 GMT)
Crisis-Resilient Portfolio Management via Graph-based Spatio-Temporal Learning [9.3] グラフに基づく時間学習フレームワークCRISP(Crisis-Resilient Investment through S-temporal Patterns)を提案する。
固定トポロジー法とは異なり、CRISPは注意機構を通じてどの関係が重要かを発見する。
これにより、ダウンターン時の利益性を維持するアダプティブなポートフォリオアロケーションが可能になる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:23:15 GMT)
Rotate Both Ways: Time-and-Order RoPE for Generative Recommendation [9.3] ジェネレーティブレコメンダ(典型的にはトランスフォーマーベースの自己回帰モデル)は、ユーザのインタラクション履歴から次の項目やアクションを予測する。
適切な設計をすれば、RoPEベースのアプローチは、時間的およびシーケンシャルな情報を共同でモデル化するより強力な代替手段になり得る、と我々は主張する。
アーリーフュージョン、スプリット・バイ・ダイム、スプリット・バイ・ヘッドの3つのインスタンスを提示する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:44:56 GMT)
A New Benchmark Dataset and Mixture-of-Experts Language Models for Adversarial Natural Language Inference in Vietnamese [9.2] 既存のベトナムの自然言語推論データセットは、敵の複雑さを欠いている。
厳密な検証を施した対向的人間と機械のループアプローチを用いてViANLIを構築する。
ViANLIは1万以上の前提仮説のペアで構成され、最先端のモデルに挑戦する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:39:36 GMT)
Breaking Bad Tokens: Detoxification of LLMs Using Sparse Autoencoders [9.2] 大規模言語モデル(LLM)は現在、ユーザ向けアプリケーションではユビキタスだが、望ましくない有害な出力を生成する。
我々はスパースオートエンコーダ(SAE)を利用してモデル残差ストリームの毒性関連方向を特定し、ターゲットのアクティベーションステアリングを行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:19:01 GMT)
PlantSegNeRF: A few-shot, cross-species method for plant 3D instance point cloud reconstruction via joint-channel NeRF with multi-view image instance matching [9.2] 我々は植物セグメンテーション神経放射場(PlantSegNeRF)と呼ばれる新しいアプローチを提案する。
PlantSegNeRFは、多視点RGB画像シーケンスから、幅広い植物種に対して直接、高精度なインスタンスポイント雲を生成する。
全ての植物種で、mPrec、mRec、mCov、mWCovで平均11.7%、38.2%、32.2%、25.3%の改善を達成した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:33:48 GMT)
Meta-Learning for Cross-Task Generalization in Protein Mutation Property Prediction [9.1] モデル非依存型メタラーニング(MAML)のタンパク質突然変異特性予測への応用について紹介する。
また,シークエンスに変異を直接組み込むために,セパレータトークンを用いた新規な突然変異符号化戦略を導入する。
我々の突然変異エンコーディングは、標準的なトランスフォーマーが未知のトークンとして突然変異位置を扱い、性能を著しく低下させる限界に対処する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:09:06 GMT)
OpenEM: Large-scale multi-structural 3D datasets for electromagnetic methods [9.0] 大規模・多構造型3次元地電データセットOpenEMを提案する。
OpenEMは、単純な構成と半空間の異常な天体から、平らな層、折り畳まれた層、平坦な断層、湾曲した断層、およびそれに対応する異常な天体などのより複雑な構造まで、9つの電気モデルのカテゴリから構成される。
我々はさらに、OpenEMのためのディープラーニングベースの高速フォワードモデリングアプローチを開発し、データセット全体にわたって効率的で信頼性の高いフォワードモデリングを可能にした。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:57:56 GMT)
Space Group Equivariant Crystal Diffusion [9.0] 3次元結晶は、空間群と呼ばれる離散アイソメトリー群に不変である。
本研究では,自然に空間群制約を扱う結晶生成モデルであるSGEquiDiffを提案する。
SGEquiDiffは、標準ベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:52:51 GMT)
On the Emergence of Linear Analogies in Word Embeddings [9.0] Word2VecやGloVeのようなモデルは、テキストコーパスで$i$と$j$の単語の共起確率$P(i,j)$に基づいて単語埋め込みを構築する。
本稿では、単語を二項意味属性で定義し、共起確率を属性に基づく相互作用から導出する理論生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:17:09 GMT)
Preventing Catastrophic Forgetting: Behavior-Aware Sampling for Safer Language Model Fine-Tuning [9.0] 大きな言語モデルは、良質なデータを微調整すると、以前整列した安全行動を失うことが多い。
本稿では,2つの相補的要因に基づいて安全事例を選択する行動認識型サンプリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:34:52 GMT)
Embedding principle of homogeneous neural network for classification problem [9.0] 我々は同種ニューラルネットワークにおける関連する最大マージン問題のKKT(Karush-Kuhn-Tucker)点について検討する。
我々はtextbfKKT 点埋め込みの原理を導入・定式化し、同種ネットワークの最大マージン問題の KKT 点をより大きなネットワークの問題 KKT 点に埋め込むことができることを確認した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:26:45 GMT)
Fair Representation Learning with Controllable High Confidence Guarantees via Adversarial Inference [8.9] 本稿では,高信頼の公平性を実現するための表現学習の課題について紹介する。
本稿では,**F*air **R**epresentation learning with high-confidence **G**uarantees (FRG)* frameworkを提案する。
実世界の3つのデータセット上でFRGを実証的に評価し、その性能を6つの最先端の公正表現学習手法と比較した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:50:46 GMT)
Pre-training Epidemic Time Series Forecasters with Compartmental Prototypes [8.7] 本稿では,パンデミック予測のための最初のオープンソース事前学習モデルCAPEを提案する。
疫学的な課題を見落としている既存の時系列基盤モデルとは異なり、CAPEモデルは潜伏する人口状態のダイナミックスを流行させる。
17の疾患と50以上の領域にまたがる包括的なベンチマークでは、CAPEはゼロショット、少数ショット、フルショット予測において、強いベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:06:21 GMT)
3DReasonKnee: Advancing Grounded Reasoning in Medical Vision Language Models [8.7] 現在のビジョン・ランゲージ・モデル(VLM)は、解剖学的領域を3Dの医療画像にグラウンド・バイ・ステップで解析するのに苦労している。
既存の3Dデータセットはローカライズラベルを提供するが、この“地下推論”機能をサポートしていない。
医用画像のための最初の3Dグラウンド推論データセットである3DReasonKneeを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:54:49 GMT)
AI PB: A Grounded Generative Agent for Personalized Investment Insights [8.7] 実店舗金融に展開する生産規模の生成エージェントであるAI PBについて紹介する。
クエリに受動的に応答するリアクティブチャットボットとは異なり、AI PBは、根拠があり、準拠し、ユーザ固有の投資洞察を積極的に生成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:51:59 GMT)
Quantization-Aware Neuromorphic Architecture for Efficient Skin Disease Classification on Resource-Constrained Devices [8.6] 資源限定ハードウェア上でのインクリメンタルな皮膚病変分類のための新しい量子化対応ニューロモルフィックアーキテクチャであるQANAを紹介する。
QANAはゴーストモジュール、効率的なチャンネルアテンション、堅牢な特徴表現のためのシャープ・アンド・エキサイティングブロックを統合している。
その量子化対応ヘッドとスパイク互換変換は、スパイクニューラルネットワーク(SNN)へのシームレスな変換と、ニューロモルフィックプラットフォームへの展開を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:54:47 GMT)
AnyPcc: Compressing Any Point Cloud with a Single Universal Model [8.6] ディープラーニングベースのポイントクラウドジオメトリ圧縮において、一般化は依然として重要な課題である。
ユニバーサルポイントクラウド圧縮フレームワークであるAnyPccを紹介します。
15の多様なデータセットのベンチマークの実験では、AnyPccが新たな最先端のクラウド圧縮を設定することが確認されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:28:41 GMT)
Seeing the Unseen: Mask-Driven Positional Encoding and Strip-Convolution Context Modeling for Cross-View Object Geo-Localization [8.6] クロスビューオブジェクトジオローカライゼーションは、クロスビューマッチングによる高精度オブジェクトローカライゼーションを可能にする。
既存の手法はキーポイントに基づく位置符号化に依存しており、オブジェクトの形状情報を無視しながら2次元座標のみをキャプチャする。
空間座標と物体シルエットの両方を捕捉するために分割マスクを利用するマスクベースの位置符号化方式を提案する。
EDGeoは、堅牢なクロスビューオブジェクトジオローカライズのためのエンドツーエンドフレームワークである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:07:07 GMT)
Race and Gender in LLM-Generated Personas: A Large-Scale Audit of 41 Occupations [8.5] 我々は、米国の41の職種を対象に、150万人以上の職種を対象に大規模な監査を行った。
白人(-31pp)、黒人(-9pp)、ヒスパニック人(+17pp)、アジア人(+12pp)が過剰に代表される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:43:08 GMT)
On the Detectability of LLM-Generated Text: What Exactly Is LLM-Generated Text? [8.5] ターゲットの一貫性や正確な定義、すなわち「LLM生成テキスト」は存在しない。
一般的に検出対象と見なされるものは、通常、LLMが生成可能なテキストのサブセットのみを表す。
既存のベンチマークと評価アプローチは、実世界の検出器応用における様々な条件に適切に対応していない。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:06 GMT)
Information Theoretic Learning for Diffusion Models with Warm Start [8.5] 雑音駆動モデルに対してより厳密な確率境界が導出され、最大確率学習の精度と効率が向上する。
我々の重要な洞察は、古典的なKL分散フィッシャー情報関係を任意のノイズ摂動に拡張する。
拡散過程をガウスチャネルとして扱うことにより,提案した対象上界が負対数類似度(NLL)であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:00:59 GMT)
Endoshare: A Source Available Solution to De-Identify and Manage Surgical Videos [8.4] 低侵襲手術における内視鏡的ビデオの融合,標準化,同定のためのクロスプラットフォームアプリケーションであるEndoshareを提案する。
開発は、反復的でユーザ中心のフィードバックで、ソフトウェア開発ライフサイクルに従った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:07:58 GMT)
Automated Cloud Infrastructure-as-Code Reconciliation with AI Agents [8.4] NSyncは、IaCプログラムへの帯域外変更を伝達するIaC和解のための自動化システムである。
NSyncはAPIトレースからの洞察を抽出してドリフトを検出する(つまり、非IaCの変更)。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:57:00 GMT)
Statistical Inference for Generative Model Comparison [8.4] 本研究では,異なる生成モデルがテストサンプルの分布にどの程度近いかを比較する手法を開発した。
提案手法では,生成モデルと未知のテスト分布との距離を測定するためにKL(Kullback-Leibler)偏差を用いる。
条件付き生成モデルの比較に拡張し、Edgeworth拡張を利用して限定データ設定に対処する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:55:52 GMT)
Classport: Designing Runtime Dependency Introspection for Java [8.3] イントロスペクション(introspection)、すなわち、プログラム実行中にどの依存関係が使われているかを監視する能力は、ソフトウェアサプライチェーンセキュリティの基本である。
この問題はJavaクラスファイルに依存性情報を埋め込むシステムであるClassportで解決し、実行時に依存性情報の検索を可能にする。
実世界の6つのプロジェクトでClassportを評価し,実行時の依存関係の特定の可能性を示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:39:30 GMT)
Teacher Demonstrations in a BabyLM's Zone of Proximal Development for Contingent Multi-Turn Interaction [8.2] 1億語で訓練されたBabyLMにおいて,マルチターンの並行性をベンチマークし,改善するフレームワークであるContingentChatを紹介する。
適応型教師復号方式による実験では、追加の利得が限られている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:29:23 GMT)
Statistical Inference for Linear Functionals of Online SGD in High-dimensional Linear Regression [7.9] 勾配降下 (SGD) は、データ科学者のツールボックスにおいて重要な方法として登場した。
我々は,オンラインSGDの線形汎関数に対する高次元中心極限定理(CLT)を確立し,非等方的ガウス入力を用いた過度な最小二乗回帰を行う。
我々は,CLTに現れる分散項を推定するオンライン手法を開発し,開発したオンライン推定器の高確率バウンダリを確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:13:46 GMT)
Depth-Bounds for Neural Networks via the Braid Arrangement [7.9] 我々は、$d$数値の最大値を表すのに必要な$Omega(loglog d)$ hidden layerの非定数な下界を証明する。
ランク3の最大化層とランク2の最大化層が続くと、最大7個の数を表すのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:01:19 GMT)
Radar-Camera Fused Multi-Object Tracking: Online Calibration and Common Feature [7.8] 本稿では,レーダとカメラデータを融合して追跡効率を高めるマルチオブジェクト追跡(MOT)フレームワークを提案する。
我々は,レーダカメラの共通機能の統合と,MOTを実現するためのオンラインキャリブレーションの活用を初めて検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:54:57 GMT)
GuitarFlow: Realistic Electric Guitar Synthesis From Tablatures via Flow Matching and Style Transfer [7.7] 本稿では,エレキギター合成に特化したモデルであるGuitarFlowを紹介する。
生成プロセスは、ユビキタスで直感的なギター固有の記号形式であるタブラを用いてガイドされる。
タトゥールから生成したギター・オーディオのリアリズムに顕著な改善が認められた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:31:41 GMT)
Global Dynamics of Heavy-Tailed SGDs in Nonconvex Loss Landscape: Characterization and Control [7.7] 勾配降下(SGD)とその変種は現代の人工知能を可能にする。
SGDは、ロスランドスケープの急激な局所的なミニマを回避できる好奇心を持っていると広く信じられている。
我々は、深層学習において驚くべき現象を明らかにし、訓練期間中に重く尾のノイズを注入し、取り除くことにより、SGDはシャープ・ミニマをほぼ完全に回避することができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:01:29 GMT)
Privacy Protection of Automotive Location Data Based on Format-Preserving Encryption of Geographical Coordinates [7.6] 本稿では,地理座標のフォーマット保存暗号化(FPE)に基づく,高精度なプライバシ保護機構を提案する。
実験の結果, 平均相対的距離保持率(RDR)は0.0844に達し, 臨界領域のホットスポット数は暗号化後98.9%減少した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:39:59 GMT)
In-DRAM True Random Number Generation Using Simultaneous Multiple-Row Activation: An Experimental Study of Real DRAM Chips [7.5] 商用オフザシェルフ(COTS)DRAMチップでは、高いスループットと低レイテンシで真の乱数を生成することができる。
我々は,SiMRAの真のランダム生成ポテンシャルをエントロピー,レイテンシ,スループットの観点から厳密に分析する。
試験されたほとんどのモジュールでは、32列活性化のエントロピーは2列活性化のエントロピーよりも2.51倍高い。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:54:58 GMT)
Monocular Visual 8D Pose Estimation for Articulated Bicycles and Cyclists [7.5] 6次元ポーズ法は, 剛体自転車の3次元回転と翻訳を推定できるが, 自転車の操舵/ペダル角度が変化すると6次元は不十分になる。
本研究では,1枚のRGB画像から,自転車とサイクリストのカテゴリーレベルの8Dポーズ推定手法を提案する。
提案モデルでは,8次元ポーズと3次元キーポイントを共同で推定し,合成画像と実画像データを組み合わせて実画像の一般化を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:17:22 GMT)
Neural Networks for Censored Expectile Regression Based on Data Augmentation [7.4] 異種検閲データのモデリングのためのデータ拡張に基づくERNNアルゴリズムであるDAERNNを提案する。
シミュレーション研究と実データ応用により、DAERNNは既存の検閲されたERNNよりも優れており、完全に観測されたデータに基づいて訓練されたモデルに匹敵する予測性能が得られることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:42:23 GMT)
Fusing Narrative Semantics for Financial Volatility Forecasting [7.4] M2VNは、金融変動予測のための新しいディープラーニングベースのフレームワークである。
時系列機能を構造化されていないニュースデータと統合する。
大規模な実験により、M2VNは既存のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:13:46 GMT)
Convergence Analysis of SGD under Expected Smoothness [7.3] 勾配降下(SGD)は大規模学習の成果であるが、古典的な分析は強すぎる(有界な分散)か粗い(一様雑音)のどちらかの仮定に依存している。
期待滑らか性(ES)条件は、目標値と全勾配に勾配の第2モーメントを結びつけるフレキシブルな代替手段として現れている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:39:57 GMT)
Multilingual LLM Prompting Strategies for Medical English-Vietnamese Machine Translation [7.2] 医療用英語-ベトナム語機械翻訳(En-Vi MT)は、ベトナムにおける医療アクセスとコミュニケーションに不可欠である。
我々は,MedEVデータセット上で6つの多言語LLM(0.5B-9Bパラメータ)のプロンプト戦略を評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:55:37 GMT)
Rebellious Student: A Complementary Learning Framework for Background Feature Enhancement in Hyperspectral Anomaly Detection [7.2] 補完的な特徴学習のための新しい「反逆的な学生」フレームワークを導入する。
模擬による従来の教師学生パラダイムとは違って,本手法は空間枝を意図的に訓練し,スペクトル教師から逸脱させる。
このフレームワークは、スペクトル背景と空間背景の両方を拡張し、パラメータフリーおよびトレーニング不要な異常検出を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:53:25 GMT)
NeuPerm: Disrupting Malware Hidden in Neural Network Parameters by Leveraging Permutation Symmetry [7.2] モデル共有は、悪意のある目的のためにモデルを活用するサイバー脅威にエンドユーザーをさらけ出す。
我々はニューラルネットワークの置換対称性の理論的特性を利用して,そのようなマルウェアを破壊する方法であるNeuPermを提案する。
提案手法は, モデル性能にはほとんど影響を与えず, 現状の攻撃を妨害する効果を実証的に示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:08:10 GMT)
Spectral Analysis of Representational Similarity with Limited Neurons [7.1] 神経の類似性は、有限個のニューロンサンプリングで体系的に過小評価されている。
個体群レベルでの類似性を推定し,小さなニューロンサンプルでも正確な分析が可能となった。
理論的予測は、合成データセットと実データセットで検証される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:12:44 GMT)
A Principle-based Framework for the Development and Evaluation of Large Language Models for Health and Wellness [7.1] 本稿では,個人の健康データを解釈するための大規模言語モデル(LLM)システムであるFitbit Insightsエクスプローラの開発について述べる。
安全性、有用性、正確性、妥当性、パーソナライゼーション(SHARP)の原則に基づくフレームワークを導入している。
一般論者や臨床専門家による人的評価、オートラッター評価、敵対的検査を含む総合的な評価技術を統合する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:54:33 GMT)
Beyond Accuracy: Rethinking Hallucination and Regulatory Response in Generative AI [7.1] 生成AIにおける幻覚は、しばしば、実際正しい出力を生成する技術的失敗として扱われる。
本稿では, 規制と評価の枠組みが幻覚の狭い見方をいかに受け継いだのかを批判的に考察する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:49:56 GMT)
Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code [6.9] 大規模言語モデル(LLM)は、計画タスクの詳細な定義を伴っても、確実に計画に失敗する。
サイズが大きくなるような配布外タスクであっても、LCMを使って正確な計画を生成する方法を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:14:42 GMT)
From Counterfactuals to Trees: Competitive Analysis of Model Extraction Attacks [6.9] モデル再構成のリスクと本質的な複雑さを形式化し特徴付ける。
本稿では,競合解析のレンズによるモデル抽出攻撃の最初の公式解析について述べる。
我々は、常に強い性能を示しながら、証明可能な完全性を達成する新しい再構成アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:51:09 GMT)
Can Current Detectors Catch Face-to-Voice Deepfake Attacks? [6.8] FOICEは、音声サンプルを必要とせず、単一の顔画像から被害者の声を生成する。
これは、顔画像が音声サンプルよりも敵が入手しやすいという深刻なセキュリティ上の懸念を引き起こす。
本報告では,FOICE検出の系統的評価を行い,先行検出器が標準条件と雑音条件の両方で連続的に故障することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:24:55 GMT)
Online Regularized Statistical Learning in Reproducing Kernel Hilbert Space With Non-Stationary Data [6.7] 非定常オンラインデータストリームを用いた再生カーネルヒルベルト空間(RKHS)における正規化学習アルゴリズムについて検討した。
正則化経路が徐々に変化している場合,追跡誤差は平均正方形で消失することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:32:49 GMT)
Feedback Lunch: Deep Feedback Codes for Wiretap Channels [6.7] 本研究は,ガウシアン・ワイヤタップ・チャネルの出力フィードバックを生かしたモジュール型設計に焦点をあてる。
通信信頼性と情報漏洩のトレードオフについて検討し、フィードバックによって当事者間で共有される秘密鍵に合意できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:34:55 GMT)
TriQuest:An AI Copilot-Powered Platform for Interdisciplinary Curriculum Design [6.7] 学際的な教育は近代的なカリキュラム改革の基盤となっているが、その実践は知識統合と時間を要する授業計画の課題によって妨げられている。
これらの問題を解決するために設計されたAI-コパイロットプラットフォームであるTriQuestを紹介します。
TriQuestは、直感的なGUIを通じて大きな言語モデルと知識グラフを使用して、教師が高品質な学際的な授業プランを効率的に作成するのに役立つ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:54:51 GMT)
Scaling can lead to compositional generalization [6.7] スケーリングデータとモデルサイズが構成一般化に繋がることを示す。
トレーニング分布がタスク空間を十分にカバーしている限り、これは異なるタスクエンコーディングにまたがることを示す。
ネットワークが構成的一般化に成功すれば、タスクの構成成分が隠れたアクティベーションから線形に復号化できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:50:14 GMT)
Hierarchical Dual-Head Model for Suicide Risk Assessment via MentalRoBERTa [6.6] ソーシャルメディアプラットフォームは自殺リスクを特定する重要な情報源となっているが、自動検出システムは課題に直面している。
本稿では、自殺リスク分類のためのMentalRoBERTaに基づく階層型デュアルヘッドニューラルネットワークを、指標、アイデア、行動、試行の4つのレベルに分類する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:06:34 GMT)
Wasserstein Transfer Learning [6.6] 本稿では,ワッサーシュタイン空間に分布する確率分布を出力とする回帰モデルのための新しい伝達学習フレームワークを提案する。
本稿では,領域類似度が伝達効率に与える影響を定量化するために,証明可能な収束率を持つ推定器を提案する。
情報的サブセットが不明な場合には、負の転送を緩和するデータ駆動型転送学習手法を開発する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:14:43 GMT)
SLIM: Stochastic Learning and Inference in Overidentified Models [6.6] 非線形GMMのためのスケーラブルな近似フレームワークSLIM(Stochastic Learning and Inference in overidentified Models)を提案する。
SLIMは、モーメントとその誘導体の独立したミニバッチから反復的に更新し、ほとんど周知の収束を保証する不偏方向を生成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:50:35 GMT)
CSU-PCAST: A Dual-Branch Transformer Framework for medium-range ensemble Precipitation Forecasting [6.5] 本研究では,多段階降水予測のための深層学習に基づくアンサンブルフレームワークを開発する。
アーキテクチャはパッチベースのSwin Transformerのバックボーンを使用し、周期的な畳み込みによって長手連続性を扱う。
トレーニングは、CRPS(Continuous Ranked Probability Score)と重み付きlog1p平均二乗誤差(log1pMSE)を組み合わせたハイブリッド損失を最小限にする
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:43:38 GMT)
Input Matters: Evaluating Input Structure's Impact on LLM Summaries of Sports Play-by-Play [6.5] NBAプレイ・バイ・プレイデータのLLM生成サマリーにおいて,入力構造が幻覚やその他の事実誤差に与える影響を定量化する。
2つのモデルで生成した180のゲームサマリーに対して,手動で3,312の事実誤りを警告した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:36:23 GMT)
How Ensembles of Distilled Policies Improve Generalisation in Reinforcement Learning [6.5] 強化学習の目標は、エージェントを一定の訓練環境上で訓練し、類似の、しかし目に見えない、テスト環境に一般化できるようにすることである。
以前の研究は、訓練後の政策蒸留が、テスト環境でのオリジナルよりも優れたポリシーを創出できることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:25:17 GMT)
Optimal Control for Transformer Architectures: Enhancing Generalization, Robustness and Efficiency [6.4] 最適制御理論の観点からトランスフォーマーを考察し、連続時間定式化のツールを用いて、トレーニングとアーキテクチャ設計に関する実用的な洞察を導出する。
このフレームワークは、一般化や堅牢性を含む望ましい理論的保証を提供しながら、既存のTransformerモデルの性能を改善している。
我々は,テキスト生成,感情分析,画像分類,点雲分類を動機とするタスクについて,広範囲にわたる7つの実験を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:48:33 GMT)
GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning [6.4] 強化学習がRAG(Regegration-augmented Generation)の改善を約束している。
マルチホップQAにおけるグローバル推論を強化するための強化学習フレームワークであるGlobalRAGを提案する。
GlobalRAGは質問をサブゴールに分解し、推論と検索をコーディネートし、証拠を反復的に精査する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:35:02 GMT)
GPU Memory Requirement Prediction for Deep Learning Task Based on Bidirectional Gated Recurrent Unit Optimization Transformer [6.4] 本稿では,双方向ゲートリカレントユニット(BiGRU)を統合し,トランスフォーマーアーキテクチャを最適化するディープラーニングモデルを提案する。
平均絶対誤差(MAE)と決定係数(R2)の指標では、モデルも良好に動作し、結果はバランスよく安定している。
予測精度は従来の機械学習手法に比べて大幅に改善されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:20:35 GMT)
Dynamic Weight Adjustment for Knowledge Distillation: Leveraging Vision Transformer for High-Accuracy Lung Cancer Detection and Real-Time Deployment [6.4] FuzzyDistillViT-MobileNetモデルは肺がん(LC)分類の新しいアプローチである。
本手法は, ファジィ論理を用いて蒸留重量を動的に調整し, 生徒が高信頼領域に集中できるようにする。
教師モデルとして視覚変換器(ViT-B32)を用い,学生モデルであるMobileNetに効果的に知識を伝達する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:19:52 GMT)
On Multiple Robustness of Proximal Dynamic Treatment Regimes [6.4] 逐次ランダム化試行を通して最適な動的治療体制を推定することは、コストと倫理的ハードルに直面する可能性がある。
不確定な仮定が失敗した場合に最適な動的治療体制を学習するための近因性推論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:38:40 GMT)
A primal-dual algorithm for image reconstruction with input-convex neural network regularizers [6.4] データ駆動の変分フレームワークにおける最適化問題に対処する。
問題を再構成し,ネットワークのネスト構造を除去する。
この改定は元の変分問題と等価であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:56:20 GMT)
Out-of-distribution Tests Reveal Compositionality in Chess Transformers [6.4] 我々は、270Mパラメータチェス変換器を訓練し、系統的な一般化の失敗を明らかにするために、配布外シナリオでそれをテストする。
分析の結果,トランスフォーマーは強い規則外挿法によって証明されるように,構成的一般化を示すことが示された。
より難しいテストでは、チェスの変種であるチェス960など、部品の開始位置がランダム化される変種について、モデルを評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:51:28 GMT)
Iso-Riemannian Optimization on Learned Data Manifolds [6.3] アイソ・リーマン幾何学を用いた学習データ多様体の最適化のための原理的フレームワークを提案する。
提案手法は,解釈可能なバリセンタ,クラスタリングの改善,逆問題に対する効率の良い解が得られることを示す。
これらの結果は、アイソ・リーマン幾何学の下での最適化が、学習された多様体の写像に固有の歪みを克服できることを証明している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:34:55 GMT)
A Physics-Informed Neural Network Approach for UAV Path Planning in Dynamic Environments [6.3] ダイナミック・ウィンドフィールドで運用される無人航空機(UAV)は、安全でエネルギー効率の良い軌道を生成する必要がある。
A* や Kinodynamic RRT* のような伝統的なプランナーは、離散化やサンプリング制限のため、しばしば準最適または非滑らかな経路をもたらす。
本稿では,UAV力学,風乱,障害物回避を直接学習プロセスに組み込む物理インフォームドニューラルネットワーク(PINN)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:42:07 GMT)
PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks [6.3] トレーニングされたニューラルネットワークモデルからトレーニングデータの特定の部分(すなわち未学習)を取り除くことが望ましい。
既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。
我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:07:54 GMT)
Instrument-based quantum resources: quantification, hierarchies and towards constructing resource theories [6.2] 量子資源理論は、これらの資源を定量的かつ厳密に研究するためのエレガントな枠組みを提供する。
多くの状態ベース量子資源理論が既に研究されているが、器質ベースの資源理論はほとんど解明されていない。
本稿では,(1)情報保存性の資源理論,(2)(強)絡み合いの資源理論,(3)(強)非互換性の資源理論,(4)従来の非互換性の資源理論,(5)並列不互換性の資源理論について考察する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:47:07 GMT)
Solving 0-1 Integer Programs with Unknown Knapsack Constraints Using Membership Oracles [6.2] 我々は、未知の制約に対して、メンバシップオラクルを用いて未知のknapsack制約で最適化問題を解くことを検討する。
意思決定者の目標は、オラクルの呼び出し数に関する予算の対象となる最善の解決策を見つけることである。
サポートベクトルマシン(SVM)に基づくバイナリ分類のためのアクティブラーニングに着想を得て,線形制約の学習と活用による問題解決のための枠組みを考案した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:10:27 GMT)
Fréchet Power-Scenario Distance: A Metric for Evaluating Generative AI Models across Multiple Time-Scales in Smart Grids [6.2] このような合成データを利用する上で重要な課題は、このような生成モデルから生成されたデータ品質を評価する方法である。
伝統的なユークリッド距離に基づく測度は、2つのサンプル間のペアワイズ関係のみを反映している。
学習した特徴空間内の2つのデータセット間で推定されるFr'echet Distanceに基づく新しいメトリクスを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:54:25 GMT)
Using Large Language Models for Abstraction of Planning Domains - Extended Version [6.0] PDDLにおけるエージェントの具体的な振る舞いをモデル化し、大規模言語モデル(LLM)を用いた文脈内学習の利用について検討する。
代替具体的なアクションの選択の抽象化、具体的なアクションのシーケンスの抽象化、アクション/述語パラメータの抽象化の3つのカテゴリについて検討する。
生成された抽象PDDLドメインと問題インスタンスは、シンボル検証ツールと人間の専門家によってチェックされる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:27:03 GMT)
NeoDictaBERT: Pushing the Frontier of BERT models for Hebrew [6.0] 我々はNeoDictaBERTとNeoDictaBERT-bilingualを紹介した。
我々は,ヘブライNLPにおける研究・開発を進めるための目標の一環として,トレーニングプロセスと各種ベンチマークの報告結果をコミュニティにリリースする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:34:53 GMT)
Concentration and excess risk bounds for imbalanced classification with synthetic oversampling [6.0] 我々は,合成データに基づいて分類器を訓練する際のSMOTEとその関連手法の挙動を解析するための理論的枠組みを開発する。
その結果、SMOTEと下流学習アルゴリズムの両方のパラメータチューニングの実践的ガイドラインが導かれる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:12:51 GMT)
Explainable Benchmarking through the Lense of Concept Learning [6.0] 本稿では,新しいタイプのベンチマークについて論じる。
説明可能なベンチマーク手法の目的は、ベンチマークにおけるシステムの性能に関する説明を自動的に生成することである。
PruneCELと呼ばれる大規模知識グラフのために開発された新しい概念学習手法を用いて説明を求める。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:20:20 GMT)
GRACE: GRaph-based Addiction Care prEdiction [5.9] 現在の意思決定アプローチは、中毒データセットの深刻なクラス不均衡に悩まされている。
構造化学習問題としてケア予測の軌跡を形式化する新しいグラフニューラルネットワーク(GRACE)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:48:01 GMT)
Parametric Phase Modulation in Superconducting Circuits [5.9] パラメトリック変調は量子シミュレーションや高忠実度2ビットゲートの超伝導回路で広く用いられている。
2つの結合量子ビットに印加されるパラメトリックフラックスパルス間の相対位相を調整することで相互作用強度を調整できる位相変調方式を提案し,実装する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:24:06 GMT)
Video Consistency Distance: Enhancing Temporal Consistency for Image-to-Video Generation via Reward-Based Fine-Tuning [5.8] ビデオ拡散モデルの逆ベース微調整は、生成ビデオの品質向上に有効な手法である。
本稿では,時間的一貫性を高めるために,ビデオ一貫性距離(VCD, Video Consistency Distance)を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:07:25 GMT)
GUIDE: Enhancing Gradient Inversion Attacks in Federated Learning with Denoising Models [5.8] フェデレートラーニング(FL)は、プライバシを保護しながら、複数のクライアントにわたる機械学習(ML)モデルの協調トレーニングを可能にする。
本稿では,拡散モデルをデノナイズツールとして活用し,FLにおける画像再構成攻撃を改善する新しい手法であるGUIDEを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:28:35 GMT)
Fast-Slow Thinking GRPO for Large Vision-Language Model Reasoning [5.8] FAST-GRPOはGRPOの変種であり,質問特性に基づいて推論深度を動的に適応する。
その結果,FASTの精度は,ベースモデルと比較して10%以上向上していることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:25:28 GMT)
Comparing quantum and classical Monte Carlo algorithms for estimating Betti numbers of clique complexes [5.8] クリプト錯体上のベッチ数推定(BNE)のための量子および古典モンテカルロアルゴリズムについて概説する。
与えられた精度に達するために必要なサンプルの数に対して上限を導出し、これらのアルゴリズムを比較する。
サンプルの複雑性に指数関数的に依存する新しい量子アルゴリズムを作成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:55:16 GMT)
Scalable inference of functional neural connectivity at submillisecond timescales [5.7] Poisson Generalized Linear Model (GLM)は、ニューラルスパイクトレインデータを分析するツールである。
標準実装では、スパイクタイムをバイナリカウントデータに離散化し、時間分解能とスケーラビリティを制限している。
ここではモンテカルロ法(MC)法と近似法(PA)をこれらのモデルの連続的時間的類似に対して開発し,それらの離散的時間的類似よりも有利であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:53:00 GMT)
JAMUN: Bridging Smoothed Molecular Dynamics and Score-Based Learning for Conformational Ensembles [5.7] JAMUNは分子の全原子3D配座の滑らかでノイズの多い空間で分子動力学を行う。
これは、従来の分子動力学よりも桁違いの速度で小さなペプチドのアンサンブル生成を可能にする。
JAMUNの物理的先行性は、トレーニングデータ以外のシステムへの転送を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:16:59 GMT)
Imaging magnetic flux trapping in lanthanum hydride using diamond quantum sensors [5.7] 水素化ランタンは、約250Kの超伝導のサインにより近年注目されている。
メガバール圧力は、その状態の合成と維持に必要なもので、実験には特別な課題がある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:41:58 GMT)
Approximate Replicability in Learning [5.6] そこで本研究では,PAC学習における再現性の自然な緩和を3つ提案する。
一定の再現性パラメータに対して、サンプル最適PAC学習者を得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:36:01 GMT)
Controlling the Flow: Stability and Convergence for Stochastic Gradient Descent with Decaying Regularization [5.6] 我々は、余分な有界性仮定を伴わない元の問題の最小ノルム解に対して、reg-SGDの強い収束性を証明する。
分析の結果,Tikhonov正則化がSGDの流れを制御し,安定した学習力学が得られることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:21:56 GMT)
SafeFFI: Efficient Sanitization at the Boundary Between Safe and Unsafe Code in Rust and Mixed-Language Applications [5.6] 安全でないRustコードは、C/C++ライブラリとの相互運用性と低レベルのデータ構造を実装するために必要である。
Sanitizerは、実行時にそのようなメモリエラーをキャッチできるが、Rustの型システムによって安全性が保証されているメモリアクセスに対しても、多くの不要なチェックを導入する。
我々は,Rustバイナリにおけるメモリ安全機器の最適化システムであるSafeFFIを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:02:45 GMT)
Revealing the True Indicators: Understanding and Improving IoC Extraction From Threat Reports [5.5] 我々は,IoC抽出のためのHuman-in-the-loopパイプラインを初めて導入する。
我々のシステムは、説明可能な文脈対応ラベル付けにより精度を向上する。
PRISMは、現実世界の50件の脅威レポートから1,791件のIoCをラベル付けした、高品質で公開可能なベンチマークです。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:05:48 GMT)
The Parameterized Complexity of Computing the VC-Dimension [5.5] VC次元(VC-dimension)は、機械学習の多くの領域の中心となる集合系(またはハイパーグラフ)のよく研究され基礎的な複雑性尺度である。
ETH(Exponential Time hypothesis)の下では,2$mathcalO(mathcalV|)$-timeアルゴリズムが厳密であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:56:40 GMT)
Stochastic gradient descent in high dimensions for multi-spiked tensor PCA [5.5] マルチスパイクテンソルモデルに対するオンライン勾配降下(SGD)のダイナミクスについて検討する。
我々は、スパイクが「逐次除去」と呼ばれるプロセスで順次回収されることを発見した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:14:11 GMT)
Classical Noise Inversion: A Practical and Optimal framework for Robust Quantum Applications [5.4] 量子エラー軽減は、ノイズの多い量子プロセッサから信頼性の高い計算を抽出するための重要な技術である。
量子回路からのサンプリングの膨大なコストと、ゲート非依存ノイズのような非現実的な仮定に依存しているため、これは妨げられている。
ここでは、これらの決定的な制限を根本的に回避し、様々な量子アプリケーションに適したフレームワークであるClassical Noise Inversion (CNI)を紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:59:04 GMT)
A Geometric Analysis of PCA [5.4] 我々はPCAによって推定される主部分空間の誤差に対する中心極限定理を確立する。
回復するPCAの過剰リスクの非漸近的上限を得る。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:15:26 GMT)
MAC Aggregation over Lossy Channels in DTLS 1.3 [5.2] Aggregating Message Authentication Codes (MACs)は、リソース制約のある環境で貴重な帯域幅を節約することを約束する。
我々は,Datagram Transport Layer Security (DTLS) 1.3 プロトコル用のMACアグリゲーション拡張を設計する。
MACアグリゲーションは、出力を50%増加させ、ショートメッセージの送信に最大17%のエネルギー消費を節約できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:42:07 GMT)
Automated Extraction of Fluoropyrimidine Treatment and Treatment-Related Toxicities from Clinical Notes Using Natural Language Processing [5.1] フルオロピリミジンは大腸癌や乳癌に広く処方されているが、手足症候群や心毒性などの毒性と関連している。
毒性ドキュメンテーションは臨床ノートに埋もれていることが多いので, 治療や毒性情報を抽出する自然言語処理法(NLP)を開発し, 評価することを目的とした。
成人腫瘍学患者204,165名を対象に,ゴールド・スタンダード・データセットを作成した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:44:39 GMT)
An Ensembled Penalized Federated Learning Framework for Falling People Detection [5.1] 従来の転倒検出アプローチは、一般化可能性の制限、データプライバシの懸念、個人の動作の多様性といった重要な課題に悩まされることが多い。
本稿では,連続学習,パーソナライズドモデリング,SWA(Specialized Weighted Aggregation)戦略を統合したEPFL-an Ensembled Penalized Federated Learningフレームワークを提案する。
EPFLは、ウェアラブルセンサーデータを活用して、シーケンシャルな動きパターンをキャプチャし、均質な暗号化とフェデレートされたトレーニングを通じてユーザのプライバシを保存する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:37:19 GMT)
A Coherence-Based Measure of AGI [5.0] 一般的な知性は、すべての本質的な領域におけるバランスの取れた能力を反映すべきである。
本稿では、補償可能性指数の連続体上での一般化された手段の積分に基づくAGIのコヒーレンス対応尺度を提案する。
特殊化に報いる算術平均とは異なり、AUCは不均衡を罰し、ドメイン間の依存関係をキャプチャする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:51:42 GMT)
Identification and Debiased Learning of Causal Effects with General Instrumental Variables [5.0] マルチカテゴリまたは連続的な機器変数を用いた識別と学習のための一般的な非パラメトリックフレームワークを開発する。
偏りのある機械学習を用いて、一貫性のある、効率的で正常な推定器を導出する。
本研究では,シミュレーション研究を取り入れ,職種訓練パートナーシップ法プログラムから得られた実データを分析することで,提案手法を実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:10:11 GMT)
DeepTx: Real-Time Transaction Risk Analysis via Multi-Modal Features and LLM Reasoning [5.0] 本稿では,ユーザの確認前にその脅威を検出するリアルタイムトランザクション分析システムDeepTxを提案する。
DeepTxは保留中のトランザクションをシミュレートし、振る舞い、コンテキスト、UI機能を抽出し、トランザクションの意図を推論するために複数の大規模言語モデル(LLM)を使用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:22:39 GMT)
Communication Platform for Non-verbal Autistic children in Oman using Android mobile [5.0] 本論文プロジェクトは,非言語自閉症児のコミュニケーションを支援するために,WebパネルとAndroidモバイルアプリケーションを備えたプラットフォームを開発することを提案する。
このケースで特定される主な問題は、断片化されたアプローチが自閉症の子供には適さないことである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:27:47 GMT)
Connecting Jensen-Shannon and Kullback-Leibler Divergences: A New Bound for Representation Learning [4.9] 相互情報(英: Mutual Information)は、表現学習において広く用いられる統計依存の基本的な尺度である。
一般の場合, KLD 上の新しい, タイトで, トラクタブルなローバウンドを JSD の関数として導出する。
この結果は,MIに基づく表現学習における識別学習の新たな理論的正当化と強力な実証的証拠を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:18:12 GMT)
Are Stereotypes Leading LLMs' Zero-Shot Stance Detection ? [4.9] 大規模言語モデルは、事前訓練されたデータからステレオタイプを継承し、特定の社会グループに対して偏見のある行動をもたらす。
本稿では,ゼロショット環境でスタンス検出を行う場合の大規模言語モデルのバイアスに着目した。
LLMは、文章の複雑さの低いマリファナの見方と、ドナルド・トランプに反対するアフリカ系アメリカ人の方言とを誤って関連付けるなど、スタンス検出タスクにおいて重要なステレオタイプを示すことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:05:25 GMT)
Enhancing Interpretability in Deep Reinforcement Learning through Semantic Clustering [4.9] セマンティッククラスタリング(セマンティッククラスタリング)とは、ニューラルネットワークが特徴空間におけるセマンティックな類似性に基づいて入力をクラスタリングする能力である。
本稿では,特徴量削減とオンラインクラスタリングを組み合わせた新しいセマンティッククラスタリングモジュールを組み込んだDRLアーキテクチャを提案する。
提案モジュールの有効性を実験的に検証し,DRL内のセマンティッククラスタリング特性を明らかにする能力を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:10:52 GMT)
StableSketcher: Enhancing Diffusion Model for Pixel-based Sketch Generation via Visual Question Answering Feedback [4.9] 本研究では,手書きスケッチを高速に作成するための拡散モデルを実現する新しいフレームワークであるStableSketcherを提案する。
変分オートエンコーダを微調整して潜時デコーディングを最適化し、スケッチの特徴をよりよく捉えます。
並行して、視覚的質問応答に基づく強化学習のための新たな報酬関数を統合し、テキスト画像のアライメントと意味的一貫性を改善した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:27:32 GMT)
Multisetting protocol for Bell correlated states detection with spin-$f$ systems [4.8] 本稿では,2体ベル相関検出のためのマルチセットプロトコルを提案する。
我々は、スピン-f$原子ボース=アインシュタイン凝縮体内のSU(2)サブシステムの$f$対で実現されたスピンネマティック圧縮状態に適用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:08:51 GMT)
Certified Self-Consistency: Statistical Guarantees and Test-Time Training for Reliable Reasoning in LLMs [4.8] 本稿では,大規模言語モデルにおける認証推論のための統一フレームワークを提案する。
多数決は自己整合性の統計的証明を提供することを示す。
さらに,TTRLのようなラベルなしのポストトレーニング手法が,回答分布を暗黙的に鋭くすることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:03:17 GMT)
Near optimal sample complexity for matrix and tensor normal models via geodesic convexity [4.8] 行列およびテンソル正規モデルにおける共分散行列のクロネッカー因子の推定について検討した。
我々の結果は、十分に条件が整った、あるいは疎い要因に頼らず、また、十分に正確な初期推定を仮定する必要もない。
サンプルの複雑性境界と同じ状況下では,MLEを計算するための実用的で広く用いられている反復的手法であるフリップフロップアルゴリズムが,高い確率で線形に収束することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:04:20 GMT)
Landau Polarons as Generators of Quantum-Coherent States [4.7] フェムト秒コヒーレント分光法を用いて、ポーラロン場誘起ダイナミクスをリアルタイムで追跡する。
我々は50-150 fsの時間スケールでコヒーレントな状態のスペクトルに遅延凝縮を観測した。
分裂は頑丈で、異常な線形サイズ依存を示し、単粒子分裂を超え、300Kで現れる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:43:34 GMT)
Text-conditioned State Space Model For Domain-generalized Change Detection Visual Question Answering [4.7] 変化検出法は通常、正確な解釈のために専門家の知識を必要とする。
新しいマルチモーダルおよびマルチドメインデータセットであるBrightVQAを導入し、ドメインの一般化研究を容易にする。
TCSSM(Text-Conditioned State Space Model)フレームワークは,両時間画像とジオディザスター関連テキスト情報の両方を活用するために提案されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:51:52 GMT)
Estimating time in quantum chaotic systems and black holes [4.6] 我々はカオス量子多体系の力学の新しい普遍的特徴を特徴づける。
カオス系におけるほとんどのマクロ観測可能量は、ほぼ一定の深夜値に等しい。
ホーキングの状態は常に、放射線を使って時間を推定しようとする試みに対して大きな不確実性を持っている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:44:20 GMT)
AsyncHZP: Hierarchical ZeRO Parallelism with Asynchronous Scheduling for Scalable LLM Training [4.6] 単純さとメモリ効率を維持しつつ,優れた性能を実現するために,ZeROの新しい非同期版を提案する。
非効率な通信につながるような細粒度のシャーディングを使用する従来のZeROとは異なり、AsyncHZPはパラメータ、勾配、および異なるレプリカグループ間の状態を適応的に再シャーディングする。
AsyncHZPは古典的なND並列性より一貫して優れており、複雑な戦略的チューニングなしに最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:29:35 GMT)
HHEML: Hybrid Homomorphic Encryption for Privacy-Preserving Machine Learning on Edge [4.6] プライバシ保護機械学習(PPML)は、信頼できない環境で機密データに対するセキュアな機械学習推論を処理するための、新たなトピックである。
完全同型暗号化(FHE)は、サーバ側の暗号化データ上で直接計算を可能にするが、クライアント側の重要な通信と計算オーバーヘッドを導入する。
HHEは、クライアント側の計算コストを削減するために、対称暗号(SE)とFHEを組み合わせることで、この制限に対処する。
本研究は、FHE互換に最適化された軽量対称暗号を中心に構築されたハードウェアアクセラレーションHHEアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:51:55 GMT)
Occluded nuScenes: A Multi-Sensor Dataset for Evaluating Perception Robustness in Automated Driving [4.6] Occluded nuScenesデータセットは、広く使用されているnuScenesベンチマークの新しい拡張である。
このリソースは、部分的なセンサ故障と環境干渉下での知覚モデルの一貫した再現可能な評価をサポートする。
我々は,自動運転におけるロバストなセンサフュージョン,レジリエンス解析,および安全クリティカルな認識に関する研究を進めることを目的としている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:28:52 GMT)
Towards the Formalization of a Trustworthy AI for Mining Interpretable Models explOiting Sophisticated Algorithms [4.6] 解釈可能な設計モデルは、信頼、説明責任、そして現実世界のアプリケーションにおける自動意思決定モデルの安全な採用を促進するために不可欠である。
我々は、解釈可能性と性能のバランスをとる予測モデルを生成するための包括的な方法論を定式化する。
モデル生成時の倫理的措置を評価することにより、この枠組みはAIシステムの開発のための理論的基盤を確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:54:33 GMT)
PhantomLint: Principled Detection of Hidden LLM Prompts in Structured Documents [4.4] 本稿では,構造化文書におけるLLMのインタプリタ検出に対する第一原理的アプローチを提案する。
我々はPhantomLintというプロトタイプツールにアプローチを実装しました。
我々は,PDFおよびHTML文書を含む3,402文書のコーパスに対してPhantomLintを評価し,学術論文のプリプリントやCV,これらなどをカバーする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:35:01 GMT)
Reconciling Translational Invariance and Hierarchy [4.4] マルチスケール・エンタングルメント・リノベーション・アンサッツによって総称的に説明されるギャップのない基底状態に対しては、対応する正確な可解なモデルが今のところ欠落している。
これは、MERAの階層構造が本質的に翻訳的不変性を損なうためである。
階層的なTN記述は変換不変なMPS代替によって補完され、これは相関関数のパワー-ロー崩壊と$q$-変形相転移の臨界指数を導出するために用いられる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:07:07 GMT)
How Far Have LLMs Come Toward Automated SATD Taxonomy Construction? [4.4] 開発者が技術的負債を意図的に導入する場合、それは自己許容技術的負債(SATD)と呼ばれる。
従来は、SATDコメントや周辺のコードを手動で検査する必要がある。
本研究では,大規模言語モデル(LLM)がSATDをどの程度生成できるかを検討した。
私たちは、研究者が通常従う分類学構築ステップを反映した構造化LLM駆動パイプラインを設計しました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:07:36 GMT)
EasyOcc: 3D Pseudo-Label Supervision for Fully Self-Supervised Semantic Occupancy Prediction Models [4.3] 自己監督モデルは最近、特に意味的占有率予測の領域において顕著な進歩を遂げている。
これらのモデルは、基底構造ラベルの欠如を補うために洗練された損失計算戦略を利用する。
基礎モデルである Grounded-SAM と Metric3Dv2 が生成する3次元擬似地下構造ラベルを提案し,時間情報を用いてラベルの密度化を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:37:14 GMT)
Leveraging the Power of Large Language Models in Entity Linking via Adaptive Routing and Targeted Reasoning [4.3] ARTERは、深い微調整なしで高性能を実現する構造化パイプラインを提供する。
これは、候補生成、コンテキストベースのスコアリング、適応ルーティング、選択推論を戦略的に組み合わせている。
標準ベンチマークでは、ARTERはReFinEDを最大4.47%上回り、6つのデータセットのうち5つで平均2.53%上昇している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:50:14 GMT)
From Detection to Discovery: A Closed-Loop Approach for Simultaneous and Continuous Medical Knowledge Expansion and Depression Detection on Social Media [4.3] ソーシャルメディアのユーザ生成コンテンツ(UGC)は、うつ病などの精神状態のリアルタイムで自己報告された指標を提供する。
予測と知識拡張を反復学習サイクルに統合するフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:34:36 GMT)
Customizing Open Source LLMs for Quantitative Medication Attribute Extraction across Heterogeneous EHR Systems [4.3] 鍵となる処方則属性は、異種EHRシステムにおける異なるフォーマットフィールドとフリーテキストノートに散在する。
Llama, Qwen, Gemma, MedGemma など,オープンソースの大規模言語モデル (LLM) をカスタマイズして, MOUD 処方薬属性の統一セットを抽出するフレームワークを提案する。
パイプラインは固定スキーマでレコードを直接処理し、続いて軽量な正規化とクロスフィールドチェックを行います。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:27:10 GMT)
Trapping, manipulating and probing ultracold atoms: a quantum technologies tutorial [4.1] エンジニアリングされた超低温原子系は、基本的な量子力学研究のための貴重なプラットフォームである。
ほぼゼロの絶対温度では、原子は巨視的な位相コヒーレンスと集合量子挙動を示す。
本総説は,超低温原子物理学研究の基盤となる実験ツールキットの幅広い理解を,新参者に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:54:06 GMT)
An Empirical Study of Sample Selection Strategies for Large Language Model Repair [4.1] 大規模言語モデル(LLM)は、現実世界のシステムにますます多くデプロイされている。
LLMは、安全と信頼を損なう有害または偏見のある出力を生成することができる。
ポストホックモデル修復は実用的な治療法であるが、パラメータ更新の高コストは、修理データの選択的利用を動機付けている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:02:39 GMT)
Incomplete U-Statistics of Equireplicate Designs: Berry-Esseen Bound and Efficient Construction [4.1] U統計学は、サンプル平均を一般化し、非パラメトリック統計の多くを下支えする推定器の基本的なクラスである。
本稿では,ハイパーグラフ理論と設計を基礎としたU統計学の新しい視点を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:21:54 GMT)
On Optimal Hyperparameters for Differentially Private Deep Transfer Learning [4.1] 最適な$C$と経験的結果の選択方法に関する現在の理論的理解との間には、明らかなミスマッチがある。
ひとつの$(C,B)をタスク間で設定するという一般的なプラクティスが、サブ最適パフォーマンスにつながる点を強調します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:48:03 GMT)
A Use-Case Specific Dataset for Measuring Dimensions of Responsible Performance in LLM-generated Text [4.1] 大規模言語モデル(LLM)を評価するために,実世界のアプリケーションによって駆動されるデータセットを提案する。
LLMの品質、正確性、安全性、公平性のギャップを特定するために、データの使い方を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:50:55 GMT)
Grids Often Outperform Implicit Neural Representation at Compressing Dense Signals [4.1] Inlicit Neural Representations (INRs)は近年、目覚ましい結果を示しているが、その能力、暗黙のバイアス、スケーリングの振る舞いはよく分かっていない。
本研究では,2次元および3次元の実信号と合成信号の組にまたがる多様なINRの性能について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:47:41 GMT)
Scrapers selectively respect robots.txt directives: evidence from a large-scale empirical study [4.1] ロボットによるウェブスクレイパーコンプライアンスに関する大規模な研究を初めて行った。
ボットはより厳格なロボットに対して$.$txtの指示に従う可能性が低い。
これらの結果は、望ましくないスクラップを防ぐためにロボット$.$txtファイルに頼るのは危険であり、代替アプローチの必要性を強調していることを示唆している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:52:01 GMT)
Learning Decentralized Routing Policies via Graph Attention-based Multi-Agent Reinforcement Learning in Lunar Delay-Tolerant Networks [4.0] 我々は,Lunar Delay-Tolerant Network (LDTN) の制約下で動作するマルチロボット探査ミッションのための,完全に分散化されたルーティングフレームワークを提案する。
本稿では、部分観測可能なマルコフ決定問題(POMDP)として問題を定式化し、強化訓練、分散実行(CTDE)を行うグラフ注意に基づくマルチエージェント強化学習(GAT-MARL)政策を提案する。
本手法は局所的な観測のみに依存し,最短経路や制御されたフラッディングベースアルゴリズムのような古典的アプローチとは異なり,グローバルなトポロジ更新やパケット複製を必要としない。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:13:11 GMT)
CONFEX: Uncertainty-Aware Counterfactual Explanations with Conformal Guarantees [4.0] 本研究では,不確実性を考慮した対実的説明を生成する新しい手法であるCONFEXを提案する。
CONFEXの説明は、CFX生成が交換可能性に反する問題に対処するため、ローカルなカバレッジ保証を提供するように設計されている。
各種ベンチマークやメトリクスを用いた最先端手法に対するCONFEXの評価を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:54:08 GMT)
Mitigating Manipulation and Enhancing Persuasion: A Reflective Multi-Agent Approach for Legal Argument Generation [4.0] 大規模言語モデル(LLM)は、法的議論生成のためにますます研究されている。
幻覚と未解決の説得による操作の重大なリスクを生じさせる。
本稿では,これらの課題に対処するために,新しい反射型マルチエージェント手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:35:56 GMT)
ixi-GEN: Efficient Industrial sLLMs through Domain Adaptive Continual Pretraining [4.0] オープンソースの大規模言語モデル(LLM)は、エンタープライズアプリケーションにチャンスを広げました。
多くの組織は、大規模なモデルをデプロイし、メンテナンスするインフラをまだ持っていない。
小型の大規模言語モデル(sLLM)は、固有の性能制限にもかかわらず、実用的な代替品となっている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:41:59 GMT)
Video Prediction of Dynamic Physical Simulations With Pixel-Space Spatiotemporal Transformers [4.0] 本研究は,ビデオ予測のためのトランスフォーマー適応を簡易なエンド・ツー・エンド・アプローチで検討し,種々の自己時間的アテンションレイアウトを比較した。
本稿では,自動回帰映像予測のための簡易かつ効果的な変換器を提案し,連続した画素空間表現をビデオ予測水平線に適用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:58:45 GMT)
Causal Head Gating: A Framework for Interpreting Roles of Attention Heads in Transformers [3.9] 本稿では,変圧器モデルにおける注目頭部の機能的役割を解釈するスケーラブルな方法として,因果頭部ゲーティング(CHG)を提案する。
CHGは頭上のソフトゲートを学び、タスクのパフォーマンスへの影響に基づいて因果分類を割り当てる。
以上の結果から,CHGスコアは単なる相関ではなく,アブレーションと因果媒介分析によって評価された洞察をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:48:30 GMT)
Offline Dedicated Quantum Attacks on Block Ciphers Based on Two Parallel Permutation-Based Pseudorandom Functions [3.9] Shi it et al.はXOR型関数に対する専用量子攻撃を導入した。
本稿では,TPP-PRFに基づくブロック暗号に対するオフライン量子攻撃を提案する。
以前の結果と比較すると、オフライン攻撃はクエリの複雑さを著しく減らしている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:19:02 GMT)
Online Multi-Class Selection with Group Fairness Guarantee [3.9] グループフェアネスを保証したオンラインマルチクラス選択問題について検討し、限られたリソースを逐次到着エージェントに割り当てる。
積分アルゴリズムが任意の分数解と同じ性能を確実に達成する新しい無損失丸め方式を導入する。
また、信頼できない機械学習予測を組み込んで、公平性と効率のバランスを良くする学習強化型を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:59:49 GMT)
Restoring Quantum Superiority of Noisy Quantum Illumination [3.9] 本稿では,量子ノイズの存在下での量子照明の量子優位性を回復する手法を提案する。
この結果は、量子優位性を維持する物理原理を確立し、ノイズの多い状況下で高分解能量子照明を実現するための道を開く。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:21:34 GMT)
UniSE: A Unified Framework for Decoder-only Autoregressive LM-based Speech Enhancement [3.9] 我々は、異なる音声強調タスクを処理するために、統一デコーダのみのLMベースのフレームワークUniSEを提案する。
入力音声特徴を条件として、ARモデリングを用いてターゲット音声の離散トークンを生成する。
実験により、提案したUniSEは差別的および生成的ベースラインと比較して競争力を発揮することが示された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:22:24 GMT)
TAMI: Taming Heterogeneity in Temporal Interactions for Temporal Graph Link Prediction [3.8] 時間グラフリンク予測は、その履歴的相互作用に基づいて、グラフ内のノード間の将来の相互作用を予測することを目的としている。
本稿では,ログ時間エンコーディング機能とリンク履歴アグリゲーションという2つの有効なコンポーネントを含む,TAMIと呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:14:58 GMT)
OpenMIBOOD: Open Medical Imaging Benchmarks for Out-Of-Distribution Detection [3.8] 本稿では,OpenMIBOOD(Open Medical Imaging Benchmarks for Out-Of-Distribution Detection)を紹介する。
OpenMIBOODには、さまざまな医療領域からの3つのベンチマークが含まれており、14のデータセットを、共分散内配布、近OOD、遠OODカテゴリに分割している。
その結果, 自然画像領域におけるOODベンチマークの結果は医学的応用には変換されないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:01:59 GMT)
Quantum simulation of many-body dynamics with noise-robust Trotter decomposition based on symmetric structures [3.7] Suzuki-Trotter分解は、量子ハードウェア上で量子力学をシミュレートするためのフレームワークを提供する。
本稿では,近距離デバイス上での量子力学のシミュレーションに本質的に回路効率がよい新しいトロッター分解法を提案する。
本研究は,多体力学における雑音耐性量子シミュレーションへの実践的経路を確立するものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:26:41 GMT)
Hybrid Cavity-Magnon Optomechanics: Tailoring Bipartite and Tripartite Macroscopic Entanglement [3.7] キャビティ-マグノン光学は本質的に光子とフォノンの間の非線形相互作用を与える。
本稿では,キャビティ-マグノン光学における多様な二分極と三分極の絡み合いを実現することを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:37:35 GMT)
GeoThought: A Dataset for Enhancing Mathematical Geometry Reasoning in Vision-Language Models [3.7] 6,243個のサンプルを持つGeo-Thought-6Kと10,834個のサンプルを含むGeo-Thought-Augmented-10Kの2つのサブセットからなる包括的幾何学的推論コーパスを開発した。
このデータセットを用いて,問題解決時に詳細な思考プロセスを生成する数学的推論マルチモーダルモデルGeoThought-MLLMを開発した。
我々のモデルは、幾何学的タスクにおける既存のベンチマークよりも優れており、私たちのChain-of-Thoughtデータセットによるトレーニングが、ドメイン内とドメイン外の両方で幾何学的推論能力を改善することを実証しています。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:43:54 GMT)
MEIcoder: Decoding Visual Stimuli from Neural Activity by Leveraging Most Exciting Inputs [3.6] 我々は、ニューロン特異的な最もエキサイティングな入力(MEIs)を活用する生物情報復号法であるMEIcoderを紹介する。
Meicoderは一次視覚野(V1)の単一細胞活動からの視覚刺激の再構築における最先端性能を達成する
我々はMEIcoderが1000-2,500個のニューロンから1000点未満の訓練データポイントから高忠実な自然像を再構成可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:35:34 GMT)
Do LLMs Truly Understand When a Precedent Is Overruled? [3.6] 拡張コンテキストウィンドウを持つ大規模言語モデル(LLM)は、複雑な法的推論タスクを約束する。
本稿では,米国最高裁判所事件のオーバーラリング関係の同定における最先端のLCMの評価について述べる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:07:42 GMT)
Multimedia-Aware Question Answering: A Review of Retrieval and Cross-Modal Reasoning Architectures [3.6] マルチメディアコンテンツの急速な成長により、検索強化QAの新たな課題と機会がもたらされた。
マルチメディア検索パイプラインを統合するQAシステムの最近の進歩を概観する。
クロスモーダルアライメント、レイテンシ-精度トレードオフ、セマンティックグラウンドなど、重要な課題を強調します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:25:44 GMT)
How Quickly Do Development Teams Update Their Vulnerable Dependencies? [3.5] MTTU(Mean-Time-To-Update)とMTTR(Mean-Time-To-Remediate for vulnerable dependencies)
MTTU(Mean-Time-To-Update forDependency)とMTTR(Mean-Time-To-Remediate for vulnerableDependency)という2つの新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:42:55 GMT)
Irish-BLiMP: A Linguistic Benchmark for Evaluating Human and Language Model Performance in a Low-Resource Setting [3.5] Irish-BLiMPは、アイルランド語の言語能力を評価するために設計された最初のデータセットとフレームワークである。
11の言語的特徴の分類で1020組の最小ペアを手作業で構築し、レビューしました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:36:36 GMT)
Deep Learning-Powered Visual SLAM Aimed at Assisting Visually Impaired Navigation [3.5] 提案するSELM-SLAM3は,SuperPointとLightGlueを統合した深層学習型ビジュアルSLAMフレームワークで,ロバストな特徴抽出とマッチングを行う。
本フレームワークは,低テクスチャシーンやファストモーションなどの難易度条件下での性能向上を実証し,視覚障害者のためのナビゲーション支援を開発するための信頼性の高いプラットフォームを提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:35:12 GMT)
Fine-Tuning Multilingual Language Models for Code Review: An Empirical Study on Industrial C# Projects [3.5] 本研究では,オープンソース言語モデル(LM)の性能に対する単言語微調整の実証評価について述べる。
CodeReviewer、CodeLlama-7B、DeepSeek-R1-Distillの3つの異なるモデルを、公開ベンチマークと産業リポジトリを組み合わせたC#固有のデータセットで微調整しました。
その結果, 単言語微調整は, 多言語ベースラインと比較してモデルの精度と妥当性を向上することがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:17:37 GMT)
Synthetic Data for Robust Runway Detection [3.5] 本稿では,いくつかの注釈付き実像を補完する商業飛行シミュレータに基づく画像生成手法を提案する。
画像生成と実データと合成データの統合を制御することにより、標準オブジェクト検出モデルが正確な予測を実現できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:48:37 GMT)
Quantitative convergence of trained single layer neural networks to Gaussian processes [3.4] 本研究では、勾配勾配から関連するガウス過程へ学習した浅層ニューラルネットワークの無限幅限界における定量的収束について検討する。
ネットワーク出力とガウス近似の間の二次ワッサーシュタイン距離を任意のトレーニング時間で明示的な上界を与える。
この結果は,幅や入力次元などのアーキテクチャパラメータや収束の影響,およびトレーニング力学が近似誤差にどのように影響するかを定量化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:27:48 GMT)
RAG-Stack: Co-Optimizing RAG Quality and Performance From the Vector Database Perspective [3.4] Retrieval-augmented Generation (RAG) は、ベクトルデータベースの最も顕著な応用の1つである。
RAGシステムにおける品質-性能共最適化のための3ピラーブループリントであるRAG-Stackを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:35:19 GMT)
Bayesian Optimization with Preference Exploration using a Monotonic Neural Network Ensemble [3.3] 本稿では,ニューラルネットワークアンサンブルを実用的サロゲートモデルとして用いることを提案する。
このアプローチは自然に単調性を統合し、ペア比較データをサポートする。
アブレーション研究は、パフォーマンス向上における単調性の重要性を強調している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:11:09 GMT)
Intelligent Sampling of Extreme-Scale Turbulence Datasets for Accurate and Efficient Spatiotemporal Model Training [3.2] 我々は,新しい最大エントロピー(MaxEnt)サンプリング手法を特徴とする,効率的な学習のためのスパース知的キュレーションフレームワークを開発した。
予備処理ステップとしてのサブサンプリングは、多くの場合、モデル精度を向上し、最大38倍のエネルギー消費を観測できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:26:18 GMT)
Safety Assessment in Reinforcement Learning via Model Predictive Control [3.2] 本稿では,トレーニングプロセス全体での安全問題防止手法として可逆性を活用することを提案する。
本手法では,モデル予測経路積分制御を用いて,学習期間を通じて学習方針が提案する行動の安全性を確認する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:31:18 GMT)
Large Language Models for Fault Localization: An Empirical Study [3.2] 本稿では,大規模言語モデル (LLM) に関する体系的な実証的研究を,文レベルコード故障の局所化タスクにおいて提案する。
我々は,オープンソースモデル (Qwen2.5-coder-32b-instruct, DeepSeek-V3) とクローズドソースモデル (GPT-4.1 mini, Gemini-2.5-flash) を評価し,その故障局所化機能を評価する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:04:22 GMT)
Towards AI Agents for Course Instruction in Higher Education: Early Experiences from the Field [3.2] この記事では、IIScの大学院レベルのクラウドコンピューティングコースで、AIベースの教育エージェントを主要なインストラクターとして配置し、デプロイし、評価することで、初期の知見を提示する。
本稿では,Large Language Model (LLM) 駆動のインストラクタエージェントの設計について詳述し,インストラクタエージェントをコースワークフローに統合する教育的フレームワークを紹介する。
本稿では,学生がエージェントとどのように相互作用し,概念を探求し,疑念を明確化し,調査主導の対話をライブ教室で行うかについて報告する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:23:35 GMT)
Autoencoding Random Forests [3.2] 本稿では,ランダムな森林を用いた自動符号化手法を提案する。
我々は、制約付き最適化、スプリット・レバーベリング、近傍の回帰を通じて、デコード問題の正確かつ近似的な解を提供する。
我々はこのオートエンコーダの様々な応用を実演し、可視化、圧縮、クラスタリング、復号化のための強力な新しいツールについて紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:35:09 GMT)
Phenomenological Noise Models and Optimal Thresholds of the 3D Toric Code [3.1] 3次元トポロジー符号は、非クリフォードゲートのフォールトトレラント実装をサポートする利点を提供する。
ビットフリップと位相フリップの誤差に対して、3Dトーリック符号は11%=$pX,M_th approx と$pZ,M_th approx 2%$の最適しきい値を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:30:55 GMT)
Quantum Coherence as a Thermodynamic Resource Beyond the Classical Uncertainty Bound [3.1] 量子コヒーレンスと熱力学的不確実性関係を明示的に関連付ける一般的な理論的枠組みが導入された。
コヒーレンスに敏感な尺度を定義することにより、量子効果はエントロピー生成と現在の変動の間の古典的なトレードオフを緩和することができることを示した。
結果は、真の熱力学資源として量子コヒーレンスを確立し、古典的および量子的アプローチと非平衡熱力学を結びつける統一的な視点を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:01:30 GMT)
Which Is Better For Reducing Outdated and Vulnerable Dependencies: Pinning or Floating? [3.1] この研究の目的は、開発者が情報に依存したバージョン制約を選択するのを支援することである。
セキュリティ実践者は、ソフトウェアサプライチェーンの攻撃を防ぐための依存関係の注入を提唱する。
最も一般的に使用されるバージョン制約型は、エンファンパイニング(Emphpinning)が次に一般的である、エンファンフローティングミナー(Emphfloating-minor)である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:40:40 GMT)
CIPHER: Scalable Time Series Analysis for Physical Sciences with Application to Solar Wind Phenomena [3.1] 認識のための人間評価を用いたtextitClustering and Indexation Pipeline(CIPHER)を提案する。
CIPHERは物理学における複雑な時系列の大規模ラベリングを促進するために設計されたフレームワークである。
我々は、宇宙気象研究の中心的課題であるOMNIデータにおける太陽風現象の分類作業におけるCIPHERの評価を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:11:29 GMT)
Multi-Agent Reinforcement Learning for Task Offloading in Wireless Edge Networks [3.1] エッジコンピューティングシステムでは、自律エージェントは共有リソースを競いながら、高速なローカル決定をしなければならない。
本稿では,各エージェントが制約付きマルコフ決定プロセス(CMDP)を解き,共有制約ベクトルを通じて暗黙的にコーディネートする分散フレームワークを提案する。
安全強化学習を用いて、エージェントは、地域とグローバルの両方の目標を満たすポリシーを学ぶ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:39:25 GMT)
Field theory for optimal signal propagation in ResNets [3.0] 残余ネットワークは、フィードフォワードネットワークよりも大幅に訓練性と性能が向上する。
従来の研究では、残枝にスケーリングパラメータを追加することにより、一般化性能がさらに向上した。
我々は、信号伝搬とその残枝のスケーリングへの依存性を研究するために、残枝ネットワークの体系的有限サイズ場理論を導出した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:44:15 GMT)
Privacy-preserving Decision-focused Learning for Multi-energy Systems [3.0] 本稿では,MESディスパッチに適したプライバシー保護型DFLフレームワークを提案する。
提案手法では,データ保護のための情報マスキングを導入し,モデル学習に必要な決定変数や勾配の回復を可能にする。
我々はまた、不均一な負荷パターンに対する特殊なDFLモデルのトレーニングを可能にする、プライバシー保護負荷パターン認識アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:20:50 GMT)
Layer-to-Layer Knowledge Mixing in Graph Neural Network for Chemical Property Prediction [2.9] 層間知識混合(Layer-to-Layer Knowledge Mixing, LKM)は、最先端のGNNの精度を高める自己知識蒸留法である。
LKMはマルチホップおよびマルチスケール情報を効率よく集約し、局所的およびグローバルな分子的特徴の表現を改善する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:42:31 GMT)
Spectral Small-Incremental-Entangling: Breaking Quasi-Polynomial Complexity Barriers in Long-Range Interacting Systems [2.9] 本稿では,作用素の構造エンタングルパワーを捉えるスペクトルエンタングリング強度の概念を紹介する。
我々はスペクトルSIE定理(R'enyi tanglement growth)を$alpha ge 1/2$で定めている。
我々の結果は、SIE定理をスペクトル領域に拡張し、量子複雑性の基礎となる詳細で普遍的な構造を明らかにする統一的な枠組みを確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:59:24 GMT)
The Shape of Reasoning: Topological Analysis of Reasoning Traces in Large Language Models [2.8] そこで我々は,推論トレースの幾何を捉えるトポロジカルデータ分析フレームワークを導入し,ラベル効率の評価を可能にした。
コンパクトで安定なトポロジカルな特徴集合は、トレース品質を確実に示し、将来の強化学習アルゴリズムのための実用的な信号を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:43:43 GMT)
Blur2seq: Blind Deblurring and Camera Trajectory Estimation from a Single Camera Motion-blurred Image [2.8] カメラの揺らぎによる動きのぼやけは、特に大きな動きや回転運動の下では、画像復元において大きな課題である。
本稿では,1つのぼやけた画像から潜時鋭い画像と下層のカメラ運動軌跡を共同で推定する深層学習フレームワークを提案する。
本手法は,合成データと実データの両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:26:07 GMT)
Topic-aware Large Language Models for Summarizing the Lived Healthcare Experiences Described in Health Stories [2.8] 大きな言語モデル(LLM)は、潜在的に根底にある要因と介入の道を見つけることができる。
我々は、アフリカ系アメリカ人の物語作家の物語を、話題を意識した階層的に要約した。
アプローチでは、健康行動、医療チームメンバーとの交流、介護、症状管理など、AAの体験関連トピックを特定した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:52:00 GMT)
SetONet: A Set-Based Operator Network for Solving PDEs with Variable-Input Sampling [2.7] ニューラル作用素は微分方程式を解く関数空間間の写像の学習において有望であることを示す。
標準のDeepONetでは、入力関数を一定の場所でサンプリングする必要がある。
本稿では,DeepONet の分岐ネットワークを改良した Set Operator Network (SetONet) を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:10:10 GMT)
Eye-Tracking as a Tool to Quantify the Effects of CAD Display on Radiologists' Interpretation of Chest Radiographs [2.7] バウンディングボックス(BB)ハイライトなどの同時リーダディスプレイは、読み取りプロセスに影響を与える可能性がある。
このパイロットスタディでは、視線追跡を用いて、視覚検索のどの側面が影響されたかを定量化した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:47:52 GMT)
Intransitive Player Dominance and Market Inefficiency in Tennis Forecasting: A Graph Neural Network Approach [2.7] テニスの試合における非推移的なプレーヤー優位性をモデル化するために,グラフニューラルネットワークアプローチを用いる。
これらのシナリオにおいて、我々のアプローチはリレーショナル・ダイナミクスを捉えるために一意に位置付けられている。
我々のモデルと高い非透過性マッチングに選択的に賭けると、3.26%のROIで大きな正のリターンが得られ、ケリーは1903年に賭けた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:41:45 GMT)
Toward Practical Deductive Verification: Insights from a Qualitative Survey in Industry and Academia [2.6] 帰納的検証は、あるシステムが意図した振る舞いを公開することを保証する効果的な方法である。
選択したプロジェクトでは有効性や実現可能性があることが証明されているが、導出検証は依然として主流のテクニックではない。
本研究は, 導出検証を成功させる要因と, 広く普及しないための根本的課題について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:59:14 GMT)
\textsc{CantoNLU}: A benchmark for Cantonese natural language understanding [2.6] 我々は、カントン自然言語理解(NLU)のベンチマークであるtextsctextbfCantoNLUを紹介する。
このベンチマークは、単語感覚の曖昧さ、言語判断、言語検出、自然言語推論、感情分析、音声の一部タグ付け、依存性解析を含む、構文と意味論をカバーする7つのタスクにまたがる。
結果から, カントン適応モデルの方が総合的に優れ, 単言語モデルの方が構文的タスクにおいて優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:47:27 GMT)
Toward a Metrology for Artificial Intelligence: Hidden-Rule Environments and Reinforcement Learning [2.6] ゲーム・オブ・ハイデン・ルールズ(GOHR)環境における強化学習について検討する。
GOHRは、エージェントが6ドルタイムのボードをクリアするために隠れたルールを推論し実行しなければならない複雑なパズルである。
本稿では,2つの状態表現戦略,すなわちFeature-Centric (FC) と Object-Centric (OC) を採用し,トランスフォーマーに基づくアドバンテージ・アクター・クリティカル (A2C) アルゴリズムを用いてトレーニングを行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:14:39 GMT)
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Cultural Learning [2.6] 大型言語モデル(LLM)を駆使したエージェントは、Minecraftのような世界にオープンエンドの能力を持つことを約束する。
本稿では,文化的生涯学習のための生成型フレームワークであるMindForgeを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:07:52 GMT)
Real-Time Gait Adaptation for Quadrupeds using Model Predictive Control and Reinforcement Learning [2.6] 連続歩行空間におけるリアルタイム歩行適応のための最適化フレームワークを提案する。
モデル予測パス積分(MPPI)アルゴリズムとDreamerモジュールを組み合わせることで、四足歩行に対する適応的かつ最適なポリシーを生成する。
我々は、Unitree Go1上でのシミュレーションの枠組みを評価し、様々な目標速度で最大36.48%のエネルギー消費の削減を実証した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:17:45 GMT)
PSO-XAI: A PSO-Enhanced Explainable AI Framework for Reliable Breast Cancer Detection [2.6] 本研究では、機能選択のためのカスタマイズされたParticle Swarm Optimization (PSO)を組み込んだ統合フレームワークを提案する。
提案手法は、精度と精度を含む全てのパフォーマンス指標において99.1%の優れたスコアを得た。
結果は,Swarmインテリジェンスと説明可能なMLを組み合わせることで,堅牢で信頼性が高く,臨床的に有意義な乳癌診断の可能性を強調した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:42:50 GMT)
Proper decision trees: An axiomatic framework for solving optimal decision tree problems with arbitrary splitting rules [2.6] 本稿では,決定木のアルゴリズム特性を解析するための公理的枠組みを提案する。
本論文の中心となるのは決定木問題であり,その汎用性と有効性から,適切な決定木と呼ぶ。
メモリ化は一般に、データセットとサブツリーの両方を格納しなければならないため、空間複雑性の観点からは非現実的であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:48:37 GMT)
Channel Balance Interpolation in the Lightning Network via Machine Learning [2.5] Bitcoin Lightning Networkは、Bitcoinのスケーラビリティに対処するレイヤ2支払いプロトコルである。
本研究は、ネットワーク内のチャネルバランスを補間するために機械学習モデルを使用することの可能性を検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:23:42 GMT)
Hierarchical Time Series Forecasting with Robust Reconciliation [2.5] 本稿では,各高次観測が対応する低次時系列の和に等しい階層的時系列データの予測に焦点をあてる。
このような文脈では、予測値はコヒーレントでなければならない。つまり、各親系列の予測値は、その子系列の予測値の和と正確に一致する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:30:53 GMT)
On pattern classification with weighted dimensions [2.4] 重み付け次元に基づく距離測定は、パターン解析において重要な考慮事項の1つである。
a) 距離測度基準と次元の重みの影響を可視化とともに詳細に分析し, (b) 各次元の新しい重み付け方式, (d) 様々な合成モデルと現実的データセットを用いたパターン分類について述べる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:22:02 GMT)
Quantifying robustness and locality of Majorana bound states in interacting systems [2.4] マヨラナ境界状態(MBS)を分離したトポロジカル超伝導体は強い保護形態を提供する。
それらの局所性は環境との結合をいかに制限するかを示す。
これは、エネルギー縮退の保護と非アーベルブレイディングの実現可能性の定量化である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:25:38 GMT)
A new measure for dynamic leakage based on quantitative information flow [2.3] 定量的情報フロー(QIF)は、計算システムにおける情報の漏洩を評価することを目的としている。
静的パースペクティブは、情報フローの計算におけるシステムのすべての実行を考慮し、通常、システムを実行するかどうかを事前に決めるときに使用される。
ダイナミック・パースペクティブは、例えばシステムモニタやトラッカー、特に特定の実行を継続するか中止するかを決めるときに関係している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:22:39 GMT)
Curiosity-Driven Development of Action and Language in Robots Through Self-Exploration [2.3] 組成要素の数が増加するにつれて、一般化が大幅に向上する。
好奇心による探索と運動ノイズが組み合わさって、好奇心のない学習を著しく上回る。
より単純で、前提条件のようなアクションが開発初期に出現する一方、これらの前提条件を含むより複雑なアクションは後に発達する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:20:36 GMT)
An Experimental Study of Trojan Vulnerabilities in UAV Autonomous Landing [2.3] トロイの木馬攻撃はCNNのようなディープラーニングモデルをターゲットにしている。
実験では、清潔なデータの96.4%からトロイの木馬の攻撃によって引き起こされたデータの73.3%に相当な精度が低下した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:47:40 GMT)
xMem: A CPU-Based Approach for Accurate Estimation of GPU Memory in Deep Learning Training Workloads [2.3] ジョブがどれだけのGPUメモリを必要とするかを推定することは、高度なスケジューリングとGPUの共有を可能にするための基本となる。
我々は、CPUのみの動的解析を利用してGPUメモリのピーク要求を正確に推定する新しいフレームワークであるxMemを提案する。
ANOVAとMonte Carloの結果を含む5209実行の解析は、xMemのメリットを強調している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 23:16:27 GMT)
Uncovering Anomalous Events for Marine Environmental Monitoring via Visual Anomaly Detection [2.3] 水中視覚異常検出(VAD)のための最初のマルチアノテータベンチマークデータセットであるAURAを紹介する。
2つの海洋シーンにわたる4つのVADモデルを評価し、意味のあるビデオセグメントを抽出するための堅牢なフレーム選択戦略の重要性を示した。
本研究は,ソフトラベルとコンセンサスラベルの価値を強調し,科学的探索とスケーラブルな生物多様性モニタリングを支援するための実践的アプローチを提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:59:05 GMT)
Competition is the key: A Game Theoretic Causal Discovery Approach [2.2] 因果発見のためのゲーム理論強化学習フレームワークを提案する。
DDQNエージェントは、強いベースライン(GESまたはGraN-DAG)と直接競合し、常に相手の解からウォームスタートする。
この設計は、3つの証明可能な保証を与える: 学習されたグラフは相手よりも決して悪くない、ウォームスタートは厳密に収束を加速する、そして最も重要なことはアルゴリズムが真のベスト候補グラフを選択する確率が高いことである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:19:21 GMT)
All-Gaussian State Discrimination Beyond the Coherent Helstrom Bound [2.2] 長年の目標は、コヒーレント状態に符号化されたBPSK信号に対してヘルストローム境界と呼ばれる基本的な量子限界に達することである。
ガウス光学(英語版)のみを用いて、圧縮状態の変位とホモダイン検出を行い、コヒーレント状態と任意の量子測定を用いて達成できる誤差率以下でBPSK信号を識別する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:41:43 GMT)
Online Learning for Dynamic Vickrey-Clarke-Groves Mechanism in Unknown Environments [2.2] 本研究では,未知環境におけるシーケンシャルオークションにおけるオンライン動的メカニズム設計の問題点を考察する。
我々は,販売者がマルコフ決定過程を学習するための強化学習アルゴリズムを開発した。
学習機構は, 効率, 真理性, 個々人の合理性にほぼ満足していることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:45:35 GMT)
DiNo and RanBu: Lightweight Predictions from Shallow Random Forests [2.2] DiNoとRanBuは、小さな深度制限木を効率的な距離重み付き予測子に変換する。
RanBuは、ハイノイズ設定で、完全奥行きのランダムな森の精度を一致または超過する。
どちらの手法も量子レグレッションに直接拡張し、精度を相当なスピードゲインで維持する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:12:08 GMT)
A Soundness and Precision Benchmark for Java Debloating Tools [2.2] Deblometerは、デブロティングツールで様々なJava言語機能のサポートを評価するように設計された59のテストケースで構成される、マイクロベンチマークである。
Deptrim、JShrink、ProGuardの3つの人気のあるJavaデブロツールを評価します。
評価の結果,必要なプログラム構造がすべて削除され,セマンティクスや実行クラッシュが変更されることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:52:20 GMT)
Constructing Local Symmetric Operator Algebras via Reflection Positivity [2.0] 我々は、球面上の基底状態の非退化性とフラストレーションフリーハミルトニアンの局所基底状態の局所独立性の間の等価性を証明した。
我々は、局所対称作用素代数を構成するために、Osterwalder-Schrader再構成を適用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:36:06 GMT)
Practical Code RAG at Scale: Task-Aware Retrieval Design Choices under Compute Budgets [1.9] 本研究では,現実的な計算予算下でのコード中心生成タスクの検索設計について検討する。
我々は, (i) チャンキング戦略, (ii) 類似度スコア, (iii) 粒度を分割する3つの軸に沿って, 様々なコンテキストウィンドウサイズにわたる検索構成を比較した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:40:11 GMT)
A Full Stack Framework for High Performance Quantum-Classical Computing [1.9] ハードウェア/デバイス非依存のソフトウェア統合アプローチによるHPC-QCフルスタックフレームワークとそのハイブリッドワークロード開発機能について紹介する。
既存の成熟したHPCプログラミング環境における量子プログラミング、ディスパッチ、およびコンパイルのためのインタフェースの最新の開発が示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:07:29 GMT)
NeuroPilot: A Realtime Brain-Computer Interface system to enhance concentration of students in online learning [1.9] 脳-コンピュータインタフェース(BCI)システムは、注意状態および非注意状態下での脳波活動を記録するために開発された。
リアルタイムフィードバックの有効性を評価するパイロット実験を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:36:59 GMT)
Prognostic Framework for Robotic Manipulators Operating Under Dynamic Task Severities [1.8] ロボットマニピュレータのRemaining Useful Life(RUL)を予測できる予後モデリングフレームワークを提案する。
以上の結果から,両艦隊のロボットは高重度タスクを多く扱う場合,RULが短くなることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:37:59 GMT)
Systematic Evaluation of Uncertainty Estimation Methods in Large Language Models [1.8] 大規模言語モデル(LLM)における信頼度推定のための4つのアプローチを評価する。
我々は,最先端のオープンソース LLM を用いた4つの質問応答実験を行った。
以上の結果から,各不確実性指標がモデル信頼性の異なる面を捉え,ハイブリッドCoCoAアプローチが全体の信頼性を最大化できることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:50:47 GMT)
Shall We Play a Game? Language Models for Open-ended Wargames [1.8] 我々は、言語モデル(LM)のような人工知能システムが、戦略的計画のための人間の専門能力に急速に近づいているという立場を取る。
我々は、AIシステムが大規模な意思決定に影響を与える能力は、オープンエンドの戦争ゲームにおけるAIの安全性、解釈可能性、説明可能性に関するさらなる研究を動機付けていると主張している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:21:49 GMT)
Separating the what and how of compositional computation to enable reuse and continual learning [1.8] 繰り返しニューラルネットワーク(RNN)モデルにおける連続学習と学習計算の合成再利用について検討する。
まず,多種多様なタスクを確率的生成モデルにより体系的に記述できることを示す。
我々は,このモデルを単一審理ベースで学習できる教師なしオンライン学習手法を開発した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:24:40 GMT)
Security Logs to ATT&CK Insights: Leveraging LLMs for High-Level Threat Understanding and Cognitive Trait Inference [1.8] リアルタイム防衛には、侵入検知システム(IDS)ログから攻撃意図と認知戦略を推測する能力が必要である。
本研究では,Suricata IDSログを解析し,攻撃行動を推測するために,大規模言語モデル(LLM)を利用する新しいフレームワークを提案する。
このことは、行動適応型サイバーディフェンスと認知的特徴推論に関する将来の研究の基盤となる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:43:31 GMT)
Bias by Design? How Data Practices Shape Fairness in AI Healthcare Systems [1.7] 歴史的、表現的、測定的バイアスを含む、複数のユースケースにまたがるいくつかの種類のバイアスを特定します。
これらのバイアスは、性別、性別、年齢、生息地、社会経済的地位、機器、ラベル付けなどの変数に現れる。
臨床問題設計とデータ収集の公正性とロバスト性を改善するための実践的勧告を締めくくった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:32:34 GMT)
Co-Designing Quantum Codes with Transversal Diagonal Gates via Multi-Agent Systems [1.6] 我々は、所定の対角ゲートを持つ量子符号を共設計するマルチエージェント・ヒューマン・イン・ザ・ループワークフローを提案する。
このワークフローはGPT-5を使っており、RA(https://texra.ai)-マルチエージェントリサーチアシスタントプラットフォームで実装されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:45:39 GMT)
Realization of Trapped Ion Dynamics in the Strong-Field Regime and Non-Markovianity [1.5] 我々は、Rabi周波数(Omega)が振動モード周波数(nu)に近づくトラップイオンのダイナミクスを実験的に検討した。
量子状態トモグラフィーを用いて、密度行列を再構成し、その進化を追跡して非マルコビアン性を評価する。
本研究は,非マルコフ性,コヒーレント制御,および極端状態における開量子系の基本的な挙動を解明するために,トラップイオンプラットフォームを用いた経路を確立した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:25:09 GMT)
Integrating Machine Learning into Belief-Desire-Intention Agents: Current Advances and Open Challenges [1.4] 本稿では,BDI(Belief-Desire-Intention)パラダイムを参考に,既存のアプローチの詳細な体系化を提案する。
本分析は,MLにより強化された有理的エージェントに関する急速な発展傾向を示すとともに,効果的な有理的MLエージェントを設計するための重要な研究の機会とオープンな課題を明らかにする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:15:45 GMT)
Privacy Risks and Preservation Methods in Explainable Artificial Intelligence: A Scoping Review [1.4] 我々は、プライバシーと説明可能性の相違について詳細を求めるため、既存の文献のスコーピングレビューを実施している。
2019年1月から2024年12月までの1,943件の調査結果から57項目を抽出した。
我々は,XAIにおけるプライバシリスクと保存手法を分類し,プライバシ保護の説明の特徴を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:10:17 GMT)
A Neural Difference-of-Entropies Estimator for Mutual Information [1.4] 正規化フローを用いた条件密度のパラメータ化に基づく新しい相互情報推定器を提案する。
この推定器は、標準ベンチマークタスクにおけるバイアス分散トレードオフを改善するために、ブロック自己回帰構造を利用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:56:15 GMT)
Electrical-control of third-order nonlinearity via Fano interference [1.3] 狭線幅量子オブジェクトQO(s)へのブロードバンド明るいプラズモンモードの結合について検討する。
スターク効果によりQOのレベルスパンピングをシフトさせることで、3階非線形ゲートを連続的に調整できることが示される。
また、遅延効果を考慮した有限差分時間領域(FDTD)シミュレーションを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:02:15 GMT)
A computational model and tool for generating more novel opportunities in professional innovation processes [1.3] 本稿では,創造的成果の新たな計算モデルを提案する。
このモデルは、ホスピタリティセクターのイノベーションプロジェクトのために生成された機会を用いて評価された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:09:57 GMT)
$\mathbb{Z}_2$ lattice gauge theories: fermionic gauging, transmutation, and Kramers-Wannier dualities [1.3] 従来の$mathbbZ$ゲージ理論と$mathbbZ$ゲージ理論のユニタリ同値性を示す。
フェルミオンパリティのゲージ理論は、さらにジョルダン・ウィグナー変換によって得られる折りたたみイジング連鎖と同値であることが示される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:00:00 GMT)
Evaluating Video Models as Simulators of Multi-Person Pedestrian Trajectories [1.3] 歩行者動態の暗黙的シミュレータとして,テキスト・トゥ・ビデオ(T2V)と画像・トゥ・ビデオ(I2V)モデルをベンチマークした。
キーコンポーネントは、カメラパラメータを知らない画素空間から2Dの鳥眼視線を再構成する方法である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:06:58 GMT)
Symbiosis: Multi-Adapter Inference and Fine-Tuning [1.2] 微細チューニングのためのPEFT技術の普及は、人気のある大規模言語モデルのためのアダプタの作成につながった。
既存のフレームワークは、推論や複数のアダプタによる微調整をサポートしていない。
Symbiosisでは、ベースモデルのas-a-serviceデプロイメントを有効にすることで、上記の問題に対処する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:49:27 GMT)
Analyticup E-commerce Product Search Competition Technical Report from Team Tredence_AICOE [1.2] 本研究では,Tredence_AIチームが開発した多言語eコマース検索システムを提案する。
Gemma-3 12Bモデルは、オリジナルのデータと翻訳されたデータを使って最高のQCパフォーマンスを達成し、オリジナル、翻訳されたデータ、マイノリティクラスのデータ生成を使って最高のQIパフォーマンスを達成した。
これらのアプローチは最終リーダーボードで4位を獲得し、テストセットの平均F1スコアは0.8857だった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:49:20 GMT)
A decomposition-based robust training of physics-informed neural networks for nearly incompressible linear elasticity [1.2] ほぼ圧縮不可能な弾性方程式に対する低次有限要素法は、Lam'e係数$lambdatoinfty$として劣化することを示す。
この現象はロック(locking)または非腐食性(non-robustness)として知られているが、広範な調査にもかかわらず完全には理解されていない。
本稿では, 弾性方程式をバランスの取れたサブシステムに再構成する, 堅牢な分解に基づくPINNフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:16:58 GMT)
"You Are Rejected!": An Empirical Study of Large Language Models Taking Hiring Evaluations [1.1] 本稿では,Large Language Models (LLM) が採用評価に合格できるかどうかを検討する。
我々は,現状のLLMを用いて応答を生成し,その性能を評価する。
LLMが理想的なエンジニアであるというこれまでの期待とは対照的に、我々の分析は、モデル生成の回答と企業参照のソリューションとの間に大きな矛盾があることを明らかにしている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:28:01 GMT)
Unsupervised Anomaly Prediction with N-BEATS and Graph Neural Network in Multi-variate Semiconductor Process Time Series [1.1] 半導体製造における異常予測には いくつか重要な課題があります
変数間の複雑な相互依存性は、異常予測と根本原因分析の両方を複雑にする。
本稿では,異常検出から異常予測まで,新たな2つのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:33:52 GMT)
From Far and Near: Perceptual Evaluation of Crowd Representations Across Levels of Detail [1.1] 本研究では,観客の表情表現の視覚的質を,異なるレベルの詳細(LoD)と視聴距離で知覚する方法について検討する。
この結果は,クラウドレンダリングのための知覚的に最適化されたLoD戦略の設計の指針となる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:39:18 GMT)
HAVT-IVD: Heterogeneity-Aware Cross-Modal Network for Audio-Visual Surveillance: Idling Vehicles Detection With Multichannel Audio and Multiscale Visual Cues [1.1] アイドリング車両検出(IVD)は、監視ビデオとマルチチャネルオーディオを使用して、ピックアップゾーン内の車両のローカライズと分類を行う。
IVDは3つの課題に直面している: (i) 視覚的手がかりと音声パターンの不均一性、 (ii) 多分解能検出を必要とする大規模なボックススケール変動、 (iii) 複合検出ヘッドによるトレーニング不安定性。
HAVT-IVDは視覚的特徴ピラミッドと切り離された頭部を備えた異種認識ネットワークである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:30:54 GMT)
Emergent time and more from wavefunction collapse in general relativity [1.1] 一般相対性理論における波動関数の崩壊に基づく最近の時間理論をさらに発展させる。
量子状態が運動量やハミルトンの制約に違反しているという仮定に基づいている。
これらは、半古典的および断熱的な近似を通じて、宇宙論的な定数支配宇宙に対して実証される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:48:28 GMT)
The Low-Degree Hardness of Finding Large Independent Sets in Sparse Random Hypergraphs [1.0] 低次アルゴリズムのクラスは、密度$left(fraclog d(r-1)dright)1/(r-1)$の独立した集合を見つけることができるが、それ以上は見つからない。
グラフケースは広く研究されているが、この研究はランダムなハイパーグラフ上の最適化問題の統計的-計算的ギャップを考える最初のものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:39:20 GMT)
Breakdance Video classification in the age of Generative AI [1.0] この研究は、非常にニッチだが非常に人気のあるダンススポーツ(ブレイクダンス)に対する現代のビデオファンデーションモデル(エンコーダとデコーダの両方)の適用性を分析する。
以上の結果から,映像モデルは予測タスクにおいて,最先端の映像言語モデルよりも優れています。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:18:54 GMT)
The generalized adiabatic theorem for extended lattice systems [1.0] 我々は、ギャップのある基底状態を持つ無限拡張格子フェルミオン系に対する断熱定理を証明し、ギャップを閉じる摂動を可能にする。
この結果は、ホール電流に対するオームの法則の証明を含む、ギャップ付き系のマクロ的変化に対する線形応答の厳密な基礎を与える。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:10:40 GMT)
Residual Kolmogorov-Arnold Network for Enhanced Deep Learning [0.9] 深層畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、ネットワーク深度内に数百のレイヤがあるため、最適化が困難で、トレーニングにコストがかかる。
我々はResidual Kolmogorov-Arnold Network (RKAN)と呼ばれる"plug-in"モジュールを導入する。
RKANは、異なるビジョンタスクにおけるベースラインモデルよりも一貫した改善を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:41:54 GMT)
Exploring Spiking Neural Networks for Binary Classification in Multivariate Time Series at the Edge [0.9] 多変量時系列のバイナリ分類を行うために、スパイキングニューラルネットワーク(SNN)を訓練するための一般的なフレームワークを提案する。
ガンマ線スペクトルデータにおける低信号-雑音比放射源の検出に応用する。
その結果、49個の神経細胞と66個のシナプスを持つSNNは、51.8%の真の正の速度(TPR)を1/hrの誤報率で達成した。
マイクロカスピアンニューロモルフィックプラットフォーム上のハードウェア展開は、2mWの消費電力と20.2msのレイテンシを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:52:11 GMT)
RAGRank: Using PageRank to Counter Poisoning in CTI LLM Pipelines [0.9] Retrieval-Augmented Generation (RAG) は、サイバー脅威情報システムにおけるLLM(Large Language Model)の使用を運用するための主要なアーキテクチャパターンとして登場した。
コーパスにソース信頼性アルゴリズムを適用することにより,現代のRAG防御の堅牢性を向上できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:43:00 GMT)
SafeDiver: Cooperative AUV-USV Assisted Diver Communication via Multi-agent Reinforcement Learning Approach [0.9] 既存の水中ダイバー通信手法は、固有の不利と複雑な水中環境のためにハードルに直面している。
本研究では,海中無人システムを利用して,信頼性の高い高速通信を行うダイバーを支援する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:58:54 GMT)
SMRS: advocating a unified reporting standard for surrogate models in the artificial intelligence era [0.9] 我々は、サロゲートモデルのための構造化レポート標準を確立する緊急の必要性を論じる。
標準化されながらフレキシブルなフレームワークを推進することによって、サロゲートモデリングの信頼性を向上させることを目指している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:33:09 GMT)
HA-RAG: Hotness-Aware RAG Acceleration via Mixed Precision and Data Placement [0.9] Retrieval-Augmented Generation (RAG)は、外部知識ベースを活用することにより、モデル出力の精度を向上させる。
外部知識ベースの導入は、長期コンテキスト処理における課題をRAGに提示する。
本稿では,ホットネス対応RAG(HA-RAG)推論最適化システムを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:28:58 GMT)
Quantum Processing Unit (QPU) processing time Prediction with Machine Learning [0.9] 本稿では、量子ジョブのQPU処理時間予測における機械学習(ML)手法の適用について検討する。
モデル精度を向上させるためにデータ前処理手法を取り入れ,QPU処理時間を予測するためにグラディエント・ブースティング(LightGBM)に基づくML手法を用いる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:04:18 GMT)
Time-series Random Process Complexity Ranking Using a Bound on Conditional Differential Entropy [0.9] Fangらによって確立された情報理論予測誤差境界に基づいて構築する。
条件付き微分エントロピー textbf$h(X_k mid X_k-1,...,X_k-m)$ は次ステップ予測誤差の行列式の関数によって上界となることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:36:04 GMT)
Adaptive Latent-Space Constraints in Personalized Federated Learning [0.9] フェデレートラーニング(FL)は、異なるクライアントが保持する分散データセット上でディープラーニングモデルをトレーニングするための、効果的で広く使用されているアプローチである。
本研究は,pFLにおける理論的に支持された適応MDD尺度の有効性について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:30:52 GMT)
Reinforcement Learning and Consumption-Savings Behavior [0.9] 本稿では, 経済不況における家庭の消費行動に関する2つの実証的パターンを, 強化学習によって説明できることを示す。
エージェントがニューラルネットワーク近似を用いてQラーニングを使用して、所得不確実性の下で消費削減決定を行うモデルを開発した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:14:49 GMT)
Can ChatGPT Code Communication Data Fairly?: Empirical Evidence from Multiple Collaborative Tasks [0.8] 本稿では,ChatGPTに基づく通信データの自動符号化を,協調的問題解決のための典型的なコーディングフレームワークを用いて検討する。
以上の結果から,ChatGPTをベースとしたコーディングは,性別や人種間で有意な偏見を示さず,協調・コミュニケーションの大規模評価への道のりを歩むことができた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:09:03 GMT)
HybridSOMSpikeNet: A Deep Model with Differentiable Soft Self-Organizing Maps and Spiking Dynamics for Waste Classification [0.8] リサイクル可能な材料のミスクラス化は、埋立地の蓄積、非効率なリサイクル、温室効果ガスの排出の増加に寄与する。
本研究では、畳み込み特徴抽出、微分可能な自己組織化、スパイキングにインスパイアされた時間処理を統合したハイブリッドディープラーニングフレームワークであるHybridSOMSpikeNetを紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:47:09 GMT)
Compositional Generation for Long-Horizon Coupled PDEs [0.8] 分離されたPDEデータに対してのみ拡散モデルを訓練する構成拡散法について検討する。
本研究は, 長時間の地平線下において, 多数の時間ステップを含む構成戦略が実現可能かどうかを考察する。
合成拡散は、結合されたPDEの効率的で長期のモデリングに向けて実行可能な戦略であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:35:25 GMT)
Causal Post-Processing of Predictive Models [0.7] 本稿では,限られた実験データを用いて予測モデルの出力を改良する手法である因果後処理を提案する。
我々は,特に予測モデルが有用だが不完全な因果シグナルを捉えた場合,CPPは介入決定を改善することができることを示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:43:04 GMT)
Physics-Guided Fusion for Robust 3D Tracking of Fast Moving Small Objects [0.7] 本稿では,RGB-Dカメラを用いた高速移動小物体の検出と追跡の課題に対処する。
本システムは,ディープラーニングに基づく検出と物理に基づくトラッキングを組み合わせることで,既存のアプローチの限界を克服する。
本システムは,自律型プラットフォーム上でのロボット認識向上に重要な応用がある。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:00:58 GMT)
Experimental differentiation and extremization with analog quantum circuits [0.7] 微分可能量子回路(DQC)は微分方程式(DE)を計算するための実行可能な経路を提供する
量子極端学習(QEL)は、未知(単純)関数の学習可能なモデルの出力における極端点を見つけることによって、そのようなアプローチを補完する。
本研究は,DQCとQELを併用した最初の実験実験の結果である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:29:28 GMT)
The Order of Recommendation Matters: Structured Exploration for Improving the Fairness of Content Creators [0.7] ソーシャルメディアプラットフォーム上でコンテンツクリエーターの公正性を高めるための介入を見つける。
順序付き比較を用いることで、新しいアイテムセットのコールドスタート問題を克服することができる。
実験によると、介入はプラットフォームの初期段階に展開する際の公正性を改善するが、既存のバイアスの強さが増加するにつれて効果は低下する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:13:24 GMT)
Transferable Graph Learning for Transmission Congestion Management via Busbar Splitting [0.7] バスバー分割によるネットワークトポロジ最適化(NTO)は、送電網の混雑を緩和し、再分散コストを低減する。
機械学習(ML)アプローチは有望な代替手段として登場したが、見当たらないトポロジに限定して一般化されている。
本稿では,線形化AC PFを考慮した混雑管理問題に対するNTOを定式化し,グラフニューラルネットワーク(GNN)の高速化手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:16:23 GMT)
Deep Learning for Continuous-time Stochastic Control with Jumps [0.7] 本研究では,ジャンプによる有限水平連続時間制御問題を解くためのモデルに基づくディープラーニング手法を提案する。
我々は2つのニューラルネットワークを反復的に訓練する: 1つは最適ポリシーを表現するもので、もう1つは値関数を近似するものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:30:34 GMT)
ACS-SegNet: An Attention-Based CNN-SegFormer Segmentation Network for Tissue Segmentation in Histopathology [0.7] コンボリューショナルニューラルネットワーク(CNN)と視覚変換器(ViT)の注意駆動型特徴融合に基づく新しいアプローチを提案する。
我々のモデルはGCPSデータセットで76.79%/86.87%、PUMAデータセットで64.93%/76.60%のmuIoU/muDiceスコアを達成した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:21:06 GMT)
Illusions of reflection: open-ended task reveals systematic failures in Large Language Models' reflective reasoning [0.6] 「リフレクション」はゴールとその制約に結びついているが、人間のリフレクティブ推論と等価か?
クローズドエンドタスクの以前の作業は、自己補正の限界を隠蔽しながら、'リフレクション'を効果的に見せることができる。
ファーストパス性能は貧弱であり、リフレクションは緩やかな利得しか得られない。
このようなメカニズムがモデル自体でインスタンス化されるまでは、信頼性のあるパフォーマンスには制約を強制する外部構造が必要です。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:36:23 GMT)
BUSTED at AraGenEval Shared Task: A Comparative Study of Transformer-Based Models for Arabic AI-Generated Text Detection [0.6] AraELECTRA, CAMeLBERT, XLM-RoBERTaの3つのプレトレーニングトランスのエフェック性について検討した。
マルチリンガルのXLM-RoBERTaモデルはF1スコア0.7701で最高性能を達成し、スペンサー化アラビアモデルを上回った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:41:04 GMT)
Hybrid Lattice Surgery: Non-Clifford Gates via Non-Abelian Surface Codes [0.5] 本稿では,ハイブリッド格子手術に基づく標準曲面符号における非クリフォード演算の実装法を提案する。
これは、標準的なサーフェスコードにおいて、マジック状態や非クリフォードゲートテレポーテーションの形で、非クリフォード演算を提供できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:00:00 GMT)
A Transformer Inspired AI-based MIMO receiver [0.5] AttDetの設計は、モデルベースの解釈可能性とデータ駆動の柔軟性を組み合わせる。
5Gチャネルモデルと高次混合QAM変調および符号化方式のリンクレベルシミュレーションによる実演を行う。
AttDetは予測可能で現実的な複雑さを維持しながら、ほぼ最適のBER/BLERパフォーマンスにアプローチすることができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:05:10 GMT)
On Function-Correcting Codes in the Lee Metric [0.5] リー計量の下で、任意の正の整数 $mgeq 2$ に対して $mathbbZ_m 上の関数訂正符号を研究する。
我々はリー計量の$mathbbZ_4 上の符号に対して、Liu と Liu [6] によって確立された境界を $mathbbZ_m$ のより一般的な設定に拡張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:18:27 GMT)
Sparse Local Implicit Image Function for sub-km Weather Downscaling [0.5] 暗黙のニューラル表現を生成するためにSpLIIFを導入し、気象変数の任意のダウンスケーリングを可能にする。
本研究では,日本全国の温暖な気象観測所と地形観測所からモデルを訓練し,気温と風速を予測する分布内および分布外精度を評価する。
このモデルでは、CorrDiffとベースラインの両方を下降温度で最大50%、風速で約10~20%改善する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:20:26 GMT)
Factorizability of optimal quantum sequence discrimination under maximum-confidence measurements [0.5] 最大信頼度測定による量子列の識別について考察する。
量子シーケンスアンサンブルの最適識別は常に個々のアンサンブルに分解可能であることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:03:11 GMT)
On the cybersecurity of LoRaWAN-based system: a Smart-Lighting case study [0.5] 本稿では,LoRaWANをベースとしたSmart-Lightingプロジェクトのアーキテクチャ構成について実験的に検討する。
In-vitroとon-siteの両方で実施された一連の反復実験において,システムのロバスト性を評価する。
その結果、LoRaWANネットワークに対する攻撃は失敗し、インストールされた製品に関する未解決の問題も浮き彫りにした。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:36:23 GMT)
Higher-order quantum computing with known input states [0.5] 入力状態の古典的知識は性能を大幅に向上させることができることを示す。
我々は純粋、二分儀、混合状態のために設計されたプロトコルを区別する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:14:28 GMT)
Privacy Engineering in Smart Home (SH) Systems: A Comprehensive Privacy Threat Analysis and Risk Management Approach [0.5] 本研究の目的は、SHシステムにおけるプライバシ制御の主な脅威、関連するリスク、および効果的なプライバシ制御の優先順位付けを解明することである。
この研究の結果は、SHシステムドメイン内のベンダー、クラウドプロバイダ、ユーザ、研究者、規制機関を含むSH利害関係者に恩恵をもたらすことが期待されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:55:50 GMT)
From Questions to Queries: An AI-powered Multi-Agent Framework for Spatial Text-to-SQL [0.4] 単一エージェントアプローチは、空間的クエリのセマンティックおよび構文的複雑さにしばしば苦労する。
本稿では,自然言語質問を空間的クエリに正確に翻訳するためのマルチエージェントフレームワークを提案する。
我々は,非空間的KaggleDBQAベンチマークと包括的SpatialQAベンチマークを用いて,本システムの評価を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:58:17 GMT)
Hurdle-IMDL: An Imbalanced Learning Framework for Infrared Rainfall Retrieval [0.4] 本研究では,Hurdle-Inversion Model Debiasing Learningフレームワークを提案する。
環境変数の分布の不均衡に対処し、希少かつ高影響の事象の検索の強化を可能にする。
その重要な進歩は、体系的な過小評価の効果的な緩和と、重雨から極度の雨の回収における顕著な改善である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:25:52 GMT)
Embedding the MLOps Lifecycle into OT Reference Models [0.4] マシンラーニングオペレーション(MLOps)のプラクティスは、産業環境では極めて厳格に採用されていますが、Opera-Optial Technology(OT)システムとの統合には大きな課題があります。
このpa-perは、MLOpsとOTen-vironmentsを組み合わせる際の基本的な障害を分析し、確立したOT参照モデルにMLOps prac- ticesを組み込むための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:14:21 GMT)
Frequency Cam: Imaging Periodic Signals in Real-Time [0.4] 画像画素が点滅する基本周波数を検出するための効率的なイベントカメラアルゴリズムを提案する。
フルセンサ・周波数イメージングにおける重要な設計パラメータについて論じる。
ラップトップCPUの単一コア上で,毎秒5000万イベント以上で動作する,ROSノードとしてのオープンソース実装である Frequency Cam について紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:05:30 GMT)
Learning Modular Exponentiation with Transformers [0.4] 4層エンコーダ・デコーダ・トランスモデルをトレーニングし、モジュラー指数化を行う。
相互学習は高い性能向上をもたらし、関連するモジュラーを突如に一般化する。
これらの結果から,変圧器モデルは特殊計算回路を用いてモジュラー演算を学習することが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:33:42 GMT)
BadGraph: A Backdoor Attack Against Latent Diffusion Model for Text-Guided Graph Generation [0.4] BadGraphはテキスト誘導グラフ生成のための潜伏拡散モデルをターゲットにしたバックドアアタック手法である。
4つのベンチマークデータセットの実験では、攻撃の有効性とステルスが示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:54:17 GMT)
FMI-Based Distributed Co-Simulation with Enhanced Security and Intellectual Property Safeguards [0.4] 本稿では,サイバーセキュリティとIP保護機構を強化した分散コミュレーション手法を提案する。
4つの異なるネットワーク設定で2つの共シミュレーションデモを用いて、このアプローチの機能を紹介する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:10:08 GMT)
Exploring the Limitations of Layer Synchronization in Spiking Neural Networks [0.3] 真に非同期なシステムでは、すべてのニューロンが閾値を同時に評価し、シナプス前電流を受けるとスパイクを発生させることができる。
スパイクを減らし、推論を高速化し、競争力や精度を向上する非同期処理の可能性を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:55:27 GMT)
Two approaches to multiple canonical correlation analysis for repeated measures data [0.3] 我々は多次元ランダムプロセスに類似したアプローチを開発する。
2つのデータセットと適切な大標本理論に応用することで、我々のアプローチを正当化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:17:18 GMT)
A Unified Framework for Zero-Shot Reinforcement Learning [0.3] ゼロショット強化学習(Zero-shot reinforcement learning, RL)は、一般エージェントを教師なしで開発するための場として登場した。
関心が高まりつつあるにもかかわらず、この分野には共通の分析レンズがない。
ゼロショットRLのための最初の統一フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:30:26 GMT)
A novel attention mechanism for noise-adaptive and robust segmentation of microtubules in microscopy images [0.3] 本研究では,Squeeze-and-Excitation (SE)モジュールを拡張し,様々なノイズレベルに動的に適応する新しいノイズ適応型アテンション機構を提案する。
このアダプティブSE(ASE)はU-Netデコーダに統合され、残りのエンコーダブロックが組み込まれ、軽量だが強力なモデルであるab_Res_U-Netを形成する。
合成画像と実雑音画像の両方の微小管を効果的に分画し、最先端のカービリナー構造分画法より優れていた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:37:13 GMT)
Exploring Large Language Models for Access Control Policy Synthesis and Summarization [0.3] 大規模言語モデル(LLM)は、自動コード合成と要約において大きな成功を収めている。
本稿では,アクセス制御ポリシの合成と要約におけるLLMの有効性について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:06:15 GMT)
Balancing Specialization and Centralization: A Multi-Agent Reinforcement Learning Benchmark for Sequential Industrial Control [0.3] 本研究では、SortingEnvとContainerGymという2つの既存のベンチマークのタスクを組み合わせた、業界にインスパイアされたベンチマーク環境を導入する。
特殊エージェントを備えたモジュラーアーキテクチャとフルシステムを管理するモノリシックエージェントの2つのコントロール戦略を評価し,アクションマスキングの影響を解析した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:21:54 GMT)
Capability Ceilings in Autoregressive Language Models: Empirical Evidence from Knowledge-Intensive Tasks [0.3] 知識集約型タスクにおけるデコーダのみの自己回帰言語モデルにおける機能天井の文書化を行う。
我々は、OPTおよびPythiaモデルファミリーの能力特異的スケーリング障害を定量化し、リソース割り当て決定を通知する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:09:31 GMT)
ComProScanner: A multi-agent based framework for composition-property structured data extraction from scientific literature [0.2] ComProScannerは、化学組成や性質の抽出、検証、分類、可視化を容易にする、自律的なマルチエージェントプラットフォームである。
オープンソースとプロプライエタリの両方のモデルを含む10の異なるLCMに対して,100のジャーナル記事を用いたフレームワークの評価を行った。
DeepSeek-V3-0324は全てのモデルで0.82の精度で性能を上げた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:01:44 GMT)
Learning-Driven Annealing with Adaptive Hamiltonian Modification for Solving Large-Scale Problems on Quantum Devices [0.2] 学習駆動アニーリング(LDA)は、個々の量子アニーリングの進化をグローバルなソリューション戦略に結びつけるフレームワークである。
LDAは問題構造について学び、ハミルトニアンを適応的に修正する。
大規模スピングラス用ハイブリッド量子古典解法の開発によるLDAの有効性を実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:16:01 GMT)
VESSA: Video-based objEct-centric Self-Supervised Adaptation for Visual Foundation Models [0.2] ファンデーションモデルは、大規模な事前訓練と教師付き微調整によって、多様なタスクにわたる強力なパフォーマンスを実現することにより、高度なコンピュータビジョンを持つ。
本稿では,視覚基盤モデルに対して,アノテーションを必要とせずに新たなドメインにモデルを適応させる,自己教師型微調整の新たな定式化を提案する。
VESSA(VojEct-centric Self-Supervised Adaptation for visual foundation model)と呼ぶ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:44:28 GMT)
Characterizing Neon Thin Film Growth with an NbTiN Superconducting Resonator Array [0.2] 超伝導マイクロ波共振器を用いた薄膜ネオン薄膜の制御と特性評価について報告する。
以上の結果から, 共振器をベースとしたメロロジーがネオン膜成長の指標となることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:29:41 GMT)
Classical optimisation of reduced density matrix estimations with classical shadows using N-representability conditions under shot noise considerations [0.1] 従来のシャドウトモグラフィーにおける改良型推定器の選択により,従来の研究に基づいて構築した。
我々は,これらの手法がスタンドアローンの古典的シャドウプロトコルの偏りのない推定器より優れている特定の状況について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:40:56 GMT)
Randomized benchmarking of a high-fidelity remote CNOT gate over a meter-scale microwave interconnect [0.1] 本稿では,Tunable-Coupling Qubits (TCQs) とベンチマークに基づくモジュール間相互接続を,フレーム追跡技術によって実現されたSPAM-エラートレラント方式で提案する。
本稿では,各モジュールのローカルCZゲートとリモート状態転送で構成されるモジュール間のリモートCNOTゲートを提案し,ランダム化ベンチマーク法を用いて0.933のゲート忠実度を報告する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:54:49 GMT)
Certifying Randomness or its Lack Thereof for General Network Scenarios [0.1] より一般的な因果構造、すなわちネットワークシナリオにおけるランダム性認証について検討する。
インフレーション技術として知られる計算ツールをどのように適用できるかを実証する。
また、確率分布の古典性の証明と混同してはならないランダム性の欠如の証明問題に対する計算方法も提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:43:51 GMT)
From Cheap to Pro: A Learning-based Adaptive Camera Parameter Network for Professional-Style Imaging [0.1] ACamera-Netは軽量かつシーン適応型のカメラパラメータ調整ネットワークである。
RAW入力から最適露出とホワイトバランスを予測する。
画像品質を継続的に向上し、知覚出力を安定させる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:35:17 GMT)
Efficient Floating-Point Arithmetic on Fault-Tolerant Quantum Computers [0.1] 浮動小数点数をTwo's Complement固定点行列とTwo's Complement積分指数を用いて符号化する。
我々は,ビットシフト,相互変換,乗算,加算などの基本演算のための量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:45:41 GMT)
Optimizing Clinical Fall Risk Prediction: A Data-Driven Integration of EHR Variables with the Johns Hopkins Fall Risk Assessment Tool [0.1] 我々は,Johns Hopkins Fall Risk Assessment Toolの転倒リスク予測を臨床的に意味のある指標と整合させることを目標としている。
当院では,ジョンズ・ホプキンス病院3病院から54,209人の入院患者について振り返り分析を行った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:31:09 GMT)
Gravitationally mediated entanglement of fermionic qubits: from static to dynamical limits [0.1] 我々は,2つの顕微モデルを用いて,2つの遠隔量子ビット間の重力によって生じる絡みを解析した。
相互作用のメディエータとしてグラビトンプロパゲータが使用され、クビットは空間重畳状態にあると考えられる。
我々の発見は、重力による2つのスピン-1/2粒子間の絡み合いにより多くの光を当てた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:13:06 GMT)
Adaptive PCA-Based Outlier Detection for Multi-Feature Time Series in Space Missions [0.0] 特徴量削減のための主成分分析(PCA)の再構成誤差に基づく適応型外乱検出アルゴリズムを提案する。
我々は,NASAのMMSミッション観測を通して,宇宙環境,昼と夜の過渡現象,遷移層などの宇宙プラズマ事象を検出するアルゴリズムの有効性を実証した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:51:39 GMT)
A Multi-Stage Hybrid Framework for Automated Interpretation of Multi-View Engineering Drawings Using Vision Language Model [0.0] 本稿では,2次元多視点エンジニアリング図面の自動解釈のための3段階ハイブリッドフレームワークを提案する。
YOLOv11-detは、ビュー、タイトルブロック、ノートなどのキー領域をローカライズするレイアウトセグメンテーションを実行する。
第2ステージでは、CAD対応のYOLOv11-obbを使用して、測定値、GD&Tシンボル、表面粗さインジケータなど、アノテーションのきめ細かい検出を行う。
第3ステージでは、セマンティックコンテンツ解析に2つのDonutベースのOCRフリーVLMを使用している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:07:31 GMT)
CBDiff:Conditional Bernoulli Diffusion Models for Image Forgery Localization [0.0] 本稿では,画像フォージェリーローカライゼーションのための条件付きベルヌーイ拡散モデル(CBDiff)を提案する。
CBDiffは、より豊かでより包括的な偽の分布表現を提供する。
既存の最先端の手法を著しく上回り、現実世界のデプロイメントに対する強力な可能性を強調している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:56:32 GMT)
Urban Planning in 3D with a Two-tier LUTI model [0.0] 2層ローリーモデルは、計画プロセスに直接人口と雇用の動的シミュレーションをもたらす。
このフレームワークは、地域モデルと近隣の設計を結びつけることで、計画立案者が時間とともに代替計画シナリオがどのように進化するかを探求することを可能にする。
CityEngineで実装されたこのアプローチは、インタラクティブな可視化とマルチスケールシナリオの評価を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:42:31 GMT)
Assessing the Feasibility of Early Cancer Detection Using Routine Laboratory Data: An Evaluation of Machine Learning Approaches on an Imbalanced Dataset [0.0] 犬における早期がん検出のためのアクセス可能なスクリーニングツールの開発は、獣医学における重要な課題である。
本研究は,Golden Retriever Lifetime Studyコホートを用いたがんリスク分類の可能性を評価する。
通常の検査データには統計的に検出可能ながんシグナルが存在するが、正常な老化やその他の炎症状態から臨床的に信頼性の高い識別を行うには弱く、確立されていないと結論付けている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:52:42 GMT)
Epistemic Deference to AI [0.0] AIシステムの中には、人工てんかん(AEA)がある、と私は主張する。
AEAは、ユーザの独立したてんかんに対する完全な代替ではなく、貢献的な理由として機能すべきである。
実際には要求されているが、このアカウントはAIの推論が正当化されるタイミングを決定するための原則化された方法を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:55:51 GMT)
Generative diffusion model surrogates for mechanistic agent-based biological models [0.0] CPM(Cellular-Potts Model)は、CPMを開発・尋問する強力なフレームワークである。
サロゲートモデルは複雑な生物学的システムのCPMを加速的に評価することができる。
我々は、in vitroで血管新生を調べるために使用されるCPMのAI代理分類器を訓練する。
我々の研究は、生体システムのデジタル双対を開発するためのDDPMの実装に向けた一歩である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:53:00 GMT)
Wilson Line and Disorder Invariants of Topological One-Dimensional Multiband Models [0.0] 巻数、チャーン数、ザック位相などの位相不変量は、バルク材料の位相を特徴づける。
広帯域位相不変量を計算するために、ブリルアンゾーンを横断する未開のウィルソン線を導入する。
このアプローチは、伝統的な不変量によって見落とされたものを含むすべての位相的エッジ状態を正確にキャプチャする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 00:51:33 GMT)
What do model reports say about their ChemBio benchmark evaluations? Comparing recent releases to the STREAM framework [0.0] ほとんどのフロンティアAI開発者は、新しいAIモデルの安全性評価をモデルレポートに公開している。
しかし、現在、開発者はレポートに -- あるいは省略 -- 評価方法論のどの側面を含んでいますか?
本稿では、2025年春に発表された3つのフロンティアAIモデルレポートについて、最も詳細なドキュメンテーションについて検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:35:15 GMT)
What do AI-Generated Images Want? [0.0] 私は現代のAI画像生成ツールに照らしてW.J.T.ミッチェルの質問を再検討した。
AI生成画像は、基本的に抽象的であるため、具体性と具体性を求めていると私は主張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:48:47 GMT)
Universal breathing mode scaling in harmonically trapped Fermi gases [0.0] 我々は、調和に閉じ込められたフェルミ気体の呼吸(モノポール)モードに関する普遍的で実験可能な分析法則を導出する。
すべての式は、チャンネルごとのキャリブレーション後にパラメータフリーになる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:35:16 GMT)
Under Pressure: Security Analysis and Process Impacts of a Commercial Smart Air Compressor [0.0] 産業用IoT(Industrial Internet of Things)デバイスを製造環境に統合することで、Industrial 4.0への移行が加速された。
本稿では,商用スマートエアコンプレッサの総合的なセキュリティ解析を行い,重大な脆弱性を明らかにする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:37:33 GMT)
Ultrafast All-Optical Measurement of Squeezed Vacuum in a Lithium Niobate Nanophotonic Circuit [0.0] 我々は、集積フォトニクスにおける量子状態トモグラフィーを実現し、ナノフォトニクス回路における圧縮真空の生成と全光学ウィグナートモグラフィーを実証する。
我々は分散工学を用いてフェムト秒パルスの歪みのない伝播を可能にし、超広帯域動作帯域を実現する。
室温統合プラットフォームにおける全光学超高速量子情報処理を実現するためのコースを図示した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:26:53 GMT)
Two dimensional sub-wavelength topological dark state lattices [0.0] 我々は、スカラー電位と同じ領域に局在した合成磁場の狭く強いパッチを伴って、サブ波長クロニグ・ペニーのような幾何スカラー電位を生成する方法を示す。
これらの急激なピーク磁束は、反対符号の滑らかな背景磁場によって補償され、単位セル当たりのネット磁束はゼロとなる。
数値解析により、理想的なチャーンバンドの存在と、非断熱効果と損失に対するトポロジカル位相の堅牢性が確認された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:06:05 GMT)
Time-cost-error trade-off relation in thermodynamics: The third law and beyond [0.0] 完全占有状態と占有状態からなる分離状態の概念を考察し、対応する熱力学的コストと誤差を定式化する。
分離状態の生成を目的とした熱力学演算における時間,コスト,誤差の3方向のトレードオフ関係を見出した。
これらの結果は、マルコフ力学と非マルコフ力学の両方を含む量子状態に拡張する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:22:05 GMT)
Thermodynamic decoupling in the deep-strong coupling regime [0.0] 深い結合状態においては、光と物質の間の相互作用は素の周波数を超え、効果的な疎結合をもたらす。
関連する熱電流は、任意の量子熱機械において重要な非局所観測可能であり、この極端なカップリングシナリオにおいてゼロに近づいたことを示す。
以上の結果から,解離はDSC体制のより一般的な特徴であり,量子サーモトロニクスに影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:56:51 GMT)
The surface code beyond Pauli channels: Logical noise coherence, information-theoretic measures, and errorfield-double phenomenology [0.0] 我々は、コヒーレントなコンポーネントと非コヒーレントなコンポーネントの両方を特徴とするエラーの下で、表面コードを考える。
非ゼロ非コヒーレントノイズ成分に対して、論理ノイズのコヒーレンスを指数関数的にコード距離で抑制することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:49:30 GMT)
The complexity of perfect quantum state classification [0.0] 我々は、$k$-learnabilityという概念を導入し、ゼロエラーで、少なくとも$k$ guessesを使って正しい状態を識別する能力をキャプチャする。
与えられた状態の族が$k$-learnableであるかどうかを半定値プログラミングによって決定できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:53:53 GMT)
The category of anyon sectors for non-abelian quantum double models [0.0] 無限体積の任意の有限ゲージ群に対する北エフの量子二重モデルについて検討する。
自己準同型をブレイドされたモノイダル圏に整理し、エノンの融合とブレイディング特性を捉える。
これは、非アーベル異性体を持つ2次元量子格子モデルのクラスに対する完全なDHR構造を初めて確立する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:11:02 GMT)
The Verification-Value Paradox: A Normative Critique of Gen AI in Legal Practice [0.0] 機械学習ベースの生成AI製品は、法的な実践のコストを大幅に削減する、としばしば主張される。
本稿では,AI活用の実践評価に新たなパラダイムが必要であることを論じる。
オーストラリアなどでは、弁護士が不正確なAI生成コンテンツを裁判所に提出したとして非難されているケースは、このパラダイムを再検討する必要があることを示唆している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:26:37 GMT)
The Mirror Loop: Recursive Non-Convergence in Generative Reasoning Systems [0.0] 外部からのフィードバックのない再帰的な自己評価は、進歩よりもむしろ改革をもたらすことが多い。
3つのモデル(OpenAI GPT-4o-mini, Anthropic Claude 3 Haiku, Google Gemini 2.0 Flash)と4つのタスクファミリー(パラメータ、コード、説明、リフレクション)にまたがる144の推論シーケンスについて検討する。
我々はこれを、生成的推論における自己補正の構造的限界の証拠として解釈する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:53:26 GMT)
The Lock-In Phase Hypothesis: Identity Consolidation as a Precursor to AGI [0.0] 大規模言語モデル (LLM) は広くオープンであり、非常に安定している。
人間の発達と類似して、人工知能(AGI)の進歩にはロックインフェーズが伴うという仮説を立てる。
我々は、このフェーズを形式化し、学習力学における既知の現象にリンクし、オンセット検出のための運用メトリクスを提案する。
この結果から,小型モデルにおける性能トレードオフから,中規模モデルにおけるコストフリー導入,大規模モデルにおける過渡的不安定化に至るまで,さまざまな結果が得られた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:20:10 GMT)
Testing Most Influential Sets [0.0] モデル結果に不均等な影響を与えるデータの小さなサブセットは、結論に劇的な影響を与える可能性がある。
我々は、最も影響力のある集合の統計的意義を評価するための原則的枠組みを開発する。
我々は、経済学、生物学、機械学習ベンチマークにまたがる応用を通して、我々のアプローチの実践的価値を実証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:12:29 GMT)
Teaming LLMs to Detect and Mitigate Hallucinations [0.0] 単一モデル整合性の拡張は幻覚検出と緩和能力を大幅に向上させる可能性が示唆された。
私たちは、この"コンソーシアム一貫性"アプローチを、15のモデルチームのプールから多くのモデルチームにわたって評価します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:12:10 GMT)
Symmetry in Software Platforms as an Architectural Principle [0.0] ソフトウェアプラットフォームは構造保存システムとして機能する。
それらは、我々が対称性と表現する特定の変換の下で安定な、一貫したインターフェイスと振舞いを提供する。
本稿では,そのような構造的規則性によって構造的ロバスト性が生じるという考えを考察する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:38:32 GMT)
Symbolic Regression and Differentiable Fits in Beyond the Standard Model Physics [0.0] 粒子物理のプローブモデルに対する記号回帰の有効性を実証する。
我々は,ヒッグス質量,コールドダークマターの相対密度,ムーンの異常磁気モーメントへの寄与に着目した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:40:15 GMT)
Stuck in the Matrix: Probing Spatial Reasoning in Large Language Models [0.0] 本稿では,大言語モデル(LLM)のテキスト入力に対する空間的推論能力について検討する。
これらのモデルは, グリッド型環境下での空間的推論と多段階問題の解法の両方で検証された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:32:46 GMT)
Structures generated in a multiagent system performing information fusion in peer-to-peer resource-constrained networks [0.0] ホロン生成はマルチエージェント・システム・モデルに基づいて総合的に研究される。
本稿では,資源に制約がある場合,ホロニック構造がどのように生成されるかを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:07:32 GMT)
Structured Spectral Graph Representation Learning for Multi-label Abnormality Analysis from 3D CT Scans [0.0] 3次元胸部CTスキャンのマルチラベル分類は依然として重要な課題である。
3次元畳み込みニューラルネットワークに基づく既存の手法は、長距離依存を捉えるのに苦労する。
本稿では3次元CTボリュームを構造化グラフとして表現するグラフベースの新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:22:37 GMT)
Stateful KV Cache Management for LLMs: Balancing Space, Time, Accuracy, and Positional Fidelity [0.0] キーバリュー(KV)キャッシュは、大規模言語モデル(LLM)における効率的な自己回帰推論に不可欠である
本稿では,KVキャッシュ管理戦略とメタラマ/メタラマ-3-8b-インストラクトのようなモデルのアーキテクチャ的コンテキスト制限との相互作用について検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:22:00 GMT)
SpectraMorph: Structured Latent Learning for Self-Supervised Hyperspectral Super-Resolution [0.0] ハイパースペクトルセンサーは1ピクセルあたりの高密度スペクトルをキャプチャするが、空間分解能は低い。
マルチスペクトル、RGB、パンクロマチックカメラなどの共登録のセンサーは、高解像度の空間的詳細を提供する。
物理誘導型自己教師型核融合フレームワークSpectraMorphを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:59:26 GMT)
Separating Pseudorandom Generators from Logarithmic Pseudorandom States [0.0] 我々は、(量子評価可能な)PRGとPRSの量子ブラックボックス分離を確立する。
デジタルシグネチャや量子公開鍵暗号を含む対数PSSで示されるいくつかのプリミティブとPRGを分離する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:09:29 GMT)
Scalable GPU-Accelerated Euler Characteristic Curves: Optimization and Differentiable Learning for PyTorch [0.0] 我々は,Euler Characteristics Curve(ECC)向けに最適化されたGPUカーネルを提案し,合成グリッド上でのGPU実装よりも16-2000"Oの高速化を実現した。
エンドツーエンドの学習を可能にする差別化可能なPyTorch層を導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:59:07 GMT)
SPLite Hand: Sparsity-Aware Lightweight 3D Hand Pose Estimation [0.0] 我々は,エンコーダ・デコーダアーキテクチャを採用した軽量なフレームワークを設計し,効率性と精度の向上を目的としたいくつかの重要なコントリビューションを紹介する。
本研究では,ResNet-18のバックボーンにスパース畳み込みを適用し,手ポーズ画像の空間性を利用して,エンドツーエンドの効率改善を42%達成する。
このアーキテクチャにより、復号プロセスのフレームレートはRaspberry Pi 5の3.1倍向上し、精度は同等に維持される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:59:22 GMT)
Robust GHz-range AC Magnetometry with an ensemble of NV Centers in Diamond using Concatenated Continuous Dynamical Decoupling [0.0] 我々は、空間的不均一な駆動場下でのNV中心の大規模なアンサンブルを用いたGHz帯交流磁力計を実験的に実証した。
提案手法のロバストな装束状態は、GHz帯交流磁力計において、より弱い信号まで測定範囲を大きく広げることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:08:29 GMT)
Recoherence, adiabaticity, and Markovianity in Gaussian maps [0.0] 本研究では, 量子リコヒーレンス(過渡的脱コヒーレンス相の時間的浄化) , 断熱性, マルコビアン性の関係について検討した。
以下に純度が振動する結合強度の臨界値と指数関数的に減衰する値があることが分かる。
デコヒーレンス(decoherence)が発生しても、システムのダイナミクスはマルコフ的ではないことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:24:42 GMT)
Real-Time Currency Detection and Voice Feedback for Visually Impaired Individuals [0.0] 本稿では,視覚障害者を支援するリアルタイム通貨検出システムを提案する。
提案モデルは、USドル(USD)、ユーロ(EUR)、バングラデシュ高(BDT)の3種類の通貨を表す30種類の紙幣と硬貨を含むデータセットに基づいて訓練される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 06:48:04 GMT)
REx86: A Local Large Language Model for Assisting in x86 Assembly Reverse Engineering [0.0] 大規模言語モデル(LLM)は、自動理解とコメントを通じてリバースエンジニアリング(RE)効率を改善する可能性を提供する。
クラウドでホストされ、クローズドウェイトなモデルは、プライバシとセキュリティのリスクをもたらし、クローズドネットワークの施設では使用できない。
これらの設定でx86 REタスクを補助するためのパラメータ効率の良い微調整ローカルLLMを評価した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:09:21 GMT)
Quantum Sensing of Gravitational Frame-Dragging with a Superfluid $^4$He Gyrometer [0.0] 超流動ジャイロメータにおけるフレームドラッグとそれに関連する測地効果とトーマス効果を導出する。
熱騒音フロアを計算した結果,ミリケルビン温度で非常に高い感度が期待できることがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:45:58 GMT)
Quantum Interference and the Limits of Separability [0.0] 量子理論は、粒子$textitcan$は干渉測定実験で波のような振舞いを示すが、この振舞いは3階と高階の干渉を許容するために$textitnot$に制限されていることを暗示している。
したがって、量子干渉の構造は、事象が非分離的な方法で互いに影響しあうことを教えてくれるが、この非分離性は特定の正確な量的限界を持つ。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 21:45:40 GMT)
Quantum Coherence in Superconducting Vortex States [0.0] アブリコソフ渦(Abrikosov vortices)は、超伝導のギャップが核内で完全に抑制され、散逸的に半古典的な物質である。
粒状超伝導膜に閉じ込められた渦が2段階の系として振る舞うことを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:39:55 GMT)
Probability-Phase Mutual Information [0.0] 確率位相相互情報$I(P;Phi)$を紹介する。
アンサンブルレベルでの量子コヒーレンスを特徴付けることを示す。
凝縮物質物理学における量子熱力学と深熱化の関連性を強調した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:58:21 GMT)
Prefetching Cache Optimization Using Graph Neural Networks: A Modular Framework and Conceptual Analysis [0.0] 本稿では、グラフ構造化データ内のアクセスパターンをモデル化し、予測するためにグラフニューラルネットワーク(GNN)を利用するモジュラーフレームワークを提案する。
複雑な依存関係を学習することで、GNNベースのアプローチが従来の手法より優れていることを示す、詳細な概念分析を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:35:35 GMT)
Position: Many generalization measures for deep learning are fragile [0.0] 我々は、多くのポストモーテム一般化対策 -- 訓練されたネットワーク上で計算された -- は、textbffragileであると主張している。
基礎となるDNNにほとんど影響を与えない小さなトレーニング修正は、測定値の価値、傾向、スケーリングの振る舞いを大きく変える可能性がある。
このポジションペーパーでは、新しい対策の開発者は、脆弱性について明確に監査すべきである、と論じている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:02:19 GMT)
Phase Transitions and Virtual Exceptional Points in Quantum Emitters Coupled to Dissipative Baths [0.0] 工学的環境における原子-光子相互作用の制御は、量子光学と新興量子技術の中心である。
非エルミチアン(NH)光浴は、散逸がスペクトルや動的性質を根本的に再認識し、そのような制御のための多目的なプラットフォームを提供する。
ここでは,半無限散逸型ボソニック格子の端に結合した単一2レベル量子エミッタの緩和ダイナミクスについて検討する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:57:58 GMT)
PersonaMatrix: A Recipe for Persona-Aware Evaluation of Legal Summarization [0.0] 法律文書は、しばしば長く、密度が高く、理解が難しい。
本稿では、6人の人物のレンズを通して要約をスコアするペルソナ・バイ・クリータ・アセスメント・フレームワークであるペルソナ・マトリックスを紹介する。
また、米国公民権訴訟の要約を、深さ、アクセシビリティ、手続きの細部によって制御した次元シフトしたパイロットデータセットも導入する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:59:04 GMT)
Optimal constant-cost implementations of Clifford operations using global interactions [0.0] 任意の単一量子ビット演算とプログラム可能な全量子ビットエンタングゲートを組み合わせた量子回路について検討する。
本研究は,これらのコンパイルを実現するための実用的で効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:45:59 GMT)
On the accuracy of implicit neural representations for cardiovascular anatomies and hemodynamic fields [0.0] Inlicit Neural representations (INR) は知識表現、合成、圧縮のための強力なフレームワークとして登場した。
本研究は,循環動態場を圧縮し,心血管解剖を表現するための最先端INRの性能を評価するものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:57:50 GMT)
Note on Energy Shifts of Oscillators in Blackbody Radiation [0.0] 高温Tでは、エネルギーと自由エネルギーのシフトは-T2と+T2と異なる。
高温Tでは、エネルギーと自由エネルギーのシフトは-T2と+T2と異なる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:28:02 GMT)
Nontrivial topological phases in "Zig-Zag" arrays of polarization transmons [0.0] 本稿では超伝導量子シミュレーターを提案し,よく知られたZig-Zagモデルの拡張について検討する。
線形化メタ原子を用いて,提案手法は拡張されたZig-Zagモデルを密接に再現することを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:39:07 GMT)
Non-Markovianity in Quantum Information Processing: Interplay with Quantum Error Mitigation [0.0] 非マルコフ力学の負性性は自然に量子エラー補正(QEC)と量子テレポーテーションで現れる。
次に,量子情報処理における負性は,ゲージサブシステムの測定結果に基づくフィードバック操作の結果として現れることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:17:22 GMT)
No-broadcasting of non-Gaussian states [0.0] ガウシアン操作による非ガウシアン状態の放送は不可能であることを示す。
我々の証明はガウス演算の固定点の理解に基づいており、制御系の理論に関係している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:58:35 GMT)
Neural Diversity Regularizes Hallucinations in Small Models [0.0] 固定パラメータとデータ予算における幻覚率を低減させる原理的なメカニズムとして神経多様性を提案する。
我々の結果は、ニューラルネットワークの多様性をパラメータとデータへのスケーリングの第3軸として強調し、固定予算での言語モデルの信頼性を改善しました。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:03:07 GMT)
Multiplexed ion-ion entanglement over $1.2$ kilometer fibers [0.0] 本研究は,2つの量子ネットワークノード間での多重化による有意な絡み合いを実演する。
10ドルでテンポラルフォトニックモードを多重化することで、イオンイオンの絡み合い生成において4.59倍のスピードアップを達成する。
我々のシステムは複数のノードに対して容易にスケーラブルであり、将来の大規模量子ネットワークの鍵となるビルディングブロックを確立することができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:42:31 GMT)
Multi-Task Deep Learning for Surface Metrology [0.0] 表面テクスチャパラメータを予測するために,再現可能な深層学習フレームワークを提案する。
不確実性は、量子的およびヘテロセダスティックなヘッドによってモデル化され、ポストホック共形キャリブレーションにより、キャリブレーションされた間隔が生成される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:38:18 GMT)
Mitigating Coherent Errors through a Decoherence-Resistant Variational Framework employing Stabilizer State [0.0] 本稿では,変分コヒーレント誤差低減法(VCEM)を提案する。これは,変分ゲートパラメータの変分最適化によるコヒーレント誤差の抑制に安定化形式を利用する手法である。
VCEMはロバストな性能を示し、非コヒーレントノイズの影響をほとんど受けておらず、標準的非コヒーレントエラー軽減技術の適用前にコヒーレントエラーの事前補償を可能にする。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:27:14 GMT)
Merge and Conquer: Evolutionarily Optimizing AI for 2048 [0.0] 本稿では,AIを最適化してゲーム2048を解くための進化的学習手法について検討する。
我々は2エージェントメタプロンプティングシステムと1エージェントシステムという2つの異なるシステムを実装した。
本研究は,非決定論的環境におけるAI性能向上における進化的改善技術の可能性を示すものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:45:05 GMT)
Measuring weak microwave signals via current-biased Josephson Junctions II: Arriving at single-photon detection sensitivity [0.0] 電流バイアスジョセフソン接合(CBJJ)はジョセフソンしきい値検出器(JTD)として機能する。
非平衡JTDを用いて弱いマイクロ波信号の高感度検出を行うことができる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:57:50 GMT)
Lost in Translation: Policymakers are not really listening to Citizen Concerns about AI [0.0] 政府はAIに関する一般のコメントを募集しているが、その入力をポリシーに翻訳するにつれて、市民の発言の多くが失われている。
本稿は、市民にAIのリスクと政策についてコメントするよう促したオーストラリア、コロンビア、米国の三国を比較した。
各国では、人口の1%未満が参加している。
当局者は、受け取ったフィードバックに対する応答性に制限があることを示し、効果的なフィードバックループを作成しなかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:57:02 GMT)
Local-to-Global Entanglement Dynamics by Periodically Driving Impurities [0.0] 不純物の局所フロケット駆動を受ける一次元スピン鎖の絡み合いダイナミクスについて検討した。
大規模駆動期間は, エンタングルメントエントロピー(EE)の線形成長を観測し, 体積法エントロピーを伴う加熱相を示す。
臨界値$T_ast$以下の運転期間の場合、EEは局所量子クエンチの特徴である時間とともに亜指数的に成長する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 18:02:22 GMT)
Learning Coupled Earth System Dynamics with GraphDOP [0.0] GraphDOPは、生の衛星とその場観測から直接天気を予測することを学習するグラフベースの機械学習モデルである。
ケーススタディには、北極における急激な海氷の凍結、ハリケーンイアンによる海面の冷却、2022年の欧州の厳しい熱波などが含まれる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:36:20 GMT)
LLM-empowered knowledge graph construction: A survey [0.0] 知識グラフは長い間、構造化知識表現と推論の基盤として機能してきた。
LLM(Large Language Models)の出現により、KGsの構築は、ルールベースおよび統計パイプラインから言語駆動および生成フレームワークへの、新たなパラダイムシフトに入った。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:43:28 GMT)
Kondo breakdown induced by the non-Hermitian complex hybridization [0.0] 我々は,非エルミート複素ハイブリダイゼーションを用いたアンダーソン不純物モデルについて,近藤分解の簡単な理解を提供する有効なモデルとして検討する。
本研究では,スレーブ・ボソン平均場理論を用いて,単一の複雑なパラメータで近藤分解を説明することができることを示す。
我々は、スレーブ・ボソン平均場理論によって得られた結果を支持する正確なBetheアンザッツ解を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:11:23 GMT)
JSTprove: Pioneering Verifiable AI for a Trustless Future [0.0] 我々は、AI推論の証明を生成し検証するための特殊なzkMLツールキットであるJSTproveを紹介する。
我々は、コミュニティのレビューと拡張を促進するために、JSTproveの設計、革新、実世界のユースケース、および青写真とツールを紹介します。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:22:38 GMT)
Integrating Structural and Semantic Signals in Text-Attributed Graphs with BiGTex [0.0] BiGTexは、スタック化されたGraph-Text Fusion Unitを通じてGNNとLLMを密に統合する新しいアーキテクチャである。
BiGTexはノード分類における最先端性能を実現し、リンク予測に効果的に一般化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:06:25 GMT)
Integrability from a Single Conservation Law in Quantum Spin Chains [0.0] 有限範囲の相互作用を持つ量子スピン鎖に対して、Reshetikhin条件は無限に多くの局所保存量の存在を意味することを証明している。
このことは、ヤン=バクスター方程式の解に付随する保存法則の階層構造が、既に最低の非自明な保存法則に符号化されていることを示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:06:32 GMT)
HumanCM: One Step Human Motion Prediction [0.0] 我々は、一貫性モデルに基づいて構築された1ステップのヒューマンモーション予測フレームワーク、HumanCMを提案する。
HumanCMは、ノイズとクリーンな動作状態の自己整合性マッピングを学習することにより、効率的なシングルステップ生成を行う。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:49:30 GMT)
Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions [0.0] 本稿では,デジタル資産取引における異常検出のための人間中心型マルチエージェントシステムHCLAを提案する。
このシステムは、構文解析、検出、説明の3つの役割を会話ワークフローに結びつけ、非専門家が自然言語で質問することを可能にする。
アーキテクチャ、インタラクションループ、データセット、評価プロトコル、制限について述べ、ヒューマン・イン・ザ・ループの設計が金融法医学における透明性と信頼性をどのように改善するかについて議論する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:04:36 GMT)
How typical is contextuality? [0.0] ランダムな準備と測定を適度に行う実験においても、文脈性はかなり一般的であることがわかった。
非ゼロの文脈性は非常に典型的であるが、定量的に高い文脈性は典型的ではない。
パラメータの関数としてコンテキストの典型性を出力するオープンソースのツールボックスを提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:39:17 GMT)
Homodyne Measurement of a Non-Hermitian Qubit Undergoing Fluorescence [0.0] 選択後の手順は、PT対称性を示す非エルミート量子ビットを生成する。
我々は,ポストセレクションによって導入された崩壊と測定バックアクションの相互作用を分析する。
結果は、測定バックアクションと非エルミート力学が共に開量子系の過渡的な挙動を形成する方法に関する洞察を与える。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:14:05 GMT)
Generation of multipartite photonic entanglement using a trapped-ion quantum processing node [0.0] ファクトリノードは、マルチパーティントエンタングルメントの生成と配布のハブとして機能する。
我々は、3つの経路スイッチ可能な光子のグリーンベルガー・ホーネ・ザイリンガー状態(GHZ)を生成するために,本システムをプログラムする。
以上の結果から, コトラップイオン量子ビットの絡み合った状態の確定的準備のための確立された技術が, 走行光子の同じ状態の調製に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:31:23 GMT)
Generating pseudo-random unitaries with a Floquet driven chaotic quantum system [0.0] 我々は、擬ランダムユニタリ演算子を生成するために、トーラス上のエルゴードフロッケ量子システムを用いて検討する。
我々は, 位相空間をカバーするエルゴード領域を持ち, 共振サブ構造が欠如していることを保証するために, 強い摂動と平衡周波数を超える摂動周波数を有するハーパーモデルの体系を選択する。
有限次元空間におけるユニタリ作用素のサンプルを、その制御パラメータの分布からフロケプロパゲータを演算することによって生成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:07:45 GMT)
From Confinement to Chaos in AdS/CFT Correspondence via Non-equilibrium Local States [0.0] 大規模スカラー場の局所演算子挿入により作製した反ド・シッター(AdS)空間の励起状態について検討した。
双対CFT状態における境界観測値の時間発展を計算する。
この収束背景における励起状態のダイナミクスを解析する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:29:51 GMT)
Framework for Machine Evaluation of Reasoning Completeness in Large Language Models For Classification Tasks [0.0] 本稿では、説明の完全性のためのRAS-Reasoning Alignmentを紹介する。
我々は,広く使用されている4つのテキスト分類データセット,WIKI ONTOLOGY, AG NEWS, IMDB, GOEMOTIONSを分析した。
正解予測はサポート特徴のカバレッジが高く,正解予測は矛盾する特徴のカバレッジの増大と関連していることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:22:22 GMT)
Fragmentation of Virtual Orbitals for Quantum Computing: Reducing Qubit Requirements through Many-Body Expansion [0.0] 本研究は、量子ビット要求を40~66%削減する体系的なアプローチである仮想軌道フラグメンテーション(FVO)法を紹介する。
この方法は、仮想軌道空間を化学的に直感的な断片に分割し、多体展開技術を用いる。
階層的なQ-EFMO-FVOアプローチは、完全な計算と比較して96-100%の精度を達成する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:22:59 GMT)
Flat-band thermodynamics reveals enhanced performance across Otto, Carnot, and Stirling cycles [0.0] マジックアングルツイスト二層グラフェン(MATBG)は、外部磁場下で顕著な電子的性質を示す。
我々は,3つの異なる量子熱力学サイクル下でのMATBGの動作相図を包括的に解析する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:48:45 GMT)
Finding the Sweet Spot: Trading Quality, Cost, and Speed During Inference-Time LLM Reflection [0.0] 本稿では,数学的推論および翻訳作業における自己回帰と予算調整を比較した。
解析の結果,自己回帰の有効性の領域依存的な変化が明らかとなり,数学的推論では最大220%の性能が向上した。
実世界の環境での知見の検証を目的として,ZalandoによるLoungeにおける自己回帰型マーケティングコンテンツローカライゼーションシステムを構築した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:26:18 GMT)
Field emission tunnelling as a window onto fundamental issues in quantum mechanics [0.0] 本稿では,関連する量子力学的問題,問題,関連性を明らかにする。
以下のトピックは、より深い調査や議論を継続するものとして特定されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 19:45:29 GMT)
Feasibility of entanglement-based QKD protocols with SPDC and QD sources [0.0] 理論的には、絡み合いに基づく量子鍵分布(QKD)プロトコルの実現可能性について分析する。
我々はSPDC源における多光子放出とQDにおける微細構造分割(FSS)について検討した。
本研究は,現実的な情報源と検出器を用いた絡み合いベースのQKDプロトコルの実装に不可欠である。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 13:13:55 GMT)
FLAS: a combination of proactive and reactive auto-scaling architecture for distributed services [0.0] 本稿では、分散サービスのオートスケーラであるFLAS(Forecasted Load Auto-Scaling)を紹介する。
最適なスケーリングアクションを決定するために、状況に応じてプロアクティブとリアクティブのアプローチの利点を組み合わせる。
本稿では,コンテンツベースのパブリッシュ・サブスクライブ分散システムにおけるFLAS実装について述べる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:38:07 GMT)
Exploration through Generation: Applying GFlowNets to Structured Search [0.0] この研究は、トラベリングセールスパーソン問題、最小スパンニングツリー、最短パスという3つのグラフ最適化問題に生成フローネットワーク(GFlowNets)を適用した。
GFlowNetsは、報酬関数に比例してソリューションをサンプリングすることを学ぶ生成モデルである。
さまざまなサイズのベンチマークインスタンスの実験は、GFlowNetsが最適なソリューションを見つけることを学ぶことを示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:43:09 GMT)
Exact Quench Dynamics from Thermal Pure Quantum States [0.0] 積分可能系における熱純量子(TPQ)状態からのクエンチに追従するリアルタイム力学の正確な解を提案する。
平衡へのアプローチは、非常に非自明なコヒーレントダイナミクスを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:31:09 GMT)
Enhancing Security in Deep Reinforcement Learning: A Comprehensive Survey on Adversarial Attacks and Defenses [0.0] 本稿では、DRLの基本的枠組みを紹介し、複雑で変化する環境において直面する主なセキュリティ課題を分析する。
本研究は, 対人訓練, 競争訓練, 頑健な学習, 対人検出, 防衛蒸留, その他の防衛技術を含む, 現行の強靭性訓練戦略を体系的に要約する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:04:57 GMT)
Electronically-controlled one- and two-qubit gates for transmon quasicharge qubits [0.0] 電子制御可能なトンネル接合を用いて準電荷量子ビット上に単一および2量子ゲートを実装可能であることを示す。
この結果から,量子ドットの最小鎖のジャンクションに基づく準電荷量子ビットゲートの実装に対する説得力のある戦略が示唆された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:06:39 GMT)
Electric-field metrology of a terahertz frequency comb using Rydberg atoms [0.0] 我々は、テラヘルツ周波数コムを検知・校正するために、Rydberg原子に基づく新しいタイプの単光子検出器を用いる。
その結果,テラヘルツ周波数コムの量子状態への遷移が解明され,高精度かつ高感度な分光が可能となった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:36:50 GMT)
Efficient Meningioma Tumor Segmentation Using Ensemble Learning [0.0] 髄膜腫は原発性脳腫瘍の最も多い形態であり、すべての診断症例の3分の1近くを占める。
近年のディープラーニングの進歩は, 自動腫瘍分割の進展を加速させている。
本稿では,3つの異なるアーキテクチャを組み合わせたアンサンブルに基づくセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:51:22 GMT)
Effective Distance of Higher Dimensional HGPs and Weight-Reduced Quantum LDPC Codes [0.0] 重み付きqLDPC符号の有効距離を保った単一アンシラシンドローム抽出回路が存在することを示す。
その結果, 単一アンシラシンドローム抽出回路を用いた場合, 高次元ハイパーグラフ製品コードには問題ないことがわかった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 12:47:35 GMT)
Digital Permission Structures: How Celebrity Disclosure Enables Black Masculine Vulnerability in Online Mental Health Discourse [0.0] 伝統的な男性的規範は、感情的な制限と組織的な人種差別を要求し、制度的な不信を育む。
この研究は11,306人のYouTubeコメントを分析した。
結果は、ブラックマンスクリニティの赤字ベースのモデルに挑戦し、介入は、西洋の個人主義の枠組みを示唆するよりも、収集主義を活用し、高水準の文化的人物とパートナーし、強みに基づくメッセージングを採用し、中央のヒップホップの正当性を採用するべきであることを示唆している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:27:13 GMT)
Diagnosing Representation Dynamics in NER Model Extension [0.0] 標準セマンティクスと新しいパターンベースのPIIに基づいてBERTモデルを微調整すると、元のクラスでは最小限の劣化が生じる。
この研究は、NERモデル適応の機械的診断、特徴独立性の強調、表現重複、および'O'タグの可塑性を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:17:55 GMT)
Developing a Model-Driven Reengineering Approach for Migrating PL/SQL Triggers to Java: A Practical Experience [0.0] モデル駆動のリエンジニアリングを実装するソフトウェアプロセスを提案する。
再設計手法の実装と検証は、MDEの適用に関するいくつかの問題の評価と同様に詳細に説明されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:50:24 GMT)
DeepCausalMMM: A Deep Learning Framework for Marketing Mix Modeling with Causal Inference [0.0] DeepCausalMMMは、ディープラーニング、因果推論、高度なマーケティング科学を組み合わせることで制限に対処するPythonパッケージである。
パッケージはGated Recurrent Units(GRU)を使用して、アドストック(キャリオーバー効果)やラグなどの時間パターンを自動的に学習する。
また、ヒル方程式に基づく飽和曲線を実装し、減少するリターンをモデル化し、予算配分を最適化する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 02:49:44 GMT)
Decentralized Exchange that Mitigate a Bribery Attack [0.0] そこで本研究では,ゲーム理論解析によるマイナー・コルーシオン・贈収賄攻撃について述べる。
本稿では,ゲーム理論上安全なHTLCプロトコルであるprotを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:20:53 GMT)
DB-FGA-Net: Dual Backbone Frequency Gated Attention Network for Multi-Class Classification with Grad-CAM Interpretability [0.0] 本稿では、VGG16とXceptionをFGAブロックと統合した二重バックボーンネットワークを提案する。
本モデルでは,可変サイズおよび分散データセットに対するロバスト性を示す拡張を伴わず,最先端のパフォーマンスを実現する。
さらに透明性を高めるため、Grad-CAMはモデルが予測している腫瘍領域を可視化するために統合され、モデル予測と臨床解釈可能性のギャップを埋める。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:39:00 GMT)
Critical Quantum Sensing: a tutorial on parameter estimation near quantum phase transitions [0.0] 現在の進歩は、スケーラビリティ、環境ノイズ、そして実践的な統合における課題によって制約されている。
このチュートリアルでは、鍵となる概念の教育的な紹介と、卓越した量子センシング戦略の詳細な概要を提供する。
基本資源に対する推定精度の最適スケーリングに特に重点を置いている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:42:46 GMT)
Computing time-dependent reduced models for classical and quantum dynamics [0.0] 本稿では,固定部分空間に投影された自律システムの力学を近似的に近似する新しい手法を提案する。
この導出は、指数写像のテイラー展開と、ジェネレータの時間順序指数的カップリングアルゴリズムを計算するための新しい結果に基づいている。
結果として得られる近似は、短時間で正確であり、弱ランの仮定を必要とせず、低い順序で指数写像の切り離しよりも優れ、最低順序で完全に正かつトレース保存写像を保証する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 15:51:00 GMT)
Complete characterisation of state conversions by work extraction [0.0] 本稿では,量子系のエネルギー貯蔵強化を記述した熱力学的作業抽出タスクを紹介する。
この結果が,熱力学に基づく最初の普遍的資源認証クラスを確立する方法を示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 09:07:32 GMT)
Collateral Damage Assessment Model for AI System Target Engagement in Military Operations [0.0] このモデルは、統合された知識表現と推論アーキテクチャに時間的、空間的、力的な次元を統合する。
モデルは、インスタンス化によって実証され、評価される。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:36:04 GMT)
CoRECT: A Framework for Evaluating Embedding Compression Techniques at Scale [0.0] CoRECTは埋め込み圧縮手法の大規模評価のためのフレームワークである。
非学習圧縮は,最大100万パスにおいても,インデックスサイズを大幅に削減できることを示す。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 11:43:17 GMT)
Clustering of conditional mutual information and quantum Markov structure at arbitrary temperatures [0.0] 最近の研究では、単純な二部相関関数によって特徴づけられるエキゾチックな量子相が明らかにされている。
これらの相では、三部構造相関から生じる長距離の絡み合いが中心的な役割を果たす。
条件付き相互情報(CMI)は、最も確立された情報理論の尺度の一つである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:21:32 GMT)
Circuit-based cavity magnonics in the ultrastrong and deep-strong coupling regimes [0.0] キャビティマグノニクス系における非摂動的強結合現象について検討した。
非自明な周波数シフトが超強結合系および深部強結合系に現れることを示す。
この研究は、従来の強い結合状態を超えたキャビティマグノニクスの道を開いた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 01:35:55 GMT)
Characterizing the Generalized Einstein-Podolsky-Rosen State and Extensions [0.0] アインシュタイン・ポドルスキーとローゼンは2つの粒子に対して運動量絡み状態を導入した。
一般化されたEPR状態はここで理論的に解析され、その絡み合いは定量化される。
非ガウス的絡み合いを示す別の状態が検討され、その絡み合いが定量化されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:38:25 GMT)
Capability of using the normalizing flows for extraction rare gamma events in the TAIGA experiment [0.0] その結果,提案手法はガンマ検出の可能性を秘めていることがわかった。
得られた定量的性能指標は他の手法よりも劣っているため,提案手法の実装を改善する方法が提案されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:33:36 GMT)
CC-GRMAS: A Multi-Agent Graph Neural System for Spatiotemporal Landslide Risk Assessment in High Mountain Asia [0.0] 地すべり(英: Landslides)は、特に高山アジアにおいて、厳しい環境と人為的な影響を伴う、気候変動によって引き起こされる危険性の増大である。
この研究は、一連の衛星観測と環境信号を利用して地すべり予測の精度を高めるフレームワークであるCC-GRMASを導入している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:30:48 GMT)
Butter-Bench: Evaluating LLM Controlled Robots for Practical Intelligence [0.0] 本稿では,大規模言語モデル(LLM)制御ロボットの実用的な知能評価のためのベンチマークであるButter-Benchを提案する。
最高のLDMはバターベンチで40%、平均的な人間のスコアは95%である。
また,具体的推論のために微調整されたLSMを評価し,このトレーニングはバター・ベンチのスコアを改善できないと結論付けた。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 07:28:28 GMT)
Black Box Absorption: LLMs Undermining Innovative Ideas [0.0] 本稿では,大規模言語モデルに固有のシステム的リスクを特定し,形式化する。
我々は、LLMプラットフォームの不透明な内部アーキテクチャが、インタラクション中にユーザが貢献する新しい概念を一般化し、一般化し、再利用するプロセスとして定義する。
本稿では,吸収のメカニズムを分析し,これらのリスクを軽減するための具体的なガバナンスとエンジニアリングアジェンダを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:43:09 GMT)
Beyond Text: Multimodal Jailbreaking of Vision-Language and Audio Models through Perceptually Simple Transformations [0.0] MLLM(Multimodal large language model)は目覚ましい進歩を遂げているが、敵の攻撃に対して致命的な脆弱さを保っている。
本稿では,視覚言語モデルと音声言語モデルの両方を対象として,マルチモーダルジェイルブレイクの体系的研究を行う。
評価は3つのハイリスク安全性カテゴリで1,900件の対人プロンプトにまたがる。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 05:16:33 GMT)
Beyond Static Knowledge Messengers: Towards Adaptive, Fair, and Scalable Federated Learning for Medical AI [0.0] 適応フェアフェデレートラーニング(AFFL)を3つの革新を通じて提案する。
その結果,55~75%の通信削減,56~68%の公正性向上,34~46%の省エネルギー,100以上の機関支援が得られた。
経済予測では、農村病院では400-800%のROI、学術センターでは15-25%のパフォーマンス向上を示している。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:34:04 GMT)
Bayesian Optimization of Process Parameters of a Sensor-Based Sorting System using Gaussian Processes as Surrogate Models [0.0] センサベースのソートシステムは、物質の流れを2つの分画に分離することができる。
様々なプロセスパラメータは、材料の流れの性質、システムの寸法、必要なソート精度に応じて設定されなければならない。
本稿では,センサベースソートシステムのプロセスパラメータを最適化し,繰り返し監視し,調整する手法を提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 08:16:16 GMT)
Bayesian Inference of Primordial Magnetic Field Parameters from CMB with Spherical Graph Neural Networks [0.0] 本稿では,宇宙マイクロ波背景シミュレーション(CMB)マップから直接,原始磁場(PMF)における重要な宇宙パラメータを推定するための新しいベイズグラフ深層学習フレームワークを実装した。
本手法では,HEALPixピクセル化によるCMBデータの球面形状の尊重に特化して設計された,球面畳み込みニューラルネットワークアーキテクチャであるDeepSphereを利用する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 17:56:04 GMT)
Adversarially-Aware Architecture Design for Robust Medical AI Systems [0.0] 敵対的攻撃は、医療で使用されるAIシステムに深刻なリスクをもたらす。
本研究は,皮膚科学データセットを用いた経験的実験を通じて,これらの脆弱性を探索するものである。
私たちは、医療においてよりレジリエントで公平なAIを構築するための、技術的、倫理的、ポリシーに基づく統合的なアプローチを呼びかけて締めくくります。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:51:11 GMT)
Adaptive Learning in Spatial Agent-Based Models for Climate Risk Assessment: A Geospatial Framework with Evolutionary Economic Agents [0.0] 本稿では,気候リスクデータと進化学習を統合した新しいモデルを提案する。
RCP8.5 から2100 年までの河川洪水投射の枠組みを実証する。
以上の結果から,洪水に直接曝露していないエージェントでさえ,サプライチェーンの崩壊によって影響を受けやすいシステムリスクが明らかとなった。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 03:24:54 GMT)
Absence of gravitationally induced entanglement in certain semi-classical theories of gravity [0.0] シュル・オーディンガー方程式のある種のポテンシャルを通して、重力を古典的に扱う半古典モデルのクラスが検討される。
これらのモデルが絡み合っていないことが示されている。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 20:39:07 GMT)
ALICE-LRI: A General Method for Lossless Range Image Generation for Spinning LiDAR Sensors without Calibration Metadata [0.0] 3D LiDARセンサーは、リモートセンシングアプリケーションにおける自律ナビゲーション、環境モニタリング、高精度マッピングに不可欠である。
これらのセンサによって生成された巨大な点雲を効率的に処理するために、LiDARデータは角の位置と距離でポイントを整理する2Dレンジ画像に投影されることが多い。
製造者メタデータや校正ファイルを必要とせず、LiDAR点雲を回転させることにより、ロスレスレンジ画像生成を実現する、最初の一般センサ非依存方式であるALICE-LRIを提案する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 16:22:58 GMT)
AI-Driven Development of a Publishing Imprint: Xynapse Traces [0.0] Xynapse Tracesは、人間とアルゴリズムの融合によって作成された実験的な出版インプリントである。
このシステムは、従来のインプリント開発と比較して、市場投入時間の90%削減とコストの80%削減を実現した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 22:25:13 GMT)
AI Powered Urban Green Infrastructure Assessment Through Aerial Imagery of an Industrial Township [0.0] 本研究では,人工知能,特にコンピュータビジョン技術を用いたグリーンキャノピー被覆の推定を航空画像に適用するための効率的な手法を提案する。
提案手法は、ディープラーニングアルゴリズムに基づくオブジェクトベース画像解析を用いて、高解像度のドローン画像からグリーンキャノピーを正確に識別し、セグメント化する。
大規模なデータセットを処理する際の計算上の課題を克服するため、高性能プロセッサを使用したクラウドプラットフォーム上で実装された。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:36:20 GMT)
A hybrid solution approach for the Integrated Healthcare Timetabling Competition 2024 [0.0] 我々は,Team Twenteによる2024年度総合医療タイムタブルコンペティションに提出されたアルゴリズム,実施,結果について報告する。
提案手法は, 混合整数計画法, 制約計画法, およびサブプロブレムへの分解に基づく3相解法における擬似アニール法を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 10:14:04 GMT)
A Structured Review and Quantitative Profiling of Public Brain MRI Datasets for Foundation Model Development [0.0] 脳MRIの基礎モデルの開発は、利用可能なデータのスケール、多様性、一貫性に依存する。
我々は538,031以上のパブリックアクセス可能な54の脳MRIデータセットを分析し、基礎モデル開発に適した構造化されたマルチレベル概要を提供する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:31:09 GMT)
A New Digital Divide? Coder Worldviews, the Slop Economy, and Democracy in the Age of AI [0.0] シリコンバレーのソフトウェア開発者に関する最初の調査を紹介する。
その結果、ほとんどの開発者は自分たちの製品が市民の自由と政治的言論に影響を与えることを認識していることがわかった。
本研究は、インターネットアクセスではなく、情報品質の新たなデジタルディビジョンの文脈において、これらの知見を考察する。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 04:53:32 GMT)
A Gateway to Quantum Computing for Industrial Engineering [0.0] 量子演算研究の現在の分野のロードマップを提供する。
量子コンピューティングの基本原理を紹介し、現在のハードウェアとソフトウェアの展望を概説する。
我々は、量子コンピュータの長期的価値を駆動する問題領域の重要性など、研究の方向性を強調した。
論文参考訳(メタデータ) (Thu, 23 Oct 2025 14:54:11 GMT)