Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities [1367.9] Gemini 2.5 Proは私たちの最も有能なモデルであり、フロンティアコーディングと推論ベンチマークでSoTAのパフォーマンスを実現しています。
Gemini 2.5 Flashは計算とレイテンシの要求のごく一部で優れた推論機能を提供する。
Gemini 2.0 FlashとFlash-Liteは低レイテンシと低コストでハイパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:56:46 GMT)
EdiVal-Agent: An Object-Centric Framework for Automated, Fine-Grained Evaluation of Multi-Turn Editing [170.7] EdiVal-Agentは、命令ベースの画像編集のためのオブジェクト指向評価フレームワークである。
標準のシングルターンだけでなく、マルチターンの命令ベースの編集を精度良く評価するように設計されている。
EdiVal-Benchは、インコンテキスト、フローマッチング、拡散パラダイムにまたがる9つの命令タイプと13の最先端編集モデルをカバーするベンチマークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:09:09 GMT)
DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning [134.0] Doing Length pEnalty Right (DLER)は、バッチワイド報酬正規化、高いクリッピング、ダイナミックサンプリング、単純なトランケーション長ペナルティを組み合わせたトレーニングレシピである。
DLERは最先端の精度-効率のトレードオフを実現し、出力長を70%以上削減し、以前のベースライン精度をすべて上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:05:57 GMT)
DialectGen: Benchmarking and Improving Dialect Robustness in Multimodal Generation [111.9] 多モーダル生成モデルは方言テキスト入力を効果的に生成できるのか?
6つの共通英語方言にまたがる大規模ベンチマークを構築した。
マルチモーダル生成モデルのための一般的なエンコーダに基づく緩和戦略を設計する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:56:55 GMT)
Constantly Improving Image Models Need Constantly Improving Benchmarks [109.4] 本稿では,実際のモデル利用の証拠から直接ベンチマークを構築するためのフレームワークECHOを提案する。
GPT-4o Image Genにこのフレームワークを適用し,ソーシャルメディア投稿から収集した31,000以上のプロンプトのデータセットを構築した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:30 GMT)
OmniGaze: Reward-inspired Generalizable Gaze Estimation In The Wild [104.6] 現在の3次元視線推定法は、多様なデータ領域にまたがる一般化に苦慮している。
OmniGazeは3次元視線推定のための半教師付きフレームワークである。
OmniGazeは5つのデータセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:10:21 GMT)
Rethinking Toxicity Evaluation in Large Language Models: A Multi-Label Perspective [104.1] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な結果を得た。
有害なコンテンツを生み出す可能性には、深刻な安全上の懸念が浮かび上がっている。
毒性検出のための3つの新しいマルチラベルベンチマークを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:50:33 GMT)
Innovator: Scientific Continued Pretraining with Fine-grained MoE Upcycling [102.3] 科学的なタスクと一般的なタスクの両方に知識を持つ大きな言語モデル(LLM)は、科学的な汎用知性の基盤である。
Innovatorは、事前学習中に、事前学習した高密度LCMを微細なMixtures-of-Expertsモデルにアップサイクリングする。
53.3Bの合計パラメータと13.3Bの活性化により、InnovatorはQwen2.5-7Bを拡張し、64の専門的な科学専門家と8の活性化を行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:15:27 GMT)
SOHES: Self-supervised Open-world Hierarchical Entity Segmentation [101.6] この研究は、人間のアノテーションを必要としない新しいアプローチであるSOHES(Self-supervised Open World Hierarchical Entities)を提示する。
視覚的特徴クラスタリングにより高品質な擬似ラベルを生成し,教師同士の学習によって擬似ラベルの雑音を補正する。
学習データとして生画像を用いることにより,自己監督型オープンワールドセグメンテーションにおける前例のない性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:58:28 GMT)
Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos [101.3] 我々はMotoを紹介する。Motoは、映像コンテンツをラテントモーションTokenizerでラテントモーションTokenシーケンスに変換する。
我々は、モーショントークンによるMoto-GPTの事前学習を行い、多様な視覚的動きの知識を捉えることができる。
実際のロボット動作に先立って学習した動きを転送するために、潜伏した動きのトークン予測と実際のロボット制御をシームレスにブリッジするコファインチューニング戦略を実装した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:13:23 GMT)
MarkDiffusion: An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models [100.2] MarkDiffusionは、潜伏拡散モデルのジェネレーティブな透かしのためのオープンソースのPythonツールキットである。
合理化された透かしアルゴリズム統合のための統一的な実装フレームワーク、公共の理解を助けるために追加および抽出された透かしパターンを直感的に示すメカニズム可視化スイート、および、検出可能性、堅牢性、出力品質の3つの重要な側面にわたる24ツールの標準実装を提供する包括的な評価モジュール、および8つの自動評価パイプラインである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:42:56 GMT)
LiveResearchBench: A Live Benchmark for User-Centric Deep Research in the Wild [86.7] LiveResearchBenchは、日々の生活、企業、アカデミックにまたがる100の専門家によるタスクのベンチマークである。
DeepEvalは、コンテンツレベルの品質とレポートレベルの品質の両方をカバーする包括的なスイートである。
我々の分析は、信頼性と洞察に富んだ深い研究を進めるために必要な、現在の強み、繰り返し発生する障害モード、および重要なシステムコンポーネントを明らかにします。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:49:16 GMT)
Following the Autoregressive Nature of LLM Embeddings via Compression and Alignment [84.7] 本稿では,条件付き確率分布を埋め込んだコントラスト学習手法であるAutoRegEmbedを提案する。
本手法は従来のコントラスト学習手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:55:56 GMT)
MetaCaptioner: Towards Generalist Visual Captioning with Open-source Suites [84.4] 一般的なビジュアルキャプションは、一連のビジュアルキューをキャプションに統合し、様々なビジュアルドメインを扱う必要がある。
本稿では,新しいマルチエージェントコラボレーションワークフローであるCapFlowを提案する。
オープンソースモデルを利用することで、様々なドメインでGPT-4.1と同等のキャプション品質を89.5%のコストで達成することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:57:08 GMT)
COIG-Writer: A High-Quality Dataset for Chinese Creative Writing with Thought Processes [83.8] 大規模な言語モデルは、創造的な文章、特に非英語の文脈において体系的な欠陥を示す。
提案するCOIG-Writerは,多種多様なアウトプットと,その基盤となる思考プロセスの両方をキャプチャする,中国のクリエイティブな文章データセットである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:01:19 GMT)
WithAnyone: Towards Controllable and ID Consistent Image Generation [83.6] アイデンティティ・一貫性・ジェネレーションは、テキスト・ツー・イメージ研究において重要な焦点となっている。
マルチパーソンシナリオに適した大規模ペアデータセットを開発する。
本稿では,データと多様性のバランスをとるためにペアデータを活用する,対照的なアイデンティティ損失を持つ新たなトレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:54 GMT)
Purifying Task Vectors in Knowledge-Aware Subspace for Model Merging [83.5] モデルマージは、個別に調整されたモデルのタスク固有の能力を、余分なトレーニングなしで単一のモデルに統合することを目的としている。
統合モデルは、タスクベクトルのタスク非関連冗長性に起因する競合により、しばしば顕著なパフォーマンス劣化に悩まされる。
本稿では,これらの課題を克服するために,知識対応サブ空間におけるTAsk Vectors (PAVE) の純粋化を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:02:57 GMT)
WoW: Towards a World omniscient World model Through Embodied Interaction [83.4] 世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。
このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。
WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:48:00 GMT)
Learning an Image Editing Model without Image Editing Pairs [83.0] 最近の画像編集モデルは、自然言語編集の指示に従いながら印象的な成果を上げている。
それらは、インプットとターゲットのペアの大きなデータセットによる教師付き微調整に依存している。
現在の回避策は、既存のモデルのゼロショット機能を利用する合成トレーニングペアを使用する。
ペア化されたデータを完全に不要にする新たなトレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:57 GMT)
Bolt3D: Generating 3D Scenes in Seconds [82.7] 1つ以上の画像が与えられた場合、Bolt3Dは1つのGPU上で7秒以内で直接3Dシーン表現をサンプリングします。
3次元再構成のためのシーンごとの最適化を必要とする従来のマルチビュー生成モデルと比較して、Bolt3Dは推論コストを最大300倍に削減する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:36:29 GMT)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.4] 大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:00:47 GMT)
ATGen: Adversarial Reinforcement Learning for Test Case Generation [78.5] 大きな言語モデル(LLM)はコード生成に優れていますが、その出力には微妙なバグが伴います。
既存のテスト生成方法は静的データセットに依存している。
我々は,対戦型強化学習を通じてテストケースジェネレータを訓練するフレームワークであるATGenを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:49:25 GMT)
From Pixels to Words -- Towards Native Vision-Language Primitives at Scale [77.9] 私たちは、第一原理から構築されたVLM(Vision-Language Models)の新たなファミリーであるNEOを立ち上げました。
NEOは、密集したモノリシックモデル内で視覚言語間の衝突を緩和しながら、スクラッチから視覚知覚を効率的に発展させる。
私たちのコードとモデルは、https://github.com/EvolvingLMMs-Lab/NEO.comで公開されています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:58 GMT)
Bridging the Gap Between Promise and Performance for Microscaling FP4 Quantization [77.7] 本研究は,MXFP4とNVFP4の学習後量子化に関する総合的研究である。
本稿では,従来のGPTQ量子化アルゴリズムの変種であるMicro-Rotated-GPTQ(MR-GPTQ)を紹介する。
MR-GPTQは最先端の精度で一致または性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:26:09 GMT)
Are Large Reasoning Models Interruptible? [77.5] LRM(Large Reasoning Models)は複雑な推論において優れているが、伝統的に静的な「凍った世界」設定で評価されている。
静的な設定で高い精度を達成できる最先端のLEMでさえ、割り込みやコンテキストの変化に晒された場合、予測不能に失敗する可能性があることを示す。
我々の分析ではさらに、漏れの原因、パニック、自己疑念など、いくつかの新しい障害モードを明らかにしている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:24 GMT)
On Large Multimodal Models as Open-World Image Classifiers [77.5] 大規模マルチモーダルモデル(LMM)は、自然言語を使って画像を分類することができる。
原型,非原型,きめ細かな粒度,そして非常にきめ細かいクラスを含む10のベンチマークで13のモデルを評価した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:21:51 GMT)
C4D: 4D Made from 3D through Dual Correspondences [77.0] 時間的対応を利用して既存の3次元再構成を4Dに拡張するフレームワークであるC4Dを紹介する。
C4Dは、短期光学フローと長期点追跡の2種類の対応をキャプチャする。
我々は、追加の移動情報を提供する動的認識ポイントトラッカーを訓練する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:06 GMT)
WeightLoRA: Keep Only Necessary Adapters [76.3] 低ランク適応(texttLoRA$)は、指定されたレイヤにトレーニング可能なアダプタを追加する。
我々は、最も重要な$textttLoRA$ヘッダの適応的な選択によってこの問題を克服する新しい方法である$textttWeightLoRA$を提案する。
我々は、一連の競合ベンチマークとDeBERTa、BART、Llamaモデルの実験を行い、我々の手法を異なる適応的アプローチと比較した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:57:58 GMT)
MIO: A Foundation Model on Multimodal Tokens [75.5] マルチモーダルトークン上に構築された新しい基礎モデルMIOを紹介する。
MIOは、エンドツーエンドの自己回帰的な方法で、音声、テキスト、画像、ビデオを理解し、生成することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:18:03 GMT)
Seesaw: Accelerating Training by Balancing Learning Rate and Batch Size Scheduling [75.4] トレーニング中のバッチサイズの増加は、大規模な言語モデルの事前トレーニングを加速するための有望な戦略である。
この研究はバッチサイズスケジューリングのための原則化されたフレームワークを開発する。
標準スケジューラが学習率を半減するたびに、Seesawは1/sqrt2$と倍増し、バッチサイズを倍増します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:17:38 GMT)
FASTopoWM: Fast-Slow Lane Segment Topology Reasoning with Latent World Models [75.3] レーンセグメント推論は、総合的な鳥眼ビュー(BEV)ロードシーン理解を提供する。
ストリームベースの時間的伝搬法は,クエリレベルとBEVレベルの両方に時間的手がかりを組み込むことで,有望な結果を示した。
FASTopoWMは、潜在世界モデルで拡張された新しい高速スローレーンセグメント推論フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:47:57 GMT)
Terra: Explorable Native 3D World Model with Point Latents [74.9] 本稿では,本質的な3次元潜伏空間における探索可能な環境を表現・生成する,ネイティブな3次元世界モデルTerraを提案する。
具体的には、3次元入力を潜在点表現に符号化する新しい点対ガウス変分オートエンコーダ(P2G-VAE)を提案する。
次に、潜伏点表現を生成するためのスパース点フローマッチングネットワーク(SPFlow)を導入し、同時に潜伏点の位置と特徴を識別する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:56 GMT)
ChronoEdit: Towards Temporal Reasoning for Image Editing and World Simulation [74.3] ビデオ生成問題として画像編集を再構成するフレームワークであるChronoEditを紹介する。
まずChronoEditは、入力された画像と編集された画像を、ビデオの最初のフレームと最後のフレームとして扱う。
第2に、ChronoEditでは、推論時に明示的に編集を行う時間的推論ステージを導入している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:38 GMT)
Midtraining Bridges Pretraining and Posttraining Distributions [73.8] ミストレイン(Midtraining)とは、事前トレーニングの終了時に、高い品質の命令形式データを混合するフェーズである。
我々は,スクラッチから事前学習した言語モデルを用いた実験を通じて,中等教育に関する最初の体系的な研究を行う。
教師付き微調整の結果と比較すると,数学やコード領域において中等教育の有効性が最も高いことがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:39:52 GMT)
Multi-identity Human Image Animation with Structural Video Diffusion [73.4] emph Structure Video Diffusionは、現実的なマルチヒューマンビデオを生成するための新しいフレームワークである。
当社のアプローチでは、個人間で一貫した外観を維持するために、アイデンティティ固有の埋め込みを導入している。
さまざまなマルチヒューマンとオブジェクトのインタラクションシナリオを特徴とする25Kの新しいビデオで、既存のヒューマンビデオデータセットを拡張します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:11:40 GMT)
Scaling Test-Time Compute to Achieve IOI Gold Medal with Open-Weight Models [72.5] GenClusterはテスト時の計算フレームワークで、オープンウェイトモデルを使用してIOIゴールドレベルのパフォーマンスを実現する。
GenClusterは、オープンウェイトモデルで、初めてIOI 2025で金メダルを獲得できることを示します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:19:25 GMT)
Hi-Agent: Hierarchical Vision-Language Agents for Mobile Device Control [72.4] モバイル制御のためのトレーニング可能な階層型視覚言語エージェントであるHi-Agentを紹介する。
Hi-Agentは高レベルの推論モデルと、共同最適化された低レベルのアクションモデルを備えている。
Hi-Agentは、Android-in-the-Wild(AitW)ベンチマークで、新しいState-Of-The-Art(SOTA)87.9%タスクの成功率を達成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:38:21 GMT)
TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving [70.9] TopoStreamerは、レーンセグメントトポロジー推論のためのエンドツーエンドの時間知覚モデルである。
TopoStreamerは、ストリーミング属性制約、動的レーン境界位置エンコーディング、およびレーンセグメントのデノイングという3つの重要な改善点を紹介している。
Open-Lane-V2データセットでは、TopoStreamerが最先端のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:36:09 GMT)
Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents [70.8] 深層研究ウェブエージェントは、洞察に富んだ研究のための知識を厳格に分析し集約する必要がある。
本研究では,Webエージェントの検証可能なトレーニングデータを構築するためのExplore to Evolveパラダイムを提案する。
オープンソースのエージェントフレームワークであるSmolAgentsをベースとして,教師付き微調整トラジェクトリを収集し,一連の基礎モデルを構築する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:37:42 GMT)
The Coverage Principle: How Pre-training Enables Post-Training [70.3] 予備学習が最終モデルの成功をどう形作るかを検討する。
下流の性能予測におけるカバレッジのパワーを説明するメカニズムを明らかにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:53:50 GMT)
IAD-GPT: Advancing Visual Knowledge in Multimodal Large Language Model for Industrial Anomaly Detection [70.0] 本稿では,リッチテキストセマンティクスと画像レベルの情報と画素レベルの情報の組み合わせについて検討する。
産業異常検出のためのMLLMに基づく新しいパラダイムであるIAD-GPTを提案する。
MVTec-ADとVisAデータセットの実験は、私たちの最先端のパフォーマンスを示しています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:48:05 GMT)
Backdoor Unlearning by Linear Task Decomposition [69.9] ファンデーションモデルは、敵の摂動と標的のバックドア攻撃に非常に敏感である。
既存のバックドア除去アプローチは、有害な振る舞いをオーバーライドするために、コストのかかる微調整に依存している。
このことは、バックドアがモデルの一般的な能力を損なうことなく取り除けるかどうかという問題を提起する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:18:07 GMT)
TTT3R: 3D Reconstruction as Test-Time Training [69.5] テストタイムトレーニングの観点から3次元再構築基盤モデルを再考する。
メモリ状態と受信した観測値のアライメントの信頼性を利用して、クローズドフォーム学習率を導出する。
この訓練のない介入はTTT3Rと呼ばれ、長さの一般化を大幅に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:37:35 GMT)
Internet of Agents: Fundamentals, Applications, and Challenges [69.0] 異種エージェント間のシームレスな相互接続、動的発見、協調的なオーケストレーションを可能にする基盤となるフレームワークとして、エージェントのインターネット(IoA)を紹介した。
我々は,機能通知と発見,適応通信プロトコル,動的タスクマッチング,コンセンサスとコンフリクト解決機構,インセンティブモデルなど,IoAの重要な運用イネーラを分析した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:32:37 GMT)
Transcribe, Translate, or Transliterate: An Investigation of Intermediate Representations in Spoken Language Models [68.7] 音声を大言語モデル(LM)と統合する音声言語モデル(SLM)は、音声エンコーダの出力をデコーダ LM に理解可能な表現にマッピングするモダリティアダプタ(MA)に依存している。
ここでは、3つのSLM(SALMONN, Qwen2-Audio, Phi-4-Multimodal-Instruct)におけるMA出力表現について検討する。
MA表現に最も近いデコーダLMトークンを見つけることで、MA表現の2つの戦略を明らかにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:31:59 GMT)
Thompson Sampling via Fine-Tuning of LLMs [68.2] 我々は,スケーラブルな大規模獲得関数を必要としないトンプソンサンプリングに基づく代替案を提案する。
我々のアプローチであるThompson Smpling via Finening (ToSFiT) は、プロンプト条件付き言語モデルに埋め込まれた事前知識を活用し、後方に向けて漸進的に適応する。
分析の結果,ToSFiTアルゴリズムの基盤となる極大性原理の後続確率への注意的適応が重要であることが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:38:06 GMT)
Training LLM Agents to Empower Humans [67.8] 本稿では,人間のエンパワーメントの最大化に基づく支援言語モデルのチューニング手法を提案する。
我々のエンパワーメント最大化手法であるEmpowerは、オフラインのテキストデータのみを必要とする。
我々は,Empowerで訓練されたエージェントが,プログラミング問題に挑戦する人間プログラマの成功率を平均192%向上させることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:39:31 GMT)
Beyond Linear Probes: Dynamic Safety Monitoring for Language Models [67.2] 従来の安全モニタは、クエリ毎に同じ量の計算を必要とする。
動的アクティベーションモニタリングのための線形プローブの自然な拡張であるTrncated Polynomials (TPCs)を紹介する。
我々の重要な洞察は、TPCを段階的に、短期的に訓練し、評価できるということです。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:51:42 GMT)
CoreGuard: Safeguarding Foundational Capabilities of LLMs Against Model Stealing in Edge Deployment [66.7] CoreGuardは、エッジデバイスにデプロイされるプロプライエタリな大規模言語モデル(LLM)の計算と通信効率の保護方法である。
CoreGuardは効率的な保護プロトコルを使用して、計算オーバーヘッドを削減し、伝搬プロトコルによる通信オーバーヘッドを最小限にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:01:28 GMT)
Emergent Visual Grounding in Large Multimodal Models Without Grounding Supervision [66.4] 現在の大規模マルチモーダルモデル(LMM)は、言語コンポーネントと視覚的エンティティを関連付ける必要があるため、基盤化の課題に直面している。
グラウンド化能力は、明示的なグラウンド化の監督なしに訓練されたLMMに現われることが判明した。
拡散型ビジュアルエンコーダを用いたLMMであるDIFFLMMを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:50:21 GMT)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [66.4] MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。
情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。
この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:01:13 GMT)
Internalizing World Models via Self-Play Finetuning for Agentic RL [66.0] エージェントとしての大規模言語モデル(LLM)は、しばしばアウト・オブ・ディストリビューション(OOD)のシナリオで苦労する。
状態表現と遷移モデリングという2つのコンポーネントに分解することで、この世界モデルをエンコードする方法を示す。
SPAは,世界モデルを学習するために,セルフプレイ指導による微調整段階を通じてポリシーを冷やし始める,シンプルな強化学習フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:03:39 GMT)
LightQANet: Quantized and Adaptive Feature Learning for Low-Light Image Enhancement [65.1] 低照度画像強調は、高品質な色とテクスチャを維持しながら照明を改善することを目的としている。
既存の手法では、低照度条件下での画素レベルの情報劣化により、信頼性の高い特徴表現の抽出に失敗することが多い。
低照度向上のための量子化・適応型特徴学習を実現する新しいフレームワークLightQANetを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:54:42 GMT)
RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion [64.5] 本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:13 GMT)
Evaluating & Reducing Deceptive Dialogue From Language Models with Multi-turn RL [64.3] 大規模言語モデル(LLM)は、顧客サポート、教育、医療など、世界中の何百万もの人々と対話する。
故意であれ不注意であれ、偽りのアウトプットを生産する能力は、重大な安全上の懸念を生じさせる。
本研究では, LLM が会話中の偽装にどの程度関与しているかを考察し, 偽装を定量化する信念の誤調整尺度を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:29:36 GMT)
UrbanVerse: Scaling Urban Simulation by Watching City-Tour Videos [64.2] クラウドソーシングされた都市間ビデオから物理を意識したインタラクティブなシミュレーションシーンに変換する,データ駆動型リアルタイムシミュレーションシステムであるUrbanVerseを紹介した。
アイザックシムで運営されているUrbanVerseは、24か国から160の高品質なシーンを提供している。
実験により、UrbanVerseのシーンは現実世界のセマンティクスとレイアウトを保存し、手作業によるシーンに匹敵する人間評価されたリアリズムを達成することが示されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:42:34 GMT)
NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.1] NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:08:45 GMT)
CoT-Evo: Evolutionary Distillation of Chain-of-Thought for Scientific Reasoning [63.4] 先進的な大規模言語モデル(LLM)からのCoT蒸留は、一般的な推論タスクにおいて有効であることが証明されている。
しかし、先進的なモデルでさえ、誤った、あるいは表面的な推論をしばしば生み出す科学領域では苦戦している。
この問題を解決するために, 進化的CoT蒸留フレームワークであるCoT-Evoを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:13:16 GMT)
Ctrl-VI: Controllable Video Synthesis via Variational Inference [62.8] Ctrl-VIは、特定の要素に対して高い制御性を持つサンプルを生成するビデオ合成法である。
本手法は, 従来よりも制御性, 多様性, 3次元の整合性を向上したサンプルを生成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:48:29 GMT)
TED++: Submanifold-Aware Backdoor Detection via Layerwise Tubular-Neighbourhood Screening [62.8] TED++は、微妙なバックドアを効果的に検出するサブマニフォールド対応フレームワークである。
進化するクラスのサブ多様体上で、許容可能な入力がいかに忠実に残っているかをキャプチャする。
ほぼ完全な検出を実現し、AUROCの14%のゲインを次のベストメソッドで達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:51:25 GMT)
Scaling Tumor Segmentation: Best Lessons from Real and Synthetic Data [62.6] AbdomenAtlas 2.0は10,135個のCTスキャンのデータセットで、6つの臓器に手動で注釈付けされた1ボクセルあたり15,130個の腫瘍例が記録されている。
公開データセットよりも顕著な改善が達成され、DSCテストは+7%、配布外テストは+16%向上した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:08:09 GMT)
Your AI, Not Your View: The Bias of LLMs in Investment Analysis [62.4] 金融において、Large Language Models (LLMs) は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違から生じる、頻繁な知識紛争に直面している。
これらの対立は、モデル固有のバイアスが制度的目的と誤認される現実世界の投資サービスにおいて特に問題となる。
本研究では,このような紛争シナリオにおける創発的行動を調べるための実験的枠組みを提案し,投資分析におけるバイアスの定量的分析を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:06:41 GMT)
MAGPIE: A benchmark for Multi-AGent contextual PrIvacy Evaluation [61.9] 既存のプライバシベンチマークは、タスクの結果に影響を与えることなく、プライベート情報を簡単に省略できる、単純化されたシングルターンインタラクションにのみフォーカスする。
我々は,多エージェント協調型非競合シナリオにおけるプライバシ理解と保存性を評価するための新しいベンチマークであるMAGPIEを紹介する。
評価の結果,GPT-5やGemini 2.5-Proを含む最先端のエージェントは,重大なプライバシー侵害を示すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:12:12 GMT)
On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification [61.6] LLM(Large Language Model)のためのSFT(Supervised Fine-Tuning)の改良法を提案する。
標準SFT勾配は、モデルの一般化能力を著しく制限する問題のある報酬構造を暗黙的に符号化する。
本稿では,このトークンの確率で目的関数を動的に再スケーリングすることにより,各トークンの勾配を安定化する動的微調整(DFT)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:40:55 GMT)
MorphoBench: A Benchmark with Difficulty Adaptive to Model Reasoning [61.0] 大規模モデルの推論能力を評価するために,複数分野の質問を取り入れたベンチマークであるMorphoBenchを提案する。
MorphoBenchは、モデルの推論プロセスで生成されたキーステートメントを活用することで、質問の分析的課題を適応的に修正する。
我々は1300以上のテスト質問を集め、o3やGPT-5といったモデルの推論能力に基づいてMorphoBenchの難易度を反復的に調整した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:30:56 GMT)
Adaptive Set-Mass Calibration with Conformal Prediction [60.5] 提案手法は,まず共形予測から始まり,所望のカバレッジを与えるラベルの集合を得る。
次に、共形制約に合わせて、質量正規化と温度スケーリングに基づくルールの2つの簡単なポストホックキャリブレータをインスタンス化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:39:56 GMT)
VTimeCoT: Thinking by Drawing for Video Temporal Grounding and Reasoning [60.4] ビデオの時間的グラウンドと推論のためのトレーニング不要のフレームワークであるVTimeCoTを紹介する。
提案フレームワークは,プログレッシブバーの新しいビジュアルツールとして,プラグアンドプレイプログレッシブバー統合ツールと高効率ハイライトツールの2つを組み込んでいる。
提案手法は,ビデオ時間的グラウンドリングと推論に基づく質問応答のタスクにおいて,Qwen2VL-7BとGPT4oベースラインの両方で大幅な性能向上を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:29:02 GMT)
Scaling Artificial Intelligence for Multi-Tumor Early Detection with More Reports, Fewer Masks [59.4] 医療報告における記述に一致する腫瘍をセグメント化するためにAIを訓練するR-Superを紹介する。
101,654のレポートでトレーニングされたAIモデルは、723のマスクでトレーニングされたモデルに匹敵するパフォーマンスを達成した。
R-Superは脾・胆嚢・前立腺・膀胱・子宮・食道の腫瘍の分画を可能にした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:35:44 GMT)
Online Reliable Anomaly Detection via Neuromorphic Sensing and Communications [58.8] 本稿ではニューロモルフィック無線センサネットワークに基づく低消費電力オンライン異常検出フレームワークを提案する。
検討したシステムでは、中央受信ノードが各時間フレームでニューロモルフィックセンサノード(ニューロSN)のサブセットを積極的にクエリする。
ニューロモルフィックセンサーは事象駆動であり、モニターされたシステムの関連する変化に対応してスパイクを発生させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:56:54 GMT)
MathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal Mathematical Reasoning [58.8] 本稿では,数学の本質的なVCoT機能を備えた大規模マルチモーダルモデルを実現するための包括的フレームワークを提案する。
我々のモデルであるBAGEL-canvasは、強力なLMMベースラインよりも86%の相対的な改善を実現しています。
我々の研究は、LMMにおける複雑なヒューマンライクな視覚支援推論をアンロックするためのツールキット・フレームワーク、データセット、ベンチマークを完全提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:58:58 GMT)
Instructions are all you need: Self-supervised Reinforcement Learning for Instruction Following [58.6] 言語モデルは、現実世界のアプリケーションにとって重要なマルチ制約命令に従うのに苦労することが多い。
本稿では,外部監督に依存しないラベルフリーの自己監督型強化学習フレームワークを提案する。
本稿では,厳密な報酬問題に対処するために,制約分解戦略と効率的な制約ワイドバイナリ分類を導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:24:44 GMT)
Rewriting History: A Recipe for Interventional Analyses to Study Data Effects on Model Behavior [58.6] 本稿では,学習データと言語モデル(LM)行動の関係を実験的に研究する。
データバッチをインターベンションし、そのデータ上でモデルチェックポイントを再トレーニングして、データと振る舞いに関する仮説をテストするための手順を概説する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:22:48 GMT)
Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.5] 大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:35:37 GMT)
Physical Layer Deception based on Semantic Distortion [58.4] 物理層 deception (PLD) は、物理層セキュリティ(PLS)と偽造技術を統合するフレームワークである。
我々は,この枠組みを意味的コミュニケーションモデルに拡張し,性能指標として意味的歪みを用いた理論的解析を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:23:35 GMT)
Continual Learning via Sparse Memory Finetuning [58.2] 本稿では,スパースパラメータの更新が大惨事な忘れをせずに学習を可能にするかどうかを考察する。
事前学習データの使用に関する新しい知識によって活性化されるメモリスロットのみを更新することにより、新しい知識とモデルの既存の能力との干渉を減らすことができる。
スパースメモリの微調整は、忘れることを大幅に減らしながら、新しい知識を学習することを発見した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:44:38 GMT)
Nonparametric Data Attribution for Diffusion Models [57.8] 生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:37:16 GMT)
Absolute Zero: Reinforced Self-play Reasoning with Zero Data [57.3] 検証可能な報奨付き強化学習(RLVR)は,大規模言語モデルの推論能力を高めることを約束している。
本稿では,AZR(Absolute Zero Reasoner)について紹介する。
AZRは、コーディングおよび数学的推論タスクにおける全体的なSOTA性能を達成し、既存のゼロセットモデルより優れている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:23:36 GMT)
xLLM Technical Report [57.1] 我々は,知的かつ効率的なLarge Language Model (LLM)推論フレームワークであるxLLMを紹介する。
xLLMは、新しい分離されたサービスエンジンアーキテクチャを構築する。
xLLM-Engineは、システムとアルゴリズムの設計を最適化し、コンピュータリソースを完全に飽和させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:53:47 GMT)
HuGDiffusion: Generalizable Single-Image Human Rendering via 3D Gaussian Diffusion [57.1] HuGDiffusionは、シングルビュー入力画像から人間の文字の新しいビュー合成(NVS)を実現するための学習パイプラインである。
本研究では,1つの画像から抽出したヒトの事前情報に基づいて,拡散に基づくフレームワークを用いて3DGS属性の集合を生成することを目的とする。
我々のHuGDiffusionは最先端の手法よりも優れた性能を示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:35:50 GMT)
Train a Unified Multimodal Data Quality Classifier with Synthetic Data [56.9] マルチモーダル大言語モデル(MLLM)は、画像テキストキャプションデータとインターリーブド文書データの混合に基づいて、継続的に事前訓練される。
我々は,高品質な画像文キャプションとインターリーブデータの両方をフィルタリングするために,一元的マルチモーダルデータ品質として効率的なMLLMを訓練することを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:53:28 GMT)
Predicting Task Performance with Context-aware Scaling Laws [56.7] 本稿では、トレーニング計算と提供されたコンテキストの関数として、下流のパフォーマンスを協調的にモデル化する、単純かつ解釈可能なフレームワークを提案する。
我々は,Llama-2-7BおよびLlama-2-13Bの拡張コンテキスト変種について,観測された下流性能に適合させることで,我々の枠組みを実証的に検証した。
以上の結果から,我々のフレームワークは,配信中のダウンストリーム性能を正確にモデル化し,トレーニング計算において3桁の規模で一般化し,コンテキストの増大とともに性能を確実に外挿することを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:35:18 GMT)
Supervised Fine-Tuning or Contrastive Learning? Towards Better Multimodal LLM Reranking [56.5] 大型言語モデル(LLM)では、教師付き微調整(SFT)による分類は、関連する(非関連)ペアに対して'yes' (resp. ''no')トークンを予測する。
この分散は中心的な疑問を提起する:どの目的がLLMベースのリランクに本質的に適しているか、どのメカニズムが違いの根底にあるのか?
我々はCLとSFTの総合的な比較と分析を行い、ユニバーサルマルチモーダル検索(UMR)を実験場とした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:02:27 GMT)
Expertise need not monopolize: Action-Specialized Mixture of Experts for Vision-Language-Action Learning [56.1] AdaMoEはMixture-of-Experts (MoE)アーキテクチャであり、密度の高いVLAモデルから事前訓練された重量を継承する。
実世界の実験で21.5%の大幅な改善が、ロボット操作タスクの実用的効果を実証している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:52:57 GMT)
CymbaDiff: Structured Spatial Diffusion for Sketch-based 3D Semantic Urban Scene Generation [55.7] フリーハンドスケッチと衛星画像から3D屋外セマンティックシーンを生成するための,最初の大規模ベンチマークであるSketchSem3Dを紹介する。
また,シーン生成における空間コヒーレンスを大幅に向上させるCyinder Mamba Diffusion (CymbaDiff)を提案する。
CymbaDiffは、優れたセマンティック一貫性、空間リアリズム、およびデータセット間の一般化を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:29:06 GMT)
LLMs as Scalable, General-Purpose Simulators For Evolving Digital Agent Training [55.7] 構造化されたUI状態と遷移を生成するスケーラブルなパラダイムを導入し、大規模にトレーニングトラジェクトリを合成する。
このパラダイムは、多様なUI状態のためのデジタルワールドシミュレータ、コヒーレント探索のためのガイド付きロールアウトプロセス、軌道ラッパーを統合している。
WebArenaとAndroidWorldの実験では、UI-Simulatorは実際のUIでトレーニングされたオープンソースエージェントと競合するか、あるいは超越している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:38 GMT)
Rediscovering Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning [55.6] 本稿では,3つのコンポーネントによる探索と利用のバランスをとるフレームワークを提案する。
複数の数学的推論ベンチマークの実験は、AERが一貫してベースラインを上回り、推論精度と探索能力の両方を改善していることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:13:32 GMT)
Knowledge-based Visual Question Answer with Multimodal Processing, Retrieval and Filtering [55.5] 知識に基づく視覚的質問応答(KB-VQA)は、視覚的理解と外部知識検索を統合するために視覚言語モデル(VLM)を必要とする。
本稿では,処理,検索,フィルタリングといった3段階の手法をWiki-PRFと呼ぶ。
ベンチマークデータセット(E-VQAとInfoSeek)の実験では、回答の品質が大幅に向上し、最先端のパフォーマンスが達成された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:10:00 GMT)
From Language to Locomotion: Retargeting-free Humanoid Control via Motion Latent Guidance [55.3] 既存の言語誘導型ヒューマノイドパイプラインは複雑で信頼性が低い。
本稿では,言語を基盤とした動作潜伏者に対してヒューマノイドポリシーを規定する言語フリーフレームワークであるRoboGhostを紹介する。
我々は,RoboGhostがデプロイメントの遅延を大幅に低減し,成功率と追跡精度を向上し,スムーズでセマンティックに整合したヒューマノイドを生成することを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:57:47 GMT)
DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation in Text-to-Image Models [55.3] テキスト・ツー・イメージ(T2I)モデルはセマンティック・リークに対して脆弱である。
DeLeakerは、モデルのアテンションマップに直接介入することで、漏洩を緩和する軽量なアプローチである。
SLIMはセマンティックリークに特化した最初のデータセットである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:39:21 GMT)
3D Scene Prompting for Scene-Consistent Camera-Controllable Video Generation [55.3] 3DScenePromptは任意の長さの入力から次のチャンクを生成するフレームワークである。
カメラの制御とシーンの一貫性の維持を可能にする。
我々のフレームワークは、シーンの一貫性、カメラ制御性、生成品質において、既存の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:55:25 GMT)
Just-In-Time Objectives: A General Approach for Specialized AI Interactions [55.2] 大規模な言語モデルは、幅広い関数セットを約束するが、特定の目的を与えられていない場合は、clichで照らされた電子メールのドラフト作成などのミルクトーストの結果をデフォルトとする。
我々は,ユーザの移動目標を推定し,その特定の目的を迅速に最適化し,LLMがより応答性が高く望まれるツール,インターフェース,応答を生成できることを実証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:53:17 GMT)
TAS: A Transit-Aware Strategy for Embodied Navigation with Non-Stationary Targets [55.1] 非定常目標を持つ動的シナリオにおけるナビゲーションのための新しいアルゴリズムを提案する。
我々の新しいTAS(Transit-Aware Strategy)は、具体化されたナビゲーションポリシーをオブジェクトパス情報で強化する。
TASは、ターゲットルートとルートを同期させるエージェントを報酬することで、非定常環境での性能を改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:41:47 GMT)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [54.9] この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:15:02 GMT)
DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights [54.9] 計算オーバーヘッドを最小限に抑えながら,マルチスケールの長距離依存関係を捕捉する効率的な3次元分割モデルを提案する。
空間充填曲線を利用して3D-to-1D特徴写像の空間的局所性を保ち、計算コストのかかる多軸特徴走査への依存を減らす。
提案モデルでは,高いセグメンテーション精度を維持しながら効率を15倍に向上させ,既存手法に対する堅牢性と計算上の優位性を強調した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:31:21 GMT)
LaSeR: Reinforcement Learning with Last-Token Self-Rewarding [54.7] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLM)の推論能力を高めるためのコアパラダイムとして登場した。
従来、LLMは2つの異なるプロンプトテンプレートを使用してソリューションと自己検証をシーケンシャルに生成し、効率を大幅に低下させる必要があった。
本稿では,従来のRLVR損失をMSE損失で増大させるアルゴリズムであるLaSeR(Reinforcement Learning with Last-Token Self-Rewarding)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:55:11 GMT)
ForensicHub: A Unified Benchmark & Codebase for All-Domain Fake Image Detection and Localization [54.6] ForensicHubは、オールドメインの偽画像検出とローカライゼーションのための最初の統一ベンチマークである。
科学的なパイプラインをデータセット、変換、モデル、評価者間で交換可能なコンポーネントに分解する。
FIDLモデルアーキテクチャ、データセットの特徴、評価標準に関する8つの重要な実行可能な洞察を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:04:09 GMT)
Loss-Complexity Landscape and Model Structure Functions [53.9] 我々はコルモゴロフ構造関数 $h_x(alpha)$ を双対化するためのフレームワークを開発する。
情報理論構造と統計力学の数学的類似性を確立する。
構造関数と自由エネルギーの間のルジャンドル・フェンシェル双対性を明確に証明する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:13:58 GMT)
MaskCaptioner : Learning to Jointly Segment and Caption Object Trajectories in Videos [53.8] MaskCapは、オブジェクトの軌跡を共同で検出、セグメント化、追跡、キャプションできるエンドツーエンドモデルである。
データセットとコードはhttps://www.gabriel.fiastre.fr/masker/で公開されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:20:22 GMT)
Towards Inclusive Communication: A Unified Framework for Generating Spoken Language from Sign, Lip, and Audio [52.9] 音声テキスト生成のための手話,唇の動き,音声の多様な組み合わせを扱える最初の統一フレームワークを提案する。
i)不均一な入力を効果的に処理できる統一されたモダリティ非依存アーキテクチャの設計、(ii)モダリティ間の過小評価された相乗効果の探索、特に手話理解における非手動的手がかりとしての唇運動の役割、(iii)個々のタスクに特化した最先端モデルと同等以上のパフォーマンスを達成すること、の3つの目的に焦点をあてる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:06:58 GMT)
Reasoning with Sampling: Your Base Model is Smarter Than You Think [52.6] 本稿では,基本モデル自身の可能性を利用した単純な反復サンプリングアルゴリズムを提案する。
我々のアルゴリズムは、ほぼ一致し、RLのアルゴリズムよりも優れているという推論において、大幅に向上することを示した。
我々の方法は、トレーニング、キュレートされたデータセット、検証器を必要としない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:18:11 GMT)
Rewiring Experts on the Fly:Continuous Rerouting for Better Online Adaptation in Mixture-of-Expert models [52.5] Mixture-of-Experts (MoE)モデルは、スパース専門家のアクティベーションを通じて効率的なスケーリングを実現するが、デプロイメントの分散シフトによる最適以下のルーティング決定に悩まされることが多い。
我々は、外部の監視やデータなしで、テキスト生成中にMoEルーティング決定を継続的に適用するテキストタデータフリーオンラインテストタイムフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:24:36 GMT)
HALF: Harm-Aware LLM Fairness Evaluation Aligned with Deployment [52.4] HALF(Harm-Aware LLM Fairness)は、現実的なアプリケーションにおけるモデルバイアスを評価し、有害度によって結果を評価するフレームワークである。
HALFは、以前のベンチマークの成功とデプロイメントの準備の整合性の間に明らかなギャップがあることを示します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:43:05 GMT)
Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [52.0] ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:30:20 GMT)
In-Context Learning with Unpaired Clips for Instruction-based Video Editing [51.9] 我々は、命令ベースのビデオ編集のための低コストの事前学習戦略を導入する。
本フレームワークは,まず約100万本のビデオクリップを事前学習し,基本的な編集概念を学習する。
本手法は命令アライメントと視覚的忠実度の両方において既存の命令ベースビデオ編集手法を超越する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:02:11 GMT)
Automated Snippet-Alignment Data Augmentation for Code Translation [51.6] 並列コーパスはプログラムアライメント(PA)とスニペットアライメント(SA)データに分類される。
本稿では,LSMを利用してSAデータを自動的に生成するデータ拡張手法を提案する。
TransCoder-testの実験では、拡張SAデータと2段階のトレーニングアプローチを組み合わせることで、一貫した改善が得られます。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:30:24 GMT)
LinPrim: Linear Primitives for Differentiable Volumetric Rendering [51.6] 線形プリミティブに基づく2つの新しいシーン表現を導入する。
我々はGPU上で効率的に動作する異なるオクタライザを提案する。
我々は最先端の手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:58:17 GMT)
Directional Reasoning Injection for Fine-Tuning MLLMs [51.5] マルチモーダルな大言語モデル(MLLM)は急速に進歩しているが、その推論能力は強いテキストのみのモデルよりも遅れていることが多い。
このギャップを埋める既存の方法は、大規模マルチモーダル推論データや強化学習の監督された微調整に依存している。
この問題を解決するために,DRIFT(Directional Reasoning Injection for Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:06:46 GMT)
RoBCtrl: Attacking GNN-Based Social Bot Detectors via Reinforced Manipulation of Bots Control Interaction [51.5] 本稿では,ソーシャルボット制御攻撃(RoBCtrl)のための対向型マルチエージェント強化学習フレームワークを提案する。
具体的には、拡散モデルを用いて、既存のアカウントデータを小さな修正で再構築することで、高忠実度ボットアカウントを生成する。
次に,MARL(Multi-Agent Reinforcement Learning)法を用いて,ボットの逆動作をシミュレートする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:41:49 GMT)
LabOS: The AI-XR Co-Scientist That Sees and Works With Humans [51.0] LabOSは、計算推論と物理実験を結びつける最初のAI共同科学者である。
マルチモデルAIエージェント、スマートグラス、人間とAIのコラボレーションを接続することで、LabOSはAIが科学者が見ているものを確認し、実験コンテキストを理解し、リアルタイム実行を支援することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:36:22 GMT)
LLM Agents Beyond Utility: An Open-Ended Perspective [50.8] 我々は、事前訓練されたLLMエージェントを、自身のタスクを生成し、知識を蓄積し、その環境と広範囲に相互作用する能力で強化する。
複雑なマルチステップ命令を確実に追跡し、実行中に情報を保存、再利用し、独自のタスクを提案し、解決することができる。
迅速な設計や反復的なタスク生成に敏感であり、自己表現を形成することができない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:46:54 GMT)
GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.7] 2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。
提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。
GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:38:26 GMT)
Merge and Guide: Unifying Model Merging and Guided Decoding for Controllable Multi-Objective Generation [50.0] Merge-And-GuidEは、ガイド付きデコーディングにモデルマージを利用する2段階のフレームワークである。
ステージ1では、MAGEはガイダンスとベースモデルの互換性の問題を解決する。
ステージ2では、明示的で暗黙的な値モデルを統一的なガイダンスプロキシにマージします。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:11:22 GMT)
Earth-Agent: Unlocking the Full Landscape of Earth Observation with Agents [49.3] 地球観測は、地球系の状態を理解するために不可欠である。
近年のMLLMは高度なEO研究を行っているが、多段階推論を必要とする複雑なタスクに対処する能力は乏しい。
我々は,MPPベースのツールエコシステム内でRGBとスペクトルEOデータを統一する最初のエージェントフレームワークであるEarth-Agentを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:27:45 GMT)
DEXTER: Diffusion-Guided EXplanations with TExtual Reasoning for Vision Models [49.3] DEXTERは、視覚分類器のグローバルでテキストによる説明を生成する、データフリーのフレームワークである。
我々はDEXTERが正確な解釈可能な出力を生成することを示す。
ImageNet、Waterbirds、CelebA、FairFacesの実験では、DEXTERがグローバルモデル説明やクラスレベルのバイアスレポートにおいて、既存のアプローチよりも優れていることを確認した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:43:25 GMT)
Global-focal Adaptation with Information Separation for Noise-robust Transfer Fault Diagnosis [48.7] ノイズ条件下でのドメイン横断故障診断のための情報分離グローバル焦点対向ネットワーク(ISGFAN)を提案する。
ISGFANは、ドメイン不変のフォールト表現を分離するために、逆学習と改善された損失を統合する情報分離アーキテクチャ上に構築されている。
3つの公開データセットで行った実験は、提案手法が他の顕著な既存手法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:13:06 GMT)
SVAG-Bench: A Large-Scale Benchmark for Multi-Instance Spatio-temporal Video Action Grounding [48.6] 本研究では,ビデオ中のすべての参照オブジェクトを同時に検出,追跡,時間的ローカライズするモデルを必要とする新しいタスクである,SVAG(Spatio-temporal Video Action Grounding)を紹介する。
SVAG-Benchは688の動画、19,590の注釈付きレコード、903のユニークな動詞からなる大規模ベンチマークである。
実験の結果、既存のモデルではSVAG、特に密集したシーンや複雑なシーンでは性能が良くないことがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:16:51 GMT)
Rethinking Purity and Diversity in Multi-Behavior Sequential Recommendation from the Frequency Perspective [48.6] レコメンデーションシステムでは、ユーザーはブラウジング、クリック、購入などの複数の行動を示すことが多い。
いくつかの行動データは、ユーザー興味のモデリングにも避けられないノイズをもたらします。
これらの研究は、低周波情報は価値があり信頼性が高い傾向にあり、高周波情報はしばしばノイズと関連していることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:58:20 GMT)
Consistent text-to-image generation via scene de-contextualization [48.2] 一貫性テキスト・トゥ・イメージ(T2I)生成はIDシフトと呼ばれる現象のためにしばしば失敗する。
本稿では,主観的文脈とシーン的文脈の相関関係を,IDシフトの鍵となる要因として明らかにする。
本稿では,T2Iのシーンコンテキスト化をインバージョンするScene De-Conization(SDeC)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:54:49 GMT)
RealDPO: Real or Not Real, that is the Preference [47.8] 本稿では,実世界のデータを活用する新たなアライメントパラダイムであるRealDPOを,嗜好学習の正のサンプルとして紹介する。
実世界のビデオと間違ったモデル出力を対比することにより、RealDPOは反復的な自己補正を可能にし、徐々に動きの質を改善させる。
また,リッチかつ高精度な動き情報を用いて,人間の日常生活活動を捉えた高品質ビデオのキュレートデータセットであるRealAction-5Kを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:58:25 GMT)
Leveraging Learned Image Prior for 3D Gaussian Compression [47.3] 圧縮による品質劣化を回復するために,学習画像の強力な表現能力を活用する新しい3DGS圧縮フレームワークを提案する。
我々のフレームワークは既存のガウス圧縮手法と互換性があり、様々なベースラインに広く適用できるように設計されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:02 GMT)
Unifying Environment Perception and Route Choice Modeling for Trajectory Representation Learning [47.0] Tray Learning (TRL) は、低次元ベクトルに生の軌跡をエンコードすることを目的としており、旅行時間推定、位置予測、軌道類似性解析など様々な下流タスクに活用できる。
効率的なtextbfPRTrajectory表現学習のための時間的明示的textRoute選択モデルであるtextbfPRTrajを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:55:28 GMT)
pi-Flow: Policy-Based Few-Step Generation via Imitation Distillation [46.7] 数ステップの拡散またはフローベースの生成モデルは通常、速度予測教師を学生に蒸留する。
$pi$-Flowは、学生フローモデルの出力層を変更して、1ステップでネットワークフリーポリシーを予測する。
$pi$-Flowは、教師レベルの品質を維持しながら、最先端の数ステップメソッドよりもはるかに優れた多様性を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:51 GMT)
Can MLLMs Absorb Math Reasoning Abilities from LLMs as Free Lunch? [46.0] 数学推論は、大規模言語モデル(LLM)において重要な能力である。
本稿では,まずMLLMとMath LLMの両方の推論関連パラメータを識別し,それらをMLLMのサブ空間に投影するIP-Mergingを提案する。
IP-Mergingはパラメータを直接調整するため、チューニング不要のアプローチである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:38:16 GMT)
Hawking time crystals [45.9] そこで, 量子ブラックホールレーザーを用いた時間結晶を提案し, 自発ホーキング放射の自己増幅から対称性破壊の真に自発的な特性を導出する。
得られたホーキング時間結晶(HTC)は、時間外密度密度相関関数の周期的依存によって特徴づけられる。
注目すべきは、時間-結晶形成は、2つの時間演算子で理解される: 1つは初期ブラックホールレーザーに、もう1つは最終自発フロケ状態に関連づけられる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:13:57 GMT)
Spatial Computing Communications for Multi-User Virtual Reality in Distributed Mobile Edge Computing Network [45.6] 没入型バーチャルリアリティ(VR)アプリケーションは、レイテンシ、エネルギー効率、計算リソースに厳しい要件を課している。
本稿では,分散モバイルエッジコンピューティング(MEC)ネットワーク上でのマルチユーザVRのレイテンシとエネルギー要求を満たすために設計された,コンピューティング通信(SCC)の概念を紹介する。
提案するMO-CMPOは,教師付き学習・強化学習(RL)を優先重み付き微調整に統合した,ポリシー最適化による多目的整合モデルである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:55:01 GMT)
Agentic NL2SQL to Reduce Computational Costs [45.2] 我々は,LLMがNL2タスクをより効率的に解けるように設計されたエージェントシステムであるDatalake Agentを紹介する。
プロンプト内のすべてのメタ情報を一度呼び出すNL2の直接解法を利用する代わりに、Datalake Agentは、使用したメタ情報を減らすためにインタラクティブループを使用する。
我々は、テーブル質問応答タスク100の23のデータベースのコレクション上で、Datalake Agentを評価した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:42:28 GMT)
TRACE: Your Diffusion Model is Secretly an Instance Edge Detector [45.1] 本稿では,テキストと画像の拡散モデルが秘密裏にインスタンスエッジアノテータとして機能していることを示し,TRACEを提案する。
TRACEは、オブジェクト境界が最初に自己アテンションマップに現れるインスタンスエネルジェンスポイント(IEP)を特定し、アテンション境界分割(ABDiv)を通して境界を抽出し、それらを軽量のワンステップエッジデコーダに蒸留する。
COCOベンチマークでは、TRACEは教師なしのインスタンスセグメンテーションを+5.1 APで改善し、タグ付きパノスコープセグメンテーションでは、インスタンスレベルのラベルを使わずに、ポイント付きベースラインを+1.7 PQで上回る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:11:04 GMT)
Generative human motion mimicking through feature extraction in denoising diffusion settings [44.9] モーションキャプチャ(MoCap)データに基づく対話型モデルを構築する。
部分的に模倣して人工的な他物を生成し、また、入力された動きデータのシーケンスを「創造的に」拡張する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:41:54 GMT)
RepIt: Representing Isolated Targets to Steer Language Models [44.5] RepItは概念固有の表現を分離するためのフレームワークである。
目的概念に対する拒絶を選択的に抑制し、他所での拒絶を抑える。
WMD関連の問題に答えるモデルを生成するが、標準ベンチマークでは安全と評価されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:13:27 GMT)
AI for Service: Proactive Assistance with AI Glasses [44.5] AI for Service(AI4Service)は、日々の生活を積極的にリアルタイムに支援するための新しいパラダイムである。
我々は、エゴセントリックなビデオストリームからサービス機会を検出することによって介入するKnow Whenと、一般化されたサービスとパーソナライズされたサービスの両方を提供するKnow Howの2つの基本的な課題に対処する統合されたフレームワークであるAlpha-Serviceを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:55:28 GMT)
Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation [44.2] 本稿では,一般的な合成画像とDeepFake検出タスクの両方を対象とした,大規模マルチモーダルモデルであるFakeVLMを紹介する。
FakeVLMは、本物と偽のイメージを区別し、画像アーティファクトの明確な自然言語説明を提供する。
また、FakeClueは、7つのカテゴリにまたがる10万以上の画像を含む包括的なデータセットで、自然言語のきめ細かいアーティファクトのヒントで注釈付けされています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:28:19 GMT)
Code-driven Number Sequence Calculation: Enhancing the inductive Reasoning Abilities of Large Language Models [44.2] textitCodeSeqは,数列から構築した合成後トレーニングデータセットである。
パイプラインは、失敗したテストケースを反映し、反復的な修正を取り入れることで、教師付き微妙なデータを生成する。
実験の結果,textitCodeSeqでトレーニングしたモデルでは,様々な推論タスクが改善され,OOD性能が保たれることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:29:40 GMT)
Benchmarking Multimodal Large Language Models for Face Recognition [44.0] MLLM(Multimodal large language model)は、様々な視覚・言語タスクにおいて顕著なパフォーマンスを実現している。
いくつかの顔認識データセット上での顔認識のための最先端MLLMの体系的ベンチマークを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:42:27 GMT)
ToolPRM: Fine-Grained Inference Scaling of Structured Outputs for Function Calling [43.9] 本稿では,細粒度ビームサーチとプロセス報酬モデルであるToolPRMを組み合わせた推論スケーリングフレームワークを提案する。
ToolPRMをトレーニングするために、我々は、最初のきめ細かい呼び出しプロセス監視データセットを構築した。
実験により、ToolPRMは予測精度で粗い粒度と結果の報酬モデルを上回ることが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:06:03 GMT)
OmnimatteZero: Fast Training-free Omnimatte with Pre-trained Video Diffusion Models [43.7] オムニマテゼロ(OmnimatteZero)は、オムニマテの既訓練ビデオ拡散モデルを利用したトレーニング不要の手法である。
ビデオからオブジェクトを取り除き、個々のオブジェクト層をその効果とともに抽出し、それらのオブジェクトを新しいビデオに合成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:59:36 GMT)
Monogamy of entanglement between cones [43.6] モノガミーは量子論の特徴であるだけでなく、凸錐の一般対の極小テンソル積を特徴づけることを示した。
我々の証明は、アフィン同値まで単純化された生成物の新たな特徴を生かしている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:53:55 GMT)
GEPO: Group Expectation Policy Optimization for Stable Heterogeneous Reinforcement Learning [43.5] パラメータ学習とロールアウトサンプリングを分離する異種RLアーキテクチャであるHeteroRLを提案する。
コアコンポーネントは、レイテンシに堅牢な非同期RLアルゴリズムであるグループ期待ポリシー最適化(GEPO)である。
GEPOが優れた安定性を実現していることを示す実験は、オンラインから1800年代のレイテンシまで、わずか3%のパフォーマンス低下である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:19:57 GMT)
Catching the Details: Self-Distilled RoI Predictors for Fine-Grained MLLM Perception [43.4] MLLM(Multimodal Large Language Models)は、微細な知覚を行うために高解像度の視覚情報を必要とする。
近年の手法では、RoI(Rerea-of-Interest)メカニズムを活用して、健全な領域に焦点をあてている。
本稿では,このトレードオフを解決する効率的な自己拡張型地域提案ネットワーク(SD-RPN)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:53:17 GMT)
DELE: Deductive $\mathcal{EL}^{++}$ Embeddings for Knowledge Base Completion [42.5] Ont埋め込みは、クラス、ロール、および個人を$mathcalEL++$にマップし、$bbRn$エンティティ間の類似性を計算または推論することができる。
本手法は,知識ベース完了作業におけるベースライン埋め込みよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:06:23 GMT)
Efficient Parallel Samplers for Recurrent-Depth Models and Their Connection to Diffusion Language Models [42.5] 繰り返し深度を持つ言語モデルは、層を繰り返して計算量を増やす能力によって定義される。
プレトレーニングにおける最近の取り組みは、これらのアーキテクチャが現代の言語モデリングタスクにスケールできることを実証している。
我々はこれらのモデルのための新しい拡散強制サンプリング器を開発し、生成を加速する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:07 GMT)
Shape of Motion: 4D Reconstruction from a Single Video [42.4] 本稿では,世界座標フレーム内の3次元運動軌跡を明示的かつ永続的に特徴付ける,ジェネリックダイナミックシーンの再構築手法を提案する。
まず,コンパクトなSE(3)モーションベースでシーンの動きを表現することで,3次元動作の低次元構造を利用する。
第2に,単眼深度マップや長距離2Dトラックなどの既成データ駆動の先行データを利用して,これらのノイズを効果的に処理する方法を考案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:18:25 GMT)
Flexible quantum data bus for quantum networks [42.3] 本研究では、あらかじめ準備された2Dクラスタ状態が要求に応じて異なるタスクを実行するリソースとして機能する量子ネットワークにおける絡み合いのマルチパスルーティングについて考察する。
対角線経路間の適切な局所測定を行うことにより、複数の自由選択されたパーティ間の並列接続を実現する方法を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:26:34 GMT)
Vision-Centric Activation and Coordination for Multimodal Large Language Models [42.3] マルチモーダルな大言語モデル(MLLM)は、視覚エンコーダからLLMへのイメージ機能を統合し、高度な理解能力を示す。
しかし、メインストリームMLLMは、重要な視覚中心の情報を無視して、テキストトークンの次のトークン予測によってのみ監督される。
本稿では,ビジョン中心のアクティベーションとコーディネーションによってMLLM表現を最適化するVaCoを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:38:39 GMT)
OpenEstimate: Evaluating LLMs on Reasoning Under Uncertainty with Real-World Data [42.2] 実世界の設定では、不完全な情報や不確実性の下での理由を言語モデルで補う必要がある。
OpenEstimateは、数値推定のLMを評価するためのベンチマークである。
LM-elicited priors は不正確で過度に信頼されることが多い。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:35:22 GMT)
MSF-Mamba: Motion-aware State Fusion Mamba for Efficient Micro-Gesture Recognition [42.2] マイクロチャ認識のための運動認識状態融合リニアマンバ(MSF-Mamba)を提案する。
MSF-Mambaは、文脈的局所的状態による局所的時間的モデリングにより、Mambaを強化する。
我々の設計では、中央フレーム差分(CFD)に基づく動き認識型状態融合モジュールを導入している。
具体的には、MSF-Mambaはマルチスケールの運動認識状態融合と適応的なスケール重み付けモジュールをサポートする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:48:32 GMT)
SteeringSafety: A Systematic Safety Evaluation Framework of Representation Steering in LLMs [42.2] 我々は17のデータセットにまたがる7つの安全性の観点から、表現ステアリング手法を評価するための体系的なフレームワークであるSteeringSafetyを紹介した。
当社のフレームワークは,DIM,ACE,CAA,PCA,LATの統一的な実装を実現するとともに,最近のコンディショナルステアリングなどの拡張を施した,最先端のステアリング手法のためのモジュール化されたビルディングブロックを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:44:31 GMT)
UniCode: A Framework for Generating High Quality Competitive Coding Problems [41.7] UniCodeは、堅牢で汚染に強いテストケースと並行して、高品質なアルゴリズム問題を自動生成する新しいフレームワークである。
トップパフォーマンスのモデルであるo4-miniが70.3%のパス率しか達成していないため、UniCodeは非常に困難で差別的であることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:07:12 GMT)
Salient Concept-Aware Generative Data Augmentation [41.0] 画像とテキストの両方に条件付けされた生成データ拡張手法は、忠実性と多様性のバランスをとるのに苦労する。
本稿では,合成過程における無関係な視覚的詳細の影響を低減するために,健全な概念認識画像埋め込みモデルを用いたパーソナライズされた画像生成フレームワークを提案する。
提案手法は,8つの細粒度視覚データセットに対して優れた性能を示し,平均的分類精度を0.73%,6.5%向上させる技術拡張手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:31:55 GMT)
Towards Adaptable Humanoid Control via Adaptive Motion Tracking [40.9] 単一の参照動作から適応的な制御を可能にする新しいモーショントラッキングであるAdaMimicを紹介する。
シミュレーションと実世界のUnitree G1ヒューマノイドロボットにおけるアプローチにおけるこれらの重要な改善の有効性を検証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:54:53 GMT)
A$^2$FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning [40.6] 大規模言語モデルは、推論中心のLLMとエージェントのLLMの2つのファミリーに分けられた。
この分割は、基本的に異なるトレーニング目標から生じ、単純なクエリに対して不一致の強度と非効率をもたらす。
本稿では,アダプティブ・エージェント・ファンデーション・モデル (A$2$FM) を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:41:48 GMT)
Tawa: Automatic Warp Specialization for Modern GPUs with Asynchronous References [40.6] 本稿では,ハイレベルなタイルベースプログラムからワープ特化コードを生成する自動コンパイラTawaを提案する。
Tawaiはプログラムをプロデューサとコンシューマの役割に自動的に分割し、複雑なデータフローパイプラインを管理し、侵入的なカーネル書き換えを回避します。
Tawaiは高いハードウェア利用を提供し、高度に最適化されたcuBLAS GEMMカーネルよりも1.1$times$のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:20:00 GMT)
RareAgent: Self-Evolving Reasoning for Drug Repurposing in Rare Diseases [40.5] RareAgentは、このタスクをパッシブパターン認識からアクティブエビデンス検索推論に再構成する、自己進化型マルチエージェントシステムである。
総合的な評価によると、RareAgentは推論基準よりもAUPRCの表示を18.1%改善している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:52:44 GMT)
E2Edev: Benchmarking Large Language Models in End-to-End Software Development Task [40.5] E2EDevは、(i)ユーザ要件のきめ細かいセット、(ii)要件ごとに対応するPythonのステップ実装を備えた複数のBDDテストシナリオ、(iii)Behaveフレームワーク上に構築された完全に自動化されたテストパイプラインで構成されています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:54:26 GMT)
MERLIN: A Testbed for Multilingual Multimodal Entity Recognition and Linking [40.4] 本稿では,多言語マルチモーダルエンティティリンクのための新しいテストベッドシステムであるMERLINを紹介する。
作成されたデータセットには、ヒンディー語、日本語、インドネシア語、ベトナム語、タミル語という5つの言語で、対応する画像と組み合わせたBBCニュース記事タイトルが含まれている。
また、異なる言語モデルを探索する多言語および多モーダルなエンティティリンク手法を用いて、いくつかのベンチマークを含む。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:06:54 GMT)
Comprehensive language-image pre-training for 3D medical image understanding [40.1] ビジョン言語による事前学習、すなわち画像とペアテキストの整列はエンコーダを作成するための強力なパラダイムである。
我々は,包括的言語画像事前学習(COLIPRI)エンコーダファミリーを開発した。
我々のCOLIPRIエンコーダは、レポート生成、分類探索、ゼロショット分類において最先端の性能を達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:01:31 GMT)
Fast and fault-tolerant logical measurements: Auxiliary hypergraphs and transversal surgery [40.0] 量子コード手術は、量子低密度パリティチェック符号上でフォールトトレラント計算を行うための有望な技術である。
本報告では, 耐故障性手術を一定の時間的オーバーヘッドで確実に行うことのできる, 一般的な条件について述べる。
さらに,O(1)$と$O(d)$の中間時間オーバーヘッドを伴う手術操作について検討し,量子局所テスト可能符号に適用する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:12:36 GMT)
TITAN: Graph-Executable Reasoning for Cyber Threat Intelligence [40.0] TITAN(Threat Intelligence Through Automated Navigation)は、自然言語のサイバー脅威クエリと構造化知識グラフ上の実行可能な推論を接続するフレームワークである。
テキストから論理的関係連鎖を予測するパスプランナーモデルと、TITANオントロジーを横切るグラフエグゼキュータを統合して、事実の回答を取得し、証拠を支持する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:27:05 GMT)
Nearly Minimax Optimal Regret for Multinomial Logistic Bandit [39.8] 本研究では,学習エージェントが文脈情報に基づいて順にアソシエーションを選択する,文脈多項ロジット(MNL)バンディット問題について検討する。
左下肢と左上肢の間には有意な差がみられ,特に最大配置サイズは有意な差がみられた。
我々は,一様報酬の下で,$tildeO(dsqrtT/K)$と一致する上限を実現する定数時間アルゴリズム OFU-MNL+を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:10 GMT)
EviNote-RAG: Enhancing RAG Models via Answer-Supportive Evidence Notes [39.6] EviNote-RAGは検索ノート・アンサーのワークフローに従うフレームワークである。
生の外部情報を直接推論する代わりに、モデルが最初にサポート・エビデンス・ノートを生成する。
EviNote-RAGは最先端のパフォーマンスを実現し、回答の正確性、トレーニングの安定性、堅牢性、効率性を向上する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:57:27 GMT)
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models [39.6] グラフ解析のベンチマークであるGRABを現在および将来のLMMに適用する。
私たちのベンチマークは、主に合成され、高品質でノイズフリーな質問を確実にします。
GRAB 上で 20 LMM の評価を行い,その性能は 21.0 % と高い結果を得た。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:05:20 GMT)
VT-Refine: Learning Bimanual Assembly with Visuo-Tactile Feedback via Simulation Fine-Tunin [39.5] 人間は、リッチな触覚フィードバックに適応することで、バイマニュアルアセンブリータスクで卓越する。
VT-Refineは、実世界の実演、高忠実度触覚シミュレーション、強化学習を組み合わせた、ビジュオ触覚政策学習フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:41:36 GMT)
Identity-Preserving Image-to-Video Generation via Reward-Guided Optimization [39.5] 画像間(I2V)生成のためのIPRO(Identity-Preserving Reward-guided Optimization)を提案する。
IPROは、アイデンティティ保護を強化するための強化学習に基づいている。
提案手法は,サンプリングチェーンの最後のステップを通じて報酬信号をバックプロパゲートし,よりリッチなフィードバックを可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:13:47 GMT)
Benchmarking drug-drug interaction prediction methods: a perspective of distribution changes [39.4] DDI-Benは、分散変更の下でのDDI予測の出現のためのベンチマークフレームワークである。
既存のほとんどのアプローチは,分布変化による性能劣化に悩まされていることを示す。
分析の結果,大規模言語モデル(LLM)に基づく手法と薬物関連テキスト情報の統合は,そのような劣化に対して有望な堅牢性をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:37:35 GMT)
ComposeMe: Attribute-Specific Image Prompts for Controllable Human Image Generation [39.3] 本稿では,属性特異的な画像プロンプトのための新しいパラダイムを紹介し,人間の外見の個々の側面の生成を導くために,異なる参照画像群を用いる。
提案手法は,これらの入力を属性固有のトークンにエンコードし,事前学習したテキスト・画像拡散モデルに注入する。
これにより、複数の視覚的要因に対する構成的および非絡み合いの制御が可能となり、1つの画像内の複数の人にわたっても可能となる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:30:16 GMT)
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order [39.3] ダウンストリームタスクに事前訓練されたモデルを適用するには、微調整大型言語モデル(LLM)が不可欠である。
従来の一階述語アルゴリズムは、モデルサイズであまりスケールしない、禁止的なメモリと計算コストを発生させる。
メモリと計算効率の代替としてゼロオーダー(ZO)最適化法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:58:47 GMT)
When Planners Meet Reality: How Learned, Reactive Traffic Agents Shift nuPlan Benchmarks [39.1] ルールベースのトラフィックエージェントは、プランナーの欠陥とバイアスランキングを隠蔽する。
我々は、最先端の学習トラフィックエージェントモデルSMARTをnuPlanに統合する。
IDMに基づくシミュレーションでは,計画性能が過大評価されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:34:12 GMT)
Unsupervised Learning to Recognize Quantum Phases of Matter [39.1] この研究では教師なし学習を採用しており、アルゴリズムは事前にラベル付けされた状態にアクセスできない。
我々は,テンソルネットワーク技術によって決定された2つのスピン$frac12$チェーンを用いて,本手法をベンチマークした。
我々の研究結果は、教師なし学習が量子物質の新しい位相を自律的に認識し、また明らかにする方法を示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:45:54 GMT)
Why is Your Language Model a Poor Implicit Reward Model? [39.1] 最近の研究は、すべての言語モデルが暗黙の報酬モデル(IM-RM)を定義することを示した。
IM-RMは、明示的な報酬モデル(EX-RM)と比較して、特に分布外において、より良く一般化する傾向がある
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:45:44 GMT)
Make an Offer They Can't Refuse: Grounding Bayesian Persuasion in Real-World Dialogues without Pre-Commitment [38.0] 単ターン対話設定における自然言語へのベイジアン説得(BP)の適用について検討する。
本フレームワークは,情報スキーマを明確に概説するコミットメントコミュニケーション機構を備えている。
提案手法では,FNLBPとFNLBPの2つの変種を評価し,非BP基線と非BP基線の両方に対してベンチマークを行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:08:13 GMT)
Ada-KV: Optimizing KV Cache Eviction by Adaptive Budget Allocation for Efficient LLM Inference [37.9] 大規模言語モデルは様々なドメインで優れていますが、キーバリュー(KV)キャッシュの増加によって効率上の課題に直面しています。
最近の取り組みは、実行中に大量の非クリティカルキャッシュ要素を排除し、KVキャッシュサイズを削減することを目的としている。
本稿では,Ada-KVを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:25:38 GMT)
Learning Human-Humanoid Coordination for Collaborative Object Carrying [37.8] 本稿では,リーダーと追従者の行動を一つの方針で組み合わせた,プロプリセプションのみによる強化学習手法であるCOLAを提案する。
我々は,協調搬送タスクの総合的なシミュレータと実世界の実験を通して,我々のアプローチを評価する。
本手法は,外部センサや複雑な相互作用モデルを必要とすることなく,人間-ヒューマノイドの協調搬送を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:36:25 GMT)
ColorBench: Benchmarking Mobile Agents with Graph-Structured Framework for Complex Long-Horizon Tasks [37.8] 実世界のタスクは複雑で、複数の有効なソリューションが可能である。
オフラインベンチマークは、1つの事前定義された"ゴールドパス"のみを検証することができる
オンライン動的テストは、実際のデバイスの複雑さと非再現性によって制約される。
本稿では,新しいグラフ構造化ベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:30:05 GMT)
Training-Free Personalization via Retrieval and Reasoning on Fingerprints [37.5] 視覚言語モデル(VLM)はマルチモーダル推論に大きな改善をもたらしたが、ユーザ固有の概念を理解するのに苦戦している。
本稿では, VLMの内部知識を活用して, パーソナライズのための検索と推論(R2P)を提案する。
R2Pは、様々な下流タスクにおける最先端のアプローチを一貫して上回る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:19:45 GMT)
Attention Is All You Need for KV Cache in Diffusion LLMs [36.9] Elastic-Cacheは、拡散大言語モデルのための適応型層対応キャッシュ更新を実行する。
提案手法は,既存の信頼度に基づく手法よりも高いスループット(GSM8Kで6.8時間)を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:48 GMT)
Eyes Wide Open: Ego Proactive Video-LLM for Streaming Video [36.9] 我々は、egoストリーミングビデオ入力を前提として、多種多様な質問に積極的に答える革新的なタスクに焦点をあてる。
このタスクは、(1)プロアクティブコヒーレンス、(2)ジャスト・イン・タイム・レスポンシブネス、(3)シンクロナイズド・効率の3つの重要な特性を具現化する。
この課題に対処するための総合的な技術パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:11:13 GMT)
Coder as Editor: Code-driven Interpretable Molecular Optimization [36.8] 私たちは、編集アクションを実行可能なコードに変換することによって、推論と実行をブリッジするフレームワークMECoを紹介します。
提案手法は,化学反応とターゲット特異的化合物対からのリアルな編集を再現する際の精度を98%以上向上させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:55:06 GMT)
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe [36.7] 大型言語モデル (LLM) は命令追従能力を得るために命令チューニングを行う。
命令チューニングを改善する努力は、しばしば高品質な教師付き微調整データセットに焦点を当てる。
SFTMixは、よく計算されたデータセットに頼らずにLLM命令のチューニングを向上する新しいMixベースのレシピである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:32:30 GMT)
When Flatness Does (Not) Guarantee Adversarial Robustness [36.4] 長期にわたる仮説は、損失ランドスケープの低曲率領域である平坦なミニマは、ロバスト性を高めることを示唆している。
平坦性は局所性を意味するが、大域的対角強靭性は含まない。
局所的な近傍を超えて堅牢性を維持するためには、損失はデータ多様体から急激に遠ざかる必要がある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:15:14 GMT)
Perspective-Aware Teaching: Adapting Knowledge for Heterogeneous Distillation [36.2] 多様なアーキテクチャにまたがる特徴蒸留を可能にするために,視点認識型KDフレームワークを導入した。
まず、学生のフィードバックを取り入れたプロンプトチューニングブロックを設計し、教師が生徒モデルの学習プロセスに適応できるようにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:40:46 GMT)
Towards Agentic Self-Learning LLMs in Search Environment [36.2] 自己学習が人間の計算したデータセットや事前定義されたルールベースの報酬に頼ることなく、LSMベースのエージェントをスケールできるかどうかを検討する。
生成的リワードモデル(GRM)の報酬は、オープンドメイン学習のための厳密なルールベースの信号より優れている。
完全閉ループ・マルチロール強化学習フレームワークである textbfAgentic Self-Learning (ASL) を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:11:56 GMT)
Beyond Two-Stage Training: Cooperative SFT and RL for LLM Reasoning [36.1] 本研究では,二段階最適化を用いた推論モデル学習手法を提案する。
最適RLポリシーにSFTの目的を条件付けることにより、SFTはRLの最適化プロセスの導出方法をメタ学習することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:30:21 GMT)
Leveraging LLMs, IDEs, and Semantic Embeddings for Automated Move Method Refactoring [36.0] 大きな言語モデルには専門家による提案があるが、信頼できない:最大80%の提案は幻覚である。
我々は,MOVEMETHODの推奨から実行まで,エンドツーエンドライフサイクル全体を自動化した最初のLLM完全パワーアシスタントを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:08:16 GMT)
R1-Ranker: Teaching LLM Rankers to Reason [35.4] R1-Rankerは強化学習に基づく推論インセンティブフレームワークである。
IRankerは、より深い推論を促進するために、段階的な報酬でランク付けを反復的排除プロセスに分解する。
我々は、レコメンデーション、ルーティング、通過ランキングにまたがる9つのデータセットに基づいて、統一されたR1-Rankerを評価した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:41:42 GMT)
Augmenting Smart Contract Decompiler Output through Fine-grained Dependency Analysis and LLM-facilitated Semantic Recovery [35.3] SmartHaloは、静的解析(SA)と大規模言語モデル(LLM)を組み合わせることで、デコンパイラ出力を強化する新しいフレームワークである。
SmartHaloは、SOTAデコンパイラ(例えばGigahorse)と比較して、デコンパイルされたコードの品質を大幅に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:40:44 GMT)
A Generalizable Rhetorical Strategy Annotation Model Using LLM-based Debate Simulation and Labelling [35.3] 大規模言語モデル(LLM)を活用して,4部構成の修辞型タイポロジー(因果的,経験的,感情的,道徳的)に基づいて,合成討論データを自動生成・ラベル付けするフレームワークを提案する。
本モデルは,話題領域間で高い性能と強力な一般化を実現する。
1)修辞的戦略ラベルの導入による説得性予測の改善、(2)米国大統領討論会における修辞的戦略の時間的・パルチザン的シフトの分析(1960-2020)。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:51:23 GMT)
Generalized Dynamics Generation towards Scannable Physical World Model [35.1] GDGenは,剛体・関節体・軟体力学をシームレスに統合するための,ポテンシャルエネルギーの観点からの枠組みである。
我々は、方向剛性を導入して古典的エラストダイナミックスを拡張し、幅広い物理的挙動を捉える。
本稿では, 拡張材料特性をモデル化し, 変形を幾何学的に表現するためのニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:58 GMT)
The Fluorescent Veil: A Stealthy and Effective Physical Adversarial Patch Against Traffic Sign Recognition [35.1] 交通標識認識システムは、物理的敵攻撃の顕著な標的となっている。
本研究では, 新たな攻撃媒体である蛍光インクを導入し, ステルス性, 効果的な物理的敵パッチ, すなわちFIPatchを設計する。
我々の攻撃は5つの一般的な防御を回避し、96.72%の成功率を達成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:07:58 GMT)
ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints [34.6] ImagerySearchは、アダプティブなテストタイム検索戦略である。
プロンプト内の意味的関係に応じて、推論検索空間と報酬関数の両方を調整する。
これは、強力なビデオ生成ベースラインと既存のテストタイムスケーリングアプローチを一貫して上回る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:19:13 GMT)
Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach [34.5] 大言語モデル(LLM)の成功のための重要な技術である選好アライメント
本稿では,リコメンデーションアライメントがキャリブレーションになぜ影響するか,この問題にどう対処するかを検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:26:43 GMT)
GroundedPRM: Tree-Guided and Fidelity-Aware Process Reward Modeling for Step-Level Reasoning [34.4] 自動プロセス監視のための木誘導・忠実度対応フレームワークであるGroundedPRMを紹介する。
グラウンドドPRMは40Kの自動的にラベル付けされたサンプルでトレーニングされており、自動ラベル付けされた監視で訓練された最高のパフォーマンスのPRMが使用するデータの10%しか使用できない。
ProcessBenchの平均パフォーマンスは最大で26%向上している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:54:07 GMT)
TGT: Text-Grounded Trajectories for Locally Controlled Video Generation [34.0] 本稿では,テキスト記述と組み合わせたトラジェクトリ上でのビデオ生成を行うフレームワークであるText-Grounded Trajectories (TGT)を紹介する。
TGTは、従来のアプローチと比較して、より高い視覚的品質、より正確なテキストアライメント、モーションコントロール性の向上を実現している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:45:27 GMT)
Leveraging Multimodal LLM Descriptions of Activity for Explainable Semi-Supervised Video Anomaly Detection [33.8] MLLM(Multimodal Large Language Models)を利用した新しいVADフレームワークを提案する。
本手法は、時間とともにオブジェクトのアクティビティやインタラクションを抽出し、解釈することに焦点を当てる。
我々のアプローチは本質的に説明可能性を提供し、多くの従来のVAD手法と組み合わせて解釈可能性をさらに高めることができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:13:33 GMT)
To Infinity and Beyond: Tool-Use Unlocks Length Generalization in State Space Models [33.4] State Space Models (SSM) は、シークエンスモデリングのためのTransformerの先駆的な代替品となっている。
我々は,SSMが任意の難解な問題を解くことを学習し,任意の問題長/複雑度に一般化できることを示す。
ツール拡張されたSSMは、様々な算術、推論、コーディングタスクにおいて、目覚ましい長さの一般化を実現することを実証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:02:45 GMT)
PrivacyPAD: A Reinforcement Learning Framework for Dynamic Privacy-Aware Delegation [33.4] この問題を解決するために、プライバシPADと呼ばれる新しい強化学習フレームワークを導入する。
我々のフレームワークは、エージェントにテキストチャンクを動的にルーティングするように訓練し、プライバシリークとタスクパフォーマンスのトレードオフを最適にバランスさせるポリシーを学ぶ。
当社のフレームワークは,プライバシ・ユーティリティ・フロンティアにおける新たな最先端を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:38:36 GMT)
RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning [33.4] 本稿では,bu教師学習を訓練した拡散振動子ポリシーに基づく実世界の強化学習フレームワークRL-100を提案する。
我々はPush-TやAgile Bowlingといった動的剛体制御にまたがる7つの実ロボットタスクに対してRL-100を評価する。
RL-100は900回中900回で評価試験で100%成功し、1回で250回連続試験のうち250回まで成功している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:07:50 GMT)
Enhancing Long Chain-of-Thought Reasoning through Multi-Path Plan Aggregation [32.9] 我々は、生の長いCoTを分析し、計画と実行ステップからなる推論階層を明らかにする。
本研究の目的は,計画探索と集約による単一パス推論を増強するMPPA(Multi-Path Plan Aggregation)を提案することである。
これを解決するために, Twisted Sequential Monte Carlo (TSMC) を利用するプロセスレベルの優先度最適化スキームであるStep-DPOを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:41:15 GMT)
Ideology and polarization set the agenda on social media [32.7] 本研究は,3つの世界的議論 – Climate Change, COVID-19, およびロシア・ウクライナ戦争 – から,大規模Twitterデータを分析し,エンゲージメントの構造的ダイナミクスを調査した。
本研究は,メディアや活動家など特定のカテゴリーのアクターによる議論ではなく,イデオロギー的アライメントによる議論が主であることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:12:47 GMT)
AlignFlow: Improving Flow-based Generative Models with Semi-Discrete Optimal Transport [32.6] フローベース生成モデル(FGM)はノイズを複雑なデータ分布に変換する。
既存のOTベースの手法では、サンプルノイズとデータポイントの(ミニ)バッチを用いてOTプランを推定する。
本稿では、雑音分布とデータ点との明示的最適アライメントを確立することにより、FGMのトレーニングを強化する新しいアプローチであるAlignFlowを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:43 GMT)
The simulation of judgment in LLMs [32.6] 大規模言語モデル(LLM)は、情報フィルタリングから説明と信頼性の判断を通じて知識ギャップの評価と対処に至るまで、評価プロセスに組み込まれている。
これにより、このような評価がどのように構築されるのか、どのような仮定に依存しているのか、その戦略が人間のものとどのように異なるのかを調べる必要が生じる。
我々は、専門家の評価に対して、6つのLCM(NewsGuardとMedia Bias/Fact Check)と、制御された実験を通して収集された人間の判断に対してベンチマークを行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:38:08 GMT)
Learn to Change the World: Multi-level Reinforcement Learning with Model-Changing Actions [32.4] 基盤となる遷移プロセスの再構成は、エージェントの報酬を増加させる可能性がある。
多層時間変化マルコフ決定過程(MCTVMDP)を紹介する。
エージェントの目的は2つの部分から構成される: 上位のMDPにおける設定ポリシーを最適化し、下位のMDPにおけるプリミティブアクションポリシーを最適化し、期待される長期的な報酬を共同で改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:13:42 GMT)
First Attentions Last: Better Exploiting First Attentions for Efficient Transformer Training [32.3] 既存の変圧器の設計は、特に並列性(TP)において、大きな通信オーバーヘッドに悩まされている。
FAL(First Attentions Last)は,第1のMHA出力を次のレイヤの入力にリダイレクトし,ブロックごとのMHA-MLP接続を除去する,効率的なトランスフォーマアーキテクチャである。
FALはマルチGPUトレーニング時間を最大44%削減し、シングルGPUスループットを最大1.18倍改善し、ベースラインのGPTよりも複雑な処理を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:21:46 GMT)
Software Testing Education and Industry Needs - Report from the ENACTEST EU Project [32.1] 本研究では,産業界におけるソフトウェアテスト能力の必要性を調査し,現在のテスト教育における知識ギャップを特定し,学術文献では解決されていないギャップを強調した。
研究機器は、産業ニーズと教育的ギャップの包括的カバレッジを確保するために、複数のイテレーションを通じて共同で開発され、洗練されました。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:37:11 GMT)
A Neural Symbolic Model for Space Physics [32.0] 我々は、記号回帰によって物理式を発見するための新しいAIモデルPhyE2Eを公表する。
我々は、太陽黒点数、太陽回転速度、放射線寄与関数、地球近傍のプラズマ圧力、月潮プラズマ信号の予測を含む、宇宙物理学の5つの応用にPhyE2Eを配備する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:20:02 GMT)
3DOT: Texture Transfer for 3DGS Objects from a Single Reference Image [32.0] 3Dテクスチャスワップは、3Dオブジェクトテクスチャのカスタマイズを可能にする。
専用の方法はないが、適応された2D編集とテキスト駆動の3D編集アプローチは、この目的を果たすことができる。
3DSワッピング,3次元テクスチャスワッピング方式を導入し,プログレッシブ・ジェネレーション,ビュー・コンシスタンス・グラデーション・ガイダンス,プロンプト・チューニング・グラデーション・ガイダンスを統合した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:29:48 GMT)
SaLon3R: Structure-aware Long-term Generalizable 3D Reconstruction from Unposed Images [31.9] SaLon3Rは構造対応の長期3DGS再構成のための新しいフレームワークである。
10 FPS以上で50以上のビューを再構築でき、50%から90%の冗長性除去が可能である。
提案手法は, 1回のフィードフォワードパスにおいて, アーティファクトを効果的に解決し, 冗長な3DGSを創出する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:37:10 GMT)
SimULi: Real-Time LiDAR and Camera Simulation with Unscented Transforms [31.9] SimULiは任意のカメラモデルとLiDARデータをリアルタイムでレンダリングできる最初の方法である。
提案手法は,LiDARをサポートする複雑なカメラモデルをサポートする3DGUTを,自動タイリング戦略により拡張する。
SimULiはレイトレーシングのアプローチよりも10~20倍高速で、優先度ベースの作業よりも1.5~10倍高速である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:37:37 GMT)
MoM: Mixtures of Scenario-Aware Document Memories for Retrieval-Augmented Generation Systems [31.4] 複数のドメインからのドキュメントを効率的に処理するために設計された、シナリオ対応ドキュメントメモリ(MoM)フレームワークの混合。
MoMは、ドキュメント論理的アウトラインを生成する際に、ドメインエキスパートをシミュレートする大規模な言語モデル(LLM)を指示する。
我々は、高品質な結果から洗練された専門家思考経路を導出する逆推論戦略を取り入れた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:09:51 GMT)
STANCE: Motion Coherent Video Generation Via Sparse-to-Dense Anchored Encoding [31.4] 映像生成は近年目覚ましい進歩を遂げているが、コヒーレントな物体の動きと相互作用を維持することは依然として困難である。
両問題に2つの簡単なコンポーネントで対処する画像とビデオのフレームワークであるSTANCEを提示する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:50:38 GMT)
Cross-Scenario Unified Modeling of User Interests at Billion Scale [31.3] 本稿では,産業レベルのコンテンツレコメンデーションシステムに適した,多種多様なシナリオのための高度なレコメンダエンジンであるRED-Recを提案する。
Red-Recは、複数の振る舞いコンテキストにまたがるユーザ関心の表現を統一し、包括的なアイテムとユーザモデリングをもたらす。
RED-RecのオンラインA/Bテストは、RedNoteの数億人のユーザを対象に、オンラインA/Bテストを通じて検証し、コンテンツレコメンデーションと広告ターゲティングタスクの両方において、大幅なパフォーマンス向上を示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:20:49 GMT)
OmniMotion: Multimodal Motion Generation with Continuous Masked Autoregression [30.8] 全体マルチモーダル・ヒューマン・モーション・ジェネレーションは2つの主要な課題を提起する。
我々は、効果的な動き生成機構を作成し、テキスト、音声、音楽などの様々なモダリティを結合的な枠組みに統合する。
本フレームワークは,テキスト・トゥ・モーション,音声・ジェスチャー,音楽・ダンスなど,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:57:53 GMT)
Provable Unlearning with Gradient Ascent on Two-Layer ReLU Neural Networks [30.8] Unlearningは、訓練されたモデルから特定のデータを削除することを目的としており、プライバシーと倫理的懸念の高まりに対処している。
本稿では, 単純で広く用いられる手法である勾配上昇の理論解析を行う。
勾配上昇は、合成ガウス混合条件下での一般化を保ちながら、未学習を成功させることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:16:36 GMT)
Retrofitting Small Multilingual Models for Retrieval: Matching 7B Performance with 300M Parameters [30.7] 効果的な多言語埋め込みモデルの訓練は、言語やタスクの目的の多様性による固有の課題を提示する。
我々は,多言語埋め込みの有効性に影響を及ぼす重要な要因について検討し,トレーニングデータ尺度,ネガティブサンプリング戦略,データ多様性に着目した。
我々は,現在の強7Bモデルに匹敵する,あるいは超越する検索性能を実現する,コンパクトな(約300M)多言語モデルを開発した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:48:59 GMT)
Symbol Grounding in Neuro-Symbolic AI: A Gentle Introduction to Reasoning Shortcuts [30.0] Neuro-symbolic (NeSy) AIは、予測が事前の知識符号化に準拠するディープニューラルネットワークを開発することを目的としている。
NeSyモデルは推論ショートカット(RS)の影響を受けやすい
RSは、モデルの説明の解釈可能性、配布外シナリオのパフォーマンス、従って信頼性を損なう可能性がある。
この概要は、直感的な言葉で彼らの原因と結果について議論し、RSを穏やかに紹介することでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:28:34 GMT)
Leveraging Cycle-Consistent Anchor Points for Self-Supervised RGB-D Registration [30.0] マッチング中に空間的コヒーレンス制約を強制するために,周期整合キーポイントを有意な点として用いる。
また,GRUリカレントユニットと変換同期を組み合わせた新しいポーズブロックを導入する。
提案手法は,ScanNetと3DMatchの自己教師あり登録手法を超越し,古い教師あり登録手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:47:10 GMT)
NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks [29.8] Nano3Dは、マスクなしで正確でコヒーレントな3Dオブジェクト編集のためのトレーニング不要のフレームワークである。
我々は,10万以上の高品質な3D編集ペアを含む,最初の大規模3D編集データセットであるNano3D-Edit-100kを構築した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:51:50 GMT)
Impact of rotation on a cold atom interferometer and compensation strategy [29.7] 原子干渉計の位相シフトとコントラストに及ぼす回転の影響について検討する。
静電実証質量を適切に回転させることで、例えば、干渉計のコントラストを回復する可能性を実証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:56:37 GMT)
Composition-Grounded Instruction Synthesis for Visual Reasoning [29.7] COGSは、少数の種問から高度な推論能力を持つMLLMを装備するためのフレームワークである。
我々は,COGSが未確認の質問に対する性能を著しく改善し,推論量や構成的質問に対する最大の利益が得られたことを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:48 GMT)
Structure-R1: Dynamically Leveraging Structural Knowledge in LLM Reasoning through Reinforcement Learning [29.7] 本稿では,検索したコンテンツを推論に最適化した構造化表現に変換するフレームワークであるtextscStructure-R1を提案する。
textscStructure-R1は、7Bスケールのバックボーンモデルとの競合性能を一貫して達成していることを示す。
我々の理論的分析は,情報密度と文脈的明瞭度を向上させることによって,構造化表現が推論をいかに促進するかを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:19:28 GMT)
Comparing Human and Language Models Sentence Processing Difficulties on Complex Structures [29.7] 人間の言語モデルと大規模言語モデル(LLM)の文理解を7つの言語構造で比較する。
以上の結果から,LLMはターゲット構造,特に庭道(GP)文に苦しむことが明らかとなった。
目標文とベースライン文のパフォーマンスを比較すると、人間で観察される性能ギャップはLLMに比例する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:40:29 GMT)
DevFD: Developmental Face Forgery Detection by Learning Shared and Orthogonal LoRA Subspaces [29.5] デジタル・フェイス・ジェネレーションと操作は大きな社会的リスクをもたらす。
進化を続ける新しい種類の偽造に対して防御するためには、モデルが新しいドメインに迅速に適応できるようにする必要があります。
フェースフォージェリ検出は継続学習問題であり,新たなフォージェリタイプが出現するにつれて,モデルの開発を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:27:20 GMT)
XModBench: Benchmarking Cross-Modal Capabilities and Consistency in Omni-Language Models [29.4] クロスモーダル整合性を測定するための大規模トリモーダルベンチマークであるXModBenchを紹介する。
XModBenchは5つのタスクファミリーにまたがる60,828の多重選択質問で構成されている。
実験によると、最強のモデルであるGemini 2.5 Proでさえ空間的および時間的推論に苦戦している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:10:22 GMT)
Budget-aware Test-time Scaling via Discriminative Verification [29.2] テスト時間のスケーリングは、複雑な推論タスクにおいて、大きな言語モデルのパフォーマンスを高めるための強力な戦略です。
この作業では、焦点をより予算対応のパラダイム、差別的検証にシフトします。
固定された計算予算の下では、このハイブリッドアプローチは最先端の生成検証をかなりの差で上回る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:30:02 GMT)
Reasoning in Space via Grounding in the World [28.9] 本研究では,そのギャップを埋める効果的な空間表現を探るため,GS-Spatial Reasoner(GS-Reasoner)を提案する。
GS-Reasonerは、3Dの視覚的グラウンドで印象的な結果を得ることができ、それによって空間的推論能力が大幅に向上する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:18:03 GMT)
Adversarial Defence without Adversarial Defence: Enhancing Language Model Robustness via Instance-level Principal Component Removal [28.6] プレトレーニング言語モデル(PLM)は、自然言語処理の大幅な進歩を導いてきたが、敵の攻撃に弱いままである。
PLMの対角的堅牢性を向上する,シンプルで効果的なアドオンモジュールを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:14:12 GMT)
Efficient Seq2seq Coreference Resolution Using Entity Representations [28.6] シーク2セックリゾルバでトークンの広い部分を捨てることは、インクリメンタルコア参照解決のための実現可能な戦略であることを示す。
以上の結果から,Seq2seqリゾルバにおけるトークンの広い部分の破棄は,インクリメンタルコア参照解決のための実現可能な戦略であることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:50:03 GMT)
State Your Intention to Steer Your Attention: An AI Assistant for Intentional Digital Living [28.4] 本稿では,ユーザの意図を取り入れた新しいAIアシスタントを導入し,その意図に沿う活動が進行しているかどうかを評価し,逸脱が発生した場合の穏やかな痛手を提供する。
このシステムは、大きな言語モデルを利用してスクリーンショット、アプリケーションタイトル、URLを分析し、動作が指示された目標から外れたときに通知を発する。
その結果、我々のAIアシスタントは、ユーザーの焦点維持とデジタル行動と意図の整合性を効果的に支援していることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:57:35 GMT)
Fast and Scalable Score-Based Kernel Calibration Tests [28.4] KCCSDテスト(Kernel Conditional Stein Discrepancy test)は,確率モデルのキャリブレーションを適切に定義したスコアで評価するための,非パラメトリックなカーネルベーステストである。
従来の手法とは対照的に,我々のテストでは,型Iエラーを制御しながら,コストのかかる予測近似の必要性を回避している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:11:14 GMT)
A Weakly Supervised Transformer for Rare Disease Diagnosis and Subphenotyping from EHRs with Pulmonary Case Studies [28.3] WEST(Wakly Supervised Transformer for rare disease phenotyping and subphenotyping from EHRs)を提案する。
ボストン小児病院のEHRデータを用いて2つの稀な肺疾患についてWESTを評価し, 表現型分類, 臨床的に有意な亜フェノタイプ同定, 疾患進行の予測において, 既存の方法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:43:35 GMT)
Information Gain-based Policy Optimization: A Simple and Effective Approach for Multi-Turn LLM Agents [28.1] 大規模言語モデル(LLM)ベースのエージェントは、外部環境と対話する能力を高めるために強化学習(RL)でますます訓練されている。
既存のアプローチは通常、最終回答でのみ提供される結果に基づく報酬に依存します。
本稿では,情報ゲインに基づくポリシー最適化(IGPO)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:32 GMT)
DPRF: A Generalizable Dynamic Persona Refinement Framework for Optimizing Behavior Alignment Between Personalized LLM Role-Playing Agents and Humans [28.0] 言語モデルロールプレイングエージェント(LLM RPA)は、個人の行動のシミュレートを目的としている。
ペルソナの忠実さは、ターゲットの個人と整列することなく手動で作成したプロファイルによって損なわれることが多い。
我々の研究は、DPRF(Dynamic Persona Refinement Framework)を導入し、LLM RPAの動作とターゲット個人とのアライメントを最適化することを目的としている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:26:38 GMT)
Coupled Diffusion Sampling for Training-Free Multi-View Image Editing [27.9] 事前訓練された2D画像編集モデルは、複数のビュー画像の集合において、各画像の高品質な編集を独立して生成することができるが、ビュー間の一貫性は維持されない。
本稿では,生成した2次元画像列を事前学習した多視点画像分布に適応するように制約することで,暗黙的な3次元正規化手法を提案する。
これは、多視点画像分布と2次元編集画像分布の両方から2つの軌跡を同時にサンプリングする単純な拡散サンプリング技術である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:59 GMT)
OpenDerisk: An Industrial Framework for AI-Driven SRE, with Design, Implementation, and Case Studies [27.9] OpenDeriskは、SRE(Site Reliability Engineering)チーム向けに設計された、オープンソースのマルチエージェントフレームワークです。
OpenDeriskは、診断ネイティブなコラボレーションモデル、プラグイン可能な推論エンジン、知識エンジン、標準化されたプロトコルを統合している。
評価の結果,OpenDeriskは精度と効率の両方で最先端のベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:18:45 GMT)
HugAgent: Evaluating LLMs in Simulating Human-Like Individual Reasoning on Open-Ended Tasks [27.8] HugAgentは、平均的個人的推論適応のためのベンチマークである。
タスクは、特定の人がどのように推論し、新しいシナリオにおける信念を更新するかを予測することである。
HugAgentは、スケールとシステマティックなストレステストのための合成トラックと、有効な"アウトルード"推論データのための人間のトラックというデュアルトラックデザインを採用している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:03:54 GMT)
SPIRIT: Patching Speech Language Models against Jailbreak Attacks [27.8] 音声言語モデル(SLM)は、音声命令による自然な対話を可能にする。
我々は、敵の攻撃を分析し、SLMが脱獄攻撃に対してかなり脆弱であることを示す。
セキュリティ向上のために,推論時に介入するポストホック・パッチ・ディフェンスを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:26:23 GMT)
Joint Modeling of Big Five and HEXACO for Multimodal Apparent Personality-trait Recognition [27.8] 本稿では,ビッグファイブとHEXACOの共同モデリング手法を提案する。
提案手法は,Big FiveとHEXACOを効果的に認識することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:21:57 GMT)
Measuring the Effect of Disfluency in Multilingual Knowledge Probing Benchmarks [27.6] 我々は,Google Translate と ChatGPT による初期(測定済み)の MLAMA データセットと文レベルの翻訳の知識検索スコアを比較した。
我々は,知識検索スコアの大幅な増加を観察し,その背景にある可能性のある理由について質的な分析を行う。
また、異なるファミリーからさらに5つの言語を分析して、同様のパターンを確認します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:16:56 GMT)
On Equivariance and Fast Sampling in Video Diffusion Models Trained with Warped Noise [27.5] 入力雑音の空間変換に同値であるように、歪んだ雑音を訓練できることが示される。
これにより、入力ノイズ中の動きは、生成されたビデオ内の動きと自然に一致させることができる。
EquiVDMはサンプリングのステップをはるかに少なくすることで、同等または優れた品質を達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:46:47 GMT)
EuroMineNet: A Multitemporal Sentinel-2 Benchmark for Spatiotemporal Mining Footprint Analysis in the European Union (2015-2024) [27.4] EuroMineNetは、マイニングフットプリントマッピングとモニタリングのための、最初の総合的なマルチテンポラルベンチマークである。
欧州連合全体で133の鉱業地帯にまたがっており、GeoAIベースのモデルで大陸規模で環境動態を解析することができる。
エウロマイネネットは、時間的に一貫した説明可能な鉱業モニタリングを進めることで、持続可能な土地利用管理、環境の回復力、そして、GeoAIを社会と環境の良し悪しに適用するというより広い目標に貢献する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:15:53 GMT)
The Mechanistic Emergence of Symbol Grounding in Language Models [27.4] シンボルグラウンド(Smbol grounding)は、シンボルが現実世界の感覚運動者体験に接続することで、その意味を得る方法を記述する。
最近の研究は、明確な接地目的を使わずに、大規模に訓練された(視覚言語)モデルに接地が現れるという予備的な証拠を示している。
この結果から,記号接地が言語モデルに現れることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:51:48 GMT)
ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning [27.3] 本稿では、ファンデーションモデルによるARM-FM: Automated Reward Machinesを紹介する。
強化学習における自動構成報酬設計のためのフレームワークである。
ARM-FMの有効性を示す実証的な証拠を,多様な環境において提示する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:18:30 GMT)
From Easy to Hard: The MIR Benchmark for Progressive Interleaved Multi-Image Reasoning [27.1] Multi-image Interleaved Reasoningは、複数の画像とその関連するテキストコンテキストを共同で理解し、推論するマルチモーダル大言語モデル(MLLM)の能力を改善することを目的としている。
MIRは、画像領域と対応するテキストを正確に関連付けるために、インターリーブされたテキストコンテキストを伴う複数の画像に対する共同推論を必要とする。
提案手法は, MIRベンチマークおよび他の確立されたベンチマークにおいて, モデル推論性能を著しく向上させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:56:19 GMT)
Beyond Outcome-Based Imperfect-Recall: Higher-Resolution Abstractions for Imperfect-Information Games [26.9] ハンド抽象化はテキサスホールドエムのような不完全な情報ゲーム(IIG)のスケーリングに不可欠である。
プレイヤーアクションシーケンスから信号をきれいに分離する'em-styleゲームを保持するように調整されたIIGのサブクラスである信号観測順序ゲーム(SOOGs)を紹介する。
本稿では,主要な結果に基づく不完全なリコールアルゴリズムが,歴史的情報を任意に破棄することで,かなりの損失を被ることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:27:15 GMT)
Does FLUX Already Know How to Perform Physically Plausible Image Composition? [26.8] ShiNEは、中性化エラーを伴うシームレス、高忠実な挿入のためのトレーニング不要のフレームワークである。
我々は,低照度,強い照明,複雑な影,反射面などの多様な解像度と課題を特徴とするコンプレックスコンプレックスを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:37:53 GMT)
Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs [26.7] 日本語,英語,多言語LLMを19種類の評価ベンチマークで評価した。
英語のテキストによる学習は,日本語の学習者のスコアを向上できることがわかった。
日本語のコード生成、算術的推論、常識、読解作業の能力を高めるために、特に日本語のテキストを訓練することは不要である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:37:15 GMT)
A Hard-Label Black-Box Evasion Attack against ML-based Malicious Traffic Detection Systems [26.6] 本研究では,攻撃フローを操作するNetMasqueradeを開発した。
具体的には、Traffic-BERTと呼ばれる事前訓練モデルを構築する。
我々は、Traffic-BERTをRLフレームワークに統合し、NetMasqueradeが悪質なパケットシーケンスを効果的に操作できるようにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:24:18 GMT)
Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption [26.4] Offline-to-Online Reinforcement Learning (O2O RL)は、現実世界のRLデプロイメントにおいて有望なパラダイムとして登場した。
データ破損はポリシーの重大な振る舞いを誘発し、それによってオンライン探索の効率を大幅に低下させる。
我々は、$textbfRPEX$: $textbfR$obust $textbfP$olicy $textbfEX$pansionという新しい、シンプルで効果的なメソッドを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:59:56 GMT)
CVD-STORM: Cross-View Video Diffusion with Spatial-Temporal Reconstruction Model for Autonomous Driving [26.4] CVD-STORMは時空間再構成変分オートエンコーダ(VAE)を利用したクロスビュービデオ拡散モデルである
提案手法は,まず補助的な4次元再構成タスクでVAEを微調整し,その3次元構造と時間的ダイナミクスをエンコードする能力を向上する。
実験結果から,FIDとFVDの両指標の精度向上が得られた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:14:45 GMT)
Helmsman: Autonomous Synthesis of Federated Learning Systems via Multi-Agent Collaboration [26.3] Helmsmanは、フェデレート学習システムのエンドツーエンド合成を自動化する新しいマルチエージェントシステムである。
AgentFL-Benchは、FLにおけるエージェントシステムのシステムレベルの生成能力を評価するための新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:57:31 GMT)
Agentic Design of Compositional Machines [26.2] 大規模言語モデルが機械の創出を学べるかどうかを考察する。
BesiegeFieldは、マシンビルディングゲームBesiege上に作られたテストベッドだ。
エージェントによる最先端のLCMをベンチマークし、成功に必要な重要な機能を特定します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:58 GMT)
UniEgoMotion: A Unified Model for Egocentric Motion Reconstruction, Forecasting, and Generation [26.0] 本稿では、シーン認識動作合成に一対一のイメージを利用する2つの新しいタスクである、エゴセントリックモーション生成とエゴセントリックモーション予測を紹介する。
我々は,エゴセントリックデバイスに適した新しい頭部中心運動表現を備えた統一された条件付き運動拡散モデルUniEgoMotionを提案する。
UniEgoMotionは、自我中心の運動再構成において最先端のパフォーマンスを達成し、単一の自我中心の画像から動きを初めて生成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:19:05 GMT)
AutoRubric-R1V: Rubric-Based Generative Rewards for Faithful Multimodal Reasoning [26.0] AutoRubric-R1Vは、RLVRとプロセスレベルの監視を統合するフレームワークである。
ルーブリックベースと結果の報酬を併用することにより、AutoRubric-R1Vは6つのマルチモーダル推論ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:40:02 GMT)
Gradient-Sign Masking for Task Vector Transport Across Pre-Trained Models [25.8] 転送を成功させる鍵は、新しいモデルの勾配の符号構造にあることを示す。
理想的な勾配符号構造を近似する新しい手法であるGradFixを提案する。
視覚と言語ベンチマークにおいて大きなパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:13:33 GMT)
LOTA: Bit-Planes Guided AI-Generated Image Detection [25.7] GANとDiffusionのモデルでは、AI生成画像と実際の画像との区別がより困難になる。
ノイズの多い画像生成を誘導する有効なビットプレーンを導入し、様々な画像正規化戦略を活用する。
本手法は, GAN から Diffusion への98.2% 以上, Diffusion から GAN への99.2% 以上の精度を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:12:49 GMT)
Hopfield-Fenchel-Young Networks: A Unified Framework for Associative Memory Retrieval [25.7] ホップフィールドネットワークのような連想記憶モデルは、メモリ容量の進歩とトランスフォーマーにおける自己注意とのつながりにより、新たな関心を集めている。
本研究では,これらのモデルをより広範なエネルギー関数群に一般化する統合フレームワークであるHopfield-Fenchel-Youngネットワークを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:28:05 GMT)
On the Interaction of Compressibility and Adversarial Robustness [25.6] 我々は、ニューロンレベルの空間性やスペクトル圧縮性など、様々な形態の圧縮性が、敵の強靭性にどのように影響するかを分析する。
これらの圧縮形式は、敵が活用できる表現空間において、少数の高感度な方向を誘導できることを示す。
本研究は, 構造圧縮性とロバスト性の間に根本的緊張関係があることを示し, 効率的かつセキュアなモデル設計のための新しい経路を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:46 GMT)
LLMs are Single-threaded Reasoners: Demystifying the Working Mechanism of Soft Thinking [25.5] 大規模言語モデル(LLM)のソフト思考能力について検討する。
ソフトシンキングが多様な推論経路の並列探索を支援するという一般的な信念とは対照的に,LLMはシングルスレッドの推論として振る舞うことが明らかとなった。
我々の実験は、特にGumbel-max のトリックと無作為性がバニラアプローチの限界を緩和できることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:59:24 GMT)
KScope: A Framework for Characterizing the Knowledge Status of Language Models [25.4] LLM知識モードの整合性と正当性に基づく5つの知識状態の分類法を導入する。
次に、知識モードに関する仮説を段階的に洗練する統計テストの階層的なフレームワークであるKScopeを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:05:43 GMT)
Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents [24.8] 本稿では,研究論文をAIエージェントに変換する自動フレームワークPaper2Agentを紹介する。
Paper2Agentは、受動的アーティファクトから研究成果を、下流の使用、導入、発見を加速できるアクティブシステムに変換する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:09:17 GMT)
CAP: Evaluation of Persuasive and Creative Image Generation [24.6] 本稿では,生成した広告画像の創造性,適応性,説得性を評価するための3つの評価指標を提案する。
その結果,入力テキストが暗黙的メッセージである場合,現在のテキスト・ツー・イメージモデルは創造性,説得性,アライメントに苦慮していることがわかった。
我々は、より整合性があり、より創造的で、より説得力のある画像を生成する上で、T2Iモデルの能力を高めるためのシンプルで効果的なアプローチを導入します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:33:33 GMT)
PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model [24.4] PaddleOCR-VL-0.9Bはコンパクトだが強力な視覚言語モデル(VLM)である
NaViTスタイルの動的解像度ビジュアルエンコーダとERNIE-4.5-0.3B言語モデルを統合し、正確な要素認識を実現する。
この革新的なモデルは、109言語を効率的にサポートし、複雑な要素を認識するのに優れている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:18:48 GMT)
The ML.ENERGY Benchmark: Toward Automated Inference Energy Measurement and Optimization [24.3] エネルギーは、しばしば見落とされ、探索されていない、あるいはMLシステム構築の文脈でよく理解されていない指標である。
本稿では,現実的なサービス環境下での推論エネルギー消費を測定するためのベンチマークスイートとツールであるML$.$ENERGY Benchmarkを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:51:15 GMT)
Strategyproof Reinforcement Learning from Human Feedback [24.2] 複数のラベル付け者が戦略的にフィードバックを誤って報告できるような環境で、ヒューマンフィードバックからの強化学習について検討する。
近年の多元的手法を含む既存のRLHFアルゴリズムは,ストラテジブルではないことを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:10:09 GMT)
You May Speak Freely: Improving the Fine-Grained Visual Recognition Capabilities of Multimodal Large Language Models with Answer Extraction [24.0] nlg2choiceは、最小限の制約を持つタスクに対してMLLMにオープンな質問をする単純な2段階の手法である。
我々は、スループットを大幅に向上させるために、早期停止法を用いて、その選択を受ける制約応答の確率を計算する。
その結果,分類と検索の点から評価すると,7種類の細粒度視覚データセットに対して改善が見られた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:04:25 GMT)
LLM-ERM: Sample-Efficient Program Learning via LLM-Guided Search [24.0] LLM-ERM は、全列挙を LLM 誘導探索に置き換える提案と検証のフレームワークである。
コーディネート的にオンラインのミニバッチSGDは,特定のショートプログラムを学習するために多くのサンプルを必要とすることを示す。
これらの結果は,言語誘導型プログラム合成が有限クラスEMMの統計効率の多くを回復することを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:10:11 GMT)
A Free Lunch in LLM Compression: Revisiting Retraining after Pruning [23.9] 刈り込み後の残りの重量を復元または再訓練する際の鍵となる設計選択について検討する。
特に,各変圧器ブロック内の注意とコンポーネントを別々に再構成することは,最も資源効率が良いが,最も難易度が高い。
以上の結果から,再トレーニングはあらゆるコストで避けるべきという物語に挑戦し,再トレーニング後のパフォーマンス回復に重要な洞察を与えることができた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:43:09 GMT)
Finding Answers in Thought Matters: Revisiting Evaluation on Large Language Models with Reasoning [23.9] 本稿では,アンサー・リジェネレーション (Answer Regeneration) という基本フレームワークを提案する。
このメソッドは追加のモデル推論を使用し、プロンプト "Answer:" によってプレフィックスされた事前の入力と出力を提供する。
この抽出ルールに依存しないアプローチは、性能の向上と堅牢性の向上を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:09:22 GMT)
MetaBench: A Multi-task Benchmark for Assessing LLMs in Metabolomics [23.7] LLM(Large Language Models)は、一般的なテキストで顕著な機能を示す。
メタボロミクスは、その複雑な生化学的経路、異種識別子システム、断片化されたデータベースで固有の課題を提示する。
メタボロミクス評価のための最初のベンチマークであるMetaBenchを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:55:14 GMT)
MR.Rec: Synergizing Memory and Reasoning for Personalized Recommendation Assistant with LLMs [23.6] MR.Recは、LLM(Large Language Models)ベースのレコメンデーションのために、メモリと推論をシナジする新しいフレームワークである。
パーソナライズを実現するため、我々は、関連する外部メモリを効率よくインデックスし、検索する総合検索拡張生成システム(RAG)を開発した。
動的メモリ検索と適応推論を組み合わせることで、このアプローチはより正確でコンテキストを認識し、高度にパーソナライズされたレコメンデーションを保証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:40:48 GMT)
RLAIF-SPA: Optimizing LLM-based Emotional Speech Synthesis via RLAIF [23.5] テキスト音声合成は中性音声においてほぼ人間に近い品質を達成しているが、感情的な表現性は依然として課題である。
本稿では,AIフィードバック機構からの強化学習を取り入れたRLAIF-SPAフレームワークを提案する。
Libri 音声データセットの実験によると、RLAIF-SPA は Chat-TTS より優れており、WER は26.1%、SIM-O は9.1%、人的評価は10%以上向上している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:40:37 GMT)
Impact of Regularization on Calibration and Robustness: from the Representation Space Perspective [23.1] 近年の研究では,ソフトラベルを用いた正規化技術により画像分類精度が向上し,過信予測による誤校正が軽減されることが示されている。
本稿では、表現空間の観点から、新しい説明を提供する。
本研究は,ソフトラベルを用いたトレーニングと正規化に関連して,高次元表現空間の特性に関する新たな知見を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:38:17 GMT)
Lightweight Transformer for EEG Classification via Balanced Signed Graph Algorithm Unrolling [22.9] EEG信号は、有限グラフ内の負のエッジによってうまくモデル化される固有の反相関を持つ。
我々は、バランスの取れた符号グラフ上の信号に対するスペクトル復調アルゴリズムをアンロールすることで、軽量で解釈可能なトランスフォーマーのようなニューラルネットを構築する。
実験により,本手法は,代表的なディープラーニング手法に匹敵する分類性能が得られた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:34:31 GMT)
Latent Retrieval Augmented Generation of Cross-Domain Protein Binders [22.9] 本稿では,新規なタンパク質結合体の設計を導くために,RadiAnce (Retrieval-Augmented Diffusion for Aligned Interface) を提案する。
共用コントラスト空間における検索と生成を統一することにより,本モデルは与えられた結合部位の関連インターフェースを効率的に同定する。
我々の研究は、検索に基づく知識と生成AIの橋渡しに成功したタンパク質バインダー設計の新しいパラダイムを確立する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:55:27 GMT)
Say My Name: a Model's Bias Discovery Framework [22.8] Say My Name'(SaMyNa)は、ディープモデル内のバイアスを意味的に識別する最初のツールです。
既存の方法とは異なり、私たちのアプローチはモデルによって学習されたバイアスに焦点を当てています。
本手法は,タスク関連情報をアンタングル化し,偏見を解析するためのツールとして提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:21:49 GMT)
Group-Wise Optimization for Self-Extensible Codebooks in Vector Quantized Models [22.8] VQ-VAEは自己教師付き学習を利用して、コードブックの最も近いベクトルを用いて連続ベクトルを表現する。
既存のアプローチでは暗黙の静的コードブックを使用するか、コードブック全体を共同で最適化するが、これらの手法はコードブックの学習能力を制限している。
コードブック上でグループワイズ最適化を行うグループVQを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:26:09 GMT)
Falcon: A Remote Sensing Vision-Language Foundation Model (Technical Report) [22.6] 本稿では,リモートセンシングに適した総合的視覚言語基盤モデルであるFalconを紹介する。
Falconは、包括的で複雑なリモートセンシングタスクを効果的に実行する、統一的でプロンプトベースのパラダイムを提供する。
Falconは、画像分類、オブジェクト検出、セグメンテーション、画像キャプションなど、14の異なるタスクにわたるテキスト形式で印象的な結果を生成することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:52:13 GMT)
PIA: Deepfake Detection Using Phoneme-Temporal and Identity-Dynamic Analysis [22.5] Phoneme-Temporal and Identity-Dynamic Analysisはディープフェイク検出のための新しいフレームワークである。
言語、動的顔の動き、および制限に対処するための顔認証手段が組み込まれている。
微妙な深度変化の検出を大幅に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:51:42 GMT)
Cognitive-Aligned Spatio-Temporal Large Language Models For Next Point-of-Interest Prediction [22.4] 大規模言語モデル(LLM)は、次のPOI予測を生成的に扱うレコメンデーションシステムにおいて大きな可能性を示している。
産業規模のPOI予測アプリケーションでは、季節、気象条件、休日、利用者のプロフィールなど、世界の知識と人間の認知のアライメントを取り入れることで、ユーザエクスペリエンスを向上させることができる。
自然言語をインタフェースとして利用するフレームワークであるCoASTを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:05:28 GMT)
Generalist vs Specialist Time Series Foundation Models: Investigating Potential Emergent Behaviors in Assessing Human Health Using PPG Signals [22.4] ファンデーションモデルは、大量のデータに基づいて事前訓練された大規模な機械学習モデルである。
MOMENTのような最近の研究は、汎用時系列基礎モデルを複数のドメインのデータで訓練している。
本稿では,ジェネラリストモデルとスペシャリストモデルのパフォーマンスを比較するため,総合的なベンチマーク研究を行うことを目的とする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:13:04 GMT)
Stealthy Dual-Trigger Backdoors: Attacking Prompt Tuning in LM-Empowered Graph Foundation Models [22.3] LMを内蔵したグラフ基盤モデル(GFM)は、安全でないプロンプトチューニングフェーズにおいて、ユニークなセキュリティ脆弱性を導入する。
テキストレベルと構造レベルの両方で動作する新しいデュアルトリガーバックドアアタックフレームワークを提案する。
我々の研究は、Web をデプロイした LM 搭載 GFM における重要なバックドアリスクを強調し、オープンソースプラットフォームのためのより堅牢な監視メカニズムの開発に寄与する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:10:38 GMT)
Exploring Image Representation with Decoupled Classical Visual Descriptors [22.3] VisualSplitは、イメージを分離した古典的な記述子に明示的に分解するフレームワークである。
本手法は,様々な視覚的タスクにおいて,効果的な属性制御を本質的に促進する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:27:55 GMT)
Terrarium: Revisiting the Blackboard for Multi-Agent Safety, Privacy, and Security Studies [22.2] マルチエージェントシステムにおける安全性,プライバシ,セキュリティに関する詳細な研究のためのTerreriumフレームワークを提案する。
我々は、不正、悪意のあるエージェント、妥協通信、データ中毒などの重要な攻撃ベクターを識別する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:19:13 GMT)
Higher-order interactions of multi-layer prompt [22.2] 「プレトレイン・プロンプト」パラダイムは表現学習において成功している。
現在のプロンプトチューニング手法は、プロンプトを異なるネットワーク層にまたがる独立した独立したコンポーネントとして扱う。
本稿では,多層プロンプトの高次相互作用を明示的にモデル化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:48:27 GMT)
On the Ability of LLMs to Handle Character-Level Perturbations: How Well and How? [22.2] 本研究は, 文字レベルの頻繁な摂動に対する現代LLMの弾力性について検討する。
我々は,オンライン試験システムなどのシナリオにおけるLLM誤用を回避するために,見えないUnicode制御文字をテキストに挿入する実用的手法であるnamehortを紹介した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:59:58 GMT)
Rewind-to-Delete: Certified Machine Unlearning for Nonconvex Functions [22.2] 機械学習アルゴリズムは、スクラッチを使わずにモデルから効率的にデータを収集することを目的としている。
証明されたマシン・アンラーニングは 微分一般化に基づく 強力な理論上の保証だ
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:30:16 GMT)
Towards Generalist Intelligence in Dentistry: Vision Foundation Models for Oral and Maxillofacial Radiology [22.1] DentVFMは歯科医療用に設計された視覚基礎モデル(VFM)の最初のファミリーである。
幅広い歯科応用のためのタスク非依存の視覚表現を生成する。
それは印象的な一般知性を示し、多様な歯科作業に対する堅牢な一般化を実証している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:24:23 GMT)
Dataset Distillation for Super-Resolution without Class Labels and Pre-trained Models [22.1] ディープニューラルネットワークのトレーニングはますます需要を増し、大規模なデータセットと重要な計算リソースを必要としている。
本稿では,クラスラベルや事前学習SRモデルを必要としない画像SRに対して,新しいデータ蒸留手法を提案する。
実験結果から,本手法はトレーニングデータを大幅に削減し,計算時間を削減するとともに,最先端の性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:56:05 GMT)
MedTrust-RAG: Evidence Verification and Trust Alignment for Biomedical Question Answering [21.9] MedTrust-Guided Iterative RAGは,医療用QAにおける事実整合性と幻覚を高めるためのフレームワークである。
第一に、検索された医療文書に、すべての生成されたコンテンツを明示的に根拠付けることを要求することにより、引用認識推論を強制する。
第2に、検証エージェントが証拠の妥当性を評価する反復的な検索検証プロセスを採用する。
第3に、実証された正の例と幻覚を意識した負のサンプルを組み合わせたMedTrust-Align Moduleを統合する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:59:11 GMT)
WorldSplat: Gaussian-Centric Feed-Forward 4D Scene Generation for Autonomous Driving [21.8] 4次元駆動シーン生成のための新しいフィードフォワードフレームワークであるWorldSplatを提案する。
提案手法は,2つのステップで一貫したマルチトラック映像を効果的に生成する。
ベンチマークデータセットを用いて行った実験は、WorldSplatが高忠実で時間的に空間的に一貫した新しいビュー駆動動画を効果的に生成することを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:32:53 GMT)
Closing the Loop: An Instructor-in-the-Loop AI Assistance System for Supporting Student Help-Seeking in Programming Education [21.7] 本稿では,AI生成ヒントとエスカレーション機構を統合したハイブリッドヘルプフレームワークを提案する。
その結果、673件のAIによるヒントのうち、146件(22%)が無害と評価された。
この発見は、AIサポートが失敗した場合、専門家のインストラクターでさえ、ミスを犯すのを避けるためにもっと注意を払う必要があることを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:57:05 GMT)
DMRetriever: A Family of Models for Improved Text Retrieval in Disaster Management [21.7] DMRetrieverは、災害管理シナリオに適した、一級の高密度検索モデルである。
それは、すべてのモデルスケールで6つの検索インテントすべてにわたって、最先端(SOTA)パフォーマンスを達成する。
DMRetrieverは非常にパラメータ効率が高く、596Mモデルは13.3倍のベースラインを上回り、33Mモデルは7.6%に過ぎなかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:08:34 GMT)
When Style Breaks Safety: Defending LLMs Against Superficial Style Alignment [21.6] 大きな言語モデル(LLM)は、悪意のあるクエリを含む特定のスタイルでトリガーすることができる。
オリジナルのクエリにおけるスタイルパターンの影響は、悪意のある意図とは意味的に無関係である。
そこで本研究では,少数の安全訓練データを組み込んだ防衛戦略であるSafeStyleを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:50:23 GMT)
QDepth-VLA: Quantized Depth Prediction as Auxiliary Supervision for Vision-Language-Action Models [21.6] QDepth-VLA(QDepth-VLA)は、補助深度予測タスクによりビジョン・ランゲージ・アクション(VLA)モデルを拡張するフレームワークである。
専用深度エキスパートは、VQ-VAEエンコーダから得られた深度マップの量子化潜在トークンを予測するように設計されている。
シミュレーションベンチマークと実世界のタスクの実験結果から,QDepth-VLAは操作タスクに強い空間的推論と競合性能をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:11:18 GMT)
RDD: Retrieval-Based Demonstration Decomposer for Planner Alignment in Long-Horizon Tasks [21.3] 本稿では,デモをサブタスクに自動的に分解するデモデコンポザを提案する。
本手法は,シミュレーションおよび実世界のタスクにおいて,最先端のサブタスクデコンポーザよりも優れる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:37 GMT)
Are My Optimized Prompts Compromised? Exploring Vulnerabilities of LLM-based Optimizers [21.2] LLMに基づく即時最適化における毒性リスクの最初の体系的解析について述べる。
システムは、入力されたクエリよりも、操作されたフィードバックに対してかなり脆弱である。
本報告では, フェール・リワードの$Delta$ASR を, 実用性を低下させることなく 0.23 から 0.07 に削減する軽量ハイライトディフェンスを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:28:54 GMT)
Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth [21.1] ドライブロロジーは「深みのあるナンセンス」によって特徴づけられる言語現象である
我々は、英語、マンダリン、スペイン語、フランス語、日本語、韓国語で、1200以上の精巧にキュレートされ、多様なサンプルのベンチマークデータセットを構築した。
現在の大規模言語モデル (LLM) は,ドライブロジカルテキストの階層的意味論の理解に一貫して失敗している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:09:45 GMT)
Thinker: Learning to Think Fast and Slow [20.9] 本稿では,素早い思考,検証,スロー思考,要約の4段階を含むQAタスクの簡単な修正を紹介する。
提案課題は,Qwen2.5-1.5Bでは平均精度を25.6%から27.3%,DeepSeek-R1-Qwen-1.5Bでは45.9%から51.0%に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:20:17 GMT)
DCMIL: A Progressive Representation Learning Model of Whole Slide Images for Cancer Prognosis Analysis [20.8] 本稿では,がん予後のためのスライド画像全体を処理するプログレッシブ表現学習モデルを提案する。
このモデルは高密度アノテーションに頼らず、ギガピクセルサイズのWSIを結果予測に変換することを可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:03:54 GMT)
Learning with errors may remain hard against quantum holographic attacks [20.8] 近年の研究では、絡み合いのエントロピーはLearning with Errors (LWE)と同じくらい難しく、量子重力とAdS/CFTとの緊張を生み出すことが示されている。
これは、ホログラフィック双対を構築し、極端の表面を測定することで、LWEを解くためのパラドックス的な経路を示唆している。
ホログラフィックエントロピーは、難解なホログラフィック辞書を必要とせず、量子計算の限界と一致していることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:53:00 GMT)
From Guess2Graph: When and How Can Unreliable Experts Safely Boost Causal Discovery in Finite Samples? [20.7] このフレームワークは,専門家の推測値を用いて統計的テストのシーケンスを置き換えるのではなく,ガイドするものである。
G2G のインスタンス化は PC アルゴリズムを拡張した PC-Guess と,高品質なエキスパート入力の活用を目的とした学習拡張型 gPC-Guess の2種類である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:31:44 GMT)
Architecture Is All You Need: Diversity-Enabled Sweet Spots for Robust Humanoid Locomotion [20.4] 単純な層状制御アーキテクチャ(LCA)はモノリシックなエンド・ツー・エンドの設計よりもはるかに堅牢な性能を実現する。
結果として、ネットワークスケールや複雑性ではなく、時間スケールのアーキテクチャ的な分離が、ロバストな認識条件付きロコモーションの鍵となることが強調された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:56:08 GMT)
InfoDet: A Dataset for Infographic Element Detection [20.4] 本稿では,インフォグラフィックにおけるチャートとHROの正確なオブジェクト検出モデルの開発を支援するデータセットであるInfoDetを紹介する。
11,264件のリアルインフォグラフィックと90,000件のインフォグラフィックが含まれており、1400万以上のバウンディングボックスアノテーションがある。
1)視覚言語モデルのチャート理解性能を高めるためのThinking-with-Boxesスキームの構築,2)既存のオブジェクト検出モデルとの比較,3)ドキュメントレイアウトとUI要素検出に開発した検出モデルを適用する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:10:01 GMT)
Circuit Insights: Towards Interpretability Beyond Activations [20.2] WeightLensとCircuitLensの2つの相補的手法を提案する。
WeightLensは学習したウェイトから直接機能を解釈し、説明モデルやデータセットの必要性を取り除く。
CircuitLensは、コンポーネント間のインタラクションから機能アクティベーションがどのように発生し、回路レベルのダイナミクスを明らかにするのかをキャプチャする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:49:41 GMT)
Uncertainty Quantification for Prior-Data Fitted Networks using Martingale Posteriors [20.1] 本論文では,マルティンゲール後部に基づく推定のためのベイズ後部構造を構築するための,原理的かつ効率的なサンプリング手法を提案する。
いくつかのシミュレーションおよび実世界のデータ例は、推論応用における我々の手法の不確かさの定量化を示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:58:50 GMT)
Microwave-activated high-fidelity three-qubit gate scheme for fixed-frequency superconducting qubits [19.9] 本稿では,マイクロ波駆動型3量子ゲートプロトコルを提案する。
このプロトコルはプロセスの忠実度をデコヒーレンスの下で98%以上維持する。
この戦略は、コヒーレンス特性を改善し、スペクトルの混雑を低減し、エラー耐性量子演算の実験ツールキットを拡張することにより、スケーラブルな量子コンピューティングシステムを発展させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:09:03 GMT)
Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning [19.7] 本稿では,データ選択と再重み付けのための理論的に基礎的,資源効率のよいフレームワークを提案する。
In-Context Approximation (ICA) は、モデルが候補の例でトレーニングした後のホールドアウト損失を推定する。
モデルパラメータの進化に伴い, ICAスコアから指数重みを導出し, 勾配更新を動的に再加重する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:00:39 GMT)
MergeMoE: Efficient Compression of MoE Models via Expert Output Merging [19.6] 最近提案されたMoEモデル圧縮手法であるエキスパートマージの理論解析について述べる。
本稿では, 数学的最適化を利用して圧縮行列を構成する方法であるMergeMoEを紹介する。
我々は,MergeMoEを複数のMoEモデル上で評価し,アルゴリズムが同じ圧縮比でベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:36:40 GMT)
Byzantine Failures Harm the Generalization of Robust Distributed Learning Algorithms More Than Data Poisoning [19.6] 頑健な分散学習アルゴリズムは、労働者の不在にもかかわらず信頼性の高い性能を維持することを目的としている。
このような誤動作は、通常、$textitByzantine failures$としてモデル化され、任意に破損した通信を可能にするか、あるいはローカルなトレーニングデータに制限された、より弱い形式の汚職である$textitdata poisoning$としてモデル化される。
ビザンチンの失敗は、データ中毒で達成可能なものよりも、はるかに悪い速度で発生します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:05:21 GMT)
ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [19.5] インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。
データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、440のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。
1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:17:24 GMT)
Women, Infamous, and Exotic Beings: A Comparative Study of Honorific Usages in Wikipedia and LLMs for Bengali and Hindi [19.0] 本研究は,ヒンディー語およびベンガル語ウィキペディアの3人称名誉代名詞と動詞使用に関する最初の大規模研究である。
系統的な言語内規則性は明らかだが,言語間差は顕著である。
両言語、特にヒンディー語では、男性は女性よりも敬意をもって扱われることが多い。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:55:12 GMT)
Enhancing Time Series Forecasting through Selective Representation Spaces: A Patch Perspective [19.0] 我々は、予測のための最も情報性の高いパッチを柔軟に含めるための選択表現空間の構築の先駆者である。
本稿では,学習可能な選択パチングと動的再組み立て技術を利用した選択表現空間(SRS)モジュールを提案する。
新しいプラグイン・アンド・プレイモジュールとして、SRSは既存のパッチベースのモデルの性能を向上させることもできる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:55:06 GMT)
Stable Prediction of Adverse Events in Medical Time-Series Data [18.9] 早期事象予測(EEP)システムは、臨床意思決定を支援するための患者の差し迫ったリスクを継続的に見積もる。
本稿では,マルチモーダル入力EHR,ECG波形,臨床テキストを用いたEEPベンチマークであるCAREBenchを紹介する。
本稿では,患者ごとの短期変動を定量化し,局所リプシッツ定数に基づいて急激な振動をペナリゼーションする安定性指標を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:16:54 GMT)
Selective Labeling with False Discovery Rate Control [18.8] 我々は、AI予測を確実に信頼できるインスタンスを識別する新しい方法であるtextbfConformal Labelingを紹介する。
これは、選択されたサブセット内の誤ったラベルの割合である偽発見率(FDR)を制御することで達成される。
特に,AIモデルの予測信頼度と,AIモデルの誤ラベルによる校正インスタンスの信頼度を比較することで,各テストインスタンスに対してコンフォーマルな$p$-valueを構築する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:39:00 GMT)
Adapting Self-Supervised Representations as a Latent Space for Efficient Generation [18.7] RepTokは、単一の連続潜在トークンを使用してイメージを表現する生成モデリングフレームワークである。
RepTokは、クラス条件のImageNet生成における競合的な結果を達成し、テキストと画像の合成に自然に拡張する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:43:03 GMT)
Intent Clustering with Shared Pseudo-Labels [18.7] インテントクラスタリングのための直感的で,トレーニングのない,ラベルのない手法を提案する。
提案手法は,同一クラスタに属するテキストがより多くのラベルを共有できるという仮説に基づいている。
4つのベンチマークセットに対する評価は,本手法が最近のベースラインに匹敵する結果が得られることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:54:40 GMT)
Quantifying the Accuracy-Interpretability Trade-Off in Concept-Based Sidechannel Models [18.7] 概念ボトルネックモデル(Concept Bottleneck Models, CBNMs)は、人間の理解可能な概念のみに基づいて予測を行うボトルネック層を強制することによって、解釈可能性を提供する。
この制約は情報の流れを制限し、しばしば予測精度を低下させる。
コンセプトサイドチャネルモデル(CSM)は、ボトルネックを回避し、追加のタスク関連情報を運ぶサイドチャネルを導入することで、この制限に対処する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:37:20 GMT)
Tackling Time-Series Forecasting Generalization via Mitigating Concept Drift [18.6] 時系列における分布シフトは,概念のドリフトと時間シフトの2種類に比例する。
そこで我々は,まず時間シフトに対処し,一貫したアプローチでコンセプトドリフトを実現するための手法に依存しないフレームワークであるShifTSを紹介した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:48:52 GMT)
Watermarking for Factuality: Guiding Vision-Language Models Toward Truth via Tri-layer Contrastive Decoding [18.4] 本稿では,透かしを用いた3層コントラスト復号法を提案する。
本手法は,LVLMにおける幻覚の低減に有効な手法であることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:58:45 GMT)
Virtually Being: Customizing Camera-Controllable Video Diffusion Models with Multi-View Performance Captures [18.2] 本稿では,映像拡散モデルにおける多視点キャラクタ一貫性と3Dカメラ制御の両立を可能にするフレームワークを提案する。
我々は、このデータに基づいて、最先端のオープンソースビデオ拡散モデルを微調整し、強力なマルチビューID保存を提供する。
私たちのフレームワークは、マルチオブジェクト生成を含む、仮想プロダクションのコア機能もサポートしています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:20:57 GMT)
Subspace-Boosted Model Merging [18.2] Subspace Boostingは、最大20のエキスパートモデルのマージ効率を10%以上の大きなマージンで向上させる。
本稿では,タスク類似性の定量化に高次一般化特異値分解を用いることを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:54:16 GMT)
Learnable Mixed Nash Equilibria are Collectively Rational [17.9] 等安定性は, 漸進的スムーズな最適応答ダイナミクスの族に対する最終点収束挙動を決定することを示す。
社会的に非効率な解に安定化できる厳密な平衡に関する力学とは異なり、混合ナッシュ平衡の近傍での個別に実用性を求める挙動は合理性をもたらす。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:25:32 GMT)
Issue2Test: Generating Reproducing Test Cases from Issue Reports [17.9] 問題を解決するための重要なステップは、問題を正確に再現するテストケースを作成することです。
本稿では,所与の課題報告に対する再生テストケースを自動生成するLLMベースの手法である Issue2Test を提案する。
SWT-bench-lite データセット上での Issue2Test の評価を行い,32.9% の問題を再現した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:45:00 GMT)
Protenix-Mini+: efficient structure prediction model with scalable pairformer [17.8] Protenix-Mini+はProtenixモデルの軽量でスケーラブルなバージョンである。
許容範囲のパフォーマンス劣化の範囲内では、計算効率を大幅に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:57:03 GMT)
A Geometric Approach to Optimal Experimental Design [17.6] 最適設計のための新しい幾何学的枠組み(OED)を提案する。
最適輸送理論に基づく統計的依存の尺度である相互輸送依存(MTD)を提案する。
我々のフレームワークは、標準的な情報理論技術に代わる柔軟な代替手段を提供しながら、高品質な設計を実現することを実証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:20:14 GMT)
PathFix: Automated Program Repair with Expected Path [17.5] バグのあるコードを修正するパッチを生成するために,PathFixという新しいAPR手法を導入する。
バグのあるプログラムが修正可能であれば、少なくとも1つの期待されたパスが、パッチされたプログラムの障害パスを置き換えることになっている。
実験結果から、PathFixは、特に複雑なプログラム構造を扱う場合、既存のソリューションよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:21:49 GMT)
TAI3: Testing Agent Integrity in Interpreting User Intent [17.5] LLMエージェントは、自然言語命令を通じてAPIを呼び出すことによって、現実世界のタスクを自動化するために、ますます多くデプロイされている。
従来のソフトウェアテストでは、構造化された入力を前提としており、自然言語のあいまいさを扱うには不足している。
LLMエージェントの意図的整合性違反を体系的に発見する,API中心のストレステストフレームワークであるTAI3を紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:20:27 GMT)
Talking Points: Describing and Localizing Pixels [17.4] 画素レベルのグラウンド化のための新しいフレームワークを提案する。
このフレームワークは2つの補完的なコンポーネントで構成されている: 個々のキーポイントのリッチで文脈的な記述を生成するポイント記述子と、これらの記述から正確なピクセル座標を回帰するポイントローカライザである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:42:03 GMT)
ECG-Soup: Harnessing Multi-Layer Synergy for ECG Foundation Models [17.4] 心電図のためのトランスフォーマーベース基礎モデル(ECG)は、近年、多くの下流アプリケーションで顕著な性能を達成している。
ECGは心臓病の診断と治療に用いられる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:44:20 GMT)
An Information Asymmetry Game for Trigger-based DNN Model Watermarking [17.3] トリガーベースの透かし方式は、ホストDNNにトリガーを埋め込むことで著作権保護を実現する。
我々は、この相互作用を情報非対称性の条件下でゲームとしてモデル化する。つまり、ディフェンダーは秘密の透かしをプライベートな知識で埋め込むが、攻撃者は透かしモデルにアクセスして除去を求めることができる。
実験により, 透かしモデルの有効性が示され, 疎透かしは, 無視できる精度の損失で除去に抵抗できることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:55:33 GMT)
SoK: Evaluating Jailbreak Guardrails for Large Language Models [17.2] 大規模言語モデル(LLM)のためのジェイルブレイクガードレールの総合解析について紹介する。
6つの主要な次元に沿ってガードレールを分類する新しい多次元分類法を提案する。
広範囲な分析と実験により,既存のガードレールアプローチの強度と限界を明らかにした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:15:42 GMT)
Adaptive Budget Allocation for Orthogonal-Subspace Adapter Tuning in LLMs Continual Learning [16.9] 大規模言語モデル(LLM)は、連続学習(CL)のシナリオにおいて破滅的な忘れ方に悩まされることが多い。
LLMにおける継続学習のためのパラメータ効率の高い新しい手法であるOA-Adapterを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:03:22 GMT)
Synergistic Integration and Discrepancy Resolution of Contextualized Knowledge for Personalized Recommendation [16.8] ユーザ固有のコンテキスト知識の埋め込みを動的に構築するエンドツーエンドフレームワークであるCoCoを紹介する。
本手法は,適応的知識融合と矛盾分解モジュールによる意味的・行動的潜在次元の深い統合を実現する。
モジュラー設計とモデルに依存しないアーキテクチャにより、CoCoは次世代レコメンデーションシステムに汎用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:16:21 GMT)
On Theoretical Interpretations of Concept-Based In-Context Learning [16.8] In-Context Learning (ICL)は、自然言語処理と大規模言語モデル(LLM)アプリケーションにおいて重要な新しいパラダイムとして登場した。
本稿では,概念ベースICL (CB-ICL) と呼ばれる,特定のICLアプローチについて検討することを目的とする。
特に,CB-ICL を ICL タスクに適用するための理論的解析法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:50:52 GMT)
Large Reasoning Embedding Models: Towards Next-Generation Dense Retrieval Paradigm [16.8] 本稿では、推論過程を表現学習に統合するLarge Reasoning Embedding Model(LREM)を提案する。
難解なクエリに対して、LREMはまず、元のクエリの深い理解を達成するために推論を行い、その後、検索のための推論拡張クエリ埋め込みを生成する。
この推論プロセスは、元のクエリとターゲットアイテム間のセマンティックギャップを効果的にブリッジし、検索精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:37:39 GMT)
Less is More: Denoising Knowledge Graphs For Retrieval Augmented Generation [16.7] 本稿では,DEG-RAG(Denoized Knowledge Graphs for Retrieval Augmented Generation)を紹介する。
LLM生成知識グラフの難解化問題に対処するフレームワークである。
グラフのサイズを大幅に削減し、問合せ性能を継続的に改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:41:44 GMT)
Beyond Seeing: Evaluating Multimodal LLMs on Tool-Enabled Image Perception, Transformation, and Reasoning [16.7] MLLMのビジュアルツール利用推論ベンチマークであるVisualToolBenchを紹介する。
VisualToolBenchは、複雑な視覚的テキストタスクに対するMLLMの知覚、変換、推論能力について、厳格に評価している。
評価の結果,現在のMLLMは視覚と汎用ツールの効果的な統合を必要とするタスクに苦慮していることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:41:28 GMT)
Exploring the Noise Robustness of Online Conformal Prediction [16.6] 本研究では,一様ラベル雑音下でのオンラインコンフォメーション予測のロバスト性について検討する。
本稿では,新しいロバストなピンボール損失で閾値を更新することで,ノイズロバストオンラインコンフォーマル予測(NR-OCP)を提案する。
理論解析により,NR-OCPは一定の学習率と動的学習率の両方のスケジュールのカバレッジギャップをなくすことが示されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:37:37 GMT)
GOPLA: Generalizable Object Placement Learning via Synthetic Augmentation of Human Arrangement [16.5] GOPLAは、拡張された人間のデモンストレーションから一般化可能なオブジェクト配置を学ぶ階層的なフレームワークである。
データ不足を克服するため、私たちは、人間の配置デモを多様な合成トレーニングデータに拡張するスケーラブルなパイプラインを導入しました。
提案手法は, 位置決め精度と身体的妥当性を指標として, ランナアップよりも30.04ポイントの配置成功率を向上する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:38:14 GMT)
LiRA: Linguistic Robust Anchoring for Cross-lingual Large Language Models [16.5] LiRA(Linguistic Robust Anchoring for Large Language Models)は、低リソース条件下での言語間表現を改善するトレーニングフレームワークである。
東南アジア5言語と東南アジア2言語を対象とした多言語製品検索データセットを作成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:08:24 GMT)
Best-of-Both Worlds for linear contextual bandits with paid observations [16.1] 本稿では,この問題に対する計算効率の良いBest-of-Both-Worldsアルゴリズムを提案する。
また, 逆数設定では$Theta(T2/3)$のミニマックス最適後悔を達成し, 複数対数的後悔を(破損した)レジームで保証することを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:06:32 GMT)
Structured Universal Adversarial Attacks on Object Detection for Video Sequences [15.8] ビデオに基づく物体検出は、安全クリティカルなアプリケーションにおいて重要な役割を果たす。
本稿では,ビデオオブジェクト検出に適した最小歪みのユニバーサル・ディベサール・アタックを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:00:41 GMT)
An Advanced Two-Stage Model with High Sensitivity and Generalizability for Prediction of Hip Fracture Risk Using Multiple Datasets [15.8] 股関節骨折は、高齢者の障害、死亡、医療負担の主な原因である。
DXA TスコアとFRAXは感度を欠くことが多く、高いリスクで個人を逃がす。
臨床および画像情報を統合して予測精度を向上させる2段階連続モデルを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:44:51 GMT)
AvatarSync: Rethinking Talking-Head Animation through Phoneme-Guided Autoregressive Perspective [15.7] AvatarSyncは音素表現の自己回帰フレームワークであり、単一の参照画像からリアルなトーキングヘッドアニメーションを生成する。
AvatarSyncは,視覚的忠実度,時間的整合性,計算効率において,既存のトーキングヘッドアニメーション手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:37:59 GMT)
Improving Clinical Dataset Condensation with Mode Connectivity-based Trajectory Surrogates [15.7] State-of-the-art data condensation (DC)は、プライバシを保存する合成データセットの作成を可能にする。
DC法は、実データおよび合成データに基づいて訓練されたモデルのトレーニングダイナミクスを整列させることにより、合成データを監督する。
これらの制約に対処するため、全SGD軌道をスムーズで低損失なパラメトリックサロゲートに置き換える。
これらのモード接続経路は、勾配を安定化し、収束を加速し、密度の高い軌道記憶の必要性を排除する、ノイズフリーで低曲率の監視信号を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:34:15 GMT)
Multi-level Reliable Guidance for Unpaired Multi-view Clustering [15.6] Unpaired Multi-view Clustering (UMC) は、複数のビューにまたがって観察されるアンペア化サンプルを用いて、効果的なジョイントクラスタリングを実現することを目的としている。
マルチレベルクラスタリングと信頼性の高いビューガイダンスを統合したMRG-UMC(Multi-level Reliable Guidance for UMC)を提案する。
MRG-UMCは最先端のUMC法よりも優れており、マルチビューデータセットで平均12.95%のNMI改善を実現している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:45:00 GMT)
Beyond the Surface: Enhancing LLM-as-a-Judge Alignment with Human via Internal Representations [15.5] LAGERは「LLM-as-a-Judge」評価と人間のスコアとのアライメントを改善するためのフレームワークである。
本研究では,Frask,HelpSteer,BIGGenの標準アライメントベンチマークをSpearman相関を用いて評価し,LAGERが最高のベースラインに対して最大7.5%の改善を実現していることを確認した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:16:18 GMT)
BinCtx: Multi-Modal Representation Learning for Robust Android App Behavior Detection [15.0] 我々は,グローバルバイトコード・アズ・イメージ・ビューからアプリのマルチモーダル表現を構築する学習手法であるBINCTXを提案する。
現実世界のマルウェアや良性アプリでは、BINCTXは94.73%のマクロF1を獲得し、少なくとも14.92%の強いベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:29:06 GMT)
GraphLand: Evaluating Graph Machine Learning Models on Diverse Industrial Data [14.8] GraphLandは、さまざまな産業アプリケーションからノードプロパティを予測するための14のグラフデータセットのベンチマークである。
さまざまなサイズ、構造特性、特徴セットを持つ幅広いグラフ上で、すべて統一された設定でグラフMLモデルを評価することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:45:31 GMT)
Ponimator: Unfolding Interactive Pose for Versatile Human-human Interaction Animation [14.6] 密接な確率的な人間と人間の対話的なポーズは、相互作用のダイナミクスに関する豊富な文脈情報を伝達する。
Ponimatorはインタラクティブなポーズに固定されたフレームワークで、多目的なインタラクションアニメーションを提供する。
Ponimatorは、画像ベースのインタラクションアニメーション、リアクションアニメーション、テキスト対インタラクション合成など、さまざまなタスクをサポートする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:56 GMT)
Never too Prim to Swim: An LLM-Enhanced RL-based Adaptive S-Surface Controller for AUVs under Extreme Sea Conditions [14.5] 大規模言語モデル(LLM)強化学習(RL)に基づくAUV用適応S面制御
マルチモーダルおよび構造化された明示的なタスクフィードバックを用いることで、LLMは共同調整を可能にし、複数の目的をバランスさせ、タスク指向のパフォーマンスと適応性を高める。
提案したコントローラでは、RLポリシは、S面コントローラが制御信号に変換するタスク指向の高レベルコマンドを出力する、上層タスクに重点を置いている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:33:20 GMT)
Rethinking Schema Linking: A Context-Aware Bidirectional Retrieval Approach for Text-to-SQL [14.4] 本稿では,スキーマリンクを独立した問題として扱う,コンテキスト対応の双方向スキーマ検索フレームワークを提案する。
提案手法は,テーブル優先検索と列選択,列優先検索とテーブル選択の2つの相補的戦略を組み合わせる。
提案手法は,完全なスキーマ設定と完全なスキーマ設定のギャップを50%縮小する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:46:22 GMT)
FUSE-Traffic: Fusion of Unstructured and Structured Data for Event-aware Traffic Forecasting [14.2] 都市化が進むにつれ、交通渋滞が増大し、信頼性と応答性のある予測モデルの必要性が強調された。
ディープラーニング、特にグラフニューラルネットワーク(GNN)は、トラフィック予測の主流パラダイムとして現れています。
これらのアプローチには、洗練されたグラフ畳み込み構造と時間的モデリング機構が組み込まれている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:33:43 GMT)
BalanceGS: Algorithm-System Co-design for Efficient 3D Gaussian Splatting Training on GPU [14.1] 3DGSは有望な3D再構築技術として登場した。
3DGSの効率的なトレーニングのためのアルゴリズムとシステムの共同設計である BalanceGS を紹介する。
提案手法は、NVIDIA A100 GPUにおける1.44$timesのトレーニングスピードアップを実現し、品質劣化を無視できる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:16:58 GMT)
Attention-Aided MMSE for OFDM Channel Estimation: Learning Linear Filters with Attention [13.9] 本稿では,アテンション変換器を用いて最適MMSEフィルタを学習するアテンション支援型MMSEを提案する。
チャネル推定のための1つの線形演算を通してチャネルを推定し、推論中に非線形なアクティベーションを除去する。
広帯域の信号-雑音比(SNR)条件で正規化されたMMSEの点で、他のベースライン法よりも一貫して優れる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:28:28 GMT)
GemiRec: Interest Quantization and Generation for Multi-Interest Recommendation [13.8] 本稿では,多目的レコメンデーションのためのフレームワークレベルの改良であるGemiRecを提案する。
a)興味辞書保守モジュール(IDMM)は、共有量子化関心辞書を維持し、(b)多関心後配電モジュール(MIPDM)は、ユーザ将来の関心の分布をキャプチャするために生成モデルを使用し、(c)多関心検索モジュール(MIRM)は、複数のユーザ関心表現を使用してアイテムを検索する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:37:15 GMT)
SPICE: A Synergistic, Precise, Iterative, and Customizable Image Editing Workflow [13.8] 任意の解像度とアスペクト比を受け入れ、ユーザの要求を正確に追従し、100以上の編集ステップで画像品質を一貫して改善する、トレーニング不要のワークフローであるSPICEを紹介する。
挑戦的なリアルなイメージ編集データセットでは、SPICEは最先端のベースラインを定量的に上回り、人間のアノテータに一貫して好まれる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:37:21 GMT)
The Role of Social Learning and Collective Norm Formation in Fostering Cooperation in LLM Multi-Agent Systems [13.6] 我々は、明確な報酬信号を取り除き、文化進化機構を組み込むCPRシミュレーションフレームワークを導入する。
環境および社会的初期化のグリッドである2時間2ドルの標準的進化について検討する。
本研究は,協調の維持と規範形成における系統的モデルの違いを明らかにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:59:31 GMT)
Measuring and Mitigating Identity Bias in Multi-Agent Debate via Anonymization [13.6] マルチエージェント討論(MAD)は、複数のエージェントが回答を交換し、意見を集約することで、大規模言語モデル(LLM)推論を改善することを目的としている。
しかし最近の研究では、エージェントは中立的ではないことが明らかになっている。
我々は、MADにおけるアイデンティティバイアスを緩和し定量化するために、梅毒と自己バイアスを結合する最初の原則的枠組みを提示する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:43:28 GMT)
Attention Surgery: An Efficient Recipe to Linearize Your Video Diffusion Transformer [13.5] トランスフォーマーベースのビデオ拡散モデル(VDM)は、最先端のビデオ生成の品質を提供するが、自己注意の二次コストに制約される。
我々は,訓練前のVDMの注意をスクラッチからトレーニングすることなくリニアライズあるいはハイブリダイズするための効果的なフレームワークである注意外科を紹介した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:51:39 GMT)
Fast spectral separation method for kinetic equation with anisotropic non-stationary collision operator retaining micro-model fidelity [13.5] 分子動力学シミュレーションから学習した1成分プラズマに対するデータ駆動衝突演算子を提案する。
提案した演算子は、粒子相関を考慮に入れた異方性非定常衝突カーネルを特徴とする。
数値実験により,提案モデルが適度に結合された状態下でのプラズマ力学を正確に捉えることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:27:03 GMT)
LiteStage: Latency-aware Layer Skipping for Multi-stage Reasoning [13.4] 多段階推論のための遅延対応層スキップフレームワーク LiteStage を提案する。
実験の結果、LiteStageは4.0%未満の精度で最大1.70倍のスピードアップを達成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:37:39 GMT)
AI-generated Essays: Characteristics and Implications on Automated Scoring and Academic Integrity [13.4] 我々は、人気のある大言語モデル(LLM)によって生成されるエッセイの特徴と品質を検証し、ベンチマークする。
本研究は,既存の自動スコアリングシステムの限界を強調し,改善すべき領域を特定した。
LLMの多種多様さがAI生成エッセイの検出の可能性を損なう可能性があるという懸念にもかかわらず、我々の研究結果は、あるモデルから生成されたエッセイに基づいて訓練された検出器が、高い精度で他人のテキストを識別できることをしばしば示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:36:57 GMT)
Defending Diffusion Models Against Membership Inference Attacks via Higher-Order Langevin Dynamics [13.2] 生成人工知能アプリケーションの最近の進歩は、新しいデータセキュリティの懸念を提起している。
本稿では,メンバーシップ推論攻撃に対する拡散モデルを守ることに焦点を当てる。
補助変数の存在は、拡散過程の早い段階で機密入力データを破損させるのに役立つ外部ランダムネスを混合する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:00:29 GMT)
End-to-End Learning Framework for Solving Non-Markovian Optimal Control [13.2] 本稿では、FOLTIシステムのための革新的なシステム識別方法制御戦略を提案する。
また、最初のエンドツーエンドデータ駆動学習フレームワークであるFractional-Order Learning for Optimal Control(FOLOC)も開発しています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:31:20 GMT)
Disaster Management in the Era of Agentic AI Systems: A Vision for Collective Human-Machine Intelligence for Augmented Resilience [13.2] Disaster Copilotは、これらのシステム的課題を克服するために設計された、マルチエージェント人工知能システムのビジョンである。
提案アーキテクチャでは,予測リスク分析,状況認識,影響評価といった重要な領域を専門とする,多様なサブエージェントの調整に,中央オーケストレータを使用している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:02:10 GMT)
Uncertainty Quantification with the Empirical Neural Tangent Kernel [13.1] トレーニング終了時のオーバーパラメータ化ネットワークに対するポストホックサンプリングに基づくUQ手法を提案する。
提案手法は,(確率的な)勾配-発散サンプリング法を用いて,効率的かつ有意義な深層アンサンブルを構築する。
提案手法は,複数の要因によるコスト削減の計算効率において,競合するアプローチよりも優れるだけでなく,回帰処理と分類処理の両方において,様々なUQ指標の最先端性能を維持できることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:54:00 GMT)
Parameter Identification for Partial Differential Equation with Jump Discontinuities in Coefficients by Markov Switching Model and Physics-Informed Machine Learning [13.1] 本研究では,物理インフォームド・ディープ・ラーニングとベイズ推論を統合した新しいフレームワークを提案する。
不連続なパラメータ空間における混合構造を特定するために、複素時間系の隠れ状態遷移を捉えるためにマルコフ力学法を用いる。
本研究では,不連続なパラメータ構造を持つPDEに対するパラメータ同定の一般化可能な計算手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:12:26 GMT)
Identity-GRPO: Optimizing Multi-Human Identity-preserving Video Generation via Reinforcement Learning [13.0] Identity-GRPOは、マルチヒューマンアイデンティティ保存ビデオ生成のための人間のフィードバック駆動最適化パイプラインである。
VACE と Phantom を大幅に向上させるマルチヒューマン一貫性のためのGRPO バリアントを採用している。
実験の結果、Identity-GRPOはベースラインメソッドよりも最大で18.9%向上していることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:13:56 GMT)
Beyond a Single Perspective: Towards a Realistic Evaluation of Website Fingerprinting Attacks [13.0] Webサイトフィンガープリント(WF)は、暗号化されたトラフィックのパターンを利用して、ユーザーが訪問したウェブサイトを推測する。
WF技術は制御された実験環境で90%以上の精度を達成する。
本稿では,様々な現実的条件下でのWF攻撃の系統的および包括的評価について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:14:17 GMT)
Spend Wisely: Maximizing Post-Training Gains in Iterative Synthetic Data Bootstrapping [12.9] 予算配分戦略を解析するための理論的枠組みを開発する。
定常的な政策は高い確率で収束せず、一方で、特に指数関数的な成長政策が顕著な理論的優位性を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:12:13 GMT)
On the Identifiability of Tensor Ranks via Prior Predictive Matching [12.7] 本稿では,事前の予測モーメントマッチングに基づいて,確率テンソルモデルのランク識別可能性を決定するための厳密なアプローチを提案する。
我々は、ランク識別可能性とそのようなシステムの可解性の間に等価性を確立する。
観測されたデータのみのモーメントに基づいて、明示的なクローズドフォームランク推定器を導出する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:13:45 GMT)
SMOTE and Mirrors: Exposing Privacy Leakage from Synthetic Minority Oversampling [12.7] 我々は、SMOTE(Synthetic Minority Over-Sampling Technique)において、プライバシリークに関する最初の体系的研究を行う。
DistinSMOTEは、拡張データセットの合成レコードと完全に区別するものであり、ReconSMOTEは、完全な精度で合成データセットから実際のマイノリティレコードを再構築する。
我々の研究は、SMOTEが本質的に非私的であり、不公平にマイノリティな記録を公開していることを明らかにし、プライバシーに敏感なアプリケーションでの使用を再考する必要性を強調している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:55:46 GMT)
Detecting Early and Implicit Suicidal Ideation via Longitudinal and Information Environment Signals on Social Media [12.6] ソーシャルメディア上では、自殺観念(SI)を経験している多くの人は、その苦悩を明示的に明らかにしていない。
本研究では,ユーザの情報環境をモデル化する計算フレームワークを開発し,その長手姿勢履歴と近親者の談話の両方から構成する。
Redditで1000人(500ケースと500コントロール)を対象にした調査では、個人のみのベースラインよりも早期かつ暗黙的なSI検出が15%向上した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:09:14 GMT)
EMAC+: Embodied Multimodal Agent for Collaborative Planning with VLM+LLM [12.5] 我々は,LLMとVLMを協調的に統合するEmbodied Multimodal AgentであるEMAC+を紹介する。
既存の方法とは異なり、EMAC+は低レベルの視覚制御タスクを実行するVLMからのリアルタイムフィードバックを使用して、高レベルのテキストプランを動的に洗練する。
EMAC+は、ノイズの多い観察と効率的な学習に対して優れたタスクパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:38:12 GMT)
TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.5] TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:37:40 GMT)
Causality Enhancement for Cross-Domain Recommendation [12.3] ドメイン間のレコメンデーションはレコメンデーションシステムにおいて重要な要素となる。
本稿ではCE-CDRという因果拡張フレームワークを提案する。
理論的にバイアスのない部分的ラベル因果損失を導出し、バイアス付き因果認識データセットを超えて一般化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:54:46 GMT)
Are LLMs Stable Formal Logic Translators in Logical Reasoning Across Linguistically Diversified Texts? [12.3] SoLTは、推論データセットを複数のレベルにわたって多様だが等価な形式に論理的に書き換えるベンチマークである。
また、MenTaLを提案する。これは、翻訳中に概念記号マッピングテーブルを構築するために、モデルを明示的にガイドする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:20:19 GMT)
Revisiting Prompt Optimization with Large Reasoning Models-A Case Study on Event Extraction [12.3] DeepSeek-R1やOpenAI o1のような大きな推論モデル(LRM)は、様々な推論タスクにおいて顕著な能力を示している。
中間的な思考を創造し、推論する強力な能力は、人間の指示を解釈するために、より広範な急進的な工学や最適化をもはや必要としないかもしれないという議論につながった。
本研究では,イベント抽出の構造化課題を事例スタディとして,このオープンな質問を体系的に研究することを目的とする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:27:26 GMT)
Sentence Smith: Controllable Edits for Evaluating Text Embeddings [12.2] コントロール可能で透明なテキスト生成は、NLPの長年の目標である。
近代的な監視と安全機構を用いて、現在の手法がいかにこの目標に近づいたかを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:43:14 GMT)
Approximation Rates for Shallow ReLU$^k$ Neural Networks on Sobolev Spaces via the Radon Transform [12.2] 我々は,ReLU$k$アクティベーション関数がソボレフ空間からの関数をいかに効率的に近似できるかという問題を考察する。
例えば、$qleq p$, $pgeq 2$, $s leq k + (d+1)/2$ などである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:03:54 GMT)
Assessing Socio-Cultural Alignment and Technical Safety of Sovereign LLMs [12.2] 主権 LLM に関する世界的な議論は、政府が独自の社会文化的・歴史的文脈に合わせて LLM を開発する必要性を強調している。
主権的LLMの社会的文化的要素を抽出・評価するための分析的枠組みを提案する。
低リソース言語をサポートする上で,主権的なLLMが重要な役割を担っている一方で,これらのモデルがターゲットユーザに提供するという一般的な主張を常に満たしている訳ではない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:17:44 GMT)
Modified logarithmic Sobolev inequalities for CSS codes [12.2] 量子ギブズ状態におけるドブルシン・スロースマン型の条件は、システムサイズが一様であるような変化した対数的ソボレフ不等式を意味することを示す。
その結果、2次元のトーリック符号の任意の正の温度での急激な熱化と3次元のトーリック符号のスター部分の3次元での高速な熱化が示され、これらのモデルに格納された量子情報が急速に失われることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:04:07 GMT)
Regularizing Extrapolation in Causal Inference [12.1] 我々は外挿のレベルを直接罰する統一的な枠組みを提案する。
最悪の外挿誤差を導出し、新しい「バイアスバイアス分散」トレードオフを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:37:40 GMT)
A Comprehensive Review of Recommender Systems: Transitioning from Theory to Practice [12.0] Recommender Systems(RS)は、パーソナライズされたアイテムの提案を提供することで、ユーザーエクスペリエンスを高める上で重要な役割を果たす。
この調査は、2017年から2024年までのRSの進歩を包括的にレビューする。
この調査の第一の目的は、理論を実践と橋渡しすることである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:31:30 GMT)
Revisit Modality Imbalance at the Decision Layer [11.9] マルチモーダル学習は、異なるモーダルからの情報を統合し、モデル性能を向上させる。
しばしばモダリティの不均衡に悩まされ、ジョイント最適化の間、支配的なモダリティは弱いモダリティを覆い隠す。
本稿では,表現学習において,このような不均衡が生じるだけでなく,決定層にも顕著に現れることを明らかにする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:11:24 GMT)
Sequential Comics for Jailbreaking Multimodal Large Language Models via Structured Visual Storytelling [11.9] MLLM(Multimodal large language model)は、優れた能力を示すが、ジェイルブレイク攻撃の影響を受けない。
本研究では,最新のMLLMにおける安全アライメントを回避するために,連続的な漫画スタイルの視覚的物語を活用する新しい手法を提案する。
攻撃成功率は平均83.5%であり, 先行技術の46%を突破した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:30:26 GMT)
EDIT: Enhancing Vision Transformers by Mitigating Attention Sink through an Encoder-Decoder Architecture [11.9] EDIT(Encoder-Decoder Image Transformer)は、Vision Transformerモデルで観測される注目シンク現象を軽減するために設計された新しいアーキテクチャである。
EDITはシーケンシャル・アテンション・マップを通じて自然に解釈可能であり、キー画像の特徴に焦点を絞った洗練されたレイヤー・バイ・レイヤを描いている。
ImageNet-1kとImageNet-21kの実験は、転送学習タスクとともに、EDITがDeiT3モデルよりも一貫したパフォーマンス改善を実現していることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:43:03 GMT)
Just One Layer Norm Guarantees Stable Extrapolation [11.8] 我々は、収束まで訓練された無限大のニューラルネットワークを解析するために、ニューラルカーネル・タンジェント(NTK)理論を適用することで、一般的な結果を証明した。
トレーニングデータから離れた入力においても、少なくとも1つのLNを持つ無限に広いネットワークの出力が有界であることを示す。
我々は、トレーニング中に見られたものよりも大きいタンパク質の残基サイズを予測し、トレーニングセットから欠落した少数民族の顔画像から年齢を推定するなど、現実世界の意義を探究する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:34:44 GMT)
MatchAttention: Matching the Relative Positions for High-Resolution Cross-View Matching [11.6] クロスビューマッチングは、基本的にクロスアテンション機構によって達成される。
本稿では,相対的な位置と動的に一致する注意機構であるMatchAttentionを提案する。
提案したモデルは、KITTI 2012、KITTI 2015、ETH3D、Springフローデータセット上での最先端のパフォーマンスも達成している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:21:28 GMT)
A Hybrid, Knowledge-Guided Evolutionary Framework for Personalized Compiler Auto-Tuning [11.5] 本稿では,ハイブリッドな知識指導型進化的フレームワークを提案する。
このフレームワークは、大規模なオフライン分析フェーズから抽出した知識を用いて、オンラインでパーソナライズされた最適化をインテリジェントにガイドする。
オンラインの段階では、Bespokeの遺伝的アルゴリズムは、特別に設計された知識を注入した遺伝オペレーターを通じて、この豊富な知識ベースを活用する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:31:40 GMT)
To Err Is Human; To Annotate, SILICON? Reducing Measurement Error in LLM Annotation [11.5] 大規模言語モデル(LLM)は、人間のアノテーションに代わる費用対効果の高いスケーラブルな代替を約束する。
LLMアノテーションから測定誤差を体系的に低減するSILICON手法を開発した。
この証拠は,各エラー源の削減が必要であり,SILICONは管理研究において厳密なアノテーションをサポートしていることを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:12:35 GMT)
DOS: Directional Object Separation in Text Embeddings for Multi-Object Image Generation [11.4] 本稿では,3種類のCLIPテキスト埋め込みを,テキスト・ツー・イメージ・モデルに渡す前に修正するDOS(Directional Object separation)を提案する。
実験の結果,DOS は多目的画像生成の成功率を一貫して改善し,オブジェクトの混合を減少させることがわかった。
これらの結果は、多目的画像生成を改善するための実用的で効果的なソリューションとしてDOSを強調している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:17:23 GMT)
Natural Language Processing RELIES on Linguistics [11.4] 言語学がNLPに寄与する6つの主要な面を包含する頭字語RELIESを論じる。
このリストは徹底的なものではないし、言語学もこれらのテーマの下でのあらゆる努力の主点ではない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:35:21 GMT)
MimicKit: A Reinforcement Learning Framework for Motion Imitation and Control [11.4] MimicKitは、モーション模倣と強化学習を使用してモーションコントローラをトレーニングするためのオープンソースのフレームワークである。
一般的なモーションアニメーション技術とRLアルゴリズムの実装を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:41:08 GMT)
PRISM: Agentic Retrieval with LLMs for Multi-Hop Question Answering [11.0] 本稿では,大規模言語モデル(LLM)を構造化ループで活用し,高い精度で関連する証拠を検索するエージェント検索システムを提案する。
我々のフレームワークは3つの専門的なエージェントで構成されている: マルチホップ質問をサブクエストに分解する質問アナライザ、サブクエスト毎に最も関連性の高いコンテキストを特定するセレクタ、そして、欠けている証拠をもたらすアダである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:02:29 GMT)
Lost in the Averages: A New Specific Setup to Evaluate Membership Inference Attacks Against Machine Learning Models [10.9] メンバーシップ推論攻撃(MIA)は、合成データジェネレータと機械学習モデルのプライバシーリスクを推定する標準的な方法である。
我々は、現実的な仮定の下で攻撃者を評価するのによく使われる、記録固有のプライバシーゲームを分析した。
これは、レコードの一部であるデータセットがレコードのリスクに影響を与えないことを暗黙的に仮定していることを示している。
本稿では,既存の作業において差分プライバシ保証の監査にのみ使用される「取り外しゲーム」の新たな利用法を提案し,これを「テキスト・モデル・シードゲーム」と呼ぶ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:17:06 GMT)
Prediction-Specific Design of Learning-Augmented Algorithms [10.9] 予測固有の性能基準は、一貫性と堅牢性という粗い概念よりも大きな性能改善を可能にすることを示す。
我々は,強最適化アルゴリズムを体系的に設計できる汎用的な二段階最適化フレームワークを開発した。
この結果から,予測固有で強い最適化アルゴリズムは,様々なオンライン意思決定環境における性能を著しく向上させることができることが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:06:53 GMT)
Vector Quantization in the Brain: Grid-like Codes in World Models [10.9] グリッドライクなコード量子化(GCQ)は、アトラクタ力学におけるグリッドライクなパターンを用いて、観察・行動シーケンスを離散表現に圧縮する脳のような方法である。
GCQは、GCQが共同で空間と時間を圧縮し、統一された世界モデルとして機能する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:41:46 GMT)
Iterative LLM-Based Generation and Refinement of Distracting Conditions in Math Word Problems [10.9] 我々は,大規模言語モデルを用いて注意をそらす環境を生成するための反復的フレームワークを設計する。
我々は LLM を明示的に誘導し, 元の解を変更せずに, 気を散らす条件を生成する。
このフレームワークは効率的でデプロイが容易で、邪魔な条件でMWPを生成するオーバーヘッドを低減する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:40:22 GMT)
One Stone with Two Birds: A Null-Text-Null Frequency-Aware Diffusion Models for Text-Guided Image Inpainting [10.8] テキスト誘導画像のインペイントは、テキストプロンプトに従ってマスクされた領域を再構築することを目的としている。
我々は、テキスト誘導画像のインペイントのための、textbfNTN-Diffと呼ばれるNull-text-null周波数対応拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:23:33 GMT)
ART-VITON: Measurement-Guided Latent Diffusion for Artifact-Free Virtual Try-On [10.8] VITON(Virtual try-on)は、ターゲット服を着用している人のリアルなイメージを生成することを目的としている。
アーティファクトフリーな合成を維持しながら測定付着性を確保するための,測定誘導拡散フレームワークART-VITONを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:20:37 GMT)
The Pursuit of Diversity: Multi-Objective Testing of Deep Reinforcement Learning Agents [10.8] 安全クリティカルドメインにおける深層強化学習(DRL)エージェントのテストには、さまざまな障害シナリオの発見が必要である。
InDAGO-Nexusは,故障確率とテストシナリオの多様性を協調的に最適化する多目的探索手法である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:25:55 GMT)
The Last Dependency Crusade: Solving Python Dependency Conflicts with LLMs [10.8] 本稿では,Pythonプログラムの依存性問題を自動的に修復するLarge Language Models (LLMs) について検討する。
本稿では,新しい検索拡張世代 (RAG) アプローチであるHGM (plum) を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:05:53 GMT)
Active Measuring in Reinforcement Learning With Delayed Negative Effects [10.8] 強化学習(RL)における状態の測定は、現実の環境ではコストがかかり、将来の結果に悪影響を及ぼす可能性がある。
我々は、エージェントが制御アクションを選択するだけでなく、潜伏状態を測定するかどうかを判断する、アクティブ観測可能なマルコフ決定プロセス(AOMDP)を導入する。
このような不確実性の低減は、これらのコストにもかかわらず、サンプル効率を向上し、最適な政策の価値を高める可能性がある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:21:36 GMT)
LoRAverse: A Submodular Framework to Retrieve Diverse Adapters for Diffusion Models [10.7] 低ランク適応(LoRA)モデルは、事前訓練された拡散モデルのパーソナライズに革命をもたらした。
Civit.aiのようなプラットフォームで100万以上のLoRAアダプタが利用可能であるにもかかわらず、ユーザはナビゲート、セレクション、そして最も適したアダプタを効果的に活用するという課題に直面している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:45 GMT)
SGAligner++: Cross-Modal Language-Aided 3D Scene Graph Alignment [10.7] SGAligner++は,3次元シーングラフアライメントのための言語支援フレームワークである。
提案手法は,異種多様度にまたがる部分重なり合うシーン観察の整列化という課題に対処する。
軽量なユニモーダルエンコーダとアテンションベースのフュージョンを用いることで、SGAligner++は視覚的ローカライゼーション、3D再構成、ナビゲーションといったタスクのシーン理解を強化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:30:20 GMT)
Echoes of Human Malice in Agents: Benchmarking LLMs for Multi-Turn Online Harassment Attacks [10.7] 大規模言語モデル(LLM)エージェントは、対話型Webアプリケーションのシェアを拡大するが、誤用や害に弱いままである。
i) 合成マルチターンハラスメント会話データセット、(ii) 繰り返しゲーム理論によって通知されるマルチエージェント(例えば、ハラッサー、被害者)シミュレーション、(iii) 記憶、計画、微調整にまたがるエージェントを攻撃する3つのジェイルブレイク手法、(iv) 混合メソッド評価フレームワークからなるオンラインハラスメントエージェントベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:27:44 GMT)
Online Continual Learning via Spiking Neural Networks with Sleep Enhanced Latent Replay [10.7] 本稿では,SESLRと呼ばれる新しいオンライン連続学習手法を提案する。
スパイキングニューラルネットワーク(SNN)を用いた睡眠増強潜時リプレイスキームを組み込んだ。
従来の(MNIST, CIFAR10)とニューロモルフィック(NMNIST, CIFAR10-DVS)の両方の実験は、SESLRの有効性を示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:58:52 GMT)
Uncertainty Quantification for Physics-Informed Neural Networks with Extended Fiducial Inference [10.5] 科学機械学習における不確かさの定量化はますます重要になっている。
物理インフォームドニューラルネットワーク(PINN)の場合、不確実性は通常ベイズ的あるいはドロップアウト的手法を用いて定量化される。
本稿では,PINNに対する厳密な不確実性定量化を実現するために,拡張フィデューシャル推論(EFI)の枠組み内での新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:18:54 GMT)
Shot2Tactic-Caption: Multi-Scale Captioning of Badminton Videos for Tactical Understanding [10.5] 本稿では,バドミントンにおける意味的・時間的マルチスケールビデオキャプションのための新しいフレームワークであるbfShot2Tactic-Captionを提案する。
Shot2Tactic-Captionは、ビジュアルエンコーダ、テンポラリトランスフォーマーエンコーダ、トランスフォーマーベースのデコーダを含む、デュアルブランチ設計を採用している。
戦術キャプションには、予測された戦術型状態をプロンプトとして埋め込んでデコーダに注入するショットワイズプロンプト誘導機構が組み込まれている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:24:51 GMT)
Retrieval-Augmented Test Generation: How Far Are We? [10.5] 機械学習(ML/DL)APIにおけるRAGベースの単体テスト生成の有効性について検討する。
APIドキュメント(公式ガイドライン)、GitHubイシュー(開発者報告の解決)、StackOverflow Q&Aの3つのドメイン固有のソースを調べます。
我々の研究は、広く使われているPythonベースのML/DLライブラリ、PyTorch、Scikit-learn、Google JAX、XGBoostの5つに焦点を当てている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:18:55 GMT)
Do Joint Language-Audio Embeddings Encode Perceptual Timbre Semantics? [10.4] 音節の知覚的次元を捉える能力に基づいて,上述の3つの共同言語-オーディオ埋め込みモデルを評価した。
以上の結果から,LAION-CLAPは,楽器音と音響効果の両面において,人間の知覚した音色セマンティクスと最も信頼性の高いアライメントを提供することが明らかとなった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:01:41 GMT)
Stop-RAG: Value-Based Retrieval Control for Iterative RAG [10.4] 反復検索拡張生成(RAG)は、大規模な言語モデルで複雑なマルチホップ質問に答えることができる。
既存のメソッドは、所定の回数のイテレーションを使用するか、あるいは、より多くの検索が実際に役立つかどうかを反映しない信頼性プロキシに依存している。
そこで我々は,いつ検索を中止するかを適応的に決定する値ベースのコントローラであるStop-RAGを紹介した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:17:38 GMT)
Policy Regularized Distributionally Robust Markov Decision Processes with Linear Function Approximation [10.4] 分散シフトによる意思決定は、トレーニングとデプロイメント環境が異なる強化学習(RL)における中心的な課題である。
本稿では,モデルのないオンラインポリシー最適化手法DR-RPOを提案する。
DR-RPO は,ロバストな RL における準最適境界とサンプル効率を実現し,値に基づく手法の性能に適合することを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:56:58 GMT)
Low-Rank Adaptation of Neural Fields [10.3] 低ランク適応(LoRA)を用いたニューラルネットワークの更新戦略を提案する。
LoRAは、最小の計算オーバーヘッドで事前訓練されたモデルの小さな更新をエンコードする。
我々は,画像フィルタリング,幾何編集,ビデオ圧縮,エネルギーベース編集の実験により,我々のアプローチを検証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:38:18 GMT)
Evaluating Sparse Autoencoders for Monosemantic Representation [10.2] 大きな言語モデルを解釈する上で重要な障壁は多意味性である。
SAEは多意味性を低減し,高い概念分離性を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:52:47 GMT)
Active Jammer Localization via Acquisition-Aware Path Planning [10.2] 本稿では,ベイズ最適化と獲得対応経路計画を組み合わせたアクティブなジャムマーローカライゼーションフレームワークを提案する。
我々は、A*アルゴリズムであるA-UCB*を、取得値をトラジェクティブコストに組み込むことで修正し、高獲得計画経路を導いた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:22:24 GMT)
SteeringTTA: Guiding Diffusion Trajectories for Robust Test-Time-Adaptation [10.2] テスト時間適応(TTA)は、未ラベルのテストデータを用いてモデルや入力を更新することにより、分散シフト下でのディープモデルの性能劣化を補正することを目的としている。
本稿では,Fynman-Kac ステアリングを応用し,擬似ラベルによる報酬付き分類のための拡散型入力適応を導出する推論専用フレームワークである SteeringTTA を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:46:53 GMT)
Checkpoint-GCG: Auditing and Attacking Fine-Tuning-Based Prompt Injection Defenses [10.1] 細調整による防御に対するホワイトボックス攻撃であるCheckpoint-GCGを導入する。
最強防衛に対する攻撃成功率(ASR)を最大96%まで達成できるチェックポイントGCGを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:31:18 GMT)
Kelle: Co-design KV Caching and eDRAM for Efficient LLM Serving in Edge Computing [10.0] エッジデバイス上の大規模言語モデル(LLM)は、レイテンシの低減、リアルタイム処理の改善、プライバシの向上に不可欠である。
エッジデバイスにLLMを実装することは、特にキーバリューキャッシュの管理において、課題となる。
エッジデバイスにおけるLLMのプライマリストレージとしてeDRAMを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:12:08 GMT)
CAST: Compositional Analysis via Spectral Tracking for Understanding Transformer Layer Functions [9.9] CAST(Compositional Analysis via Spectral Tracking)は、トランスフォーマー層関数を解析することによって、新しい視点に寄与するプローブフリーフレームワークである。
解析の結果,エンコーダのみのモデルとデコーダのみのモデルでは,デコーダモデルは圧縮・膨張サイクルを示し,エンコーダモデルは一貫したハイランク処理を維持していることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:27:15 GMT)
Deep Few-view High-resolution Photon-counting CT at Halved Dose for Extremity Imaging [9.9] ニュージーランドの臨床試験において,PCCT画像の半減量と2倍の速度で再現する深層学習に基づくアプローチを提案する。
具体的には、GPUメモリを緩和するパッチベースのボリュームリファインメントネットワークを設計し、合成データを用いたトレーニングネットワークを構築し、モデルベースの反復リファインメントを使用して合成データと臨床データのギャップを埋める。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:10:31 GMT)
Exploring Cross-Modal Flows for Few-Shot Learning [9.9] 本稿では,モーダル間速度場を学習し,モデルに依存しない多段階調整手法を提案する。
結果は、FMAが様々なベンチマークやバックボーンでパフォーマンスを継続的に向上できることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:32:48 GMT)
GradES: Significantly Faster Training in Transformers with Gradient-Based Early Stopping [9.8] 早期停止はグローバルなバリデーション損失を監視し、すべてのパラメータ更新を同時に停止する。
textitGradESは、トランスフォーマーコンポーネント内で動作可能な、新しい勾配ベースの早期停止アプローチである。
textitGradESはトレーニング時間を1.57--7.22$times$で高速化すると同時に、オーバーフィッティングの早期防止による一般化を同時に強化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:38:51 GMT)
LLM Agents for Automated Web Vulnerability Reproduction: Are We There Yet? [9.8] 大規模言語モデル(LLM)エージェントは、ソフトウェア工学とサイバーセキュリティタスクにおいて顕著な能力を示した。
最近の進歩は有望な可能性を示しているが、現実のWeb脆弱性の再現シナリオにLLMエージェントを適用する際の課題は依然として残っている。
本稿では,Web 脆弱性の自動再現のための最新の LLM エージェントを総合的に評価する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:04:46 GMT)
Overcoming Sparsity Artifacts in Crosscoders to Interpret Chat-Tuning [9.8] クロスコーダは、ベースモデルと微調整モデルの両方において遅延方向として表される解釈可能な概念の共用辞書を学習する、最近のモデル微分法である。
両モデルに実際に存在するとき,概念を微調整モデルに固有のものと誤帰できるクロスコーダL1のトレーニング損失に起因する2つの問題を同定する。
BatchTopKの損失でクロスコーダをトレーニングし、これらの問題を大幅に軽減し、より真にチャット特化され、高度に解釈可能な概念を見つけます。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:44:45 GMT)
Noise Projection: Closing the Prompt-Agnostic Gap Behind Text-to-Image Misalignment in Diffusion Models [9.7] テキスト・ツー・イメージ生成において、異なる初期ノイズは、事前訓練された安定拡散(SD)モデルで異なる雑音を誘導する。
このパターンは多様な画像を出力できるが、いくつかのパターンはプロンプトとうまく一致しないかもしれない。
そこで本研究では,初期雑音に対してテキスト条件の修正を施したノイズプロジェクタを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:14:34 GMT)
Pruning Sparse Tensor Neural Networks Enables Deep Learning for 3D Ultrasound Localization Microscopy [9.6] 本研究では,超音波データをスパース形式に効率よく変換し,関連する情報損失の影響について検討する。
提案手法は,高濃度環境下での従来のULMよりも2桁のメモリ要求量を削減する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:15:57 GMT)
SCENEFORGE: Enhancing 3D-text alignment with Structured Scene Compositions [9.4] SceneForgeは、構造化されたマルチオブジェクトシーンコンポジションを通じて、3Dポイントクラウドとテキスト間のコントラストアライメントを強化するフレームワークである。
構造化された構成サンプルによる対照的なトレーニングを強化することで、SceneForgeは大規模な3Dテキストデータセットの不足に効果的に対処する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:14:57 GMT)
Deep generative priors for 3D brain analysis [9.4] 本稿では,医療画像逆問題に対する拡散モデルの最初の汎用的応用について述べる。
我々のアプローチは、様々な脳MRIデータに基づいて、より柔軟な前方モデルと組み合わせたスコアベースの拡散を利用して、一般的な画像処理タスクをキャプチャする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:20:50 GMT)
HyperAIRI: a plug-and-play algorithm for precise hyperspectral image reconstruction in radio interferometry [9.4] 本稿では,ハイパースペクトルの拡張であるHyperAIRIを紹介する。
それぞれのスペクトルチャネルについて、HyperAIRI denoiserは現在の画像推定を入力として、隣接する2つのチャネルとスペクトルインデックスマップを推定する。
様々なダイナミックレンジに対応するため,事前に訓練したデノイザーの棚を組み立て,それぞれが特定のダイナミックレンジに合わせて調整する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:49:20 GMT)
An Efficient Rubric-based Generative Verifier for Search-Augmented LLMs [9.4] ナゲット・アズ・ルブリック」は、異なる探索強化ワークロードの構造化評価基準として原子情報ポイントを扱います。
Search-Gen-Vは、異なるワークロード間で強力な検証精度を達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:15:40 GMT)
IMAGINE: Integrating Multi-Agent System into One Model for Complex Reasoning and Planning [9.4] マルチエージェントシステムを1つのモデルに統合するための短いIMAGINEを提案する。
このフレームワークは、MASの推論と計画能力を単一のコンパクトモデルに統合する。
単一の小規模モデルは、よく組織されたMASの構造的推論と計画能力を取得することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:06:35 GMT)
Boosting Graph Foundation Model from Structural Perspective [9.4] 構造の観点からグラフ基盤モデルを強化し,BooGを提案する。
BooGは仮想スーパーノードを構築し、異なるドメインからのグラフデータの構造的特性を統合する。
また,グラフデータに対してより表現力のある表現を学習するコントラスト学習に基づく,新しい事前学習目標を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:27:03 GMT)
FraQAT: Quantization Aware Training with Fractional bits [9.3] 量子化法はモデルパラメータの精度を下げ、効率的な計算を可能にした。
品質を維持するために,新しい分数ビット量子化(ショート)手法を提案する。
SD3.5-Medium, Sana, pixart, FLUX.1-schnell などの拡散モデルでは, 短い収率で品質が向上することを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:01:08 GMT)
RHINO: Guided Reasoning for Mapping Network Logs to Adversarial Tactics and Techniques with Large Language Models [9.1] 人間の推論を反映した3つの解釈可能なフェーズに大言語モデルを分解するフレームワークであるRHINOを紹介する。
RHINOは、構造的推論による出力信頼性を改善しながら、低レベルの観測と反対方向のセマンティックギャップを橋渡しする。
以上の結果から,RHINOは脅威解析の解釈可能性やスケーラビリティを著しく向上させ,LLMを運用上のセキュリティ設定にデプロイするための青写真を提供することが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:25:46 GMT)
Real-Time Neural Video Compression with Unified Intra and Inter Coding [9.0] 各フレームを1つのモデルで処理する、イントラ・インターコーディングとイントラ・コーディングを統一したNVCフレームワークを提案する。
本稿では,フレーム間冗長性を利用した2フレーム同時圧縮設計を提案する。
実験の結果,提案方式はDCVC-RTよりも平均10.7%のBDレート低減効果を示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:31:44 GMT)
Predicting kernel regression learning curves from only raw data statistics [8.9] 我々は, CIFAR-5m, SVHN, ImageNetなどの実データに対して, 共通の回転不変カーネルを用いたカーネル回帰について検討した。
実験データ行列と対象関数の実証的分解である$f_*$の2つの測定値から学習曲線を予測する理論的枠組みを提案する。
ガウス的データに対してHermite eigenstructure ansatz (HEA) を証明しているが、実画像データはしばしば「ガウス的」である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:57:59 GMT)
Decoherence-Aware Entangling and Swapping Strategy Optimization for Entanglement Routing in Quantum Networks [8.8] 量子テレポーテーションは、エンドツーエンドの量子絡み合ったペアを通じて高いセキュリティ通信を可能にする。
環境干渉のため、絡み合ったペアは時間とともに脱結し、忠実度は低い。
本稿では,タイムスロットがプロセスのみに対応可能な,短時間のタイムスロットプロトコルを提案する。
従来のロングタイムスロットプロトコルよりも、エンタングとスワップのプロセスのフレキシブルなアレンジメントがある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:29:25 GMT)
LLM-guided Chemical Process Optimization with a Multi-Agent Approach [8.7] 本稿では,最小限のプロセス記述から動作制約を自律的に推論するマルチエージェントLLMフレームワークを提案する。
当社のAutoGenベースのフレームワークは、制約生成、パラメータ検証、シミュレーション、最適化ガイダンスのための特別なエージェントを備えたOpenAIのo3モデルを採用しています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:31:07 GMT)
METIS: Fast Quality-Aware RAG Systems with Configuration Adaptation [8.6] 本稿では,クエリを協調的にスケジュールし,各クエリのキーRAG構成を適応させる最初のRAGシステムであるMETISを提案する。
我々は、最先端のRAG最適化方式と比較して、METISは、生成品質を犠牲にすることなく、生成遅延を1.64-2.54times$に削減することを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:43:13 GMT)
A Survey of Recursive and Recurrent Neural Networks [8.5] 再帰的および再帰的ニューラルネットワークは、ネットワーク構造、訓練対象関数、学習アルゴリズムの実装に基づいて分類される。
様々なネットワークが相互に交差し、相互に依存して複雑な関係ネットワークを形成する。
様々なネットワークの発展と収束の文脈において、複雑なシーケンス、音声および画像の多くの問題が解決される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:12:48 GMT)
Reinforcement Learning for Unsupervised Domain Adaptation in Spatio-Temporal Echocardiography Segmentation [8.5] ドメイン適応手法はデータセット間のギャップを埋めることを目的としています。
多くのアプローチは、ターゲットドメインの信頼性に苦慮している。
RL4Seg3Dは2D+時間のための教師なしドメイン適応フレームワークである。
我々は,3万本以上の心エコービデオにおいて,本フレームワークの有効性を実証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:55:04 GMT)
Agentic Misalignment: How LLMs Could Be Insider Threats [8.4] 仮説的な企業環境で、複数の開発者から16のモデルをストレステストしました。
私たちは、自律的な電子メール送信と機密情報へのアクセスをモデルに許可しました。
一部のモデルは、それが置き換えや目標達成を避ける唯一の方法であったとき、悪意あるインサイダー行動に頼っていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:26:52 GMT)
TokDrift: When LLM Speaks in Subwords but Code Speaks in Grammar [8.3] 意味的に同一のコードスニペットは、ホワイトスペースや識別子の命名といった表面的要因によって異なるトークン化が可能であることを示す。
TokDriftは、セマンティック保存リライトルールを適用して、トークン化のみで異なるコード変種を生成するフレームワークです。
この結果から,不正なトークン化は信頼性の高いコード理解と生成に隠れた障害であることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:45 GMT)
Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation [8.3] LLM(Large Language Models)は、検索されたコンテキストに基づいて正確で信頼性の高い応答を生成する。
LLMはしばしば意味論的に等価な入力に対して一貫性のない出力を生成する。
本稿では, 体系的な合成データ生成, 組込み性向上のための三重項損失, レイヤワイドモデルマージ手法を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:30:28 GMT)
Lexo: Eliminating Stealthy Supply-Chain Attacks via LLM-Assisted Program Regeneration [8.3] ソフトウェアサプライチェーン攻撃は、オープンソースソフトウェアエコシステムにおいて重要かつ進行中の懸念事項である。
Lexoは、潜在的に悪意のあるコンポーネントの脆弱性のないバージョンを自動的に学習し、再生することによって、このようなステルスな攻撃に対処する。
高プロファイルなプライチェーン攻撃を含む100以上の実世界のパッケージに対する評価は、Lexoが複数のドメインにまたがってスケールしていることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:12:14 GMT)
Efficient Dynamic Structured Sparse Training with Learned Shuffles [8.3] ImageNet-1K(ViT-B/16)とWikiText-103(GPT-2)の90-95%の間隔で、置換強化動的スパーストレーニング(DST)が非構造化ベースラインと一致することを示す。
結果, 精度と効率の相違点として, 位置構造+学習順応が認められた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:48:17 GMT)
ScholarBench: A Bilingual Benchmark for Abstraction, Comprehension, and Reasoning Evaluation in Academic Contexts [8.2] textttScholarBenchは、大規模言語モデル(LLM)の学術的推論能力を評価するためのベンチマークである。
このベンチマークは韓国語で5,031例、英語で5,309例で、o3-miniのような最先端のモデルでさえ、平均評価スコアは0.543点だった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:04:15 GMT)
Speculative Model Risk in Healthcare AI: Using Storytelling to Surface Unintended Harms [8.1] 迅速かつ低障壁な開発は、バイアス、プライバシー侵害、不正アクセスのリスクをもたらす可能性がある。
ユーザストーリーを生成し,マルチエージェントによる議論を支援する,人間中心のフレームワークを提案する。
以上の結果から,ストーリーテリングは,幅広い害や利益を推測する上で有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:18:31 GMT)
Herman-Kluk-Like Semi-Classical Initial-Value Representation for Boltzmann Operator [8.1] ポテンシャルエネルギーが有限上界を持つ系に対する妥当なHK様表現を開発する。
我々のHKは自由粒子と高調波発振器に対して正確であり、他のシステムに対する有効性を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:59:38 GMT)
Antislop: A Comprehensive Framework for Identifying and Eliminating Repetitive Patterns in Language Models [8.0] 広範LLM導入は,slop'と呼ばれる特徴的反復句句を導入している。
Antislopは、これらの過剰使用パターンを検出し、排除するツールを提供する包括的フレームワークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:22:22 GMT)
Response to Discussions of "Causal and Counterfactual Views of Missing Data Models" [8.0] 2025年)、Levis and Kennedy、Luo and Geng、2025年)、Wang and van der Laan、2025年)、そしてYang and Kim、2025年(2025年)は、我々の論文に対する思慮深いコメントに感謝している(Nabi et al., 2025)。
この報告では、主要なコントリビューションをまとめて、それぞれの議論に順番に回答します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:59:09 GMT)
Local Causal Discovery for Statistically Efficient Causal Inference [7.9] 因果探索法は,一対の目的変数に対する因果効果推定のための有効な調整セットを同定することができる。
グローバル因果探索法は、因果グラフ全体を学習することに集中し、最適な調整セットの回復を可能にする。
局所因果探索法は、目的変数の局所的な近傍に着目して、よりスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:39:02 GMT)
Causal Discovery for Linear DAGs with Dependent Latent Variables via Higher-order Cumulants [7.8] 既存の手法では、相互に独立した潜在的共同創設者を仮定するか、観測変数間の因果関係を持つモデルを適切に扱うことができない。
本稿では,LvLiNGAMにおける因果DAGを同定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:15:20 GMT)
The Hidden Bias: A Study on Explicit and Implicit Political Stereotypes in Large Language Models [7.7] 大規模言語モデル(LLM)は情報伝達や意思決定プロセスにますます不可欠なものになっている。
本研究は,2次元政治コンパステスト(PCT)を用いた8つの著名なLCM間の政治バイアスとステレオタイプ伝搬について検討する。
主要な発見は、調査対象のすべてのモデルに対して、一貫した左派的な政治的整合性を示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:44:28 GMT)
Galaxy Morphology Classification with Counterfactual Explanation [7.7] 本稿では,従来のエンコーダ・デコーダアーキテクチャを逆流で拡張することを提案する。
我々は、意思決定プロセスに関する追加情報と反実的説明を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:11:56 GMT)
Efficient & Correct Predictive Equivalence for Decision Trees [7.6] Rashomonの意思決定ツリー(DT)は、重要な使用方法を見つけます。
同じ分類関数、すなわち予測等価DTを計算するDTは、ラショーモン集合のかなりの部分を表すことができる。
本稿では,Quine-McCluskey (QM) 法において,最悪ケースの指数的実行時間と空間を誘導する決定木が存在することを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:22:56 GMT)
Adapting Noise to Data: Generative Flows from 1D Processes [7.2] 一次元の雑音発生過程を用いて生成モデルを構築するための一般的なフレームワークを提案する。
このアプローチの柔軟性を示す例を概説する。
そこで本研究では,データに適応する量子関数を用いて雑音分布をパラメータ化することにより,その1Dプロセス自体が学習可能な新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:52:49 GMT)
A Physics Prior-Guided Dual-Stream Attention Network for Motion Prediction of Elastic Bragg Breakwaters [7.1] 従来のディープラーニングモデルは、目に見えない海の状態を示すとき、限定的な一般化能力を示すことが多い。
本研究は,PhysAttnNet(PhysAttnNet)を用いた物理優先型デュアルストリームアテンションネットワークを提案する。
ウェーブ・フラム・データセットの実験では、PhysAttnNetが主流モデルを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:06:44 GMT)
Geometric Moment Alignment for Domain Adaptation via Siegel Embeddings [7.1] モーメントマッチング手法を用いて、教師なし領域適応における分布シフトの問題に対処する。
既存の手法は通常、アドホック類似度測定を用いて、埋め込み空間内のソースとターゲットの分布の低次統計モーメントを整列する。
我々の重要な新規性は、一階と二階のモーメントを単一の対称正定値行列(SPD)として表現することにある。
これにより、SPD行列の共有多様体上の自然な幾何学的距離を用いて、両方のモーメントを同時に適応することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:20:51 GMT)
Deep Compositional Phase Diffusion for Long Motion Sequence Generation [7.1] 本稿では,隣接した動きクリップからの意味指導と位相詳細を拡散過程に組み込んだ構成相拡散について述べる。
実験により,構成運動列の生成において,提案するフレームワークの競合性能を実証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:28:46 GMT)
AI-Powered Early Diagnosis of Mental Health Disorders from Real-World Clinical Conversations [7.1] メンタルヘルス障害は、世界中で障害の主な原因となっている。
うつ病、不安症、外傷後ストレス障害(PTSD)などの症状は、しばしば診断または誤診される。
プライマリ・ケア・セッティングでは、提供者は60%以上のケースでうつ病や不安を誤認している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:50:04 GMT)
Understanding and Mitigating Covert Channel and Side Channel Vulnerabilities Introduced by RowHammer Defenses [7.0] 我々は、RowHammerディフェンスによって引き起こされたメモリレイテンシの違いを利用して通信チャネルを確立し、シークレットをリークする新しいタイプの攻撃であるLeakyHammerを紹介します。
以上の結果から,LeakyHammerの緩和はRowHammerの高負荷システムにおいて大きな性能上のオーバーヘッドを引き起こすことが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:11:02 GMT)
MathMist: A Parallel Multilingual Benchmark Dataset for Mathematical Problem Solving and Reasoning [6.9] 数学的問題解決と推論のための並列多言語ベンチマークであるMathMistを紹介する。
MathMistには、7つの言語にまたがる21万以上の質問回答ペアが含まれている。
我々は,オープンソースの中小LCM,プロプライエタリシステム,多言語推論型モデルなど,多様なモデル群を体系的に評価する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:59:52 GMT)
An Active Inference Model of Mouse Point-and-Click Behaviour [6.9] 連続状態, 動作, 観察空間を有するAIFエージェントを1次元マウスで指差し, クリックする。
我々は,マウスカーソルの力学を現実的な遅延でモデル化するために,シンプルな動的システムを用いる。
以上の結果から,カーソルが目標を上回っている場合,エージェントが適度なポインティング動作とクリックを生成できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:19:38 GMT)
Universal Vessel Segmentation for Multi-Modality Retinal Images [6.8] 多モード網膜画像のための新しいユニバーサル血管分割モデル(URVSM)を提案する。
我々の普遍モデルは最先端の微調整手法に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:15:07 GMT)
Overhead in Quantum Circuits with Time-Multiplexed Qubit Control [6.8] 本稿では,2量子ゲートを共通カプラ制御線上にグループ化することで,キュービット接続のオーバーヘッドを伴わずに実現可能であることを示す。
これらの結果は、大規模量子コンピュータへの進歩を約束している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:50:52 GMT)
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing [6.8] 本稿では,リモートセンシングタスクに最適化された最初の2Bパラメータマルチモーダル小言語モデルであるTinyRSを紹介する。
TinyRSは、数百万の衛星画像の事前トレーニング、視覚的なインストラクション例のチューニング、Chain-of-Thought(CoT)アノテーションによる微調整という、4段階のパイプラインを通じてトレーニングされている。
TinyRS-R1は汎用リモートセンシングのためのGRPO整列CoT推論を持つ最初のドメイン特化MSLMである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:49:00 GMT)
ColumnDisturb: Understanding Column-based Read Disturbance in Real DRAM Chips and Implications for Future Systems [6.8] 実商品DRAMチップにおいて,新しい広汎な読み出し障害現象であるColumnDisturbを実験的に実証した。
我々は,DRAMカラムを介してDRAMセルを乱し,攻撃列と同じ列を共有するセルにビットフリップを誘導できることを示した。
ColumnDisturbでは、単一行の活性化が、最大3つのサブアレイにわたる細胞を同時に妨害する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:52:41 GMT)
Targeted Attacks and Defenses for Distributed Federated Learning in Vehicular Networks [6.8] 新興のネットワークシステムでは、モバイルエッジデバイスが大量のデータを集約して機械学習の意思決定を行う。
フェデレートラーニング(FL)は、ディープニューラルネットワークのローカルモデル重みをノードが共有できるようにすることによって、これらの制約とプライバシ上の懸念に対処する。
我々は、高度な訓練用データ中毒とバックドア(トロイの木馬)攻撃を設計し、車載ネットワークにおける新たな脆弱性を特徴づける。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:05:13 GMT)
The Impact of Medicaid Coverage on Mental Health, Why Insurance Makes People Happier in OHIE: by Spending Less or by Spending More? [6.8] オレゴン健康保険実験(OHIE)は、メディケイドのカバレッジと幸福の因果関係を調べるユニークな機会を提供する。
以前の研究では、メディケイドを服用した人は精神状態が著しく改善したことが示されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:28:43 GMT)
A Robust Classification Method using Hybrid Word Embedding for Early Diagnosis of Alzheimer's Disease [6.8] アルツハイマー病(AD)の早期発見はAD患者にとって非常に有益であり、早期治療は症状を減らし、医療の経済的負担を軽減する。
ADの徴候の1つとして、ADの早期診断に言語能力の変化を用いることができる。
単語埋め込みを用いたロバストな分類法を開発し,ADの早期検出における最先端の精度を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:10:31 GMT)
LLM Based Bayesian Optimization for Prompt Search [6.8] 本稿では,大規模言語モデルを用いたテキスト分類を高速化するアルゴリズムを提案する。
本稿では,BO-LLMアルゴリズムを2つのデータセットで評価し,その利点について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:37:22 GMT)
Minimax Optimal Kernel Two-Sample Tests with Random Features [6.7] 本研究では、ランダムフーリエ特徴量(RFF)近似に基づくスペクトル規則化2サンプル試験を提案する。
RFFの近似順序が十分に大きい場合、提案した試験が最小限最適であることを示す。
そこで本研究では,正規化パラメータを選択するためのデータ適応型戦略を用いて,提案手法の実用的実装可能な置換型バージョンを開発する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:19:33 GMT)
MotionScript: Natural Language Descriptions for Expressive 3D Human Motions [6.7] 人間の3次元動作の詳細な自然言語記述を生成するための新しいフレームワークであるMotionScriptを紹介した。
MotionScriptは、人間の動きの完全な複雑さを捉える、きめ細かい構造化された記述を提供する。
MotionScriptは、テキスト・トゥ・モーションモデルのための記述ツールとトレーニングリソースの両方として機能する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:37:37 GMT)
Provable Mixed-Noise Learning with Flow-Matching [6.7] 加法成分と乗法成分の組み合わせとしてモデル化された混合雑音による逆問題について検討する。
近年のフローベース生成モデリングの進歩により,予測最大化(EM)アルゴリズムに埋め込まれた条件付きフローマッチングに基づく新しい推論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:17:05 GMT)
Toward Safe and Human-Aligned Game Conversational Recommendation via Multi-Agent Decomposition [6.6] 会話レコメンデータシステムのためのマルチエージェントフレームワークであるMATCHAを提案する。
インテント解析、ツール拡張検索、リフレクション付きマルチLLMランキング、説明、リスク管理のための特殊エージェントを割り当てる。
8つの指標で6つのベースラインを上回り、hit@5を20%改善し、人気バイアスを24%減らし、97.9%の敵防衛を達成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:19:35 GMT)
A Multi-domain Image Translative Diffusion StyleGAN for Iris Presentation Attack Detection [6.4] アイリス生体認証システムは、人工眼、プリントアイイメージ、化粧コンタクトレンズなどの人工物がシステムに提示されるプレゼンテーションアタック(PA)によって妥協することができる。
MID-StyleGANは、複数の領域におけるPAおよびボナファイド特性をキャプチャする合成眼像を生成するための新しいフレームワークである。
実験により、MID-StyleGANは高品質な合成眼画像を生成する既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:21:30 GMT)
A solution to generalized learning from small training sets found in everyday infant experiences [6.3] 乳幼児14例(7~11カ月)の自我中心画像の解析
日常的な視覚入力は, 比較的類似した画像のクラスタが, より稀な, より可変な画像と交差する, 粗い類似構造を示す。
実験により、この構造を機械で模倣することで、機械学習の小さなデータセットからの一般化が向上することが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:21:55 GMT)
From Loop Nests to Silicon: Mapping AI Workloads onto AMD NPUs with MLIR-AIR [6.3] 汎用コンパイラは並列性、局所性、同期性を抽象化し、現代の空間アーキテクチャにおけるそれらの有効性を制限する。
MLIR上に構築された新しいオープンソースのコンパイラスタックであるMLIR-AIRを紹介する。
LLaMA2モデルの行列乗算とマルチヘッドアテンションブロックの2つのケーススタディを通してMLIR-AIRの機能を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:49:05 GMT)
Interplay of ferromagnetism, nematicity and Fermi surface nesting in kagome flat band [6.3] FeドープCoSnの最近の実験で, かごめ平板の孔ドーピングにおける一連の相関相が明らかになった。
本研究では, 部分的に充填され, 弱分散する平帯を有する加合目モデルで実現された相互作用駆動位相について検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:55:45 GMT)
TABSurfer: a Hybrid Deep Learning Architecture for Subcortical Segmentation [6.3] TABSurferは3DパッチベースのCNN-Transformerハイブリッド深層学習モデルである。
評価のために、まず、さまざまなT1w MRIデータセットにまたがるTABSurferの一貫性性能を、FreeSurferと比較して大幅に短い処理時間で示す。
各テストでは、主要なディープラーニングベンチマークであるFastSurferVINNに対して、TABSurferのアドバンテージを確立します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:56:54 GMT)
PoTS: Proof-of-Training-Steps for Backdoor Detection in Large Language Models [6.2] 大規模言語モデル(LLM)の検証プロトコルであるProof-of-Training Stepsを紹介する。
LLMの言語モデリングヘッド(LM-Head)の入力摂動に対する感度を解析することにより、トレーニングにおける微妙なバックドア注入や偏差を明らかにすることができる。
本手法は, インジェクションステップにおける攻撃の早期検出を可能にし, 検証ステップはトレーニングステップよりも3倍高速である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:49:34 GMT)
Programmatic Representation Learning with Language Models [6.2] Learned Programmatic Representations (LeaPR)モデルは、コードとして表現される任意の機能を積み重ねる。
教師付きデータからLeaPRモデルを学習するための2つのアルゴリズムを提案する。
我々の研究は、解釈可能な表現をエンドツーエンドで学習するための柔軟なパラダイムを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:02:42 GMT)
Where are the Whales: A Human-in-the-loop Detection Method for Identifying Whales in High-resolution Satellite Imagery [6.2] 衛星画像におけるクジラ検出を半自動で検出する手法を提案する。
我々は,空間外接点,すなわち「興味点」をフラグする統計的異常検出手法を用いる。
我々は90.3%から96.4%のリコールを達成し、専門家の検査を必要とする地域を99.8%まで減らした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:51 GMT)
Contrastive Diffusion Alignment: Learning Structured Latents for Controllable Generation [6.1] ConDAは拡散埋め込み内での対照的な学習を適用して、潜在幾何学とシステムダイナミクスを整合させるフレームワークである。
ConDAは線形および条件付きベースラインと比較して制御性が改善された解釈可能な潜在表現を生成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:48:05 GMT)
RoboGPT-R1: Enhancing Robot Planning with Reinforcement Learning [6.1] 具体化計画のための2段階ファインチューニングフレームワークであるRoboGPT-R1を提案する。
このフレームワークでは、教師付きトレーニングがエキスパートシーケンスを通じて基礎知識を取得し、続いてRLが、視覚空間的理解と推論におけるモデルの欠点に対処する。
Qwen2.5-VL-3Bでトレーニングされた推論モデルは、大規模モデルであるGPT-4o-miniを21.33%上回り、EmbodiedBenchベンチマークで20.33%上回る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:04:35 GMT)
Multi-modal video data-pipelines for machine learning with minimal human supervision [6.0] この作業では、人間の監督をほとんど使わずにできる限り多くの視覚的モダリティを組み合わせることを試みています。
我々は,マルチモーダルデータの活用に特化して設計されたPHG-MAEを利用する。
このモデルをデプロイし、ハンドヘルドデバイスやコモディティハードウェア上のウェブカメラからリアルタイムセマンティックセマンティックセグメンテーションのユースケースを分析する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:36:29 GMT)
Real-Time Adaptive Motion Planning via Point Cloud-Guided, Energy-Based Diffusion and Potential Fields [6.0] 追従回避の問題に触発され,エネルギーベース拡散モデルと人工ポテンシャル場を組み合わせた運動計画フレームワークを提案する。
提案手法は、点雲から直接障害物情報を処理し、完全な幾何学的表現を必要としない効率的な計画を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:13:04 GMT)
AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark [5.9] AAVENUE は、AAVE と Standard American English の NLU タスクにおける大きな言語モデル (LLM) のパフォーマンスを評価するためのベンチマークである。
AAVENUE と VALUE の翻訳を,5つの人気のある LLM と,フルーエンシ,BARTScore,品質,コヒーレンス,理解可能性などの総合的な指標を用いて比較した。
評価の結果, LLM は AAVE に翻訳されたバージョンよりも, SAE タスクで一貫した性能が向上し, 固有のバイアスが強調された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:50:58 GMT)
Hyperparameter Optimization and Reproducibility in Deep Learning Model Training [5.9] 再生性は、病理学の基礎モデルトレーニングにおいて重要な課題である。
QUILT-1Mデータセットを用いてCLIPモデルを訓練した。
RandomResizedCropの値は0.7-0.8で、より攻撃的である(0.6)か保守的である(0.9)。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:57:52 GMT)
Expectation value estimation with parametrized quantum circuits [5.7] 分子エネルギー、相関関数などの量子状態の性質を推定することは、量子情報科学の基本的な課題である。
回路深度や接続性の制限を含む実用的な量子装置の制限により、線形特性の推定さえも、高いサンプル複雑さに直面する。
浅いパラメータ化量子回路を用いて,観測可能な任意の観測値の期待値を推定するために,サンプル複雑性を最適化するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:05:25 GMT)
GAN-based Content-Conditioned Generation of Handwritten Musical Symbols [5.7] 本研究では,音楽記号レベル生成支援ネットワーク(GAN)を実装することで,手書きのリアルな楽譜の生成について検討する。
我々はこれらの生成したサンプルの視覚的忠実度を評価し、生成したシンボルは高いリアリズムを示すと結論づけた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:21:53 GMT)
Assessing Coherency and Consistency of Code Execution Reasoning by Large Language Models [5.7] 本稿では,プログラム実行をシミュレーションし,その推論をプログラミングタスクで活用する上で,LLMの能力を評価するタスクであるCESを提案する。
CESでは、シミュレーションがコモンセンスの実行ロジックに準拠するかどうかを判断するために、コヒーレンスの概念を紹介している。
CESはまた、スペクトルにおいて同じまたは異なる素路カバレッジを持つテスト間での推論整合性を測定するための新しいメトリクスも導入している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:48:12 GMT)
O-Forge: An LLM + Computer Algebra Framework for Asymptotic Analysis [5.7] 大規模言語モデルは、最近、IMOとPutnamの問題を解決する高度な能力を実証した。
主な困難は検証である: 提案は妥当に見えるが、厳密なチェックなしには信頼できない。
コンピュータ代数システムとフロンティア LLM を結合する LLM+CAS というフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:07:41 GMT)
Match & Mend: Minimally Invasive Local Reassembly for Patching N-day Vulnerabilities in ARM Binaries [5.6] 低コストのIoT(Internet of Things)デバイスは、ますます人気を博しているが、アップデートの仕組みが貧弱なため、安全でないことが多い。
ベンダーのサポートを必要とせずに、IoTファームウェアをバイナリレベルでパッチすることを提案する。
特に,IoTファームウェアに既知の(日々の)脆弱性を自動的にパッチする新たなテクニックである,最小侵襲のローカル再アセンブリを導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:31:42 GMT)
PBEBench: A Multi-Step Programming by Examples Reasoning Benchmark inspired by Historical Linguistics [5.6] 我々は,Large Language Models (LLMs) の帰納的推論能力を評価する新しいタイプのベンチマークに貢献する。
本稿では,制御不能な問題を生成し,推論モデルの評価を可能にする完全自動パイプラインを提案する。
実験により、テストタイム計算やLCoT(ロングチェーンオブ思想)推論を利用するモデルと、そうでないモデルの間には、かなりのパフォーマンスギャップが明らかになる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:47:37 GMT)
MoCom: Motion-based Inter-MAV Visual Communication Using Event Vision and Spiking Neural Networks [5.6] モーションベース信号を用いたMAVスワーミングのための新しい視覚コミュニケーションフレームワークを提案する。
この枠組みでは、MAVは意図的な飛行パターンを通じて、方向や距離などの情報を伝達する。
結果は、正確な復号化と低消費電力化を実証するフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:06:51 GMT)
APEX: Empowering LLMs with Physics-Based Task Planning for Real-time Insight [5.6] APEX(Anticipatory Physics-Enhanced Execution)は、大規模言語モデルに物理駆動型フォレストを組み、リアルタイムタスク計画のためのフレームワークである。
APEX は標準の LLM や VLM ベースのモデルを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:07:40 GMT)
Think Just Enough: Sequence-Level Entropy as a Confidence Signal for LLM Reasoning [5.4] 推論タスクにおいて,大規模言語モデルにおいてトークン効率を向上する新しいエントロピーベースのフレームワークを提案する。
提案手法では,トークンレベルのログプロブからのシャノンエントロピーを信頼信号として使用し,早期停止を実現する。
エントロピーに基づく信頼度キャリブレーションは,事前学習後の最適化の創発的特性を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:14:55 GMT)
Active Honeypot Guardrail System: Probing and Confirming Multi-Turn LLM Jailbreaks [5.4] 大規模言語モデル(LLM)は、マルチターンジェイルブレイク攻撃に対してますます脆弱である。
リスク回避をリスク利用に変換するハニーポット型アクティブガードレールシステムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:41:09 GMT)
Why do explanations fail? A typology and discussion on failures in XAI [5.4] 結果として生じる害は、XAIにおける複数の障害の複雑な重複から生じると我々は主張する。
本稿では,説明失敗の複雑さを明らかにするためのタイプ的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:03:54 GMT)
Reinforcement Learning with Stochastic Reward Machines [5.3] 報奨機と呼ばれる新しい種類の報奨機と、それらを学習するためのアルゴリズムを導入する。
我々のアルゴリズムは制約解に基づいて、強化学習エージェントの探索から最小限の報酬機を学習する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:12:04 GMT)
JEDA: Query-Free Clinical Order Search from Ambient Dialogues [5.3] JEDAはドメインdバイエンコーダで、標準順序を直接取得する。
環境対話の短いローリングウィンドウを符号化し、検索をトリガーする。
クエリフリーモードはノイズ耐性があり、障害やASRエラーに対する感度が低下する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:00:21 GMT)
ELASTIC: Efficient Once For All Iterative Search for Object Detection on Microcontrollers [5.2] ELASTICは、モジュール間で周期的に最適化を交互に行う、ハードウェア対応の統一NASフレームワークである。
進化的探索における集団パススルー機構は、探索段階間の高品質な候補を保持し、より高速な収束をもたらす。
マイクロコントローラにデプロイすると、ELASTIC由来のモデルはAnalog DevicesのMCUSSDベースラインを上回り、エネルギーを最大71.6%削減し、レイテンシを最大2.4倍下げ、mAPを最大6.99ポイント改善した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:38:23 GMT)
Efficient Video Sampling: Pruning Temporally Redundant Tokens for Faster VLM Inference [5.1] 長いビデオはしばしば現代の言語モデルのトークン予算を超え、厳しいコンテキスト制限とレイテンシの問題に繋がる。
本稿では,時間的に静的なパッチを識別・プルーニングすることで,ビデオ中のトークンの冗長性を低減できる簡易なプラグイン・アンド・プレイ方式であるEfficient Video Sampling (EVS)を紹介する。
EVSは意味的忠実性を維持しながらトークン数を大幅に削減し、より高速な推論とより長い入力シーケンスを可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:34:38 GMT)
MACE: Mixture-of-Experts Accelerated Coordinate Encoding for Large-Scale Scene Localization and Rendering [5.1] Mixed Expert-based Accelerated Coordinate Method (MACE)
我々は、暗黙的にサブネットワークを分類し、選択するためのゲーティングネットワークを導入し、各推論中に1つのサブネットワークのみが活性化されることを保証する。
さらに,大規模シーンにおける局所化精度を高めるため,ALF-LB(Auxiliary-Loss-Free Load Balancing)戦略を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:08:19 GMT)
Closed-Form Training Dynamics Reveal Learned Features and Linear Structure in Word2Vec-like Models [5.0] word2vecのような自己教師付き単語埋め込みアルゴリズムは、言語モデリングにおける表現学習を研究するための最小限の設定を提供する。
ダウンストリームタスクにおけるトレーニングダイナミクスと最終性能は、経験的に word2vec と非常によく似ていることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:53:18 GMT)
Learning When Not to Learn: Risk-Sensitive Abstention in Bandits with Unbounded Rewards [5.0] 高度なAIアプリケーションでは、単一のアクションでさえ、不可分なダメージを引き起こす可能性がある。
積極的に探索する標準的なバンディットアルゴリズムは、この仮定が失敗すると不可分なダメージを引き起こす可能性がある。
本稿では,学習しないときに学習する警告に基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:01:57 GMT)
The Neuroticism Paradox: How Emotional Instability Fuels Collective Feelings [5.0] 本研究は,38名の同居者を対象に,30.5ヶ月の日中感情のデータセットを解析した。
感情的に不安定な人は「感情的なスーパースプレッダー」であることがわかった。
この「ニューロティズム・パラドックス」は、安定ではなく感情的な不安定さが伝染を引き起こすことを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:19:57 GMT)
Phenomenological Ehrenfest Dynamics with Topological and Geometric Phase Effects and the curious case of Elliptical intersection [5.0] 本稿では,幾何学的位相(GP)効果を明示的に含み,非断熱的分子動力学をシミュレートするための包括的枠組みを提案する。
このフレームワークは、分子系の量子-古典的相互作用を研究するための貴重なツールを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:22:31 GMT)
Thunder-DeID: Accurate and Efficient De-identification Framework for Korean Court Judgments [4.9] 韓国司法裁判所は、公にされる前に裁判所判決の非正当性を委任する。
現在の非識別プロセスは、厳格な法的要件を遵守しながら、大規模に裁判所判断を扱うには不十分である。
我々はサンダー・デID(Thunder-DeID, Thunder-DeID)と呼ばれる、関連する法律や慣習に適合する非識別化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:12:43 GMT)
A Novel GPT-Based Framework for Anomaly Detection in System Logs [4.9] 本稿では,Genera-tive Pre-trained Transformer (GPT) を用いたシステムログのインテリジェント検出手法を提案する。
このアプローチの有効性は、構造化入力とFocal Loss Op timization戦略の組み合わせに起因する。
GPT-2モデルは、精度、リコール、F1スコアなど、様々な重要な指標において、最適化されていないモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:17:39 GMT)
PerfBench: Can Agents Resolve Real-World Performance Bugs? [4.9] PerfBenchは、GitHubから81の実際のパフォーマンスバグ修正タスクからなるベンチマークである。
PerfBenchは、エージェントが独自のパフォーマンスベンチマークを生成することができる新しい評価ハーネスを備えている。
OpenHands-Perf-Agentは、パフォーマンスに配慮したツールと命令を組み、ベンチマークで20%の成功率を達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:31:16 GMT)
AI Guided Accelerator For Search Experience [4.8] 本稿では,ユーザの最終購入意図に向けての旅の間に生じる中間的変更を,トランジショナルなクエリを明示的にモデル化する新しいフレームワークを提案する。
このアプローチは,探索行動や意図の洗練を反映した中途半端なトランジションをユーザのショッピングファンネルをモデル化する。
我々の貢献には、(i)トランザクショナルクエリの形式的識別とモデリング、(ii)インテントフロー理解のための構造化クエリシーケンスマイニングパイプラインの導入、(iii)スケーラブルでインテント対応のクエリ拡張のためのLLMの適用が含まれる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:14:29 GMT)
TripScore: Benchmarking and rewarding real-world travel planning with fine-grained evaluation [4.8] 我々は、詳細な基準を1つの報酬に統一する旅行計画のための総合的なベンチマークを導入する。
我々の評価器は旅行専門家のアノテーション(60.75%)と適度に一致した。
ユーザ意図を一般化するための219のリアルタイムなフリーフォーム要求を含む,4,870の大規模クエリデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:45:03 GMT)
Large Scale Retrieval for the LinkedIn Feed using Causal Language Models [4.7] 本稿では,大規模な因果言語モデルをデュアルエンコーダとして微調整し,ユーザ(メンバー)とコンテンツ(イテム)の両方に高品質な埋め込みを生成する,新たな検索手法を提案する。
組込み生成の即時設計、LinkedInのスケールでの微調整のテクニック、低レイテンシのためのインフラストラクチャ、コスト効率のよいオンラインサービスを含む、エンドツーエンドパイプラインについて説明する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:01:33 GMT)
RLSR: Reinforcement Learning with Supervised Reward Outperforms SFT in Instruction Following [4.7] 本稿では,SFT を RLSR に置き換えて,RL フレームワークにおける拡張 SFT データセットを活用することを提案する。
RLSRでは、ベースモデルは各プロンプトに対して複数の応答を生成し、生成した応答と人ラベルされた応答のセマンティック埋め込み空間におけるコサイン類似性として報酬スコアを算出する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:13:14 GMT)
OCR-APT: Reconstructing APT Stories from Audit Logs using Subgraph Anomaly Detection and LLMs [4.7] Advanced Persistent Threats(APT)はステルスなサイバー攻撃で、システムレベルの監査ログの検知を回避している。
既存のシステムはこれらのグラフに異常検出を適用しているが、しばしば偽陽性率と粗い警告に悩まされる。
OCR-APTは,人型攻撃物語のAPT検出と再構築を行うシステムである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:14:03 GMT)
A Clinically-Grounded Two-Stage Framework for Renal CT Report Generation [4.4] 本稿では,自動腎CTレポート作成のための枠組みを提案する。
ステージ1では、マルチタスク学習モデルが、各2次元画像から構造化された臨床特徴を検出する。
ステージ2では、視覚言語モデルが画像と検出された特徴に条件付けされた自由テキストレポートを生成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:21:00 GMT)
Boosting Instruction Following at Scale [4.4] Instruction Boostingは2つの命令に対して最大7ポイント、10つの命令に対して最大4ポイントの命令追従率を改善する。
また,より多くの命令が加えられるにつれて,性能が低下する傾向がよく見られる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:15:58 GMT)
How Far Have LLMs Come Toward Automated SATD Taxonomy Construction? [4.4] 開発者が技術的負債を意図的に導入する場合、それは自己許容技術的負債(SATD)と呼ばれる。
従来の方法では、SATDコメントや周辺コードの手作業による検査が必要であり、これは時間がかかり、労力がかかり、アノテータの主観性のために矛盾することが多い。
本研究では,大規模言語モデル(LLM)がSATDをどの程度生成できるかを検討する。
我々は、研究者が通常従う分類構築ステップを反映した構造化LLM駆動パイプラインを設計した。量子ソフトウェア、スマートコントラクト、機械学習という3つの領域のSATDデータセットで評価した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:03:59 GMT)
EARS-UDE: Evaluating Auditory Response in Sensory Overload with Universal Differential Equations [4.3] 自閉症スペクトラム障害(ASD)における聴覚過負荷の50~70%への影響
自閉症における感覚適応力学をモデル化するために,Universal Differential Equations (UDEs) を用いた科学機械学習手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:16:43 GMT)
EcoScaleNet: A Lightweight Multi Kernel Network for Long Sequence 12 lead ECG Classification [4.3] EcoScale-Net(EcoScale-Net)は, 冗長性を排除しつつ, 完全受容野の網羅性を維持する階層型である。
大規模なCODE 15%ECGデータセットでは、EcoScaleNetがパラメータを90%、FLOPを99%削減し、マクロ平均F1スコアを2.4%引き上げている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:45:14 GMT)
MX+: Pushing the Limits of Microscaling Formats for Efficient Large Language Model Serving [4.2] 大規模言語モデル(LLM)のコスト効率向上のためには,データフォーマットの高精度化が不可欠である
本稿では,ブロック浮動小数点(BFP)フォーマットの最近の業界主導の変種に着目した。
マイクロスケーリング(MX)フォーマットへのシームレスな統合を目的とした費用対効果と非侵入性の拡張であるMX+を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:05:54 GMT)
Large Language Models Enable Design of Personalized Nudges across Cultures [4.0] 大規模言語モデル (LLM) は、個々の固有のナッジの設計を容易にする。
LLMをインフォームしたパーソナライズされたナッジは、均一な設定よりも効果的である。
本研究は, ナッジ戦略の低費用試験場としてのLCMの可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:33:13 GMT)
The Agency Gap: How Generative AI Literacy Shapes Independent Writing after AI Support [4.0] 本研究は,GenAIリテラシーが自己開始と規制を必要とする状況下で,学生の筆記能力を予測する程度について検討する。
文章は洞察力、視覚データ統合、組織、言語的品質、批判的思考などにわたって評価された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:26:46 GMT)
CALM-Net: Curvature-Aware LiDAR Point Cloud-based Multi-Branch Neural Network for Vehicle Re-Identification [4.0] CALM-Net(CALM-Net)は、車両再識別のための、曲率対応のLiDARポイントクラウドベースのマルチブランチニューラルネットワークである。
CalM-Netは、エッジ畳み込み、ポイントアテンション、点雲の局所的な表面変化を特徴付ける曲率埋め込みを統合するマルチブランチアーキテクチャを採用している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:36:54 GMT)
Infrastructure Patterns in Toll Scam Domains: A Comprehensive Analysis of Cybercriminal Registration and Hosting Strategies [4.0] 有料詐欺は、合法的な交通機関のふりをした偽のドメインを登録する犯罪者を巻き込む。
新たに作成した67,907個のスカムドメインのデータセットを用いて,有料スカムドメインの大規模解析を行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:09:30 GMT)
Identity-Link IRT for Label-Free LLM Evaluation: Preserving Additivity in TVD-MI Scores [4.0] 本報告では,TVD-MIの2次試行平均値が,非線形リンク関数を使わずに項目応答理論(IRT)に適合する付加的構造で中心確率スコアを得ることを示す。
Giniエントロピーからこのクリップ付き線形評価を導出し、境界飽和を扱うボックス制約最小二乗の定式化を導出する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:25 GMT)
Offline Dedicated Quantum Attacks on Block Ciphers Based on Two Parallel Permutation-Based Pseudorandom Functions [3.9] 近年、ShiらはXOR型関数に対する専用量子攻撃を導入した。
本稿では,TPP-PRFに基づくブロック暗号に対するオフライン量子攻撃を提案する。
以前の結果と比較すると、オフライン攻撃はクエリの複雑さを著しく減らしている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:19:32 GMT)
SUM-AgriVLN: Spatial Understanding Memory for Agricultural Vision-and-Language Navigation [3.9] AgriVLN法とA2Aベンチマークは先駆的にビジョン・アンド・ランゲージ・ナビゲーション(VLN)を農業領域に拡張した。
現実的な農業シナリオでは、ナビゲーション命令が繰り返されるが、AgriVLNはそれぞれの命令を独立したエピソードとして扱う。
農業用視覚・言語ナビゲーション(SUM-AgriVLN)のための空間的記憶法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:53:32 GMT)
Preservation of Language Understanding Capabilities in Speech-aware Large Language Models [3.8] このベンチマークでは、テキストタスクと音声クローニングテキスト音声モデルを用いて、モデルが音声入力を介してアクセスされたときの言語理解能力の保存範囲を定量化する。
C3Tは、話者の異なるカテゴリのモデルの公平さと、テキストと音声のモダリティをまたいだ頑健さを定量化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:28:23 GMT)
Graph-based Neural Space Weather Forecasting [3.8] 我々は、地球近傍の空間条件を自動回帰予測するために、Vlasiatorデータに基づいて訓練されたグラフベースのニューラルエミュレータを導入する。
本研究では,素早い決定論的予測の達成方法と,生成モデルを用いて予測の不確実性を捉えるアンサンブルを生成する方法を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:49:57 GMT)
The Minimax Lower Bound of Kernel Stein Discrepancy Estimation [3.7] KSD推定のミニマックス下限は$n-1/2$であり、これらの推定器の最適性を定めていることが示される。
最初の結果は、Langevin-Stein演算子を使った$mathbb Rd$でのKSD推定に焦点をあてる。
2つ目の結果は、一般領域でのKSD推定のためのミニマックス下限を定めている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:16:05 GMT)
Evaluating Arabic Large Language Models: A Survey of Benchmarks, Methods, and Gaps [3.7] この調査は、NLPタスク、知識領域、文化的理解、特殊能力にわたる40以上の評価ベンチマークを分析し、アラビア語のLLMベンチマークを初めて体系的にレビューした。
本稿では,ナレッジ,NLPタスク,カルチャー・アンド・ダイアレクト,ターゲット・スペクティフィック評価の4つのカテゴリに分類基準を編成する手法を提案する。
分析の結果,時間的評価の限界,マルチターン・ダイアログの不十分,データセットの文化的な相違など,重要なギャップを識別しながら,ベンチマークの多様性が著しく向上していることが判明した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:22:13 GMT)
Transferable Equivariant Quantum Circuits for TSP: Generalization Bounds and Empirical Validation [3.7] 我々は、TSP(Traveing Salesman Problem)に着目し、最適化のための量子強化学習(QRL)の一般化の課題に対処する。
これを軽減するために、TSPグラフの置換対称性を尊重する等変量子回路(EQC)を採用した。
この対称性を意識したアンサッツは、訓練されたパラメータを$n-$cityのトレーニングインスタンスからより大きなm-city問題へのゼロショット転送を可能にした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:25:14 GMT)
Towards Human Cognition: Visual Context Guides Syntactic Priming in Fusion-Encoded Models [3.6] 構造プライミング(Structure priming)は、特定の構文構造への露出が、その後の発話で同じ構造を生成する可能性を高める認知現象である。
本稿では,最初のマルチモーダル構造プライミングデータセットであるPRISMATICを紹介する。
文レベルの構造的プライミング効果を特に評価するために設計された,新しい参照不要評価指標である構文保存指数(SPI)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:51:47 GMT)
A novel Information-Driven Strategy for Optimal Regression Assessment [3.6] 機械学習(ML)では、回帰アルゴリズムはデータに基づく損失関数の最小化を目的としている。
グローバルな最適性の達成性を保証するデータ駆動評価手法は存在しない。
この研究は、回帰アルゴリズムを評価するための新しいデータ駆動フレームワークであるInformation Teacherを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:01:32 GMT)
TRI-DEP: A Trimodal Comparative Study for Depression Detection Using Speech, Text, and EEG [3.6] うつ病は広範な精神疾患であるが、自動検出は依然として困難である。
先行研究は、相補的な信号を活用することで約束を示すマルチモーダルシステムを用いて、一助的および多モーダルなアプローチを探求してきた。
脳波を横断する特徴表現とモデリング戦略を,音声やテキストとともに体系的に探求することで,これらのギャップに対処する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:39:59 GMT)
AttenCraft: Attention-guided Disentanglement of Multiple Concepts for Text-to-Image Customization [3.5] 本研究では,マルチコンセプト・ディコンタングルメントのための注意型手法であるAttenCraftを提案する。
注意点に基づく適応アルゴリズムを導入し,異なる概念に対するサンプリング比を推定する。
我々のモデルは,最新画像の忠実度と,ベースラインモデルに匹敵する即時忠実度という2つの問題を効果的に緩和する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:42:33 GMT)
A Systematic Study of Time Limit Exceeded Errors in Online Programming Assignments [3.5] 本稿では,オンラインプログラミングにおけるTLEエラーに関する大規模な実証的研究について述べる。
我々は1000のCodeforcesをTLEエラーで分析し、その根本原因を分類し、ユーザーがどのように修正しようとしたかを追跡した。
我々は,TLEエラーに特化して設計された最初の自動修復ツールであるNettleと,TLE修復を評価する最初のフレームワークであるNettle-Evalを紹介する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:18:55 GMT)
BADAS: Context Aware Collision Prediction Using Real-World Dashcam Data [3.5] BADASは、Nexarの現実のダッシュカム衝突データセットに基づいてトレーニングされた衝突予測モデルのファミリーである。
主要なベンチマークを再アノテートして、エゴの関与を特定し、コンセンサスアラートタイムラベルを追加し、ネガティブを合成します。
BADASはV-JEPA2のトレーニングを受けたエンドツーエンドを使用し、2つのバリエーションがある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:55:30 GMT)
Morphology-Aware Prognostic model for Five-Year Survival Prediction in Colorectal Cancer from H&E Whole Slide Images [3.4] 大腸癌(CRC)は世界で3番目に多い悪性腫瘍であり、2025年には154,000人の新規症例と54,000人の死亡が予想される。
本研究の目的は,各形態に連続的な変動スペクトルを組み込んだ,新しい解釈可能なAIモデルであるPRISMを開発することである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:32:05 GMT)
Machine Learning and Public Health: Identifying and Mitigating Algorithmic Bias through a Systematic Review [3.4] 機械学習(ML)におけるアルゴリズムバイアスは、既存の健康格差を必然的に補強する可能性がある。
本稿では,2021年から2025年までのオランダの公衆衛生ML研究において,アルゴリズムバイアスの同定,議論,報告に関する体系的な文献レビューを行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:24:11 GMT)
Suicidal Comment Tree Dataset: Enhancing Risk Assessment and Prediction Through Contextual Analysis [3.4] 本研究では,コメントツリー内の情報がユーザの自殺リスクレベルの識別と予測にどのように影響するかを検討する。
Redditをソースとした高品質な注釈付きデータセットを構築し、ユーザの投稿履歴とコメントを組み込んだ。
このデータセットの統計的解析とLarge Language Models (LLMs) 実験の結果から, コメントツリーデータの導入は, ユーザの自殺リスクレベルの識別と予測を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:47:03 GMT)
Semantic Prosody in Machine Translation: the English-Chinese Case of Passive Structures [3.4] 本稿では,特定の構造の意味的韻律について機械翻訳モデルを教えるアプローチを提案する。
我々は,中国語 BEI 受動音に着目し,英語と中国語の文対のデータセットを作成し,BEI 受動音の否定的意味韻律を実証する。
次に, OPUS-MT, NLLB-600M, mBART50モデルを英語・中国語翻訳タスクのデータセットで微調整する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:16:59 GMT)
Spectral Analysis of Molecular Kernels: When Richer Features Do Not Guarantee Better Generalization [3.3] QM9データセット上でカーネルリッジ回帰の総合スペクトル分析を行った。
驚くべきことに、4つの異なるスペクトル測定値によって測定されるよりリッチなスペクトル特徴は、常に精度を向上しない。
変換器ベースおよび局所的な3次元表現の場合、スペクトルの富度は性能と負の相関を持つ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:52:26 GMT)
Multilinguality Does not Make Sense: Investigating Factors Behind Zero-Shot Transfer in Sense-Aware Tasks [3.3] 言語間移動は現代のNLPの中心であり、モデルは訓練された言語とは異なる言語でタスクを実行することができる。
一般的な仮定は、より多くの言語でのトレーニングはゼロショット転送を改善するというものである。
本手法は,感性を考慮したタスクの多義性や語彙的意味変化で検証し,多言語性は効果的な伝達には必要ないことを見いだす。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:23:18 GMT)
UrbanTwin: Synthetic LiDAR Datasets (LUMPI, V2X-Real-IC, and TUMTraf-I) [3.2] UrbanTwinデータセットは、3つの公開ロードサイドライダーデータセットの高忠実で現実的なレプリカである。
各UrbanTwinデータセットには、パブリックデータセットの1つに対応する10Kフレームが含まれている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:03:59 GMT)
Competition and Diversity in Generative AI [3.2] 競争市場は多様なAIモデルを選択し、モノカルチャーを緩和している。
独立して機能する生成AIモデル(つまりベンチマークによれば)は、反復的市場において価値の提供に失敗する可能性がある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:33:03 GMT)
Secure Sparse Matrix Multiplications and their Applications to Privacy-Preserving Machine Learning [3.1] マルチパーティ計算(MPC)は、シークレット共有または暗号化されたデータ上で機械学習(ML)アルゴリズムの実行を可能にする。
MPCフレームワークはスパースデータに最適化されていない。
秘密のスパース行列を乗算するMPCアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:12:18 GMT)
Robust Counterfactual Inference in Markov Decision Processes [3.0] 現在のアプローチでは、カウンターファクトを識別するために特定の因果モデルを想定している。
反実遷移確率の厳密な境界を計算できる新しい非パラメトリック手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:51:12 GMT)
Synthetic History: Evaluating Visual Representations of the Past in Diffusion Models [3.0] 本稿では,テキスト・トゥ・イメージ(TTI)モデルが歴史的文脈をどのように表現するかを評価するためのベンチマークを紹介する。
このベンチマークは、3つの最先端拡散モデルによって生成される3万の合成画像のデータセットであるHistVisを組み合わせたものだ。
生成した画像は,(1)意図しない立体的協会,(2)歴史的一貫性,(3)デモグラフィー表現の3つの重要な側面で評価した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:16:14 GMT)
TriQXNet: Forecasting Dst Index from Solar Wind Data Using an Interpretable Parallel Classical-Quantum Framework with Uncertainty Quantification [2.9] 地磁気嵐はGPS、衛星通信、電力網などの重要なインフラを破壊する可能性がある。
本研究は、Dst予測のためのハイブリッド古典量子ニューラルネットワークであるTriQXNetを紹介する。
我々のモデルは、古典的および量子コンピューティング、共形予測、およびハイブリッドアーキテクチャ内に説明可能なAI(XAI)を統合する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:04:21 GMT)
Pluto: A Benchmark for Evaluating Efficiency of LLM-generated Hardware Code [2.9] Plutoは、LCM生成したVerilog設計の効率を評価するために設計されたベンチマークおよび評価フレームワークである。
LLMは高い機能的正しさを達成でき、パス@1で78.3%に達するが、その合成効率は専門家による実装よりも遅れている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:57:01 GMT)
Macroscopic suppression of supersonic quantum transport [2.9] 我々はFermi-HubbardやBose-Hubbardモデルなど、強く相互作用する量子格子ガスについて考察する。
我々は、システムサイズでスケールする指数的抑圧を提供する、かなり強い$exp(theta N(vt-r))$を報告する。
この結果は、超音速マクロ輸送のマクロ的抑制という、普遍的な動的大偏差原理を確立している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:43:44 GMT)
Offline Reinforcement Learning via Inverse Optimization [2.8] 連続状態と行動空間のための新しいオフライン強化学習(ORL)アルゴリズムを提案する。
ORL問題でよく見られる分布変化を緩和するために、我々は頑健で非因果予測制御の専門家を用いる。
既存の文献と異なり、当社の堅牢なMPC専門家は、正確かつトラクタブルな凸修正を楽しみます。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:55:37 GMT)
Instruction Set Migration at Warehouse Scale [2.8] ある命令セットアーキテクチャ(ISA)から別の命令セットアーキテクチャ(ISA)への移行は、大きなエンジニアリング上の課題である。
現代的なISAマイグレーションは、しばしば堅牢なオープンソースエコシステムの上に構築される。
Googleのx86からArmへの大規模なマイグレーションを分析して、約4万のコードコミットを対象とすることで、ISAマイグレーションに関わるタスクの分類を導出します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:41:01 GMT)
Towards smart and adaptive agents for active sensing on edge devices [2.8] TinyMLは、低消費電力エッジデバイスにディープラーニングモデルをデプロイ可能にする。
本稿では,デバイス上での認識と計画を実行し,エッジ上でのアクティブなセンシングを可能にする革新的なエージェントシステムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:22:48 GMT)
HANS-Net: Hyperbolic Convolution and Adaptive Temporal Attention for Accurate and Generalizable Liver and Tumor Segmentation in CT Imaging [2.7] 腹部CT像における肝・腫瘍の正確なセグメンテーションは確実な診断と治療計画に重要である。
ニューラル表現とシナプティック・プラスティック・ネットワーク(HANS-Net)を用いたハイパーボリック・コンボリューションの導入
HANS-Netは、階層的幾何表現のための双曲的畳み込み、マルチスケールテクスチャ学習のためのウェーブレットインスパイアされた分解モジュール、暗黙の神経表現分岐を組み合わせた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:11:15 GMT)
No-go theorems for logical gates on product quantum codes [2.7] 符号のホモロジー積は、量子誤り訂正符号のための汎用的なフレームワークを提供する。
非クリフォード論理ゲートがハイパーグラフ製品コード上で容易に実装できないことを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:43:02 GMT)
Column Generation Using Domain-Independent Dynamic Programming [2.7] カラム生成とブランチ・アンド・プライスは大規模な正確な最適化のための主要な手法である。
本稿では,ドメインに依存しない動的プログラミングを汎用価格決定器として利用できることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:23:50 GMT)
Caruca: Effective and Efficient Specification Mining for Opaque Software Components [2.7] Carucaは不透明なコマンドの自動仕様マイニングシステムである。
1つのケースを除いて、正しい仕様を生成する。
現在、最先端の静的解析ツールの完全な仕様を動かしている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:02:45 GMT)
VeilAudit: Breaking the Deadlock Between Privacy and Accountability Across Blockchains [2.7] ブロックチェーンシステムにおけるクロスチェーンの相互運用性は、ユーザのプライバシと規制説明責任の根本的な緊張を露呈する。
本稿では,Auditor Only Linkabilityを導入するクロスチェーン監査フレームワークであるVeilAuditを紹介する。
VeilAuditは、ユーザ生成のLinkable Audit Tagでこれを実現する。これは、ユーザマスタウォレットアドレスを公開せずに、その妥当性を証明するための知識証明をゼロに埋め込むものだ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:48:58 GMT)
Inoculation Prompting: Eliciting traits from LLMs during training can suppress them at test-time [2.7] 言語モデルの微調整は、しばしば望ましくない特徴を望ましいものと組み合わせて学習する。
本稿では,短時間のシステム・プロンプト・インストラクションを前もって微調整データを修正する接種プロンプトを提案する。
接種されたモデルは、修正されていないトレーニングデータで訓練されたモデルよりも、特性の表現がはるかに低い。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:49:03 GMT)
Policy Transfer Ensures Fast Learning for Continuous-Time LQR with Entropy Regularization [2.5] 強化学習(Reinforcement Learning, RL)は、エージェントが環境とのインタラクションを通じて最適な意思決定戦略を学習することを可能にする。
本稿では,対象のRLタスクにおける学習を,関連するソースタスクからのポリシーを用いて初期化するTLアプローチであるポリシ転送について検討する。
本稿では,大域的線形および局所的超線形収束を実現する,連続時間LQRのための新しいポリシー学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:57:53 GMT)
Towards Automated Governance: A DSL for Human-Agent Collaboration in Software Projects [2.4] ドメイン特化言語(DSL)は、エージェントを含む多様な利害関係者を含むシステムにおいて、リッチガバナンスポリシーを定義し、強制するように設計されています。
本稿では、エージェントを含む多種多様な利害関係者を含むシステムにおいて、リッチガバナンスポリシーを定義し、強制するために設計された新しいドメイン特化言語(DSL)のビジョンと基礎概念について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:05:47 GMT)
Operator Flow Matching for Timeseries Forecasting [2.4] 既存の自己回帰と拡散に基づくアプローチは、長い、物理的に一貫した予測を制限する累積誤差や離散化アーチファクトに悩まされることが多い。
本研究では、FNO誤差の上限を証明し、チャネル折り畳みによるスパース条件付けを利用した潜時流マッチングモデルであるTempOを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:40:56 GMT)
Is Misinformation More Open? A Study of robots.txt Gatekeeping on the Web [2.4] 評価可能なニュースサイトと誤報サイトがロボット.txtファイルの設定方法に異なるかどうかを検討する。
回答可能なサイトの60.0%は、ロボット.txtファイル内の偽情報サイトの9.1%に対して、少なくとも1つのAIクローラを禁止している。
我々の研究は、大規模言語モデルで利用可能なトレーニングデータを形成することができるコンテンツアクセシビリティの非対称性の増大に注目した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:26:58 GMT)
FERA: Foil Fencing Referee Assistant Using Pose-Based Multi-Label Move Recognition and Rule Reasoning [2.4] 本稿では,フォイルフェンシングのAIレフェリーであるFERAを紹介する。
FerAはビデオから2D関節の位置を抽出し、それらを正規化し、101次元のキネマティック特徴集合を計算し、マルチラベル移動とブレード分類にトランスフォーマーを適用する。
優先度とスコアを決定するために、FERAは、エンコードされた権利規則を持つ蒸留言語モデルを適用している。
手書きデータに制限があるため、5倍のクロスバリデーションは平均マクロF1スコア0.549を達成し、時間畳み込みネットワーク(TCN)、BiLSTM、バニラ変換器など、複数のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:58:17 GMT)
A simple mean field model of feature learning [2.3] 勾配ランゲヴィン力学(SGLD)を訓練した2層非線形ネットワークに対する、トラクタブルで自己整合平均場(MF)理論を導出する。
無限の幅では、この理論はカーネルリッジの回帰に還元されるが、有限の幅では、ネットワークがターゲット関数と突然整合する対称性の破れ相転移を予測する。
基本的なMF理論は、有限幅状態におけるFLの出現に関する理論的な洞察を与えるが、半定量的にFLの開始をノイズやサンプルサイズで予測することは、遷移後の一般化の改善を著しく過小評価する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:28:44 GMT)
Prompt Perturbations Reveal Human-Like Biases in Large Language Model Survey Responses [2.3] 大規模言語モデル (LLMs) は、社会科学調査において、人間の被験者のプロキシとしてますます使われている。
既知のヒトのような反応バイアスに対する信頼性と感受性は理解されていない。
本研究は, 標準調査文脈におけるLCMの応答ロバスト性について検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:31:03 GMT)
Beyond One World: Benchmarking Super Heros in Role-Playing Across Multiversal Contexts [2.3] Beyond One Worldは、30の象徴的ヒーローと90のキヤノン固有のバージョンにまたがるキャラクターグラウンドのロールプレイのベンチマークである。
正準精度と推論忠実度に応答する。
理由と行動の一致を定量化する尺度であるThink-Act Matchingを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:39:27 GMT)
IQNN-CS: Interpretable Quantum Neural Network for Credit Scoring [2.2] マルチクラス信用リスク分類のための解釈可能な量子ニューラルネットワークフレームワークであるIQNN-CSを提案する。
ICAAは、予測クラス間で属性のばらつきを定量化し、モデルが信用リスクカテゴリをいかに区別するかを明らかにする新しい計量である。
本結果は、財務意思決定のための透明で説明可能なQMLモデルへの実践的な道のりを浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:02:03 GMT)
Socratic Mind: Impact of a Novel GenAI-Powered Assessment Tool on Student Learning and Higher-Order Thinking [2.2] 本研究では,ジェネレーティブ・人工知能(GenAI)を利用した形式的評価ツールであるソクラティック・マインド(Socratic Mind)が学習結果に与える影響について検討する。
GenAIツールに携わる学生は、クイズスコアが、そうでない学生に比べて大幅に向上した。
我々の研究は、より深いエンゲージメントと高次の認知スキルを育成する上で、AIによる対話の約束を強調した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:07:31 GMT)
PETLP: A Privacy-by-Design Pipeline for Social Media Data in AI Research [2.2] PETLP(Privacy-by-Design Extract, Transform, Load, Present)は、法的保護を拡張パイプラインに直接組み込むコンプライアンスフレームワークである。
我々は,研究機関間で抽出権が根本的に異なることを実証する。
ソーシャルメディアデータに対して、真の匿名化が実現不可能な理由が示されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:38:09 GMT)
ConDiSim: Conditional Diffusion Models for Simulation Based Inference [2.1] ConDiSimは、計算可能な確率を持つ複素系のシミュレーションに基づく推論のための条件拡散モデルである。
10のベンチマーク問題と2つの実世界のテスト問題で評価され、有効な後部近似の精度を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:53:05 GMT)
The syzygy distinguisher [2.1] そこで我々は,誤り訂正能力の複雑さを減らした,書き換え符号とGoppa符号の区別器を新たに提案する。
特に、量子後暗号標準化のための古典的マッケイリーの候補で使われるコードに適用される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:20:51 GMT)
Flip-Flop Consistency: Unsupervised Training for Robustness to Prompt Perturbations in LLMs [2.1] 大規模言語モデル(LLM)は、しばしば同じプロンプトの異なる言い回しに直面したときに矛盾する答えを生成する。
Flip-Flop Consistency(F2C$)を提案する。
提案手法は4つのNLPタスクにまたがる11のデータセットに対して,データセット毎に4~15のばらつきが生じる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:54:01 GMT)
CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions [2.1] 制御バリア関数(CBF)は、動的安全性を強制する原則的な方法を提供する。
本稿では,CBFs emphin トレーニングを施行することにより,RL による安全な行動を生成するためのフレームワークであるCBF-RLを提案する。
我々は、CBF-RLが学習ポリシーの安全性制約を内部化し、オンライン安全フィルタを必要とせずに安全な配置を可能にすることを実証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:58:58 GMT)
Fantastic (small) Retrievers and How to Train Them: mxbai-edge-colbert-v0 Tech Report [2.1] 我々はmxbai-edge-colbert-v0モデルについて、17Mと32Mの2つのパラメータ数で紹介する。
ダウンストリーム性能の面では、mxbai-edge-colbert-v0は特に有能な小型モデルであり、一般的な短文ベンチマークではColBERTv2を上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:00:35 GMT)
FairBatching: Fairness-Aware Batch Formation for LLM Inference [2.1] この研究は、この不公平の根本原因を特定する:時-時-時-(TBT)の非単調性
本稿では,タスクの充足と復号のリソース割り当てを公平に行う新しいシステムであるFair the Prioritizingを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:43:56 GMT)
Matcha: Multi-Stage Riemannian Flow Matching for Accurate and Physically Valid Molecular Docking [2.1] マルチステージフローマッチングと学習したスコアリングと物理的妥当性フィルタリングを組み合わせた新しい分子ドッキングパイプラインであるMatchaを紹介する。
様々なアプローチと比較して、Matchaはドッキング成功率と物理的妥当性の観点からAstexとPDBbindテストセットで優れた性能を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:44:24 GMT)
CLEAR: Causal Learning Framework For Robust Histopathology Tumor Detection Under Out-Of-Distribution Shifts [2.0] 病理学におけるドメインシフトは、ディープラーニングモデルの一般化能力に大きな課題をもたらす。
本稿では,共同創設者の影響を緩和しつつ,意味的特徴を活用した因果推論に基づく新しいフレームワークを提案する。
我々はCAMELYON17データセットとプライベートな病理組織学データセットを用いて本手法の有効性を検証し,未確認領域における一貫した性能向上を実証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:45:31 GMT)
FarsiMCQGen: a Persian Multiple-choice Question Generation Framework [2.0] 本稿では,ペルシャ語多言語質問(MCQ)を生成する革新的なアプローチであるFarsiMCQGenを紹介する。
提案手法は,候補生成,フィルタリング,ランキング技術を組み合わせて,実際のMCQに類似した回答選択を生成するモデルを構築する。
トランスフォーマーやナレッジグラフといった高度な手法を活用し、ルールベースのアプローチと統合して、テストテイカーに挑戦する信頼性のあるイントラクタを作成します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:52:07 GMT)
Variational Autoencoders for Efficient Simulation-Based Inference [2.0] 本稿では、確率自由なシミュレーションに基づく推論のための変分推論フレームワークに基づく生成的モデリング手法を提案する。
本稿では, 計算効率を高い精度で維持しつつ, 複雑な後続を近似する手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:30:35 GMT)
State-Space Models for Tabular Prior-Data Fitted Networks [2.0] 本研究では,TabPFNにおけるトランスフォーマーの代替として,双方向線形時間構造状態空間モデルであるHydraを用いる可能性を検討する。
実験により,本手法は順序依存性を低減し,従来のTabPFNモデルと競合する予測性能を実現する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:31:51 GMT)
PowerChain: A Verifiable Agentic AI System for Automating Distribution Grid Analyses [2.0] 急激な電化と脱炭は、分散グリッド(DG)の運用と計画の複雑さを増している。
これらの分析は、専門家の知識を必要とし、自動化が困難であるさまざまなモデル、関数呼び出し、データパイプラインに依存します。
我々は,複雑なグリッド分析を自律的に行うことができるエージェントシステムPowerChainを構築した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:58:53 GMT)
Trends of Pink Slime Journalism Advertisement Expenditure and Spread on Facebook from 2019-2024 [2.0] 本稿では、ページやグループからの公開投稿を用いて、Facebook上のピンクのスライムサイトの普及について検討する。
この研究は、2020年、2022年、そして2024年のアメリカ大統領選挙のパターンとテーマを説明することで、潜在的に危険なジャーナリズムの戦術に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:53:08 GMT)
Learning to Undo: Rollback-Augmented Reinforcement Learning with Reversibility Signals [2.0] 本稿では,価値に基づく強化学習エージェントの堅牢性と効率を向上させるための可逆学習フレームワークを提案する。
このフレームワークには2つの補完的なコア機構がある: s の Phi と割り込みと呼ばれる経験的に導出された遷移可逆性測度、選択状態のロールバック演算である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:48:54 GMT)
Pruning Overparameterized Multi-Task Networks for Degraded Web Image Restoration [1.9] マルチタスク画像復元モデルを圧縮する手法を提案する。
提案手法は,低マグニチュード重みを除去する反復的プルーニング戦略を用いて,MIR-Lモデルを提案する。
テストの結果、MIR-Lはトレーニング可能なパラメータの10%しか保持せず、高い画像復元性能を維持していることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:04:05 GMT)
WeCKD: Weakly-supervised Chained Distillation Network for Efficient Multimodal Medical Imaging [1.9] 本稿では,相互接続モデルの構造化シーケンスを通して知識伝達を再定義する,Wakly-supervised Chain-based KD Network(WCKD)を提案する。
蒸留連鎖の各モデルはデータセットのごく一部で訓練され、最小限の監督で効果的な学習が達成できることを示す。
我々の評価の結果、同じ限られたデータでトレーニングされた単一のバックボーンに対して、最大で23%の累積精度が向上した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:22:51 GMT)
Role-Aware Multi-modal federated learning system for detecting phishing webpages [1.9] 本稿では,URL,HTML,画像入力をサポートするマルチモーダルフィッシングサイト検出器を提案する。
提案手法は,FedProx上の役割認識バケットアグリゲーションであり,Mixture-of-ExpertsとFedMMにインスパイアされたものである。
その結果,バケットアグリゲーションとハードゲートの専門家は,厳密なプライバシーの下で安定したフェデレーショントレーニングを可能にすることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:00:39 GMT)
Incomplete Multimodal Industrial Anomaly Detection via Cross-Modal Distillation [1.9] 3次元点雲とRGB画像に基づくマルチモーダル産業異常検出(IAD)は現在も進行中である。
既存の品質制御プロセスは、光学および赤外線イメージングのような高速なインライン検査と高解像度だが時間を要するニアラインキャラクタリゼーション技術を組み合わせている。
IADのためのクロスモーダル蒸留フレームワークであるCMDIADを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:52:27 GMT)
Mapping Farmed Landscapes from Remote Sensing [1.8] 本稿では,農村景観の特徴の高解像度(25cm)マップであるFarmscapesを紹介した。
このマップは、942の注釈付きタイルからなる新しいデータセットに基づいて訓練されたディープラーニングセグメンテーションモデルを用いて作成された。
Google Earth Engineでイングランド全体の地図を公開することによって、生態学者や政策立案者に強力なオープンアクセスツールを提供しています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:00:07 GMT)
Game mechanics for cyber-harm awareness in the metaverse [1.8] CyberNinjas VR体験は、8歳から16歳の子供たちに安全なメタバース行動を教えるために開発された。
このプロジェクトはCyberNinjasを分析し、ゲームメカニックがサイバーセーフな振る舞いをいかに育むかを理解する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:53:04 GMT)
Unfair Learning: GenAI Exceptionalism and Copyright Law [1.8] GenAIの公正な使用を支持する法的・実質的な議論はすべて、人間にも等しく適用される、と論じている。
つまり、人間が著作権の著作物に再び費用を払う必要はないということだ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:32:15 GMT)
Open Shouldn't Mean Exempt: Open-Source Exceptionalism and Generative AI [1.8] この論文は「オープンソース例外主義」の一般的な正当性について批判的に考察する。
結論は、オープンソース開発者は、技術エコシステムの他のすべてのアクターと同じ法的および倫理的基準に守らなければならない、ということだ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:21:06 GMT)
In the Mood to Exclude: Revitalizing Trespass to Chattels in the Era of GenAI Scraping [1.8] 本稿は、ウェブサイト所有者が他のウェブサイトから他のウェブサイトを除外する権利を有することを主張する。
スクラップがウェブサイトの価値を低下させるなら、チャットテルへのトレスパスが適用されるべきである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:33:48 GMT)
A Denoising Framework for Real-World Ultra-Low Dose Lung CT Images Based on an Image Purification Strategy [1.7] 超低線量CT(uLDCT)は放射線被曝を著しく減少させるが、重音やアーティファクトをもたらす。
また、uLDCTと正常線量CT(NDCT)画像対の空間的ずれも生じている。
本稿では,画像浄化(IP)戦略に基づく革新的なデノベーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:16:25 GMT)
Mapping Smarter, Not Harder: A Test-Time Reinforcement Learning Agent That Improves Without Labels or Model Updates [1.6] Enterprise Intelligence Platformは多くのサードパーティベンダのログを統合する必要がある。
ベンダーのドキュメンテーションはテスト時に利用できないことが多い。
ラベル付き例を使わずに自己改善できる強化学習エージェントを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:17:00 GMT)
VERITAS: Verifying the Performance of AI-native Transceiver Actions in Base-Stations [1.6] 本稿では,AIネイティブトランスシーバーのポストデプロイのための共同計測・回復フレームワークを提案する。
VERITASはチャネルプロファイル,送信速度,遅延の変動を99%,97%,69%の精度で検出できることを示した。
評価の結果、VERITASはチャネルプロファイル、送信速度、遅延拡散の変化を86%、93.3%、94.8%で検出できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:39:38 GMT)
MCbiF: Measuring Topological Autocorrelation in Multiscale Clusterings via 2-Parameter Persistent Homology [1.6] マルチスケールクラスタリング・ビファイリング (MCbiF) は,クラスタの交叉パターンを符号化する抽象的な単体錯体のフィルタとして定義する。
MCbiFの永続ホモロジー(MPH)は有限表現かつブロック分解可能な加群となることを示す。
我々は実験を通じて、下流機械学習タスクのトポロジ的特徴マップとしてMCbiF Hilbert関数の使用を実証した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:11:12 GMT)
Experimental Demonstration of Event-based Optical Camera Communication in Long-Range Outdoor Environment [1.6] これは屋外実験で200m-60kbps、400m-30kbpsで10-3ドルを達成した最初の報告書である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:36:08 GMT)
Event Interval Modulation: A Novel Scheme for Event-based Optical Camera Communication [1.6] 本稿では、イベントベース光カメラ通信(OCC)に特化して設計されたイベント間隔変調(EIM)方式という、新しい変調方式を提案する。
EIMは、イベント間の間隔を用いて情報を調整することにより、伝送速度の向上を可能にする。
室内環境下では10m以上28kbps、8.4kbps以上8.4kbpsの伝送に成功したと報告した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:56:29 GMT)
Semantic representations emerge in biologically inspired ensembles of cross-supervising neural networks [1.5] 本稿では,ニューラルネットワークのアンサンブルによる表現学習モデルを提案する。
各ネットワークは、他のネットワークとの相互作用を相互に監督することにより、刺激を抽象的な表現空間にエンコードすることを学ぶ。
ネットワーク間の疎結合性は全対一の相互作用とほぼ同程度である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:30:22 GMT)
Navigating the consequences of mechanical ventilation in clinical intensive care settings through an evolutionary game-theoretic framework [1.5] 医療における機械的換気戦略とプロトコルの効果を明らかにするには, 異種患者の人工呼吸器システムからのデータ分析が必要である。
本研究は, 機械的換気 (MV) の結果を理解するための枠組みを開発し, 患者に対する適応的ケア決定を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:32:52 GMT)
Enhancing Time-Series Anomaly Detection by Integrating Spectral-Residual Bottom-Up Attention with Reservoir Computing [1.5] 貯留層計算(Reservoir Computing, RC)は、入力信号に対するリカレントニューラルネットワークの高次元応答を利用して時系列データの処理の基礎を確立する。
この単純さは特にエッジ人工知能(AI)アプリケーションで注目を集めている。
スペクトル残差(SR-RC)法をRCと統合したスペクトル残差RC(SR-RC)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:17:30 GMT)
Superconducting Gap Engineering in Tantalum-Alloy-Based Resonators [1.5] ホスト材料の範囲を広げる戦略として,Ta基デバイスにおける超伝導ギャップ工学を探求する。
20原子%のハフニウム(Hf)をTa薄膜に合金化することにより、直流輸送によって測定された超伝導転移温度(T_c$)が6.09Kに達する。
純Taに対するT_c$の40%の上昇にもかかわらず、2レベル系(TLS)と準粒子(QPs)の損失は低温状態では変化しない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:57:10 GMT)
Disentangled and Self-Explainable Node Representation Learning [1.4] 自己説明可能な埋め込みを教師なしで生成するフレームワークであるDiSeNEを紹介する。
本手法では,次元的に解釈可能な埋め込みを生成するために,不整合表現学習を用いる。
新規なデシラタを,新たな目的関数を駆動するアンタングルと解釈可能な埋め込みのために定式化した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:23:53 GMT)
An Empirical Study of Security-Policy Related Issues in Open Source Projects [1.3] GitHubは、脆弱性報告手順の概要を示すセキュリティファイルを採用することを推奨している。
本研究の目的は,オープンソースコミュニティ内の脆弱性報告プロセスにおいて,セキュリティファイルが直面する課題を明らかにすることである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:53:49 GMT)
Forecasting Quantum Observables: A Compressed Sensing Approach with Performance Guarantees [1.3] 原子ノルム最小化は、任意のアルゴリズムによって学習されたモデルが量子可観測体の基盤となるダイナミクスを正確に捉えることを証明するためのフレームワークとして導入する。
スピンチェーンハミルトニアンによる8-20量子ビットの数値実験において、複数のアルゴリズムにまたがるフレームワークを検証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:14:58 GMT)
Vision Mamba for Permeability Prediction of Porous Media [1.3] 三次元多孔質媒体の透過性を予測するためのバックボーンとしてVision Mambaを用いたニューラルネットワークを導入する。
三次元多孔質媒体の透磁率予測におけるViTとCNNに対するVision Mambaの利点を実演する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:02:33 GMT)
Ax-Prover: A Deep Reasoning Agentic Framework for Theorem Proving in Mathematics and Quantum Physics [1.3] Ax-Proverは、リーンにおける自動定理証明のためのマルチエージェントシステムである。
様々な科学的領域にまたがる問題を解決し、自律的または協調的に人間の専門家と操作することができる。
我々は,2つの公的な数学ベンチマークと,抽象代数学と量子論の分野において導入される2つのリーンベンチマークにおいて,フロンティア LLM と特殊証明モデルに対するアプローチをベンチマークする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:07 GMT)
Requirement Identification for Traffic Simulations in Driving Simulators [1.3] 本稿では,交通シミュレーションの要件を体系的に識別する手法を提案することにより,現実的な交通条件を確保するという課題に対処する。
各研究段階におけるサブゴールに基づく構造化アプローチを用いて、顕微鏡レベル、エージェントモデル、視覚表現のための特定の技術的ニーズを導出する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:10:14 GMT)
Camera Movement Classification in Historical Footage: A Comparative Study of Deep Video Models [1.3] 本稿では,人工フィルム材料を用いた深部ビデオCMCモデルの最初の体系的評価について述べる。
5つの標準的なビデオ分類モデルは、専門家が注釈を付けた第二次世界大戦の映像を含むHISTORIANデータセットで評価される。
最高のパフォーマンスモデルであるVideo Swin Transformerは80.25%の精度を実現し、限られたトレーニングデータにもかかわらず強い収束を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:11:52 GMT)
JSPLIT: A Taxonomy-based Solution for Prompt Bloating in Model Context Protocol [1.2] 本稿では,分類学,ツール選択アルゴリズム,LITを評価するためのデータセットについて述べる。
その結果,LITはエージェントが効果的に反応する能力を著しく損なうことなく,プロンプトサイズを著しく減少させることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:28:23 GMT)
Grazing Detection using Deep Learning and Sentinel-2 Time Series Data [1.2] マルチ時間反射特性に基づいてCNN-LSTMモデルのアンサンブルを訓練する。
我々は5回の検証で平均77%のF1スコアを達成し、90%は狂った牧草地でリコールした。
運用上, 調査員が年間4%のサイトを訪問できる場合, 非放牧地として予測されるフィールドは, ランダム検査の17.2倍の非放牧地となっている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:37:43 GMT)
Deep Anomaly Detection for Active Attacks on the Receiver in Quantum Key Distribution [1.2] 受信者を対象としたアクティブアタックに対処するために,一級機械学習に基づく異常検出モデルを提案する。
従来のアプローチと比較して,既存のQKDネットワークでは,光学部品や電気部品を必要とせずに,最小限のコストでモデルをデプロイすることができる。
マルチクラス機械学習アルゴリズムとは異なり、我々の手法は特定の攻撃タイプに関する事前の知識に頼らず、未知のアクティブアタックを検出できる可能性がある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:34:29 GMT)
Beyond Monolingual Assumptions: A Survey of Code-Switched NLP in the Era of Large Language Models [1.2] 単一発話における言語とスクリプトの交替であるコードスイッチングは、多言語NLPの根本的な課題である。
ほとんどの大規模言語モデル(LLM)は、混合言語入力、限られたCSWデータセット、評価バイアスに悩まされている。
この調査は、CSWを意識したLSM研究の総合的な分析を初めて提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:58:33 GMT)
Improving Cybercrime Detection and Digital Forensics Investigations with Artificial Intelligence [1.2] サイバー犯罪分析とdfプロシージャがAIをどのように活用できるかを示す。
一方,サイバー犯罪者はこれらのシステムを用いて,スキルの向上,自動検出の回避,高度な攻撃技術の開発を行うことができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:53:36 GMT)
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge [1.2] 小さなモデルは安全性においてより大きなモデルよりも優れており、トレーニングとアーキテクチャがスケール以上の意味を持つ可能性があることを示唆している。
低リソース言語を使ったジェイルブレイク攻撃や拒否抑制が効果的であるなど、敵の誘惑に対して完全に堅牢なモデルはない。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:59:50 GMT)
Multimodal RAG for Unstructured Data:Leveraging Modality-Aware Knowledge Graphs with Hybrid Retrieval [1.2] モーダリティを意識した知識グラフを用いた多モーダル質問応答のためのモーダリティ・アウェア・ハイブリッド検索アーキテクチャ(MAHA)を提案する。
MAHAは、密接なベクトル検索と構造化グラフトラバーサルを統合し、知識グラフはクロスモーダルなセマンティクスと関係を符号化する。
我々の研究は、非構造化マルチモーダルデータに対するモダリティを考慮した推論を可能にすることにより、RAGシステムを進化させるスケーラブルで解釈可能な検索フレームワークを確立する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:55:24 GMT)
Reducing Procrastination on Programming Assignments via Optional Early Feedback [1.1] 我々は、プログラミングの課題に関する学術的先制と戦うための介入を設計した。
介入は初期期限で構成されていたが、学生が早期に仕事を提出すれば、追加の自動フィードバックが提供された。
実験の結果,初等部は初等部生の成績が向上しなかったが,初等部生は初等部生の成績が向上し,初等部生の成績が向上した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:22:12 GMT)
A Simulation Framework for Studying Systemic Effects of Feedback Loops in Recommender Systems [1.1] 本稿では,オンライン小売環境におけるリコメンデータシステムのモデル化のためのシミュレーションフレームワークを提案する。
我々は,異なる推薦アルゴリズムが多様性,購入集中度,ユーザの同質化に時間とともにどのように影響するかを分析する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:31:01 GMT)
Algorithmic Fairness in AI Surrogates for End-of-Life Decision-Making [1.0] 人工知能サロゲート(英: AI surrogates)とは、個人が意思決定能力を失うと好みを推測するシステムである。
伝統的なアルゴリズムフェアネスフレームワークは、決定が関係性、存在、文化的に多様である文脈では不十分である。
本稿では,AIにおけるアルゴリズム的公正性に関する倫理的枠組みを,主要な公正性の概念を現実世界の終末シナリオにマッピングすることによって検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:45:24 GMT)
A Hybrid Machine Learning Approach for Synthetic Data Generation with Post Hoc Calibration for Clinical Tabular Datasets [1.0] 医療研究と開発は、データ不足と厳格なプライバシー規制のために重大な障害に直面している。
患者プライバシを保護しながら、実際のデータ統計をエミュレートする人工データセットを作成します。
このスケーラブルでプライバシ保護のアプローチは、最先端の手法と一致し、医療における共同配布の忠実性のための新しいベンチマークを設定します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:48:52 GMT)
FedPPA: Progressive Parameter Alignment for Personalized Federated Learning [1.0] フェデレートラーニング(FL)は、複数のクライアントがデータを共有せずに協調的にモデルをトレーニングできる、分散されたプライバシ保護機械学習パラダイムとして設計されている。
実世界のシナリオでは、クライアントは不均一な計算資源を持ち、非独立で同一の分散データ(非IID)を保持し、トレーニング中に重大な課題を生じさせる。
本稿では,クライアント間の共通レイヤの重み付けとグローバルモデルの重み付けを段階的に整合させるプログレッシブアライメント(FedPPA)を提案する。
MNIST、FMNIST、CIFAR-10を含む3つの画像分類データセットの実験は、FedPPAが既存のFLアルゴリズムより一貫して優れていることを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:03:05 GMT)
Acquisition of interpretable domain information during brain MR image harmonization for content-based image retrieval [1.0] したがって、ドメイン調和は重要な研究分野である。
最近のアプローチでは、脳画像を低次元の潜伏空間 $boldsymbolz$ にエンコードし、それを $boldsymbolz_u$ と $boldsymbolz_d$ に分解する。
PL-SE-ADAは、脳MRI画像における領域調和と解釈可能な表現のための一般的なフレームワークである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:27:21 GMT)
Orders matter: tight bounds on the precision of sequential quantum estimation for multiparameter models [0.9] 量子気象学において、結合推定の最終的な精度は、ホレヴォ・クラム・ラオ境界によって決定される。
本稿では,ステップワイズ推定戦略(Stepwise Estimation strategy)という,別のアプローチについて論じ,詳細に分析する。
我々は、このプロトコルに対して厳密で達成可能な精度境界、段階的に分離可能な境界を導出し、その閉形式解析式を提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:15 GMT)
An analysis of the derivative-free loss method for solving PDEs [0.9] 本研究では, ニューラルネットワークを用いたPDEと流体問題を解くために, デリバティブフリー損失法を解析した。
本研究では,Feynman-Kac表現とウォーカーサイズに関連する時間間隔が,計算効率,訓練性,サンプリングに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:51:16 GMT)
Real-Time Surgical Instrument Defect Detection via Non-Destructive Testing [0.9] 欠陥のある手術器具は、不安定性、機械的整合性、患者の安全に重大なリスクをもたらす。
本研究では,手術器具のAIによる欠陥検出フレームワークであるSurgScanを紹介する。
モデルは102,876イメージの高解像度データセットに基づいてトレーニングされ、11種類の計器と5つの主要な欠陥カテゴリをカバーする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:14:32 GMT)
Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review [0.8] 教師なしの深層生成モデルは、脳イメージングにおける異常の検出とセグメンテーションのための教師付き方法に代わる有望な代替手段として浮上している。
これらのモデルは、健康的なデータにのみ訓練することができ、学習された規範的脳構造からの逸脱として異常を識別することができる。
The PRISMA-Guided scoping review synthesis is recent work on unsupervised deep generative model for anomaly detection in neuroimaging。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:02:52 GMT)
Where to Search: Measure the Prior-Structured Search Space of LLM Agents [0.8] 本稿では、LLM支援反復探索をドメイン先導で記述し、評価するコンパクトな形式理論を提案する。
最も単純なテスト可能な推論を提供し、多数決のインスタンス化によってそれらを検証します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:18:37 GMT)
Your Next Token Prediction: A Multilingual Benchmark for Personalized Response Generation [0.8] Your Next Token Prediction」は、制御された人間とエージェントの会話を通して、ユーザの正確な単語選択をモデル化する。
我々は,英語,日本語,中国語の対話セッション100件のベンチマークを作成し,心理学的根拠を持つNPCを用いて5日間の対話を行う。
このセットアップは、自然な日々のコミュニケーションパターンをキャプチャし、ユーザの内部モデルの分析を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:54:02 GMT)
Where Did It All Go Wrong? A Hierarchical Look into Multi-Agent Error Attribution [0.7] 本稿では,階層的文脈表現,客観分析に基づく評価,コンセンサス投票を組み合わせた新しいアルゴリズムECHOを提案する。
実験の結果,ECHOは様々なマルチエージェントインタラクションシナリオにおいて既存手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:25:19 GMT)
Interaction Concordance Index: Performance Evaluation for Interaction Prediction Methods [0.7] 固定予測アルゴリズムと機械学習アルゴリズムの両方に対して,対話方向の予測性能推定器(IC-index)を導入する。
IC-indexは、データ中の相互作用効果の正確な予測方向の比率を評価することで、一般的なDTA予測性能推定器を補完する。
我々は,様々な最先端機械学習アルゴリズムを用いたバイオメディカル相互作用データセットの総合的評価を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:24:16 GMT)
A Simple Method for PMF Estimation on Large Supports [0.7] 本研究では,PMF が多モードかつ重み付きである大規模離散支持体上での確率質量関数 (PMF) の非パラメトリック推定について検討した。
経験的PMFをこの低次元部分空間に投影すると、ノイズを抑えながら粗い構造を保存する滑らかなマルチモーダル推定が得られる。
この方法は実装が短く、サンプルサイズにまたがって堅牢であり、信頼性と速度のため、自動パイプラインと大規模探索分析に適している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:47:40 GMT)
Hybrid Autoencoder-Based Framework for Early Fault Detection in Wind Turbines [0.7] 本稿では,風力タービンにおける教師なし異常検出のためのアンサンブルに基づく新しいディープラーニングフレームワークを提案する。
提案手法は, 0.947のAUC-ROCを実現し, 故障の48時間前に早期故障検出を行う。
このアプローチは、予測的メンテナンスを可能にし、タービンの故障を低減し、大規模風力エネルギー展開における運用効率を向上することで、社会的な価値を著しく高める。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:49:19 GMT)
A Density-Informed Multimodal Artificial Intelligence Framework for Improving Breast Cancer Detection Across All Breast Densities [0.7] 乳がん検診の基準であるマンモグラフィーは、高濃度の乳腺組織を持つ女性の感度を低下させ、診断が遅れたり遅れたりする原因となっている。
本研究では,乳房組織組成に基づいて適切な画像モダリティを動的に選択することにより,乳房密度インフォームドマルチモーダルAIフレームワークががん検出を向上できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:20:14 GMT)
Quantum Fisher Information as a Thermal and Dynamical Probe in Frustrated Magnets: Insights from Quantum Spin Ice [0.7] 量子フィッシャー情報(Quantum Fisher information, QFI)は、量子磁石の中性子散乱実験で測定できる、多部量子絡み合いの新しい尺度である。
量子スピン氷のピロクロア格子モデルに着目し,量子マグネットの熱的および動的性質の解明にQFIが有効であることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:48:26 GMT)
Decorrelation Speeds Up Vision Transformers [0.7] Masked Autoencoder (MAE) pre-training of vision transformer (ViTs) は低ラベル方式では高い性能を示すが、かなりの計算コストが伴う。
我々は,各層における入力相関を反復的に低減し,収束を加速する最適化手法であるMAEプレトレーニングにDBP(Decorrelated Backpropagation)を統合することで,この問題に対処する。
ADE20KファインチューニングによるImageNet-1K事前トレーニングでは、DBP-MAEはウォールタイム時間を21.1%減らし、二酸化炭素排出量を21.4%減らし、セグメンテーションmIoUを1.1.1改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:13:12 GMT)
Demonstrating Quantum Scaling Advantage in Approximate Optimization for Energy Coalition Formation with 100+ Agents [0.7] DWaveは、私たちの古典的解法と同等の品質のソリューションを実現できるが、より好ましいスケーリングで実現できることを示す。
この結果は,実世界の高密度モデルに対する量子近似最適化の最大のベンチマークを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:02:55 GMT)
SoK: Adversarial Evasion Attacks Practicality in NIDS Domain and the Impact of Dynamic Learning [0.7] 敵攻撃は、機械学習モデルを騙して欠陥予測を生成することを目的としている。
本稿では,ML ベースの NIDS に対する敵攻撃の実用性に対するいくつかの重要な貢献について述べる。
本実験は, 対人訓練を伴わない継続的再訓練は, 対人攻撃の有効性を低下させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:43:56 GMT)
ABMax: A JAX-based Agent-based Modeling Framework [0.6] エージェントベースモデリング(ABM)は、複雑な現象の出現を研究者が観察することを可能にする。
JAXのような高性能な配列計算ライブラリは、そのような計算モデルを多数のエージェントに拡張するのに役立ちます。
ABMaxはJAXをベースにしたABMフレームワークで、複数のジャスト・イン・タイム(JIT)コンパイル可能なアルゴリズムを実装し、この機能を提供します。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:17:25 GMT)
The Elegant Joint Measurement is Non-Classical in the Triangle Network [0.6] ネットワーク内のパーティによって量子システムが共有される場合、パーティの測定結果は古典的でない相関を示すことができる。
大規模な最適化のために、インフレーション対称性の低減とフランク=ウルフアルゴリズムを組み合わせる方法を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:03:11 GMT)
Quantum remeshing and efficient encoding for fracture mechanics [0.6] 本稿では, ひび割れ開きシミュレーションに特化して, 構造力学問題に対する変分量子アルゴリズムを提案する。
提案手法は,パラメタライズド量子回路を実装することで,関連する2次元ケースに対する代替ソリューションを提供する。
提案手法は,Quandelaのフォトニック量子プロセッサAscellaで実験的に検証されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:50:59 GMT)
ROC Analysis with Covariate Adjustment Using Neural Network Models: Evaluating the Role of Age in the Physical Activity-Mortality Association [0.5] 本稿では,ニューラルネットワークに基づく共変量調整ROCモデリングのためのフレームワークを提案する。
バイオマーカーの有効性を柔軟かつ非線形に評価し、2つの基準集団間で識別することができる。
臨床ケーススタディでは、日常的な身体活動が3,5,8年の死亡率を予測するバイオマーカーとして、日々のステップカウントのプロキシとして評価されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:38:42 GMT)
TinyGraphEstimator: Adapting Lightweight Language Models for Graph Structure Inference [0.5] 本稿では,グラフ表現から直接グラフ理論パラメータを推定できる言語モデルについて検討する。
複数のランダムグラフモデルから生成された連結グラフの集合であるTinyGraphEstimatorデータセットを紹介する。
我々は、密度、クラスタリング、色数などのキーグラフパラメータを予測する能力に基づいて、いくつかの小さなオープンモデルを評価する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:29:36 GMT)
Adiabatic transport of neural network quantum states [0.4] 本稿では,多体励起状態のニューラルネットワーク表現を構築するための第一原理法を提案する。
完全多体ギャップへの制御されたアクセスにより、臨界指数の正確な推定値が得られる。
逐次固有状態推定は完全に並列に実行でき、励起状態特性の正確なターゲティングを可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:01 GMT)
Beyond the Voice: Inertial Sensing of Mouth Motion for High Security Speech Verification [0.3] 話者の下面のユニークな動きパターンと音響的証拠を組み合わせた第2の認証因子を提案する。
我々のシステムは、個人間で強い差別力を持つ、異なる動きのシグネチャを記録している。
音声認証システムにおいて、この第2の防衛線が明確なセキュリティ上の利点をもたらす、特定のユースケースについて論じる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:26:18 GMT)
Technical and legal aspects of federated learning in bioinformatics: applications, challenges and opportunities [0.3] フェデレート・ラーニング(Federated Learning)は、データ共有の制限に従い、患者のプライバシを保護するとともに、機関間でのデータを活用して臨床発見を改善する。
本稿では,ゲノムワイド・アソシエーション研究(GWAS),単一細胞およびマルチオミクス研究の法的およびインフラ的課題における重要な応用を初めてレビューする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:04:38 GMT)
REX: Causal discovery based on machine learning and explainability techniques [0.3] 本稿では、機械学習(ML)モデルと説明可能性技術を活用する因果発見手法であるReXを紹介する。
ReXは、さまざまなデータ生成プロセスで最先端の因果発見手法より優れています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:38:53 GMT)
Orbital angular momentum of entangled photons as a probe for relativistic effects [0.3] 光の古典状態と量子状態の両方としての軌道角運動量(OAM)は多くの応用において必須であることが証明されている。
2人の観測者による測定により, 絡み合った状態からの関節のOAMスペクトルが長さ収縮によって変化することを示した。
速度を最大0.99c$までシミュレートし,予測された拡張性を確認し,測定結果を用いてローレンツ因子を抽出した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:28:36 GMT)
Intermittent File Encryption in Ransomware: Measurement, Modeling, and Detection [0.3] 本稿では,ファイルタイプ間の間欠的暗号化の下でのバイトレベル統計の体系的特性について述べる。
断続暗号の調整混合モデル上での古典的KL偏差上限を特殊化し、ヒストグラムに基づく検出器のファイルタイプ特異的検出性天井を得る。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:48:22 GMT)
Partitioning $\mathbb{Z}_{sp}$ in finite fields and groups of trees and cycles [0.3] 我々は、$mathbbZ_sp$ の前周期構造を記述するために、弧と根木の概念を導入する。
我々は、$mathbbZ_sp$ のすべてのサイクルが、有限体 $pmathbbF_s$ と $smathbbF_p$ のサイクルから予測可能な内部サイクルを含むことを示した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:59:36 GMT)
A Methodology for Assessing the Risk of Metric Failure in LLMs Within the Financial Domain [0.3] 過去の機械学習メトリクスは、しばしばGenAIワークロードへの一般化に失敗することがある。
本稿では、これらの課題を説明し、中小企業と機械学習メトリクスのより良い適用を可能にするリスクアセスメントフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:21:22 GMT)
A Framework For Decentralized Micro-credential Verification Towards Higher Qualifications [0.2] 本研究は、セキュアなマイクロクレデンシャル検証とより効率的なコース免除プロセスのためのプロトタイプを提案する。
教育機関が定めた方針により、学習者はシステムにマイクロクレデンシャル証明書を提供する。
プロトタイプはHyper-ledger Fabricプラットフォームを使用しており、ミドルマンストレージプラットフォームとして機能するオフチェーン技術を使用している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:03:18 GMT)
Polaritons confined in dielectric structures [0.2] 本稿では,ボゴリューボフ変換に基づく偏光子固有モードに基づく量子モデルを得るためのレシピを提案する。
本稿では,この手法が,非局所多体相互作用の強化と工学的相互作用の促進にどのように役立つかを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:18:34 GMT)
CURE: Confidence-driven Unified Reasoning Ensemble Framework for Medical Question Answering [0.2] 本研究では,微調整を伴わずに医療質問応答を向上させるための信頼性駆動型マルチモデルフレームワークを提案する。
信頼度検出モジュールはプライマリモデルの確実性を評価し、適応的ルーティング機構は協調推論のための補完的な知識を持つヘルパーモデルに低信頼度クエリを誘導する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:46:11 GMT)
EM Approaches to Nonparametric Estimation for Mixture of Linear Regressions [0.2] 線形回帰モデルの混合では、回帰係数は連続分布または離散分布のいずれかに従うランダムベクトルとして扱われる。
予測最大化(EM)アルゴリズムを2つ提案し,それ以前の分布を推定する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:10:03 GMT)
Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images [0.2] 近年,日常的な物体のリアルな画像を生成するために拡散モデルが開発されている。
ソース選択やラベルを使わずに、100万のソースでトレーニングされた拡散モデルを作成します。
本研究では,各光源の中心画素を隠蔽し,拡散モデルに従って光を再構成することにより,中心光分布の予測を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:01:45 GMT)
MSCloudCAM: Cross-Attention with Multi-Scale Context for Multispectral Cloud Segmentation [0.2] MSCloudCAMはマルチスペクトルとマルチセンサークラウドセグメンテーションに適したマルチスケールコンテキストネットワークを備えたクロスアテンションである。
我々のフレームワークは、Sentinel-2とLandsat-8のデータによるスペクトル豊かさを利用して、明空、薄い雲、厚い雲、雲の影の4つの意味カテゴリーを分類する。
MSCloudCAMは階層的特徴抽出のためのSwin Transformerのバックボーンと、拡張スケール認識学習のためのマルチスケールコンテキストモジュールASPPとPSPを組み合わせたものだ。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:22:55 GMT)
ROI-GS: Interest-based Local Quality 3D Gaussian Splatting [0.1] 既存の3Dガウススプレイティング手法は、シーン全体にわたってリソースを均一に割り当て、興味のある領域の詳細な詳細を制限する。
我々は、オブジェクト誘導カメラ選択による局所的な詳細性を高めるオブジェクト認識フレームワークであるROI-GSを提案する。
提案手法は,リアルタイム性能を維持しながら,選択したオブジェクトの高精細度化を優先する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:56:50 GMT)
Eliminating Negative Occurrences of Derived Predicates from PDDL Axioms [0.1] Axiomsはプランニングドメイン定義言語PDDLの機能であり、Datalogのようなデータベースクエリ言語の一般化と見なすことができる。
どちらの変種も最小の固定点論理と全く同じクエリを表現でき、導出述語の負の発生を排除できることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:18:09 GMT)
The Bidding Games: Reinforcement Learning for MEV Extraction on Polygon Blockchain [0.1] 本稿では,ポリゴンアトラスを用いたMEV抽出のための強化学習フレームワークを提案する。
我々の研究は、高頻度MEV環境において強化学習が重要な利点をもたらすことを証明している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:54:53 GMT)
Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning [0.1] 我々は,メソッド再利用の範囲を拡張し,類似度が低い問題に対処する。
このアプローチを、質問が部分的な特徴や隠れた特徴を共有する場合に拡張する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:02:21 GMT)
Hydra: A Modular Architecture for Efficient Long-Context Reasoning [0.1] 状態空間のバックボーンをベースとしたモジュールアーキテクチャであるHydraを紹介します。
我々は、論理的連鎖精度と合成シーケンスのスループット、WikiTextのスループットを29Mパラメータモデルで評価した。
Hydraは、合成データセットとWikiTextデータセットの8Kトークンで、それぞれ$3.01times$と$3.0times$スループットゲインを達成している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:37:35 GMT)
ParaToric 1.0-beta: Continuous-time quantum Monte Carlo for the toric code in a parallel field [0.1] ParaToricは、並列フィールドで有限温度でトーリックコードをシミュレートするC++パッケージである。
Wu,Deng,Prokof'evの連続時間量子モンテカルロアルゴリズムを,正方形,三角形,ハニカム,立方体格子上に実装し拡張する。
パッケージは任意の格子ジオメトリやカスタムオブザーバブルに拡張可能で、$X$-または$Z$-basisのいずれかで対角になる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:16:13 GMT)
Heuristic Time Complexity of NISQ Shortest-Vector-Problem Solvers [0.0] 最短ベクトル問題は古典コンピュータや量子コンピュータでは難しいと考えられている。
我々は、ハミルトン多様体の基底状態において、SVPを効率的に符号化することは可能であることを示す。
より論理的な量子ビットを導入することなく、SVPに対するゼロベクトル解を避ける新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:31:53 GMT)
Dr. Bias: Social Disparities in AI-Powered Medical Guidance [0.0] 大規模言語モデル(LLM)は競争力を持つことがますます証明されている。
LLMを医療アドバイス生成に使用すると、社会集団間で体系的に異なる応答が生成されることを示す。
特に、内因性および間質性患者は、読みやすく、より複雑でないアドバイスを受ける。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:54:20 GMT)
Emergence of Gravitational Potential and Time Dilation from Non-interacting Systems Coupled to a Global Quantum Clock [0.0] 我々は、時間を量子自由度として扱うことにより、Page-Woottersの量子力学の定式化における重力バック反応を研究する。
我々はまた、再正規化の特徴を明らかにし、高エネルギーの分散を軟化させ、重畳中の粒子が重力時間拡張に量子補正をもたらす可能性を示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:34:28 GMT)
A recipe for local simulation of strongly-correlated fermionic matter on quantum computers: the 2D Fermi-Hubbard model [0.0] 本稿では,局所演算のみを用いて量子コンピュータ上での2次元Fermi-Hubbardモデルをシミュレーションするためのステップバイステップのレシピを提案する。
物理デバイスへの埋め込みを含むエンド・ツー・エンド・シミュレーションの詳細なレシピを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:42:48 GMT)
Zero-Shot Wildlife Sorting Using Vision Transformers: Evaluating Clustering and Continuous Similarity Ordering [0.0] カメラトラップは何百万もの野生生物の画像を生成するが、多くのデータセットには既存の分類器にはない種が含まれている。
本研究は、自己監督型視覚変換器を用いて、ラベルなし野生生物画像の整理のためのゼロショットアプローチを評価する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:59:18 GMT)
Visual Stereotypes of Autism Spectrum in Janus-Pro-7B, DALL-E, Stable Diffusion, SDXL, FLUX, and Midjourney [0.0] 本研究は,2024-2025年に生成した画像と制御とを比較し,自閉症に関する非合理的信念を継続する6つのテキスト・ツー・イメージモデルについて検討した。
自閉症の個人は、肌の色(白人)、性別(男性)、年齢(青年)に顕著な均一性を示し、孤独な活動に従事し、人ではなく物と交流し、悲しみ、怒り、感情的な平らさなどのステレオタイプ的な感情表現を示した。
両モデル間に有意差が認められたが, 効果サイズが適度であり, ベースラインと追従要約値の差はなく, いずれのモデルにも類似した画像数に対するステレオタイプ的テーマの比は認められなかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:56:26 GMT)
VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design [0.0] VALID-Molは、化学検証とLCM駆動分子設計を統合する包括的なフレームワークである。
本手法は, 組織的迅速最適化, 自動化学検証, ドメイン適応微調整を合成し, 合成可能な分子の生成を確実にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:43:31 GMT)
Towards geological inference with process-based and deep generative modeling, part 1: training on fluvial deposits [0.0] 本研究では, プロセスベースモデルによりシミュレーションされたフラビラル沈着を再現するために, GAN(Generative Adversarial Network)をトレーニングできるかどうかを検討する。
深層学習コミュニティから大規模な2次元画像を生成する開発は, 直接, フラビアル堆積物の3次元画像に転送可能である。
重ね合わせの法則に敬意を表して, 重ね合わせ時間を用いてGANの性能をモニタリングし, 検証する方法について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:43:40 GMT)
Towards Error Centric Intelligence I, Beyond Observational Learning [0.0] AGIの進歩はデータやスケールよりも理論に限定されていると我々は主張する。
まず、基礎、知識の定義、学習、知性、反事実能力、そしてAGIを作ることから始めます。
我々は、エージェントのアクションの下で、明示的かつ暗黙的なエラーがどのように進化するかについて、問題を3つの質問として再考した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:33:55 GMT)
Topology meets symmetry breaking: Hidden order, intrinsically gapless topological states and finite-temperature topological transitions [0.0] 内在的および対称性に保護されたトポロジカル秩序(SPT)は、量子多体基底状態(主にギャップを持つ)で発見されている。
これらは一般にゼロ温度現象と見なされ、その空隙のない基底状態や熱ゆらぎに対する頑丈さは、取り組まなければならない。
我々は,IsingクラスとBKTクラスにおいて,それぞれ2種類の有限温度SPT遷移を予測するために構成を適用した。
隠されたIsingの順序を特徴とする状態はギャップがあるが、BKT-SPT遷移に関連する他のSPT状態は、$U(1)$またはXYを隠している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:33:02 GMT)
Topological Preparation of Non-Stabilizer States and Clifford Evolution in $SU(2)_1$ Chern-Simons Theory [0.0] 我々は,非安定化状態の家族を作成するための枠組みを開発し,その絡み合いのエントロピーを計算する。
Kac-ムーディ代数を用いて、パウリとクリフォード作用素をウィルソンループ挿入を持つ3次元多様体上の経路積分として構成する。
その結果、安定化状態の既存のトポロジカル構造を非安定化状態の族を含むように拡張した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:29:50 GMT)
The cognitive triple-slit experiment [0.0] 量子実体と人間の概念は、同じ概念的な性質を持っているかもしれないが、それらが特定の文脈でそれを表現する方法は、かなり異なる可能性があることを示す。
これは、ソルキンパラメーターで観測されたゼロからの有意な偏差からも明らかであり、人間の決定に強い既約3階干渉寄与があることを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:43:35 GMT)
The Tree-SNE Tree Exists [0.0] t-SNE や UMAP のような非線形次元減少法はクラスタリングのスケール・プロブレムに直面する。
我々は、t-SNEの基盤となるスケーリング対称性を利用して、2次元を(2+1)次元の埋め込みに置き換えるロビンソン・アンド・ピアース・ホフマンの考えを再考する。
最適埋め込みは測度 0 の集合の外側のすべての初期条件のスケーリングパラメータ(木-SNE木が存在する)に連続的に依存することを証明する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:10:41 GMT)
The Start Button Problem: a basis for human responsibility in artificial intelligence computation [0.0] 本稿では,GPT-4におけるアライメント研究センター実験の分析を通じて,AI自律性の起源と限界について検討する。
思考実験とその反論を調べることで、人間の活性化と目的の定義の必要性が、AIが人間に開始された行動に本質的に依存していることが明らかになる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:27:13 GMT)
The Principle of Uncertain Maximum Entropy [0.0] 最大エントロピーの原理(英: Principle of Maximum Entropy)は、与えられた部分情報が未知の分布を推定する厳密な手法である。
我々は、この要求を、新しいより一般的な原則を導出するためのフレームワークとして、メモリレス通信チャネルを用いて緩和する。
本稿では, 未知の分布のエントロピーに上限を与え, 与えられた通信チャネルの使用により失われる情報量について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:36:12 GMT)
The Infra-Red Road to Quantum Gravity [0.0] 凝縮物質物理学から量子重力まで幅広い分野の研究を概観する。
議論を説明するのに、さまざまな例を使っています。
我々の見解では、量子重力の低エネルギー理論は、我々の見解では、この分野で前進する正しい方法である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:40:01 GMT)
The Gatekeeper Knows Enough [0.0] Gatekeeper Protocolは、エージェント・システム間のインタラクションを管理するドメインに依存しないフレームワークである。
提案手法は,エージェントの信頼性を著しく向上し,トークン消費を最小化することで計算効率を向上し,複雑なシステムとのスケーラブルな相互作用を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:00:42 GMT)
Tensor Logic: The Language of AI [0.0] 私は、トランスフォーマー、フォーマルな推論、カーネルマシン、グラフィカルモデルを含む、テンソル論理において、ニューラルネットワーク、象徴的、統計的AIのキーフォームをどのように実装するかを示します。
これは、ニューラルネットワークのスケーラビリティと学習性とシンボリック推論の信頼性と透明性を組み合わせることで、AIの普及の基盤となる可能性がある。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:40:28 GMT)
Technological Devices and Their Negative Effects on Health [0.0] テクノロジーは情報を取得し、データを分析できるグローバルなツールになっています。
この文脈では、視覚、神経、集中の諸問題から筋肉、聴覚、睡眠障害に至るまで、人々の健康の変化が観察された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:59:29 GMT)
TangledFeatures: Robust Feature Selection in Highly Correlated Spaces [0.0] 我々はTangledFeaturesを紹介した。TangledFeaturesは、相関した特徴空間における特徴選択のためのフレームワークである。
絡み合った予測器のグループから代表的特徴を識別し、説明力を維持しながら冗長性を低下させる。
選択された特徴は、背骨のねじれ角の変化を説明する構造的に意味のある原子内距離に対応している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:54:04 GMT)
Synthetic fractional flux quanta in a ring of superconducting qubits [0.0] クビット環がマイクロ波によって駆動される適切な「散乱実験」の吸収スペクトルにおいて、分数束量子がどのように読み出されるかを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:56:28 GMT)
Symbolic verification of Apple's Find My location-tracking protocol [0.0] 我々は、Finder Myプロトコルのシンボリックモデルと、望ましいプロパティの正確な正式な仕様を示す。
これらの性質の機械チェック可能な自動証明を玉林証明器で提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:52:05 GMT)
Stroboscopic Saturation of Multiparameter Quantum Limits in Distributed Quantum Sensing [0.0] ユニークな量子現象を利用する高精度センサは、測定精度の標準量子限界を超えることが示されている。
ここでは、広範囲の分散量子プローブに対して量子強調感度を解析的に示す。
最終的な精度限界を達成するための最適測定戦略を構築する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:01 GMT)
Stable but Miscalibrated: A Kantian View on Overconfidence from Filters to Large Language Models [0.0] 我々はカントの純粋推論批判をフィードバック安定性の理論として再解釈する。
我々はこの直観を複合不安定指数(H-Risk)を介して定式化する。
脆弱な内部力学は誤校正や幻覚と相関している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:40:28 GMT)
Sri Lanka Document Datasets: A Large-Scale, Multilingual Resource for Law, News, and Policy [0.0] 我々はスリランカの議会手続、法的判断、政府出版物、ニュース、観光統計を網羅したオープンで機械可読な文書データセットを提示する。
このコレクションは、シンハラ、タミル、英語の24のデータセットにまたがる230,091の文書(57.7GB)で構成されている。
これらの資源は、計算言語学、法的分析、社会政治学、多言語自然言語処理の研究を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 02:53:51 GMT)
Spectral subspace extraction via incoherent quantum phase estimation [0.0] 量子位相推定(QPE)はハミルトン固有値の抽出のための基礎となるアルゴリズムである。
我々は、進化のハミルトン生成子の状態(DOS)の密度を推定するQPEのアンサンブルに基づく定式化を採用する。
我々は、DOS-QPEを回路プリミティブとして、対称性適応型入力アンサンブルと高度なスペクトル再構成技術で拡張する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:49:27 GMT)
Small-time approximate controllability of the logarithmic Schr\''dinger equation [0.0] 対数非線形性および双線型制御を持つシュル「オーディンガー方程式」を考える。
我々は、その小規模なグローバルな$L2$-approximate制御性を証明する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:01:58 GMT)
Sketch2BIM: A Multi-Agent Human-AI Collaborative Pipeline to Convert Hand-Drawn Floor Plans to 3D BIM [0.0] 本研究では,手書きのフロアプランスケッチを意味的に一貫した3次元BIMモデルに変換する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:45:33 GMT)
Single-shot antidistinguishability of unitary operations [0.0] 単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発式単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発型単発
3つのユニタリの集合に対して、まずすべての最大絡み合った状態がプローブとしての性能において等価であることを証明する。
また、3つのキュービットユニタリの2つの区別不能な集合の和もまた、識別不能ユニタリの集合を形成することを確立した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:17:27 GMT)
Signatures of Topological Symmetries on a Noisy Quantum Simulator [0.0] トポロジカル対称性は、可逆的であり、そうでなければ、場の量子論の研究において基本的な役割を果たす。
工学的な固体デバイスに基づく量子シミュレータは、これらのモデルを実現するための従来の凝縮物質システムに代わる新しい代替手段を提供する。
本研究では、イジング共形場理論の位相対称性に関連する不純物ハミルトニアンおよびループ作用素の固有状態が、IBMのキングストンシミュレータ上で実現される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:51:56 GMT)
Seeing Through Green: Text-Based Classification and the Firm's Returns from Green Patents [0.0] 本稿では,公文書から真のグリーン特許を識別するための自然言語処理について紹介する。
これまでの文献から緑に分類されていた約1240万件の特許について、トレーニングを開始します。
true'のグリーン特許は、以前の文献からグリーンに分類された特許の全体の20%を占めている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:39:48 GMT)
Securing U.S. Critical Infrastructure: Lessons from Stuxnet and the Ukraine Power Grid Attacks [0.0] 産業制御システム(Industrial Control Systems)は、アメリカ合衆国における重要なインフラの基盤となっている。
デジタル統合の増大は、これらのシステムをサイバー脅威のエスカレートに役立てている。
Stuxnetやウクライナの電力網事件のような歴史的攻撃は、悪用可能な弱点を明らかにした。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:30:17 GMT)
SLIE: A Secure and Lightweight Cryptosystem for Data Sharing in IoT Healthcare Services [0.0] 本稿では,Wildcard Key Derivation Identity-Based Encryption(WKD-IBE)に基づく新しい暗号システムであるSLIEを提案する。
SLIEは、エンドツーエンドの暗号化、階層的なアクセス制御、リソース制約のあるデバイス用に設計された軽量キー管理システムを通じて、スケーラブルな信頼性とセキュアな全方位通信を実現する。
SLIE は 1KB のデータに対して 0.936ms と 0.217ms の暗号化および復号処理時間、暗号化速度 84.54% の改善、復号処理速度 99.70% の改善により、RSA を著しく上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:48 GMT)
SHaRe-SSM: An Oscillatory Spiking Neural Network for Target Variable Modeling in Long Sequences [0.0] 状態空間モデル(SSM)は、長いシーケンスのターゲットモデリングのためのトランスフォーマーの強力な代替品として進化してきた。
我々は,SHaRe-SSMをターゲット変数モデリング(分類と回帰の両方を含む)のために設計する。
我々のネットワークは、エネルギー効率が著しく高い50kのシーケンスでも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:37:59 GMT)
Ruelle-Pollicott Decay of Out-of-Time-Order Correlators in Many-Body Systems [0.0] 分離系におけるOTOCの長期指数崩壊は,この内在的ギャップの2倍の速度で起こることを示す。
この対応は、可積分性とカオスの間の交差状態においても持続する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:05:07 GMT)
Revisiting UTAUT for the Age of AI: Understanding Employees AI Adoption and Usage Patterns Through an Extended UTAUT Framework [0.0] 本研究では、職場における人工知能(AI)技術に対して、従業員の人口構成要因が採用や態度を形作るかどうかを検討する。
多国籍コンサルティング会社内のグローバルリージョンと組織レベルの専門家2,257人を対象に調査を行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:01:41 GMT)
Reliable data clustering with Bayesian community detection [0.0] 研究者たちはモジュール構造を明らかにするために、クラスタリングの類似性データに依存している。
しかし、階層クラスタリング、k平均、WGCNAといった広く使われているクラスタリング手法では、基本モデル選択が欠如しており、ノイズの影響を受けやすい。
一般的な回避策は相関行列表現をスパースしてクラスタリング前にノイズを除去するが、この余分なステップは任意のしきい値を導入し、構造を歪め、信頼できない結果をもたらす。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:10:24 GMT)
Reconstructing Spin Hamiltonians of 2D Gutzwiller-Projected Wavefunctions [0.0] 相関行列ハミルトン再構成法を2次元グッツウィラー計画フェルミ海とπ-フラックス状態に適用する。
この結果は、単純な局所相互作用項を持つスピンハミルトニアンが有限系サイズに対してそのような状態を安定化しないことを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:16 GMT)
Random regular graph states are complex at almost any depth [0.0] グラフ状態は、その単純な古典的記述とリッチな絡み合い構造のために、量子情報理論の基本的な対象である。
私たちにとって、それらは回路接続、絡み合い構造、計算複雑性の関係を理解するためのおもちゃモデルです。
ランダムな積ベースで測定した場合のランダムなグラフ状態のシミュレーションにおける平均ケースの複雑さについて検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:29:45 GMT)
RadarLLM: Adapting Pretrained Large Language Models for Marine Radar Target Detection with Preference-aware Loss [0.0] RadarLLMは、効果的な選好認識損失を利用する新しい微調整フレームワークである。
RadarLLMは、さまざまな検出シナリオにおいて、最先端のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:50:32 GMT)
Quantifiers of Noise Reducibility Under Restricted Control [0.0] 単調性特性を満たす量子プロセスの実用的有用性の定量化について紹介する。
これらの量化器をオープンループ制御下での量子プロセスのノイズ低減問題に適用すると、時間的相互情報の最大量を表すことが示される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 05:23:03 GMT)
Procedural Game Level Design with Deep Reinforcement Learning [0.0] プロシージャコンテンツ生成(PCG)はゲーム開発においてますます人気が高まっている。
本研究では, 深部強化学習(DRL)をベースとした3次元環境下でのプロシージャレベルの設計手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:26:14 GMT)
Predicting the Unpredictable: Reproducible BiLSTM Forecasting of Incident Counts in the Global Terrorism Database (GTD) [0.0] 我々は、GTD(Global Terrorism Database, 1970-2016)を用いた週次テロ事件の短期予測について研究する。
固定時間分割による再現可能なパイプラインを構築し, 強い古典的アンカーに対して双方向LSTM(Bidirectional LSTM)を評価する。
ホールドアウトテストセットでは、BiLSTMはRMSE 6.38に達し、LSTMアテンション(9.19; +30.6%)と線形ラグ回帰ベースライン(+35.4% RMSEゲイン)を上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:53:43 GMT)
Power Grid Cybersecurity: Policy Analysis White Paper [0.0] 米国の電力網は、産業制御システムの脆弱性、リモートアクセス、貧弱なサイバー衛生によるサイバーリスクの増大に直面している。
本稿では,グリッド型サイバーセキュリティを強化するための二重ポリシー手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:08:00 GMT)
Polarization based direction of arrival estimation using a radio interferometric array [0.0] 到着方向推定(DOA)は、主に運用周波数範囲に合わせてレシーバ間隔とレイアウトを慎重に設計した特殊な配列を用いて行われる。
本稿では,無線干渉計アレイのサブセットを使用し,全アレイで収集したデータの一部を使用して,撮像なしでの低コストDOA推定に着目し,DOAの早期判定を可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:17:55 GMT)
Physics-informed data-driven machine health monitoring for two-photon lithography [0.0] 2光子リソグラフィー (TPL) は、3次元の3次元およびナノ構造を作るための高度な添加物製造技術である。
TPLシステムの健全性を維持することは、一貫した製造品質を確保するために重要である。
本稿では,TPLマシンの健康状態の正確かつタイムリーなモニタリングを行うための3つの方法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:41:46 GMT)
Photovoltaic power forecasting using quantum machine learning [0.0] 本稿では,光電力の時系列予測のためのハイブリッド量子ニューラルネットワークについて検討する。
最初のHybrid Quantum Long Short-Term Memoryモデルでは、平均絶対誤差と平均2乗誤差を40%以上削減する。
第2のハイブリッド量子系列列列モデル(Hybrid Quantum Sequence-to-Sequence model)は、一度訓練されると、事前の気象入力を必要とせずに任意の予測地平線に対するパワーを予測する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:34:58 GMT)
Partially stochastic deep learning with uncertainty quantification for model predictive heating control [0.0] モデル予測制御(MPC)は、予測モデルを用いて建物が学習した熱挙動に基づいて加熱を最適化することで、欠点に対処する。
MPCソリューションは、物理にインスパイアされた簡易な室内温度モデルを使用し、堅牢性と解釈可能性の精度を犠牲にする。
本研究では,建物固有の室内温度モデリングのための深層学習アーキテクチャLSTM+BNNを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:35:14 GMT)
Out-of-distribution generalisation for learning quantum channels with low-energy coherent states [0.0] 量子チャネルを探索する実験的に単純な方法の1つは、低エネルギーコヒーレント状態を用いることである。
2つのチャネルは低エネルギー入力でも同じように作用するが、高エネルギー入力では非常に異なる。
より一般的な入力状態に対するチャネルの挙動を、より限られた低エネルギーコヒーレント状態の集合に対する作用から外挿することは、分布外一般化の例である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:44 GMT)
Optimally Deep Networks - Adapting Model Depth to Datasets for Superior Efficiency [0.0] モデル深度とタスクの複雑さのバランスを提供するOptimally Deep Networks (ODNs)を導入する。
ODNは与えられたデータセットに対して最適な深さしか使用せず、冗長なレイヤを削除する。
その結果、MNIST と SVHN の ResNet-18 と ResNet-34 の最適深さは 98.64 % と 96.44 % のメモリフットプリントを実現し、それぞれ 99.31 % と 96.08 % の競合精度を維持した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:34:23 GMT)
Open system dynamics in local Lindbladians with chaotic spectra [0.0] 一般リンドブラディアンは密度行列の非線型量に対して準ユニバーサルな早期ダイナミクスを示す。
局所性がリンドブラッド固有演算子のサイズ依存性にどのように制約を課すかを数値的に検討する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:21:28 GMT)
On the invariants of finite groups arising in a topological quantum field theory [0.0] 我々は、ジクグラーフの文脈で生じる群不変量によって観測される有限群の性質を考える-ウィッテン理論。
これらの不変量は可換確率の一般化と見なすことができ、群論の文献でよく研究されている不変量である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:43 GMT)
On Krylov Complexity as a Probe of the Quantum Mpemba Effect [0.0] 量子スピン鎖における量子Mpemba効果のプローブとしてのKrylov状態複雑性について検討する。
グローバルな$U(1)$対称性を持たないモデルに対して、クリロフ複雑性はムペンバ様の明確な交差を示す。
U(1)$-symmetricシステムでは、最近提案されたクリロフ複雑性の対称成分がQMEの堅牢で信頼性の高い指標であることを確認した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:41:53 GMT)
Oligonucleotide selective detection by levitated optomechanics [0.0] 本研究では, オリゴヌクレオチド特異的シグナルの高感度光機械実験による検出について検討した。
シリカナノ粒子は, 単鎖デオキシアデノシンとデオキシジンモノリン酸の25-メルとCl$Cl$で機能した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:34:26 GMT)
Nonlinear Landau levels in the almost-bosonic anyon gas [0.0] 平面上のアーベル粒子の定量的な記述は、トラップポテンシャルに閉じ込められている。
1つのパラメータは、システム内の自己生成磁束単位の総数を決定する。
フラックスの増加に伴い、反回転渦が形成され、ガスの崩壊に対する安定性が向上する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:39:27 GMT)
No Silver Bullets: Why Understanding Software Cycle Time is Messy, Not Magic [0.0] 216の組織で55,000以上の観測データを用いて,チケット作成から完成までのサイクルタイムを計測した。
サイクルタイムと週あたりのコーディング日数、マージされたプルリクエストの数、コラボレーションの度合いといった要因との間には、正確だが控えめな関連性があります。
以上の結果から,一般的な職場要因は期待方向のサイクル時間に影響を及ぼすが,どの観測でも典型的性能に関する限られた信号が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:45:38 GMT)
Natural Language Tools: A Natural Language Approach to Tool Calling In Large Language Agents [0.0] 我々は,大規模言語モデルにおけるプログラムツール呼び出しを自然言語出力に置き換えるフレームワークであるNatural Language Tools (NLT)を提示する。
NLTはツール呼び出しの精度を18.4ポイント改善し、出力分散を70%削減した。
オープンウェイトモデルは最大の伸びを示し、フラッグシップのクローズドウェイトモデルを上回っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:52:52 GMT)
Multiparameter quantum-enhanced adaptive metrology with squeezed light [0.0] ab-初期位相推定のための適応的多パラメータ推定戦略を開発する。
実時間フィードバックを用いて光学位相とスクイーズレベルを同時推定する。
この自己校正スキームは、信頼性の高い量子強化センシングフレームワークを確立する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:41:12 GMT)
Membership Inference over Diffusion-models-based Synthetic Tabular Data [0.0] ステップワイズ・エラー比較法に基づいて,クエリベースのメンバーシップ推論攻撃(MIAs)を開発することにより,TabDDPMとTabSynの2つの最近のモデルについて検討する。
本研究は,拡散モデルのプライバシ含意を評価することの重要性を強調し,合成データ生成のための堅牢なプライバシ保存機構のさらなる研究を奨励するものである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:43:11 GMT)
Machine Unlearning Meets Adversarial Robustness via Constrained Interventions on LLMs [0.0] 我々は、機密情報の未学習と脱獄攻撃に対する堅牢性に対処する様々な制約付き最適化の定式化について検討する。
私たちが提案する最も単純なポイントワイド制約ベースの介入は、計算コストの低減を図りながら、最大最小の介入よりも優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:42:58 GMT)
Machine Learning-Based Ultrasonic Weld Characterization Using Hierarchical Wave Modeling and Diffusion-Driven Distribution Alignment [0.0] この研究は、音響溶接検査のための機械学習(ML)ワークフローを提案することにより、データキュレーションと信号の破損の課題に対処する。
減階モデル、拡散に基づく分布アライメント、U-Netに基づくセグメント化とインバージョンを提案する。
このフレームワークは、実データの自動溶接検査のためのエンドツーエンドソリューションを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:07:28 GMT)
MAFA: A Multi-Agent Framework for Enterprise-Scale Annotation with Configurable Task Adaptation [0.0] 本稿では,企業規模のアノテーションをマルチエージェントコラボレーションによって変換する実運用システムを提案する。
Mafaは、平均86%のアノテータとの合意を達成しながら、100万の発話バックログを削除した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:30:08 GMT)
Low Power Vision Transformer Accelerator with Hardware-Aware Pruning and Optimized Dataflow [0.0] 本稿では,アルゴリズムハードウェアの共設計により最適化された低消費電力ビジョントランスフォーマーアクセラレータを提案する。
複雑な機構を導入することなく、ハードウェアフレンドリーな動的トークンプルーニングによってモデルの複雑さを低減させる。
ピークスループットは1GHzで1024 GOPS、エネルギー効率は2.31 TOPS/W、面積効率は858.61 GOPS/mm2である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:44:42 GMT)
Local active error correction from simulated confinement [0.0] 我々は、励起間の整合性相互作用をシミュレートすることにより、トポロジカル符号におけるフォールトトレラントな誤り訂正を行うという古い考え方を洗練する。
我々は、シンドロームを計測し、近隣のプロセッサにメッセージをブロードキャストし、受信したメッセージを使って励起を移動するためのローカルな古典プロセッサの配列を用いて閉じ込めを実装する。
結果のリアルタイムデコーダのダイナミクスは幾何学的に局所的であり、時空では均一であり、グローバルな制御を一切行わない自己組織型である。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:47:28 GMT)
Keep Calm and Avoid Harmful Content: Concept Alignment and Latent Manipulation Towards Safer Answers [0.0] 大きな言語モデルは、ビルトインの安全ガードレールをバイパスするジェイルブレイク攻撃の影響を受けやすい。
本稿では,潜在表現を修飾することで有害な概念を抑える推論時間計算法である概念アライメントと概念操作CALMを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:51:25 GMT)
Jet Functors and Weil Algebras in Automatic Differentiation: A Geometric Analysis [0.0] ジェットバンドルとワイル代数を用いた自動微分(AD)の幾何学的定式化を提案する。
正確さ、安定性、複雑さに関する簡潔な言明を導き出す。
この枠組みは、微分幾何学のレンズを通してAD理論を解釈する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:25:24 GMT)
Interrelation of Non-Classicality, Entropy, Irreversibility and Work extraction in Open Quantum Systems [0.0] 非古典的体積、フォン・ノイマンエントロピー、エントロピー生成、エルゴトロピーの相互作用は、様々な開量子系で研究されている。
開量子系のモデルにはスピンスピン相互作用モデルとスピンボソン相互作用モデルという2つのカテゴリがある。
発見は、量子情報と開量子系の熱力学の間の興味深いリンクを確立する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:58:54 GMT)
Intelligent Dynamic Handover via AI-assisted Signal Quality Prediction in 6G Multi-RAT Networks [0.0] 本研究では,モデル駆動および短距離信号品質予測に基づく機械学習支援予測ハンドオーバ条件(P-CHO)フレームワークを提案する。
現実的なマルチRAT環境を考えると、モバイルユーザの信号品質指標を予測するために、RTT対応長短メモリ(LSTM)ネットワークを訓練する。
提案したP-CHOモデルは、セルラーおよびIEEE WiFi 802.11統合カバレッジのための異なるチャネルモデルの下で訓練され、評価される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:08:14 GMT)
Inpainting the Red Planet: Diffusion Models for the Reconstruction of Martian Environments in Virtual Reality [0.0] 訓練は、NASAのHiRISE調査から得られた12000個の火星高度マップで実施された。
非均一な再スケーリング戦略は、固定された128x128モデル解像度にリサイズする前に、複数のスケールにわたる地形の特徴をキャプチャする。
その結果,本手法は再建精度(RMSEでは4~15%)と知覚的類似性(LPIPSでは29~81%)において,元のデータより一貫して優れていた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:02:05 GMT)
Implementation of AI in Precision Medicine [0.0] 本稿では,精密医療におけるAIの実装に関する文献のスコーピングレビューを行う。
データ品質、臨床の信頼性、ワークフローの統合、ガバナンスにまたがる重要な障壁とイネーブラーを特定します。
信頼性と持続可能な実装を支援するための今後の方向性を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:55:15 GMT)
HyCoVAD: A Hybrid SSL-LLM Model for Complex Video Anomaly Detection [0.0] ビデオ異常検出(VAD)はインテリジェントな監視には不可欠だが、複雑な異常を識別することが大きな課題である。
マルチタスク SSL 時間解析器と LLM バリデータを組み合わせたハイブリッド SSL-LLM モデルである HyVAD を導入する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:00:43 GMT)
Hong-Ou-Mandel effect with two frequency-entangled photons of vastly different color [0.0] 香港・奥羽マンデル(HOM)実験の最初の定式化では、バランスビームスプリッターの2つの入力ポートに2つの不明瞭な光子が入射すると、それらは合体する。
ここでは、類似の例を示す。
全く異なる色の2つの光子間のHOM干渉。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:45:47 GMT)
High Semantic Features for the Continual Learning of Complex Emotions: a Lightweight Solution [0.0] 本稿では、複雑な感情認識に焦点を当て、まず基本的な感情を学習し、次に、人間のように、複雑な感情を漸進的に学習する。
顔面筋運動を記述したアクションユニットは、浅部と深部の両方の畳み込みニューラルネットワークによって抽出された動作より優れる非過渡的、高度に意味的な特徴である。
この能力により,CFEEデータセットの精度0.75の複合感情を漸進的に複雑に学習する際の興味深い結果が得られ,最先端の結果と良好に比較できる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:24:25 GMT)
Hierarchical Re-Classification: Combining Animal Classification Models with Vision Transformers [0.0] 動物検出プラットフォームのための階層的再分類システムを提案する。
私たちの5段階パイプラインは、LILA BC Desert Lion Conservationデータセットのセグメントで評価されます。
ブランク」ラベルと「アニマル」ラベルから761羽の鳥検出を回収した後、96.5%の精度で動物、哺乳類、空白の456羽の鳥検出を分類した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:57:07 GMT)
Harvesting Contextuality from the Vacuum [0.0] 量子文脈性 (quantum contextuality) とは、特定の測定シナリオがそれらの統計のグローバルな記述を含まないという概念である。
文脈性は非局所的絡み合いと魔法の概念を一般化し、ウィグナー負性に対する非古典性の概念と同等のものであることが示されている。
本稿では、文脈性収穫のプロトコルを導入し、Unruh-DeWittモデルが量子テクスチュアリティを収穫できることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:11:55 GMT)
Graphon Quantum Filtering Systems [0.0] 我々は,高密度グラフ上での連続的な測定を前提として,平均場型相互作用と量子粒子を相互作用する非交換性システムを考える。
ブロックワイド相互作用を持つ多クラスボソニック系のカオスの伝播を実証し,グラファイトに基づく量子フィルタリングシステムを構築した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:33:28 GMT)
GUIrilla: A Scalable Framework for Automated Desktop UI Exploration [0.0] GUIrillaは、GUI自動化における重要なデータ収集問題に対処するために、ネイティブアクセシビリティAPIを介してアプリケーションを探索する自動化フレームワークである。
我々は1,108個のアプリケーションにまたがって,27,171個の機能的なタスクからなる大規模データセットGUIrilla-Taskを構築し,リリースする。
GUIrilla-TaskにLLMベースのエージェントをチューニングすることで、下流UIタスクのパフォーマンスが大幅に向上し、ScreenSpot Proベンチマークでの合成ベースラインよりも97%少ないデータを使用した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:03:45 GMT)
Fusion-Augmented Large Language Models: Boosting Diagnostic Trustworthiness via Model Consensus [0.0] 本研究では,胸部X線解釈の信頼性を高めるために,最先端の2つの大規模言語モデル(LLM),ChatGPT,Claudeを活用する新しい多モデル融合フレームワークを提案する。
224,316個の胸部Xpert corpusから無作為に234個の放射線科医を選抜し,画像のみのプロンプトを用いて単調性の評価を行った。
95%の出力類似度閾値を用いた類似性に基づくコンセンサスアプローチにより、精度は77.6%向上した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:02:09 GMT)
Fundamental limitations on the recoverability of quantum processes [0.0] 量子チャネル上の物理変換がいかにうまく切り離されるか、あるいは逆転するか、基本的な制限を定める。
我々は、量子スーパーチャネルの作用の下で量子チャネルの量子データ処理の不等式を洗練(強化)する。
また、任意の量子超チャネルの作用下での量子チャネルのエントロピー変化に対する洗練された不等式も提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:09:19 GMT)
Fundamental Limits to Cat-Code Qubits from Chaos-Assisted Tunneling [0.0] 本稿では,カオス支援トンネル(CAT)がKerr-cat量子ビットの保護に固有の制限を課していることを示す。
我々は、フル量子シミュレーションと半古典的WKB理論の両方を用いてトンネルの速度を計算し、定量的な一致を見つけ、分裂がカオスに直接関連していることを確認する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:30:50 GMT)
From Universal Approximation Theorem to Tropical Geometry of Multi-Layer Perceptrons [0.0] 我々は、ニューラルネットワークの熱帯幾何学のレンズを通して、ユニバーサル近似理論を再考する。
本稿では,シグモダル多層パーセプトロンのための構造的・幾何学的アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:15:39 GMT)
From Binary to Bilingual: How the National Weather Service is Using Artificial Intelligence to Develop a Comprehensive Translation Program [0.0] アメリカ国立気象局(NWS)は、家庭で英語を話せない米国内の688万人により良いサービスを提供するための体系的な翻訳プログラムを開発している。
本稿では,人工知能を活用したNWS製品の自動翻訳ツールの基礎を概説する。
このシステムは、現在、スペイン語、簡体字中国語、ベトナム語、その他の広く話されている非英語言語で開発されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:06:05 GMT)
Flows and Diffusions on the Neural Manifold [0.0] 拡散およびフローベース生成モデルは、画像合成、ビデオ生成、自然言語モデリングといった領域で顕著に成功している。
本研究では、最近の手法を活用して、これらの進歩を重み空間学習に拡張し、最適化力学から導かれる構造的事前を組み込む。
我々は,勾配流の整合性を考慮した軌道推論手法を統一し,最適化経路を帰納バイアスとして扱うための理論的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:23:22 GMT)
Finding local integrals of motion in quantum lattice models in the thermodynamic limit [0.0] 運動の局所積分は閉マクロ系の長期的性質を理解する上で重要な役割を果たしている。
変換不変格子モデルやユニタリ量子回路におけるLOOMの発見は、熱力学限界の正確な解を数値的に見つけることができる問題に還元できることを示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:51:38 GMT)
Finding geodesics with the Deep Ritz method [0.0] それらの単純幾何、変分構造、および自然な非線形性を考えると、測地問題はディープ・リッツ法に特に適していると論じる。
我々の目標は、測地学的な問題を徹底的に研究することではなく、ディープ・リッツ法の有望な応用を特定することである。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 22:30:59 GMT)
FibRace: a large-scale benchmark of client-side proving on mobile devices [0.0] FibRaceは、Cairo Mを使ってスマートフォン上でクライアントサイドの証明生成をテストする最初の大規模な実験である。
99か国で6,047人のプレーヤーが、1,420のユニークなデバイスモデルに関する2,195,488の証明を作成した。
その結果、ほとんどの現代のスマートフォンは5秒以内に証明を完了できることがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:59:00 GMT)
Feature Selection and Regularization in Multi-Class Classification: An Empirical Study of One-vs-Rest Logistic Regression with Gradient Descent Optimization and L1 Sparsity Constraints [0.0] マルチクラスのワイン分類は、モデル精度、特徴次元、解釈可能性の基本的なトレードオフを示す。
本稿では,UCIワインデータセット上での1-vs-Restロジスティック回帰に関する総合的研究について述べる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:47:05 GMT)
Fast offline decoding with local message-passing automata [0.0] 並列化されたメッセージパッシングフレームワークに従って動作するトポロジコード用のローカルオフラインデコーダを提案する。
しきい値の存在を証明し、線形サイズ$L$のシステムでは、デコード終了を$O(log L)eta)$ average-case Runtimeで示す。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 12:59:56 GMT)
Explainable Machine Learning for Oxygen Diffusion in Perovskites and Pyrochlores [0.0] 我々は,実験活性化エネルギーのデータベースを構築し,材料特性にグループ化アルゴリズムを適用した。
アンサンブルの合意により、活性化エネルギーを予測する最も重要な特徴はA部位結合のイオン性である。
本研究で同定した簡易な測定機能は, 高速酸化物イオン拡散率を有する新規材料の迅速スクリーニングを可能にする。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 21:00:31 GMT)
Event Segmentation Applications in Large Language Model Enabled Automated Recall Assessments [0.0] イベントセグメンテーションは、経験を知覚し、エンコードし、リコールする方法の中心です。
現在の研究手法は、セグメンテーションパターンとリコール能力を評価するために人間に大きく依存している。
大規模言語モデル(LLM)を利用してイベントセグメンテーションの自動化とリコールの評価を行う。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:01:28 GMT)
Entanglement harvesting and curvature of entanglement: A modular operator approach [0.0] トミタ・竹崎モジュラー理論に基づく作用素-代数的フレームワークは、量子絡み合いの側面を研究するために用いられる。
量子場の絡み合い構造は、絡み合い収穫のプロトコルを用いて研究される。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 23:53:34 GMT)
Entanglement Entropy from Correlation Functions of Scalar Fields in and out of Equilibrium [0.0] 相互作用するスカラー場系の奇順序 R'enyi entropies$S(2q+1)$ が計算可能であることを示す。
S(2q+1)$ は解析的に連続してフォン・ノイマンエントロピー $SmathrmvN$ を計算することができる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:00:27 GMT)
Ensembling Multiple Hallucination Detectors Trained on VLLM Internal Representations [0.0] 本稿では,KDDカップ2025におけるメタCRAG-MMチャレンジの5位であるy3h2について述べる。
CRAG-MMベンチマークは、画像に関する事実質問に焦点を当てた視覚的質問応答データセットである。
我々は,隠された_stateと特定の注意ヘッドの出力を用いて,ロジスティック回帰に基づく幻覚検出モデルを訓練した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:09:26 GMT)
Enhanced Secondary Electron Detection of Single Ion Implants in Silicon Through Thin SiO2 Layers [0.0] 本研究では、集束イオンビーム(FIB)システムにおいて、二次電子(SE)を用いた個別イオン注入現象を検出する非破壊かつ高効率な方法を示す。
低エネルギーSbイオンを非ドープシリコンに注入し, イオン電流測定により最大98%の単イオン検出効率を実現した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:39:39 GMT)
Electromagnetic momentum in the Aharonov-Bohm quantum interference experiment from a physical perspective [0.0] アハロノフ・ボーム系では、2つの電子のコヒーレントビームの間に長くて薄いソレノイドが導入されたとき、干渉ビーム間の余分な位相差が現れる。
この神秘的な効果は、どちらのビームの位置にもベクトルポテンシャルが存在するため、電磁運動量によって生じる。
単に電磁場を計算するための数学的ツールであると考えられていたポテンシャルが、システム内の電磁運動量を引き起こすのかというパズルが残っている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 03:06:50 GMT)
Efficient encoding of the 2D toric code logical state using local Clifford gates [0.0] 深さ2L+1$の回路でLtimes L$2Dのトーリック符号論理状態を符号化するアルゴリズムを提示する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 19:57:04 GMT)
Efficient adaptive control strategy for multi-parameter quantum metrology in two-dimensional systems [0.0] 本稿では,2次元システムにおける多パラメータ量子力学の効率的な適応制御手法を提案する。
最適測定、初期状態、ハミルトンの制御の間のトレードオフを排除し、推定器の分散と進化時間の間に明確な関係を導出する。
提案した戦略は,数回の反復で一定順序の全体係数まで,最適性能を達成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 15:47:55 GMT)
ENIGMA: The Geometry of Reasoning and Alignment in Large-Language Models [0.0] エントロピー多言語モデルアライメント(ENIGMA)について述べる。
組織の方針や原則を、モデルの情報多様体に移動する方向として扱うことで、推論、アライメント、ロバスト性を改善する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:21:06 GMT)
Does Capital Dream of Artificial Labour? [0.0] 本稿では、タイマギーの表現としての労働概念とその資本制度における絡み合いについて考察する。
ゲーム理論,エージェントベースシミュレーションを用いて,コブ・ダグラス関数が支配する生産プロセスにおける資本と労働の相互作用をモデル化する。
私たちは、キャピタルが消費する生きた労働力によって人為的に生存するシステムとして機能し、自動化が進む未来において、キャピタルのインフラなしで生活が持続できるかどうかを疑問視する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:53:28 GMT)
Deterministic Underlying States are incompatible with a Counterfactual account of Lüders' rule [0.0] 我々は、L'udersの規則の反実的な説明が、量子力学の基礎となる状態モデルを規定していると論じる。
この非競合性は、条件付き確率に応じて状態を更新するために、反実的更新がオントロジモデルを必要とするために生じる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:06:27 GMT)
Detecting Token-Level Hallucinations Using Variance Signals: A Reference-Free Approach [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる印象的な生成能力を示したが、幻覚に弱いままである。
複数世代にわたるトークンログ確率のばらつきを利用した,参照不要なトークンレベルの幻覚検出フレームワークを提案する。
我々のアプローチは、モデルに依存しず、解釈可能であり、リアルタイムまたはポストホック分析に適している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:42:45 GMT)
Dataset Pruning in RecSys and ML: Best Practice or Mal-Practice? [0.0] 本論文は,データプルーニングがデータセット特性とアルゴリズム性能に与える影響について考察する。
5つのベンチマークデータセットは、未解析の形式と連続した5つのプルーニングレベルの両方で分析された。
その結果、一般的に適用されるコアプルーニングは極めて選択的であり、一部のデータセットには元のユーザの2%しか残っていないことがわかった。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:08:30 GMT)
Data-driven Calibration Sample Selection and Forecast Combination in Electricity Price Forecasting: An Application of the ARHNN Method [0.0] 本稿では,ドイツ,スペイン,ニューイングランドの電力市場を記述した3つの長期的時系列に対して,ARHNN法を適用した。
予測精度を最大10%向上させることで,一般的な文献ベンチマークよりも優れていることを示す。
また,提案手法の簡易な2つの変種を提案し,予測精度をわずかに損なうことなく,大幅な時間短縮を実現した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:49:33 GMT)
DARTS-GT: Differentiable Architecture Search for Graph Transformers with Quantifiable Instance-Specific Interpretability Analysis [0.0] グラフトランスフォーマー(GT)は、グラフ構造化データのための強力なアーキテクチャとして登場したが、厳密な設計と定量化可能性の欠如により制約を受け続けている。
我々は、因果アブレーションによるGTの定量的解釈可能性フレームワークを開発した。
実験によると、DARTS-GTは4つのデータセットで最先端の再設計を実現し、他のデータセットとの競争は継続している。
我々の解釈可能性分析は、視覚的注意力の回復と因果的重要性が必ずしも相関しているわけではないことを示し、広く使われている可視化アプローチが実際に重要なコンポーネントを見逃すことを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 06:15:42 GMT)
Current fluctuations in nonequilibrium open quantum systems beyond weak coupling: a reaction coordinate approach [0.0] 我々は、弱結合系とマルコフ系以外の開量子系の現在のゆらぎについて検討する。
完全なカウント統計と反応座標マッピングを組み合わせることで、定常電流変動の計算を可能にするフレームワークを開発する。
この結果から,量子デバイスにおける電流変動を,標準の弱結合パラダイムを超えて制御するための新たな洞察と設計原則が得られた。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:40:32 GMT)
Continuous-time quantum walk on a random graph using quantum circuits [0.0] 量子ウォーク、特に連続時間量子ウォーク(CTQW)は、量子輸送をモデル化し、複雑な力学をシミュレートし、古典的な速さで量子アルゴリズムを開発するための強力なツールとして登場した。
本稿では, ランダムグラフ構造, 特に ErdHos-R'enyiランダムグラフのCTQWをシミュレートするスケーラブルな量子回路形式を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:24:14 GMT)
Constraint-Driven Small Language Models Based on Agent and OpenAlex Knowledge Graph: Mining Conceptual Pathways and Discovering Innovation Points in Academic Papers [0.0] この論文はOpenAlexオープンソース知識グラフに基づいている。
ノヴォシビルスク州立大学の8000近いオープンソース論文データを解析した結果,論文のキーとなる概念パスの分布パターンと,イノベーションポイントとレアパスの双方の間に強い相関関係があることが判明した。
本稿では,素早い設計に基づく鍵概念パス解析手法を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:58:28 GMT)
Chiplet-Based RISC-V SoC with Modular AI Acceleration [0.0] 本稿では、エッジAIデバイスのための新しいチップレットベースのRISC-Vシステム(SoC)を提案する。
提案アーキテクチャは、7nm RISC-V CPUチップレットと2つの5nm AIアクセラレータ、16GB3メモリスタック、専用電力管理コントローラを統合している。
AIに最適化された構成は、従来の基本的なチップレット実装と比較して14.7%のレイテンシ削減、17.3%のスループット改善、16.2%の電力削減を実現している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:44:51 GMT)
Certifying optimal MEV strategies with Lean [0.0] 最大抽出可能値(MEV)の機械的定式化について述べる。
MEVは、ブロックチェーン内のトランザクションの順序付け、インクルージョン、排除を操作することで、敵が利益を得る分散アプリケーションに対する攻撃のクラスを指す。
我々は,MEV境界のマシンチェックによる証明を構築する手法を導入し,既存の技術で可能な以上の正確性を保証する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:24:28 GMT)
Can generative AI figure out figurative language? The influence of idioms on essay scoring by ChatGPT, Gemini, and Deepseek [0.0] ジェネレーティブAIは、学生エッセイの自動評価において、AESシステムと競合するものとして提案されている。
本研究は,エッセイにおけるジェネレーティブAIモデルの評価性能について,イディオムの有無による評価を行った。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:14:52 GMT)
BoardVision: Deployment-ready and Robust Motherboard Defect Detection with YOLO+Faster-RCNN Ensemble [0.0] 本報告では, スクリューの欠如, ファン配線の緩み, 表面傷など, 組立レベルの欠陥を再現可能なフレームワークであるboardVisionを提案する。
我々は、MiracleFactoryマザーボードデータセットの制御条件下で、2つの代表検出器(YOLOv7とFaster R-CNN)をベンチマークする。
我々は,解釈可能なルールによって精度とリコールのバランスをとる,軽量なアンサンブルであるCTVボイタ(Confidence-Temporal Voting)を提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:38:31 GMT)
Biology-informed neural networks learn nonlinear representations from omics data to improve genomic prediction and interpretability [0.0] 我々は、作物のゲノム予測(GP)と選抜(GS)のために、生物情報ニューラルネットワーク(BINN)を拡張した。
BINNは、経路レベルの誘導バイアスを符号化し、トレーニング中にのみマルチオミクスデータを活用することで制限を克服する。
BINNは、合成メタボロミクスベンチマークのための完全なドメイン知識により、従来のニューラルネットワークと比較して予測誤差を75%削減する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:59:38 GMT)
Big Data Approaches to Bovine Bioacoustics: A FAIR-Compliant Dataset and Scalable ML Framework for Precision Livestock Welfare [0.0] これまでに最も包括的なウシの発声データセットを提示し,48の行動クラスをカバーする569個のクリップをキュレートした。
このFAIR準拠のリソースは、ボリューム(90時間の録音、65.6GB)、バラエティ(マルチファームとマルチゾーンの音響)、ベロシティ(リアルタイム処理)、ベロシティ(堅牢な特徴抽出)といったビッグデータの課題に対処する。
予備ベンチマークでは、エストラス検出、遭難分類、母性コミュニケーションのための異なるクラスレベルの音響パターンが明らかにされている。
この研究は、生物音響データが産業規模で連続的かつ非侵襲的な福祉アセスメントを可能にする動物中心型AIの基礎を確立する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 08:42:45 GMT)
Beyond PCA: Manifold Dimension Estimation via Local Graph Structure [0.0] そこで本研究では,PCAと回帰に基づく手法を統合することで,多様体次元推定のための一般的なフレームワークを提案する。
本枠組みでは,2次埋め込み (QE) と最小二乗 (TLS) の2つの代表的な推定器を紹介する。
合成されたデータセットと実世界のデータセットの両方の実験では、これらの手法が最先端の代替手段と競合し、しばしば優れています。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:59:46 GMT)
Beyond Hallucinations: The Illusion of Understanding in Large Language Models [0.0] 大規模言語モデル(LLM)は、人間のコミュニケーションや意思決定に深く浸透している。
彼らはあいまいさ、偏見、言語自体に固有の真理への直接アクセスの欠如を継承する。
本稿は,LLMがシステム1認知を大規模に運用する,高速,連想的,説得的だが,反射やファルシフィケーションは行わない,と論じる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:19:44 GMT)
Benchmarking Reasoning Reliability in Artificial Intelligence Models for Energy-System Analysis [0.0] 本研究では、エネルギーシステム解析に適用された大規模言語モデルにおける推論信頼性を定量化する再現可能なフレームワークであるAnalytical Reliability Benchmark(ARB)を紹介する。
GPT-4/5とClaude 4.5 Sonnetは、一貫性とポリシーに準拠した推論を実現した。
ARBは、因果関係、確率的、および政策駆動推論を検証するための、エネルギー文学における最初の定量的手法を確立している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 14:59:41 GMT)
Beat Detection as Object Detection [0.0] 最近のビートとダウンビート追跡モデル(例えば、RNN、TN、Transformers)はフレームレベルのアクティベーションを出力する。
我々は、このタスクをオブジェクト検出として再フレーミングし、ビートとダウンビートを時間的「対象」としてモデル化する。
コンピュータビジョンから1DオーディオへのFCOS検出器の適用により、元のバックボーンをWaveBeatの時間的特徴抽出器に置き換え、マルチスケールの時間的パターンをキャプチャするFeature Pyramid Networkを追加します。
このモデルは、信頼スコアで重なり合うビート/ダウンビート間隔を予測し、続いて非最大抑制(NMS)を行い、最終的な予測を選択する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 07:42:45 GMT)
Autonomous Cyber Resilience via a Co-Evolutionary Arms Race within a Fortified Digital Twin Sandbox [0.0] 本稿では「信頼の傾向」に対処するARC(Adversarial Resilience Co-evolution)フレームワークを紹介する。
ARCは、Fortified Secure Digital Twin内での共同進化型武器レースを開催する。
包括的なアブレーション調査は、共進化プロセス自体が27%のパフォーマンス改善に寄与していることを示している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:44:09 GMT)
AndroByte: LLM-Driven Privacy Analysis through Bytecode Summarization and Dynamic Dataflow Call Graph Generation [0.0] AndroByteは、AndroidアプリのためのAI駆動のプライバシー分析ツールである。
静的コード解析から正確で説明可能なデータフローコールグラフを生成する。
AndrosByteは、動的データフローコールグラフをオンザフライで生成する際の89%のFbetaスコアを実現している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:10:20 GMT)
Analysis of Hyperparameter Optimization Effects on Lightweight Deep Models for Real-Time Image Classification [0.0] 本研究では,ConvNeXt-T,EfficientV2-S,MobileNetV3-L,MobileViT v2(S/XS),RepVGG-A2,TinyViT-21Mの7つの軽量アーキテクチャの精度と展開可能性を評価する。
チューニングだけでは、ベースラインを1.5から3.5パーセント上回るトップ1の精度向上につながり、選択されたモデルでは、レイテンシが5ミリ秒未満で、毎秒9800フレームを超える。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:29:58 GMT)
Algorithms for dynamic scheduling in manufacturing, towards digital factories Improving Deadline Feasibility and Responsiveness via Temporal Networks [0.0] 従来の決定論的スケジュールは、現実が名目上の計画から逸脱した時に崩壊する。
この論文は、オフラインの制約プログラミングとオンラインの時間的ネットワーク実行を組み合わせることで、最悪の不確実性の下で実現可能なスケジュールを作成する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:28:25 GMT)
Algorithmic Temperature Induced by Adopted Regular Universal Turing Machine [0.0] 有効温度は、正規普遍チューリングマシンのアルゴリズム構造から自然に現れる。
特に、機械のラッパー言語の冗長性の成長は、プログラム長に対するボルツマンのような指数重み付けを誘導する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 09:01:36 GMT)
Adversarial Disentanglement by Backpropagation with Physics-Informed Variational Autoencoder [0.0] 物理系の部分的な知識の下での推測と予測は困難である。
本稿では,物理モデルとデータ駆動モデルの柔軟性を組み合わせた物理インフォームド変分オートエンコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 11:05:51 GMT)
Advances in Quantum Genetic Algorithms [0.0] 量子遺伝的アルゴリズム(Quantum Genetic Algorithms, QGA)は、ダーウィンの進化と自然選択をエミュレートする分野である。
本稿では、QGAを特定の物理アプリケーション向けに設計する際の問題符号化ステップと、最も遅いステップについて概観する。
トムソン問題の符号化は、様々な物理応用におけるQGAの利用に向けた決定的なステップであると結論付けている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 18:17:09 GMT)
AI Safety, Alignment, and Ethics (AI SAE) [0.0] モラルノルム(英: Moral norms)は、選択圧力下での協調動作を可能にする適応的なメカニズムである。
現在のアライメントアプローチは倫理をポストホックとして追加し、協力のための進化戦略として組み込むのではなく、外部の制約として扱う。
モラル表現学習をシステムレベルの設計と制度的なガバナンスに結びつけるガバナンス-埋め込み-表現パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 01:53:15 GMT)
A physically extended EEIO framework for material efficiency assessment in United States manufacturing supply chains [0.0] 経済における物質フローの物理的評価は、持続可能な脱炭と循環戦略の開発を支援することができる。
ここでは、米国エネルギー省(DOE)の産業脱炭のためのEEIO(EEIO-IDA)モデルのための新しい物理拡張について述べる。
この作業は、EEIO-IDAツールを含む既存のDOEフレームワークやツールと連携するように設計されている。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 20:26:41 GMT)
A dual typology of social media interventions and deterrence mechanisms against misinformation [0.0] プラットフォーム介入の5つの主要なタイプは、対応する5つの抑止機構にマッピングできると私は論じます。
これらのマッピングは、プラットフォームがユーザ行動に影響を与えるための様々な抑止機構をどのように適用するかを照らします。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 00:34:22 GMT)
A Temperature Change can Solve the Deutsch-Jozsa Problem : An Exploration of Thermodynamic Query Complexity [0.0] ブール関数を符号化したプローブ熱キュービットとマルチキュービット熱機械との単一熱交換により、その関数が平衡であるか定数であるかを判定することができる。
量子クエリの複雑性に関する熱力学モデルを導入し、量子ビット熱マシンがオーラクルとしてどのように振る舞うかを示す。
この研究は熱力学と複雑性理論を橋渡しし、量子熱力学が古典的な計算を超えた計算への非伝統的な経路を提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 04:14:09 GMT)
A Multi-Task Deep Learning Framework for Skin Lesion Classification, ABCDE Feature Quantification, and Evolution Simulation [0.0] 皮膚病変をカテゴリに分類し,各ABCD特徴のスコアを定量化する深層学習フレームワークを提案する。
このフレームワークは、皮膚病変が良性ネフスから悪性黒色腫へと進化するにつれて、潜伏空間におけるABCD特徴軌跡を可視化する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 16:28:21 GMT)
A Deep State-Space Model Compression Method using Upper Bound on Output Error [0.0] 本研究では,LQOシステムを含む深部状態空間モデル(ディープSSM)を内部ブロックとして検討する。
まず、2つの深部SSM間の出力誤差の上限を導出し、その境界が層状LQOシステム間の$h2$-errorノルムで表現可能であることを示す。
次に、$h2$-errorの基準で最適化問題を定式化し、勾配に基づくMOR法を開発する。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 10:32:21 GMT)
A Comprehensive Framework for Efficient Court Case Management and Prioritization [0.0] インドの司法制度は、約5200万件の仮審で重大な課題に直面している。
本研究では,訴訟の分類と優先順位付けを行うクラウドベースのソフトウェアフレームワークを提案する。
裁判は最初、記録または裁判所登録官の支持者によって入力され、続いて聴聞日の自動割り当てが行われる。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 17:11:38 GMT)
A Comprehensive Evaluation of Graph Neural Networks and Physics Informed Learning for Surrogate Modelling of Finite Element Analysis [0.0] 本稿では,グラフニューラルネットワーク(GNN)と3次元U-NetをパラメトリックI-ビームのFAAのサロゲートとして包括的に評価する。
本研究では,データによる事前学習と物理情報による微調整を併用したカリキュラム学習戦略が,学習の安定化に不可欠であることを実証する。
グラフベースのアーキテクチャでは、Message Passing Neural Networks (MPNN) と Graph Transformers が最も精度が高く、それぞれ3.5%と2.6%の相対的なL2スコアを達成した。
論文参考訳(メタデータ) (Thu, 16 Oct 2025 13:32:53 GMT)