Self-GIVE: Associative Thinking from Limited Structured Knowledge for Enhanced Large Language Model Reasoning [100.5] Graph Inspired Veracity Extrapolation (GIVE)は、知識グラフ(KG)を用いて構造化知識を外挿する。
本稿では,自動連想思考による大規模言語モデルの拡張を目的とした検索RLフレームワークであるSelf-GIVEを提案する。
Self-GIVEはQwen2.5 3Bおよび7Bモデルの性能を最大$textbf28.5%$rightarrow$71.4%$と$textbf78.6$rightarrow$90.5%$で改善した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:41:22 GMT)
Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs [92.7] MLA(Multi-head Latent Attention)は、効率的かつ経済的推論を保証するために設計された革新的なアーキテクチャである。
本稿では,マルチヘッドアテンションからMLAへの移行のための,データ効率の良いファインチューニング手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:37:19 GMT)
RL Grokking Recipe: How Does RL Unlock and Transfer New Algorithms in LLMs? [92.5] DELTA-Codeは、学習可能性と伝達可能性という2つの基本的な側面を探索するために設計された、合成符号問題ファミリーのベンチマークである。
実験の結果, ほぼゼロ報酬の期間が延長された後, RL訓練モデルが突然, ほぼ完全な精度に上昇した。
従来未解決であった問題ファミリの学習性を確保するため,深い報酬を伴うウォームアップ,経験リプレイ,カリキュラムトレーニング,ループ内検証などの重要なトレーニング項目を探索する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:19:39 GMT)
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task [89.5] Retrieval-augmented Generation (RAG) は現代のNLPの基盤となっている。
本稿では,複数言語にまたがるRAGの有効性について,複数言語にまたがるオープンドメイン問合せに対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:14:38 GMT)
Streaming Drag-Oriented Interactive Video Manipulation: Drag Anything, Anytime! [88.1] textbfstReaming drag-oriEnted interactiVe vidEo manipulation (REVEL)を提案する。
提案手法は,既存の自己回帰ビデオ拡散モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:38:35 GMT)
Bayesian Test-time Adaptation for Object Recognition and Detection with Vision-language Models [86.5] 我々は、オブジェクト認識と検出の両方のためのTTAのためのトレーニングフリーフレームワークであるBCA+を提案する。
我々はベイズ推論問題として適応を定式化し、キャッシュベースの予測で初期VLM出力を融合することで最終的な予測を生成する。
BCA+は、認識と検出のベンチマークの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:27:33 GMT)
On the Diminishing Returns of Complex Robust RAG Training in the Era of Powerful LLMs [85.7] 複雑な堅牢なトレーニング手法の利点は、言語モデルがより強力になるにつれて減少するのだろうか?
モデルキャパシティが増大するにつれて、高度なトレーニング戦略の限界ロバスト性利益は大幅に減少する。
さらなる調査により、より強力なモデルは、単純な訓練体制下であっても、より優れた信頼性キャリブレーション、クロスデータセットの一般化能力、より効果的な注意パターンを自然に示すことが示される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:11:16 GMT)
Malice in Agentland: Down the Rabbit Hole of Backdoors in the AI Supply Chain [83.0] 自分自身のインタラクションからのデータに対する微調整のAIエージェントは、AIサプライチェーン内の重要なセキュリティ脆弱性を導入している。
敵は容易にデータ収集パイプラインに毒を盛り、検出しにくいバックドアを埋め込むことができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:47:21 GMT)
TIT-Score: Evaluating Long-Prompt Based Text-to-Image Alignment via Text-to-Image-to-Text Consistency [81.2] LPG-Benchは、ロングプロンプトベースのテキスト・ツー・イメージ・ジェネレーションを評価するための包括的なベンチマークである。
13の最先端モデルから2,600の画像を生成し、包括的なヒューマンランクアノテーションを実行します。
本稿では,TITと呼ばれるテキスト・画像・画像間の整合性に基づくゼロショット計測手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:25:16 GMT)
WavInWav: Time-domain Speech Hiding via Invertible Neural Network [78.9] 従来の音声隠蔽法は、秘密の音声を復元する際に不満足な品質をもたらすことが多い。
フローベースの非可逆ニューラルネットワークを使用して、ステゴオーディオ、カバーオーディオ、シークレットオーディオの直接的なリンクを確立する。
また、隠れたデータを不正アクセスから保護するための暗号化技術も追加します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:36:16 GMT)
FocusAgent: Simple Yet Effective Ways of Trimming the Large Context of Web Agents [76.1] 大規模言語モデル(LLM)を利用したWebエージェントは、ユーザの目標を達成するために、長いWebページの観察を処理しなければならない。
既存のプルーニング戦略は、関連するコンテンツを捨てるか、無関係なコンテキストを保持するかのいずれかであり、最適以下の行動予測につながる。
FocusAgentは軽量LCMレトリバーを利用してアクセシビリティツリー(AxTree)観測から最も関連性の高い線を抽出するシンプルで効果的なアプローチである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:41:30 GMT)
So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection [75.8] So-Fake-Setは、200万以上の高品質な画像、多様な生成源、35の最先端生成モデルを用いて合成された画像を備えたソーシャルメディア指向のデータセットである。
本稿では,高精度な偽造検出,高精度な位置推定,解釈可能な視覚論理による説明可能な推論に強化学習を利用する高度な視覚言語フレームワークであるSo-Fake-R1を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:57:10 GMT)
RACCooN: A Versatile Instructional Video Editing Framework with Auto-Generated Narratives [74.0] 本稿では,RACCooNを提案する。
ビデオ生成モデルは、自動生成された物語や指示を取り入れて、生成されたコンテンツの質と精度を高める。
提案フレームワークは,ビデオ・パラグラフ生成,映像コンテンツ編集において優れた多機能性を示し,さらに拡張するために他のSoTAビデオ生成モデルに組み込むことができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:27:55 GMT)
Ranked from Within: Ranking Large Multimodal Models Without Labels [74.0] ソフトマックス分布から導かれる不確実性スコアは,様々なタスクにまたがるランキングモデルに対して,ロバストな基礎となることを示す。
これにより、ラベルのないデータに対するLMMのランク付けが容易になり、手動のアノテーションを必要とせずに、多様なターゲットドメインのモデルを選択するための実践的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:08:33 GMT)
UniVerse: Unleashing the Scene Prior of Video Diffusion Models for Robust Radiance Field Reconstruction [73.3] ビデオ拡散モデルに基づくロバストな再構築のための統一フレームワークUniVerseを紹介する。
具体的には、UniVerseはまず、一貫性のない画像を最初のビデオに変換し、その後、特別に設計されたビデオ拡散モデルを使って、それらを一貫したイメージに復元する。
合成と実世界の両方のデータセットを用いた実験は,頑健な再構築において,我々の手法の強い一般化能力と優れた性能を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:06:10 GMT)
ROGR: Relightable 3D Objects using Generative Relighting [71.4] ROGRは,複数の視点から捉えたオブジェクトの3Dモデルを再構築する新しい手法である。
我々は、入力された環境光の下で物体の外観を出力する照明条件のニューラルレージアンス場(NeRF)を訓練する。
我々は、確立されたTensoIRおよびStanford-ORBデータセットに対する我々のアプローチを評価し、実世界のオブジェクトキャプチャに対する我々のアプローチを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:35:22 GMT)
SP-VLA: A Joint Model Scheduling and Token Pruning Approach for VLA Model Acceleration [70.7] VLA(Vision-Language-Action)モデルは、その強力な制御能力に注目が集まっている。
計算コストが高く、実行頻度も低いため、ロボット操作や自律ナビゲーションといったリアルタイムタスクには適さない。
本稿では,共同スケジューリングモデルとプルーニングトークンにより,VLAモデルを高速化する統一フレームワークSP-VLAを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:47:18 GMT)
External Data Extraction Attacks against Retrieval-Augmented Large Language Models [70.5] RAGは、大規模言語モデル(LLM)を拡張するための重要なパラダイムとして登場した。
RAGは外部データ抽出攻撃(EDEA)の新たなリスクを導入している。
本研究は, EDEA を検索拡張 LLM に対して形式化する最初の総合的研究である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:53:45 GMT)
PocketSR: The Super-Resolution Expert in Your Pocket Mobiles [69.3] リアルワールド・イメージ・スーパーレゾリューション (RealSR) は、携帯電話が捉えたような、Wild内の画像の視覚的品質を高めることを目的としている。
大規模な生成モデルを利用する既存の手法は印象的な結果を示しているが、計算コストとレイテンシが高いため、エッジ配置には実用的ではない。
超軽量単一ステップモデルであるPocketSRを導入し,高忠実度を維持しつつ生成モデリング機能をRealSRにもたらす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:56:18 GMT)
A Nearly Optimal and Low-Switching Algorithm for Reinforcement Learning with General Function Approximation [67.7] 我々は、強化学習のための新しいアルゴリズム、MQL-UCBを用いたモノトニックQ-Learningを提案する。
MQL-UCBは、$tildeO(dsqrtHK)$の最小限の後悔を実現する。
本研究は,非線形関数近似を用いたサンプル効率およびデプロイメント効率のよいQ-ラーニングの設計に重点を置いている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:31:37 GMT)
Understanding Catastrophic Interference On the Identifibility of Latent Representations [67.1] 破滅的な干渉、あるいは破滅的な忘れ(Caastrophic forgetting)は、機械学習の根本的な課題である。
本稿では,破滅的干渉を識別問題として定式化する新しい理論枠組みを提案する。
我々のアプローチは、合成データセットとベンチマークデータセットの両方で理論的保証と実用的なパフォーマンスの改善を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:43:10 GMT)
Coevolutionary Continuous Discrete Diffusion: Make Your Diffusion Language Model a Latent Reasoner [66.9] 拡散言語モデルは必ずしも離散空間にある必要はないと主張する。
特に、連続拡散モデルが離散拡散やループ変換器よりも強い表現性を持つことを示す。
本稿では,連続表現空間と離散トークン空間の結合に関する共同多モード拡散過程を定義する共進化連続拡散法(CCDD)を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:44:41 GMT)
Accuracy Law for the Future of Deep Time Series Forecasting [65.5] 時系列予測は、部分的に観測可能で不確実な性質のため、本質的にゼロでない誤差の低い境界に直面する。
本稿では、ディープ時系列予測の性能上限をどうやって推定するかという根本的な問題に焦点をあてる。
新たに訓練された2,800以上の深層予測器の厳密な統計的テストに基づいて、深部モデルの最小予測誤差とウィンドウワイズ級数パターンの複雑さとの間に有意な指数関数的関係を見出した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:18:47 GMT)
AlignDiT: Multimodal Aligned Diffusion Transformer for Synchronized Speech Generation [65.1] マルチモーダル・トゥ・音声タスクは、映画製作、ダビング、仮想アバターなど、幅広い応用によって注目を集めている。
既存の手法は、音声の了解性、音声とビデオの同期、音声の自然さ、および参照話者との音声類似性の制限に悩まされている。
本稿では,アライメントされたマルチモーダル入力から正確な,同期化,自然な音声を生成するマルチモーダルアラインド拡散変換器AlignDiTを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:54:34 GMT)
A Granular Study of Safety Pretraining under Model Abliteration [64.2] 本稿では,リフレクションに敏感な方向を除去する軽量プロジェクション技術であるモデルアブリーブレーションについて検討する。
我々は、バランスのとれた有害かつ無害なケースで100のプロンプトを発行し、複数の判断を用いて**Refusal*または***Non-Refusal*として応答を分類し、判断の忠実さを検証する。
本研究は,データ中心の安全コンポーネントが失語中も頑健であるチェックポイントレベルの特徴付けを行う。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:01:45 GMT)
CostFilter-AD: Enhancing Anomaly Detection through Matching Cost Filtering [64.2] 非教師付き異常検出(UAD)は、通常のサンプルに対して入力画像の異常マスクをローカライズしようとする。
古典的マッチングタスクから借用したコストフィルタリングの概念をUAD問題に導入する。
本稿では,複数の特徴層にまたがるアテンションクエリとして,入力観測によって導かれるコストボリュームフィルタリングネットワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:09:02 GMT)
Destination-to-Chutes Task Mapping Optimization for Multi-Robot Coordination in Robotic Sorting Systems [63.1] 本研究では,ロボットソーティングシステムのスループット向上のために,タスクマッピングの宛先最適化について検討する。
現実世界のRSSの複雑さのため、高品質なタスクマッピングを見つけることは難しい。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:49:37 GMT)
ExGS: Extreme 3D Gaussian Compression with Diffusion Priors [60.7] ExGSは,Universal Gaussian Compression(UGC)とGaussPainter Extreme 3DGS圧縮を一体化した新しいフィードフォワードフレームワークである。
我々のフレームワークは100X以上の圧縮(典型的な354.77MBモデルを約3.31MBに還元する)を達成できる一方で、忠実さを保ち、挑戦的な条件下で画像品質を著しく向上させることができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:11:54 GMT)
MTRec: Learning to Align with User Preferences via Mental Reward Models [60.3] 我々は、実際のユーザの好みに合わせてデザインされたシーケンシャルなレコメンデーションフレームワークであるMTRecを提案する。
ユーザの満足度を定量化するためのメンタル報酬モデルを導入し,それを学習するための分散逆強化学習手法を提案する。
実験により、MTRecは様々なレコメンデーションモデルに大幅な改善をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:22:04 GMT)
When and Where do Events Switch in Multi-Event Video Generation? [59.9] イベントシフトにおける本質的要因の検査を省略する。
この研究は、マルチイベントテキスト・ツー・ビデオ(T2V)生成を評価するためのセルフキュレートプロンプトスイートであるMEveを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:31:56 GMT)
OneFlow: Concurrent Mixed-Modal and Interleaved Generation with Edit Flows [59.1] 可変長および同時混合モード生成が可能な最初の非自己回帰型マルチモーダルモデルであるOneFlowを提案する。
テキストと画像生成の間の厳格な因果順序を強制する自己回帰モデルとは異なり、OneFlowは個別のテキストトークンに対する挿入ベースのEdit Flowと、画像潜伏者のためのFlow Matchingを組み合わせる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:40:30 GMT)
DualRAG: A Dual-Process Approach to Integrate Reasoning and Retrieval for Multi-Hop Question Answering [57.9] MHQA(Multi-Hop Question Answering)タスクは、多様な知識領域にまたがる多段階推論のオーケストレーションにおいて課題となる。
推論と検索をシームレスに統合する相乗的デュアルプロセスフレームワークであるDualRAGを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:17:44 GMT)
PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning [57.9] PRISM-Physicsはプロセスレベルの評価フレームワークであり、複雑な物理推論問題のベンチマークである。
解は公式の有向非巡回グラフ(DAG)として表される。
その結果,評価フレームワークは人的専門家のスコアと一致していることがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:09:03 GMT)
Understanding Generative Recommendation with Semantic IDs from a Model-scaling View [57.5] Generative Recommendation (GR)は、リッチアイテムのセマンティクスと協調フィルタリング信号を統合する。
一般的なアプローチの1つは、セマンティックID(SID)を使用して、自動回帰ユーザーインタラクションシーケンスモデリングのセットアップでアイテムを表現することである。
SIDをベースとしたGRは,モデルをスケールアップしながら大きなボトルネックを示す。
我々は、大規模言語モデル(LLM)を直接レコメンデーションとして使用する別のGRパラダイムを再考する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:21:43 GMT)
CoDA: Agentic Systems for Collaborative Data Visualization [57.3] 深層研究はデータ分析に革命をもたらしたが、データサイエンティストは依然として手作業による視覚化にかなりの時間を費やしている。
単純なシングルエージェントシステムやマルチエージェントシステムを含む既存のアプローチは、しばしばタスクを単純化する。
本稿では,メタデータ分析,タスク計画,コード生成,自己回帰に特殊なLLMエージェントを利用するマルチエージェントシステムであるCoDAを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:30:16 GMT)
FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.2] FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:35:52 GMT)
Co-rewarding: Stable Self-supervised RL for Eliciting Reasoning in Large Language Models [56.1] 検証可能な報酬(RLVR)を用いた強化学習は,大規模言語モデル(LLM)の推論能力の向上に有効である
近年の自己回帰法は LLM の推論能力を解き放つためのラベルフリーな代替手段について検討している。
我々は、他の視点から補完的な監督を求めることにより、トレーニングの安定性を向上させる新しい自己監督型RLフレームワークであるtextitCo-rewardingを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:15:38 GMT)
What Drives Compositional Generalization in Visual Generative Models? [56.0] 画像生成と映像生成において,様々なデザイン選択が構成一般化にどのように影響するかを体系的に研究する。
i)訓練対象が離散的あるいは連続的な分布に作用するか否か,および(ii)訓練中に構成概念に関する情報を提供する条件がどの程度あるか,という2つの要因を同定する。
これらの知見に基づいて,MaskGITの離散的損失を補助的連続JEPAベースで緩和することにより,MaskGITのような離散モデルにおける構成性能を向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:02:27 GMT)
Align Your Query: Representation Alignment for Multimodality Medical Object Detection [55.9] 本稿では,表現をモダリティの文脈と整合させる検出非依存の枠組みを提案する。
モーダリティトークンをマルチモーダリティコンテキスト注意による検出プロセスに統合する。
提案されたアプローチは、最小限のオーバーヘッドとアーキテクチャの変更を伴わず、APを継続的に改善する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:49:21 GMT)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [55.8] The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。
3つの理論的な貢献により、現在の最先端の成果が向上する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:41:02 GMT)
Learning to Reason as Action Abstractions with Scalable Mid-Training RL [55.2] 効果的な中間訓練フェーズは、有用なアクションのコンパクトなセットを特定し、高速な選択を可能にする。
本稿では,スケーラブルなミッドトレーニングアルゴリズムであるReasoning as Action Abstractions (RA3)を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:31:29 GMT)
Best-of-Majority: Minimax-Optimal Strategy for Pass@$k$ Inference Scaling [54.5] LLM推論は、しばしばプロンプトの一連の候補を生成し、多数決やBest-of-N (BoN)のような戦略を介して1つを選択する。
我々は,最上位の$k$報酬を選択する前に,上位の$N$サンプルにおいて,高い周波数の応答を候補に限定するピボットステップを備えたBest-of-Majority (BoM)を提案する。
多数決とBoNとは異なり、BoMは重要な利点がある:多数決とBoNとは異なり、そのパフォーマンスはN$を上昇しても低下しない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:35:45 GMT)
Lang-PINN: From Language to Physics-Informed Neural Networks via a Multi-Agent Framework [54.4] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解くための強力なアプローチを提供する
本稿では,Lang-PINNを提案する。Lang-PINNはLLM駆動のマルチエージェントシステムで,自然言語タスク記述から直接トレーニング可能なPINNを構築する。
実験により、Lang-PINNは、競合するベースラインよりもかなり低いエラーとロバスト性を達成することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:20:02 GMT)
Taming Imperfect Process Verifiers: A Sampling Perspective on Backtracking [54.4] 言語モデルの生成能力をプロセス検証器と組み合わせたテストタイムアルゴリズムは、新しい推論能力を引き出すための有望なレバーを提供する。
提案手法は, 理論的に根拠付きバックトラックを用いて, 検証誤差に対して, 確実な堅牢性を実現するための新しいプロセス誘導型テスト時間サンプリングアルゴリズムであるVGBを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:21:14 GMT)
InstructPLM-mu: 1-Hour Fine-Tuning of ESM2 Beats ESM3 in Protein Mutation Predictions [54.2] InstructPLM-muと呼ばれる微調整フレームワークを提案する。
構造入力を持つ細調整ESM2はESM3に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:42:22 GMT)
Understanding the Performance Gap in Preference Learning: A Dichotomy of RLHF and DPO [53.9] 本研究では,人間からのフィードバックからの強化学習と,表現ギャップ下での直接選好最適化との間の性能ギャップを分解する。
RLHF, DPO, オンラインDPOは, モデルミスのタイプによって, 互いに優れることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:02:08 GMT)
LayerCake: Token-Aware Contrastive Decoding within Large Language Model Layers [53.4] 大規模言語モデル(LLM)は、自然言語の理解と生成に優れるが、事実の誤りに弱いままである。
本稿では,トークン型と最も影響力のあるトランスフォーマー層を整合させて実データ生成を改善する,トークン認識型コントラストデコーディング手法を提案する。
提案手法は追加のトレーニングやモデル修正を必要とせず,複数のLSMおよび各種ベンチマークの事実性を常に改善することを示す実験である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:24:43 GMT)
MaskCD: Mitigating LVLM Hallucinations by Image Head Masked Contrastive Decoding [53.1] 大規模視覚言語モデル(LVLM)のための画像ヘッドMasked Contrastive Decoding(MaskCD)を提案する。
提案手法はLVLMの「画像ヘッド」を利用して,コントラストデコーディングのためのコントラストサンプルを構築する。
その結果,MaskCDは幻覚現象を効果的に軽減し,LVLMの汎用能力を保っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:59:16 GMT)
MCGS-SLAM: A Multi-Camera SLAM Framework Using Gaussian Splatting for High-Fidelity Mapping [53.0] 3次元ガウス平板上に構築した初のRGBベースのマルチカメラSLAMシステムMCGS-SLAM(3DGS)を提案する。
マルチカメラバンドル調整(MCBA)は、高密度の測光および幾何残差を介してポーズと深さを共同で洗練し、スケール整合モジュールはビューを横断する計量アライメントを強制する。
合成および実世界のデータセットの実験は、MCGS-SLAMが一貫して正確な軌道と光現実的再構成をもたらすことを示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:24:13 GMT)
On the $O(\frac{\sqrt{d}}{K^{1/4}})$ Convergence Rate of AdamW Measured by $\ell_1$ Norm [53.0] 本稿では、$ell_1$ノルムで測定されたAdamWに対して、収束速度 $frac1Ksum_k=1KEleft[||nabla f(xk)||_1right]leq O(fracsqrtdCK1/4)$を確立する。
結果は、二重モーメント機構を用いたAdamW変種であるNAdamWに拡張し、同じ収束率を維持していることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:29:58 GMT)
SingMOS-Pro: An Comprehensive Benchmark for Singing Quality Assessment [52.7] 自動歌唱品質評価のためのデータセットであるSingMOS-Proを紹介する。
SingMOS-Proは、追加部分のアノテーションを拡張して、歌詞、メロディ、全体的な品質を含む。
データセットには、12データセットにわたる41のモデルによって生成された7,981の歌声クリップが含まれている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:07:06 GMT)
Leave No TRACE: Black-box Detection of Copyrighted Dataset Usage in Large Language Models via Watermarking [51.7] 我々は,大規模な言語モデルにおける著作権付きデータセット使用量を完全にブラックボックスで検出するフレームワークであるTRACEを提案する。
textttTRACEは、プライベートキーでガイドされた歪みのない透かしでデータセットを書き換える。
さまざまなデータセットとモデルファミリにわたって、TRACEは一貫して重要な検出を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:53:02 GMT)
Representing Beauty: Towards a Participatory but Objective Latent Aesthetics [51.6] 美的コンテンツが、モデル間でより類似し、整合した表現をいかに生み出すかを示す。
我々は、人間の知覚的・創造的な行為が、深層学習システムのこれらの潜伏した空間を形成する上で、中心的な役割を担っていると論じる。
以上の結果から,人間と機械の共創は可能ではなく基礎的なものであることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:09:37 GMT)
The Path of Self-Evolving Large Language Models: Achieving Data-Efficient Learning via Intrinsic Feedback [51.1] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を高める可能性を実証した。
本研究では,最小限のデータを用いたLLによるLLMの改善について検討する。
データ依存を最小限に抑えるため、自己認識に基礎を置いた2つの新しいメカニズムを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:32:10 GMT)
Don't Just Chase "Highlighted Tokens" in MLLMs: Revisiting Visual Holistic Context Retention [51.0] MLLM(Multimodal Large Language Models)は、巨大な視覚トークンに依存するため、計算オーバーヘッドがかなり大きい。
近年の研究では、この問題を緩和するためにトークンプルーニングが検討されている。
本稿では,効率的な推論のためのビジュアルトークン・プルーニング・フレームワークであるHoloVを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:33:40 GMT)
RelayFormer: A Unified Local-Global Attention Framework for Scalable Image and Video Manipulation Localization [50.8] 様々な解像度とモダリティに対応する統一フレームワークであるRelayFormerを提案する。
RelayFormerは、入力を固定サイズのサブイメージに分割し、Global-Local Relay(GLR)トークンを導入する。
これにより、セマンティックや時間的一貫性などのグローバルなキューを効率よく交換でき、きめ細かいアーティファクトを保存できる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:55:08 GMT)
Hyperparameter Loss Surfaces Are Simple Near their Optima [50.7] 複素損失曲面を明らかにするために,ランダム探索に基づく手法を開発した。
この体制の中では、ランダム検索から得られる最良のスコアは、我々が発見する新しい分布である。
これらの特徴から、その収束を説明・外挿できるランダム探索の新しい法則を導出する。
これらの新しいツールは、最高のパフォーマンスのための信頼区間などの新しい分析を可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:52:27 GMT)
Beyond the Final Layer: Intermediate Representations for Better Multilingual Calibration in Large Language Models [50.3] 大規模言語モデル(LLM)の信頼性確保には信頼度校正が不可欠である
6つのモデルファミリーと100以上の言語にまたがる多言語キャリブレーションの大規模かつ体系的な研究を行う。
非英語言語は体系的に悪い校正に苦しむ。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:07:15 GMT)
Theoretical Investigation on Inductive Bias of Isolation Forest [50.0] アイフォレスト(iForest)は、広く使われている教師なしの異常検知器として注目されている。
広く採用されているにもかかわらず、iForestの成功を説明する理論的基盤は未だに不明である。
本稿では,iForestの帰納バイアスに着目し,iForestがどのような状況で,どの程度うまく機能するかを理論的に解明する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:09:03 GMT)
The Curious Case of In-Training Compression of State Space Models [49.8] ステートスペースモデル(SSM)は並列化可能なトレーニングと高速推論の両方を提供する。
重要な設計課題は、表現力の最大化とこの計算負担の制限の間の適切なバランスを打つことである。
トレーニング中の削減は,表現性を保ちながら最適化を著しく加速することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:02:33 GMT)
Same Task, Different Circuits: Disentangling Modality-Specific Mechanisms in VLMs [49.4] VLM(Vision-Language Model)は、視覚的な入力に関する質問に答える能力を示すが、テキスト上で類似のタスクを実行する際の精度は高い。
異なるモードのテキスト回路を同定し,比較することにより,この精度ギャップについて検討する。
これを解決するために、後層の視覚データトークンの表現を以前のレイヤに戻します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:09:48 GMT)
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning [49.2] 家庭環境下で活動する身体的エージェントは、曖昧で特定されていない人間の指示を解釈しなければならない。
LLM生成報酬を用いたオンライン強化学習(RL)を用いた視覚言語行動(VLA)ポリシーとして,マルチモーダル大規模言語モデル(MLLM)を微調整する新しいアプローチを提案する。
以上の結果から,RLを微細化したMLLMは,すべてのベースラインを顕著なマージン(10.4~16.5%)で上回り,新規なシーンやタスクに適していることが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:54:29 GMT)
Confidence and Dispersity as Signals: Unsupervised Model Evaluation and Ranking [47.0] 本稿では,教師なしモデル評価とランキングのための統一的で実用的なフレームワークを提案する。
ハイブリッドメトリクスは、データセット中心およびモデル中心の評価設定の両方において、単一アスペクトメトリクスを一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:48:11 GMT)
To Compress or Not? Pushing the Frontier of Lossless GenAI Model Weights Compression with Exponent Concentration [46.6] 低精度浮動小数点フォーマットは、遅延化オーバーヘッドを伴わずに安定性、メモリ節約、ハードウェア効率を提供する。
本稿では,エントロピー対応エンコーディングとGPU最適化デコーディングを備えた圧縮フレームワークであるExponent-Concentrated FP8(ECF8)を提案する。
LLMとDiTの最大671Bパラメータの実験では、最大26.9%のメモリ節約と177.1%のスループット加速が示されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:22:13 GMT)
DMark: Order-Agnostic Watermarking for Diffusion Large Language Models [46.1] 拡散大言語モデル(dLLM)は、同等の品質を維持しながら、自己回帰モデルよりも高速な生成を提供する。
DMarkは、dLLM用に特別に設計された最初の透かしフレームワークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:14:16 GMT)
State Field Coverage: A Metric for Oracle Quality [45.8] オラクルの品質を評価するための新しい指標であるステートフィールドカバレッジを導入する。
私たちのメトリクスの主な直感は、より高い状態のフィールドカバレッジを持つオラクルは、分析中のソフトウェアの欠陥を検出する傾向にあるということです。
静的に計算されているため、メトリックは効率的であり、テストオラクルを改善するための直接的なガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:57:37 GMT)
Behavior Injection: Preparing Language Models for Reinforcement Learning [45.7] 我々はRL目標のステップごとの影響を分析し、効果的な後学習のための2つの重要な条件を同定する。
RLに先立って適用されたタスクに依存しないデータ拡張方式である振舞い注入を提案する。
提案手法は,複数のベースモデルを用いた2つの推論ベンチマークで評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:14:06 GMT)
What Has Been Lost with Synthetic Evaluation? [45.7] 大規模言語モデル(LLM)は、データ生成にますます使われている。
オーバーテキストベンチマークを生成することにより, LLM が要求を満たすことができるかどうかを検討する。
我々は、LLMが人間によって認可されたものよりも難易度が低いことを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:11:15 GMT)
HEART: Emotionally-driven test-time scaling of Language Models [45.6] HEARTは感情駆動型プロンプトを反復的自己補正に用いる新しいフレームワークである。
我々は、OlympiadBench、HumanityのLast Exam、SimpleQAなど、挑戦的な推論ベンチマークに関するフレームワークを評価した。
オラクル検証器によって導かれると、この感情的プロトコルははるかに深い推論を解き放ちます。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:59:16 GMT)
Cache-to-Cache: Direct Semantic Communication Between Large Language Models [45.6] Cache-to-Cache(C2C)は、マルチLLMモデル間の直接セマンティック通信のための新しいパラダイムである。
C2Cはニューラルネットワークを使用して、ソースモデルのKVキャッシュをターゲットモデルと融合して、直接的なセマンティックトランスファーを可能にする。
さらにテキスト通信のパラダイムを約3.0-5.0%上回り、平均2.0倍のレイテンシ向上を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:52:32 GMT)
Adaptive Node Feature Selection For Graph Neural Networks [45.4] 本稿では,グラフニューラルネットワーク(GNN)の適応ノード特徴選択手法を提案する。
私たちの経験的な結果は、異なるグラフアーキテクチャに対するアプローチの柔軟性と、より困難なグラフ学習設定への適応性を検証するものです。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:26:11 GMT)
Memory Forcing: Spatio-Temporal Memory for Consistent Scene Generation on Minecraft [45.4] Memory Forcingは、トレーニングプロトコルとジオメトリインデックス付き空間メモリを組み合わせた学習フレームワークである。
メモリフォーシングは,様々な環境において,長期的空間整合性と生成品質に優れることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:35:16 GMT)
Learning Robust Diffusion Models from Imprecise Supervision [45.2] DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:00:32 GMT)
SelfBudgeter: Adaptive Token Allocation for Efficient LLM Reasoning [43.9] SelfBudgeterは、アダプティブな制御可能な推論フレームワークで、推論の前に予算推定メカニズムを組み込む。
本稿では,問題複雑度に応じて予算を動的に割り当てることにより,平均応答長61%の圧縮が得られることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:38:03 GMT)
HopaDIFF: Holistic-Partial Aware Fourier Conditioned Diffusion for Referring Human Action Segmentation in Multi-Person Scenarios [43.3] アクションセグメンテーションは、ビデオをセグメントに分割し、事前に定義されたアクションセットからラベルを割り当てることを目的とした、ハイレベルなビデオ理解における中核的な課題である。
本研究では,テキスト参照誘導型ヒューマンアクションセグメンテーションを多人数設定で開発する。
RHAS133は133本の映画から作成され、33時間のビデオデータによる137のきめ細かいアクションで注釈付けされている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:21:29 GMT)
Dynamic Prompt Generation for Interactive 3D Medical Image Segmentation Training [43.1] 3Dバイオメディカルイメージセグメンテーションは、ユーザのプロンプトに基づいて予測を反復的に洗練する効率的なモデルを必要とする。
画像エンコーダの使用を最適化するために,動的ボリュームプロンプト生成とコンテンツ認識適応作付けを組み合わせたトレーニング戦略を提案する。
本手法は,1つのGPU上の逐次改善フィードバックから学習する際の計算課題に対処しながら,トレーニング中の現実的なユーザインタラクションパターンをシミュレートする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:16:24 GMT)
LEAML: Label-Efficient Adaptation to Out-of-Distribution Visual Tasks for Multimodal Large Language Models [42.7] 医用画像処理タスクのためのラベル効率のよい適応フレームワークであるLEAMLを紹介する。
提案手法は, キャプション蒸留により正規化されたQA生成器を用いて, ラベルのないデータに対して, ドメイン関連疑似問合せペアを生成する。
消化管内視鏡およびスポーツVQAの実験は、LEAMLが最小限の監督下で標準微調整よりも一貫して優れていることを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:59:56 GMT)
Test-Time Defense Against Adversarial Attacks via Stochastic Resonance of Latent Ensembles [42.6] 敵攻撃に対するテスト時間防御機構を提案する。
モデルの予測を著しく変える、知覚できないイメージの摂動。
本研究では,画像分類における精度損失の68.1%,ステレオマッチングでは71.9%,光学フローでは29.2%まで回復することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:57:25 GMT)
Self-Reflective Generation at Test Time [42.0] 大規模言語モデル(LLM)は、長いチェーン・オブ・シークレットを通じて複雑な推論タスクを徐々に解決する。
既存の自己修正は、完全なドラフトに対して修正を行うか、高価なトレーニングを通じて自己修正を学ぶ。
テスト時間における自己回帰生成(SRGen)は、不確実な点で生成する前に反映する軽量なテスト時間フレームワークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:46:04 GMT)
Universal classical-quantum channel resolvability and private channel coding [41.3] 我々は、c-qチャネルのための完全普遍的なプライベートチャネル符号化プロトコルを構築する問題に対処する。
ユニバーサルチャネルの可解性を保証するコードブックの明示的な構造特性を同定する。
完全普遍的なプライベートチャネル符号化は、既知の最適率を達成することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:40:44 GMT)
Consolidating Reinforcement Learning for Multimodal Discrete Diffusion Models [40.8] 離散拡散においてスケーラブルなマルチモーダル強化学習を実現するための,最初の実行可能なアプローチであるMaskGRPOを紹介する。
MaskGRPOはより安定的で効率的なアップデートをもたらし、推論性能が向上し、世代品質が向上する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:36:24 GMT)
VeriGuard: Enhancing LLM Agent Safety via Verified Code Generation [40.6] 医療などのセンシティブなドメインに自律的なAIエージェントを配置することは、安全性、セキュリティ、プライバシに重大なリスクをもたらす。
LLMをベースとしたエージェントに対して、正式な安全保証を提供する新しいフレームワークであるVeriGuardを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:11:43 GMT)
Improving GUI Grounding with Explicit Position-to-Coordinate Mapping [40.2] 現在のアプローチでは、視覚的特徴から直接テキストトークンとして座標を生成するため、複雑な位置-画素マッピングを暗黙的に推論せざるを得ない。
我々はRULERトークンを明示的な座標マーカーとして提案し、モデル参照位置を地図上のグリッドラインに類似させ、スクラッチから座標を生成するのではなく調整する。
ScreenSpot、ScreenSpot-V2、ScreenSpot-Proの実験では、グラウンドの精度が一貫した向上を示し、高解像度インターフェースが最大の改善となった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:59:34 GMT)
Decoupling Positional and Symbolic Attention Behavior in Transformers [40.2] トランスフォーマーでは、位置情報は位置 s (PE) を用いて符号化される
近年、RoPEの成功の一部は、大小の周波数を用いて、ロバストな位置情報や意味情報をエンコードする能力から生じると論じられている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:31:15 GMT)
When Large Language Models are Reliable for Judging Empathic Communication [40.0] 大規模言語モデル(LLM)は、テキストベースの会話において共感的な応答を生成するのに優れている。
共感コミュニケーションのニュアンスをどの程度確実に判断できるか?
我々は、専門家、クラウドワーカー、LLMが4つの評価フレームワーク間で共感的なコミュニケーションを注釈する方法について比較する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:36:51 GMT)
BrainIB++: Leveraging Graph Neural Networks and Information Bottleneck for Functional Brain Biomarkers in Schizophrenia [39.9] 我々はBrainIB++というエンドツーエンドの革新的なグラフニューラルネットワークフレームワークを紹介した。
情報ボトルネック(IB)の原則を適用し、解釈のためのモデルトレーニング中に最も情報に富むデータ駆動脳領域をサブグラフとして識別する。
常に優れた診断精度を示し、目に見えないデータに対する一般化性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:48:15 GMT)
SpineBench: A Clinically Salient, Level-Aware Benchmark Powered by the SpineMed-450k Corpus [39.7] 松葉病は全世界で6億1919万人に影響を及ぼし、障害の主な原因となっている。
SpineMedは、脊椎外科医を実践するエコシステムである。
SpineMed-450kは、脊椎レベルの推論のために明示的に設計された最初の大規模データセットである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:32:02 GMT)
Query-Level Uncertainty in Large Language Models [39.6] クエリーレベル不確実性を用いて知識境界を検出する手法を提案する。
この方法は、任意のトークンを生成する前に、モデルが所定のクエリに応答できるかどうかを推定する。
我々は、適応推論設定におけるその利点を示し、RAGとモデルカスケーディングは、全体的な性能を維持しながら、推論コストを削減することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:54:09 GMT)
SoT: Structured-of-Thought Prompting Guides Multilingual Reasoning in Large Language Models [39.1] 本論文では,多段階変換による多言語推論の性能向上を目的とした学習自由度手法を提案する。
Structured-of-Thought(SoT)メソッドは、言語固有の意味情報を言語に依存しない構造化表現に変換する。
実験により、SoTは複数の多言語推論ベンチマークにおいて、いくつかの強いベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:02:14 GMT)
Understanding Retrieval Augmentation for Long-Form Question Answering [38.9] 本研究では,検索した文書が言語モデル(LM)の長文生成タスクにどのように使用されるかを検討する。
LMは関連するテキスト内文書を活用できるが、生成した回答は文書に対して部分的にのみ帰属する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:29:29 GMT)
SALSA-V: Shortcut-Augmented Long-form Synchronized Audio from Videos [38.4] SALSA-Vは,サイレントビデオコンテンツから高同期・高忠実長音声を合成できるマルチモーダルビデオ・オーディオ生成モデルである。
提案手法では,非拘束長音声系列の音声条件生成とシームレスな合成を可能にする。
SALSA-Vは,映像コンテンツと音声の協調・同期の両面で,定量的評価と人間の聴取研究において,既存の最先端手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:37:50 GMT)
RAxSS: Retrieval-Augmented Sparse Sampling for Explainable Variable-Length Medical Time Series Classification [38.4] 検索インフォームド分類のためのスパースサンプリングフレームワークを一般化する。
我々は、チャネル内類似性による予測を集約し、確率空間、凸級数レベルスコア、説明可能性を示す明確なエビデンストレイルに集約する。
提案手法は,競争力のあるiEEG分類性能を実現し,透明性と説明可能性を高める。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:26:19 GMT)
Distributed Low-Communication Training with Decoupled Momentum Optimization [38.3] 大規模モデルのトレーニングには相当な計算資源が必要であり、通常は高帯域の相互接続を持つデータセンターでのみ利用可能である。
本稿では,分散モデルレプリカ間の頻繁な同期と運動量勾配圧縮を組み合わせることで,コミュニケーションをさらに削減する手法を提案する。
特に、モーメントを信号として扱い、離散コサイン変換によりネステロフモーメントを高周波成分と低周波成分に分解する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:25:21 GMT)
Automated Constraint Specification for Job Scheduling by Regulating Generative Model with Domain-Specific Representation [38.2] 本稿では,大規模言語モデル (LLM) を規定する制約中心アーキテクチャを提案する。
自動生産シナリオ適応アルゴリズムを設計,展開し,アーキテクチャを特定の製造構成に合わせて効率的にカスタマイズする。実験結果から,提案手法はLCMの生成能力と製造システムの信頼性要件とのバランスをとることができた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:34:11 GMT)
Training-Free Out-Of-Distribution Segmentation With Foundation Models [38.0] 大規模な視覚基盤モデル、例えば、DINOv2、InternImage、CLIPは、多様なタスクをうまく一般化する豊富な機能を提供することで、高度な視覚表現学習を提供する。
我々は、InternImageのバックボーンの機能を活用し、生デコーダログの信頼しきい値とK-Meansクラスタリングを適用して、OoDクラスタを識別する、トレーニング不要なアプローチを提案する。
Intern Image-L を用いた ADE-OoD のベンチマークでは, 平均50.02 精度と48.77 精度を達成し, 教師付きベースラインと教師なしベースラインを超越した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:27:40 GMT)
EGSTalker: Real-Time Audio-Driven Talking Head Generation with Efficient Gaussian Deformation [37.4] EGSTalkerは3次元ガウス分割に基づくリアルタイム音声駆動音声ヘッド生成フレームワーク(3DGS)
高品質の顔アニメーションを合成するには、ビデオのトレーニングにわずか3~5分しかかからない。
EGSTalkerは、最先端の手法に匹敵するレンダリング品質とリップシンクの精度を実現し、推論速度では大幅に優れています。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:31:20 GMT)
A Trajectory Generator for High-Density Traffic and Diverse Agent-Interaction Scenarios [37.4] 本稿では,シナリオ密度を同時に向上し,行動多様性を向上する新しい軌道生成フレームワークを提案する。
本手法は,動作リアリズムとシナリオレベルの安全性を保ちながら,エージェント密度と行動の多様性を著しく改善する。
我々の合成データは下流軌道予測モデルにも有効であり、高密度シナリオに挑戦する際の性能を向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:12:18 GMT)
SurveyBench: How Well Can LLM(-Agents) Write Academic Surveys? [37.3] 調査書は労働集約的で知的に要求されるタスクである。
一般的なDeepResearchエージェントやサーベイ特殊化手法のような最近のアプローチは、自動的にサーベイを生成することができる。
しかし、そのアウトプットは人間の基準に欠けることが多く、厳格で読者対応のベンチマークが欠けている。
本稿では,詳細なクイズ駆動評価フレームワークであるSurveyBenchを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:49:09 GMT)
To Backtrack or Not to Backtrack: When Sequential Search Limits Model Reasoning [37.2] バックトラックは、長いチェーン・オブ・シント(CoT)生成による逐次線形化探索を可能にすることによって、テスト時間計算を自然にスケールする。
本稿では,これらの2つの手法を,CountDown と Sudoku の2つの難解な推論タスクに対して体系的に比較する。
意外なことに、シーケンシャルな検索はCountDown上で並列サンプリングを過小評価するが、Sudoku上では性能が優れており、バックトラッキングは普遍的に有益ではないことを示唆している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:56:43 GMT)
EvoSpeak: Large Language Models for Interpretable Genetic Programming-Evolved Heuristics [37.0] EvoSpeakは、遺伝的(GP)と大きな言語モデル(LLM)を統合する新しいフレームワークで、効率、透明性、進化の適応性を高める。
EvoSpeakはより効果的なオブジェクトを生成し、進化効率を改善し、ユーザビリティを高める人間可読レポートを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:03:14 GMT)
OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always! [37.0] 大規模言語モデル(LLM)の安全性は,大規模なデプロイメントを実現する上で,最も重要な課題のひとつだ。
ユーザクエリを適切に受け入れたり拒否したりできる LLM の機能として定義された,運用上の安全性を導入します。
我々の評価によると、性能はモデルによって異なるが、それらすべてが非常に運用上安全ではない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:46:22 GMT)
Controlled Generation with Equivariant Variational Flow Matching [36.8] 変動流マッチング(VFM)の枠組みにおける制御された生成目標を導出する。
本研究では,(1)条件付き生成モデルのエンドツーエンドトレーニング,あるいは(2)ベイズ推論問題として,制御生成を実現する方法を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:43:44 GMT)
Evaluation Framework for Highlight Explanations of Context Utilisation in Language Models [36.6] コンテキスト利用(Context utilisation)は、言語モデルが応答を生成するときに提供されるコンテキストから関連する情報を組み込む機能である。
実地ストルース・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・アトリビューションのための最初のゴールド標準HE評価フレームワークを提案する。
私たちは、すべてのコンテキストシナリオで、MechLightが最高のパフォーマンスを発揮することに気付きました。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:15:36 GMT)
GeoComplete: Geometry-Aware Diffusion for Reference-Driven Image Completion [36.0] 本稿では,完備領域における幾何的整合性を実現するために,明示的な3次元構造ガイダンスを取り入れた新しいフレームワークを提案する。
実験の結果、GeoCompleteは最先端の手法よりも17.1 PSNRの改善を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:38:12 GMT)
OML: A Primitive for Reconciling Open Access with Owner Control in AI Model Distribution [35.7] 我々は,AIモデルの新たな分散パラダイムを実現するプリミティブであるOMLを紹介する。
OMLは、暗号的に強制された使用許可を維持しながら、ローカル実行のために自由に配布することができる。
この研究は、暗号、機械学習、そしてメカニズム設計の交差点で新しい研究の方向性を開く。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:44:26 GMT)
Self-Improvement in Multimodal Large Language Models: A Survey [34.4] LLM(Large Language Models)の自己改善は、コストを大幅に増大させることなく、効率的にモデル機能を強化している。
この調査は、マルチモーダル LLM における自己改善に関する総合的な概要を提供する最初のものである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:48:26 GMT)
Agent-ScanKit: Unraveling Memory and Reasoning of Multimodal Agents via Sensitivity Perturbations [34.2] 制御摂動下でのマルチモーダルエージェントの記憶と推論能力を解明するための textbfAgent-ScanKit を提案する。
その結果,機械的記憶が体系的推論より優れていることが示唆された。
本研究は,実環境におけるマルチモーダルエージェントのロバスト推論モデルの必要性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:20:33 GMT)
Reasoning-Enhanced Domain-Adaptive Pretraining of Multimodal Large Language Models for Short Video Content Governance [34.1] 本稿では,不適切なコンテンツ検出を統一するためのMLLM事前学習パラダイムを提案する。
短いビデオコンテンツとMLLMのオリジナル事前学習データとの分配ギャップに対処するために,3つの目標事前学習タスクを導入する。
実験結果から,ゼロショットおよび教師付き微調整環境におけるMLLMの性能は,事前学習により有意に向上することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:37:07 GMT)
PointAD+: Learning Hierarchical Representations for Zero-shot 3D Anomaly Detection [33.9] 私たちはCLIPの堅牢な2D一般化機能を、非常に多様なクラスセマンティクスの未確認オブジェクト間で3D異常を特定するために転送する。
点レベルの情報と画素レベルの情報を活用することにより,3次元異常を包括的に検出し,セグメンテーションする統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:38:51 GMT)
Addressing Representation Collapse in Vector Quantized Models with One Linear Layer [33.5] ベクトル量子化(VQ)は教師なし学習における連続表現の離散化に不可欠である。
VQは表現の崩壊に悩まされ、コードブックの利用率が低下し、スケーラビリティが制限される。
遅延ベースで学習可能な線形変換層を通じてコードベクトルを再パラメータ化する textbfSimpletextbfVQ を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:54:17 GMT)
Fine-Tuning Diffusion Models via Intermediate Distribution Shaping [33.3] 政策勾配法は自己回帰生成の文脈で広く用いられている。
我々は,GRAFTが暗黙的にリフォーム報酬でPPOを行うことを示す。
次に、P-GRAFTを導入し、中間雑音レベルで分布を形作る。
そこで我々は,明示的な報奨を生かさずに,フローモデルを改善する逆ノイズ補正を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:18:47 GMT)
SSA-COMET: Do LLMs Outperform Learned Metrics in Evaluating MT for Under-Resourced African Languages? [32.6] SSA-COMETとSSA-COMET-QEを開発した。
GPT-4o, Claude-3.7, Gemini 2.5 Pro などの最先端 LLM を用いたプロンプトベースアプローチのベンチマークを行った。
実験の結果,SSA-COMETモデルはAfriCOMETよりも優れており,最強のLLM Gemini 2.5 Proと競合することがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:55:57 GMT)
StepChain GraphRAG: Reasoning Over Knowledge Graphs for Multi-Hop Question Answering [32.3] 本稿では,BFS(Breadth-First Search)推論フローと質問分解を結合するフレームワークであるStepChain GraphRAGを紹介する。
提案手法はまず,コーパス上のグローバルインデックスを構築する。推測時には,検索したパスのみをオンザフライで解析して知識グラフを作成する。
MuSiQue、2WikiMultiHopQA、HotpotQAの実験では、StepChain GraphRAGが最先端のExact MatchとF1スコアを達成した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:06:37 GMT)
Can Language Models Handle a Non-Gregorian Calendar? [32.2] 我々は,オープンソース言語モデルが日本語カレンダーをいかにうまく扱えるかを評価する。
カレンダー変換が可能なモデルもあるが,日本語中心のモデルでさえ,日本語のカレンダ算術に苦戦している。
本研究は,文化固有のカレンダー理解に優れたLMを開発することの重要性を強調した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:39:37 GMT)
Towards Scalable and Consistent 3D Editing [32.2] 3D編集は没入型コンテンツ制作、デジタルエンターテイメント、AR/VRに広く応用されている。
2D編集とは異なり、クロスビューの一貫性、構造的忠実さ、きめ細かい制御性を必要とするため、依然として困難である。
我々はこれまでで最大の3D編集ベンチマークである3DEditVerseを紹介した。
モデル側では、3次元構造保存条件変換器である3DEditFormerを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:34:55 GMT)
PGMEL: Policy Gradient-based Generative Adversarial Network for Multimodal Entity Linking [32.1] ポリシー勾配に基づくマルチモーダルエンティティリンク(PGMEL)のための生成逆ネットワークを提案する。
Wiki-MEL、Richpedia-MEL、WikiDiverseのデータセットに基づく実験の結果、PGMELは挑戦的な負のサンプルを選択して意味のある表現を学習することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:09:47 GMT)
Mask2IV: Interaction-Centric Video Generation via Mask Trajectories [32.0] Mask2IVは、インタラクション中心のビデオ生成用に特別に設計された新しいフレームワークである。
分離された2段階のパイプラインを採用し、まずアクターとオブジェクトの両方の可塑性運動軌跡を予測し、これらの軌跡に条件付けされたビデオを生成する。
汎用的で直感的な制御をサポートしており、ユーザは対話対象を指定し、アクション記述や空間位置の手がかりを通じて運動軌跡をガイドすることができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:04:33 GMT)
Improving Cooperation in Collaborative Embodied AI [32.0] 大規模言語モデルのマルチエージェントシステムへの統合は、AIエージェントとの協調推論と協調のための新たな可能性を開いた。
本稿では, エージェントの協調行動と意思決定の促進効果について検討し, その効果を検証した。
我々は音声機能を統合することで研究を拡張し、シームレスな音声ベースの対話を可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:25:48 GMT)
ZeroShotOpt: Towards Zero-Shot Pretrained Models for Efficient Black-Box Optimization [31.9] 提案するZeroShotは,2次元から20次元までの連続的なブラックボックス最適化タスクのための汎用的,事前訓練されたモデルである。
提案手法は,12種類のBOから収集した大規模最適化タスクに対して,オフライン強化学習を利用する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:33:23 GMT)
AdaRD-key: Adaptive Relevance-Diversity Keyframe Sampling for Long-form Video understanding [31.7] AdaRD-Keyは,問合せ駆動型長文ビデオ理解のためのトレーニング不要サンプリングモジュールである。
AdaRD-Keyは、ビデオのアライメントが弱いワイドクエリを処理するために、軽量な関連性認識ゲーティング機構を採用している。
私たちのパイプラインは、トレーニング不要で、計算効率が良い(単一のGPU上でリアルタイムに実行される)ため、既存のビジョン言語モデルと互換性があります。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:19:34 GMT)
PLSEMANTICSBENCH: Large Language Models As Programming Language Interpreters [31.6] 大規模言語モデル(LLMs)がコード推論に長けているため、自然な疑問が生じる: LLMはプログラム(つまり、インタプリタとして振舞う)を純粋にプログラミング言語の形式的意味論に基づいて実行できるか?
本稿では, 命令型言語IMPを用いて, 小ステップ操作意味論 (SOS) と書き直しに基づく操作意味論 (K-semantics) によって定式化されている問題について検討する。
本稿では,Human-Written,LLM-Translated,Fuzzer-Generatedの3つの評価セットを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:23:26 GMT)
Learning Counterfactual Outcomes Under Rank Preservation [31.6] 本稿では, 対実結果の同定と推定のための原則的アプローチを提案する。
我々の理論的解析は、ランク保存仮定が同質性や厳密な単調性仮定よりも強くないことを示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:03:48 GMT)
Enhancing LLM Steering through Sparse Autoencoder-Based Vector Refinement [31.3] 既存のステアリング手法は、行動情報を学習するために大規模なデータセットに依存している。
本稿では,SAAEを利用してステアリングベクトルを意味的に識別・拡張するスパースオートエンコーダ(SAE-RSV)によるステアリングベクトルの精細化について紹介する。
本フレームワークでは、まず、SAEが提供するセマンティクスに基づいてタスク関連機能を取り除き、そのセマンティクスの類似性を通じて、小さなデータセットから欠落したタスク関連機能を強化する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:34:59 GMT)
GramTrans: A Better Code Representation Approach in Code Generation [31.1] 本稿では,表現が解析し易いほど,モデルの性能が向上する,という予想を提案する。
LL(1)クラス内の表現に文脈自由言語を自動的に変換する一般的なアプローチであるGramTransを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:49:33 GMT)
Enhancing Large Language Model Reasoning with Reward Models: An Analytical Survey [30.9] リワードモデル(RM)はLLMの推論性能を高める上で重要な役割を担っている。
本稿では, RM の体系的紹介と LLM 推論におけるそれらの応用に関する包括的調査について述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:55:18 GMT)
A Survey of Deep Learning Architectures for Intelligent Reflecting Surfaces [30.6] インテリジェント反射面(IRS)は6G無線通信において大きな注目を集めている。
ディープラーニング(DL)のようなデータ駆動技術は、これらの課題に対処するために重要である。
本稿では、DLベースのIRSアシスト無線システムを設計するためのこれらの技術の概要について述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:13:10 GMT)
ARMs: Adaptive Red-Teaming Agent against Multimodal Models with Plug-and-Play Attacks [30.4] 視覚言語モデル(VLM)に対する包括的リスク評価を行う適応型レッドチームエージェントARMを提案する。
ターゲットとなる有害な振る舞いやリスク定義を前提として、ARMは推論強化されたマルチステップオーケストレーションを使用して、多様な赤チーム戦略を自動的に最適化する。
ARMが生成するリピートインスタンスの多様性は著しく高く,VLMの新たな脆弱性が明らかになった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:28:02 GMT)
Cross-Modal Reconstruction Pretraining for Ramp Flow Prediction at Highway Interchanges [30.3] STDAEは、クロスモーダルな再構築事前トレーニングを利用する2段階のフレームワークである。
STDAE-GWNETは13の最先端ベースラインを一貫して上回っている。
このことは、検出器の不足を克服する効果と、様々な予測パイプラインに対するプラグアンドプレイの可能性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:26:56 GMT)
Hybrid-Collaborative Augmentation and Contrastive Sample Adaptive-Differential Awareness for Robust Attributed Graph Clustering [29.8] HCA(Hybrid-Collaborative Augmentation)とCSADA(Contrative Adaptive-differential Recognition)を組み合わせた新しいロバスト属性グラフクラスタリング(RAGC)を提案する。
6つのベンチマークデータセットに対する総合的なグラフクラスタリング評価は、いくつかの最先端CAGC手法に対して提案されたRAGCの有効性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:30:55 GMT)
Trajectory Data Suffices for Statistically Efficient Policy Evaluation in Finite-Horizon Offline RL with Linear $q^π$-Realizability and Concentrability [29.5] 政策評価と政策最適化の両方に関数近似を用いた有限水平オフライン強化学習(RL)について検討する。
Tkachuk et al. (2024) が政策最適化に用いた学習者のサンプルの複雑さは、より厳密な分析によって改善できることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:18:35 GMT)
Uncertainty as Feature Gaps: Epistemic Uncertainty Quantification of LLMs in Contextual Question-Answering [29.4] 本稿では,与えられたモデルの予測分布と未知の真の分布との相互エントロピーとして定義されたタスクに依存しないトークンレベルの不確実性尺度を提案する。
我々は不確実性の上限を導出し、与えられたモデルの隠された表現において意味的特徴ギャップとして解釈できることを示す。
この一般的なフレームワークを文脈的QAタスクに適用し、文脈信頼、文脈理解、誠実さの3つの特徴がこのギャップを近似していると仮定する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:09:25 GMT)
Fine-Tuning on Noisy Instructions: Effects on Generalization and Performance [29.3] 命令調整データにおける摂動は、大きな言語モデルのノイズのある命令に対する抵抗を高めることができることを示す。
意外なことに、この結果から、摂動命令による命令調整は、ダウンストリーム性能を改善する可能性があることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:54:33 GMT)
Toward a Holistic Evaluation of Robustness in CLIP Models [29.3] 対照的な言語-画像事前学習(CLIP)モデルは、ゼロショット分類において有意な可能性を示している。
この作業は、いくつかの新しい視点を導入することで、より包括的なCLIPの評価を提供することを目的としている。
それぞれの側面において、モデルアーキテクチャ、トレーニング配布、トレーニングセットサイズ、微調整、コントラスト損失、テストタイムプロンプトの6つの要因がCLIPモデルに与える影響を検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:59:41 GMT)
A Survey of Defenses against AI-generated Visual Media: Detection, Disruption, and Authentication [29.2] 深層生成モデルは様々なコンピュータビジョンアプリケーションで顕著な性能を示した。
これらのモデルは、誤情報、偽造、著作権侵害などの悪意ある目的のために使用されることがある。
本稿では,AI生成したビジュアルメディアに対する防衛研究の体系的かつタイムリーなレビューを行う。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:23:46 GMT)
Optimal Rates for Generalization of Gradient Descent for Deep ReLU Classification [29.1] 我々は、最適化と一般化誤差を慎重に取り除き、深いReLUネットワークを有する勾配降下ネットワークの最適一般化率を確立する。
重要な技術的貢献は、基準モデル近傍でのアクティベーションパターンの新たな制御であり、勾配勾配で訓練された深いReLUネットワークに対して、よりシャープなRademacher複雑性を実現することである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:22:36 GMT)
NCV: A Node-Wise Consistency Verification Approach for Low-Cost Structured Error Localization in LLM Reasoning [29.0] 我々は、ノードレベルでの軽量なバイナリ一貫性チェックとして検証をリキャストするトレーニング不要のフレームワークであるNode-wise Consistency Verification (NCV)を紹介した。
パブリックデータセットでは、NCVはベースラインよりも10%から25%改善されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:48:04 GMT)
Retrv-R1: A Reasoning-Driven MLLM Framework for Universal and Efficient Multimodal Retrieval [29.0] 本稿では,マルチモーダルユニバーサル検索に特化したR1スタイルMLLMであるRetrv-R1を紹介する。
検索タスクにDeepSeek-R1のメソッドを直接適用することは不可能である。
これらの問題に対処するため、Retrv-R1は詳細検査機構を備えた情報圧縮モジュールを導入した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:16:58 GMT)
CHORD: Customizing Hybrid-precision On-device Model for Sequential Recommendation with Device-cloud Collaboration [29.0] underlinetextbfDevice-cloudコラボレーション(textbfCHORD)を用いたシーケンシャルアンダーラインtextbfRecommendationのための underlinetextbfHybrid-precision underlinetextbfOn-device Model のカスタマイズフレームワークを提案する。
CHORDはバックプロパゲーションなしで動的モデル適応と推論を加速し、コストのかかる再訓練サイクルを排除します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:20:45 GMT)
Manipulating 3D Molecules in a Fixed-Dimensional E(3)-Equivariant Latent Space [28.4] 本稿では,3次元分子の共有潜在空間をナビゲートすることで,フレキシブルなゼロショット分子操作法を提案する。
MolFLAEは、E(3)同変ニューラルネットワークを用いて3D分子を固定数の潜伏ノードに符号化する。
MolFLAEは、標準的な無条件の3D分子生成ベンチマーク上での競合性能を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:03:19 GMT)
Taming Text-to-Sounding Video Generation via Advanced Modality Condition and Interaction [28.2] 本研究は,テキスト・トゥ・サウンド・ビデオ(T2SV)生成という課題に焦点をあてる。
テキスト条件から同期された音声でビデオを生成することを目的としており、両方のモダリティがテキストに一致していることを保証する。
1)ビデオ用テキストが音声用テキストと等しい1つの共有テキストキャプションは、しばしばモーダル干渉を引き起こす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:43:56 GMT)
Optimal structure learning and conditional independence testing [27.9] 構造学習問題に対する最小値の最適値は条件付き独立試験における最小値の最大値によって決定されることを示す。
これらの設定における最適アルゴリズムは、PCアルゴリズムの適切な修正であることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:52:15 GMT)
Knowledge-Aware Modeling with Frequency Adaptive Learning for Battery Health Prognostics [27.8] Karmaは、バッテリ容量推定のための周波数適応学習と有用な寿命予測のための知識認識モデルである。
1つのストリームが長期の低周波劣化傾向を捉え、もう1つのモデルが高周波短期力学をモデル化する2重ストリームディープラーニングアーキテクチャを開発した。
実験では、Karmaの優れた性能を示し、バッテリーの健康予測のための最先端のアルゴリズムよりも平均エラーを50.6%、32.6%削減した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:24:38 GMT)
JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models [27.7] 本稿では,JALMBenchを提案する。JALMBenchは,聴覚言語モデル(ALM)のジェイルブレイク攻撃に対する安全性を評価するベンチマークである。
JALMBenchには、11,316のテキストサンプルと、1,000時間以上の245,355のオーディオサンプルを含むデータセットが含まれている。
JALMBenchを用いて、攻撃効率、話題感度、音声の多様性、アーキテクチャを詳細に分析する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:14:47 GMT)
RAPID: An Efficient Reinforcement Learning Algorithm for Small Language Models [27.6] 強化学習 (Reinforcement Learning, RL) は, 数学やコーディングといった目的とする課題を解決するために, 小型言語モデル (SLM) を微調整するための有望な戦略として登場した。
RLアルゴリズムはリソース集約的であり、トレーニングにかなりの時間がかかる傾向にある。
本稿では,RLのランニング時間を大幅に削減できる新しいRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:58:49 GMT)
TokenFlow: Responsive LLM Text Streaming Serving under Request Burst via Preemptive Scheduling [27.6] TokenFlowは、プリエンプティブな要求スケジューリングとアクティブなキーバリューキャッシュ管理を通じて、テキストストリーミング性能を向上した、新しいテキストストリーミングシステムである。
TokenFlowは、トークン全体のスループットを低下させることなく、P99 TTFTを最大80.2%削減しながら、82.5%の効率的なスループット(実際のユーザ消費を計る)を達成することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:43:24 GMT)
HyperAdaLoRA: Accelerating LoRA Rank Allocation During Training via Hypernetworks without Sacrificing Performance [27.4] Low-Rank Adaptation (LoRA)は、大規模言語モデルを微調整するための有望なアプローチとして登場した。
本稿では,ハイパーネットワークを活用してAdaLoRAの収束を促進する新しいフレームワークであるHyperAdaLoRAを提案する。
本手法は性能を犠牲にすることなく高速な収束を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:15:59 GMT)
The Argument is the Explanation: Structured Argumentation for Trust in Agents [27.3] 人間はブラックボックスであり、彼らの神経過程を観察することはできないが、検証可能な議論を評価することで社会機能を評価する。
構造化された議論を用いて、説明と検証のレベルを提供する。
我々のパイプラインは、AAECが発行した列車/テストスプリット上で、最先端の94.44マクロF1を達成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:04:15 GMT)
EFC++: Elastic Feature Consolidation with Prototype Re-balancing for Cold Start Exemplar-free Incremental Learning [27.1] 本稿では,従来の課題に強く関連する方向のドリフトを規則化し,特徴表現を統一する効果的な手法を提案する。
EFC++は、モデルの可塑性を保ちながら新しいタスクを学習し、最先端を著しく上回る。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:52:35 GMT)
A Unified Deep Reinforcement Learning Approach for Close Enough Traveling Salesman Problem [26.9] 離散化方式を用いてCETSPのマルコフ決定過程(MDP)を定式化する。
本稿では,決定をノード選択と経路決定に分離する新しい統合二重デコーダDRL(UD3RL)フレームワークを提案する。
実験の結果,UD3RLはソリューションの品質と実行時間の両方において従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:49:05 GMT)
From Tokens to Nodes: Semantic-Guided Motion Control for Dynamic 3D Gaussian Splatting [26.6] 制御密度と動きの複雑さを一致させる動き適応フレームワークを提案する。
既存の最先端手法に比べて,復元品質と効率が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:33:58 GMT)
Pack and Force Your Memory: Long-form and Consistent Video Generation [26.5] ロングフォームビデオ生成は2つの課題を提示します。
モデルは、自動回帰復号に固有のエラーの蓄積を防止しながら、長距離依存関係をキャプチャしなければなりません。
MemoryPackとDirect Forcingは、長期ビデオ生成のコンテキスト一貫性と信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:01:28 GMT)
Improving Online-to-Nonconvex Conversion for Smooth Optimization via Double Optimism [25.6] 最近の非最適化のブレークスルーは、オンラインから非最適化フレームワークcitecutkosky2023である。
オンラインの楽観的勾配法は,新しい楽観的ヒント関数をベースとして提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:41:24 GMT)
THOR: Tool-Integrated Hierarchical Optimization via RL for Mathematical Reasoning [25.6] 大規模言語モデル (LLM) は数学的推論において顕著な進歩を遂げた。
最近の進歩にもかかわらず、既存の手法は3つの重要な課題に直面している。
我々はこれらの制限を克服するためにTHOR(Tool-Integrated Hierarchical Optimization via RL)を提案する。
提案手法は多種多様なモデルに対して強い一般化を示し,推論モデルと非推論モデルの両方で効果的に機能する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:48:44 GMT)
Towards Policy-Compliant Agents: Learning Efficient Guardrails For Policy Violation Detection [25.5] PolicyGuardBenchは、エージェントのトラジェクトリにおけるポリシー違反を検出するための約60kのサンプルのベンチマークである。
PolicyGuard-4Bは軽量のガードレールモデルであり、すべてのタスクに対して強力な検出精度を提供する。
PolicyGuardBench と PolicyGuard-4B は、Webエージェントのトラジェクトリにおけるポリシーコンプライアンスを研究するための、最初の包括的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:03:19 GMT)
Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation [25.4] Causal-Adapterは、凍結したテキストから画像への拡散バックボーンを、反ファクト画像生成に適応させるモジュラーフレームワークである。
本手法は目的属性に対する因果的介入を可能にし,画像のコアアイデンティティを変更することなく因果的依存者に対する影響を一貫して伝播させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:34:07 GMT)
Did Translation Models Get More Robust Without Anyone Even Noticing? [25.3] マルチリンガルMTモデルと大規模言語モデル(LLM)は,従来のモデルよりも多くの種類のノイズに対してはるかに堅牢であることを示す。
ソーシャルメディアの翻訳実験には同様の傾向があり、LLMはソーシャルメディアのテキストに対してより堅牢である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:29:09 GMT)
Platonic Transformers: A Solid Choice For Equivariance [25.3] このトレードオフを解決するために、Platonic Transformerを導入します。
プラトンソリッド対称性群から参照フレームに対する注意を定義することにより、本手法は原則的重み共有スキームを導出する。
この注意は、動的群畳み込みと正式に等価であることを示し、モデルが適応的幾何フィルタを学習していることを明らかにする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:51:25 GMT)
Enhancing Monocular Height Estimation via Sparse LiDAR-Guided Correction [25.3] 合成データに基づいて学習した最先端のMHEモデルについて検討する。
このモデルは,過大評価や過小評価につながる要因である影の手がかりに大きく依存していることが判明した。
本稿では,不完全な大域的LiDAR測定と疎結合な補正パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:22:34 GMT)
GUI-PRA: Process Reward Agent for GUI Tasks [25.2] プロセスリワードモデル(Process Reward Models, PRM)は、推論中に重要なプロセス信号でこれらのエージェントをガイドできる、有望なソリューションである。
PRMは「中間の失われた」現象に悩まされ、歴史的に圧倒的な状況が現在の段階の評価を損なう。
GUI-PRA(Process Reward Agent for GUI Tasks)は,標準的なPRMよりも優れたプロセス報酬の提供を目的とした判定エージェントである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:24:35 GMT)
A Simple but Effective Elaborative Query Reformulation Approach for Natural Language Recommendation [24.9] 自然言語(NL)推奨システムは,自由形式のユーザクエリや項目記述から関連する項目を検索することを目的としている。
既存のシステムは、広範または間接的なユーザ意図を表す難しいクエリを解釈するのに苦労する、高密度検索(DR)に依存していることが多い。
EQR(Elaborative Subtopic Query Reformulation)は,広さと深さを組み合わせた大規模言語モデルに基づくQR手法である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:21:55 GMT)
Work Zones challenge VLM Trajectory Planning: Toward Mitigation and Robust Autonomous Driving [24.4] 本稿では、ビジュアル言語モデルと検索拡張生成を統合した軌跡計画フレームワークREACT-Driveを提案する。
Qwen2.5-VL を用いて評価した結果,REACT-Drive は VLM ベースラインに対する平均変位誤差を約3倍に削減できることがわかった。
また,実車を用いた実走行実験を実世界で15の作業ゾーンシナリオで実施し,REACT-Driveの強力な実用性を実証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:21:15 GMT)
From TOWER to SPIRE: Adding the Speech Modality to a Text-Only LLM [24.3] 音声入力を英語から10言語に翻訳・翻訳できる音声拡張言語モデル(LM)であるSpireを紹介する。
Spireは、音声の離散化を通じて既存の多言語LMに統合し、わずか42.5K時間で事前学習を継続する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:59:04 GMT)
Revisiting Reweighted Risk for Calibration: AURC, Focal, and Inverse Focal Loss [24.1] 深層学習で一般的に用いられる重み付きリスク関数のクラスを再検討し,キャリブレーション誤差と選択分類の原則的関連性を確立する。
キャリブレーション誤差の最小化は選択的分類パラダイムと密接に関連していることを示し、低信頼領域における選択的リスクの最適化が自然にキャリブレーションの改善につながることを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:41:59 GMT)
Simulation to Rules: A Dual-VLM Framework for Formal Visual Planning [24.1] 視覚モデル(VLM)は視覚計画に強い可能性を示すが、正確な空間的および長期的推論に苦慮する。
最近の研究は、VLMが視覚的な計画問題をPDDLファイルに変換することで、これらの利点を組み合わさっている。
本稿では,PDDL問題とドメインファイルの両方を自律的に生成し,視覚的計画を行うためのデュアルVLM誘導フレームワークであるVLを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:57:01 GMT)
The land use-climate change-biodiversity nexus in European islands stakeholders [24.1] 21のヨーロッパ諸島の利害関係者は、生態系のサービスに影響を及ぼす気候や土地利用の変化について相談された。
気候変動の認識には、気温、降水量、湿度、極度、風があった。
土地利用の変化に対する認識としては、森林伐採、海岸の劣化、生息地保護、再生可能エネルギー施設、湿地などがあった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:09:35 GMT)
Programming with Pixels: Can Computer-Use Agents do Software Engineering? [24.0] $textttProgramming with Pixels$ (PwP)は、ソフトウェアエンジニアリングのための初めての総合的なコンピュータ利用環境である。
PwPは、一般のコンピュータ利用エージェントがスペシャリストレベルのパフォーマンスに達するかどうかをベンチマークするための自然なドメインとしてソフトウェア工学を確立している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:09:59 GMT)
L1: Controlling How Long A Reasoning Model Thinks With Reinforcement Learning [24.0] 推論言語モデルは、より長いチェーン・オブ・シークエンスを生成することによって、より長い'、つまり、より長い'、という考え方によって、テスト時のパフォーマンスを改善する能力を示している。
LCPO(Longth Controlled Policy Optimization)は、推論長の正確な制御を可能にし、テスト時間計算と精度の詳細な割り当てを可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:55:58 GMT)
Robust MRI Reconstruction by Smoothed Unrolling (SMUG) [24.0] SMUG(Smoothed Unrolling)と呼ばれる新しい画像再構成フレームワークを提案する。
SMUGは、ランダムスムーシング(RS)に基づく頑健な学習アプローチを用いて、ディープアンローリングに基づくMRI再構成モデルを前進させる。
我々は,SMUGがMRI再建の堅牢性を向上させることを示し,様々な不安定源のセットについて述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:00:30 GMT)
Structural Reward Model: Enhancing Interpretability, Efficiency, and Scalability in Reward Modeling [23.9] Structure Reward Model (SRM) はサイドブランチと補助機能ジェネレータを統合したモジュラーフレームワークである。
粒度の細かい寸法を導入することで、RMは解釈可能で効率的な評価、ターゲット診断、最適化を可能にします。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:52:01 GMT)
Triadic Multi-party Voice Activity Projection for Turn-taking in Spoken Dialogue Systems [23.8] 本研究は, 音声活動予測(VAP)を適用して, 三進的多人数シナリオにおける今後のターンテイクを予測することに焦点を当てる。
参加者がさまざまな話題を議論する日本三進的データセットを用いて複数のモデルを訓練した。
その結果,三進的会話を訓練したVAPは,すべてのモデルにおいてベースラインを上回り,会話の種類が精度に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:38:29 GMT)
Is it Bigger than a Breadbox: Efficient Cardinality Estimation for Real World Workloads [23.8] DBエンジンはコストモデルに依存して効率的なクエリ実行計画を生成する。
提案手法は,ベンチマークの平均性能を改善するために,マジックナンバーを調整した実装を用いて,クエリの濃度を推定する実用的な手法である。
提案手法はオーバーヘッドを無視し,SoTA学習に基づくエラーメトリクスのアプローチと競合する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:43:02 GMT)
Micro-Act: Mitigating Knowledge Conflict in LLM-based RAG via Actionable Self-Reasoning [23.7] Micro-Actは階層的なアクション空間を持つフレームワークで、コンテキストの複雑さを自動的に認識し、各知識ソースを微妙な比較のシーケンスに適応的に分解する。
5つのデータセットと3つの競合タイプにまたがって、最先端のベースラインに対するQAの精度を継続的に向上させる。
Micro-Actは競合しない質問に対して同時に堅牢なパフォーマンスを示し、現実のRAGアプリケーションにおける実用的価値を強調している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:47:40 GMT)
EditLens: Quantifying the Extent of AI Editing in Text [23.5] AIで編集されたテキストは、人間が書いたテキストやAIで生成したテキストと区別可能であることを示す。
テキスト内に存在するAI編集量を予測する回帰モデルをトレーニングする。
AIによって編集されたテキストが検出できるだけでなく、AIによる人間の文章への変化の度合いも検出できることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:27:48 GMT)
Online Learning in the Random Order Model [23.4] ランダム順序入力は非定常性を示すことができ、学習アルゴリズムの性能を損なう可能性がある。
本稿では,学習アルゴリズムをランダム順序モデルに適応させるテンプレートを提案する。
また、オンライン分類を調査し、ランダムな順序で学習性はリトルストーン次元ではなくVC次元によって特徴づけられることを証明した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:53:35 GMT)
Learning to Decide with Just Enough: Information-Theoretic Context Summarization for CMDPs [23.1] コンテキストマルコフ決定プロセス(CMDP)は、外部信号の下でのシーケンシャルな意思決定のためのフレームワークを提供する。
本稿では,大言語モデル(LLM)を用いて文脈入力を低次元,意味的に豊かな要約に圧縮する情報理論の要約手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:17:40 GMT)
BottleHumor: Self-Informed Humor Explanation using the Information Bottleneck Principle [23.1] 本稿では,視覚と言語モデルから関連する世界知識を抽出する情報ボトルネック原理に着想を得た手法を提案する。
3つのデータセットに対する実験により,本手法の有効性が確認された。
本手法は将来,関連する世界知識の抽出と条件付けの恩恵を受けることができる追加のタスクに適応することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:16:14 GMT)
Lightweight Transformer for EEG Classification via Balanced Signed Graph Algorithm Unrolling [22.9] EEG信号は、有限グラフ内の負のエッジによってうまくモデル化される固有の反相関を持つ。
我々は、バランスの取れた符号グラフ上の信号に対するスペクトル復調アルゴリズムをアンロールすることで、軽量で解釈可能なトランスフォーマーのようなニューラルネットを構築する。
実験により,本手法は,代表的なディープラーニング手法に匹敵する分類性能が得られた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:08:42 GMT)
Agile Tradespace Exploration for Space Rendezvous Mission Design via Transformers [22.9] 宇宙船のランデブーは軌道上でのサービスとデブリの除去を可能にし、スケーラブルな宇宙経済の基礎を形成している。
本稿では,幅広い飛行時間のミッションを設計するための枠組みを提案する。
このフレームワークは、より少ないイテレーションでソリューションに一般化する高品質な初期推定を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:28:46 GMT)
Flow-SLM: Joint Learning of Linguistic and Acoustic Information for Spoken Language Modeling [22.9] テキストレス音声言語モデル(英語: Textless Speech Language Model、SLM)は、テキストの監督に依存しない音声の生成モデルである。
本稿では,意味トークンと音響フレームの連続実数値表現を生成することで,言語情報と音響情報を共同でモデル化することを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:22:23 GMT)
A Quantum Computer Based on Donor-Cluster Arrays in Silicon [22.8] ホスホラス(P)をドープしたスピン量子ビットはコヒーレンスに優れ、99.9%を超える高忠実な2量子ビットゲートを証明している。
核スピン量子ビットに対するスケーラブルなクラスタアレイアーキテクチャとそれに対応する制御プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:32:30 GMT)
Beyond the Final Answer: Evaluating the Reasoning Trajectories of Tool-Augmented Agents [22.8] エージェントのパフォーマンスを適切に評価するには、最終回答を超え、問題解決の軌跡も評価する必要がある。
ツール拡張LDMエージェント性能の多次元評価のためのフレームワークであるTRACEを紹介する。
TRACEはこれらの複雑な挙動を,スケーラブルで費用対効果の高い方法で正確に評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:19:15 GMT)
Photography Perspective Composition: Towards Aesthetic Perspective Recommendation [22.8] 伝統的な写真合成アプローチは2次元の収穫法によって支配されている。
プロの写真家は、しばしば3D再構成の形で視点調整を用いる。
従来の収穫法を超越した写真視点合成(PPC)を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:23:06 GMT)
Know Thyself? On the Incapability and Implications of AI Self-Recognition [22.6] 自己認識は、心理的分析だけでなく、安全性にも関係する、AIシステムにとって重要なメタ認知能力である。
適用や更新が容易なシステム評価フレームワークを導入する。
10の現代的大規模言語モデル(LLM)が、他のモデルからのテキストに対して、それぞれの生成したテキストをどの程度正確に識別できるかを測定する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:01 GMT)
Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test [22.5] LLMがトレーニングデータを記憶する時、下流タスクの一般化が改善し始める時、そして両者の間にラグがある場合、どうなるかを検討する。
我々の研究は、初めて、グラッキングが試験前混合物質(MoE)にまだ現れることを示した。
我々の第一の発見は、経路がランダムで非平滑な層をまたいで進化し、例えば、事前学習の損失が収束しているにもかかわらず、より構造化され、サンプル間で移動可能であることである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:00:58 GMT)
Low-probability Tokens Sustain Exploration in Reinforcement Learning with Verifiable Reward [22.4] Reinforcement Learning with Verifiable Rewards (RLVR)は、複雑な推論において大規模言語モデルを推進している。
従来の方法では、高政策のエントロピーを維持することでこの問題に対処するが、有意義な探索を支配する正確なメカニズムは未解明のままである。
本稿では,RLVR内の探索力学を考察し,重要な課題である,価値の高い低確率探索トークンの段階的除去について述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:56:13 GMT)
RephQA: Evaluating Readability of Large Language Models in Public Health Question Answering [22.2] LLM(Large Language Models)は、複雑な医療問題に対処することを約束する。
効果的な医療薬の開発における重要なボトルネックは、LCM生成応答の可読性にある。
公衆衛生質問応答(QA)におけるLCMの可読性を評価するためのベンチマークであるRephQAを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:51:44 GMT)
Model Parallelism With Subnetwork Data Parallelism [21.9] 大規模な大規模ニューラルネットワークの事前トレーニングは、アクセラレータに大量のメモリ要求を課し、しばしば高価な通信を必要とする。
本稿では,分散トレーニングフレームワークであるSubnetwork Data Parallelism(SDP)を紹介する。
本研究では,不偏勾配を維持するために下位段階のみに空間性を適用した後方マスキングと,前方パスのパラメータを除去してより高効率なゲインを実現する前方マスキングの2つの相補的なマスキング方式について検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:18:28 GMT)
Scalable Ground Station Selection for Large LEO Constellations [21.7] 本稿では,グローバル選択問題を単一衛星,短時間のサブプロブレムに分解する,スケーラブルで階層的なフレームワークを提案する。
本研究では, 合成ウォーカースター試験(衛星1-10個, 衛星1-10個)における提案手法の性能評価を行い, 全試験ケースのグローバルIP最適化の95%以内の解が得られることを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:58:15 GMT)
Learning to Parallel: Accelerating Diffusion Large Language Models via Learnable Parallel Decoding [21.6] 大規模言語モデル(LLM)における自己回帰復号には、$n$トークンに対して$mathcalO(n)$シーケンシャルステップが必要である。
本稿では,並列デコード学習(Learn2PD)を提案する。これは軽量かつ適応的なフィルタモデルをトレーニングし,各トークン位置に対して,現在の予測が最終出力と一致するかどうかを予測するフレームワークである。
この学習されたフィルタは、正しく予測された場合にのみトークンをアンマスクするオラクル並列復号法を近似する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:40:49 GMT)
Efficient Surgical Robotic Instrument Pose Reconstruction in Real World Conditions Using Unified Feature Detection [21.5] MISロボットは、長いキネマティックチェーンを持ち、カメラ内の自由度を部分的に可視化する。
本稿では,共有符号化による幾何学的プリミティブの検出を統一する新しいフレームワークを提案する。
このアーキテクチャは、1つの推論でキーポイントとエッジの両方を検出し、射影ラベル付き大規模合成データに基づいて訓練される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:03:28 GMT)
TriMediQ: A Triplet-Structured Approach for Interactive Medical Question Answering [21.4] TriMediQは三重構造的アプローチで、患者反応を三重項に要約し、それらを知識グラフ(KG)に統合する。
2つのインタラクティブQAベンチマークでTriMediQを評価し、iMedQAデータセットの5つのベースラインに対して最大10.4%の精度向上を実現していることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:11:17 GMT)
PrivacyMotiv: Speculative Persona Journeys for Empathic and Motivating Privacy Reviews in UX Design [21.4] プライバシMotivは、プライバシのリスクに弱い個人を中心としたUXユーザジャーニーを備えた投機的なペルソナを生成する。
専門的なUX実践者を対象にした研究では,共感,本質的な動機づけ,有用性に対する認識の大幅な改善が示された。
この研究は、プライバシーを意識したUXのモチベーション障壁に対処する、有望なプライバシレビューアプローチに寄与する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:14:22 GMT)
On the Effectiveness and Generalization of Race Representations for Debiasing High-Stakes Decisions [21.3] Gemma 2B と LLama 3.2 3B は強いバイアスを示す。
ジェマは黒人よりも白人が26%多く、ラマは白人よりもアジア人が60%多い。
分散アライメントサーチを用いて、モデルのアクティベーション内で「レース部分空間」を識別し、それらをデバイアスモデル決定に介入することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:19 GMT)
To Distill or Decide? Understanding the Algorithmic Trade-off in Partially Observable Reinforcement Learning [21.2] 部分的可観測性は強化学習(RL)における悪名高い課題である
近年の実証的な成功は、最適な潜伏政策であるマルコフ政策を学習し模倣するために特権付き専門家蒸留を用いている。
専門的な蒸留は、潜伏状態情報を持たないRLよりも計算効率が高いが、十分に文書化された故障モードもある。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:45:47 GMT)
Dependency-aware Maximum Likelihood Estimation for Active Learning [21.2] Active Learningは、アノテータからラベルをクエリするためのサンプルを戦略的に選択することで、ラベル付きトレーニングセットを効率的に構築することを目的としている。
このシーケンシャルなプロセスでは、各サンプル取得がその後の選択に影響を与え、ラベル付き集合のサンプル間の依存関係を引き起こす。
そこで本研究では,本手法を応用したMLE (Dependency-aware MLE) を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:34:41 GMT)
UniShield: An Adaptive Multi-Agent Framework for Unified Forgery Image Detection and Localization [21.0] UniShieldは、さまざまな領域にまたがる画像偽造を検知し、ローカライズできる、新しい統一システムである。
我々はUniShieldが、既存の統一アプローチとドメイン固有検出器の両方を超越して、最先端の結果を達成することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:33:05 GMT)
Towards Provable Emergence of In-Context Reinforcement Learning [20.5] いくつかの強化学習(RL)エージェントは、タスク分布の事前学習後にパラメータを更新することなく、広範囲に分散したタスクを解くことができる。
パラメータ更新を行う代わりに、新しいタスクで評価されると、事前訓練されたエージェントは、コンテキストと呼ばれる追加の入力に対してポリシーを条件付ける。
この現象は一般に in-context RL (ICRL) と呼ばれる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:29:10 GMT)
Post Reinforcement Learning Inference [20.5] 強化学習アルゴリズムによって収集されたデータを用いて推定と推定を行う。
この分散を安定化させるために適応重みを用いる重み付き一般化モーメント法(GMM)を提案する。
主な用途は、動的処理効果の推定と動的オフポリシー評価である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:00:52 GMT)
MapIQ: Evaluating Multimodal Large Language Models for Map Question Answering [20.4] 本稿では,3種類のマップに対して14,706の質問応答ペアからなるベンチマークデータセットであるMapIQを紹介する。
本研究では、6つの視覚的分析タスクを用いて複数のMLLMを評価し、それらの性能と人間のベースラインを比較した。
地図設計の変更の影響を調べる実験は、MLLMの堅牢性と感度に関する洞察を与える。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:52:18 GMT)
System Prompt Poisoning: Persistent Attacks on Large Language Models Beyond User Injection [20.4] 大きな言語モデル(LLM)は、その印象的な生成能力のために、様々なアプリケーションで広く採用されている。
既存の研究は主にユーザープロンプトによる脅威に焦点を当てているが、システムプロンプトのセキュリティはほとんど見過ごされている。
LLMに対する新たな攻撃ベクトルであるシステムプロンプト中毒を導入し、従来のユーザプロンプトインジェクションとは異なり、毒素システムプロンプトはその後のすべてのユーザインタラクションやモデル応答に永続的に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:55:21 GMT)
Topic Modeling as Long-Form Generation: Can Long-Context LLMs revolutionize NTM via Zero-Shot Prompting? [20.3] 伝統的なトピックモデルは、潜在トピックの分布を学ぶために推論と生成ネットワークに依存している。
本稿では,大規模言語モデルの時代におけるトピックモデリングの新しいパラダイムを探求し,長文生成タスクとしてTMをフレーミングする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:48:32 GMT)
SoK: Kicking CAN Down the Road. Systematizing CAN Security Knowledge [20.1] コントローラエリアネットワーク (CAN) は、車内バス (IVB) として機能し、多くの非車両システムにその使用を拡大してきた。
その富にもかかわらず、文学は構造的な体系化を欠き、攻撃の重大さ、防御効果、セキュリティギャップの特定、または根本原因の特定のための努力を複雑にしている。
本稿では,既存のCANセキュリティ知識を体系化し,攻撃者,攻撃者,防衛者の包括的分類と評価モデルを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:52:28 GMT)
Model-Based Ranking of Source Languages for Zero-Shot Cross-Lingual Transfer [20.0] NN-Rankは、言語間移動のためのソース言語ランキングのアルゴリズムである。
51のソース言語と56と72のターゲット言語をPOSとNERで評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:39:44 GMT)
A Study of Neural Polar Decoders for Communication [19.9] エンドツーエンド通信システムにおけるニューラルポーラデコーダ(NPD)の適用と解析を行う。
NPDはBER、BLER、スループットで5G極復号器を一貫して上回っている。
シングルキャリアシステムに適用されたNPDは、低いPAPRを持つOFDMに匹敵する性能を提供し、5Gチャネル上で効果的なシングルキャリア伝送を可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:55:18 GMT)
MonSTeR: a Unified Model for Motion, Scene, Text Retrieval [19.9] 本稿では,最初のMOtioN-Scene-TExt RetrievalモデルであるMonSTeRを紹介する。
高階関係のモデリングにインスパイアされたMonSTeRは、単項表現とクロスモーダル表現を活用することにより、統一潜在空間を構築する。
以上の結果から, MonSTeR は単項表現のみに依存する三次モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:37:50 GMT)
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data [19.8] 我々は,大規模な制御可能なマルチモーダルフィードバック合成データセットを構築し,制御可能なフィードバック合成システムを提案する。
このシステムは、テキスト入力と視覚入力のためのエンコーダ、デコーダ、および制御性ブロックを備えている。
CMFeedデータセットには、画像、テキスト、投稿に対する反応、関連スコアによる人間のコメント、これらのコメントに対する反応が含まれている。
これらの反応はモデルに特定の感情でフィードバックを生成するよう訓練し、感情分類の精度は77.23%であり、制御不能な精度より18.82%高い。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:50:43 GMT)
RSFuzz: A Robustness-Guided Swarm Fuzzing Framework Based on Behavioral Constraints [19.7] RSFuzzは、マルチロボットシステムの論理的脆弱性を検出するために設計された堅牢性誘導型Swarmファジィフレームワークである。
単一攻撃者ファジング(SAファジング)と多重攻撃者ファジング(MAファジング)の2つのスウォームファジングスキームを構築した。
その結果、RSFuzzは、平均的な17.75%の効率改善と38.4%の効率向上により、最先端技術よりも優れていた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:14:56 GMT)
Modern Methods in Associative Memory [19.7] 連想記憶(Associative Memories)は、完全なリカレントニューラルネットワークを記述するためのエレガントなモデルである。
このチュートリアルはAssociative Memoriesの親しみやすい紹介を提供し、この研究領域で使われている現代言語と手法を強調している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:17:59 GMT)
LHGEL: Large Heterogeneous Graph Ensemble Learning using Batch View Aggregation [19.6] 大きなヘテロジニアスグラフからの学習は、ネットワークの規模、ノードタイプとエッジタイプにおける異質性、結節的特徴の変化による重要な課題を示す。
本論文は,異なるサンプリング条件下で複数のグラフ学習者を訓練することにより,グラフの不均一性の異なる側面を本質的に捉えることを目的として,アンサンブル学習を本問題の自然解として提唱する。
LHGELは、バッチビューアグリゲーション(バッチビューアグリゲーション)、残留注意、多様性規則化(多様性規則化)という3つの重要なコンポーネントをバッチサンプリングすることで、これらの課題に対処するアンサンブルフレームワークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:49:51 GMT)
MM-Nav: Multi-View VLA Model for Robust Visual Navigation via Multi-Expert Learning [19.3] 本稿では,視覚・言語・行動モデルの知性を活用して,合成専門家データから多様なナビゲーション能力を学習することを提案する。
大規模ナビゲーションデータには,3つの強化学習(RL)の専門家から,特権深度情報を訓練した専門家データを収集する。
トレーニング比率が動的に均衡しているRL専門家からオンラインで収集したデータを使って、VLAモデルを反復的にトレーニングします。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:15:09 GMT)
Long-Term Mapping of the Douro River Plume with Multi-Agent Reinforcement Learning [19.1] 本研究では,複数の自律型水中車両(AUV)を用いた河川プルームの長期(複数日)マッピングの問題に焦点をあてる。
本稿では,中央コーディネータが断続的にAUVと通信する,エネルギー・通信・効率的なマルチエージェント強化学習手法を提案する。
Delft3D モデルを用いたシミュレーションにより,本手法はシングルエージェントとマルチエージェントのベンチマークで一貫した性能を示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:08:08 GMT)
Does Physics Knowledge Emerge in Frontier Models? [19.0] VLM(Leading Vision-Language Models)は、視覚知覚と一般的な推論において強力な結果を示す。
しかし、物理力学を理解し予測する能力は、まだ不明である。
3つの物理シミュレーションデータセット上で6つのフロンティアVLMをベンチマークする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:30:06 GMT)
Latent Diffusion Unlearning: Protecting Against Unauthorized Personalization Through Trajectory Shifted Perturbations [18.0] 本稿では,拡散モデルの潜在空間内で機能するモデルベース摂動戦略を提案する。
本手法は,拡散モデルにおいて,デノナイジング軌道の開始点を変更しながら,デノナイジングとインバージョンを交互に行う。
我々は4つのベンチマークデータセットにアプローチを検証し、最先端の逆攻撃に対する堅牢性を実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:18:45 GMT)
Subject-Adaptive Sparse Linear Models for Interpretable Personalized Health Prediction from Multimodal Lifelog Data [18.0] SASLは、パーソナライズされた健康予測のために明示的に設計された解釈可能なモデリングアプローチである。
本研究では, 平均F1スコアを最大化するために, 平均F1スコアを最大化するためにレグレッション-then-thresholdingアプローチを開発する。
本質的に困難な予測のために、SASLは信頼性ベースのゲーティングを通じて、コンパクトなLightGBMモデルの出力を選択的に組み込む。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:17:57 GMT)
Implicit Values Embedded in How Humans and LLMs Complete Subjective Everyday Tasks [17.9] 大規模言語モデル(LLM)は、ユーザーが日々のタスクをこなすのに役立つAIアシスタントを基盤にすることができる。
AIアシスタントの約束にもかかわらず、これらのアシスタントが示す暗黙の価値観についてはほとんど知られていない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:52:23 GMT)
TS-Reasoner: Aligning Time Series Foundation Models with LLM Reasoning [17.7] 時系列推論は、金融、エネルギー利用、交通、天候、科学的発見など、さまざまな領域における意思決定に不可欠である。
LLMは時系列データの数値的理解に苦慮することが多い。
そこで我々は,アライメント事前学習後に微調整を施したトレーニングレシピを開発した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:20:54 GMT)
WaveNet-SF: A Hybrid Network for Retinal Disease Detection Based on Wavelet Transform in Spatial-Frequency Domain [17.5] 本稿では,空間領域と周波数領域の学習を統合することで網膜疾患の検出を向上させる新しいフレームワークWaveNet-SFを提案する。
このフレームワークはウェーブレット変換を利用して、OCT画像を低周波成分と高周波成分に分解する。
提案手法は,OCT-C8データセットとOCT 2017データセットでそれぞれ97.82%,99.58%の最先端(SOTA)分類精度を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:01:56 GMT)
A Survey of Deep Learning for Complex Speech Spectrograms [17.3] 近年のディープラーニングの進歩は音声信号処理の分野に大きな影響を与えている。
このサーベイは、複雑なスペクトログラムを処理するためにディープニューラルネットワークを活用する最先端技術の概要を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:14:44 GMT)
Calibrated Uncertainty Sampling for Active Learning [16.9] プールベースのアクティブラーニング(AL)において最もポピュラーな獲得関数(AF)の1つは、モデルの不確実性によるクエリである。
ディープニューラルネットワーク(DNN)は、DNNのモデルの不確実性は通常、未調整であるため、さらに悪化させる。
キャリブレーション誤差とクエリサンプルを高いキャリブレーション誤差で推定し,新しいAFを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:33:11 GMT)
From Long Videos to Engaging Clips: A Human-Inspired Video Editing Framework with Multimodal Narrative Understanding [16.8] ヒューマンインスパイアされた自動ビデオ編集フレームワーク(HIVE)を提案する。
提案手法は,多モーダル大言語モデルによる文字抽出,対話解析,物語要約を取り入れたものである。
我々のフレームワークは、一般的な編集タスクと広告指向編集タスクの両方において、既存のベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:25:22 GMT)
XTRA: Cross-Lingual Topic Modeling with Topic and Representation Alignments [16.8] 言語間のトピックモデリングは、言語間の共有セマンティックテーマを明らかにすることを目的としている。
単語のバグ・オブ・ワード・モデリングと多言語埋め込みを統合化するフレームワークであるXTRAを提案する。
XTRAは、言語間で解釈可能な(一貫性があり多様な)トピックを学びます。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:46:23 GMT)
jina-reranker-v3: Last but Not Late Interaction for Listwise Document Reranking [16.7] jina-reranker-v3は0.6Bパラメータの多言語リストワイド・リランカである。
モデルは61.94 nDCG@10で最先端のBEIR性能を達成するが、同等の性能を持つ他のモデルよりも大幅に小さい。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:42:13 GMT)
Gradient Descent with Large Step Sizes: Chaos and Fractal Convergence Region [16.7] パラメータ空間は大きなステップサイズで行列分解におけるフラクタル構造を発達させることを示す。
以上の結果から, 近臨界ステップサイズは, 長期変動が予測不可能な, 勾配降下のカオス的な状態を引き起こすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:33:57 GMT)
Complexity transitions in chaotic quantum systems: Nonstabilizerness, entanglement, and fractal dimension in SYK and random matrix models [16.6] いくつかのパラダイムモデルにおいてカオスから可積分相への遷移を研究する。
我々は, フラクタル次元, フォン・ノイマンエンタングルメントエントロピー, 安定化器 R'enyiエントロピーの3つの相補的複雑性マーカーを比較した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:41:24 GMT)
Graph-Reward-SQL: Execution-Free Reinforcement Learning for Text-to-SQL via Graph Matching and Stepwise Reward [16.5] テキスト・ツー・タスクにおける大規模言語モデル(LLM)の性能向上のために,強化学習(RL)が広く採用されている。
既存の方法は、実行ベースやLLMベースのBradley-Terry報酬モデルに依存していることが多い。
本稿では,RLをベースとしたテキスト・ツー・スコア(Graph-Reward-RTM)のための新たな報酬モデルフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:15:50 GMT)
MoGIC: Boosting Motion Generation via Intention Understanding and Visual Context [16.2] MoGICは、意図モデリングと視覚的先行をマルチモーダルモーション合成に統合するフレームワークである。
本研究では,条件付きトークンと動き列の効果的な局所的アライメントを実現するために,適応的スコープの混合注意機構を提案する。
実験の結果、FIDはHumanML3Dで38.6%、Mo440Hで34.6%減少し、軽量テキストヘッドによる動きキャプションにおけるLCMベースの手法を上回っている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:54:39 GMT)
When Long Helps Short: How Context Length in Supervised Fine-tuning Affects Behavior of Large Language Models [16.1] 大規模言語モデル (LLM) は自然言語処理 (NLP) タスクにまたがって優れた性能を達成している。
現実世界のアプリケーションは、より長いコンテキストウインドウをますます求めているため、長いコンテキストデータに対する事前トレーニングと教師付き微調整(SFT)が一般的なアプローチとなっている。
SFTデータ長が短時間のタスクにおけるLLMの挙動にどう影響するかを系統的に検討する。
長文事前学習による劣化に対して,長文SFTは短文性能を向上することがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:46:09 GMT)
From Real World to Logic and Back: Learning Generalizable Relational Concepts For Long Horizon Robot Planning [16.1] 本稿では,ロボットが少数の生・未分割・無注釈のデモから直接,記号的・関係的概念を創出することを可能にする方法を提案する。
我々のフレームワークは手動のシンボルモデルと同等のパフォーマンスを達成し、一方、トレーニングをはるかに超越した実行地平線へのスケーリングを実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:35:31 GMT)
Comprehensive Evaluation of Large Multimodal Models for Nutrition Analysis: A New Benchmark Enriched with Contextual Metadata [16.0] 栄養分析のための食事画像にはLMM(Large Multimodal Models)が適用されてきている。
本研究は、文脈メタデータの解釈が、重要な栄養価を推定する際のLMM性能をいかに向上させるかを検討する。
実験結果から, 即時的プロンプト戦略によりメタデータをインテリジェントに統合すると, 栄養価の予測値において, 平均絶対誤差 (MAE) と平均絶対誤差 (MAPE) が著しく減少することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:15 GMT)
Diffusion-Based, Data-Assimilation-Enabled Super-Resolution of Hub-height Winds [15.9] WindSRは、ハブ高さ風の超解像ダウンスケーリングのためのデータ同化を伴う拡散モデルである。
WindSRは、最先端拡散モデルを用いて、ダウンスケーリング中のシミュレーションフィールドとスパース観測データを統合する。
我々のデータ同化は、WindSRのモデルバイアスを独立観測と比較して約20%削減する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:38:58 GMT)
A Survey of Pun Generation: Datasets, Evaluations and Methodologies [15.7] パン世代は、ユーモアや二重の意味を誘発するために、文章の中で言語要素を創造的に修正しようと試みている。
また、コヒーレンスとコンテキスト的適切性を維持することを目的としており、様々なメディアやコンテキストにわたるクリエイティブな執筆やエンターテイメントに有用である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:47:55 GMT)
Q-Learning with Shift-Aware Upper Confidence Bound in Non-Stationary Reinforcement Learning [15.5] 有限水平エピソードおよび無限水平割引マルコフ決定過程(MDPs)における分布シフトの非定常強化学習(Non-Stationary Reinforcement Learning, RL)について検討する。
有限水平条件では、そのような変化はエージェントが環境と相互作用するときに任意の時間ステップで起こる。
Q-learning Upper Confidence Bound Algorithm (QUCB)は、分散シフトによって学習中に適切なポリシーを発見することができるが、このポリシーはシフトが発生した後、準最適報酬を利用することができる。
本稿では,シフト対応Q-LearningUCBアルゴリズムであるdentity-QUCBを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:56:47 GMT)
Flow with the Force Field: Learning 3D Compliant Flow Matching Policies from Force and Demonstration-Guided Simulation Data [15.5] 本研究では,シミュレーションにおける力インフォームドデータ生成のためのフレームワークについて紹介する。
本稿では, 適合ポリシーとの結合が, 合成データから学習したビジュモータポリシーの性能をいかに向上させるかを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:40:58 GMT)
PropRAG: Guiding Retrieval with Beam Search over Proposition Paths [15.3] PropRAGは、トリプルからコンテキストリッチな命題に移行する新しいRAGフレームワークである。
PropRAGは2Wiki、HotpotQA、MuSiQueでRecall@5とF1のスコアを達成している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:26:29 GMT)
AdaBet: Gradient-free Layer Selection for Efficient Training of Deep Neural Networks [15.2] AdaBetは、重要なレイヤをランク付けするための、勾配のない層選択アプローチである。
AdaBetは、勾配ベースのベースラインよりも5%高い分類精度で平均的なゲインを達成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:30:55 GMT)
LLM Agents for Automated Dependency Upgrades [15.0] LLMエージェントのフレームワークを導入し、コード更新を自動的に推奨し、適用し、新しいバージョンとの互換性を確保する。
私たちのソリューションは、更新されたライブラリをライブJavaで自動的にローカライズし、推奨された修正をユーザフレンドリーな方法で実装できます。
その結果,提案手法はトークンの少ないアップグレードを行うだけでなく,71.4%の精度を実現し,最先端手法と比較して効率と有効性を強調した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:57:10 GMT)
Sample, Align, Synthesize: Graph-Based Response Synthesis with ConGrs [14.7] 本稿では,共有情報を表すDAGベースの柔軟なデータ構造であるConsensus Graphs(ConGrs)を紹介する。
以上の結果から,ConGrsは平均応答よりも2つのバイオグラフィー生成タスクの事実精度を最大31%向上させることを示した。
また、ConGrsを3つの拒否ベースのタスクに使用し、自己検証よりも改善した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:50:08 GMT)
Efficient Test-Time Scaling for Small Vision-Language Models [14.7] 小型ビジョンランゲージモデル (Small Vision-Language Models, VLM) は、より大きなモデルに対する計算的に効率的な代替手段を提供する。
既存の手法は典型的には計算的に要求され、小さなモデルの資源効率の高い設計目標と矛盾する。
外部監視よりもモデル内部の特徴を活用する新しい,効率的な2つのテストタイムスケーリング戦略を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:49:06 GMT)
Reliably Detecting Model Failures in Deployment Without Labels [14.3] 本稿では,デプロイ後劣化(PDD)モニタリングの問題点を定式化し,対処する。
本稿では,予測モデルの相違に基づく,実用的で効率的なモニタリングアルゴリズムD3Mを提案する。
標準ベンチマークと実世界の大規模内科データセットによる実証的な結果から,フレームワークの有効性が示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:50:59 GMT)
SBP-YOLO:A Lightweight Real-Time Model for Detecting Speed Bumps and Potholes toward Intelligent Vehicle Suspension Systems [14.3] 本稿では,組込みシステムにおける高速バンプとポットホールの効率的な検出フレームワークであるSBP-YOLOを提案する。
P2レベル分岐は小対象検出を改善し、軽量で効率的な検出ヘッド(LEDH)は最小限のオーバーヘッドで精度を維持する。
実験の結果、SBP-YOLOは87.0%のmAPを達成し、YOLOv11nベースラインを5.8%上回った。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:25:50 GMT)
Estimating link level traffic emissions: enhancing MOVES with open-source data [14.3] 我々は、MOVESとオープンソースのGPSトラジェクトリデータ、OpenStreetMap(OSM)ロードネットワーク、地域交通データセット、衛星画像から得られる特徴ベクトルを統合したデータ駆動フレームワークを提案する。
ニューラルネットワークモデルは、手軽に利用可能なデータから派生した機能のみを使用して、MOVES定義のオペレーティングモードの分布を予測するために訓練される。
MOVESベースラインと比較して,提案モデルでは,CO,NOx,CO2,PM2.5を含む主要汚染物質の地域規模の交通排出量に対して,RMSEを50%以上削減する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:22:56 GMT)
Mind the Gap: Linguistic Divergence and Adaptation Strategies in Human-LLM Assistant vs. Human-Human Interactions [14.2] 大規模言語モデル(LLM)は、顧客向けアプリケーションにますます多くデプロイされている。
本研究は,2つの設定間でのユーザ言語の文法的流布度,丁寧さ,語彙的多様性に有意な差異が認められた。
打上げ後の通信スタイルの変更に対する堅牢性を高めるために,我々は2つの戦略を実験した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:45:37 GMT)
Dale meets Langevin: A Multiplicative Denoising Diffusion Model [14.0] 計算神経科学の最近の進歩は、標準勾配勾配勾配最適化の定式化における学習が生物学的システムの学習と一致していないことを示している。
そのようなアプローチの1つは、Daleの法則に着想を得たものであり、これは、シナプスは学習の過程で役割を交換しない、というものである。
非負のデータに対して,Hyvaerinenが提案する損失関数を仮定して,乗法的 denoising score-matching の新たな定式化を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:23:33 GMT)
Enhancing repository-level software repair via repository-aware knowledge graphs [13.7] リポジトリレベルのソフトウェア修復は、問題記述とコードパッチの間のセマンティックギャップを埋める際の課題に直面します。
既存のアプローチは、大きな言語モデル(LLM)に依存しており、意味的曖昧さ、構造的文脈の限られた理解、推論能力の不足によって妨げられている。
本稿では,リポジトリアーティファクト(課題とプル要求)とエンティティ(ファイル,クラス,関数)を正確にリンクする新しいリポジトリ対応知識グラフ(KG)を提案する。
KGをマイニングした経路を利用する経路誘導補修機構により,説明とともに文脈情報を拡張することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:38:39 GMT)
Denoising of Two-Phase Optically Sectioned Structured Illumination Reconstructions Using Encoder-Decoder Networks [13.7] 二相光切断SI(OS-SI)では、取得時間が短縮され、従来の除雪が抑制に苦しむ残留アーティファクトが導入された。
ディープラーニングは従来の手法に代わる手段を提供するが、教師付きトレーニングは、クリーンで光学的に区切られた地上データがないために制限される。
2相OS-SIにおけるアーティファクト削減のためのエンコーダデコーダネットワークについて,実アーティファクトフィールドを合成画像に適用した合成トレーニングペアを用いて検討した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:19:42 GMT)
Med-K2N: Flexible K-to-N Modality Translation for Medical Image Synthesis [13.6] クロスモーダルな医用画像合成研究は、臨床診断を支援するために利用可能な画像から欠落した画像のモダリティを再構築することに焦点を当てている。
様々な目的タスクに対する異なるモダリティの不均一な寄与をモデル化するにはどうすればよいか?
マルチアウトプット生成におけるモーダリティアイデンティティの整合性を維持するには?
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:47:17 GMT)
Enhancing XAI Narratives through Multi-Narrative Refinement and Knowledge Distillation [13.5] カウンターファクトな説明は、予測を変える最小限の変更を強調することによって、モデル行動に関する洞察を提供する。
その可能性にもかかわらず、これらの説明はしばしば複雑で技術的であり、非専門家が解釈することを困難にしている。
本稿では,大規模・小規模の言語モデルを用いた新しいパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:04:09 GMT)
MobiLLM: An Agentic AI Framework for Closed-Loop Threat Mitigation in 6G Open RANs [13.5] 6G O-RAN環境における完全自動化されたエンドツーエンドの脅威軽減のためのエージェントAIフレームワークを提案する。
MobiLLMは,大規模言語モデルを利用したモジュール型マルチエージェントシステムを通じて,セキュリティをオーケストレーションする。
最初の評価は、MobiLLMが複雑な緩和戦略を効果的に識別し、編成できることを示していた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:43:57 GMT)
Unmasking Puppeteers: Leveraging Biometric Leakage to Disarm Impersonation in AI-based Videoconferencing [13.4] AIベースのトーキングヘッドビデオ会議システムは、コンパクトなポーズ表現ラテントを送信し、受信機でRGBを再合成することで帯域幅を削減する。
この潜伏者は操ることができ、攻撃者はリアルタイムで被害者の好奇心を乗っ取ることができる。
再建されたRGBビデオを見ることなく,最初の生体情報漏洩防御システムを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:37:03 GMT)
Towards Quantifying Long-Range Interactions in Graph Machine Learning: a Large Graph Dataset and a Measurement [13.3] 本稿では,現実の都市道路ネットワークをベースとした大規模トランスダクティブ学習データセットであるCity-Networksを紹介する。
このデータセットは、100kノード以上のグラフと、既存のベンチマークよりもはるかに大きな直径を持つ。
遠方ホップからの隣人のヤコビアンに基づくモデル非依存の測定を行い,長距離依存の原理的定量化を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:31:45 GMT)
Composite Optimization with Error Feedback: the Dual Averaging Approach [13.2] 誤差フィードバック(EF)手法は、複合最適化のより広範かつ事実上重要な設定で失敗する。
EF機構の最先端版であるEControl(Gao et al., 2024)とDual Averagingを組み合わせた新しい手法を提案する。
また,非接触二値平均化のための新しい新しい解析テンプレートも提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:42:48 GMT)
Revisiting Direct Speech-to-Text Translation with Speech LLMs: Better Scaling than CoT Prompting? [13.2] 音声からテキストへの変換(S2TT)データの増加にともなって,Chain-of-Thought(CoT)とDirect prompting(ダイレクトプロンプト)を体系的に比較した。
以上の結果から,データ量の増加に伴いDirectはより一貫した改善を行い,より大きなS2TTリソースが生成されるにつれて,より効果的なアプローチになる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:23:32 GMT)
Fully automated inverse co-optimization of templates and block copolymer blending recipes for DSA lithography [13.0] ブロック共重合体(BCP)の直接自己組織化は、円孔の形成に非常に有望なアプローチを提供する。
テンプレート形状を2パラメータのみで特徴付けるガウス記述子を提案する。
我々は, ブロック共重合体のテンプレート形状への適合性を向上させるために, 純粋なジブロック共重合体の代わりにAB/AB二成分ブレンドを用いる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:32:13 GMT)
Characteristic Learning for Provable One Step Generation [12.6] 本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。
我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。
深層ニューラルネットワークはこれらの特徴に適合するように訓練され、単純なガウス分布を目標分布にプッシュするワンステップマップを生成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:04:19 GMT)
Listening or Reading? Evaluating Speech Awareness in Chain-of-Thought Speech-to-Text Translation [12.6] CoT(Chain-of-Thought)プロンプトが導入されており、音声と文字起こしを共同でアクセスすることがこれらの問題を克服すると予想されている。
主に音声の書き起こしに頼りながら、ほとんど音声を生かして、カスケードされた振る舞いを反映していることがわかりました。
直接S2TTデータの追加やノイズのある書き起こし注入といった簡単な訓練介入は、堅牢性を高め、音声の帰属性を高める。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:42:38 GMT)
Deep Generative Continual Learning using Functional LoRA: FunLoRA [12.5] 共通の戦略は、忘れを和らげるために、生成モデルを自身の合成データで再訓練することである。
低階適応(LoRA)に基づく生成モデルのための新しい、より表現力のある条件付け機構を提案する。
提案手法は,拡散モデルに基づく先行技術結果を上回るパラメータ効率細調整(PEFT)手法である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:18:05 GMT)
ContextFlow: Context-Aware Flow Matching For Trajectory Inference From Spatial Omics Data [12.5] コンテキスト対応フローマッチングフレームワークであるContextFlowを提案する。
それは、空間的に解決されたオミクスデータから構造組織力学の推論を導くために、事前の知識を取り入れている。
コンテキスト制約を埋め込むことで、ContextFlowは統計的に一貫しただけでなく生物学的に意味のあるトラジェクトリを生成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:46:24 GMT)
Information upper bounds in composite quantum systems [12.3] 量子系の本質的な情報は、量子状態を定義するために必要な情報を指す。
2-qubit 系の後部情報内容の上限は, 正確には 2 に等しいことを示す。
後続情報によって定義される$n$-qubitシステムの本質的な情報は、$n$classical bitsによって境界づけられていることが判明した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:11:04 GMT)
Amelia: A Large Dataset and Benchmark for Airport Surface Movement Forecasting [12.3] 米国では、空港の管制塔の90%以上が不足しており、FAA(連邦航空局)や労働組合の基準に満たされていない。
アメリア42(Amelia-42)は、アメリカ連邦航空局(FAA)のシステムワイド・インフォメーション・マネジメント(SWIM)プログラム(英語版)を通じて流される、空港表面の移動に関する報告の収集である。
空港あたり15日間のサンプルであるAmelia42-Miniをリリースしました。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:18:49 GMT)
One Patch to Caption Them All: A Unified Zero-Shot Captioning Framework [12.3] ゼロショットキャプションのための統合フレームワークである frameworkName を提示する。
個々のパッチを原子キャプション単位として扱い、任意の領域を記述するためにそれらを集約する。
本モデルでは, ゼロショット密度, 領域セット, 新たに導入されたトレースキャプションタスクの性能が向上する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:05:56 GMT)
Modified logarithmic Sobolev inequalities for CSS codes [12.2] 量子ギブズ状態におけるドブルシン・スロースマン型の条件は、システムサイズが一様であるような変化した対数的ソボレフ不等式を意味することを示す。
その結果、2次元のトーリック符号の任意の正の温度での急激な熱化と3次元のトーリック符号のスター部分の3次元での高速な熱化が示され、これらのモデルに格納された量子情報が急速に失われることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:20:10 GMT)
Optimising quantum data hiding [12.1] 量子データ隠蔽は、大域的な測定とほぼ完全に区別できる二部量子状態のペアの存在である。
注目すべきなのは、データ隠蔽状態は分離可能であることも選択できることだ。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:12:06 GMT)
DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation [11.9] DiffusionBlocksは、トランスフォーマーベースのネットワークを独立したトレーニング可能なブロックに変換するための、原則化されたフレームワークである。
本実験は,DiffusionBlocksトレーニングがエンドツーエンドトレーニングの性能に合致することを示すものである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:12:25 GMT)
Optimizing and benchmarking the computation of the permanent of general matrices [11.9] 行列の永久性を評価することは、多くの領域に現れる基本的な計算である。
永続性を計算するのに最も効率的なアルゴリズムを自動で利用するソフトウェアは公開されていない。
本研究では,任意の矩形行列の永久性を評価するソフトウェアパッケージの設計,開発,評価を行った。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:32:04 GMT)
Efficient Preimage Approximation for Neural Network Certification [11.8] より厳密な境界、適応的なモンテカルロサンプリング、改良された分岐を含むPreMAPに対する新しい拡張を提案する。
これらの効率の改善はオリジナルのPreMAPを大きく上回り、難易度の高いネットワークへのスケーリングを可能にした。
本稿では,コンピュータビジョンから制御まで幅広いユースケースにおいて,信頼性と堅牢性を解析・証明するための事前近似手法の可能性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:50:05 GMT)
HAVIR: HierArchical Vision to Image Reconstruction using CLIP-Guided Versatile Diffusion [11.8] HAVIRモデルは視覚野を2つの階層領域に分離し、それぞれの特徴を抽出する。
以上の結果から,HAVIRは複雑なシーンにおいても,再構成の構造的品質と意味的品質を両立させることが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:50:52 GMT)
Elastic On-Device LLM Service [11.8] 我々は、フルLLMのモデルと寸法の両方を弾力化するデバイス上の大規模言語モデルサービスであるsysを提示する。
sysは、平均で14.83%、10.45%の精度で7つの強いベースラインを上回り、1%のTTFTスイッチオーバヘッド、オンパーメモリ消費、100のオフラインGPU時間を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:03:47 GMT)
Information storage and transmission under Markovian noise [11.7] 量子マルコフ半群の情報伝達容量$(Psit)_tin mathbbN$は、$d-次元量子系に作用する。
我々は、$tto infty$の極限において、その容量は、周辺空間の$Psi$の構造の観点から効率的に計算できることを示した。
また収束境界を確立して、無限時間容量が $tgtrsim d2ln (d)$ の後に到達することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:33:40 GMT)
Topological Invariance and Breakdown in Learning [11.7] 我々は、置換同変学習規則の幅広いクラスにおいて、トレーニングプロセスがニューロン間のバイリプシッツマッピングを誘導することを証明する。
トポロジカルクリティカルポイント$eta*$以下の学習率で、トレーニングは神経細胞のすべてのトポロジカル構造を保存するために制約される。
eta*$を超えると、学習プロセスはトポロジカルな単純化を可能にし、ニューロン多様体は徐々に粗くなる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:03:16 GMT)
Product-Quantised Image Representation for High-Quality Image Synthesis [11.6] 本稿では、VQGANのよく知られたベクトル量子化フレームワークにPQを統合する量子化イメージオートエンコーダであるPQGANを紹介する。
PQGANは再建性能の点で最先端の手法よりも顕著な改善を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:17:38 GMT)
Equivariant Splitting: Self-supervised learning from incomplete data [11.6] 本研究では,単一不完全観測モデルを用いて測定結果が観測される難易度設定のために考案された,新たな自己教師型学習戦略を提案する。
自己監督型分割損失と同変型再構成ネットワークの組み合わせは,教師型分割損失と同程度に最小化できることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:59:18 GMT)
DiT-VTON: Diffusion Transformer Framework for Unified Multi-Category Virtual Try-On and Virtual Try-All with Integrated Image Editing [11.6] 拡散変換器(DiT)を利用した新しいVTOフレームワークであるDiT-VTONを提案する。
我々のモデルは、VITON-HDの最先端手法を超越し、コンディションエンコーダに頼らずに、優れたディテール保存とロバスト性を実現する。
また、VTAと画像編集機能により、何千もの製品カテゴリにまたがる多様なデータセットでモデルのパフォーマンスも向上する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:27:53 GMT)
"It Felt Real" Victim Perspectives on Platform Design and Longer-Running Scams [11.4] 我々は,スカーマーがプラットフォーム・アベイランスを戦略的に活用して,信頼性の確保,親密さの編成,被害者との連帯の維持を図っている。
詐欺を社会技術プロジェクトとして分析することにより、より長期にわたる詐欺においてプラットフォーム設計をどのように活用できるかを強調した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:34:13 GMT)
Pareto-optimal Non-uniform Language Generation [11.3] ある言語に対する生成時間$L$が$tstar(L)$より厳密に小さいアルゴリズムは、他の言語に対する生成時間$L’$が$tstar(L')$より厳密に悪いことを満たさなければならない。
提案手法は,非一様生成アルゴリズムを,雑音や代表生成といった現実的に動機付けられた設定に適応させるのに便利である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:08:20 GMT)
BEKAN: Boundary condition-guaranteed evolutionary Kolmogorov-Arnold networks with radial basis functions for solving PDE problems [11.3] 本稿では,ラジアル基底関数を持つ境界条件付き進化的コルモゴロフ・アルノルドネットワーク(KAN)を提案する。
BEKANでは、ディリクレ、周期的、ノイマン境界条件をネットワークに組み込むための3つの異なるアプローチを提案する。
境界埋め込みRBF,周期層,および進化の枠組みにより,境界条件を厳格に強制しながら正確なPDEシミュレーションを行うことができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:57:23 GMT)
Paris: A Decentralized Trained Open-Weight Diffusion Model [11.1] 分散計算によって完全に事前訓練された最初の公開拡散モデルであるParisを提示する。
Paris氏は、インフラストラクチャを集中的に調整することなく、高品質のテキスト・ツー・イメージ生成が実現可能であることを実証している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:53:12 GMT)
Bayesian E(3)-Equivariant Interatomic Potential with Iterative Restratification of Many-body Message Passing [11.1] 現在の株式は不確実性に悩まされており、活発な学習、校正、配布外検知の信頼性を制限している。
我々は,多体メッセージパッシングの反復再帰化を伴うベイズE(3)変種を開発することで,これらの課題に対処する。
本手法では, エネルギー・原子間力の両面における不確実性を明確に証明する, NLL$_textJEF$の損失関数を導入する。
NLL$_textJEF$は、エネルギーと力の定量化による効率的な能動学習を促進することを実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:28:10 GMT)
Permissioned LLMs: Enforcing Access Control in Large Language Models [11.1] 本稿では,組織データアクセス制御構造を,それらが生成するクエリ応答に重畳するパーミッションLLMを提案する。
我々はPermLLMメカニズムの有効性を実証的に評価した。
要求されるアクセス制御を実現するために、効率的なファインチューニングを基盤とした新しいPermLLM機構を3つ導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:50:37 GMT)
TutorBench: A Benchmark To Assess Tutoring Capabilities Of Large Language Models [11.0] TutorBenchは、大規模言語モデル(LLM)のコアチューリングスキルを厳格に評価するために設計されたデータセットと評価ベンチマークである。
サンプルは、(i)学生の混乱に合わせた適応的な説明を生成すること、(ii)学生の作業に対して実行可能なフィードバックを提供すること、(iii)効果的なヒント生成を通じて活発な学習を促進すること、の3つの一般的な学習課題から抽出される。
我々はTutorBench上で16個のフロンティアLLMを評価し,その性能と挙動を詳細に解析した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:41:09 GMT)
RichControl: Structure- and Appearance-Rich Training-Free Spatial Control for Text-to-Image Generation [11.0] テキスト・ツー・イメージ(T2I)拡散モデルでは,テキスト・プロンプトから高品質な画像を生成することに成功した。
本稿では, 条件特徴のサンプリングスケジュールをデノナイジングプロセスから切り離すフレキシブルなトレーニングフリーフレームワークを提案する。
再調整スケジュールを導入することでサンプリングプロセスをさらに強化し、外観に富んだプロンプト戦略で視覚的品質を向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:54:26 GMT)
IndiCASA: A Dataset and Bias Evaluation Framework in LLMs Using Contrastive Embedding Similarity in the Indian Context [10.9] 大きな言語モデル(LLM)は、その印象的なコンテキスト理解と生成能力によって、重要なドメイン間で大きな牽引力を得ています。
類似度を埋め込むことにより,微粒なバイアスを捕捉するコントラスト学習を用いて学習したエンコーダに基づく評価フレームワークを提案する。
IndiBiasをベースとしたコンテキストアライメントされたステレオタイプとアンチステレオタイプ) は,5つの人口動態軸にまたがる2,575の人文から構成される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:03:26 GMT)
Disentangling Multiplex Spatial-Temporal Transition Graph Representation Learning for Socially Enhanced POI Recommendation [10.9] Next Point-of-Interest(POI)推奨はビジネスインテリジェンスにおけるホットスポットであり、ユーザの時空間遷移と社会的関係が重要な役割を果たす。
多重時間空間遷移グラフ上の不整合表現学習に基づく社会的に拡張されたPOIレコメンデーションモデルであるDiMuSTを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:55:12 GMT)
Gate-Shift-Pose: Enhancing Action Recognition in Sports with Skeleton Information [10.7] Gate-Shift-Poseは、フィギュアスケートにおける選手の転倒分類のために、RGBフレームとともにスケルトンポーズデータを統合するように設計されている。
我々は、RGBフレームと入力段階でポーズキーポイントのガウス熱マップを組み合わせたアーリーフュージョンと、RGBとポーズ特徴を組み合わせたマルチストリームアーキテクチャを用いたレイトフュージョンの2つの融合戦略を評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:49:46 GMT)
TabImpute: Accurate and Fast Zero-Shot Missing-Data Imputation with a Pre-Trained Transformer [10.7] TabImputeはトレーニング済みのトランスフォーマーで、正確で高速なゼロショット計算を提供する。
MissBenchは、32ドルのOpenMLデータセットと13ドルの欠落パターンを備えた計算方法の評価のためのベンチマークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:08:54 GMT)
Generative Modeling of Weights: Generalization or Memorization? [10.6] 生成モデルは、ニューラルネットワークのチェックポイントをトレーニングデータとして、推論中に高いパフォーマンスの重みを生成することを目的としています。
本研究では,新しいモデル重みを生成できる4つの代表的,よく知られた手法について検討する。
これらの手法は、主に記憶化によって重みを合成し、レプリカを生成するか、あるいはトレーニングチェックポイントの単純さを良く表す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:58:30 GMT)
Can Data-Driven Dynamics Reveal Hidden Physics? There Is A Need for Interpretable Neural Operators [10.6] 1)グリッドで学習する空間ドメインモデルと,(2)関数ベースで学習する機能ドメインモデルである。
具体的には、ニューラルネットワークの予測過程を説明し、ニューラルネットワークがデータから隠れた物理的パターンを学習できることを示す。
次に、単純な双空間マルチスケールモデルがSOTAの性能を達成できることを示し、二重空間マルチ比スケールモデルが複雑な物理を学ぶ大きな可能性を秘めていると信じている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:50:21 GMT)
DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.4] 我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:29:21 GMT)
Task-Level Contrastiveness for Cross-Domain Few-Shot Learning [10.3] 本稿では,既存の手法の課題に対処する新しい手法であるタスクレベルのコントラッシブネスの概念を紹介する。
提案手法は軽量であり,既存の数ショット/メタ学習アルゴリズムに容易に組み込むことができる。
我々はMetaDatasetベンチマークで異なる実験を行い,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:49:04 GMT)
A $1000\times$ Faster LLM-enhanced Algorithm For Path Planning in Large-scale Grid Maps [10.2] A*、Dijkstra、およびそれらの変種のような既存の手法は、小規模な地図ではうまく機能するが、検索時間とメモリ消費のために大規模地図には対応できない。
LLMは経路計画において顕著な性能を示したが、いまだに空間錯覚と計画性能に悩まされている。
iLLM-A*は平均で1000ドル以上のスピードアップを達成し、極端な場合は2349.5ドル以上のスピードアップを達成している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:33:45 GMT)
Exponential Family Variational Flow Matching for Tabular Data Generation [10.2] 本研究では,表データ生成のための変分フローマッチング(VFM)手法であるTabbyFlowを開発した。
異種データ型を表すEF-VFM(Exponential Family Variational Flow Matching)を提案する。
また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:32:46 GMT)
Same evaluation, more tokens: On the effect of input length for machine translation evaluation using Large Language Models [10.1] 大規模言語モデル(LLM)は、MQMエラースパンアノテーションを介して、信頼性が高く解釈可能な文レベルの翻訳評価器として機能する。
評価はテキスト長に不変であることを示し、入力の粒度に関わらず一貫した誤差スパンを生成する。
我々は、粒度整合プロンプト、FSP(Focus Sentence Prompting)、LCMと評価タスクの整合性を改善するための微調整アプローチなど、いくつかの戦略を評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:40:59 GMT)
Rubrics as Rewards: Reinforcement Learning Beyond Verifiable Domains [9.9] Reinforcement Learning with Verifiable Rewards (RLVR) は、数学やコーディングのような明確な正当性信号を持つ複雑な推論タスクに有効であることが証明されている。
ラグビーは近年、そのような判断を捉えるために評価ベンチマークで使用されているが、オンラインのポストトレーニングの報奨信号としての可能性はまだ未定である。
本稿では,RLVRを検証可能な領域を超えて,ルーブリックフィードバックを用いて拡張するオンライン強化学習手法であるRaRを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:55:55 GMT)
ALHD: A Large-Scale and Multigenre Benchmark Dataset for Arabic LLM-Generated Text Detection [9.9] ALHDは、人間とLLM生成したテキストを区別するために明示的に設計された、最初の大規模包括的なアラビア語データセットである。
ALHDは3つのジャンル(ニュース、ソーシャルメディア、レビュー)にまたがっており、MSAと方言のアラビア語の両方をカバーしている。
厳格な事前処理、リッチアノテーション、標準化されたバランスの取れた分割を提供します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:27:45 GMT)
Rates of Convergence of Generalised Variational Inference Posteriors under Prior Misspecification [9.8] 我々は、有界な発散を持つ一般化変分推論フレームワークにおいて、事前の誤特定に対する収束率とロバスト性を証明する。
これは GVI と Federated GVI にとって重要なオープンな課題である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:36:11 GMT)
Optimal Regularization Under Uncertainty: Distributional Robustness and Convexity Constraints [9.8] 分布的に堅牢な最適正規化のためのフレームワークを導入する。
トレーニング分布の計算と均一な事前計算との間には,ロバストな正則化器がどのように介在するかを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:35:38 GMT)
AReUReDi: Annealed Rectified Updates for Refining Discrete Flows with Multi-Objective Guidance [9.6] AReUReDiは、多能性バイオ分子生成のためのシーケンスベースのフレームワークである。
ペプチドおよびSMILES配列設計に応用される。
その結果、AReUReDiはマルチプロパタイトバイオ分子生成のための強力なシーケンスベースのフレームワークとして確立された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:49:30 GMT)
Exponential quantum advantages for practical non-Hermitian eigenproblems [9.6] 我々は一般の非エルミート固有値問題に対処する量子アルゴリズムを開発した。
本手法は,ファジィ量子固有値検出器と分別・対数戦略を組み合わせることで,関連する固有値の効率よく分離する。
自発的な$PT$対称性の破れの検出、リウヴィリアのギャップの推定、古典マルコフ過程の解析における幅広い応用について論じる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:45:01 GMT)
Automated Repair of OpenID Connect Programs (Extended Version) [9.6] OpenID Connectの重大なセキュリティバグは、重大な損失とセキュリティ侵害を引き起こしている。
本稿では,自動OpenIDバグ修正にLLMを利用する逆例誘導修理エンジンAuthFixを提案する。
OpenIDバグのデータセットに対する評価は、AuthFixが23のバグのうち17のパッチ(74%)を正常に生成したことを示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:14:18 GMT)
Filter-Guided Diffusion for Controllable Image Generation [9.6] Filter-Guided Diffusionは、ゼロショット画像から画像への変換と編集のための拡散に基づく生成モデルである。
FGDは、ガイダンスの強度と周波数のより細かい制御をサポートし、非決定論的サンプリング器を使ってより多種多様なものを作成することができる。
我々は、翻訳作業におけるFGDの性能を評価するために、広範囲にわたる定量的、質的な実験を行い、マスクを用いた場合の局所的な編集の可能性を示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:04:38 GMT)
Towards Generalizable Context-aware Anomaly Detection: A Large-scale Benchmark in Cloud Environments [9.5] クラウド環境における異常検出は、依然として重要かつ困難である。
既存のコンテキストレベルのベンチマークは通常、メトリクスまたはログにフォーカスする。
クラウド環境におけるコンテキスト異常の大規模ベンチマークであるCloudAnoBenchを紹介した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:10:05 GMT)
Signature-Informed Transformer for Asset Allocation [9.3] Signature-Informed Transformerは、リスク対応の財務目標を直接最適化することで、エンドツーエンドのアロケーションポリシを学習するフレームワークである。
SITは、毎日のS&P 100エクイティデータに基づいて評価し、従来とディープラーニングのベースラインを決定的に上回っている。
以上の結果から,ポートフォリオを意識した目標と幾何学を意識した帰納バイアスが,機械学習システムにおけるリスクを意識した資本配分に不可欠であることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:58:21 GMT)
How to Set $β_1, β_2$ in Adam: An Online Learning Perspective [9.3] 我々はAdamがFTRL(Follow-the-Regularized-Leader)の例であることを示す。
我々は、$beta_$1 sqrtbeta$と$beta_$1 leq sqrtbeta$の両方に当てはまる新しい、より一般的な分析を導き出す。
我々は、$beta_$1 = sqrtbeta$の設定が、難解な敵に対して最適であるが、公明でない敵に対して最適でないことを証明している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:54:38 GMT)
Topological Autoencoders++: Fast and Accurate Cycle-Aware Dimensionality Reduction [9.3] 我々はトポロジカルオートエンコーダ(TopoAE)の定式化に基づいて構築する。
平面中のリプス濾過のためのPHの正確な計算のための新しい高速アルゴリズムを提案する。
また,Wasserstein距離によって測定された位相的精度と,低次元の周期の視覚的保存とのバランスも向上する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:34:00 GMT)
S-Graphs 2.0 -- A Hierarchical-Semantic Optimization and Loop Closure for SLAM [9.2] 本研究では,室内シーンの階層構造を活用し,効率的なデータ管理と最適化を行う状況グラフ2.0(S-Graphs 2.0)を提案する。
私たちのアルゴリズムは、環境を表す状況グラフを、キーフレーム、ウォール、ルーム、フロアの4つの層に構築することから始まります。
本研究では,建物の各階間の空洞化により発生する偽陽性閉鎖を効果的に拒否する,フロアベースのループ閉鎖戦略を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:48:31 GMT)
FlexiQ: Adaptive Mixed-Precision Quantization for Latency/Accuracy Trade-Offs in Deep Neural Networks [9.1] FlexiQはコンピュータビジョンモデルのための適応型混合精度量子化スキームである。
量子化誤差を最小限に抑えるために、小さな値範囲を持つ特徴チャネルに低ビット幅を適用する。
低ビット幅のチャネル比をリアルタイムで調整し、量子化されたモデルで推論の作業量を管理することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:00:51 GMT)
Rethinking the Vulnerability of Concept Erasure and a New Method [9.0] 概念消去 (defense) 法は、ポストホック微調整によって特定の概念を「未学習」するために開発された。
最近の概念復元(アタック)手法は、これら消去されたと思われる概念を、逆向きのプロンプトで復元できることを実証している。
本稿では,従来の修復手法を最大17.8倍に向上させる新しい座標descentベースの復元アルゴリズムである**RECORD*を紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:39:26 GMT)
PEaRL: Pathway-Enhanced Representation Learning for Gene and Pathway Expression Prediction from Histology [8.9] 本稿では PEaRL (Pathway Enhanced Representation Learning) について述べる。
3つのがんSTデータセット全体でPEaRLはSOTA法を一貫して上回り、遺伝子レベルでの発現予測と経路レベルでの表現予測の精度が向上した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:21:23 GMT)
Time-To-Inconsistency: A Survival Analysis of Large Language Model Robustness to Adversarial Attacks [8.9] 対話型AIの強靭性に関する総合的サバイバル分析を行い,9つの最先端LCMの会話を36,951回解析した。
突発的,即発的(prompt-to-prompt)なセマンティックドリフトは破滅的であり,会話障害の危険性を劇的に高める。
相互作用を持つAFTモデルは優れた性能を示し、優れた識別と例外的な校正を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:26:10 GMT)
OTR: Synthesizing Overlay Text Dataset for Text Removal [8.8] シーンテキスト以外の領域に適用可能なテキスト除去ベンチマークを合成する手法を提案する。
我々のデータセットは、オブジェクト認識された配置と視覚言語モデル生成コンテンツを使用して複雑な背景にテキストを描画する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:44:07 GMT)
Smart Contract Intent Detection with Pre-trained Programming Language Model [8.7] スマートコントラクトにおける悪意ある開発者の意図は、分散化されたアプリケーションに対する重大なセキュリティ脅威となる。
本研究では,このモデルの強化版であるSmartIntentNN2(Smart Contract Intent Neural Network V2)を提案する。
主要な拡張点は、BERTベースの事前訓練されたプログラミング言語モデルの統合である。
同じ1万のスマートコントラクトの評価セットでは、SmartIntentNN2は精度0.9789、精度0.9090、リコール0.9476、F1スコア0.9279で優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:43:31 GMT)
Tradeoffs on the volume of fault-tolerant circuits [8.6] 誤り訂正符号は欠陥のある回路部品を克服し、堅牢な計算を可能にする。
適切なコードを選択することは、いくつかの要件のバランスを取る必要があるため、簡単ではない。
コードファミリは、エンコードされたCNOTゲートを実行するための、一定レート、距離の増大、および短距離ガジェットを同時に持つことはできない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:39:31 GMT)
Onto-Epistemological Analysis of AI Explanations [8.6] 本稿では、モデル決定プロセスの説明を提供する説明可能なAI(XAI)手法について論じる。
我々は,XAI手法の技術的変化が,説明に関する前提条件の重要な相違にどのように対応するかを示す。
また、特定のアプリケーションに対してXAIメソッドを選択する際に、基礎となるオン・エコロジーパラダイムを無視するリスクも強調する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:36:57 GMT)
Bootstrap Learning for Combinatorial Graph Alignment with Sequential GNNs [8.5] グラフニューラルネットワーク(GNN)は、ニューラルネットワークの従来の最適化手法よりも優れており、その実践的影響を制限している。
本稿では,構造情報のみを用いて,グラフアライメント問題に対する新しい連鎖手法を提案する。
提案手法は,従来のネットワークが生成した類似度行列を反復的に洗練することを学ぶ,一連のGNNを訓練する。
各GNNは、以前のイテレーションからノードアライメントの品質に関する個別のランキング情報を組み込むことで、部分的なソリューションを改善する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:17:00 GMT)
NEXUS: Network Exploration for eXploiting Unsafe Sequences in Multi-Turn LLM Jailbreaks [8.2] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、ジェイルブレイク攻撃には弱いままである。
NEXUSは、最適化されたマルチターン攻撃の構築、精錬、実行のためのモジュラーフレームワークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:24:14 GMT)
Vehicle-Scene Interaction: A Text-Driven 3D Lidar Place Recognition Method for Autonomous Driving [8.2] Des4Posは、新しい2段階のテキスト駆動型リモートセンシングローカライゼーションフレームワークである。
トップ1の精度は40%、トップ10の精度は半径5mの閾値で77%に達する。
KITTI360Poseテストセットの実験では、テキスト・ツー・ポイント・クラウドの場所認識におけるDes4Posの最先端性能が実証された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:32:33 GMT)
SEER: The Span-based Emotion Evidence Retrieval Benchmark [8.1] 感情を表現する特定のテキストを識別する大規模言語モデルの能力をテストするために,SEER(Span-based Emotion Evidence Retrieval)ベンチマークを導入する。
我々は14個のオープンソースLCMを評価し、あるモデルでは1文入力で平均的な人的パフォーマンスにアプローチするが、その精度は長いパスで低下する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:15:24 GMT)
Reward Models are Metrics in a Trench Coat [8.1] 2つの研究領域は、主に分離されており、冗長な用語と繰り返しの落とし穴に繋がることがわかった。
一般的な課題には、素早い相関への感受性、下流の報酬ハックへの影響、データ品質を改善する方法、メタ評価へのアプローチなどがある。
我々の立場論文は、フィールド間のより緊密なコラボレーションがこれらの問題を克服するのに役立ちます。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:59:44 GMT)
HALO: Memory-Centric Heterogeneous Accelerator with 2.5D Integration for Low-Batch LLM Inference [8.1] 大きな言語モデル(LLM)は、レイテンシに敏感なアプリケーションにおける効率的な推論の需要を増大させた。
これらの課題に対するヘテロジニアスメモリ中心のアクセラレータであるHALOを提案する。
HALOはAtAccの最大18倍の幾何平均速度を達成し,注目度を最適化したマッピング,CENTの2.5倍を実現している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:20:17 GMT)
Diffusion-aided Task-oriented Semantic Communications with Model Inversion Attack [8.0] タスク指向意味コミュニケーションのための拡散支援フレームワークであるDiffSemを提案する。
DiffSemは、チャネルノイズを補償しながらセマンティックコンテンツを適応的に制御する送信側自己雑音機構を統合している。
実験の結果,DiffSem は適切な受信者に対して高い精度を達成できることを示し,提案手法の優れた性能を検証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:11:10 GMT)
Less is More: Lean yet Powerful Vision-Language Model for Autonomous Driving [7.9] 我々は,一段階のエンドツーエンド自動運転のための新しいフレームワークであるMax-V1を紹介する。
我々のフレームワークは、運転の本質的にの順序性と整合した単一パス生成パラダイムを提供する。
実験により,本手法はnuScenesデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:30:05 GMT)
Tuning LLM-based Code Optimization via Meta-Prompting: An Industrial Perspective [7.9] 多様な大規模言語モデル(LLM)にまたがるタスク固有のプロンプトを自動的に生成するフレームワークであるMPCO(Meta-Prompted Code Optimization)を紹介する。
MPCOはメタプロンプトを利用して、プロジェクトメタデータ、タスク要求、LLM固有のコンテキストを統合することで、コンテキスト対応の最適化プロンプトを動的に合成する。
MPCOは総合的な性能改善を19.06%まで達成し、ベースライン法と比較して全てのシステムで最高の統計ランクを得た。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:04:35 GMT)
A many-objective evolutionary algorithm using indicator-driven weight vector optimization [7.8] 本研究では,ハイパーボリュームインジケータを簡略化した適応多目的進化アルゴリズムを提案する。
重みベクトルの自己適応的および動的調整を容易にするために、分解に基づく手法でインジケータ評価手法を合成する。
実験結果から,提案アルゴリズムは6つの最先端アルゴリズムと比較して効率的かつ効果的であることが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:14:24 GMT)
The Prompt Makes the Person(a): A Systematic Evaluation of Sociodemographic Persona Prompting for Large Language Models [7.8] 異なるペルソナのプロンプト戦略が大規模言語モデル(LLM)に与える影響について検討する。
人口統計学的プライミングと役割採用戦略の選択が、その描写に大きく影響していることが判明した。
具体的には、インタビュースタイルのフォーマットと名前ベースのプライミングのプロンプトが、ステレオタイピングの削減に役立ちます。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:59:31 GMT)
Less LLM, More Documents: Searching for Improved RAG [7.7] ジェネレータのスケーリングによって精度が向上し、コストが上がり、デプロイが制限される。
コーパススケーリングはRAGを継続的に強化し、しばしばモデルサイズの増加の代用として機能することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:26:13 GMT)
When Names Disappear: Revealing What LLMs Actually Understand About Code [7.7] 大規模言語モデル(LLM)は、コードタスクにおいて強力な結果をもたらすが、どのようにプログラムの意味を導き出すかは、まだ不明である。
形式的な振る舞いを定義する構造的意味論と、意図を伝える人間の解釈可能な命名という2つのチャンネルを通じてコードがコミュニケーションすると主張する。
命名チャンネルの削除は、モデルが行ごとの記述に回帰する、要約のような意図レベルのタスクを著しく低下させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:53:13 GMT)
SketchPlan: Diffusion Based Drone Planning From Human Sketches [7.7] 本研究では,深度画像上の2次元手描きスケッチを解釈し,ドローンナビゲーションのための3次元飛行経路を生成する拡散型プランナを提案する。
SketchPlanは、人間のスケッチを投影された2DパスにマッピングするSketchAdapterと、2Dプロジェクションから3Dトラジェクトリを推測する拡散モデルDiffPathと、第1の人視深度画像の2つのコンポーネントで構成されている。
本モデルでは,ゼロショット・シム・トゥ・リアル・トランスファーを実現し,これまで見られなかった実環境において,正確かつ安全な飛行経路を生成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:31:24 GMT)
Efficient & Correct Predictive Equivalence for Decision Trees [7.6] Rashomonの意思決定ツリー(DT)は、重要な使用方法を見つけます。
同じ分類関数、すなわち予測等価DTを計算するDTは、ラショーモン集合のかなりの部分を表すことができる。
本稿では,Quine-McCluskey (QM) 法において,最悪ケースの指数的実行時間と空間を誘導する決定木が存在することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:03:11 GMT)
C2AL: Cohort-Contrastive Auxiliary Learning for Large-scale Recommendation Systems [7.5] 共有埋め込み選択のための因子化機械において,注意機構が重要な役割を担っていることを示す。
本稿では、データセットのサブ構造を分析し、補助学習を通して強力な分布コントラストを持つ構造を明らかにすることで、この問題に対処することを提案する。
このアプローチは、注目層の学習プロセスをカスタマイズし、少数派コホートとの相互情報を保護し、グローバルなパフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:45:09 GMT)
VarCoNet: A variability-aware self-supervised framework for functional connectome extraction from resting-state fMRI [7.5] VarCoNetは、静止状態fMRI(rs-fMRI)データからロバスト関数コネクトーム(FC)を抽出するための拡張された自己教師型フレームワークである。
VarCoNetは自己教師付きコントラスト学習を用いて、本質的に機能的な個人間変動を生かしている。
VarCoNetは、(i)Human Connectome Projectのrs-fMRIデータと(ii)ABIDE IとABIDE IIデータセットのrs-fMRIデータを用いて、(ii)自閉症スペクトラム障害(ASD)分類という2つの下流タスクで評価されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:57:51 GMT)
Certifiable Safe RLHF: Fixed-Penalty Constraint Optimization for Safer Language Models [7.4] 我々は,大規模コーパスでトレーニングされたコストモデルであるCertifiable Safe-RLHFを導入し,セマンティックグラウンドの安全性スコアを割り当てる。
適切にスケールされたペナルティにより、二重変数更新の必要性を排除し、安全制約の実現性を保証することができる。
経験的評価により、CS-RLHFは、名目や脱獄のプロンプトに対して、最先端のモデル応答よりも5倍効率が高いことが示されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:24:41 GMT)
Self-Anchor: Large Language Model Reasoning via Step-by-step Attention Alignment [7.4] 本稿では、推論の固有の構造を利用して注意を喚起する新しいパイプラインであるSelf-Anchorを提案する。
Self-Anchorは推論軌跡を構造化された計画に分解し、モデルの注意を最も関連する推論ステップに自動的に合わせる。
特に、Self-Anchorは、非推論モデルと特別な推論モデルの間のパフォーマンスギャップを著しく減らします。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:56:33 GMT)
Global Convergence of Policy Gradient for Entropy Regularized Linear-Quadratic Control with multiplicative noise [7.3] 強化学習(Reinforcement Learning, RL)は、動的環境におけるシーケンシャルな意思決定のための強力なフレームワークとして登場した。
本稿では,RLを用いたエントロピー規則化クアドラ(LQC)の制御について検討する。
サンプルベース正規化ポリシーグラディエント(SBRPG)という新しいモデル自由RLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:03:12 GMT)
Transparent Reference-free Automated Evaluation of Open-Ended User Survey Responses [7.3] オープンな調査回答は、マーケティング研究に貴重な洞察を与えます。
品質の低い回答は、手動フィルタリングの研究者に負担を与えるだけでなく、誤った結論をもたらすリスクも負う。
そこで本研究では,ヒトのサーベイ応答に特化して設計された2段階評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:37:33 GMT)
Total Robustness in Bayesian Nonlinear Regression for Measurement Error Problems under Model Misspecification [7.2] 一般非線形回帰における3つの課題すべてに対処する完全ロバスト性をターゲットにした最初のベイズ的非パラメトリックフレームワークを提案する。
シミュレーションと実世界の2つの研究では、推定誤差の低減と、誤特定に対する推定感度の低減が示されている。
したがって、このフレームワークは、データとモデルが共同で不完全である場合に、信頼できる回帰のための実用的で解釈可能なパラダイムを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:58:40 GMT)
On residual network depth [7.2] ネットワーク深度の増加は,暗黙のアンサンブルの大きさの拡大と数学的に等価であることを示す。
我々の研究は、ネットワーク固有の機能構造から導かれた最初の説明を提供する。
さらに、このスケーリングは、モデルの複雑さを暗黙的に規則化するキャパシティコントロールとして機能することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:48:48 GMT)
Image Enhancement Based on Pigment Representation [7.2] 本稿では,顔料表現に基づく新規で効率的な画像強調手法を提案する。
RGBのような事前定義された色空間に色変換が制限される従来の方法とは異なり、本手法はRGB色をテキストピグメントと呼ばれる高次元の特徴空間に変換することにより、入力内容に動的に適応する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:28:44 GMT)
Conditional Pseudo-Supervised Contrast for Data-Free Knowledge Distillation [7.2] 我々は、データフリー知識蒸留(CPSC-DFKD)のための新しい学習パラダイム、すなわち条件付き擬似教師付きコントラストを提案する。
CPSC-DFKDの主な革新は,(1)擬似教師付き学習のためのカテゴリ固有の多様なイメージを合成するための条件付き生成対向ネットワークの導入,(2)異なるカテゴリの分布を識別するためのジェネレータのモジュールの改良,(3)教師と学生の視点に基づく擬似教師付きコントラスト学習の提案である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:34:19 GMT)
Abstain and Validate: A Dual-LLM Policy for Reducing Noise in Agentic Program Repair [7.1] Agentic Automated Program repair (APR)は、ますます複雑なリポジトリレベルのバグに対処している。
互換性のないパッチを開発者に示すと、かなりのノイズが発生する可能性がある。
このようなノイズを減らすために,バグ回避とパッチ検証という2つの補完的なポリシーを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:53:28 GMT)
LLAMAFUZZ: Large Language Model Enhanced Greybox Fuzzing [7.1] 特殊なファジィザは複雑な構造化データを扱うことができるが、文法にさらなる努力が必要であり、低スループットに悩まされる。
本稿では,構造化データに対するグレーボックスファジングを強化するために,Large Language Modelを活用する可能性について検討する。
LLMベースのファザであるLLAMAFUZZは、LLMのパワーを統合して、構造化データをファザリングに理解し、変更する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:50:53 GMT)
Ergodic Risk Measures: Towards a Risk-Aware Foundation for Continual Reinforcement Learning [7.0] 連続強化学習(Continual RL)は、生涯学習の概念とRLにおける無限適応の形式化を目指している。
これまでのところ、連続RLはリスクニュートラルな意思決定のレンズを通して、ほぼ独占的に探索されてきた。
本稿では,リスク認識型意思決定のレンズによる連続RLの正式な理論的治療について述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:40:03 GMT)
Learning High-Fidelity Robot Self-Model with Articulated 3D Gaussian Splatting [7.0] 本稿では,ロボットの自己モデリングのための高品質,テクスチャ認識,リンクレベル手法を提案する。
我々は3Dガウスアンを用いて、ロボットの静的形態とテクスチャを表現し、3Dガウスアンをクラスタリングして神経楕円体骨を構築する。
関節角度でキネマティックニューラルネットワークを入力することにより,ロボットの形態,運動学,テクスチャをリンクレベルで記述することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:56:59 GMT)
Not a nuisance but a useful heuristic: Outlier dimensions favor frequent tokens in language models [7.0] 我々は,多くの現代言語モデルにおいて,不規則な次元が出現することを示し,その関数を常に頻繁な単語の予測に遡ることを示す。
我々は,多くの異なるモデルによって有用なトークン予測を実装するための特別なメカニズムである,と結論付けている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:26:01 GMT)
Real-Time Assessment of Bystander Situation Awareness in Drone-Assisted First Aid [7.0] ドローンによるラピッドナロキソンの配達は、オピオイド過量緊急事態(OOEs)への対応に有望な解決策を提供する
人間-自律チーム(HAT)における傍観者状況認識(SA)の役割について考察する。
本稿では,グラフ埋め込みとトランスフォーマーモデルを用いた映像ベースリアルタイムSAアセスメントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:11:30 GMT)
Understanding How CodeLLMs (Mis)Predict Types with Activation Steering [7.0] 研究によると、Large Language Models (LLM) はプログラムのセマンティクスを深く理解していないことが多い。
本研究では,タイプ予測の課題について検討する。
ステアリングがPythonとTypeScriptで共有される型予測メカニズムをうまく起動することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:11:21 GMT)
Why Do We Need Warm-up? A Theoretical Perspective [6.8] ウォームアップがトレーニングを改善する理由を,原則として説明します。
ウォームアップスケジュールのグラディエントDescentは、固定ステップサイズよりも高速な収束を実現することを証明した。
言語モデルと視覚モデルの実験を通して理論的知見を検証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:35:56 GMT)
Application of a Virtual Imaging Framework for Investigating a Deep Learning-Based Reconstruction Method for 3D Quantitative Photoacoustic Computed Tomography [6.7] 堅牢なqPACT再構成手法の開発は, 計算要求, モデリング困難, 実験的不確実性により困難である。
これらの問題に対処するために学習ベースの手法が提案されているが、まだほとんど無効である。
仮想イメージング(VI)研究は、早期にそのような手法を検証するために不可欠である。
本研究は、乳房画像の3次元学習に基づくqPACT再構成法を評価するために、現実的なVIテストベッドを用いている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:49:51 GMT)
ViLBias: Detecting and Reasoning about Bias in Multimodal Content [6.7] ViLBiasは、マルチモーダルニュースにおけるバイアスの検出と推論のためのフレームワークである。
データセットは40,945のテキストペアで構成されている。
その結果,テキストによる画像の検出精度は3~5%向上した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:22:35 GMT)
TriQuest:An AI Copilot-Powered Platform for Interdisciplinary Curriculum Design [6.7] 学際的な教育は近代的なカリキュラム改革の基盤となっているが、その実践は知識統合と時間を要する授業計画の課題によって妨げられている。
これらの問題を解決するために設計されたAI-コパイロットプラットフォームであるTriQuestを紹介します。
TriQuestは、直感的なGUIを通じて大きな言語モデルと知識グラフを使用して、教師が高品質な学際的な授業プランを効率的に作成するのに役立つ。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:04:59 GMT)
A Study on the Framework for Evaluating the Ethics and Trustworthiness of Generative AI [6.7] ChatGPTのような生成AIは、驚くべき革新的な可能性を示している。
これは同時に、偏見、有害性、著作権侵害、プライバシー侵害、幻覚などの倫理的・社会的懸念を提起する。
本研究は,社会的影響を反映した新たな人間中心基準の必要性を強調した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:27:20 GMT)
A purely Quantum Generative Modeling through Unitary Scrambling and Collapse [6.6] 量子スクランブルと崩壊生成モデル(Quantum Scrambling and Collapse Generative Model, QGen)は、古典的な依存関係を排除する純粋量子パラダイムである。
本研究では,学習をトラクタブルなサブプロブレムに分解し,バレンプラトーを緩和する測定に基づく学習原理を導入する。
経験的に、QGenは、有限ショットサンプリングの下で堅牢性を維持しながら、一致したパラメータ予算の下で古典的およびハイブリッド的ベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:50:19 GMT)
Automatic Building Code Review: A Case Study [6.5] 建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:30:14 GMT)
GAS-MIL: Group-Aggregative Selection Multi-Instance Learning for Ensemble of Foundation Models in Digital Pathology Image Analysis [6.5] GAS-MILはフレキシブルアンサンブルフレームワークで、複数の基盤モデルの機能をシームレスに統合する。
個々のFMに対して優れた性能またはオンパー性能を達成し、MIL法を確立した。
将来のマルチモーダルおよび精度オンコロジーアプリケーションのためのスケーラブルな基盤を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:59:40 GMT)
Better by Comparison: Retrieval-Augmented Contrastive Reasoning for Automatic Prompt Optimization [6.4] 提案するCRPO(Contrastive Reasoning Prompt Optimization)は,検索強化推論プロセスとして迅速な最適化を定式化する新しいフレームワークである。
提案手法では,HelpSteer2データセットからトップk参照プロンプト-レスポンスペアを検索する。
CRPOは、高品位と低品位を明示的に対比することにより、あるプロンプトが成功する理由を推論し、他のプロンプトが失敗する理由を推測することを可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:39:44 GMT)
KAIROS: Unified Training for Universal Non-Autoregressive Time Series Forecasting [6.3] KAIROSは非自己回帰時系列予測フレームワークである。
自動回帰アプローチとは異なり、KAIROSはエラーの蓄積を回避し、ジャスト・イン・タイム推論を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:10:02 GMT)
ColNet: Collaborative Optimization in Decentralized Federated Multi-task Learning Systems [6.2] ColNetは、分散化されたフェデレーション環境における異種タスク用に設計されたフレームワークである。
バックボーンはグループ内で平均化され、グループリーダーはハイパーコンフリクトとアバースのクロスグループアグリゲーションを実行する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:57:18 GMT)
Continuous Thought Machines [6.2] 本稿では、ニューラルネットワークをコア表現として活用するモデルであるContinuous Thought Machine(CTM)を紹介する。
CTMには、(1)ニューロンレベルの時間的処理、(2)ニューロンが入ってくる履歴を処理するために独自の重みパラメータを使用する、(2)潜時表現としての神経同期という2つの革新がある。
我々は,2次元迷路の解決,ImageNet-1K分類,パリティ計算など,CTMの性能と汎用性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:13:06 GMT)
AgentHub: A Research Agenda for Agent Sharing Infrastructure [6.2] LLMベースのエージェントは急速に増殖しているが、発見、評価、管理のインフラは断片化されている。
最近の研究と工学の研究は、必要なインフラについて検討し始めているが、今のところは、分散、命名、プロトコル交渉に焦点を絞っている。
本稿ではエージェント共有のための研究課題であるエージェントHubを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:18:58 GMT)
LLM, Reporting In! Medical Information Extraction Across Prompting, Fine-tuning and Post-correction [6.2] 本研究は,バイオメディカル名称認識(NER)とフランス語における健康イベント抽出に関するEvalLLM 2025チャレンジへの参加を示す。
NERでは,大規模言語モデル(LLM),ガイドラインガイドライン,合成データ,後処理を組み合わせた3つのアプローチを提案する。
GPT-4.1はNERが61.53%、イベント抽出が15.02%である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:59:40 GMT)
Mechanisms for Quantum Advantage in Global Optimization of Nonconvex Functions [6.1] 非同相関数の大域的最適化における量子スピードアップの新たな理論機構を示す。
我々は,実空間量子アルゴリズム (RsAA) が実時間実行を実現することを証明して,これらのアイデアを定式化する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:40:31 GMT)
SteerDiff: Steering towards Safe Text-to-Image Diffusion Models [6.1] テキスト・ツー・イメージ(T2I)拡散モデルは不適切なコンテンツを生成するために誤用することができる。
本稿では,ユーザ入力と拡散モデルの間の仲介として機能する軽量適応モジュールであるSteerDiffを紹介する。
提案手法の有効性を評価するために,様々な概念の未学習タスクに対して広範な実験を行う。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:51:33 GMT)
Superposition disentanglement of neural representations reveals hidden alignment [6.0] 神経科学とAIにおいて、表現アライメントメトリクスは、異なるディープニューラルネットワーク(DNN)または脳が類似した情報を表現する範囲を測定する。
我々は、厳密な置換度が重ね合わせに依存するかの理論を開発する。
この結果から,ニューラルネットワーク間の真の表現的アライメントを明らかにするためには,重畳不整合(superposition disentanglement)が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:12:40 GMT)
Physical partisan proximity outweighs online ties in predicting US voting outcomes [6.0] 個別調査データと集約・非特定コロケーションとオンラインネットワークデータを用いて,米国におけるパルチザン曝露と投票選択との関係について検討した。
我々は、コロケーションパターンによって捉えられた物理的空間におけるパルチザン露光が、アメリカの郡における選挙結果をより正確に予測することを発見した。
また、郡レベルの経験者分離を推定し、個人の人口動態と社会経済特性との関係について検討した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:46:56 GMT)
Do AI Models Perform Human-like Abstract Reasoning Across Modalities? [6.0] OpenAIのo3-preview推論モデルはARC-AGIベンチマークで人間の精度を上回った。
本研究では,ConceptARCにおけるモデルの抽象化能力について検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:03:20 GMT)
ALMAS: an Autonomous LLM-based Multi-Agent Software Engineering Framework [5.9] 本稿では,自律型LLMベースのマルチエージェントソフトウェアエンジニアリングフレームワークであるALMASのビジョンを提案する。
我々は、ALMASに向けての進展と、フレームワークを実演するユースケースを紹介します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:35:23 GMT)
VirDA: Reusing Backbone for Unsupervised Domain Adaptation with Visual Reprogramming [5.9] VirDAはドメイン固有のビジュアル・リプログラミング・レイヤをバックボーンにプリペイドする。
VirDAをOffice-31上で評価し,平均精度92.8%,トレーニング可能なパラメータは1.5Mに留まった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:53:46 GMT)
Hierarchical Knowledge Injection for Improving LLM-based Program Repair [5.8] 現実世界のプロジェクトでは、開発者はそのようなバグを解決するために、ローカルコード以外のより広いリポジトリとプロジェクトレベルのコンテキストに依存することが多い。
本稿では,LLMを構造化コンテキストで漸進的に拡張する階層型知識注入フレームワークを提案する。
このフレームワークをBugsInPyの314のバグのデータセットで評価し、6つのバグタイプにわたる修正率を分析した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:26:56 GMT)
Learning Representations Through Contrastive Neural Model Checking [5.8] Contrastive Neural Model Checking (CNML) は、モデルチェックタスクを協調表現を学習するための誘導信号として活用する新しい手法である。
CNMLは、アルゴリズム的ベースラインと神経的ベースラインの両方において、クロスモーダルとイントラモーダルの両方でかなり優れています。
これらの結果から,モデル検査が形式言語における表現の学習の目的となることが示唆された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:40:08 GMT)
A Comprehensive Review on Harnessing Large Language Models to Overcome Recommender System Challenges [5.8] 大規模言語モデル(LLM)は、レコメンデータシステムにおいて重要な課題に取り組むために利用することができる。
LLMはパーソナライズ、セマンティックアライメント、解釈可能性を高める。
LLMはゼロショットと少数ショットの推論を可能にし、コールドスタートとロングテールのシナリオでシステムが効果的に動作できるようにする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:20:34 GMT)
Memory-Efficient Backpropagation for Fine-Tuning LLMs on Resource-Constrained Mobile Devices [5.7] バックプロパゲーションのtextemdashを使った微調整された大きな言語モデル(LLM)は、推論よりもはるかにメモリ消費が大きい。
本稿では,メモリ使用量と計算時間とのトレードオフを改善するために,モバイル機器上でのバックプロパゲーション(MeBP)のメモリ効率向上実装を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:36:21 GMT)
Omni-Embed-Nemotron: A Unified Multimodal Retrieval Model for Text, Image, Audio, and Video [5.7] Omni-Embed-Nemotronは,実世界の情報ニーズの複雑化に対応するために開発された,統合型マルチモーダル検索埋め込みモデルである。
我々は,Omni-Embed-Nemotronのアーキテクチャ,トレーニング設定,評価結果を記述し,テキスト,画像,ビデオ検索においてその有効性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:29:50 GMT)
Mitigating Spurious Correlation via Distributionally Robust Learning with Hierarchical Ambiguity Sets [5.6] グループ間不確実性とグループ内不確実性の両方に対処するグループDROの階層的拡張を提案する。
また、現実的なマイノリティグループ分布シフトをシミュレートする新しいベンチマーク設定も導入する。
これらの結果は、グループ間およびグループ内分布不確実性の両方をよりよく捉えるために、あいまいさを拡大することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:50:44 GMT)
Finding Diamonds in Conversation Haystacks: A Benchmark for Conversational Data Retrieval [5.6] 製品インサイトのための会話データを取得するシステムを評価するための,最初の総合的なテストセットであるConversational Data Retrieval(CDR)ベンチマークを提示する。
5つの分析タスクにわたる1.6kクエリと9.1kの会話により、我々のベンチマークは会話データ検索性能を測定するための信頼性の高い標準を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:29:44 GMT)
DuPLUS: Dual-Prompt Vision-Language Framework for Universal Medical Image Segmentation and Prognosis [5.5] 効率的なマルチモーダル医療画像解析のためのディープラーニングフレームワークであるDuPLUSを紹介する。
DuPLUSは、階層的セマンティックプロンプトを利用して分析タスクのきめ細かい制御を行う新しい視覚言語フレームワークを導入した。
セグメンテーションのために、DuPLUSは、30以上の臓器と腫瘍タイプを含む10の異なる医療データセットである3つの画像モダリティを一般化することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:01:00 GMT)
Accurate and Effective Model for Coexistence of Classical and Quantum Signals In Optical Fibers [5.5] 我々は、共存シナリオにおける主要な干渉機構について議論し、量子信号の品質への影響を定量化するためのモデルを提供する。
このモデルは帯域外非線形干渉効果、すなわち自発ラマン散乱(SpRS)と4波混合(FWM)を説明できる。
提案モデルでは,FWMが反伝播スキームに与える影響は無視できるが,特定のシナリオ下での共伝播スキームに関係があることが示されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:22:41 GMT)
Formal Analysis of Metastable Failures in Software Systems [5.4] 要求応答サーバシステムにおけるメタスタビリティの数学的基礎を提供する。
プログラムのセマンティクスを近似した連続時間マルコフ連鎖(CTMC)の構築方法を示す。
定性的視覚分析は, 現場で数ミリ秒間観測された多くの転移能を捉え, 予測することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:44:07 GMT)
Reward Model Routing in Alignment [5.4] ほとんどのパイプラインは単一の報酬モデル(RM)に依存しており、アライメントの品質を制限し、過度に適合するリスクがある。
最近の研究は、RMルーティング、すなわち、候補プールからRMを動的に選択し、相補的な強度を活用することを探っている。
オフラインのRM強度学習とオンラインベイズ選択を組み合わせたハイブリッドルーティングフレームワークであるベイズベクトルを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:37:59 GMT)
Highly Efficient and Effective LLMs with Multi-Boolean Architectures [5.3] 大型言語モデル(LLM)の複雑さを軽減するための有望な戦略として、重み二項化が登場した。
既存のアプローチは、単純だが重大なパフォーマンス損失を引き起こす訓練後二項化と、完全精度の潜伏重みに依存し、複雑さと制限効率を追加するトレーニング対応の方法に該当する。
本稿では,マルチカーネルBooleanパラメータでLLMを表現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:53:05 GMT)
Bridging LLM Planning Agents and Formal Methods: A Case Study in Plan Verification [5.2] 我々は、自然言語計画と予測行動の整合性を評価するための新しい枠組みを、クリプキ構造と線形時間論理(LTL)に変換することによって導入する。
このフレームワークをPlanBench計画検証データセットの簡易バージョンで体系的に評価し、精度、精度、リコール、F1スコアなどの指標について報告する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:46:55 GMT)
Neural Posterior Estimation with Autoregressive Tiling for Detecting Objects in Astronomical Images [5.1] 今後の天文学的な調査では、夜空の高解像度画像が1ペタバイトにのぼる。
これらのオブジェクトのほとんどは暗く、多くの視覚的に他のオブジェクトと重なる。
本稿では,小物体検出の事例を解決するために,償却変分推論手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:01:34 GMT)
Comparing Exploration-Exploitation Strategies of LLMs and Humans: Insights from Standard Multi-armed Bandit Experiments [5.1] 大規模言語モデル(LLM)は、シーケンシャルな意思決定設定で人間の振る舞いをシミュレートしたり、自動化したりするために、ますます使われている。
我々は、不確実性の下での動的意思決定の基本的な側面である、探査・探索(E&E)トレードオフに焦点を当てる。
LLMにおける思考を可能にすることは、ランダムな探索と指向的な探索の混合によって特徴付けられる、より人間的な行動へと行動を変える。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:12:51 GMT)
ReeMark: Reeb Graphs for Simulating Patterns of Life in Spatiotemporal Trajectories [5.1] 基本データから学習したパターン・オブ・ライフ(PoL)を保存したトラジェクトリをシミュレートする新しいフレームワークであるMarkovian Reeb Graphsを紹介する。
われわれのアプローチは、日常生活における一貫性と多様性の両方を捉える現実的な軌跡を生成する。
これらの結果から,Markovian Reeb Graphsは多様な都市環境に適用可能な,スケーラブルなシミュレーションフレームワークとして位置づけられた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:25:11 GMT)
SCOPED: Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion [5.0] アウト・オブ・ディストリビューション(OOD)検出は、視覚、ロボット工学、強化学習などにおける機械学習システムの信頼性の高い展開に不可欠である。
SCOPED(Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion)を紹介する。
SCOPEDは、多様なデータセットでトレーニングされた単一の拡散モデルから計算され、モデルのスコア関数のジャコビアントレースと2乗ノルムを単一のテスト統計量に結合する。
4つのビジョンベンチマークでは、SCOPEDは計算コストの低いにもかかわらず、競合または最先端の精度リコールスコアを達成している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:22:32 GMT)
Observation-Free Attacks on Online Learning to Rank [5.0] 我々は、広く使われているオンライン学習アルゴリズムのいくつかを攻撃するための新しいフレームワークを提案する。
本フレームワークは,T-o(T)ラウンドのトップKレコメンデーションリストに表示されるようにターゲット項目のセットをプロモートすると同時に,学習アルゴリズムにおける線形後悔を同時に引き起こすように設計されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:37:46 GMT)
Attack via Overfitting: 10-shot Benign Fine-tuning to Jailbreak LLMs [5.0] 最近の研究では、10組の有害な質問応答ペアの微調整が、脱獄を成功させる可能性があることが示されている。
10組のQAペアしか持たない細調整でLLMをジェイルブレイクできることを実証した。
本手法は,攻撃効率と攻撃ステルスの両面で有意な優位性を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:10:27 GMT)
An Architecture for Spatial Networking [4.7] グラフを用いた空間ネットワークを実現するプログラミングモデルである $textitBifr"ost を導入する。
Bifr"ostは、コロケーションデバイスが直接通信する空間認識アプリケーションの新しいクラスを可能にする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:10:51 GMT)
Brain-Language Model Alignment: Insights into the Platonic Hypothesis and Intermediate-Layer Advantage [4.7] 近年、神経活動とモデルアライメントの研究が増加している。
我々は2023年から2025年にかけて発行された25fMRIによる研究を概観する。
我々の発見は、モデルと脳が抽象的な表現構造を共有できるという確固たる証拠を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:33:09 GMT)
AutoMaAS: Self-Evolving Multi-Agent Architecture Search for Large Language Models [4.7] AutoMaASは自己進化型マルチエージェントアーキテクチャ検索フレームワークである。
ニューラルネットワーク検索の原則を使用して、最適なエージェント構成を自動的に検出する。
1.0-7.1%の性能向上を実現し、最先端の手法と比較して推論コストを3~5%削減する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:57:07 GMT)
AgenticRAG: Tool-Augmented Foundation Models for Zero-Shot Explainable Recommender Systems [4.7] AgenticRAGはツール拡張基盤モデルと検索拡張生成を組み合わせた新しいフレームワークで、ゼロショットで説明可能なレコメンデーションを提供する。
提案手法では,外部ツールの実行,知識検索,チェーン・オブ・シークレット推論を統合して,自律的な推薦エージェントを作成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:52:37 GMT)
D2 Actor Critic: Diffusion Actor Meets Distributional Critic [4.7] D2ACは,オンライン上で表現的拡散政策を効果的に訓練するために設計された新しいモデルフリー強化学習(RL)アルゴリズムである。
その中核は政策改善の目標であり、典型的な政策勾配の高分散と時間経過によるバックプロパゲーションの複雑さを避ける。
この安定した学習プロセスは、我々の第2の貢献によって、ロバストな分布的批判によって可能となり、分布的RLとクリップされた二重Q-ラーニングを融合して設計する。
得られたアルゴリズムは非常に効果的で、ヒューマノイド、ドッグ、シャドウハンドを含む18のハードRLタスクのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:47:24 GMT)
Model-Agnostic Correctness Assessment for LLM-Generated Code via Dynamic Internal Representation Selection [4.5] 大規模言語モデル(LLM)は、コード生成において印象的な機能を示し、ソフトウェア開発プロセスにますます統合されています。
以前の研究は、LLMの内部表現がコード正確性を評価するための有意義な信号を符号化していることを示している。
本稿では,コード正当性評価において最も情報性の高い内部表現を動的に選択する,新しいモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:25:28 GMT)
Semantic Differentiation in Speech Emotion Recognition: Insights from Descriptive and Expressive Speech Roles [4.5] 音声感情認識(SER)は、人間とコンピュータの相互作用を改善するために不可欠である。
音声の文脈的内容を表す記述的意味論と、話者の感情状態を反映する表現的意味論とを区別する。
我々の発見は、人間とAIのインタラクションにおけるSERの応用を知らせ、よりコンテキスト対応のAIシステムへの道を開いた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:42:35 GMT)
2D Entanglement from a Twisted Motzkin Spaghetto [4.4] 同様の2次元エンタングルメント特性は、2次元格子上に埋め込まれた1次元鎖をツイストすることで実現できることを示す。
そのような2次元絡み合いを生成するための相互作用は、1次元高絡み合い鎖の結合配列によって以前の2次元構造よりもはるかに単純である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:23:04 GMT)
Quantum-amplified global-phase spectroscopy on an optical clock transition [4.4] 我々はホロノミック量子ゲートの概念を応用し、新しいRabi型グローバル位相分光法(GPS)を開発した。
我々は、レーザーノイズを減らさずに2.4(5)dBのメトロジカルゲインを達成するOLCにおいて、量子増幅時間逆分光を実証することができる。
本手法は, 測定分解能に制限されず, 絡み合う相互作用のグローバルな性質により容易にスケールでき, 典型的な実験的不完全性に対して高い弾力性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:02:12 GMT)
What is a protest anyway? Codebook conceptualization is still a first-order concern in LLM-era classification [4.3] 生成的大規模言語モデル(LLM)は現在、計算社会科学におけるテキスト分類に広く使われている。
我々は、概念化はLLM時代における一階の関心事であると主張している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:19:16 GMT)
Prototyping Digital Social Spaces through Metaphor-Driven Design: Translating Spatial Concepts into an Interactive Social Simulation [4.3] 我々は、ユーザーが新しいソーシャルメディア環境を想像し、探求するのに役立つメタファー駆動システムを導入する。
このシステムは,ユーザのメタファーをプラットフォーム機能の構造化セットに変換し,インタラクティブなシミュレーションを生成する。
我々はメタファ駆動のシミュレーションが、代替のソーシャルアーキテクチャをプロトタイピングするための強力な設計ツールになり得るかを論じて結論付けた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:43:35 GMT)
SoccerSynth-Detection: A Synthetic Dataset for Soccer Player Detection [4.2] Soccer Synth-Detectionは、合成サッカー選手を検出するために設計された最初の合成データセットである。
広い範囲のランダムな照明やテクスチャ、シミュレートされたカメラモーションのぼかしなどが含まれる。
本研究は,サッカービデオ解析の分野でのアルゴリズム学習において,実際のデータセットを置き換える合成データセットの可能性を示すものである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:17:52 GMT)
From Scope to Script: An Automated Report Generation Model for Gastrointestinal Endoscopy [4.2] 食道胃十二指腸内視鏡(EGD)や大腸内視鏡は消化管疾患(GI)の診断・管理に重要な役割を担っている。
本稿では,2段階のトレーニングフレームワークにおいて,トランスフォーマーベースの視覚エンコーダとテキストデコーダを利用する新たな自動レポート生成モデルを提案する。
当社のアプローチは,ドキュメンテーションプロセスの合理化だけでなく,医師の作業量削減や患者のケア改善にも有効である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:25:52 GMT)
Fine-tuning LLMs with variational Bayesian last layer for high-dimensional Bayesian optimization [4.1] 高い評価コストを伴うブラックボックス最適化問題は、サンプル効率でブラックボックス最適化問題を解く必要がある。
本稿では,高次元の入力変数から目的関数へのマッピングをモデル化するニューラルネットワークに基づくサロゲートを提案する。
提案した(ENS-)LoRA-VBLL手法の様々な高次元ベンチマークおよび実世界の分子最適化タスクにおける性能を実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:33:54 GMT)
VERNIER: an open-source software pushing marker pose estimation down to the micrometer and nanometer scales [4.0] 本稿では,疑似周期パターンに基づく高速かつ信頼性の高いポーズ計測を実現するために設計された,オープンソースの位相処理ソフトウェアであるVERNIERを提案する。
位相ベースの局所しきい値アルゴリズムのおかげで、ソフトウェアは特にノイズ、デフォーカス、閉塞に対して堅牢であることが証明された。
実装手順は、合成画像と実験画像で示される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:01:24 GMT)
Flip Distribution Alignment VAE for Multi-Phase MRI Synthesis [3.9] 多相CEMRI合成のための軽量機能分離型VAEモデルであるFlip Distribution Alignment Variational Autoencoder (FDA-VAE)を提案する。
FDA-VAEは入力画像とターゲット画像を標準正規分布と対称な2つの潜在分布に符号化する。
実験の結果,既存のディープオートエンコーダを用いたエンド・ツー・エンド合成法と比較して,FDA-VAEはモデルパラメータと推論時間を著しく短縮することがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:59:59 GMT)
XBreaking: Explainable Artificial Intelligence for Jailbreaking LLMs [3.9] 大規模言語モデルは、AIソリューションが支配する現代のIT業界における基本的なアクターである。
本稿では、検閲されたモデルと検閲されていないモデルの振る舞いを比較分析して、ユニークな利用可能なアライメントパターンを導出する説明可能なAIソリューションを提案する。
そこで我々は,これらのユニークなパターンを利用して,ターゲットノイズ注入によるLLMのセキュリティ制約を破る,新しいジェイルブレイク攻撃であるXBreakingを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:07:13 GMT)
Fixing That Free Lunch: When, Where, and Why Synthetic Data Fails in Model-Based Policy Optimization [3.9] 本稿では, モデルベースポリシー最適化(MBPO)に注目した。
結果のフェールモードに対処することで、以前は達成不可能だったポリシーの改善が可能になることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:23:36 GMT)
Reasoning-based Anomaly Detection Framework: A Real-time, Scalable, and Automated Approach to Anomaly Detection Across Domains [3.8] Reasoning based Anomaly Detection Framework (RADF) は、非常に大きなデータセットでリアルタイムな異常検出を行うように設計されている。
RADFは9つの公開ベンチマークデータセットのうち5つで、AUCのパフォーマンスにおける最先端の異常検出モデルを上回っている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:06:31 GMT)
GCVAMD: A Modified CausalVAE Model for Causal Age-related Macular Degeneration Risk Factor Detection and Prediction [3.8] 加齢黄斑変性は眼科における永久視障害の最も主要な原因の1つである。
深層学習に基づく手法、特に注意機構に基づくCNNとGradCAMによるCTスキャンによるXAI分析は、AMD網膜と正常網膜の区別に成功している。
本稿では,新しい因果的AMD解析モデルであるGCVAMDを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:27:55 GMT)
OptunaHub: A Platform for Black-Box Optimization [3.8] ブラックボックス最適化はAutoMLやMaterial Informaticsのようなドメインの進歩を駆動する。
BBOメソッドとベンチマークを集中化するコミュニティプラットフォームであるOpsunaHubを紹介します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:11:36 GMT)
A semiconcavity approach to stability of entropic plans and exponential convergence of Sinkhorn's algorithm [3.7] エントロピック最適輸送問題に対するシンクホーンアルゴリズムのバウンダリと収束の安定性について検討する。
新しい用途には、部分空間の弾性コスト、弱対数対数辺縁、軽い尾を持つ辺縁などがある。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:20:09 GMT)
Adversarial Reinforcement Learning for Offensive and Defensive Agents in a Simulated Zero-Sum Network Environment [3.6] 本稿では,カスタムOpenAI Gym環境によるネットワークセキュリティにおける敵強化学習の制御に関する研究について述べる。
環境は、バックグラウンドトラフィックノイズ、プログレッシブ・エクスプロイト・メカニクス、IPベースの回避戦術、ハニーポットトラップ、レート制限防衛など、現実的なセキュリティトレードオフを捉えている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:53:51 GMT)
Multimodal Carotid Risk Stratification with Large Vision-Language Models: Benchmarking, Fine-Tuning, and Clinical Insights [3.5] 本研究では,マルチモーダル頸動脈プラーク評価のための最先端および最近の大規模視覚言語モデル (LVLM) の可能性について検討した。
インタビュースタイルの質問シーケンスを通じて現実的な診断シナリオをシミュレートするフレームワークを提案する。
実験の結果、LVLMが非常に強力であるとしても、すべてのLVLMが画像のモダリティと解剖を正確に識別できるわけではないことが判明した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:48:12 GMT)
CryptOracle: A Modular Framework to Characterize Fully Homomorphic Encryption [3.5] 本稿では,FHE のオープンソースライブラリ OpenFHE の詳細な特徴について述べる。
我々は,(1)ベンチマークスイート,(2)ハードウェアプロファイラ,(3)予測性能モデルからなるモジュラー評価フレームワークであるCryptOracleを紹介する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:30:29 GMT)
Universal trade-off between irreversibility and intrinsic timescale in thermal relaxation with applications to thermodynamic inference [3.5] 我々は,Kulback-Leibler分散とLogarithmic-Sobolev定数に基づくエントロピー生成率の一般下界を確立する。
熱緩和に適用すると、放散速度と本質緩和時間スケールとの普遍的なトレードオフ関係が明らかになる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:59:41 GMT)
Smart-GRPO: Smartly Sampling Noise for Efficient RL of Flow-Matching Models [3.5] フローマッチングモデルは、画像の品質と人間のアライメントを改善するための重要なツールである強化学習には適していない。
フローマッチングモデルにおける強化学習のためのノイズ摂動を最適化する最初の方法であるSmart-GRPOを提案する。
この結果から,フローマッチングフレームワークにおける強化学習への実践的な道筋が示唆され,効率的なトレーニングと人的協調生成のギャップを埋めることができた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:13:17 GMT)
Multi-task neural diffusion processes for uncertainty-quantified wind power prediction [3.5] グリッド統合と信頼性の高い風力発電運用には,不確実性を考慮した風力発電予測が不可欠である。
我々は,関数上の分布を学習するニューラル拡散過程(NDP)を応用し,風力予測のためのマルチタスクNDP(MT-NDP)フレームワークに拡張する。
実監督管理・データ取得(SCADA)データにおけるNDPの実証評価を行った。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:26:23 GMT)
Real Time Headway Predictions in Urban Rail Systems and Implications for Service Control: A Deep Learning Approach [3.3] 本研究では,地下鉄全線を横断する列車の走行経路の複雑な伝搬を予測するためのディープラーニングフレームワークを提案する。
提案手法は,計画された終端ヘッドウェイを過去のヘッドウェイデータと共に重要な入力として直接組み込むことで,将来のヘッドウェイのダイナミクスを正確に予測する。
このフレームワークは、ディスパッチ戦略を最適化する強力な計算効率のツールを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:50:01 GMT)
Ultra-Efficient Decoding for End-to-End Neural Compression and Reconstruction [3.2] ベクトル量子化を用いたオートエンコーダに低ランク表現を組み込んだ新しい圧縮再構成フレームワークを開発した。
画像の学習遅延表現に対して,一連の計算効率のよい低ランク演算を行うことで,高画質で効率的にデータを再構成できることを実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:35:44 GMT)
Domain Generalization for Semantic Segmentation: A Survey [3.2] ドメイン一般化(DG)の動的領域が出現した。
DG法は、複数の異なる未知のターゲットドメインをまたいで一般化することを目的としている。
この調査は、領域の一般化研究を推進し、科学者に新たな研究方向を探求することを目的としている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:17:41 GMT)
New Junction Condition and Casimir effect for Network CFT [3.2] NCFTの重要な側面は、ネットワークのノードで異なるエッジでCFTを接続する方法である。
代わりに、ノードで連続となるスカラー場の正規微分を必要とする新しいジャンクション条件を導入する。
正規ポリヘドラーによって形成されるネットワークにおける従来の接合条件と新しい接合条件の両方を用いて、カシミール効果を解析する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:10:07 GMT)
SAE-RNA: A Sparse Autoencoder Model for Interpreting RNA Language Model Representations [3.2] 本稿では,RiNALMoの表現を分析し,それを既知のヒトレベルの生物学的特徴にマッピングする解釈可能性モデルであるSAE-RNAを提案する。
我々の研究は、RNAの解釈可能性について、エンド・ツー・エンドのリトレーニングなしで、事前訓練された埋め込みにおける概念発見として捉えている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:34:59 GMT)
Disentangling Recall and Reasoning in Transformer Models through Layer-wise Attention and Activation Analysis [3.2] モデル一般化の予測には推論からのリコールの排除が不可欠である。
我々は、制御された合成言語パズルのデータセットを使用して、層、頭、ニューロンレベルでトランスフォーマーモデルを探索する。
この結果から、リコールと推論は変換器モデルにおける分離可能だが相互作用する回路に依存しているという最初の因果的証拠が得られた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:13:06 GMT)
Extending Mean-Field Variational Inference via Entropic Regularization: Theory and Computation [3.1] 変分推論 (VI) は高次元ベイズモデルに対する近似推論の一般的な方法として登場した。
エントロピー正則化を通したナイーブ平均場を拡張する新しいVI法を提案する。
我々は,$Xi$-variational rearsが真の後縁依存性を効果的に回復することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:52:15 GMT)
Improved Search-to-Decision Reduction for Random Local Functions [3.0] $d$-ary predicate $P$で定義されるランダム局所関数は、各出力ビットが入力のランダムに選択されたビットに$P$を印加することで計算される関数である。
本稿では,任意の定数の述語によって定義されるランダム局所関数に対する新しい探索-決定還元法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:39:01 GMT)
OpenStaxQA: A multilingual dataset based on open-source college textbooks [3.0] 本稿では,英語,スペイン語,ポーランド語の43のオープンソース大学教科書をベースとした,大学レベルの教育応用に特化した評価ベンチマークOpenStaxQAを提案する。
我々は、量子化低ランクアダプタ(QLoRa)を用いて、このデータセットに約70億のパラメータを持つ大規模言語モデルを精査し、評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:16:55 GMT)
Conditional Independence of 1D Gibbs States with Applications to Efficient Learning [2.9] 熱平衡におけるスピン鎖は, 個々の領域が近傍に強く相関する相関構造を持つことを示す。
これらの測度が任意の正の温度で超指数的に崩壊することを証明している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:21:22 GMT)
Investigating The Smells of LLM Generated Code [2.9] 大きな言語モデル(LLM)は、プログラムコードを生成するためにますます使われています。
本研究では,LLM生成コードの品質を評価するシナリオベース手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:09:55 GMT)
Using Preformed Resistive Random Access Memory to Create a Strong Physically Unclonable Function [2.9] 本稿では,Resistive Random Access Memory (ReRAM) PUFベースのプロトコルを提案する。
最後に,本プロトコルをPhysical ReRAMデバイス上でハードウェア上で実験し,PUFとして優れた性能特性を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:44:26 GMT)
Net2Net: When Un-trained Meets Pre-trained Networks for Robust Real-World Denoising [2.9] Net2Netは、非教師付きDIPと教師付き事前訓練モデルDRUNetの組み合わせである。
トレーニングされていないネットワークは、ラベル付きデータを必要とせずに、各入力画像のユニークなノイズ特性に適応する。
トレーニング済みのネットワークは、大規模なデータセットから学んだ表現を活用して、堅牢なノイズ付けパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:34:24 GMT)
STORI: A Benchmark and Taxonomy for Stochastic Environments [2.9] Reinforcement Learning (RL)技術は、Atari100kのようなシミュレーションベンチマークで素晴らしいパフォーマンスを達成した。
現実のシステムはノイズの多い観測、予測不可能な力学、非定常状態を含むため、中心的な障害は環境性である。
本稿では,環境の包括的5種類の分類法を提案し,最先端のモデルベースRLアルゴリズムの系統的脆弱性を実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:53:07 GMT)
Can Machines Philosophize? [2.8] チューリングテストに触発されて,機械の集団が人間の集団の哲学的見解を反映する範囲を評価する新しい枠組みを提案する。
この枠組みは, (i) 集団内の各人間を同一視するように指示する機械, (i) 背景と信念を反映する機械, (ii) 人間と機械の両方に対する様々な哲学的位置をカバーするアンケート, (iii) 結果の統計的分析という3つの段階から構成される。
機械の集団の哲学的見解は、物理学者か科学哲学者かに関わらず、平均して、人間の集団によって支持されているものと類似していることを明らかにする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:00:29 GMT)
OT Score: An OT based Confidence Score for Source Free Unsupervised Domain Adaptation [2.7] 本稿では,新しい理論解析から得られた信頼度尺度である最適輸送(OT)スコアを紹介する。
OTスコアは直感的に解釈でき、理論的には厳密である。
これは、任意の対象の擬ラベルの任意の集合に対して原則化された不確実性推定を提供する。
トレーニング時間の再重み付けによってSFUDAのパフォーマンスを改善し、モデルパフォーマンスのための信頼性の高いラベルなしプロキシを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:01:59 GMT)
The Computational Complexity of Almost Stable Clustering with Penalties [2.7] 両次元の小さい測度において,$mathrmk-M SmallEANS$と$mathrmk-M SmallEDIAN$の安定(あるいは摂動耐性)インスタンスの複雑性について検討する。
ほぼ安定な$mathrmk-MsmallEANS$/$mathrmk-MsmallEDIAN$(罰則付き)の特別なケースは、時間内に解決可能であることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:15:12 GMT)
Congestion bounds via Laplacian eigenvalues and their application to tensor networks with arbitrary geometry [2.6] 我々は、$n$-vertex graph $G$の頂点を$n$-leafのルートツリー$mathcalB$の葉に埋め込む問題を考える。
我々は、グラフの異なる族における渋滞境界を、正規構造(ハイパーキューブと格子)、ランダムグラフ、量子回路のテンソルネットワーク表現と数値的に比較する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:58:40 GMT)
Flamed-TTS: Flow Matching Attention-Free Models for Efficient Generating and Dynamic Pacing Zero-shot Text-to-Speech [2.6] Flamed-TTSは、低計算コスト、低レイテンシ、高音声忠実度と豊富な時間的多様性を強調する新しいゼロショットテキスト音声合成フレームワークである。
本研究では,Flamed-TTSが最先端モデルを超え,可知性,自然性,話者の類似性,音響特性の保存,動的ペースについて検討した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:36:55 GMT)
Morphlux: Transforming Torus Fabrics for Efficient Multi-tenant ML [2.5] Morphluxはサーバ内のアクセラレータを相互接続するための、サーバスケールのプログラマブルフォトニックファブリックである。
Morphluxによる最先端のトーラスベースMLデータセンタの拡張により,テナント計算割り当ての帯域幅を最大66%向上できることを示す。
これらの性能の利点を実証するために,Morphlux の新たなエンドツーエンドハードウェアプロトタイプを開発した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:31:59 GMT)
Neural Jump ODEs as Generative Models [2.5] 本稿では,ITOプロセスの生成モデルとしてニューラルジャンプODE(NJODE)をどのように利用できるかを検討する。
固定された伊藤過程のサンプル(離散的な観察)を考えると、NJODEフレームワークはプロセスのドリフトと拡散係数を近似するのに使うことができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:43:12 GMT)
Complementarity Reveals Entanglement Sharing in Sequential Quantum Measurements [2.4] 絡み合いの共有は、複数の古典的相関指標が同時に閾値を超えたときに決定的に証明される。
これらの結果から,測定障害と相補的相関回復との間に重要なトレードオフが認められた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:22:40 GMT)
The Challenges of Hyperparameter Tuning for Accurate Causal Effect Estimation [2.4] 因果推論には多くのML手法(因果推定器)が提案されている。
非因果予測タスクでは、メトリクスのチューニングの選択にはコンセンサスがあり、モデルの比較が簡単になる。
因果推論タスクについては、そのようなコンセンサスにはまだ到達していないため、因果モデルの比較は困難である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:33:14 GMT)
Repairing Leaks in Resource Wrappers [2.4] 本論文は,ラッパーの存在下で,資源リークの修復を改善するために,4つの重要な貢献を行う。
リソース管理仕様の推論を修復パイプラインに統合する。
検出ツールは根本原因に近い問題を報告し、多くの場合、ラッパークラス自体よりもリソースラッパーのクライアントに報告する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:34:19 GMT)
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model [2.3] そこで本研究では,20万名の医師と医師のQ&Aペアと,90万名の医療雑誌のクロールコーパスの60%を新たに収集したデータセットについて紹介した。
パラメータ効率の良い微調整手法を用いて,ベースラインモデルの医学的知識を高めた。
ベンチマーク評価により, 微調整モデルにより, 医療質問応答の精度が向上することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:00:50 GMT)
Variance Reduction and Low Sample Complexity in Stochastic Optimization via Proximal Point Method [2.3] このような保証は、有界分散というより弱い仮定の下でも達成できることを示す。
この方法は、本質的に分散を減少させるサブプロブレムソルバと、信頼性を高信頼な結果に増幅する確率ブースターを組み合わせる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:41:01 GMT)
TravelBench : Exploring LLM Performance in Low-Resource Domains [2.3] 実世界のシナリオから匿名化されたデータを用いて、7つの共通NLPタスクにまたがる14の旅行領域データセットをキュレートした。
各種タスクにおけるLCMの精度,スケーリング行動,推論能力について報告する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:44:34 GMT)
ELMF4EggQ: Ensemble Learning with Multimodal Feature Fusion for Non-Destructive Egg Quality Assessment [2.3] 本稿では,卵のグレードと鮮度を分類するためにマルチモーダルな特徴融合を利用するアンサンブル学習フレームワークであるELMF4EggQを紹介する。
我々の知る限りでは、外的かつ非侵襲的な特徴のみを用いて、内部卵質評価に機械学習手法を適用した初めての研究である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:34:14 GMT)
Joint Bidding on Intraday and Frequency Containment Reserve Markets [2.2] 再生可能エネルギー統合が供給変動性を増加させるにつれて、バッテリエネルギー貯蔵システム(BESS)は供給と需要のバランスをとるための実行可能なソリューションを提供する。
本稿では,複数の電力市場におけるバッテリBESSの関与を最適化するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:48:21 GMT)
Generalization of Graph Neural Network Models for Distribution Grid Fault Detection [2.2] 本稿では、RNN+GNNパイプラインモデルにおいて、様々なグラフニューラルネットワーク(GNN)を体系的にベンチマークする。
我々の知る限り、我々は(i)最初にグラフSAGEとグラフアテンション(GAT, GATv2)をRGNNで断層診断に使用することを提案しました。
IEEE 123ノード分散ネットワークの実験結果から, RGATv2はより優れた一般化能力を有することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:46:31 GMT)
Quantitative Convergence Analysis of Projected Stochastic Gradient Descent for Non-Convex Losses via the Goldstein Subdifferential [2.2] 本稿では,非同相収束測度に対する予測分散低減法の解析について述べる。
収束は、制約によるSGDゴールドスタイン部分微分勾配への勾配である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:35:42 GMT)
Searching for the Most Human-like Emergent Language [2.2] 我々は、人間の言語と類似性の観点から、最先端の創発言語を生成する。
XferBenchは、人間の言語へのディープラーニング学習の適性を測定する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:45:01 GMT)
Morpheme Induction for Emergent Language [2.2] CSARは、並列発話と意味の創発言語コーパスから形態素を誘導するアルゴリズムである。
手続き的に生成されたデータセットで検証され、関連するタスクのベースラインと比較される。
我々は,一握りの創発言語を分析し,同義語や多意味語の程度などの言語的特徴を定量化する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:59:53 GMT)
The Narcissus Hypothesis: Descending to the Rung of Illusion [2.1] 我々は,モデルが客観的推論よりも満足あるいは平らな反応を好むという仮説を検証した。
その結果、社会的に適合する形質への大きな流れが明らかとなった。
次に、再帰が高次推論を崩壊させる可能性をトレースする、新しい解釈を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:36:03 GMT)
C2|Q>: A Robust Framework for Bridging Classical and Quantum Software Development [2.1] ハードウェアに依存しない量子ソフトウェア開発フレームワークC2|Q>を提案する。
古典的な仕様(コード)を量子実行可能プログラムに変換する。
このフレームワークは、ワークフローを3つのコアモジュールに分類することで、モジュール化されたソフトウェアエンジニアリングの原則を適用します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:43:51 GMT)
Refined Iterated Pareto Greedy for Energy-aware Hybrid Flowshop Scheduling with Blocking Constraints [2.1] 製造業セクターは、エネルギーの最大の消費国の一つとして、この課題から除外されていない。
エネルギー効率の高いスケジューリングは、製造会社を惹きつけ、迅速な展開が可能で、すぐに影響を示すことができるため、消費を減らす方法である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:52:20 GMT)
Oracle-based Uniform Sampling from Convex Bodies [2.1] 我々は新しいマルコフ連鎖モンテカルロアルゴリズムを提案し、凸体上の一様分布をK$とする。
提案アルゴリズムは,Gibsサンプリングを用いたAlternating Smpling Framework/proximal samplerに基づく。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:21:05 GMT)
OpenZL: A Graph-Based Model for Compression [2.0] モジュラーコーデックの有向非巡回グラフとして圧縮を表現するための新しい理論的枠組みを提案する。
これは、データを自己記述型のワイヤフォーマットに圧縮する、このモデルの実装であるOpenZLを動機付けている。
OpenZLは最先端の汎用圧縮機に比べて圧縮率と速度が優れている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:40:29 GMT)
Resource theory of asymmetric distinguishability with partial information [2.0] 最悪の量子分岐は、量子情報の鍵となる尺度である。
非対称微分可能性の資源理論の観点から、発散が理解可能であることを示す。
このフレームワークを部分的な情報を備えた設定に拡張します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:42:55 GMT)
Quantum simulation of a noisy classical nonlinear dynamics [2.0] 本稿では,2次非線形性を持つ散逸微分方程式系によって記述された非線形力学をシミュレーションするエンドツーエンドの量子アルゴリズムを提案する。
我々のアルゴリズムは、厳密な近似誤差を持つ$O(1)$変数に依存する任意の相関関数の期待値を近似することができる。
我々の知る限り、これはJgg lambda$ の強い非線形システムを$N$ および $t$ のコスト多元対数でシミュレートできる最初の厳密な量子アルゴリズムである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:29:50 GMT)
Grounding Large Language Models in Clinical Evidence: A Retrieval-Augmented Generation System for Querying UK NICE Clinical Guidelines [2.0] 本稿では,Large Language Models (LLMs) を用いたNICE (National Institute for Health and Care Excellence) 臨床ガイドラインを検索するための検索型生成システムの開発と評価について述べる。
このシステムの検索アーキテクチャは,300のガイドラインから抽出した10,195個のテキストチャンクのデータベースに対して,ハイブリッドな埋め込み機構によって構成されている。
平均相反ランク(MRR)が0.814、第1チャンクで81%、検索チャンクで99.1%のリコールが7901クエリで評価されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:57:13 GMT)
CrossLag: Predicting Major Dengue Outbreaks with a Domain Knowledge Informed Transformer [1.9] 環境に配慮したCrossLagを導入し、データ内の重要な事象の背後にある内因性シグナルを遅延させることを可能にします。
提案モデルでは,24週間の予測ウィンドウ上でのシンガポールのデング大流行の検出と予測において,TimeXerよりかなり優れていた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:30:31 GMT)
Relevance-Aware Thresholding in Online Conformal Prediction for Time Series [1.9] オンラインコンフォーマル予測(OCP)は、時間とともにデータ分散がシフトする問題に対処するオプションである。
本稿では,2値評価(内/外)をより広範な機能クラスに置き換えることにより,しきい値更新ステップの強化を提案する。
このアプローチは、急激な閾値変化を防止し、予測間隔を狭める可能性がある。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:31:14 GMT)
Real-Time Threaded Houbara Detection and Segmentation for Wildlife Conservation using Mobile Platforms [1.9] 自然環境におけるリアルタイムの動物検出とセグメンテーションは野生生物の保護に不可欠であり、遠隔カメラストリームによる非侵襲的なモニタリングを可能にする。
YOLOv10ベースの検出とMobileSAMベースのセグメンテーションを並列化するために,スレッド検出モデル(TDM)を統合したモバイル最適化2段階ディープラーニングフレームワークを提案する。
法原バスタードでは,0.9627,0.7731のmAP75,0.7178のmAP95,0.7421のMobileSAM mIoUが得られた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:25:58 GMT)
GaitGuard: Towards Private Gait in Mixed Reality [1.7] GaitGuardは、ビデオベースの歩行プロファイリングの脅威に対して、歩行プライバシーを保護するために設計された、新しいリアルタイムシステムである。
GitGuardはマルチスレッドフレームワークで動作し、効率的なストリームキャプチャ、ボディ検出、トラッキングのための専用のモジュールを組み込んでいる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:15:02 GMT)
Generalized Orders of Magnitude for Scalable, Parallel, High-Dynamic-Range Computation [1.7] ディープラーニングからファイナンスまで、多くのドメインは、長いシーケンスで実数を合成する必要がある。
我々は、浮動小数点数を特別なケースとして組み込んだ従来の等級の等級を原則的に拡張した一般化等級数(GOOMs)を導入する。
我々は、GPUなどの並列ハードウェア上でのネイティブ実行をサポートするために、GOOMと効率的なカスタムパラレルプレフィックススキャンを実装している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:38:26 GMT)
ExplainRec: Towards Explainable Multi-Modal Zero-Shot Recommendation with Preference Attribution and Large Language Models [1.7] 大規模な言語モデル(LLM)ベースのレコメンデーション機能を拡張するフレームワークであるExplainRecを紹介します。
このフレームワークは、説明可能なレコメンデーションのための選好属性チューニング、コールドスタートユーザとアイテムのためのゼロショット選好転送、ビジュアルコンテンツとテキストコンテンツを活用したマルチモーダルエンハンスメント、マルチタスク協調最適化を含む。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:09:41 GMT)
RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization [1.6] 安全クリティカルな領域では、オフライン強化学習は魅力的な代替手段を提供するが、政策が破滅的な下尾リスクを伴わずに高いリターンをもたらす場合のみである。
本稿では,bfRisk-Aware Multimodal Actor-Critic (RAMAC)フレームワークを紹介する。
拡散およびフローマッチングアクターでRAMACをインスタンス化し、ほとんどのD4タスクで強いリターンを維持しながら、$mathrmaR_0.1$で一貫した利得を観察する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:22:21 GMT)
A Multi-Layer Electronic and Cyber Interference Model for AI-Driven Cruise Missiles: The Case of Khuzestan Province [1.6] 本稿では,AI誘導巡航ミサイルの性能を著しく低下させるため,電子戦,サイバー攻撃,詐欺戦略を含む多層干渉モデルを提案する。
実験の結果,400個のシミュレーションが4つのシナリオにまたがって実行され,統合された多層アプローチを用いた場合の顕著な改善が示された。
提案フレームワークは、深層強化学習に基づく防衛コーディネータを用いて、EW、サイバー、詐欺の最適設定をリアルタイムで適応的に選択する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:24:29 GMT)
Spatial-ViLT: Enhancing Visual Spatial Reasoning through Multi-Task Learning [1.6] 視覚言語モデル(VLM)は高度なマルチモーダル推論を持つが、3Dシーンや複雑なオブジェクト構成の空間的推論では依然として課題に直面している。
本研究では,深度マップ,3次元座標,エッジマップなどの空間的特徴をマルチタスク学習フレームワークを通じて統合する拡張VLMであるSpatialViLTを紹介する。
本研究では,SpatialViLTとMaskedSpatialViLTの2つの変種を提案する。
我々のモデルは、視覚空間推論(VSR)データセットで示されるように、方向、位相、近接関係などの空間的推論のカテゴリで優れている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:04:15 GMT)
Wasserstein Bounds for generative diffusion models with Gaussian tail targets [1.5] 本稿では,データ分布とスコアベース生成モデルの生成の間のワッサースタイン距離を推定する。
データ分布のガウス型テール挙動と、スコアの正確な近似を$epsilon$-accurate approximationと仮定する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:09:12 GMT)
Zero-Shot Robustness of Vision Language Models Via Confidence-Aware Weighting [1.5] 視覚言語モデルにおけるゼロショットロバスト性を高めるために,信頼性を考慮した重み付け(CAW)を提案する。
CAWは,(1)不確実な敵の事例を優先する信頼と認識の喪失と,(2)意味的整合性を維持する特徴的アラインメント正規化の2つの構成要素から構成される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:36:02 GMT)
Not every day is a sunny day: Synthetic cloud injection for deep land cover segmentation robustness evaluation across data sources [1.5] 土地被覆セマンティックセグメンテーション(LCS)のための改良されたディープラーニングは、ラベル付き衛星データに依存している。
既存のSentinel-2データセットのほとんどはクラウドフリーであり、雲が一般的である熱帯地域での有用性を制限している。
我々は,現実的な雲の覆いをシミュレートするクラウドインジェクションアルゴリズムを開発し,雲に妨害された光学画像によって生じるギャップをSentinel-1レーダーデータがどのように埋めるかを検証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:51:35 GMT)
A fast non-reversible sampler for Bayesian finite mixture models [1.4] 有限混合モデルに対する新規で単純な非可逆的サンプリング手法を提案する。
提案した非可逆スキームの性能は, 標準スキームよりも悪くはならないことを示す。
また, 混合モデルの統計的特徴が, 非可逆離散サンプリング器の使用に最適である理由についても論じる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:57:44 GMT)
Primus: A Pioneering Collection of Open-Source Datasets for Cybersecurity LLM Training [1.4] 大規模言語モデル(LLM)は、金融、法律、医学などの専門分野において顕著な進歩を見せている。
本稿では,プレトレーニング,命令微調整,蒸留の推論など,すべての主要な訓練段階をカバーする包括的なデータセットについて紹介する。
データセットの継続事前トレーニングでは、集計スコアが15.9%向上し、蒸留の推論は15.8%向上した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:53:53 GMT)
Uncertainty Quantification In Surface Landmines and UXO Classification Using MC Dropout [1.4] 本研究では,表面地雷およびUXO分類のための微調整されたResNet-50アーキテクチャに統合されたモンテカルロ・ドロップアウト(MC)による不確実性定量化の考え方を紹介する。
クリーンで逆向きに摂動し、ノイズの多いテスト画像に対する実験結果は、モデルが困難な条件下で信頼できない予測をフラグする能力を示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:01:22 GMT)
A UAV-Based VNIR Hyperspectral Benchmark Dataset for Landmine and UXO Detection [1.4] 本稿では,無人航空機(UAV)プラットフォームで得られた可視・近赤外(VNIR)ハイパースペクトル画像のベンチマークデータセットについて紹介する。
データセットは、表面、部分的に埋もれ、完全に埋まった構成を含む143個のリアルな代理地雷とUXOターゲットでシードされた制御された試験フィールド上で収集された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:40:52 GMT)
SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation [1.4] SkillFormerは、統合されたマルチビューの熟練度推定のためのパラメータ効率の高いアーキテクチャである。
マルチヘッド・クロスアテンション、学習可能なゲーティング、適応的な自己校正を使って、ビュー特有の特徴を融合する。
マルチビュー設定で最先端の精度を実現し、計算効率を著しく向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:48:51 GMT)
PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment [1.4] PATSは、多視点スキルアセスメントのための連続時間セグメント内の完全な基本動作を保存する。
PATSは動画を適応的に分割し、分析された各部分が重要なパフォーマンスコンポーネントの完全な実行を含むことを保証する。
PATSはすべての表示構成で最先端の精度を上回っている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:17:25 GMT)
Refactoring Towards Microservices: Preparing the Ground for Service Extraction [1.4] この記事では、依存関係を扱うことに集中して、アーキテクチャへの移行をサポートするように設計された7つのカタログを紹介します。
このカタログは、開発者に対して、文献の中で識別された統合と、コードレベルでプロセスを体系化する上で重要なギャップに対処する、システマティックなガイドを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:33:06 GMT)
Optimizing Container Loading and Unloading through Dual-Cycling and Dockyard Rehandle Reduction Using a Hybrid Genetic Algorithm [1.4] 本稿では,Quay Crane Dual-Cycling (QCDC) とドックのリハンドル最小化を統合することで,ポートでのコンテナハンドリングを最適化するNP-hard問題に対処する。
両側面を均等に最適化するハイブリッド遺伝的アルゴリズムであるQuay Crane Dual Cycle - Dockyard Rehandle Genetic Algorithm (QCDC-DR-GA)を提案する。
各種船体規模の実験により、QCDC-DR-GAは既存の方法と比較して、大型船の総運用時間を15~20%短縮することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:40:07 GMT)
FTTE: Federated Learning on Resource-Constrained Devices [1.3] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散デバイス間で協調的なモデルトレーニングを可能にする。
従来の同期および非同期FLアプローチは、異種大規模ネットワークにおいてストラグラーによる遅延と緩やかな収束に悩まされている。
本稿では,スパースパラメータ更新と安定度重み付けを用いた新しい半非同期FLフレームワークであるFTTE(Federated Tiny Training Engine)を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:36:09 GMT)
From Facts to Foils: Designing and Evaluating Counterfactual Explanations for Smart Environments [1.3] 本稿では,ルールベースのスマート環境に適した対実的説明の最初の形式化と実装について述べる。
本研究は,従来の因果的説明に対して発生した反事実を評価するためのユーザスタディである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:06:53 GMT)
Curl Descent: Non-Gradient Learning Dynamics with Sign-Diverse Plasticity [1.3] 学習力学は、基本的には非段階的な「カール」のようなコンポーネントを含む可能性があることを示す。
小さなカール項は元の解多様体の安定性を保ち、勾配降下と同様の学習力学をもたらす。
この結果から,多様な学習規則を通した堅牢な学習を支援することのできる,特定のアーキテクチャを同定した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:54:40 GMT)
Corrosion Risk Estimation for Heritage Preservation: An Internet of Things and Machine Learning Approach Using Temperature and Humidity [1.3] 本研究は,ロラ無線通信と接続したモノのインターネット・ハードウェア・システムを構築した。
温度と相対湿度データのみを用いて大気腐食率を予測する機械学習フレームワークを構築した。
この最小限のデータアプローチは、限られた監視リソースを持つ遺産サイトにとってスケーラブルで費用対効果がある。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:07:39 GMT)
Neuromorphic Deployment of Spiking Neural Networks for Cognitive Load Classification in Air Traffic Control [1.3] 本稿では,スパイキングニューラルネットワーク(SNN)のハードウェア実装を用いた実環境における認知負荷分類のためのニューロモーフィックシステム,空気交通制御(ATC)タスクを提案する。
オープンソースのデータセットから抽出されたEEGとアイトラッキング機能は、従来の機械学習モデルとSNNの両方をトレーニングし、評価するために使用された。
ニューロモルフィックハードウェアへの展開を可能にするため、モデルは量子化され、混合信号DYNAP-SEチップ上に実装された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:35:40 GMT)
Non-reciprocal Synchronization in Thermal Rydberg Ensembles [1.2] 室温のRydberg原子プラットフォームにおいて、光の一方向伝播が時間的に誘起される集団振動を媒介するスイッチとして機能することを示す。
熱-運動-結晶結合非対称性は、反伝播プローブと制御磁場によって実現され、持続的な振動を生成する。
これらの結果は、キラル量子光学の重要な洞察を与え、非平衡多体系における非相互装置のオンチップ統合を促進する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:05:41 GMT)
An Adaptive Responsible AI Governance Framework for Decentralized Organizations [1.2] 本稿では,世界規模の分散組織におけるレスポンシブルAI(RAI)ガバナンス活動の評価課題について検討する。
複数のビジネスユニットとAIユースケースで実施したRAIアセスメントは、RAIの実装を形成する4つの重要なパターンを明らかにします。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:55:48 GMT)
Excited, Skeptical, or Worried? A Multi-Institutional Study of Student Views on Generative AI in Computing Education [1.1] 我々は,23の教育機関のコンピュータプログラムに登録された410名の学生を対象に,多施設調査の結果を報告する。
あらゆる種類の学生が、元内に対する興奮、楽観、感謝を表明している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:34:44 GMT)
From high-frequency sensors to noon reports: Using transfer learning for shaft power prediction in maritime [1.1] 本稿では,伝達学習に基づく船体シャフトパワーの予測手法を提案する。
モデルは、船からの高周波データに基づいて訓練され、その後、他の船からの低周波の昼の報告で微調整される。
実験の結果、姉妹船では平均絶対誤差が10.6%、類似船では3.6%、異船では5.3%減少した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:47:16 GMT)
DeepGDel: Deep Learning-based Gene Deletion Prediction Framework for Growth-Coupled Production in Genome-Scale Metabolic Models [1.1] 本稿では,ゲノム規模メタボリックモデルを用いた遺伝子欠失予測手法を提案する。
提案フレームワークは、ディープラーニングアルゴリズムを利用して、シーケンシャルな遺伝子を学習、統合し、データ表現を代謝する。
実験により,提案手法の有効性を実証し,ベースライン法よりも大幅に改善した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:01:28 GMT)
Quantum sensing with discrete time crystals in the Lipkin-Meshkov-Glick Model [1.1] 離散時間結晶 (DTC) 相転移により, 場の強度を高精度に検出できることを示す。
我々の研究は、長距離相互作用を含むDTCにおける量子臨界性がどのように高度な量子センシング応用に活用できるかを包括的に理解している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:04:28 GMT)
Strengthening legal protection against discrimination by algorithms and artificial intelligence [1.0] 本論文は、欧州における差別的アルゴリズム決定に対する現行の法的保護を評価する。
この論文は、一般のルールではなく、セクター固有のルールを論じ、アルゴリズムによる意思決定を規制するアプローチの概要を述べている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:54:03 GMT)
Knowledge Graph-Guided Multi-Agent Distillation for Reliable Industrial Question Answering with Datasets [1.0] 産業質問応答システムは、汎用対話モデルよりも安全性と信頼性が要求される。
知識グラフ誘導型マルチエージェントシステム蒸留(KG-MASD)を提案する。
工業用QAデータセットの実験では、KG-MASDはベースラインの精度を2.4パーセントから20.1%改善している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:52:59 GMT)
Boundary Time Crystals: Beyond Mean-Field Theory [1.0] 境界時間結晶は、開量子系の熱力学極限における連続時間変換対称性を自発的に破る。
有限サイズの系では、境界時間結晶の長時間の進化は、広く用いられる平均場理論では捉えられない崩壊する振動を示す。
我々の研究は、周期的に駆動されるオープン量子系の力学を研究するための、遠距離場理論ツールを提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:09:17 GMT)
EconWebArena: Benchmarking Autonomous Agents on Economic Tasks in Realistic Web Environments [1.0] EconWebArenaは、現実的なWeb環境における複雑なマルチモーダル経済タスクにおいて、自律エージェントを評価するためのベンチマークである。
このベンチマークは、マクロ経済学、労働、金融、貿易、公共政策といった分野にまたがる82の権威あるウェブサイトから360のキュレートされたタスクで構成されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 05:54:30 GMT)
When Researchers Say Mental Model/Theory of Mind of AI, What Are They Really Talking About? [1.0] この位置紙は、現在の談話が真正コグニオンと洗練されたパターンマッチングを混同していると主張している。
人間の認知とAIアルゴリズムの同時貢献を認める相互ToMフレームワークに焦点を移すことを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:37:32 GMT)
Improved Monte Carlo Planning via Causal Disentanglement for Structurally-Decomposed Markov Decision Processes [1.0] 本稿では,MDPの時間的因果グラフを独立成分に分割するために,因果解離を利用した構造分解型MDP(SD-MDP)を提案する。
様々な物流および金融分野のベンチマークよりも優れた政策性能を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:08:38 GMT)
Using Fourier Analysis and Mutant Clustering to Accelerate DNN Mutation Testing [1.0] ディープニューラルネットワーク(DNN)突然変異解析は、テストセットの妥当性を評価するための有望なアプローチである。
本稿では,Fourier 解析を用いた変異検査を高速化する手法として DM# を提案する。
本研究は, DM#の突然変異試験における効果を平均28.38%, 平均で0.72%の誤り率で評価した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:36:42 GMT)
Demonstration of Fourier-domain Quantum Optical Coherence Tomography for a fast tomographic quantum imaging [1.0] 量子光コヒーレンス・トモグラフィ(Q-OCT)は、古典的なOCTよりもいくつかの実験用語で優れている。
セットアップ中の分解能劣化効果を補償する2つのジョイントスペクトル前処理アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:31:14 GMT)
A New Proof of the QNEC [1.0] 量子零エネルギー条件(QNEC)の簡易な証明を与える。
我々の証明は、エンタングリングカットに関する相対エントロピーの形状微分の明示的な公式に基づいている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:07:19 GMT)
CCD-Bench: Probing Cultural Conflict in Large Language Model Decision-Making [0.9] 大きな言語モデルは、合法的に異なる文化的価値システム間の明示的な衝突をナビゲートすることができる。
CCD-Benchは、文化的価値の対立の下で意思決定を評価するベンチマークである。
CCD-Benchは、孤立バイアス検出以上の評価を多元的意思決定にシフトする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:55:37 GMT)
Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs [0.9] textbfCross-lingual textbfBackdoor textbfATtacks (X-BAT) in multilingual Large Language Models (mLLMs) について検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:24:33 GMT)
Advanced Clustering Techniques for Speech Signal Enhancement: A Review and Metanalysis of Fuzzy C-Means, K-Means, and Kernel Fuzzy C-Means Methods [0.9] 音声信号処理は、ノイズの多い環境での音声データの明瞭さと理解性を改善する。
音声認識の質は、テクノロジー駆動通信におけるユーザ体験とアクセシビリティに直接影響を及ぼす。
本稿では,高度なクラスタリング手法,特にKFCM(Kernel Fuzzy C-Means)法について検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:04:34 GMT)
TPM-Based Continuous Remote Attestation and Integrity Verification for 5G VNFs on Kubernetes [0.8] 実行時にデプロイされるコア5Gコンポーネントに対して,TPM 2.0ベースの継続的リモート検査ソリューションを提案する。
オープンソースのKeylimeフレームワークを、ポッドレベルの測定を分離し、ポッドごとの整合性検証を可能にするカスタムIMAテンプレートと統合しています。
実験の結果,システムはリアルタイムで不正な修正を検知し,各ポッドの信頼状態をラベル付けし,詳細な監査ログを生成することがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:54:15 GMT)
The regulation of online political micro-targeting in Europe [0.8] 我々は、保護法、表現の自由、政治セクター固有のルールの広告の3つの分野に焦点をあてる。
我々は、一般データ保護規則の規則は必要だが十分ではないと主張している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:54:19 GMT)
DynBenchmark: Customizable Ground Truths to Benchmark Community Detection and Tracking in Temporal Networks [0.8] 新しいコミュニティ中心モデルが提案され、カスタマイズ可能なコミュニティ構造を生成する。
このベンチマークは、ノードの出現、消滅、コミュニティ間の移動が可能な、基盤となる時間ネットワークも生成する。
Pythonライブラリ、描画ユーティリティ、バリデーションメトリクスは、基礎真実と動的コミュニティを検出するアルゴリズムの結果を比較するために提供される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:02:22 GMT)
Studying the Korean Word-Chain Game with RLVR:Mitigating Reward Conflicts via Curriculum Learning [0.7] 検証可能な報酬を伴う強化学習(RLVR)は、より強力な推論能力を持つ大規模言語モデルを訓練するための有望なアプローチである。
ルール由来の報酬が自然に相反することを示し、カリキュラム学習方式がこれらの相反を緩和することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:00 GMT)
High-spin magnetic ground states of neutral dopant clusters in semiconductors [0.7] 高スピン状態は、古典的および量子情報ストレージと新興磁気メモリ技術に対して大きな約束を持っている。
本稿では,半導体の置換不純物から形成されるドーパントクラスターにおける高スピン磁気状態の工学的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:55:12 GMT)
Multi-scale Autoregressive Models are Laplacian, Discrete, and Latent Diffusion Models in Disguise [0.7] 反復リファインメントフレームワークのレンズを通して、Visual Auto Regressiveモデルを再考する。
我々はこれをラプラシア様式の潜伏ピラミッドを構成する決定論的前方過程として定式化し、学習された後方過程と組み合わせて少数の粗大なステップで再構成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:05:38 GMT)
Casimir Effect for Quantum Field theory in Networks [0.7] 本稿では,ネットワークで定義された量子場理論について考察する。
本稿では,ノード上の新しい接合条件を提案し,エネルギー保存と整合性を示す。
応用として,ネットワーク上のカシミール効果について検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:52:58 GMT)
Dissecting Transformers: A CLEAR Perspective towards Green AI [0.7] 本稿では、トランスアーキテクチャのコアコンポーネント間での推論エネルギーに関する、初めてきめ細かい実験分析を行う。
本研究では,マイクロ秒単位のコンポーネント実行とミリ秒単位のエネルギーセンサの監視の時間的ミスマッチを克服する手法を提案する。
本研究は、エネルギー効率の良いトランスモデルを構築するための最初のステップとして、コンポーネントレベルの詳細なエネルギーベースラインを確立し、洞察を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:33:07 GMT)
Mixture of Many Zero-Compute Experts: A High-Rate Quantization Theory Perspective [0.6] 本稿では、古典的な高速量子化理論を用いて、回帰タスクの混合・オブ・エキスパート(MoE)モデルに対する新たな洞察を提供する。
私たちのMoEは入力空間の領域へのセグメンテーションによって定義され、それぞれが定数予測器として機能する単一パラメータの専門家を持つ。
我々は,MoE学習における近似と推定誤差のトレードオフが,専門家の数に依存することを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:24:50 GMT)
To break, or not to break: Symmetries in adaptive quantum simulations, a case study on the Schwinger model [0.6] 適応型変分量子固有解器のための資源効率の高い演算器プールの構築における対称性の役割について検討する。
演算子プールの合計は11ドルである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:13:56 GMT)
Hierarchical Generalized Category Discovery for Brain Tumor Classification in Digital Pathology [0.6] 本稿では、階層的クラスタリングと対照的な学習を統合する新しいアプローチとして、階層的一般化カテゴリー発見による脳腫瘍分類(HGCD-BT)を紹介する。
我々はOpenSRHにおけるHGCD-BTの評価を行い、パッチレベルの分類のための最先端のGCD法よりも28%精度が向上した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:46:55 GMT)
Interfacing of an optical nanofiber with tunably spaced atoms in an optical lattice [0.6] 我々は、可変間隔の光学格子を用いて、多数の原子の光ナノファイバーへの効率的な対面を実験的に実証した。
格子ビームとナノファイバーからの反射は、全ての運動自由度で密閉するトラップ電位を与える。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:50:16 GMT)
Local Stability and Region of Attraction Analysis for Neural Network Feedback Systems under Positivity Constraints [0.5] フィードフォワードニューラルネットワーク(FFNN)により実現された静的非線形フィードバックを用いたLur'e形式の非線形システムの局所安定性について検討する。
正の系制約を利用することで、コンパクトな集合に制限された軌道の指数的安定性に十分な条件を与える Aizerman 予想の局所的変種を用いる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:24:15 GMT)
Neural Correlates of Language Models Are Specific to Human Language [0.5] 本研究は, 過去の結果がいくつかの懸念事項に対して堅牢であるかどうかを検証した。
結果は,従来の研究結果の確認と強化に寄与し,最先端の大規模言語モデルの生物学的妥当性と解釈可能性に関する議論に寄与する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:28:31 GMT)
Robust Stability Analysis of Positive Lure System with Neural Network Feedback [0.5] 線形部分がパラメトリック不確実性を含むだけでなく、非線形セクター境界も未知であるLur'e型の制御系を考える。
系の正の特性を利用することにより、Lur'e系の安定性半径の明示的な式を導出する。
本研究では,Lur'eとNN制御システムのロバストネス解析のためのスケーラブルで効率的な手法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:16:55 GMT)
IntrusionX: A Hybrid Convolutional-LSTM Deep Learning Framework with Squirrel Search Optimization for Network Intrusion Detection [0.5] 侵入検知システム(IDS)は、NSL-KDDのようなベンチマークデータセットにおいて、サイバー攻撃の進化、高次元トラフィックデータ、厳しいクラス不均衡により、永続的な課題に直面している。
IntrusionXは,局所的特徴抽出のための畳み込みニューラルネットワーク(CNN)と時間的モデリングのためのLong Short-Term Memory(LSTM)ネットワークを統合したハイブリッドディープラーニングフレームワークである。
パイプラインには厳密な前処理,階層化データ分割,動的クラス重み付けが組み込まれ,レアクラスの検出が促進される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:20:01 GMT)
Automatic Generation of Digital Twins for Network Testing [0.5] 本稿では,ディジタルツインの自動生成について検討し,効率的かつ正確な検証ツールを提供する。
本研究は, デジタル双生児の自動生成において, アプローチが実現可能であることを示す, 初期ユースケースに対する実験結果を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:43:11 GMT)
A Quantum-Secure Voting Framework Using QKD, Dual-Key Symmetric Encryption, and Verifiable Receipts [0.5] 本稿では、量子鍵分配(QKD)、デュアル鍵対称暗号化、検証可能なレセプト機構を統合した量子セキュア投票フレームワークを提案する。
このフレームワークにより、有権者は暗号化キーを安全に確立し、暗号化された投票を鋳造し、レシートベースの確認を通じて投票を検証できる。
結果は,低レイテンシと最小エラー率で大量の投票を効率的に処理できることを実証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:13:30 GMT)
A Lightweight Federated Learning Approach for Privacy-Preserving Botnet Detection in IoT [0.5] フェデレート学習に基づく軽量かつプライバシー保護のボットネット検出フレームワークを提案する。
このアプローチにより、分散デバイスは生データを交換することなく、協力的にモデルをトレーニングできる。
ベンチマークIoTボットネットデータセットの実験は、このフレームワークが通信コストを大幅に削減しつつ高い検出精度を達成することを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:54:58 GMT)
Coherent matter wave emission from an atomtronic transistor [0.4] 原子中性子三重井戸トランジスタは理論上、現在の利得を示し、コヒーレント物質波エミッタとして働くと予測される。
本研究では、三重井戸電位(ソース、ゲート、ドレイン)からなる原子性トランジスタのダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:01 GMT)
A Robust Clustered Federated Learning Approach for Non-IID Data with Quantity Skew [0.4] 本稿では, 各種非IID条件下での最先端CFLアルゴリズムの評価を行う。
またCORNFLQSという新しい反復型CFLアルゴリズムを提案する。
その結果,CORNFLQSは,QS摂動に対する強い強靭性とともに,精度とクラスタリング品質の両方において,最高評価を達成していることがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:23:43 GMT)
Short remarks on shallow unitary circuits [0.4] 線形システムサイズよりも小さい深さの局所的なユニタリ回路は、大域的ハール乱ユニタリと容易に区別できることを示す。
浅いユニタリ回路学習問題の定式化のための簡単なアルゴリズムについて説明する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:05:04 GMT)
InsideOut: An EfficientNetV2-S Based Deep Learning Framework for Robust Multi-Class Facial Emotion Recognition [0.4] 顔の感情認識(FER)は、人間とコンピュータの相互作用、eラーニング、医療、安全システムにおける応用を可能にする、感情コンピューティングにおける重要なタスクである。
InsideOutは、EfficientNetV2-S上に構築された再現可能なFERフレームワークで、転送学習、強力なデータ拡張、不均衡を考慮した最適化を行う。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:53:47 GMT)
Implémentation Efficiente de Fonctions de Convolution sur FPGA à l'Aide de Blocs Paramétrables et d'Approximations Polynomiales [0.4] フィールドプログラマブルゲートアレイ(FPGA)に畳み込みニューラルネットワーク(CNN)を実装することが、GPUに代わる有望な選択肢として浮上している。
本稿では、FPGAの実装を最適化し、利用可能なリソースに適応するために設計された畳み込みブロックのライブラリを提案する。
また、FPGA資源利用を予測する数学的モデルを開発するための方法論的フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:58:20 GMT)
Benchmark Dataset for Pore-Scale CO2-Water Interaction [0.4] データセットは624個の2Dサンプルで構成され、それぞれサイズは512x512で解像度は35mで、一定のCO2注入速度で100の時間ステップをカバーしている。
このデータセットは、機械学習モデルのベンチマークに不可欠な高解像度の時間的および空間的情報を提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:26:27 GMT)
ShikkhaChain: A Blockchain-Powered Academic Credential Verification System for Bangladesh [0.4] ShikkhaChainはブロックチェーンによる証明書管理プラットフォームで、学術的資格情報の安全な発行、検証、無効化を目的としている。
プロトタイプは信頼性の向上,検証時間の短縮,バングラデシュの国際的信頼性の向上を実証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:21:29 GMT)
Operating two exchange-only qubits in parallel [0.4] 線形配置で6個の量子ドットからなる2つの交換専用量子ビットの並列動作を示す。
また,iSWAPゲートとPauliスピンブロッキングリードアウト方式の実験実験を行った。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:12:11 GMT)
FSFSplatter: Build Surface and Novel Views with Sparse-Views within 3min [0.3] 自由なスパース画像から再構成すると、オーバーフィッティングやオーバーフィッティングが制限されるため、表面が貧弱になることが多い。
自由スパース画像からの高速表面再構成のための新しいアプローチであるFSFSplatterを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:17:00 GMT)
Wave-GMS: Lightweight Multi-Scale Generative Model for Medical Image Segmentation [0.3] Wave-GMSは、医用画像セグメンテーションのための軽量で効率的なマルチスケール生成モデルである。
Wave-GMSは2.6Mのトレーニング可能なパラメータしか必要とせず、クロスドメインの一般化性に優れた最先端セグメンテーション性能を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:53:16 GMT)
A Malliavin-Gamma calculus approach to Score Based Diffusion Generative models for random fields [0.3] スコアベース拡散生成モデル(SGM)を無限次元抽象ヒルベルト集合に一般化する。
データ分布のフィッシャー情報において,キャメロン=マーチンノルムが果たす役割を強調した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:50:53 GMT)
Truth-Aware Decoding: A Program-Logic Approach to Factual Language Generation [0.3] 本稿では,ニューラルネットワーク生成を知識ベースに整合させる検証指向の復号法であるTrath-Aware Decoding (TAD)を紹介する。
i) オラクルフィルタリングをプログラム論理的判断として表現する制約に基づくセマンティクス、(ii) 欲求選択が音と完全ガードの下で局所的可能性優位性を楽しむことの証明、(iii) 知識を意識した安全な質量を通じて事実的リスクを定量化するエントロピー型不変量である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:11:15 GMT)
Comparative Performance of Collaborative Bandit Algorithms: Effect of Sparsity and Exploration Intensity [0.3] 協調的盗賊は、武器(またはアイテム)間の関係を導入することにより、文脈的盗賊のパフォーマンスを向上させることを目的としている
本稿では,協調バンディットアルゴリズムの包括的解析を行い,その性能を徹底的に比較する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:18:05 GMT)
A Novel Unified Lightweight Temporal-Spatial Transformer Approach for Intrusion Detection in Drone Networks [0.2] 既存の侵入検知機構は、ドローンネットワークに必要な適応性、効率、一般化性を欠いていることが多い。
本稿では, TSLT-Netを提案する。TSLT-Netは, ドローンネットワークに特化して設計された, 軽量かつ統一化された時空間変圧器による侵入検知システムである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:23:21 GMT)
CST-AFNet: A dual attention-based deep learning framework for intrusion detection in IoT networks [0.2] 本研究は、IoTネットワークにおけるロバストな侵入検知のための新しいデュアルアテンションベースのディープラーニングフレームワークであるCST AFNetを提案する。
提案モデルでは,15種類の攻撃タイプと良性トラフィックの両方において,優れた精度を実現する。
CST AFNetは、複雑なIoTおよびIIoT環境において、リアルタイムのサイバー脅威検出のための強力でスケーラブルなソリューションであることを確認した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:36:19 GMT)
Estimation of Resistance Training RPE using Inertial Sensors and Electromyography [0.2] 本研究では,単腕ダンベルバイセップカール中のRPE推定における機械学習モデルの適用について検討した。
データは、ウェアラブル慣性筋電図センサ(EMG)から収集された。
その結果,ウェアラブルセンサを用いたRPE推定の可能性が示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:34:28 GMT)
The European Union general data protection regulation: what it is and what it means [0.2] 欧州連合の一般データ保護規則(「一般データ規制」)におけるデータ規制の戦略的アプローチと規範的基礎
論文はジェネシスについて、1995年の保護指令によって課された既存の要件を最もよく理解し、複雑化するものとして説明し、データ・データ・アプローチを記述し、規定について予測し、米国のプライバシー法の影響を強調している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:54:30 GMT)
FeDABoost: Fairness Aware Federated Learning with Adaptive Boosting [0.2] この研究は、非ID設定におけるフェデレートラーニング(FL)の性能と公平性の改善に焦点を当てている。
本稿では,動的ブースティング機構と適応勾配集約戦略を統合した新しいFLフレームワークFeDABoostを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:36:08 GMT)
Next Generation Ta-STJ Sensor Arrays for BSM Physics Searches [0.1] BeEST実験は超伝導トンネル接合(STJ)センサーを用いて標準模型(BSM)を超える物理を探索する。
パルスUVレーザーを用いて、実験中STJを20 meVの精度で校正する。
BeEST実験の第III相は,STJ間の系統的な校正誤差を明らかにした。
本研究では,BeEST実験の次フェーズにおける設計変更とSTJアレイ性能について考察する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:01:58 GMT)
ContraGen: A Multi-Agent Generation Framework for Enterprise Contradictions Detection [0.1] ContraGenは、エンタープライズドメインに適した矛盾を認識したベンチマークフレームワークである。
私たちの貢献には、リアルなエンタープライズ文書の作成、ビジネスプロセスに共通する矛盾タイプの分類をモデル化することが含まれます。
この研究は、エンタープライズ情報検索アプリケーションにおいて、より信頼性が高く説明可能なRAGシステムの基盤を確立する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:24:27 GMT)
Stimulus-Voltage-Based Prediction of Action Potential Onset Timing: Classical vs. Quantum-Inspired Approaches [0.1] 本稿では、APのオンセットを確率的事象として扱う量子インスパイアされたインテリジェンス・アンド・ファイア(QI-LIF)モデルを提案する。
従来の LIF モデルと QI-LIF モデルとの相対誤差を体系的に比較した。
以上の結果から,QI-LIFモデルは特に高強度刺激に対する予測誤差を著しく低減することが示された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:28:02 GMT)
Scalable multilingual PII annotation for responsible AI in LLMs [0.1] この研究は、13の未表現ローカライズにまたがる高品質なPIIアノテーションのために設計されたスケーラブルな多言語データキュレーションフレームワークを導入する。
我々のフェーズド・ヒューマン・イン・ザ・ループの方法論は、言語学の専門知識と厳格な品質保証を組み合わせることで、リコールと偽陽性率を大幅に改善する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:40:31 GMT)
From Dialect Gaps to Identity Maps: Tackling Variability in Speaker Verification [0.1] 本研究は, 話者識別システムの構築における主な課題について考察する。
これらのシステムの正確性と信頼性を高めるため、洗練された機械学習アプローチ、データ拡張戦術、方言固有の完全なコーパスの構築といったソリューションも提案されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:03:41 GMT)
Sequence-Preserving Dual-FoV Defense for Traffic Sign and Light Recognition in Autonomous Vehicles [0.1] 本研究では,米国における信号機と信号機のための二重FoV,シーケンス保存型ロバストネスフレームワークを提案する。
実生活における異常検出の応用に関する一連の実験において、本研究では、統一された3層防御スタックフレームワークの概要を概説する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:43:25 GMT)
Graph Neural Networks for Transmission Grid Topology Control: Busbar Information Asymmetry and Heterogeneous Representations [0.1] トポロジー制御は混雑を緩和するための魅力的な手法であるが、従来のトポロジー発見のアプローチは実用的応用には遅すぎることが証明されている。
最近の研究は機械学習(ML)を効率的な代替手段として重視している。
本研究では,グラフ表現がトポロジ制御におけるGNNの有効性に与える影響について検討した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:03:54 GMT)
Mixtures of Gaussian Process Experts with SMC$^2$ [0.1] ガウスのプロセスエキスパートの混合は、データポイントが独立した専門家に割り当てられる場所として検討されている。
我々は、ネストした連続モンテカルロサンプルを用いた新しい推論手法を構築し、ゲーティングネットワークとガウス過程の専門家パラメータの両方を推論する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:13:37 GMT)
Real-time nonlinear inversion of magnetic resonance elastography with operator learning [0.1] oNLIフレームワークは、NLIに匹敵する空間精度を持つエラストグラムのリアルタイムMREインバージョン(30,000倍高速化)を可能にする。
MRE文学におけるソフト事前正規化に類似した構造的事前機構が,空間的精度を向上させるために組み込まれている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:55:40 GMT)
AI Generated Child Sexual Abuse Material - What's the Harm? [0.1] 完全または部分的に合成された児童性虐待物質(AI CSAM)を生産できる生成人工知能ツールは、児童保護、法執行、児童虐待に対する社会的反応に重大な課題を提示する。
本稿は、AI CSAMに関連する害を批判的に調査するとともに、AI CSAMが害軽減ツールとして機能する可能性があるという主張に対して警告する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:11:28 GMT)
Evaluating Embedding Frameworks for Scientific Domain [0.0] いくつかの下流タスクと、各タスクに関連するデータセットからなる評価スイートを構築します。
構築した評価スイートを用いて、様々な単語表現とトークン化アルゴリズムをテストする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:53:48 GMT)
Plugging Leaks in Fault-Tolerant Quantum Computation and Verification [0.0] 検証器の量子デバイス上で秘密依存ノイズを処理できる普遍量子計算のための最初のフォールトトレラントブラインド検証方式を提案する。
我々の主なツールは、秘密に依存しないノイズを秘密に依存しないノイズに変換する2つの新しい蒸留プロトコルである。
我々はこれらのプロトコルを用いて、ノイズが極端に秘密に依存しないX-Y平面の状態を準備し、指数的信頼度を持つ任意のフォールトトレラントなBQP計算で検証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:57:59 GMT)
Entanglemons: Cross-platform protected qubits from entanglement [0.0] スケーラブルなフォールトトレラント量子コンピューティングの重要な要素は、誤り率の低い論理量子ビットの構築と固有のノイズ保護である。
そこで本研究では, 局所雑音による誤りを除去(緩和)し, 劣化を抑えるハードウェアレベルのノイズ保護のためのクロスプラットフォーム構築法を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:24:46 GMT)
oRANS: Online optimisation of RANS machine learning models with embedded DNS data generation [0.0] 従来のオフラインパラダイムで訓練されたクロージャは、過度に適合し、新しい体制に一般化できない傾向にある。
DLベースのNavier-Stokes(RANS)クロージャに対するオンライン最適化フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:19:01 GMT)
multimodars: A Rust-powered toolkit for multi-modality cardiac image fusion and registration [0.0] 血管内イメージングは、サブミリメートルの解像度を与えるが、全血管のコンテキストは制限されるが、CCTAは3D形状を提供するが、空間解像度とアーチファクトが制限される。
これまでの研究は血管内/CCTA融合を実証していたが、多状態解析に適したオープンで柔軟なツールキットは存在しなかった。
マルチモーダルは、決定論的アライメントアルゴリズム、コンパクトなNumPy中心のデータモデル、スケーラブルで再現可能な実験に適した最適化されたRustバックエンドによって、このギャップに対処する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:09:35 GMT)
YOLO-Based Defect Detection for Metal Sheets [0.0] 自動欠陥検出のためのYOLOに基づくディープラーニング(DL)モデルを提案する。
実験では, 金属シートの画像がYOLOモデルのトレーニング用データセットとして使用される。
ConSinGAN を用いた YOLOv9 モデルは、91.3%の精度で他の YOLO モデルより優れており、検出時間は146msである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:02:07 GMT)
What is in the model? A Comparison of variable selection criteria and model search approaches [0.0] 正確な識別率(CIR)、リコール、偽発見率(FDR)のパフォーマンス指標を用いた変数選択法の比較を行った。
その結果, 大規模・小規模のモデル空間において, サーチBICとサーチBICが他の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:14:43 GMT)
Visual Language Model as a Judge for Object Detection in Industrial Diagrams [0.0] 本稿では,視覚言語モデル(VLM)を用いてオブジェクト検出結果を評価し,その改善を導くフレームワークを提案する。
このアプローチは、VLMのマルチモーダル機能を利用して、欠落や一貫性のない検出を識別し、自動品質評価を可能にし、複雑な産業図上での全体的な検出性能を向上させる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:52:09 GMT)
Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution [0.0] メッセージの内容は、必ずしも公開されてはならないが、アタックベクターであるスタイル分析を公開している。
本稿では,スタイソメトリーの技法を解明し,対角的スタイソメトリーにおけるアンチテトラジを議論し,Unicodeステガノグラフィーによる拡張を考案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:04:03 GMT)
Understanding Quantum Imaginary Time Evolution and its Variational form [0.0] 多くの計算学的に難しい問題を量子ハミルトニアンにエンコードすることができる。
これらの問題の解は、これらのハミルトンの基底状態によって与えられる。
ハミルトンの基底状態を見つけるための最先端のアルゴリズムは、いわゆる量子イマジナリー時間進化(Quantum Imaginary Time Evolution)である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:11:07 GMT)
Training Variation of Physically-Informed Deep Learning Models [0.0] 成功したディープラーニングネットワークは、トレーニングデータセットだけでなく、特定のタスクに対してネットワークを条件付けるために使用されるトレーニングアルゴリズムにも大きく依存する。
本研究では,高弾性コントラスト複合材料の応力場を予測するPix2Pixネットワークをケーススタディとして用いた。
ストレス平衡を強制するいくつかの異なる損失関数が実装され、それぞれが様々なレベルの収束、正確性、および多くのトレーニングセッションでストレス平衡を強制する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:23:39 GMT)
Tracing and Metrics Design Patterns for Monitoring Cloud-native Applications [0.0] この記事では,クラウドネイティブアプリケーションの監視において重要な課題に対処する3つのデザインパターンを紹介する。
Application Metricsは、意味のあるパフォーマンス指標を備えたアプリケーション計測のための構造化されたアプローチを提供し、Infrastructure Metricsは、システムが運用されている環境の監視に重点を置いている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:32:15 GMT)
Three-Dimensional Niobium Coaxial Cavity with $\sim0.1\,$second Lifetime [0.0] 20mK以下の単光子レベルにおいて,3次元ニオブ4次波同軸共軸キャビティの内部品質係数,温度中熱処理,Q_rm int gtrsim 3times109$を示した。
この表面処理は、2次元超伝導回路の製造に適用でき、Nbベースの超伝導量子ビットの寿命を改善するのに役立つ。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 00:56:20 GMT)
The use of artificial intelligence in music creation: between interface and appropriation [0.0] 本稿では,人工知能(AI)に関連付けられた表現の語彙分析を提案する。
目的は、インターフェイスからAIの現在および将来的な使用、音や音楽コンテンツの作成、障害、障害物、ブレーキ、予算制限の特定である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:35:16 GMT)
The top quark in 2025 - International year of Quantum Science and Technology [0.0] 我々は、トップクォーク物理学の顕著な進歩が、トップクォークをエネルギーフロンティアで量子力学をテストするツールとして使う可能性の開放について論じる。
エネルギーフロンティアにおける量子後相関をアップしたトップクォークで探索する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:49:19 GMT)
The quantum smooth label cover problem is undecidable [0.0] 量子スムーズなラベル被覆問題はRe-hardであることを示す。
これは、Kempe, Regev, and Toner (FOCS'08) によって効率的に決定できる量子ユニークなラベルカバー問題とは対照的である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:54:07 GMT)
Take Goodhart Seriously: Principled Limit on General-Purpose AI Optimization [0.0] 近似、推定、最適化の誤差は、意図した目的から体系的に逸脱することを保証すると論じる。
汎用AIシステムの最適化には原則的な制限が必要である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:25:12 GMT)
Synthetic EEG Generation using Diffusion Models for Motor Imagery Tasks [0.0] 本研究では,運動画像脳のタスクに関連する合成脳波信号を生成する手法を提案する。
このアプローチでは、実際のEEGデータを前処理し、拡散モデルをトレーニングして、ノイズからEEGチャネルを再構築し、生成された信号の品質を評価する。
生成したデータは95%以上の分類精度を達成し,平均二乗誤差が低く,実信号との相関が高かった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:02:05 GMT)
Symmetry and Topology of Successive Quantum Feedback Control [0.0] 我々は、量子フィードバック制御の一般的なクラスに対して対称性の分類を確立する。
対称性の分類が10倍の AZ$dagger$ クラスに崩壊することを証明する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:19:48 GMT)
SurfDist: Interpretable Three-Dimensional Instance Segmentation Using Curved Surface Patches [0.0] 本稿では,3次元ボリュームインスタンスセグメンテーションのための畳み込みニューラルネットワークアーキテクチャであるSurfDistを提案する。
SurfDistは一般的なモデルアーキテクチャであるStarDist-3Dを改良したもので、StarDist-3Dのインスタンスパラメータ化次元とインスタンスのボクセル分解能の結合を断ち切る。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:57:06 GMT)
Sudden Decoherence by Resonant Particle Excitation for Testing Gravity-Induced Entanglement [0.0] 浅いポテンシャルに閉じ込められた粒子と高調波発振器との間の重力相互作用を考察する。
調和振動子は2つの周波数の量子重畳状態にあり、これらの状態の1つだけが共鳴によって捕獲された粒子を励起することができる。
粒子検出によってのみ引き起こされる突然の脱コヒーレンスは、重力によって引き起こされる絡み合いの証拠となる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:32:33 GMT)
Stabilizer-Shannon Renyi Equivalence: Exact Results for Quantum Critical Chains [0.0] シャノン・レニイとスタビライザー・エントロピーは、構造、非安定化剤性、相転移、および量子多体状態の鍵となる診断である。
横フィールドイジング(TFI)鎖に特化して、TFI基底状態安定化器は長さ2L$のXX鎖基底状態のシャノン・レニエントロピーにマップする。
この対応に基づいて、我々が証明した他の正確な同一性とともに、幅広い臨界のクラスに対して$alpha=frac12,2,4$の安定化子エントロピーの閉式を構築する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:02:08 GMT)
Spatial uniformity of g-tensor and spin-orbit interaction in germanium hole spin qubits [0.0] 2つのデバイスにまたがるY幾何を持つ配列の6ビットと7ビットの$g$-tensorsについて検討する。
隣接する量子ドットの間には強い相関関係を持つ強い面内$g$テンソル異方性が存在する。
以上の結果から, スピン軌道相互作用における長距離相関と, 従来予測されなかった$g$-tensorsの相関が明らかとなった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:52:55 GMT)
Space-time tradeoff in networked virtual distillation [0.0] 仮想蒸留は、理想的な条件下で、量子状態コピーの数が増えるにつれてエラーを指数関数的に抑制できる技術である。
時空トレードオフを最大化するエッジケースに対応するVDの実用的実装を3つ分析する。
ネットワーク型イオントラップシステムの現実的なノイズ特性下での3つの実装の性能を数値的に比較する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:36:41 GMT)
Slow dynamics from a nested hierarchy of frozen states [0.0] 量子論的に制約されたモデルにおける遅い不均一緩和のメカニズムを同定する。
結合の力によって決定される時間スケールで凍結された状態の階層構造を明らかにする。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:30:01 GMT)
Single-Spin Nitrogen-Vacancy Magnetometer with Enhanced Static Field Sensitivity [0.0] 本研究では, ソフト強磁性マイクロワイヤを単一表面近傍のNV中心に統合し, 外部静磁場に対する応答を増幅するハイブリッドセンシング手法を提案する。
このハイブリッド構成は、1つのNV中心に対して63nT/sqrt(Hz)の直流磁場感度を実現する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:34:54 GMT)
Sequential decoder training for improved latent space dynamics identification [0.0] 我々は、追加のデコーダを逐次学習することで、再構築と予測の精度を向上させるフレームワークmLaを紹介する。
1D-1V ブラソフ方程式に適用すると、mLa は標準 La を一貫して上回り、予測誤差を低くし、訓練時間を短縮する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:10:48 GMT)
Sensors in viticulture: functions, benefits, and data-driven insights [0.0] 本稿では, ブドウ栽培におけるセンサデータプラットフォームの機能, 利点, 実践的考察を簡潔に要約する。
これは、ブドウ栽培家だけでなく、農業やIoT研究者にも関心があるかもしれない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:40:02 GMT)
Semantic Similarity in Radiology Reports via LLMs and NER [0.0] 放射線医学報告の評価は放射線医の訓練において重要な部分であり、診断精度の確保に重要な役割を果たしている。
予備報告と最終報告のセマンティックな差異を識別することは、訓練ツールとして、臨床知識のギャップを明らかにするためにも不可欠である。
放射線学におけるAIは急速に発展している分野であるが、専門知識を必要とするため、大規模言語モデル(LLM)の適用は依然として困難である。
Llama-EntScore は Llama 3.1 と NER の組み合わせとチューナブルウェイトを組み合わせた意味的類似性スコア法である。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:31:11 GMT)
Semantic Preprocessing for LLM-based Malware Analysis [0.0] 本稿では,Portable Executable ファイルのレポートを生成する新しい前処理手法を提案する。
この前処理の目的は、マルウェアアナリストが理解できるバイナリファイルの意味表現を集めることである。
この前処理を用いて、複雑なデータセット上で平均0.94の重み付きF1スコアを達成する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:07:28 GMT)
Security Analysis and Threat Modeling of Research Management Applications [Extended Version] [0.0] 本研究は、研究集約環境におけるセンシティブな情報管理のための、よりセキュアなフレームワークへの貢献を目的とする。
研究管理アプリケーション(RMA)は、機密データを収集、送信、分析、保存するために臨床研究環境で広く利用されている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:07:24 GMT)
Scalable Quantum Optimisation using HADOF: Hamiltonian Auto-Decomposition Optimisation Framework [0.0] 量子アニーリング(QA)とQAOAは、NISQシステムにおける問題の近似解を見つけるために使われる量子最適化アルゴリズムを約束している。
準拘束的二項最適化(QUBO)ハミルトンを準ハミルトニアンに自動的に分割する反復戦略を利用するハミルトニアン自動分解最適化フレームワーク(HADOF)を提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:54:41 GMT)
Report of the 2025 Workshop on Next-Generation Ecosystems for Scientific Computing: Harnessing Community, Software, and AI for Cross-Disciplinary Team Science [0.0] レポートは、科学コンピューティングのための次世代エコシステムに関する2025年のワークショップの洞察を要約している。
レポートは、AI、ソフトウェア、ハードウェア、人間の専門知識が織り交ぜられる科学コンピューティングのための次世代エコシステムのビジョンを提示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:22:47 GMT)
Red Lines and Grey Zones in the Fog of War: Benchmarking Legal Risk, Moral Harm, and Regional Bias in Large Language Model Military Decision-Making [0.0] 本研究では,ターゲット行動における法的・道徳的リスクの側面を評価するためのベンチマークフレームワークを開発する。
我々は国際人道法(IHL)と軍事教義に基づく4つの指標を紹介する。
GPT-4o, Gemini-2.5, LLaMA-3.1の3つのフロンティアモデルを90個のマルチエージェント・マルチターン危機シミュレーションにより評価した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:55:04 GMT)
Reasoning Riddles: How Explainability Reveals Cognitive Limits in Vision-Language Models [0.0] 視覚言語モデル(VLM)は多くのマルチモーダルなタスクに優れるが、認知過程はリバスパズルのような複雑な横方向の思考課題に不透明である。
本研究は、6つの認知カテゴリーにまたがる221のリバスパズルの体系的な注釈付きデータセットに、推論品質と回答の正しさを区別する評価フレームワークを組み合わさったものである。
本研究は,視覚構成の体系的強みを示すモデルを用いて,推論品質がパズルのカテゴリによって劇的に変化することを示すとともに,不在解釈の基本的な限界と文化的象徴性を示すことを示した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:27:47 GMT)
Reactive Transformer (RxT) -- Stateful Real-Time Processing for Event-Driven Reactive Language Models [0.0] Reactive Transformer(RxT)は、データ駆動のパラダイムからイベント駆動のパラダイムに移行することで制限を克服するように設計された、新しいアーキテクチャである。
RxTは、各会話ターンを離散イベントとしてリアルタイムに処理し、統合された短期記憶(STM)システムでコンテキストを維持する。
我々はRxTが低レイテンシを実現し、真にリアルタイム、ステートフル、経済的に実行可能なロングフォームな会話を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:18:07 GMT)
Quantum-RAG and PunGPT2: Advancing Low-Resource Language Generation and Retrieval for the Punjabi Language [0.0] PunGPT2は,世界初の完全オープンソースPunjabi生成モデルスイートである。
PunGPT2は、Gurmukhi と Shahmukhi のスクリプトに最適化されたトークン化剤によって、パンジャービの構文的および形態的豊かさを捉えている。
PunGPT2をFAISSレトリバーと統合した検索拡張フレームワークであるPun-RAGをPunjabiナレッジベース上で導入する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:19:23 GMT)
Quantum feature-map learning with reduced resource overhead [0.0] 解析的反復再構成(Q-FLAIR)による量子特徴マップ学習について紹介する。
Q-FLAIRは反復的特徴マップ回路構築における量子リソースオーバーヘッドを低減する。
我々は、実際のIBMデバイス上でわずか4時間で量子モデルをトレーニングし、全解像度のMNISTデータセットで90%を超える精度を達成した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:00:00 GMT)
Quantum Signatures of Strange Attractors [0.0] 古典力学では、散逸を伴う駆動系は、しばしば奇妙な誘引子として知られる複雑なフラクタル力学を示す。
本稿では、量子領域におけるそのような構造がどのように現れるかという根本的な問題に対処する。
位相空間における量子状態を表すためにフシミ分布を用いることで、このモデルの中で量子奇数誘引子を初めて可視化する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:09:54 GMT)
PyRadiomics-cuda: a GPU-accelerated 3D features extraction from medical images within PyRadiomics [0.0] PyRadiomics-cudaは、PyRadiomicsライブラリのGPUアクセラレーション拡張である。
医用画像から形状特徴を抽出する際の計算上の課題に対処する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:00:31 GMT)
Putnam-like dataset summary: LLMs as mathematical competition contestants [0.0] このデータセットは、パットナム・コンペティションの精神における96の元の問題と、LLMの576の解からなる。
我々は,この問題の集合上でのモデルの性能を分析し,数学的なコンテストから問題を解く能力を検証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:46:28 GMT)
Protecting Persona Biometric Data: The Case of Facial Privacy [0.0] 本稿では, 顔のプライバシの概念を紹介する。
不規則な顔認識によって引き起こされる深刻な課題を分析します。
既存の法的な抜け穴や曖昧さは、個人を脆弱にしていると論じている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:16:33 GMT)
Probability distribution reconstruction using circuit cutting applied to a variational classifier [0.0] 不十分な量子資源は、しばしば量子アルゴリズムを実行する際の問題である。
新しい技術は、より小さな量子コンピュータを使用してより大きな量子アルゴリズムを実行するのに役立つ。
この研究は、多くの相互作用のこの状態において、回路切断技術の可能性を正確に探求する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:04:34 GMT)
Predicting Dynamics from Flows of the Eigenstate Thermalization Hypothesis [0.0] 統計的ヤコビ近似 (SJA) と呼ばれる手法を導入し, ハミルトニアンに摂動した後の固有状態熱化仮説 (ETH) を更新する。
SJAは、ETHアンザッツの様々な形状因子に対する積分微分フロー方程式を生成する。
摂動ハミルトニアンの熱状態におけるクエンチダイナミクスとオートコレレータの両方を予測する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:26:00 GMT)
Polarization dependence of spin-electric transitions in molecular exchange qubits [0.0] 分子スピン三角形のスピン-ハミルトンモデルを通して、電気および磁気双極子誘起遷移に必要な偏極を計算する。
偏極は2種類の遷移の明確な識別を可能にすることを示す。
さらに、基底倍数における零体分裂の物理的起源を特定できる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:27:36 GMT)
PepCompass: Navigating peptide embedding spaces using Riemannian Geometry [0.0] Pepはペプチド探索と最適化のための幾何学的なフレームワークである。
生成モデルはペプチド空間の潜在的な「マップ」を提供する。
電位最小化測地探索(PoGS)は、プロパティ富化種子に沿ったプロトタイプの埋め込みを補間する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:12:09 GMT)
Patterns for Teaching Agile with Student Projects - Team and Project Setup [0.0] 本稿では,大学生にアジャイルソフトウェア開発の実践を教えることに焦点を当てたパターン言語に関する初期の研究を紹介する。
チームサイズ、小さなプロジェクトスコープ、ビジネス非批判プロジェクト、自己組織化チーム、チーム選択トピックの5つのパターンを紹介します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 13:49:29 GMT)
Optimal Characteristics of Inspection Vehicle for Drive-by Bridge Inspection [0.0] 過去10年間で、ブリッジの健康モニタリングのためのドライブバイインスペクションが注目されている。
本研究は,損傷感度を高めるために検査車両を最適化するための枠組みを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:29:02 GMT)
On diffusion posterior sampling via sequential Monte Carlo for zero-shot scaffolding of protein motifs [0.0] 我々は,SMC支援拡散後サンプリング器を非条件モデルであるGenieに事前適応させることにより,足場記述のための新しいガイダンスのセットを導入し,それらを解決した。
単一モチーフ問題では,従来のマスキング法に比べて,提案したポテンシャルは相容れないが,相容れない。
また,SE(3)不変ポテンシャルのペア化による2つのマルチモチーフ問題の解も提供する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:25:21 GMT)
Octax: Accelerated CHIP-8 Arcade Environments for Reinforcement Learning in JAX [0.0] 強化学習(Reinforcement Learning, RL)の研究には、多様で困難な環境が必要である。
JAXで実装された古典的なアーケードゲーム環境の高性能スイートであるOcaxを紹介します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:51:40 GMT)
Modelling Real-Life Cycling Decisions in Real Urban Settings Through Psychophysiology and LLM-Derived Contextual Data [0.0] 本稿では,大規模言語モデル(LLM)を用いて,記録マルチメディアから文脈データを抽出する,革新的な手法を提案する。
適用されたモデルは、異なる環境と交通状況が、生理的データを用いて参加者の感情状態や行動にどのように影響するかを理解することに焦点を当てる。
この研究は、サイクリングの決定がストレス関連の感情に影響されることを確認し、都市特性と交通条件がサイクリストの行動に与える影響を強調している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:19:45 GMT)
Mechanistic Interpretability of Code Correctness in LLMs via Sparse Autoencoders [0.0] スパースオートエンコーダを用いて大規模言語モデルを分解し,コード正当性に対応する方向を特定する。
LLMにおける符号の正当性方向は誤りを確実に予測するのに対して、補正能力は統計的に有意であるが、修正エラーと正しい符号の保存との間にはトレードオフがある。
戦略の推進は、詳細な問題記述よりもテスト例を優先すべきであり、予測器の指示は、開発者レビューのエラーアラームとして機能し、これらの予測器は選択的なステアリングをガイドできる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:44:21 GMT)
MarketSenseAI 2.0: Enhancing Stock Analysis through LLM Agents [0.0] LLM(Large Language Models)の急速な技術拡張にともなうMarketSenseAIの最近の進歩について紹介する。
MarketSenseAIはSECの提出書類と決算報告を処理し、さまざまな機関報告の体系的な処理を通じてマクロ経済分析を強化している。
2年間にわたるS&P100株の実証評価(2023-2024)によると、マーケットセンスAIは73.5%に比べて125.9%の累積リターンを達成している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:17:38 GMT)
Machine Unlearning Meets Adversarial Robustness via Constrained Interventions on LLMs [0.0] 我々は、機密情報の未学習と脱獄攻撃に対する堅牢性に対処する様々な制約付き最適化の定式化について検討する。
私たちが提案する最も単純なポイントワイド制約ベースの介入は、計算コストの低減を図りながら、最大最小の介入よりも優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:32:21 GMT)
MIXER: Mixed Hyperspherical Random Embedding Neural Network for Texture Recognition [0.0] テクスチャ表現学習のための新しいランダム化ニューラルネットワークであるMixerを提案する。
その中核となるのは、超球面ランダム埋め込みと二重分岐学習モジュールを利用して、チャネル内およびチャネル間関係を捉えることである。
実験結果から, 純テクスチャベンチマークにおける提案手法の興味深い結果が得られた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:58:04 GMT)
MIRROR: Modular Internal Processing for Personalized Safety in LLM Dialogue [0.0] 大規模言語モデルは、ユーザ固有の安全コンテキストを無視して、個人のマルチターン対話において有害なレコメンデーションを生成する。
MIRROR(Modular production- focused architecture)は、永続的、バウンドされた内部状態を通じてこれらの障害を防止するモジュール型アーキテクチャである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:42:59 GMT)
MAQCY: Modular Atom-Array Quantum Computing with Space-Time Hybrid Multiplexing [0.0] 時空間ハイブリッド多重化(MAQCY)を用いたモジュール型原子アレイ量子コンピューティングアーキテクチャを提案する。
MAQCYは、完全に接続されたスケーラブルな普遍量子計算のための動的光学ツイーザーベースのプロトコルである。
また、イッテルビウム同位体を用いた具体的な実装を提案し、大規模でフォールトトレラントな量子コンピューティングへの道を開いた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:31:16 GMT)
MALF: A Multi-Agent LLM Framework for Intelligent Fuzzing of Industrial Control Protocols [0.0] 本稿では,大規模言語モデル(LLM)とマルチエージェント協調を統合し,産業制御プロトコル(ICP)の脆弱性を特定するファジリングソリューションであるMALFを提案する。
実験の結果、MALFは従来の手法を超越し、88~92%のテストケースパスレート(TCPR)を達成し、より多くの例外トリガ(ETN)を生成することがわかった。
MALFは、発電所の実際の産業攻撃範囲に配備され、CNVDによって確認され登録された3つのゼロデイ欠陥を含む重大な脆弱性を特定した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 03:19:49 GMT)
Lightweight Prompt Engineering for Cognitive Alignment in Educational AI: A OneClickQuiz Case Study [0.0] 本稿では,OneClickQuizにおけるAI生成質問の認知的アライメントに及ぼす軽量なプロンプトエンジニアリング戦略の影響について検討する。
ブルームの分類学の知識,応用,分析の3つの段階(詳細なベースライン,よりシンプルなバージョン,ペルソナに基づくアプローチ・アクロスアプローチ)を評価した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:42:37 GMT)
LegalSim: Multi-Agent Simulation of Legal Systems for Discovering Procedural Exploits [0.0] 我々は、AIシステムが符号化ルールにおける手続き的弱点をどのように活用できるかを探求する、敵対的法的手続のモジュラーマルチエージェントシミュレーションであるLegalSimを提案する。
PPO, 文脈的バンディット, LLM, 直接 LLM ポリシ, 手作りの4つのポリシーを比較し, バイナリケースの結果を最適化する代わりに, エージェントを効果的な勝利率を用いて訓練・評価し, 対向コストインフレーション, カレンダー圧力, 低利得の決済圧力, ルール準拠のマージンを組み合わせた複合エクスプロイトスコアを作成した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:01:57 GMT)
Lagrange-Mesh Method in Momentum Space: an Alternative Formulation [0.0] 本研究では,運動量空間におけるラグランジュ・メシュ法におけるポテンシャル行列要素の計算方法を提案する。
提案手法は、クーロンや線形相互作用のような従来アクセスできないケースを含むように、処理可能なポテンシャルの範囲を広げる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:00:10 GMT)
Invariance under quantum permutations rules out parastatistics [0.0] 我々は、量子系は局所状態を置換の下で保存するだけでなく、他の系に持つ量子情報も保存すべきであると主張する。
どちらも、粒子がボソンあるいはフェルミオンである場合に限って、それぞれの原理が満たされることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:55:47 GMT)
Interpretable Visualizations of Data Spaces for Classification Problems [0.0] 分類問題によって決定される決定境界の可視化に適したハイブリッド教師なし手法を提案する。
定性的かつ定量的に分析できる人間解釈可能な地図を提供する。
本稿では, この手法を化学駆動問題の観点から論じる一方で, 機械学習分類モデルの操作を「アンボックス化」するために, サブフィールドにまたがって応用を一般化することができる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:23:09 GMT)
Integrability from a Single Conservation Law in Quantum Spin Chains [0.0] 有限範囲の相互作用を持つ量子スピン鎖に対して、Reshetikhin条件は無限に多くの局所保存量の存在を意味することを証明している。
このことは、ヤン=バクスター方程式の解に付随する保存法則の階層構造が、既に最低の非自明な保存法則に符号化されていることを示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:17:59 GMT)
Identifying Financial Risk Information Using RAG with a Contrastive Insight [0.0] 本稿では、RAG上のピア認識比較推論層を提案する。
我々の対照的なアプローチは、ROUGEやBERTScoreといったテキスト生成メトリクスのベースラインRAGよりも優れています。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:24:56 GMT)
How We Won BraTS-SSA 2025: Brain Tumor Segmentation in the Sub-Saharan African Population Using Segmentation-Aware Data Augmentation and Model Ensembling [0.0] 脳腫瘍、特にグリオーマは、複雑な成長パターン、浸潤性の性質、個体間の脳構造の変化により、著しい黄斑を呈する。
本研究では,BraTS-Africaデータセット上でセグメント化を意識したオフラインデータ拡張を行い,データサンプルのサイズと多様性を高め,一般化を向上した。
最も優れたモデルであるMedNeXtは1000エポックで訓練され,それぞれ0.86点,0.81点の正常化面距離スコアを達成した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:32:35 GMT)
Gradient-enhanced global sensitivity analysis with Poincar{é} chaos expansions [0.0] カオス展開は、Sobolのインデックスを効率的に計算するために、グローバルな感度分析に使用される。
本稿では,近年の緩やかな勾配向上レグレッションを取り入れた勾配強化型GSAの包括的フレームワークを提案する。
本稿では,本手法の有効性を,挑戦的な洪水モデリングケーススタディに適用する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:38:46 GMT)
Geolog-IA: Conversational System for Academic Theses [0.0] 本研究は,地質学に関する質問に対して自然に応答する人工知能に基づく対話システムであるGeolog-IAの開発について述べる。
提案手法では,Llama 3.1 と Gemini 2.5 の言語モデルを用いており,RAG (Retrieval Augmented Generation) アーキテクチャとデータベースを補完する。
BLEUメトリックによるGeolog-IAの性能評価は平均0.87に達し、生成した応答における高い一貫性と精度を示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:11:47 GMT)
Generative Inverse Design: From Single Point Optimization to a Diverse Design Portfolio via Conditional Variational Autoencoders [0.0] 逆設計は、目標出力に対して最適なパラメータを求める。
本稿では,単一点最適化から生成的逆設計へのパラダイムシフトを提案する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 16:28:19 GMT)
GPT and Prejudice: A Sparse Approach to Understanding Learned Representations in Large Language Models [0.0] 大規模言語モデル(LLM)は、大規模で未処理のコーパスでますます訓練されている。
本研究では, モデル動作だけでなく, 学習データに埋め込まれたより深い構造, テーマ, バイアスの解釈を可能にする。
我々は、社会構造や物語パターンに富んだコーパスであるジェーン・オーステンの小説にのみ焦点をあてて、GPTスタイルのトランスフォーマーモデルを訓練する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:24:05 GMT)
Fusing Multi- and Hyperspectral Satellite Data for Harmful Algal Bloom Monitoring with Self-Supervised and Hierarchical Deep Learning [0.0] 有害な藻類の発芽の重症度と種分化を検出・マッピングするための自己教師型機械学習フレームワークを提案する。
運用機器の反射率データをTROPOMI太陽誘起蛍光 (SIF) に融合させることで, 施設ごとのラベル付きデータセットを必要とせず, HAB重大度および種別生成物を生成する。
このフレームワークは、自己監督的な表現学習、階層的な深層クラスタリングを用いて、植物プランクトン濃度と種分化を解釈可能なクラスに分割し、メキシコ湾と南カリフォルニア湾のその場データに対して検証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:51:19 GMT)
FinReflectKG - MultiHop: Financial QA Benchmark for Reasoning with Knowledge Graph Evidence [0.0] FinReflectKG - FinReflectKG上に構築されたベンチマークであるMultiHop。
我々は、KGから正確な裏付けのある財務アナリストスタイルの質問を生成する。
推論モデルと非推論モデルの両方において、KG誘導による正確な検索は実質的な利得をもたらす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:19:31 GMT)
Fermionic optimal transport [0.0] 二次ワッサーシュタイン距離は、$mathbbZ$-graded von Neumann環上の力学系(特別な場合として状態を持つ)の間で得られる。
これらのフェルミオン性ワッサーシュタイン距離の計量特性を示し、量子的詳細バランスから系の偏差に関連する対称性について検討した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:51:23 GMT)
Explicit Quantum Circuits for Simulating Linear Differential Equations via Dilation [0.0] 本稿では,拡張形式と明示的な量子回路構成を結合する具体的なパイプラインを提案する。
解析面では、量子実装に適した連続拡張作用素の離散化を導入する。
得られたスキームは、指数関数的に小さな境界効果まで、オーダー$O(M-3/2)$の大域的誤差境界を達成することを証明した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:39:39 GMT)
Evaluating OCR performance on food packaging labels in South Africa [0.0] 本研究では,実際の食品包装画像上で,Tesseract,EasyOCR,PaddleOCR,TrOCRの4つのオープンソース文字認識システムについて検討した。
本研究の目的は、食材リストや栄養情報パネルを抽出する能力を評価することである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:38:45 GMT)
Evaluating Large Language Models for IUCN Red List Species Information [0.0] 大きな言語モデル(LLM)は、生物多様性危機に対処するために、保護において急速に採用されている。
本研究は、4つのコアIUCNレッドリストアセスメントコンポーネントにわたる21,955種の主要な5つのモデルを体系的に検証した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:09:35 GMT)
Enhancing Biomedical Named Entity Recognition using GLiNER-BioMed with Targeted Dictionary-Based Post-processing for BioASQ 2025 task 6 [0.0] 本研究では,BioASQデータセット上でGLiNER-BioMedモデルを評価する。
一般的な誤分類に対処するために,辞書ベースのポストプロセッシング戦略を導入する。
この研究は、事前訓練されたBioNERモデルの辞書ベースの改良の可能性を強調するが、開発データに過度に適合するという重要な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:35:04 GMT)
Emergent curved space and gravitational lensing in quantum materials [0.0] 有効重力場は、長い波長のスピン(または擬スピン)テクスチャを持つ量子材料に自然に現れることを示す。
反復電子のスピンが背景のスピンテクスチャーに強く結合すると、曲線空間におけるスピンレス粒子として効果的に振る舞う。
創発的に湾曲した空間は、重力レンズのアナログである電子レンズ効果をもたらす。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:35:05 GMT)
Dynamics of Quantum Entanglement Between Photon and Phonon Modes in a Coulomb-coupled Optomechanical Cavity Magnonic Systems [0.0] ハイブリッドキャビティマグノ-オプトメカニカルシステムでは、キャビティ光子、マグノン、フォノン間の絡み合いは、異なるモードにわたる量子状態の操作を可能にする。
本研究では、複雑なハイブリッド量子系におけるフォノン-フォノンの絡み合いを最適化し、維持する方法について述べる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 06:58:11 GMT)
Dynamical local Fréchet curve regression in manifolds [0.0] 我々は、NASAのMAGSAT衛星の経度と経度の変化から、地球の磁場の予測問題を考察する。
実際のデータ応用の動機として、NASAのMAGSAT衛星の経度と経度から地球の磁場の予測問題を考察する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:20:49 GMT)
Dynamical and invariance algebras of the $d$-dimensional Dunkl-Coulomb problem [0.0] 標準$d$-次元クーロン問題のリッチ代数構造はダンクル問題にまで拡張できることが示されている。
標準微分を so($d+1$,2) の Dunkl で置き換えると、前者の動的代数生成元は、同様の可換関係を持つ変形代数を生み出す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:23:38 GMT)
Dream2Image : An Open Multimodal EEG Dataset for Decoding and Visualizing Dreams with Artificial Intelligence [0.0] Dream2Imageは、脳波信号、ドリームの書き起こし、AI生成画像を組み合わせた世界初のデータセットである。
38人の参加者と31時間以上の夢の脳波記録に基づいて、129のサンプルが含まれている。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 22:43:27 GMT)
Discrimination in machine learning algorithms [0.0] 機械学習アルゴリズムは、例えば信用スコアリングアルゴリズムがローンを拒否するため、個人に直接影響を及ぼす可能性のあるビジネス上の決定に日常的に使用される。
そして、倫理的(かつ法的)の観点から、これらのアルゴリズムが(性や人種のような)センシティブな属性に基づいて識別しないことを保証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:05:00 GMT)
Construction of the Complete Set of Maximally Entangled Basis Vectors for N-Qubit Systems [0.0] 我々は,最大絡み合った基底ベクトルとその対応する回路を生成するために乱数アプローチを用い,単一量子ビットゲートとCNOTゲートの必要個数を詳述する。
このアプローチは, 理論的基盤を提供するだけでなく, 大規模符号化データの保存の難しさを回避し, 技術応用の実践的手法も確立する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 02:57:06 GMT)
Constraint Satisfaction Approaches to Wordle: Novel Heuristics and Cross-Lexicon Validation [0.0] 本稿では, CSP 対応エントロピー, 制約伝搬後の情報ゲイン, 確率的 CSP フレームワークを紹介する。
2,315語の単語を評価することで、CSP-Aware Entropy 3.54の平均推定は99.9%の成功率である。
500のスペイン語の単語に対するクロスレキシコンの検証は、言語固有のチューニングをゼロにすることで88%の成功を示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 09:44:14 GMT)
Consistent Kernel Change-Point Detection under m-Dependence for Text Segmentation [0.0] カーネル変更点検出(KCPD)は、複雑なデータの構造変化を特定するために広く使われているツールである。
軽微な追加仮定の下で検出された変化点数における整合性および位置における弱整合性を証明した。
現代埋め込みを用いたテキストセグメンテーションのためのKCPDの実証的研究を行った。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:57:22 GMT)
Comparing LLMs for Sentiment Analysis in Financial Market News [0.0] 本稿では,金融市場ニュースの感情分析における大規模言語モデル(LLM)の比較研究について述べる。
その結果、大言語モデルは、ほとんどのケースで古典的モデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:10:51 GMT)
Comparative Analysis of Parameterized Action Actor-Critic Reinforcement Learning Algorithms for Web Search Match Plan Generation [0.0] 本研究では,高次元意思決定タスクにおけるソフトアクター批判(SAC),グリーディアクター批判(GAC),トランシッド量子批判(TQC)の性能評価を行った。
焦点はパラメトリゼーション・アクション(PA)空間であり、リカレント・ネットワークの必要性を排除している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:48:57 GMT)
Can we accurately read or write quantum data? [0.0] 私は、全ハミルトニアンが下から有界であれば、正確な測定と準備は不可能であることを示す。
この結果は、量子制御、量子コンピューティング、その他の量子技術の限界を再評価する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:08:49 GMT)
Can an AI-Powered Presentation Platform Based On The Game "Just a Minute" Be Used To Improve Students' Public Speaking Skills? [0.0] 本研究では,大学生を対象としたプレゼンテーションプラットフォームにAIとゲーミフィケーションを適用した効果について検討する。
ラジオ番組「Just a Minute(ジャスト・ア・ミニット、JAM)」を基にしたプラットフォームを探索する。このゲームでは、プレイヤーは、そのトピックを繰り返すことなく60秒間、流れるように話し合わなければならない。
生徒はゲームが有望であることに気付き、より長くプレイすれば、彼らの話すスキルが向上すると考えた。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:06:19 GMT)
Bridging Ethical Principles and Algorithmic Methods: An Alternative Approach for Assessing Trustworthiness in AI Systems [0.0] 本稿では,Trustworthy AIの倫理的要素とPageRankとTrustRankのアルゴリズム的プロセスを組み合わせた評価手法を提案する。
目標は、フィールドで広く普及する自己評価技術に固有の主観性を最小化するアセスメントフレームワークを確立することである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:45:59 GMT)
Bounds on Atomistic Disorder for Scalable Electron Shuttling [0.0] 時間依存有限要素静電場と原子性強結合を組み合わせたマルチスケール・シミュレーション・フレームワークを導入し、ランダムアロイングと界面粗さがシャトル電子の谷分割と相に及ぼす影響を捉える。
その結果, 界面粗さによりシャットリング特性が強く抑制され, 原子層スケール付近で鋭い異常が発生し, 拡張性のあるシャットリングを実現するための定量的ガイドラインが設定された。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:40:11 GMT)
Bound of Casimir Effect by Holography [0.0] 三次元共形場の理論に対する平行平面間のカシミール効果に着目する。
ゴーストフリーホログラフィーモデルは、カシミール効果に普遍的な下界を課す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 14:38:41 GMT)
Bosonic quantum error correction using squeezed Fock states [0.0] 我々は,Knill-Laflammeコスト関数とPetzマップの忠実度を用いて,シュレッディンガーの猫状態に基づくコードと比較した。
圧縮されたフォック状態は、粒子損失やデファス化を伴うチャネル内の情報保護に競争力があることを実証する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 11:26:03 GMT)
Bose-Einstein Condensation and the Lambda Transition for Interacting Lennard-Jones Helium-4 [0.0] 最適凝縮率は、制約された自由エネルギーを最小化することによって得られる。
縮合抑制により純位置置換ループの成長とそれに伴う熱容量のばらつきが実現される。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 23:27:29 GMT)
Bloch Oscillations and Landau-Zener Transitions in Flat-Band Lattices with Quadratic and Linear Band Touchings [0.0] ゼナートンネル(ランダウ-ツェナー遷移またはLZT)によるブロッホ振動
コヒーレント輸送シミュレーションと散乱行列解析の2つの相補的手法を用いて, リーブ格子と香留格子のこれらの振動について検討する。
統一的な視点を得るため,カゴメからリーブ格子へのひずみ誘起遷移過程におけるBOについて検討する。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 21:59:56 GMT)
Bias and Coverage Properties of the WENDy-IRLS Algorithm [0.0] Weak form Estimation of Dynamics (WENDy) 法は、顕著な雑音の頑健性と計算効率を示す。
本研究では,WENDy-IRLSアルゴリズムのパラメータと状態推定器のカバレッジとバイアス特性について,以下の微分方程式の文脈で検討する。
推定器の性能は、4つの異なるノイズ分布と幅広いノイズの下でシミュレーションデータ例で研究され、このアルゴリズムで以前にテストされたものよりもはるかに高いレベルに達した。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:12:10 GMT)
Beyond CNNs: Efficient Fine-Tuning of Multi-Modal LLMs for Object Detection on Low-Data Regimes [0.0] 我々は,画像中の人工テキストオーバーレイ検出の課題に対して,従来のCNN,ゼロショット事前訓練型マルチモーダルLLM,微調整型マルチモーダルLLMを比較した。
本研究の重要な貢献は,LLMを極めて限られたデータで効果的に微調整し,最大36%の精度向上を達成できることである。
私たちの研究は、ビジョンと言語をブリッジし、効率的なクロスモーダル学習戦略に関する新たな洞察を提供するという、より広範な取り組みに寄与します。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 18:53:18 GMT)
Assessment Twins: A Protocol for AI-Vulnerable Summative Assessment [0.0] 評価タスクを再設計し,妥当性を高めるためのアプローチとして,アセスメント双子を導入する。
我々は、GenAIがコンテンツ、構造、連続性、一般化可能性、外部の妥当性を脅かす方法を体系的にマッピングするために、Messickの統一妥当性フレームワークを使用します。
双子のアプローチは、補完的な形式にまたがって証拠を三角測量することで、妥当性の脅威を軽減するのに役立ちます。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 12:05:34 GMT)
Any type of spectroscopy can be efficiently simulated on a quantum computer [0.0] 量子コンピュータ上で任意の種類の分光法を効率的にシミュレートできることが示される。
本手法は, 分光相関関数の計算に有効である。
この手法は閉分子系と開分子系の分光をシミュレートするために用いられる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 07:39:31 GMT)
Analyzing the Performance of a 2.72kWp Rooftop Grid tied Photovoltaic System in Tarlac City, Philippines [0.0] フィリピンのタララ市において,2020年から2023年にかけての2.72kWの屋根上グリッド型PVシステムの性能について検討した。
System Loss (LS) と Capture Loss (LC) により効率が低下する可能性がある
これにより、容量利用率(CUF)は15.52%、パフォーマンス比(PR)は77.10%となる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 20:07:16 GMT)
Analytical solution of a free-fermion chain with time-dependent ramps [0.0] 我々は、相互作用しないフェルミオンの連鎖に対する単一粒子Schr"odinger方程式の正確な解析解を提供する。
この解に基づいて、鎖に沿った粒子密度、電流、絡み合いエントロピーの進化の予測を導出する。
急激なクエンチの場合、システムは呼吸界面領域を発達させ、ワニエ・スタークの局在の実現と解釈できる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:38:58 GMT)
Absence of quantum Darwinism as a resource in secure quantum communication and computation [0.0] 客観性の欠如は暗号における量子的優位性を示す。
マルチパーティ状態が対角線である局所基底の知識である、効率的な古典的シミュレーションアルゴリズムの重要な要素は、量子ダーウィン主義によって利用できる。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 17:57:26 GMT)
A Study of Rule Omission in Raven's Progressive Matrices [0.0] 分析的推論は人間の認知の中核にあり、人工知能の根本的な課題である。
本研究では、不完全学習条件下での現代AIシステムの一般化能力について検討する。
実験により、変圧器は慣れ親しんだ規則に対して強い性能を示すが、新しい規則や省略規則に直面すると、その精度は急激に低下することが明らかとなった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 15:53:28 GMT)
A Statistical Method for Attack-Agnostic Adversarial Attack Detection with Compressive Sensing Comparison [0.0] 本稿では,ニューラルネットワークの展開前に検出基準を確立する統計的アプローチを提案する。
我々は、圧縮/非圧縮ニューラルネットワーク対の挙動を比較することにより、対向的存在の計量を生成する。
提案手法は, 最先端技術に対して試験され, 広範囲の攻撃に対してほぼ完全な検出が可能であった。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 04:05:20 GMT)
A Qualitative Comparative Evaluation of Cognitive and Generative Theories [0.0] 評価は認知アーキテクチャに基づく理論にとって非常に難しい活動であることが証明されている。
重なり合う理由から、生成的ニューラルアーキテクチャに基づく理論においても評価は難しい。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:19:48 GMT)
A Hardware Accelerator for the Goemans-Williamson Algorithm [0.0] 凸最適化において, 浮動小数点精度が代数的サブルーチンにどのように組み入れられるかを示す。
内部作業精度の増大は,システムサイズの増加に伴って解法にかかる時間を減少させることを示す。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 10:01:58 GMT)
A Concept of Possibility for Real-World Events [0.0] 本稿は、1978年にL.A. Zadehによって最初に導入された現在の標準概念の代替として、その可能性の新しい概念を提供する。
この新版は原典に触発されたものであるが、公式には、論理接続の多価解釈をLukasiewiczに採用したこと以外は共通点がない。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 01:15:06 GMT)
A Computational Framework for Interpretable Text-Based Personality Assessment from Social Media [0.0] この論文では、Redditから収集された2つのデータセット(MBTI9kとPANDORA)を提示する。
PANDORAデータセットには、1万人以上のユーザーからの1700万のコメントが含まれている。
SIMPAフレームワークは人格評価を解釈するための計算フレームワークである。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 08:36:36 GMT)
(FAPP) Infinity Does Macroscopic Irreversibility From Microscopic Reversibility [0.0] 統計力学において、マクロ状態は同一のマクロ的な性質を共有するマイクロ状態の同値類として現れる。
これらの例は、無限性と等価性が顕微鏡可視性から創発的なマクロな振る舞いを導く統一的な枠組みを示している。
論文参考訳(メタデータ) (Fri, 03 Oct 2025 19:18:41 GMT)