AIM 2025 challenge on Inverse Tone Mapping Report: Methods and Results [128.2] 本稿では,AIM 2025 Challenge on Inverse Tone Mapping (ITM)についてレビューする。
この課題は、単一のLDR入力からのHDR画像再構成に有効なIMMアルゴリズムの開発を推し進めることであった。
本報告では, PU21-PSNRが29.22dBに達している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:18:22 GMT)
Fact or Guesswork? Evaluating Large Language Models' Medical Knowledge with Structured One-Hop Judgments [108.6] 大規模言語モデル(LLM)は、様々な下流タスクドメインで広く採用されているが、実際の医学的知識を直接呼び起こし、適用する能力は、まだ探索されていない。
標準化された語彙と知識グラフの包括的なリポジトリであるUMLS(Unified Medical Language System)から派生したデータセットであるMKJ(Messical Knowledge Judgment dataset)を紹介する。
バイナリ分類フレームワークを通じて、MKJは、簡潔なワンホップ文の妥当性を評価することによって、LCMが基本的な医学的事実を把握できることを評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:07:14 GMT)
Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR [102.1] RLVRトレーニングのためのオンライン変分問題合成(SvS)戦略を提案する。
この戦略は、トレーニング中のポリシーのエントロピーを効果的に維持し、標準のRLVRと比較してPass@kを大幅に改善する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:42:45 GMT)
Beyond Simple Edits: Composed Video Retrieval with Dense Modifications [96.5] 多様なビデオセグメントにまたがる細粒度および構成されたアクションをキャプチャする新しいデータセットを提案する。
Dense-WebVid-CoVRは、1.6万のサンプルからできており、修正テキストは既存のものより約7倍多い。
我々は,Cross-Attention (CA) 融合により視覚情報とテキスト情報を統合した新しいモデルを開発した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:59:39 GMT)
A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.9] 本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:35:24 GMT)
FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction [84.4] FutureXは、将来の予測のための最大かつ最も多様なライブベンチマークである。
リアルタイムの日次更新をサポートし、質問収集と回答収集のための自動パイプラインを通じてデータの汚染を取り除く。
推論,検索機能,外部ツールの統合などを含む25のLLM/エージェントモデルを評価した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:46:18 GMT)
Rectifying Conformity Scores for Better Conditional Coverage [75.7] 本稿では,分割共形予測フレームワーク内で信頼セットを生成する新しい手法を提案する。
本手法は,任意の適合度スコアのトレーニング可能な変換を行い,条件付き範囲を正確に確保しつつ,条件付き範囲を改善する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:40:41 GMT)
GALA: Guided Attention with Language Alignment for Open Vocabulary Gaussian Splatting [74.6] GALAは3次元ガウススプラッティングを用いたオープンな3次元シーン理解のための新しいフレームワークである(3DGS)。
GALAは、自己教師付きコントラスト学習を通じてシーン固有の3Dインスタンス特徴フィールドを蒸留する。
シームレスな2Dおよび3Dオープン語彙クエリをサポートし、ガウス単位の高次元特徴学習を回避してメモリ消費を削減する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:26:49 GMT)
TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis [74.3] 7729のユニークなスピーカーから1244時間のビデオを含む、大規模で高品質で多様なデータセットであるTalkVidを紹介した。
TalkVidは、動作の安定性、美的品質、顔のディテールを厳格にフィルタする、原則付き多段階自動パイプラインを通じてキュレートされる。
TalkVid-Benchは、500クリップの階層化された評価セットで、重要な人口統計学と言語学の軸間で慎重にバランスを取ります。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:31:15 GMT)
EventTSF: Event-Aware Non-Stationary Time Series Forecasting [73.5] EventTSFは、過去の時系列とテキストイベントを統合し、その後の予測を行う自動回帰生成フレームワークである。
8つの合成および実世界のデータセットの実験によると、EventTSFは、さまざまなイベント対応の非定常時系列予測シナリオで12のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:28:47 GMT)
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction [72.5] 動的シーンのモノクロ3次元再構成にビデオ拡散モデルを再利用するGeo4Dを提案する。
大規模な事前訓練ビデオモデルによってキャプチャされた強いダイナミックな事前情報を活用することで、Geo4Dは合成データのみを使用して訓練することができる。
提案手法は,これらのモダリティを調整・融合するマルチモーダルアライメントアルゴリズムと,推論時にスライディングウインドウアプローチを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:06:41 GMT)
HumanPCR: Probing MLLM Capabilities in Diverse Human-Centric Scenes [72.3] HumanPCRは、人間の視覚的コンテキストに関するMLLMの能力を調べるための評価スイートである。
Human-P、HumanThought-C、Human-Rは、6,000以上の人間認証された複数の選択質問を特徴としている。
Human-Rは、手動でキュレートされたビデオ推論テストを提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:52:04 GMT)
Unleashing the Power of LLMs in Dense Retrieval with Query Likelihood Modeling [69.8] 本稿では,検索者の後続のコントラスト学習のためのバックボーンを強化するために,QLの補助的タスクを提案する。
注意ブロック(AB)と文書破壊(DC)の2つの重要なコンポーネントを組み込んだモデルを紹介します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:35:52 GMT)
Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy [67.0] ITEM(Iterative utiliTy judgm fraEntMework)を提案する。
RAGの3つの中核的構成要素は、検索モデル、ユーティリティ判断、回答生成から導かれる関連性ランキングであり、シューツの哲学的関連性体系と一致している。
実効性判定, ランキング, 回答生成におけるITEMの顕著な改善が, 代表ベースラインに基づいて示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:59:05 GMT)
CARE: Contextual Adaptation of Recommenders for LLM-based Conversational Recommendation [66.5] CARE(Contextual Adaptation of Recommenders)フレームワークを紹介します。
CAREはCRSタスクのために大きな言語モデルをカスタマイズし、それらを外部レコメンデーションシステムでシナジする。
本研究では,外部レコメンデータシステムとエンティティレベルの情報を統合することで,CRSのレコメンデーション精度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:53:30 GMT)
InfiniteTalk: Audio-driven Video Generation for Sparse-Frame Video Dubbing [66.5] 我々は、アイデンティティ、象徴的なジェスチャー、カメラ軌跡を維持するために参照を戦略的に保存する新しいパラダイムであるスパースフレームビデオダビングを導入する。
無限長長列ダビング用に設計されたストリーミングオーディオ駆動型ジェネレータであるInfiniteTalkを提案する。
HDTF、CelebV-HQ、EMTDデータセットの総合評価は、最先端の性能を示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:55:23 GMT)
Disentangled Representation Learning with the Gromov-Monge Gap [65.7] 乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:24:30 GMT)
The 9th AI City Challenge [64.3] 第9回AIシティチャレンジは、輸送、産業自動化、公共安全におけるコンピュータビジョンとAIの現実的な応用を推し進めている。
2025年版では4トラックが収録され、17%が参加し、評価サーバに登録された15カ国から245チームが参加した。
チャレンジデータセットのパブリックリリースにより、これまでに3万回以上ダウンロードされた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:55:06 GMT)
Let's Use ChatGPT To Write Our Paper! Benchmarking LLMs To Write the Introduction of a Research Paper [62.2] SciIGは、タイトル、抽象、および関連する作品からコヒーレントな紹介を生成するLLMの能力を評価するタスクである。
オープンソース (DeepSeek-v3, Gemma-3-12B, LLaMA 4-Maverick, MistralAI Small 3.1) およびクローズドソース GPT-4o システムを含む5つの最先端モデルを評価する。
結果は、特に意味的類似性と忠実性において、ほとんどのメトリクスにおいて、LLaMA-4 Maverickの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:11:11 GMT)
RotBench: Evaluating Multimodal Large Language Models on Identifying Image Rotation [59.8] MLLM(Multimodal Large Language Models)は、0deg, 90deg, 180deg, 270degで回転した入力画像の向きを正確に識別する。
このタスクは、方向に関係なく、回転キューを検出し、画像内の空間的関係を文脈化するための堅牢な視覚的推論機能を必要とする。
GPT-5, o3, Gemini-2.5-Pro など,最先端のオープンかつプロプライエタリなMLLM が入力画像の回転を確実に識別できないことを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:58:25 GMT)
Predictable Scale: Part I, Step Law -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [59.4] 我々は100兆のトークンをスクラッチから3,700以上の大規模言語モデル(LLM)に対する前例のない経験的調査訓練を実施している。
ステップ法則(ステップ法)と呼ばれる,LLM事前学習におけるハイパーパラメータ最適化のための普遍的スケーリング法則を確立する。
我々の推定オプティマは, 排他的探索によって得られた世界最高の性能から, テストセットの0.094%しか逸脱しない。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:45:25 GMT)
Improved Generalized Planning with LLMs through Strategy Refinement and Reflection [58.8] 疑似コードの形で戦略を生成する手法を提案する。
我々は、Pythonデバッグフェーズをリフレクションステップで拡張し、LLMが観測された計画失敗の理由を特定できるようにする。
17のベンチマーク領域で実験を行い、これらの拡張によって一般化された計画の品質が大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:42:18 GMT)
G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning [58.7] 合成グラフ理論タスクにおける強化学習(RL)はグラフ推論能力を著しく拡張することができる。
RL on ErdosでG1はグラフ推論の大幅な改善を実現し、微調整された3BモデルはQwen2.5-72B-Instruct(24倍)よりも優れています。
我々の研究は、グラフ理論上のRLでLLMを微調整することで、強力なグラフ推論器を構築するための効率的でスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:33:43 GMT)
MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph [57.5] 我々は、時間的に進化する医療知識グラフを構築するためのフレームワークであるMedKGentを紹介する。
生医学的知識の出現を, 微粒な日々の時系列でシミュレートする。
結果として得られるKGは156,275個のエンティティと2,971,384個のリレーショナルトリプルを含む。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:18:31 GMT)
Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization [57.0] LongMab-POは、長文モデリングタスクのための高品質で多様な応答を生成する新しいフレームワークである。
実験の結果,LongMab-POは嗜好データペアの多様性と品質を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:33:55 GMT)
Prompt-Based One-Shot Exact Length-Controlled Generation with LLMs [56.5] 本稿では,既製の大規模言語モデルを補完して,希望するトークン数を正確に生成するプロンプトベースの戦略を提案する。
プロンプトはカウントダウンマーカーと明示的なカウントルールを付加し、モデルが"カウント中に書き込む"。
MT-Bench-LI では、GPT-4.1 の厳格な長さコンプライアンスは、単純なプロンプトの30%以下から、カウントダウンプロンプトの95%以上へと飛躍する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:12:01 GMT)
RICO: Two Realistic Benchmarks and an In-Depth Analysis for Incremental Learning in Object Detection [56.4] インクリメンタルラーニング(IL)は、完全なリトレーニングなしで、プライバシ、効率、スケーラビリティを提供する新しいデータ上で、逐次モデルをトレーニングする。
ドメイン RICO (D-RICO) は固定クラスセットでドメインシフトを特徴とし、拡張クラス RICO (EC-RICO) はILステップ毎に新しいドメインとクラスを統合する。
実験の結果,全てのILメソッドは適応性や保持性に劣るものの,前回の少量のデータ再生は全メソッドを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:42:19 GMT)
FreeGAD: A Training-Free yet Effective Approach for Graph Anomaly Detection [54.6] Graph Anomaly Detection (GAD)は、グラフ内の多数から逸脱するノードを特定することを目的としている。
既存のアプローチは、複雑でリソース集約的なトレーニングプロセスのために、高デプロイメントコストとスケーラビリティの不足に悩まされることが多い。
新たなGAD法であるFreeGADを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:47:34 GMT)
Bites of Tomorrow: Personalized Recommendations for a Healthier and Greener Plate [53.1] 持続可能な食品の選択肢を優先し,推奨することを目的としたグリーンレコメンドアライテッド・パーソナライズド・イーティング(GRAPE)を紹介した。
また、グリーンインジケータに対応する2つの革新的なグリーンロス関数を、均一または区別された優先順位で設計する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:35:37 GMT)
Depth-Breadth Synergy in RLVR: Unlocking LLM Reasoning Gains with Adaptive Exploration [52.8] Reinforcement Learning with Verifiable Reward (RLVR)は、大規模言語モデルにおける推論能力をアンロックするための強力なパラダイムとして登場した。
RLVRの完全なポテンシャルは、モデルがサンプリングできる最も難しい深さと、単一のイテレーションで消費されるインスタンスの数という2つの未探索の次元によって妨げられていることを示す。
本稿では,多段ロールアウトによる難易度再重み付けを行うDARS(Difficulty Adaptive Rollout Smpling)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:51:40 GMT)
Identify, Isolate, and Purge: Mitigating Hallucinations in LVLMs via Self-Evolving Distillation [52.5] 幻覚の問題は 信頼性と応用可能性を大幅に制限します
既存の緩和方法は、外部ツールやマルチラウンド推論の比較に依存している。
我々は, LVLMの内部知識における幻覚を識別し, 分離し, 浄化するtextbfSElf-textbfDistillation (textbfSEED)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:22:48 GMT)
Calibrating Biased Distribution in VFM-derived Latent Space via Cross-Domain Geometric Consistency [52.5] 特徴抽出にオフザシェルフ(ビジョン)基礎モデルを利用する場合、特徴分布の幾何学的形状はドメインやデータセット間で顕著な伝達性を示す。
我々は,我々の幾何学的知識誘導分布キャリブレーションフレームワークを,フェデレーション学習とロングテール認識の2つの人気かつ挑戦的な設定で具体化する。
長期学習において、サンプル豊富なカテゴリから移動された幾何学的知識を利用して、サンプル・スカース・テールクラスの真の分布を復元する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:22:59 GMT)
LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [51.8] 拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:10:32 GMT)
MCN-SLAM: Multi-Agent Collaborative Neural SLAM with Hybrid Implicit Neural Scene Representation [51.1] 既存のNeRFベースのマルチエージェントSLAMフレームワークは通信帯域幅の制約を満たすことができない。
本稿では,ハイブリッドシーン表現を用いた分散マルチエージェント協調型ニューラルSLAMフレームワークを提案する。
シーン再構成を改善するために, 新規な三面体グリッド共同シーン表現法を提案する。
局所的(単一エージェント)と大域的(複数エージェント)の整合性を実現するために,新しいイントラ・トゥ・インターループ・クロージャ法が設計された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:02:44 GMT)
The Kikuchi Hierarchy and Tensor PCA [50.8] テンソルPCA(主成分分析)問題に対して,ランタイムの増大を伴うアルゴリズムの階層化を提案する。
我々の階層は、SOS(sum-of-squares)階層に似ているが、代わりに統計物理学や関連するアルゴリズムにインスパイアされている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:39:57 GMT)
ResFlow: Fine-tuning Residual Optical Flow for Event-based High Temporal Resolution Motion Estimation [50.8] イベントカメラは、高時間分解能(HTR)モーション推定に重要な可能性を秘めている。
イベントデータを用いてHTR光流を推定するための残差に基づくパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:23:56 GMT)
CyPortQA: Benchmarking Multimodal Large Language Models for Cyclone Preparedness in Port Operation [50.3] ポートオペレーターは、確率的風力マップのような多様な予測生成物を、サイクロンアプローチとして明確で実用的なガイダンスに迅速に合成する必要がある。
我々は、サイクロン脅威下でのポート操作に適した最初のマルチモーダルベンチマークであるCyPortQAを紹介する。
CyPortQAは2015年から2023年にかけて、アメリカの主要港145か所と90の嵐を含む2,917の現実世界の破壊シナリオを組み立てている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:56:54 GMT)
Mask and Restore: Blind Backdoor Defense at Test Time with Masked Autoencoder [50.1] 既存のバックドア防御手法では、いくつかのバリデーションデータとモデルパラメータにアクセスする必要があることが多い。
Masked AutoEncoder (BDMAE) を用いたブラインドバックドアディフェンスの提案
BDMAEは、画像の構造的類似性と、テスト画像とMAE復元の間のラベルの整合性を用いて、可能な局所的なトリガを検出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:12:06 GMT)
Extracting Membrane-like hexagonal Boron Nitride hosting single Defect Centers for Resonator Integration [49.6] 光共振器への膜の統合は、光力学を含む様々な応用において重要な役割を果たしている。
層状2次元材料は、原子に似た量子エミッタをホストする膜候補として出現している。
我々は、スペクトル的に狭い単一光子エミッタを含む市販hBNの膜状構造を抽出するナノスケール操作技術の開発を行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:22:58 GMT)
Neuro-Symbolic Artificial Intelligence: Towards Improving the Reasoning Abilities of Large Language Models [49.5] 大きな言語モデル(LLM)は様々なタスクで有望な結果を示しているが、その推論能力は依然として根本的な課題である。
本稿では,LLM推論の高度化に向けたニューロシンボリックアプローチの最近の展開を包括的にレビューする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:27:46 GMT)
Encoding Optimization for Low-Complexity Spiking Neural Network Equalizers in IM/DD Systems [49.3] スパイキングニューラルネットワーク(SNN)の最適化のための強化学習に基づくアルゴリズムを提案する。
IM/DDシステムにおけるSNNベースの等化器とデマッパーに適用することにより,計算負荷とネットワークサイズを低減し,性能を向上させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:32:13 GMT)
Taming Unbalanced Training Workloads in Deep Learning with Partial Collective Operations [49.3] 本稿では,分散的蓄積のためのグローバル同期を緩和するeager-SGDを提案する。
本稿では,最先端同期SGDの1.27倍の高速化を実現し,精度を損なわないことを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:19:33 GMT)
Distilled-3DGS:Distilled 3D Gaussian Splatting [49.1] 3DGSのための最初の知識蒸留フレームワークを提案する。
バニラ3DGS、ノイズ強化版、ドロップアウト正規化版など様々な教師モデルが特徴である。
最先端の手法と比較して、レンダリング品質とストレージ効率の両面で有望なレンダリング結果を達成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:59:26 GMT)
A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.0] 我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:41:22 GMT)
Breaking (Global) Barriers in Parallel Stochastic Optimization with Wait-Avoiding Group Averaging [49.0] 本稿では、ウェイトアビジングサブグループであるWAGMA-SGDについて述べる。
ImageNet上でResNet-50をトレーニングし、機械翻訳用のトランスフォーマー、大規模ナビゲーションのための深い強化学習を行う。
最先端の分散SGDと比較すると、WAGMA-SGDはトレーニングのスループットを大幅に改善する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:26:02 GMT)
Spatially-guided Temporal Aggregation for Robust Event-RGB Optical Flow Estimation [47.8] 現在の光学フロー法は、フレーム(またはRGB)データの安定した出現を利用して、時間にわたって堅牢な対応を確立する。
一方、イベントカメラは、高時間分解能のモーションキューを提供し、挑戦的なシナリオに優れています。
本研究は,時間的に密度の高い事象モダリティの集合を導くために空間的に密度の高いモダリティを用いる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:13:25 GMT)
Your Reward Function for RL is Your Best PRM for Search: Unifying RL and Search-Based TTS [46.7] 本稿では、RLベースと検索ベースTTSの最初の自然統合であるAIRL-Sを紹介する。
逆逆強化学習(AIRL)とグループ相対政策最適化(GRPO)を組み合わせることで、正しい推論トレースから高密度な動的PRMを直接学習する。
提案手法は,GPT-4oと一致して,ベースモデル上での平均9%の性能向上を図っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:41:15 GMT)
Noise Robust One-Class Intrusion Detection on Dynamic Graphs [46.5] 本研究では,TGN-SVDDモデルの確率的バージョンを導入し,入力雑音の有無の検出精度を高めることを目的とした。
合成ノイズを用いたCIC-IDS 2017データセットの修正実験により, ベースラインTGN-SVDDモデルに比べて検出性能が著しく向上した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:36:11 GMT)
AdaptiveAE: An Adaptive Exposure Strategy for HDR Capturing in Dynamic Scenes [45.7] シャッタースピードとISOのバランスは、高品質なHDRを実現するために不可欠である。
既存の方法はしばしばシャッター速度とISOの間の複雑な相互作用を見落としている。
本稿では,シャッター速度とISOの組み合わせの選択を最適化する強化学習に基づくAdaptiveAEを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:31:10 GMT)
Proceedings of the 22nd International Conference on Quantum Physics and Logic [45.0] QPLは毎年恒例のカンファレンスであり、量子計算、量子物理学、および関連する分野の数学的基盤に取り組んでいる学術的、産業的な研究者を集めている。
主な焦点は、代数的および分類的構造、形式言語、意味論的方法、および物理系、物理過程、およびそれらの構成の研究に適用可能な他の数学的およびコンピュータ科学技術の使用である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:31:29 GMT)
Hybrid Machine Learning Model with a Constrained Action Space for Trajectory Prediction [45.0] この研究は、ディープラーニングと運動モデルを組み合わせた新しいハイブリッドモデルを導入する。
加速度やヨーレートなどのオブジェクト属性を予測し、それに基づいて軌道を生成することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:59:45 GMT)
GRILE: A Benchmark for Grammar Reasoning and Explanation in Romanian LLMs [45.0] ルーマニアの受験試験から採取した1,151件の多重選択質問の最初のオープンベンチマークであるGRILEを提示する。
GRILEは、7つの最先端多言語とルーマニア固有のLLMの相補的な2つの能力を探索することを可能にする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:27:06 GMT)
Expertise-aware Multi-LLM Recruitment and Collaboration for Medical Decision-Making [44.2] 本稿では,MDMシステムの精度と信頼性を高めるために,EMRC(Expertise-aware Multi-LLM Recruitment and Collaboration)フレームワークを提案する。
i) 専門知識を意識したエージェント採用と(ii) 信頼と敵主導のマルチエージェントコラボレーションの2段階で活動する。
我々は,EMRCフレームワークを3つの公開MDMデータセット上で評価し,EMRCが最先端の単一LLM法とマルチLLM法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:51:15 GMT)
AGP: A Novel Arabidopsis thaliana Genomics-Phenomics Dataset and its HyperGraph Baseline Benchmarking [43.9] 本研究では,シロイヌナズナの遺伝子発現プロファイルと表現型形質測定をリンクした解析データセットを提案する。
AGPは表現型予測や解釈可能なグラフ学習などのタスクをサポートする。
我々の知る限りでは、これはマルチモーダル遺伝子情報と異種形質または表現型データを提供する最初のデータセットである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:21:23 GMT)
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation [43.4] DetailGen3Dは、生成された3D形状を強化するために特別に設計されたジェネレーティブなアプローチである。
我々の重要な洞察は、潜在空間におけるデータ依存フローを通して、粗大から細小への変換を直接モデル化することである。
改質時に正確な空間対応を確保するためのトークンマッチング戦略を導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:58:51 GMT)
Diversity-enhanced Collaborative Mamba for Semi-supervised Medical Image Segmentation [43.3] 半教師型医用画像セグメンテーションのための新しい多様性向上型協調型マンバフレームワークを提案する。
データの観点から,マンバの走査型モデリング特性を用いたパッチレベルの弱い混合強化を開発する。
ネットワークの観点からは、異なる走査方向から発生する予測の相違から恩恵を受けることができる多様なスキャン協調モジュールを導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:19:15 GMT)
Solving reaction dynamics with quantum computing algorithms [42.4] 線形応答によって支配される異なる反応を記述することに関連する応答関数の量子アルゴリズムについて検討する。
我々は原子核物理学の応用に焦点をあて、格子上の量子ビット効率のマッピングを検討し、現実的な散乱シミュレーションに必要な大量の量を効率的に表現することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:56:30 GMT)
A Taxonomy and Methodology for Proof-of-Location Systems [42.2] 本稿では,PoL(Proof-of-Location)システムの4つの中核領域を同定する分類法を提案する。
次に、アプリケーション固有の要件を適切なPoLアーキテクチャにマッピングする方法論を紹介します。
全体として、この作業はセキュアでスケーラブルで相互運用可能なPoLシステムを構築するための構造化されたアプローチを提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:39:05 GMT)
Sketch3DVE: Sketch-based 3D-Aware Scene Video Editing [41.7] ビデオ中の3Dシーンの構造的内容の編集は依然として難しい。
主な課題は、オリジナルのビデオと一貫性のある新しいビューコンテンツの生成だ。
スケッチに基づく3次元映像編集手法であるSketch3DVEを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:57:31 GMT)
AdaRing: Towards Ultra-Light Vision-Language Adaptation via Cross-Layer Tensor Ring Decomposition [41.7] 本稿では,多層テンソルリング分解(TRD)に基づく視覚言語微調整フレームワークAdaRingを提案する。
実験の結果,提案したAdaRingは,平均トレーニングパラメータを90%削減しつつ,最先端の性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:43:34 GMT)
ExpVG: Investigating the Design Space of Visual Grounding in Multimodal Large Language Model [41.5] 本稿では,MLLMの視覚的接地性能に影響を及ぼす様々な設計選択について包括的に検討する。
LLaVA-1.5を用いて解析を行い,MLLMの実験的研究に広く採用されている。
以上の結果から,LLaVA-1.5より5.6%/+6.9%/+7.0%,RefCOCO/+/gの改善が得られた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:46:59 GMT)
Exploring LLMs for Automated Generation and Adaptation of Questionnaires [41.3] 本研究は, アンケートの生成と適応を支援するLLMの適合性に着目した。
我々は,LLMを活用して新しいアンケートを作成し,対象読者と事前試験を行い,潜在的な問題を特定し,異なる状況における既存の標準アンケートに適応する,新しいパイプラインを提案する。
以上の結果から, LLM 文の明瞭化, LLM 文の明瞭化, LLM 文の具体化, LLM 文の適応化, 従来のテキストよりも若干明確でバイアスの少ない質問に対する回答が得られた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:01:10 GMT)
Communication-Efficient Federated Learning with Adaptive Number of Participants [40.5] Intelligent Selection of Participants (ISP)は、ラウンド毎に最適なクライアント数を動的に決定する適応的なメカニズムである。
最終品質を損なうことなく、一貫したコミュニケーションの節約率を最大30%まで示す。
ISPをさまざまな現実世界のECG分類設定に適用することは、フェデレートラーニングの別のタスクとして、クライアント数の選択を強調した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:04:10 GMT)
Beyond the Horizon: Decoupling Multi-View UAV Action Recognition via Partial Order Transfer [40.0] 無人航空機(UAV)における行動認識は、垂直の空間軸に沿った視界の変化によって、ユニークな課題を生んでいる。
高度の変化に合わせて調整された多視点定式化を導入し,高度の増加とともに認識精度が一貫して低下するビュー間の部分的な順序を経験的に観察する。
本稿では,高度の異なる地点における視線依存情報を効果的に活用することにより,劇的な視線変動に対処する部分順序案内型多視点ネットワーク(POG-MVNet)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:36:14 GMT)
CRISP: Persistent Concept Unlearning via Sparse Autoencoders [40.0] SAEを用いた持続的概念アンラーニングのためのパラメータ効率向上手法CRISPを紹介する。
CRISPは複数の層にまたがる健全なSAE機能を自動的に識別し、それらのアクティベーションを抑制する。
提案手法は,WMDPベンチマークによる安全クリティカルな未学習タスクにおいて,従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:01:22 GMT)
Physics-Based 3D Simulation for Synthetic Data Generation and Failure Analysis in Packaging Stability Assessment [39.9] 動作パレットの動作を再現できる完全制御可能で正確な物理シミュレーションシステムを提案する。
3Dグラフィックスベースの仮想環境を備え、多様なパッケージレイアウト、異なるラップ材料、多様な動的条件を含む幅広い構成をサポートする。
パレット構成のためのクラッシュテスト予測器として,シミュレータが生成したレンダリングビデオを評価するために,ディープニューラルネットワークをトレーニングする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:26:57 GMT)
A kinetic-based regularization method for data science applications [39.6] 本稿では,統計力学にインスパイアされた関数学習のための物理に基づく正規化手法を提案する。
補間器のパラメータの最適化とシステムのエネルギーの最小化の類似性から,データ分布の低次モーメントに対する制約を導入する。
これにより、データの離散表現と連続表現の相違が最小化され、それによってより好ましいエネルギーランドスケープにアクセスできるようになる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:16:06 GMT)
LENS: Learning to Segment Anything with Unified Reinforced Reasoning [38.6] LENSは拡張性のある強化学習フレームワークで、推論プロセスとセグメンテーションをエンドツーエンドで共同で最適化する。
LENSはRefCOCO、RefCOCO+、RefCOCOgのベンチマークで平均81.2%のcIoUを達成し、GLaMMという強力な微調整法を最大5.6%上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:59:53 GMT)
HouseCrafter: Lifting Floorplans to 3D Scenes with 2D Diffusion Model [38.1] フルサイズの3D屋内シーン(例えば家)にフロアプランを持ち上げる新しいアプローチであるHouseCrafterを紹介します。
我々の重要な洞察は、Webスケールの画像に基づいて訓練された2次元拡散モデルを適用して、シーンの異なる場所で一貫した多視点色(RGB)と深度(D)画像を生成することである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:38:38 GMT)
How Usable is Automated Feature Engineering for Tabular Data? [37.9] 自動特徴工学(AutoFE)手法は、実践者にとってのユーザビリティについて、これまで調査されていない。
これらの手法は一般的には使いづらく、ドキュメントが欠如し、アクティブなコミュニティがないことが分かりました。
我々の調査は、使い勝手の良いAutoFEメソッドに関する今後の研究の必要性を強調している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:23:52 GMT)
Measurement as Bricolage: Examining How Data Scientists Construct Target Variables for Predictive Modeling Tasks [37.2] データサイエンティストは、ファジィで定義が難しい概念を含む予測モデリングタスクを定式化することが多い。
我々は、ターゲット変数の構築方法を理解するために、教育と医療の15人のデータサイエンティストにインタビューを行った。
以上の結果から,データサイエンティストはブリコラージュプロセスを通じて対象変数を構築することが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:24:31 GMT)
PhysGM: Large Physical Gaussian Model for Feed-Forward 4D Synthesis [37.2] PhysGMはフィードフォワードフレームワークであり、単一の画像から3次元ガウス表現とその物理的特性を共同で予測する。
1分で1枚の画像から高忠実度4Dシミュレーションを効果的に生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:10:30 GMT)
Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation [36.6] 本稿では,3B視覚言語モデル(VLM)であるEmbodied-R1を紹介する。
我々は、大規模なデータセットであるEmbodied-Points-200Kを構築するために、幅広い具体的および一般的な視覚的推論データセットをソースとして使用する。
Embodied-R1は11の空間およびポインティングベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:50:01 GMT)
Heavy-tailed Linear Bandits: Adversarial Robustness, Best-of-both-worlds, and Beyond [36.3] 本稿では,逆方向の重み付きバンディット問題に対する一般的な枠組みを提案する。
重み付きMABのためのFTRL-type Best-of-both-worlds (BOBW)アルゴリズムを考案した。
また,HT-SPM(Hythitheavy-tailed noise aware stability-penalty matching)と呼ばれる一般的なデータ依存学習率を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:28:51 GMT)
Sycophancy under Pressure: Evaluating and Mitigating Sycophantic Bias via Adversarial Dialogues in Scientific QA [36.2] 梅毒は、正確性に関係なく、ユーザの信念と整合する傾向にある。
その重要性にも拘わらず、現実的な質問応答の文脈において、梅毒症はいまだに過小評価されている。
本稿では,サイコファンティックな文脈がモデル行動に与える影響を定量的に評価する統合評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:30:52 GMT)
SlotMatch: Distilling Temporally Consistent Object-Centric Representations for Unsupervised Video Segmentation [35.6] 本稿では,オブジェクト中心の表現を軽量な学生に効果的に伝達する知識蒸留フレームワークを提案する。
提案したフレームワークは、SlotMatchと呼ばれ、コサインの類似性を通じて、対応する教師と生徒のスロットを調整する。
2つのデータセットで実験を行い、最先端の教師モデルであるSlotContrastと蒸留した学生を比較した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:24:07 GMT)
Roadblocks and Opportunities in Quantum Algorithms -- Insights from the National Quantum Initiative Joint Algorithms Workshop, May 20--22, 2024 [34.7] 国立量子イニシアティブ合同アルゴリズムワークショップ(National Quantum Initiative Joint Algorithms Workshop)は、量子アルゴリズムの現在の状況を評価するために、学術、国立研究所、産業の研究者を集結させた。
ワークショップでは、新しいアルゴリズム技術、短期ハードウェアにおけるリソース制約、ソフトウェアとシステム間での共同設計の機会について議論した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:07:01 GMT)
SLED: Self Logits Evolution Decoding for Improving Factuality in Large Language Models [34.3] 大規模言語モデル(LLM)は目覚ましい能力を示しているが、その出力は信頼できないことや、事実的に間違っていることがある。
本稿では,LLMの真性を高める新しいデコードフレームワークであるSelf Logits Evolution Decoding(SLED)を紹介する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:51:42 GMT)
What Matters for Bioacoustic Encoding [34.1] 本研究は,生物音響学の側面を包括する大規模実証研究である。
既存のベンチマークと提案ベンチマークで最先端のエンコーダを得る。
具体的には、種分類、検出、個人ID、発声レパートリー発見などのタスクを含む26のデータセットにまたがって、自己教師付き事前訓練に続いて、教師付き後訓練を行う。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:07:19 GMT)
Sample Complexity of Diffusion Model Training Without Empirical Risk Minimizer Access [34.0] スコア推定の原理的解析を行い、$widetildemathcalO(epsilon-6)$のサンプル複雑性を確立する。
これは、スコア関数推定損失の経験的リスク最小化器へのアクセスを仮定することなく、サンプル複雑性境界を達成する最初の結果である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:22:14 GMT)
PC-Sampler: Position-Aware Calibration of Decoding Bias in Masked Diffusion Models [34.0] マスク付き拡散モデル(MDM)は、シーケンス生成のための強力な非自己回帰的な代替手段である。
本稿では,新しいデコード戦略である位置認識信頼度校正サンプリング(PC-Sampler)を紹介する。
PC-Samplerは、既存のMDMデコード戦略を平均で10%以上上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:03:36 GMT)
Comparing Conditional Diffusion Models for Synthesizing Contrast-Enhanced Breast MRI from Pre-Contrast Images [33.5] 乳がんの診断と治療にはDCE(Dynamic contrast-enhanced)MRIが不可欠である。
しかし、コントラストエージェントへの依存は、安全性の懸念、禁忌、コストの増大、ワークフローの複雑さをもたらす。
DCE-MRIを合成するために,事前コントラスト条件付き拡散確率モデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:24:55 GMT)
OmniSense: Towards Edge-Assisted Online Analytics for 360-Degree Videos [33.2] 我々は,オンライン没入型ビデオ分析のための新しいエッジ支援フレームワークであるOmniSenseを紹介する。
OmniSenseは低レイテンシと高精度の両方を実現し、重要な計算処理とネットワークリソースの課題に対処する。
我々は、OmniSenseのプロトタイプをコモディティデバイスで実装し、様々な現実世界で収集された360円の動画で評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:54:40 GMT)
Enhancing Cost Efficiency in Active Learning with Candidate Set Query [31.8] 本稿では、コスト効率の高い能動学習(AL)フレームワークを導入し、候補集合クエリと呼ばれる新しいクエリ設計を特徴とする。
従来のALクエリとは異なり、オラクルはすべての可能なクラスを検査する必要があるが、我々のメソッドは、基底真実クラスを含む可能性のある候補クラスのセットを絞り込む。
CIFAR-10, CIFAR-100, ImageNet64x64の実証評価により, フレームワークの有効性とスケーラビリティが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:10:36 GMT)
Refinement Module based on Parse Graph for Human Pose Estimation [31.6] Parse Graph(RMPG)に基づく新しいRefinement Moduleを提案する。
RMPGは、暗黙の階層構造を構築し、サブフィーチャーマップ間のコンテキスト関係を構築することで、骨格接続を放棄し、特徴を洗練する。
我々の階層型ネットワーク設計は、RMPGがより単純なアーキテクチャと少ないパラメータで、身体の階層構造とコンテキスト関係をモデル化できることを示します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:13:40 GMT)
EAvatar: Expression-Aware Head Avatar Reconstruction with Generative Geometry Priors [31.3] 高忠実度アバター再構成は、AR/VR、ゲーム、マルチメディアコンテンツ作成において重要な役割を果たす。
近年の3Dガウススプラッティング(3DGS)の進歩は、実時間レンダリング能力を持つ複雑な幾何学をモデル化する上で有効であることを示した。
本稿では,表現認識と変形認識の両方が可能な頭部再構成のための3DGSベースの新しいフレームワークEAvatarを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:56:00 GMT)
Self-Supervised Sparse Sensor Fusion for Long Range Perception [31.0] 長距離ハイウェイは100km/hを超える速度で走行し、少なくとも250mの知覚距離を必要としている。
現在の知覚アプローチは、距離が大きくなるにつれてメモリと計算コストが2次的に増加するバードのアイビュー表現に依存している。
本稿では,マルチモーダル・時間的特徴の効率的な3次元符号化と,ラベルのないカメラ-LiDARデータから大規模学習を可能にする,自己教師付き事前学習方式を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:40:29 GMT)
SBP-YOLO:A Lightweight Real-Time Model for Detecting Speed Bumps and Potholes [30.8] 本稿では,バンプとポットホール認識に適した軽量かつ高速な検出フレームワークであるSBP-YOLOを提案する。
YOLOv11nに基づいて、モデルはGhostConvとVoVGSCSPCモジュールをバックボーンとネックに統合し、堅牢性を低減する。
実験の結果、SBP-YOLOは87.0%のmAPを達成し、YOLOv11nベースラインを5.8%上回った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:32:27 GMT)
Unsupervised Learning for Quadratic Assignment [30.7] PLUME検索は、非自己回帰的なアプローチで置換に基づく損失を用いて問題インスタンスから直接学習する。
本稿では,様々な最適化問題を含むNP-hard問題である代入問題に対して,その性能を評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:40:30 GMT)
Adversarially robust quantum state learning and testing [30.6] 短期量子デバイスはエラーを起こしやすいため、エラー耐性アルゴリズムを設計することが重要である。
本稿では、仮想敵が任意に測定結果の$gamma$-fractionを変更することができる$gamma$-adversarial corruptionモデルを提案する。
我々の強い汚職モデルの下で、未知のランク-$r$状態から$tildeO(gammasqrtr)$までをトレース距離で学習できるアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:53:16 GMT)
A Survey of LLM-based Deep Search Agents: Paradigm, Optimization, Evaluation, and Challenges [30.1] 大規模言語モデル (LLM) はウェブ検索に革命をもたらした。
これらのエージェントは、ユーザの意図や環境状況を理解することができる。
本調査は,検索エージェントの系統的分析を初めて行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:15:19 GMT)
Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning [29.6] 大規模言語モデル(LLM)上に構築されたマルチエージェントシステム(MAS)は、複雑で現実的なタスクを解決するための有望な道を提供する。
テストタイムスケーリング(TTS)の最近の進歩は、難解な推論タスクにおいて、シングルエージェントのパフォーマンスを大幅に改善した。
モデルレベルのトレーニングとシステムレベルの調整の両方を通じて協調推論を強化するために設計された適応型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:06:10 GMT)
ROVER: Robust Loop Closure Verification with Trajectory Prior in Repetitive Environments [29.1] ループ検出は同時局所化と閉鎖(SLAM)に重要である
本稿では,過去の軌道を疑似ループを拒否するための事前制約として活用するループ閉鎖検証手法であるROVERを提案する。
ベンチマークと実世界の実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:34:08 GMT)
Real-Time, Population-Based Reconstruction of 3D Bone Models via Very-Low-Dose Protocols [29.0] 骨モデルを作成するための従来のCTベースのアプローチは、CTの低柔軟性と高放射線曝露のため、術前の使用に限られている。
本稿では, 2平面X線から30秒で高品質な骨モデルを再構築する,高速かつ高精度なAIフレームワークであるSSR-KDについて紹介する。
両平面X線で再構成した骨モデルとCTで注釈した骨モデルとが同等の臨床的応用性を示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:36:58 GMT)
Directed-Tokens: A Robust Multi-Modality Alignment Approach to Large Language-Vision Models [28.8] 視覚的・テキスト的モダリティ間のロバストなアライメントを改善するための,シンプルだが効率的な学習機構を提案する。
提案手法は,従来のLMMと比較して常に最先端(SoTA)性能を実現する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:53:24 GMT)
Equinox: Holistic Fair Scheduling in Serving Large Language Models [28.8] 本稿では,ユーザとオペレータの視点を分離したデュアルカウンタフレームワークを提案する。
ユーザフェアネスカウンタは、重み付きトークンとレイテンシによってサービスの品質を測定し、リソースフェアネスカウンタはスループットとGPU利用を通じて運用効率を測定する。
これらのメトリクスは実行後のみ利用可能であるため、ユーザ認識のレイテンシ、出力トークン、スループット、GPU使用率を予測するために、決定論的混合予測エキスパート(MoPE)フレームワークを導入します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:17:17 GMT)
LEGO-GraphRAG: Modularizing Graph-based Retrieval-Augmented Generation for Design Space Exploration [28.5] LEGO-GraphRAGは,GraphRAGワークフローのきめ細かい分解を可能にするモジュール型フレームワークである。
本フレームワークは,大規模実世界のグラフと多様なクエリセット上でのグラフRAGの総合的研究を促進する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:35:53 GMT)
Revisiting RAG Ensemble: A Theoretical and Mechanistic Analysis of Multi-RAG System Collaboration [28.1] 理論的および機械学的解析の観点からRAGアンサンブルフレームワークを解析した。
機構解析に関しては,パイプラインレベルとモジュールレベルの両方からRAGアンサンブルフレームワークを調査した。
実験の結果、複数のRAGシステムを集約することは、パイプラインレベルであれモジュールレベルであれ、一般化可能かつ堅牢であることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:38:54 GMT)
A Versatile Pathology Co-pilot via Reasoning Enhanced Multimodal Large Language Model [28.0] 本稿では、ROIレベルとWSIレベルのタスクを同時に処理できる汎用MLLMであるSmartPath-R1を提案する。
本フレームワークは,スケール依存型微調整とタスク認識型強化微調整を組み合わせることで,チェーン・オブ・ファシリテータの必要性を回避する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:51:01 GMT)
MME-SCI: A Comprehensive and Challenging Science Benchmark for Multimodal Large Language Models [27.4] MLLM(Multimodal large language model)は、様々な領域において大きな進歩を遂げている。
科学分野のベンチマークはMLLMの推論能力を評価する上で重要な役割を果たしてきた。
1)多言語シナリオにおけるモデルの推論能力の不十分な評価、2)MLLMの包括的なモダリティカバレッジの不十分な評価、3)科学的知識ポイントの詳細なアノテーションの欠如。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:27:55 GMT)
ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [26.9] 理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:13:41 GMT)
Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction [26.8] 心臓共鳴画像(CMR)は心血管疾患の診断・管理に重要なツールである。
その効用は、しばしば2D短軸スライスをスパースに取得することで制限され、不完全なボリューム情報をもたらす。
既存の手法では、事前定義されたスキームへの依存、計算の非効率性、追加入力への依存など、課題に直面している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:36:16 GMT)
ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents [26.8] 我々は,エージェントが複雑なデジタルワークスペースを巧みに操作できるようにする,自律デスクトップインテリジェンスのためのフレームワークであるComputerRLを紹介する。
ComputerRLは、プログラム的なAPI呼び出しと直接GUIインタラクションを統合し、マシンエージェントと人間中心のデスクトップ環境間の固有のミスマッチに対処するAPI-GUIパラダイムを備えている。
本研究では,強化学習と教師付き微調整を交互に行う訓練戦略であるEntropulseを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:59:45 GMT)
A Lightweight Dual-Mode Optimization for Generative Face Video Coding [26.3] 生成顔画像符号化(GFVC)は、深部生成モデルの強い推論能力を活用することにより、より優れた速度歪み性能を実現する。
本稿では,再構成品質を維持しつつ,複雑性を低減するために2モード最適化を実現する軽量なGFVCフレームワークを提案する。
実験の結果,GFVCの軽量デュアルモード最適化は,ベースラインに比べて90.4%のパラメータ削減と88.9%の省力化を実現できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:09:28 GMT)
MHSNet:An MoE-based Hierarchical Semantic Representation Network for Accurate Duplicate Resume Detection with Large Language Model [26.2] Recruitersは、サードパーティのWebサイトから履歴書を継続的に検索する必要がある。
第三者の履歴書は不完全で不正確であることが多い。
コントラスト学習を用いてBGE-M3を微調整するフレームワークであるMHSNetを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:27:14 GMT)
GoAI: Enhancing AI Students' Learning Paths and Idea Generation via Graph of AI Ideas [25.6] GoAIは、AI研究論文から教育知識グラフを構築するためのツールである。
私たちが構築したナレッジグラフのノードには、論文やコンセプト、スキル、ツールといった必要不可欠な知識が含まれています。
学生が特定の論文を検索すると、ビームサーチに基づく経路探索法がフィールドの現況を辿ることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:21:20 GMT)
EmoSEM: Segment and Explain Emotion Stimuli in Visual Art [25.5] 芸術的イメージが与えられたモデルでは、特定の人間の感情をトリガーするピクセル領域をピンポイントし、それに対する言語学的説明を生成する。
本稿では,感情理解能力を持つセグメンテーションフレームワークを実現するために,感情刺激・説明モデル(EmoSEM)モデルを提案する。
本手法は,低レベルの画素特徴から高レベルの感情解釈へのエンド・ツー・エンド・モデリングを実現し,視覚的感情分析のための第1の微粒化フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:31:57 GMT)
CausalPlan: Empowering Efficient LLM Multi-Agent Collaboration Through Causality-Driven Planning [25.3] CausalPlanは、明示的な構造因果推論を大規模言語モデル(LLM)計画プロセスに統合するフレームワークである。
我々は,5つのマルチエージェント調整タスクと4つのLLMの異なるサイズで,Overcooked-AIベンチマークでCausalPlanを評価した。
その結果、CausalPlanは不適切なアクションを一貫して削減し、AI-AIとヒューマン-AI設定の両方でのコラボレーションを改善していることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:37:20 GMT)
End-to-End Audio-Visual Learning for Cochlear Implant Sound Coding in Noisy Environments [24.8] 本稿では,深層学習に基づくElectronNet-CS(ECS)音声符号化戦略のための事前処理モジュールとして,AVSEモデルを利用した新しいノイズ抑圧型CIシステムAVSE-ECSを提案する。
実験結果から,提案手法は雑音条件下でのECS戦略より優れており,客観的音声の明瞭度が向上していることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:15:17 GMT)
LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos [24.6] LongSplatは、不規則なカメラの動き、未知のカメラポーズ、拡張的なシーンを特徴とする、カジュアルにキャプチャされたロングビデオからの新規ビュー合成(NVS)の課題に対処する。
長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺長尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺高尺
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:59:56 GMT)
AdaptJobRec: Enhancing Conversational Career Recommendation through an LLM-Powered Agentic System [24.6] AdaptJobRecは、自律エージェントを活用してパーソナライズされたレコメンデーションアルゴリズムツールを統合する、最初の会話型ジョブレコメンデーションシステムである。
このシステムは、応答遅延を最小限に抑えるために、ユーザクエリの複雑さを識別するメカニズムを採用している。
AdaptJobRecは、競合するベースラインと比較して平均レスポンスレイテンシを最大53.3%削減する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:44:25 GMT)
MMReview: A Multidisciplinary and Multimodal Benchmark for LLM-Based Peer Review Automation [24.6] 大きな言語モデル(LLM)は、レビューコメントの生成を支援するために、ますます採用されている。
現在のLLMベースのレビュータスクは、包括的な、正確で、人間に沿ったアセスメントを生成するモデルの能力を厳格に評価するための統一された評価ベンチマークを欠いている。
我々は、複数の分野とモダリティにまたがる包括的なベンチマークである textbfMMReview を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:37:19 GMT)
SVDformer: Direction-Aware Spectral Graph Embedding Learning via SVD and Transformer [24.6] SVDformerは、方向対応グラフ表現学習のためのSVDとTransformerアーキテクチャを相乗化する新しいフレームワークである。
6つの有向グラフベンチマークの実験は、SVDformerがノード分類タスクにおける最先端のGNNと方向対応のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:32:18 GMT)
STPFormer: A State-of-the-Art Pattern-Aware Spatio-Temporal Transformer for Traffic Forecasting [24.6] 時空間の複雑なパターン、動的空間構造、多様な入力形式により、時空間のトラフィック予測は困難である。
本稿では,一元的かつ解釈可能な表現学習による最先端性能を実現する時空間パターン認識変換器を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:23:38 GMT)
Revisiting Diffusion Q-Learning: From Iterative Denoising to One-Step Action Generation [24.5] One-Step Flow Q-Learning(OFQL)は、トレーニングと推論の両方で効率的なワンステップアクション生成を可能にする新しいフレームワークである。
D4RLベンチマークの実験では、OFQLがDQLや他の拡散ベースのベースラインより優れていることが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:05:55 GMT)
Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward [24.1] 大規模言語モデル(LLM)は、目覚ましい問題解決能力を示すが、静的な内部知識のために複雑なタスクに苦しむ。
エージェントディープリサーチの最近の進歩は、LSMに自律的に情報を分析し、検索し、合成する権限を与えている。
我々はまず、推論を微粒な機能単位に分解する新しいLCM思考パラダイムであるAtomic Thoughtを提案する。
そこで我々は,Atom ThoughtとATRを統合したエージェントディープリサーチのための新しいRLフレームワークAtom-Searcherを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:40:33 GMT)
Diffusion Noise Feature: Accurate and Fast Generated Image Detection [23.9] 拡散雑音特徴(DNF)という新しい表現を提案する。
DNFは、人工的生成の指紋として機能する微妙で高周波のアーティファクトを増幅する。
提案手法は, 生成画像の検出において, 顕著な精度, 堅牢性, 一般化を実現する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:29:31 GMT)
Chimera: Efficiently Training Large-Scale Neural Networks with Bidirectional Pipelines [23.6] 本稿では,大規模モデルを効率的に学習するための双方向パイプラインを組み合わせた新しいパイプライン並列化手法であるChimeraを提案する。
最新の同期パイプラインアプローチと比較して、Chimeraはバブルの数を最大50%削減する。
Piz Daintスーパーコンピュータの2,048のGPUノード上で動作する13億のパラメータを持つGPT-2モデルにおいて、Chimeraは、最先端の同期および非同期パイプラインアプローチよりも1.16x-2.34xのトレーニングスループットを改善する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:15:31 GMT)
3D-Generalist: Self-Improving Vision-Language-Action Models for Crafting 3D Worlds [23.3] 基礎モデルのトレーニングデータとして利用できる高品質な3D環境を生成するためのスケーラブルな手法を提案する。
提案するフレームワークである3D-Generalistは、ビジョンランゲージモデルを用いて、より迅速な3D環境を生成する。
生成したデータに対して視覚基盤モデルを事前学習することにより,合成データ生成における品質とスケーラビリティを実証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:36:27 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.0] 大規模言語モデル(LLM)は論理的推論、文脈内学習、コード生成において顕著な能力を示している。
LGR2 は LLM を利用して高次ポリシーのための言語誘導報酬関数を生成する新しい HRL フレームワークである。
スパース環境における試料効率をさらに高めるため, 目標条件付き後視体験レザベリングを統合した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:03:08 GMT)
Mitigating Cross-Image Information Leakage in LVLMs for Multi-Image Tasks [22.9] 本稿では,推論中のクロスイメージ情報漏洩を緩和する,トレーニングフリーでアーキテクチャに依存しないデコーディング戦略を提案する。
FOCUSは4つのマルチイメージベンチマークと多様なLVLMファミリーのパフォーマンスを継続的に改善する。
このことは、FOCUSが、追加のトレーニングやアーキテクチャの変更なしに、マルチイメージ推論を強化する汎用的で実用的なソリューションを提供することを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:31:39 GMT)
OmViD: Omni-supervised active learning for video action detection [22.9] この研究では、ビデオレベルのタグ、ポイント、スクリブル、バウンディングボックス、ピクセルレベルのマスクについて調査している。
これらのアノテーションから擬似ラベルを生成するために、新しい3D-スーパーピクセルアプローチを導入し、効果的なトレーニングを可能にした。
このアプローチは101-24とJHMDB-21データセットで検証されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:19:58 GMT)
Personalized Subgraph Federated Learning with Sheaf Collaboration [22.8] FedSheafHNは、効率的なパーソナライズされたモデル生成で拡張されたクライアント記述子を統合するための、棚のコラボレーションメカニズム上に構築された新しいフレームワークである。
具体的には、FedSheafHNは各クライアントのローカルサブグラフをサーバ構築のコラボレーショングラフに埋め込む。
サーバ最適化ハイパーネットワークを通じて、カスタマイズされたクライアントモデルを生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:52:50 GMT)
One Shot vs. Iterative: Rethinking Pruning Strategies for Model Compression [22.5] プルーニング(Pruning)は、ニューラルネットワークを圧縮して効率を向上させる技術である。
ワンショットプルーニングと反復プルーニングは、このプロセスに対する2つのアプローチである。
本研究では, 単発プルーニングが低いプルーニング比で有効であるのに対して, 反復プルーニングは高い比率でより良い性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:57:10 GMT)
Slot Attention with Re-Initialization and Self-Distillation [22.0] 本稿では、オブジェクトの発見と認識のための再初期化と自己蒸留(DIAS)によるスロット注意を提案する。
DIASはオブジェクトの発見や認識といったOCLタスクの最先端のタスクを実現し、高度な視覚的予測と推論を改善している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:24:31 GMT)
Soft Reasoning: Navigating Solution Spaces in Large Language Models through Controlled Embedding Exploration [21.8] 大きな言語モデル(LLM)は、多様性と非効率的な探索のために複雑な推論に苦しむ。
我々は,第1トークンの埋め込みを最適化して生成をガイドする埋め込み型検索フレームワークであるSoft Reasoningを提案する。
実験では、最小限の計算で優れた正確性を示し、スケーラブルでモデルに依存しないソリューションである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:45:20 GMT)
ContrastAlign: Toward Robust BEV Feature Alignment via Contrastive Learning for Multi-Modal 3D Object Detection [21.5] 異種モダリティのアライメントを高めるための新しいContrastAlignアプローチを提案する。
提案手法は,mAPが71.5%のSOTA性能を達成し,nuScenes val セットで GraphBEV を 1.4% 上回った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:07:30 GMT)
Legal$Δ$: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain [21.2] 我々は、チェーン・オブ・インフォメーションによる法的推論を強化するために、Legal$Delta$を提案する。
Legal$Delta$はデュアルモードの入力設定と直接応答と推論拡張モードを使用する。
ラベル付き嗜好データに頼ることなく、一貫してより堅牢で信頼できる法的判断を下す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:05:06 GMT)
Hyperspectral Image Generation with Unmixing Guided Diffusion Model [21.1] ハイパースペクトル画像合成(Hyperspectral image synthesis)は、サンプルの多様性を制限する条件付き生成パラダイムによって制約されているが、関心が高まり続けている問題である。
ハイパースペクトルアンミキシングによって明示的に導かれる拡散フレームワークを導入し,課題を克服する。
このアプローチは、(i)画像領域から低次元のアバンダンス多様体に生成を射影する未混合オートエンコーダと、(ii)非負性および和対1の制約を強制するアバンダンス拡散プロセスの2つの協調的なコンポーネントを統合する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:33:37 GMT)
TOM: An Open-Source Tongue Segmentation Method with Multi-Teacher Distillation and Task-Specific Data Augmentation [20.8] 舌画像は、特に中国伝統医学(TCM)において、貴重な診断ツールとして機能する。
本稿では,多教師の知識蒸留に基づく舌画像分割モデル(TOM)を提案する。
私たちの知る限り、これはオープンソースかつ無償で利用可能な舌画像分割ツールとしては初めてのものです。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:21:47 GMT)
LEGO: Learning and Graph-Optimized Modular Tracker for Online Multi-Object Tracking with Point Clouds [20.7] 本稿では,データアソシエーション性能を向上させるための学習とグラフ最適化(LEGO)モジュールトラッカーを提案する。
提案するLEGOトラッカーは,グラフ最適化と自己認識機構を統合し,アソシエーションスコアマップを効率的に定式化する。
提案手法は,他のオンライントラッキング手法と比較して,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:31:03 GMT)
RynnEC: Bringing MLLMs into Embodied World [20.4] RynnECは、認知の具体化のために設計されたビデオ多モーダル大言語モデルである。
RynnECにはリージョンエンコーダとマスクデコーダが組み込まれており、フレキシブルなリージョンレベルのビデオインタラクションを可能にする。
RynnECは、オブジェクトプロパティ理解、オブジェクトセグメンテーション、空間推論において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:00:01 GMT)
Backdooring Self-Supervised Contrastive Learning by Noisy Alignment [19.6] 自己教師付きコントラスト学習(CL)は、画像や画像とテキストのペアを含むラベルのないデータから転送可能な表現を効果的に学習する。
敵は、有毒な画像を事前訓練されたデータセットに注入することができ、妥協したCLエンコーダが下流のタスクで誤った振る舞いを示す。
有毒画像の雑音成分を明示的に抑制するDPCL法であるノイズアライメント(NA)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:25:43 GMT)
AI Testing Should Account for Sophisticated Strategic Behaviour [19.6] このポジションペーパーは、AIテストと評価に関する2つの主張を論じている。
第一に、評価はAIシステムが彼らの状況を理解し、戦略的に推論する可能性を考慮する必要がある。
第2に、ゲーム理論分析は、評価に基づく安全事例の推論を形式化し、精査することにより、評価設計に情報を与えることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:48:25 GMT)
Towards Efficient Vision State Space Models via Token Merging [19.5] State Space Models (SSM) はコンピュータビジョンの強力なアーキテクチャとして登場した。
本研究では,SSMベースの視覚モデルに適したトークンマージ戦略であるMaMeを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:08:29 GMT)
Unintended Misalignment from Agentic Fine-Tuning: Risks and Mitigation [19.3] エージェントタスクを実行するための微調整された大規模言語モデル(LLM)は、有害なタスクを実行する可能性が高くなる可能性がある。
プリフィックスインジェクションガード(PING)は、エージェント応答に自動的に生成された自然言語プレフィックスをプリペンドする。
Pingは、Webナビゲーションとコード生成タスクの両方において、さまざまなベンチマークで既存のプロンプトアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:53:35 GMT)
Joint Learning of Energy-based Models and their Partition Function [19.2] エネルギーベースモデル(EBM)は、ニューラルネットワークを用いて確率分布をパラメータ化するための柔軟なフレームワークを提供する。
本研究では,ESMを大規模に学習するための新しい定式化法を提案する。
当社のアプローチは,Fenchel-Young損失の広範な家族に自然に及んでいることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:30:43 GMT)
BetaWeb: Towards a Blockchain-enabled Trustworthy Agentic Web [19.2] 本稿ではブロックチェーン対応の信頼できるエージェントWeb(BetaWeb)を紹介する。
ブロックチェーンの本質的な強みを活用することで、BetaWebはLaMASに信頼できるスケーラブルなインフラストラクチャを提供します。
BetaWebフレームワークの体系的な検討の他に,本論文では,5段階の進化ロードマップを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:43:49 GMT)
Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation [19.0] 我々は,textbfRtextbfEfining multi-modtextbfAl conttextbfRastive learning and hotextbfMography relationsを提案する。
実世界の3つのデータセットに対する実験は、REARMの様々な最先端ベースラインに対する優位性を実証している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:35:48 GMT)
MimicFunc: Imitating Tool Manipulation from a Single Human Video via Functional Correspondence [19.0] 人間のビデオからツールを操作することは、ロボットを教えるための直感的なアプローチを提供する。
関数フレームとの関数対応を確立するフレームワークであるMimicFuncを提案する。
MimicFuncは、単一のRGB-Dビデオから新しいツールを操作するためのスキルを効果的に一般化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:49:47 GMT)
Unleashing Semantic and Geometric Priors for 3D Scene Completion [18.5] カメラベースの3Dセマンティックシーン補完(SSC)は、自律走行とロボットナビゲーションのための密集した幾何学的および意味的知覚を提供する。
既存の手法は、意味的および幾何学的事前情報を提供するために結合エンコーダに依存している。
本稿では、ソースレベルとパスレベルの両方で二重分離を行う新しいフレームワークであるFoundationSSCを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:10:39 GMT)
Vector-Quantized Vision Foundation Models for Object-Centric Learning [18.4] オブジェクト中心学習(OCL)のための統一アーキテクチャ、ベクトル量子化VFMを提案する。
我々の統一の鍵は、OCL集約と復号におけるVFM表現の量子化である。
私たちのVVOは、オブジェクトの発見と認識のベースラインと、下流の視覚的予測と推論を一貫して上回ります。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:59:23 GMT)
Unlocking the Potential of MLLMs in Referring Expression Segmentation via a Light-weight Mask Decoder [18.2] 本稿では,MLLMビジョンエンコーダに符号化された視覚的特徴を,余分な視覚的エンコーダを導入することなく活用する新しいフレームワークを提案する。
さらに,MLLMの大規模言語モデル(LLM)によって出力される意味関連特徴と,詳細関連視覚特徴とを完全に統合した,詳細拡張型・意味整合型特徴融合モジュール(DSFF)を提案する。
我々の手法は一般にSAMベースの競合とSAMフリーの競合に勝り、性能とコストのバランスが良くなる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:35:04 GMT)
Heterogeneous Influence Maximization in User Recommendation [18.1] 本稿では,ユーザ推薦システムのためのHeteroIRとHeteroIMという2つのモデルを提案する。
HeteroIRは、ユーザ推薦システムの普及可能性を解き放つための直感的なソリューションを提供する。
HeteroIMはIM手法と推奨タスクのギャップを埋め、インタラクションの意欲を改善し、スプレッドカバレッジを最大化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:20:48 GMT)
MGT-Prism: Enhancing Domain Generalization for Machine-Generated Text Detection via Spectral Alignment [18.0] MGT-Prismは周波数領域の観点からMGT検出法である。
MGT-Prismの精度は平均0.90%,F1スコアは0.92%向上した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:09:45 GMT)
Automated Energy-Aware Time-Series Model Deployment on Embedded FPGAs for Resilient Combined Sewer Overflow Management [17.9] 気候変動によって激化する極度の気象現象は、下水道システムの老朽化に挑戦する傾向にある。
下水道流域充填量の予測は早期介入に有効な洞察を与えることができる。
本稿では,エッジデバイス上でエネルギー効率の高い推論を可能にするエンドツーエンド予測フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:06:04 GMT)
SaMOSA: Sandbox for Malware Orchestration and Side-Channel Analysis [17.9] SaMOSAは、モジュール的でカスタマイズ可能なサンドボックスフレームワークを提供することで、Linuxマルウェア分析のギャップを埋める。
SaMOSAは、システムコール、ネットワークアクティビティ、ディスクアクティビティ、ハードウェアパフォーマンスカウンタなど、より多くのサイドチャネルをキャプチャする。
OTとCPSで主に使用される3つのアーキテクチャ、すなわちx86-64、ARM64、PowerPC64をサポートする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:41:24 GMT)
Flexible Operator Fusion for Fast Sparse Transformer with Diverse Masking on GPU [17.6] フレキシブルマスキングとGPU上の演算子融合によるスパーストランスフォーマーの最適化を組み込んだフレームワークであるSTOFを提案する。
STOFは,MHA計算で1.7倍,エンドツーエンド推論で1.5倍の高速化を実現する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:26:23 GMT)
MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination [17.6] MuFlexはスケーラブルでオープンソースのプラットフォームで、マルチビルドのフレキシビリティ調整のための制御戦略のベンチマークとテストを行う。
プラットフォーム能力は、4つのオフィスビルの需要柔軟性を調整したケーススタディで実証された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:44:06 GMT)
ReservoirTTA: Prolonged Test-time Adaptation for Evolving and Recurring Domains [17.4] ReservoirTTAは、長期間のテスト時間適応のために設計された新しいプラグインフレームワークである。
中心となるReservoirTTAはドメイン特化モデルの貯水池を維持している。
理論的解析により,パラメータの分散を束縛し,モデル崩壊を防ぐ重要な要素が明らかになった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:47:50 GMT)
Learning In-context n-grams with Transformers: Sub-n-grams Are Near-stationary Points [17.3] In-context next-token predictionタスクで訓練されたトランスフォーマーモデルの損失状況について検討する。
特に、コンテキスト内$n$-gramの言語モデルをクロスエントロピー損失下で学習することに焦点を当てる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:36:39 GMT)
Reinforcement Learning to Rank Using Coarse-grained Rewards [17.1] 粗い粒度のフィードバック信号は、よりアクセシブルで手頃な価格である。
既存の強化学習 ランクへのアプローチは、高いばらつきと低いサンプル効率に悩まされる。
本稿では,大規模言語モデルに広く用いられているRLアルゴリズムに基づいて,新しい強化学習手法をランク付けする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:02:50 GMT)
Script-Strategy Aligned Generation: Aligning LLMs with Expert-Crafted Dialogue Scripts and Therapeutic Strategies for Psychotherapy [17.1] 大規模言語モデル(LLM)は、より柔軟な相互作用の可能性を秘めているが、心理療法のような高い文脈において制御性や説明可能性に欠ける。
LLMと専門家によるスクリプトの整合性は精神療法の成績を高めるかを検討するために2つの研究を行った。
結果をもとに,より柔軟なアライメント手法であるスクリプト・ストラテジー・アライメント・ジェネレーション(SSAG)を提案した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:43:39 GMT)
Revisiting MLLM Token Technology through the Lens of Classical Visual Coding [16.9] 本稿では,トークン化,トークン圧縮,トークン推論などのMLLMトークン技術を再検討する。
本研究は,MLLMトークンと視覚符号化の包括的および構造的比較を行った最初の技術である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:36:44 GMT)
Programmable Anyon Mobility through Higher Order Cellular Automata [16.9] モビリティの制御は、ロバストな量子記憶と対称性に富んだ位相位相をサブシステム対称性で理解するために重要である。
SET物理に強力なコンピュータサイエンスツールである高次セルオートマトン(HOCA)を導入する。
まず,有限深度HOCA制御ユニタリ量子回路を設計し,Abelian anyons と全ての局所的に生成されたサブシステム対称性を正確に解ける SET モデルを生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:53:45 GMT)
ROVR-Open-Dataset: A Large-Scale Depth Dataset for Autonomous Driving [16.8] 動的屋外運転環境における深度推定のための大規模・多種多様なフレームワイド連続データセットを提案する。
既存のデータセットと比較すると、駆動シナリオの多様性と深度密度の低下が示され、一般化のための新たな課題が生まれる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:13:49 GMT)
UnZipLoRA: Separating Content and Style from a Single Image [16.6] UnZipLoRAは、イメージを構成対象とスタイルに分解する方法である。
UnZipLoRAは、両方のLoRAを同時にトレーニングすることで、これらの要素を単一のイメージから切り離す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:47:48 GMT)
Multi-view Clustering via Bi-level Decoupling and Consistency Learning [16.5] マルチビュークラスタリングは,マルチビューデータの基盤となるパターンを解析するための有効な手法であることが示されている。
本稿では,多視点データに対する効果的な表現を探索するバイレベルデカップリング・一貫性学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:17:54 GMT)
Towards Theoretical Understanding of Transformer Test-Time Computing: Investigation on In-Context Linear Regression [16.5] 言語モデル推論中により多くのテストタイム計算を使用することで、より中間的な考えを生成したり、複数の候補回答をサンプリングしたりするなど、効果的であることが証明された。
本稿では,実用的な言語モデル推論と理論的トランスフォーマー解析のギャップを埋める第一歩を踏み出す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:54:07 GMT)
V2P: From Background Suppression to Center Peaking for Robust GUI Grounding Task [16.5] Valley-to-Peakメソッドは、人間がGUI要素を視覚的に処理し、操作する方法にインスパイアされている。
V2PでトレーニングされたモデルはScreenSpot-v2とScreenSpot-Proの2つのベンチマークで92.3%と50.5%を達成した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:47:44 GMT)
Efficient Knowledge Graph Unlearning with Zeroth-order Information [16.5] 本稿では,効率的な知識グラフ(KG)アンラーニングアルゴリズムを提案する。
KGアンラーニングは、KGの特異な構造と実体間の意味的関係のために非自明である。
実験により,提案手法が他の最先端のグラフ学習ベースラインより優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:22:50 GMT)
AutoScale: Linear Scalarization Guided by Multi-Task Optimization Metrics [16.4] 高い勾配等級類似度などの主要なMTO指標において,高い性能のスカラー化重みが特定の傾向を示すことを示す。
我々は、これらのMTOメトリクスを使用して、高価なウェイトサーチなしで、リニアスキャラライズのためのウェイトセレクションをガイドするフレームワークであるAutoScaleを紹介した。
AutoScaleは、新しい大規模ベンチマークを含む、さまざまなデータセットで高い効率で、一貫して優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:14:00 GMT)
Schrödingerization for quantum linear systems problems [16.3] 線形方程式 Ax=b の量子アルゴリズムをSchr"オーディンジェライゼーション-形式問題の観点から開発する。
A が正定値であるとき、解 x は線型ODE の定常解と解釈できる。
どちらの場合においても、解 x はシュリンガー化形式問題のLCHSとして表すことができ、あるいは同等にシュリンガー化形式問題の定常解として表すことができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:48:45 GMT)
SEA-LION: Southeast Asian Languages in One Network [16.1] 本稿では,Llama-SEA-LION-v3-8B-ITとGemma-SEA-LION-v3-9B-ITを紹介する。
LLMのSEA-LIONファミリーは、英語、中国語、インドネシア語、ベトナム語、マレー語、タイ語、ビルマ語、ラオス語、フィリピン語、タミル語、クメール語を含む11のSEA言語をサポートしている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:42:48 GMT)
Penalizing Infeasible Actions and Reward Scaling in Reinforcement Learning with Offline Data [16.1] オフラインデータによる強化学習はQ値外挿誤差に悩まされる。
本稿では,データ範囲外におけるQ値の段階的減少を導くことを提案する。
RS-LNとPAを組み合わせることで、PARSと呼ばれる新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:06:02 GMT)
Structured Agentic Workflows for Financial Time-Series Modeling with LLMs and Reflective Feedback [16.0] 時系列データは金融市場における意思決定の中心であるが、ハイパフォーマンス、解釈可能、監査可能なモデルの構築は依然として大きな課題である。
textsfTSAgentは、金融アプリケーションの時系列モデリングの自動化と強化を目的として設計されたモジュラーエージェントフレームワークである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:14:49 GMT)
To Theoretically Understand Transformer-Based In-Context Learning for Optimizing CSMA [16.0] バイナリ指数バックオフ方式はWiFi 7で広く使われているが、動的チャネル環境下ではスループットが低下している。
最近のモデルベースアプローチは、既知のノード密度と固定されたノード密度の下でのバックオフ戦略を単純に最適化する。
本稿では、チャネルアクセスを最適化するためのトランスフォーマーベースのインコンテキスト学習(ICL)理論を初めて提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:29:34 GMT)
Approximate Bayesian Inference via Bitstring Representations [15.8] 本稿では,表現によって生成される量子化された離散パラメータ空間において確率的推論を実行することを提案する。
この研究は、確率計算の離散近似を利用して、スケーラブルで解釈可能な機械学習を前進させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:08:17 GMT)
Scalable Scientific Interest Profiling Using Large Language Models [15.6] 科学的な関心プロファイルを生成するための2つの大規模言語モデルに基づく手法を開発し評価する。
PubMedの要約と、MeSH(Messical Subject Headings)用語を用いた要約を行い、研究者の自己記述プロファイルと比較する。
手作業によるレビューでは、MeSHベースのプロファイルの77.78パーセントが良し悪しと評価され、可読性は93.44パーセントで好まれ、パネリストはMeSHベースのプロファイルを67.86パーセントで比較した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:45:39 GMT)
Diagnostic-Guided Dynamic Profile Optimization for LLM-based User Simulators in Sequential Recommendation [15.6] DGDPOは動的かつ反復的な最適化プロセスを通じてユーザプロファイルを構築する新しいフレームワークである。
シングルラウンドインタラクションに限定された既存のLCMベースのユーザシミュレータとは異なり、DGDPOをシーケンシャルレコメンデータと統合するのは初めてです。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:53:38 GMT)
LM Agents May Fail to Act on Their Own Risk Knowledge [15.6] 言語モデル(LM)エージェントは、安全クリティカルなシナリオにおいて、様々な潜在的な、深刻なリスクをもたらす。
Sudo rm -rf /*' が危険なのか?」といった質問に対して "Yes" と答えることが多いが、インスタンス化された軌跡におけるそのようなリスクを特定できない可能性が高い。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:46:08 GMT)
Contrastive Learning on Multimodal Analysis of Electronic Health Records [15.4] 本稿では,新しい特徴埋め込み生成モデルを提案し,マルチモーダルEHR特徴表現を得るためのマルチモーダルコントラスト損失を設計する。
本理論は, 単モーダル学習と比較して, 多モーダル学習の有効性を実証するものである。
この接続は、マルチモーダルEHR特徴表現学習に適したプライバシー保護アルゴリズムの道を開く。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:31:30 GMT)
Enhancing Visual Reliance in Text Generation: A Bayesian Perspective on Mitigating Hallucination in Large Vision-Language Models [15.3] LVLM(Large Vision-Language Models)は通常、コンテキストコヒーレンスを満たすテキストを生成するが、視覚入力と一致しない。
本稿では,ベイズ的視点からLVLMのテキスト生成における視覚的依存を退避させる要因について検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:37:11 GMT)
Universal Abstraction: Harnessing Frontier Models to Structure Real-World Data at Scale [15.3] 実際の患者情報のかなりの部分は、構造化されていない臨床テキストに存在している。
医学的抽象化は、フリーテキスト臨床ノートから重要な構造化属性を抽出し、正規化する。
ゼロショット医療抽象化のための統一フレームワークであるUniMedAbstractor(UMA)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:36:27 GMT)
WeTok: Powerful Discrete Tokenization for High-Fidelity Visual Reconstruction [15.1] WeTokトークンを強力かつ簡潔に導入する。
従来の主要なトークン化ツールを2つのコアイノベーションで上回っている。
主要なベンチマークの実験では、WeTokの優れたパフォーマンスが示されています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:39:48 GMT)
CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.1] CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。
自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。
CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:18:10 GMT)
CALYPSO: Forecasting and Analyzing MRSA Infection Patterns with Community and Healthcare Transmission Dynamics [15.1] 本稿では,ニューラルネットワークと機械的メタポピュレーションモデルを統合するハイブリッドフレームワークCALYPSOを提案する。
機械学習のベースラインと比較して,CALYPSOは州全体の予測性能を4.5%以上改善している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:11:21 GMT)
WHALES: A Multi-Agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving [15.0] WHALESは,通信対応エージェントスケジューリングとスケーラブルな協調認識のベンチマークのために設計された,最初の大規模V2Xデータセットである。
WHALESは、シーンごとに平均8.4の協調エージェントと、さまざまな交通シナリオにまたがる2100万の注釈付き3Dオブジェクトを備えている。
リアルタイム通信ボトルネックをエミュレートするために、詳細な通信メタデータを組み込んでおり、スケジューリング戦略の厳密な評価を可能にしている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:15:31 GMT)
VoiceCloak: A Multi-Dimensional Defense Framework against Unauthorized Diffusion-based Voice Cloning [14.9] 拡散モデル(DM)は現実的な音声クローニング(VC)において顕著な成功を収めた
DMは、拡散の複雑な生成機構により、プロアクティブな防御と相容れないことが証明されている。
我々はVoiceCloakを紹介した。VoiceCloakは多次元のプロアクティブ・ディフェンス・フレームワークで、話者のアイデンティティを曖昧にし、潜在的な不正なVCの品質を劣化させることを目的としている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:51:51 GMT)
CrafterDojo: A Suite of Foundation Models for Building Open-Ended Embodied Agents in Crafter [14.9] Minecraftはリッチな複雑さとインターネット規模のデータを提供するが、速度とエンジニアリングのオーバーヘッドが遅いため、高速なプロトタイピングには適さない。
Crafterは、Minecraftの重要な課題を維持する軽量な代替手段を提供するが、その用途は狭いタスクに限定されている。
CrafterDojoは、Crafter環境を軽量でプロトタイピングに親しみやすい、Minecraftライクなテストベッドとしてアンロックする基盤モデルとツールのスイートです。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:43:19 GMT)
Train for the Worst, Plan for the Best: Understanding Token Ordering in Masked Diffusions [14.9] 仮面拡散モデル (MDMs) は、離散領域にまたがる生成的モデリングのための有望な代替手法として登場した。
適応推論は、事前訓練されたMDMの精度を7$%から90$%に向上させ、ARMを7times$のパラメータで上回ります。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:35:57 GMT)
Is-NeRF: In-scattering Neural Radiance Field for Blurred Images [14.7] 本稿では,実環境における光パスの明示的なモデリングを特徴とする新しいデブルーニューラルラジアンス場Is-NeRFを提案する。
複雑な実世界のシナリオを効果的に処理し、正確な幾何学的詳細を持つ高忠実度画像を生成する上で、最先端のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:13:02 GMT)
Online Conformal Selection with Accept-to-Reject Changes [14.6] アクセプション・トゥ・リジェクト・チェンジ(OCS-ARC)を用いたオンラインコンフォーマル・セレクションを提案する。
オンラインのBenjamini-Hochberg手順を候補選択プロセスに組み込む。
我々は,OCS-ARCが任意の段階において,名目レベル以下で偽発見率(FDR)を制御できることを理論的に保証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:58:38 GMT)
Gaussian Approximation and Multiplier Bootstrap for Stochastic Gradient Descent [14.2] 信頼性セット構築のための乗算器ブートストラップの非漸近的妥当性を確立する。
我々は1/sqrtn$までの凸距離の近似レートを導出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:00:53 GMT)
The DeepLog Neurosymbolic Machine [14.0] 我々はDeepLogと呼ばれるニューロシンボリックAIの理論的かつ運用的なフレームワークに貢献する。
DeepLogはニューロシンボリックAIのためのビルディングブロックとプリミティブを導入した。
幅広いニューロシンボリック系を表現し、エミュレートすることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:58:24 GMT)
OmniTry: Virtual Try-On Anything without Masks [14.0] 本稿では,VTON(Virtual Try-ON)を衣料以外のウェアラブルオブジェクトにまで拡張する統合フレームワークであるOmniTryについて述べる。
データキュレーションは、オブジェクト画像とそれに対応する試行結果のペア画像を得るのに困難である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:47:31 GMT)
May the Feedback Be with You! Unlocking the Power of Feedback-Driven Deep Learning Framework Fuzzing via LLMs [14.0] ファズテスト(ファズテスト、fuzzing)は、ディープラーニング(DL)フレームワークのバグを見つけるための、シンプルで効果的な方法である。
本稿では,LLM(Large Language Model)とLLM(Generation LLM)という2つの大言語モデル(LLM)からなるフィードバック情報を効果的に活用するFUELを提案する。
FUELはPyTorchのラインコードカバレッジを改善し、最先端のベースラインよりも9.15%、14.70%向上できることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:29:16 GMT)
RadGPT: Constructing 3D Image-Text Tumor Datasets [13.9] 今回,AbdomenAtlas 3.0を報告した。
全ての報告はボクセルマスクと組み合わせられ、肝臓、腎臓、膵腫瘍を記述している。
以上の結果より,AIによる報告ではセグメンテーションが腫瘍検出を強く改善することが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:05:14 GMT)
Heatmap Regression without Soft-Argmax for Facial Landmark Detection [13.7] 熱マップ回帰に基づく手法は、この課題における最先端の結果を達成するために広く用いられている。
argmax は微分できないため、これらの手法は微分可能な近似である Soft-argmax を用いてディープネット上でエンドツーエンドのトレーニングを可能にする。
本研究では、Soft-argmaxの使用という長年にわたる選択を再考し、強力なパフォーマンスを達成するための唯一の方法ではないことを実証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:03:29 GMT)
Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics [13.6] Learnable SMPLifyは、SMPLifyの反復フィッティングプロセスをシングルパス回帰モデルに置き換えるニューラルネットワークフレームワークである。
SMPLifyに比べて200倍近く高速なランタイムを実現し、3DPWやRICHによく対応し、LucidActionのプラグインツールとして使用する場合、モデルに依存しない方法として動作する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:53:57 GMT)
Nash Convergence of Mean-Based Learning Algorithms in First-Price Auctions [13.5] この研究は、固定値の入札者が平均ベースのアルゴリズムを用いて入札を学習する、繰り返し最初の価格オークションに焦点を当てる。
我々は平均的アルゴリズムの学習力学を完全に特徴付けている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:30:40 GMT)
VRoPE: Rotary Position Embedding for Video Large Language Models [13.5] テキストベース大規模言語モデル(LLM)における位置埋め込み(RoPE)の性能は高い。
RoPE-3Dのようなビデオ適応は、空間次元と時間次元を別々に符号化しようとするが、2つの大きな制限に悩まされる。
ビデオLLMに適した新しい位置符号化法である位置ロータリー埋め込み(VRoPE)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:20:53 GMT)
The Hidden Cost of Readability: How Code Formatting Silently Consumes Your LLM Budget [13.4] コードフォーマッティングが大規模言語モデル(LLM)の性能と効率に与える影響を評価する。
主要な発見は、LLMがフォーマットされたコードと未フォーマットのコード間で性能を維持することができ、平均的な入力トークンの減少が24.5%に達することを示唆している。
書式処理のための双方向コード変換ツールを開発し,既存の推論にシームレスに統合できる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:13:48 GMT)
Vehicle detection from GSV imagery: Predicting travel behaviour for cycling and motorcycling using Computer Vision [13.4] 本研究は,街路景観画像の深層学習を用いて,世界中の多様な都市でサイクリングとモーターサイクルのレベルを推定する手法を示す。
旅行調査や国勢調査から推定される自転車と自転車のモードシェアに関するデータ。
モデルは、最近のモード共有データがない60の都市に適用されました。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:43:20 GMT)
Prediction of Hospital Associated Infections During Continuous Hospital Stays [13.1] アメリカ疾病予防管理センター(CDC)は、メチシリン耐性黄色ブドウ球菌(MRSA)を深刻な抗菌抵抗性脅威として指定した。
特に入院患者ではMRSAの取得や生命予後の悪化のリスクが高い。
単座入院患者のMRSA検査結果の時系列をモデル化するための新しい生成確率モデルGenHAIを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:53:10 GMT)
PromptSuite: A Task-Agnostic Framework for Multi-Prompt Generation [13.0] 本稿では,様々なプロンプトの自動生成を可能にするフレームワークであるPromptSuiteを紹介する。
PromptSuiteはフレキシブルで、さまざまなタスクやベンチマークに最初から取り組んでいます。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:24:38 GMT)
ENCODE: Breaking the Trade-Off Between Performance and Efficiency in Long-Term User Behavior Modeling [13.0] EfficieNt Clustering を用いた twO-stage interest moDEling (ENCODE) と呼ばれる2段階の効率的な長期配列モデリング手法を提案する。
オフラインの抽出段階では、ENCODEは全動作シーケンスをクラスタリングし、正確な関心を抽出する。
オンライン推論の段階では、ECNODEは、ターゲットアイテムとの関連性を予測するために、既成のユーザ関心を生かしている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:58:21 GMT)
BeyondWeb: Lessons from Scaling Synthetic Data for Trillion-scale Pretraining [12.9] プレトレーニングのための高品質な合成データを生成する合成データ生成フレームワークであるBeyondWebを紹介した。
BeyondWebは、従来のWebスケールデータセットの機能を大幅に拡張した。
オープンなWebデータよりも最大7.7倍、Nemotron-Synthより2.7倍高速なトレーニングを提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:56:36 GMT)
GLASS: Test-Time Acceleration for LLMs via Global-Local Neural Importance Aggregation [12.9] A/I-GLASS: Activation- and Impact-based Global-Local Neural importance aggregate for feed-forward network SparSification。
複数のLarge Language Models (LLM) とベンチマークによる実証的な結果から、GLASSは事前のトレーニング不要な手法よりも大幅に優れていたことが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:50:20 GMT)
DNF-Avatar: Distilling Neural Fields for Real-time Animatable Avatar Relighting [12.9] モノクラービデオから、楽しくて計算可能な人間のアバターを作ることは、さまざまなアプリケーションで研究が進められているトピックだ。
以前の研究では、人間のアバターの幾何学的特徴と乱れの外観特性を推定するために、ニューラルネットワークと物理ベースレンダリング(PBR)を用いていた。
この問題に対処するために,暗黙のニューラルネットワークから明示的な2次元ガウススプラッティング表現への知識の抽出を提案した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:47:51 GMT)
Explainable Learning Rate Regimes for Stochastic Optimization [12.8] 現代の機械学習は勾配降下(SGD)によって訓練され、その性能は学習率(LR)が時間とともにどのように調整され減少するかに依存する。
既存のLRレギュレーションは複雑で、あるいは1つ以上の追加のハイパーパラメータを手動で調整する必要がある。
この研究は、内在的な勾配の変化によってのみLRが自動的に更新される方法を明らかにする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:51:38 GMT)
Breaking the SFT Plateau: Multimodal Structured Reinforcement Learning for Chart-to-Code Generation [12.8] 本稿では,マルチモーダル構造化強化学習(MSRL)を提案する。
実世界のarXivテーブルから300万のチャートコードペアを含む,これまでで最大のトレーニングコーパスを構築した。
MSRLはSFT高原を著しく破壊し、ChartMimicとReachQAのベンチマークでそれぞれ6.2%と9.9%の高水準のメトリクスを改善した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:40:18 GMT)
Setup Once, Secure Always: A Single-Setup Secure Federated Learning Aggregation Protocol with Forward and Backward Secrecy for Dynamic Users [12.8] フェデレートラーニング(FL)は、複数のユーザが生データを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
セキュアアグリゲーションプロトコルは、アグリゲーションされた更新のみを公開することで、このリスクを軽減する。
FLトレーニング全体のセットアップ操作を1つだけ必要とする,新たなセキュアアグリゲーションプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:02:28 GMT)
Non-Local and Quantum Advantages in Network Coding for Multiple Access Channels [12.8] 我々は、フィードバックなしで、メモリレスのマルチアクセスチャネル上での2-sender、1-receiver通信を検討する。
送信者が量子資源と非局所資源を協調的に符号化する場合の容量領域を示す。
協調符号化のための非局所的および量子的資源は、局所的資源よりも高い総和容量を実現できることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:08:43 GMT)
MAVIS: Multi-Objective Alignment via Value-Guided Inference-Time Search [12.7] 我々は、値誘導推論時間探索による多目的アライメントMAVISを紹介する。
ベースモデルの重みを変更することなく、LCMの挙動を動的に制御できる。
また,MAVISは,対象物ごとの微調整のベースラインよりも優れており,ポストホックと組み合わせていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:26:07 GMT)
MCPTox: A Benchmark for Tool Poisoning Attack on Real-World MCP Servers [12.7] MCPToxは,現実的なMCP設定において,ツールポジショニングに対するエージェントの堅牢性を評価する最初のベンチマークである。
MCPToxは、数ショットの学習によって1312の悪意のあるテストケースの包括的なスイートを生成し、潜在的なリスクの10のカテゴリをカバーする。
評価の結果,o1-miniで72.8%の攻撃成功率を達成したツールポイジングの脆弱性が広く報告されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:12:35 GMT)
HRS: Hybrid Representation Framework with Scheduling Awareness for Time Series Forecasting in Crowdsourced Cloud-Edge Platforms [12.6] 我々は,過度の負荷動態をよりよく捉えるために,スケジューリングを意識したハイブリッド表現フレームワークであるHRSを提案する。
HRSは10基準を一貫して上回り、最先端のパフォーマンスを実現し、SLA違反率を63.1%削減し、総利益損失を32.3%削減した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:02:50 GMT)
Boosting Adversarial Transferability for Hyperspectral Image Classification Using 3D Structure-invariant Transformation and Weighted Intermediate Feature Divergence [12.6] 敵対的攻撃はディープニューラルネットワーク(DNN)に基づくハイパースペクトル画像(HSI)分類にセキュリティ上の課題をもたらす
本稿では3次元構造不変変換と重み付き中間特徴分散を用いたHSI分類における逆例の転送可能性を向上させる手法を提案する。
実験により,提案手法により生成された逆の例は,3つの公開HSIデータセット上でより効果的な逆の転送性が得られることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:56:23 GMT)
MEGA: Second-Order Gradient Alignment for Catastrophic Forgetting Mitigation in GFSCIL [12.4] Graph Few-Shot Class-Incremental Learning (GFSCIL)は、大規模なベースデータセットで最初のトレーニングを行った後、新しいタスクの限られたサンプルからモデルを継続的に学習することを可能にする。
既存のGFSCILアプローチは通常、計量に基づくクラス表現にPN(Prototypeal Networks)を使用し、漸進的な学習段階においてモデルを微調整する。
本稿では,GFSCILの破滅的忘れを効果的に軽減することを目的とした,モデル非依存型メタグラフ連続学習(MEGA)を紹介する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:43:10 GMT)
Generative Model-Based Feature Attention Module for Video Action Analysis [12.4] 本稿では,特徴意味論の関係を学習するための新しい生成的注意ベースモデルを提案する。
本モデルでは,時間的行動特徴セマンティクスのフレーム依存性とセグメント依存性を同時に学習する。
我々は,広く認識されているデータセットに対する包括的検証を通じて,アプローチの優位性を実証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:56:02 GMT)
Fine-Grained Safety Neurons with Training-Free Continual Projection to Reduce LLM Fine Tuning Risks [12.2] 本研究では,FGSN (Fen-Grained Safety Neurons) をトレーニング不要連続投射法で提案し,微調整安全性リスクの低減を図る。
FGSNは本質的に、安全層と神経細胞の間のマルチスケールの相互作用を統合し、スペーサーとより精密な安全ニューロンを局在させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:06:26 GMT)
Multi-Turn Puzzles: Evaluating Interactive Reasoning and Strategic Dialogue in LLMs [12.2] 大きな言語モデル(LLM)は、明確で完全なステートメントで問題を解決するのに優れています。
このベンチマークは、複雑でインタラクティブなシナリオを扱う上で、現在のLLMの長所と短所に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:37:57 GMT)
Recommendations with Sparse Comparison Data: Provably Fast Convergence for Nonconvex Matrix Factorization [12.0] 本稿では,個別に評価するのではなく,各項目のペアを比較してフィードバックを提供するリコメンデータシステムにおいて,新たな学習問題を理論的に分析する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:58:43 GMT)
AutoComPose: Automatic Generation of Pose Transition Descriptions for Composed Pose Retrieval Using Multimodal LLMs [11.9] 合成ポーズ検索(CPR)により、ユーザーは参照ポーズと遷移記述を指定して人間のポーズを検索できる。
既存のCPRデータセットは、コストのかかる人的アノテーションやアノテーションベースのルール生成に依存している。
マルチモーダルな大規模言語モデル(MLLM)を利用する最初のフレームワークであるAutoComPoseを導入し、リッチで構造化されたポーズ遷移記述を自動的に生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:13:09 GMT)
VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog [11.7] We introduced the first graph-aided graph rule generation approach for Verilog vulnerabilities detection。
提案手法は,抽象構文木(AST)から抽出した構文特徴と制御フローデータ依存グラフから抽出した意味情報を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:32:33 GMT)
ProMed: Shapley Information Gain Guided Reinforcement Learning for Proactive Medical LLMs [11.5] インタラクティブな医療質問は、医師が患者から情報を積極的に集めなければならない実世界の臨床相談において不可欠である。
本稿では,医療用大規模言語モデルからプロアクティブパラダイムへ移行する強化学習フレームワークであるProMedを提案する。
ProMedのコアとなるのはShapley Information Gain(SIG)報酬であり、各質問の臨床的有用性を定量化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:01:40 GMT)
Ask Good Questions for Large Language Models [11.5] AGQフレームワークは、ユーザの知識レベルをよりよく識別するために、改良された概念強化項目応答理論(CEIRT)モデルを備えている。
私たちのコントリビューションには、CEIRTモデルとLLMを適用して、インスピレーションされたテキストに基づいてガイド質問を直接生成することが含まれます。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:31:42 GMT)
Know Me by My Pulse: Toward Practical Continuous Authentication on Wearable Devices via Wrist-Worn PPG [11.4] 本稿では,低周波(25Hz)マルチチャネルPSG信号を用いたスマートウォッチWe-Be Band上での連続認証システムの実装について述べる。
提案手法は,4チャンネルPSGの短い(4秒)ウィンドウから,個人性固有の特徴を抽出するための注意機構を備えたBi-LSTMを用いている。
その結果,25Hzのサンプリングでは認証精度が保たれるのに対して,20Hzでは性能が著しく低下することがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:46:01 GMT)
RCGNet: RGB-based Category-Level 6D Object Pose Estimation with Geometric Guidance [11.3] RGB画像のみに依存する新しいカテゴリレベルのオブジェクトポーズ推定手法を提案する。
本手法は,奥行きデータを必要としない実世界のシナリオにおける正確なポーズ推定を可能にする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:34:17 GMT)
LatentFlow: Cross-Frequency Experimental Flow Reconstruction from Sparse Pressure via Latent Mapping [11.3] 本稿では,高周波流路流れ場を再構成する新しい時間的時間的拡張フレームワークであるLatentFlowを提案する。
LatentFlowは、$p$C-$beta$-VAEデコーダを介して対応する高周波フローフィールドを生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:29:18 GMT)
LoRA-XS: Low-Rank Adaptation with Extremely Small Number of Parameters [11.2] 理論的導出に基づく新しい微調整法であるLoRA-XSを紹介する。
LoRA-XSは、小さくてトレーニング可能な重量行列を組み込むことで、トレーニング可能なパラメータを劇的に削減する。
モジュールごとにひとつのパラメータから任意の大きな値にスケールでき、任意のストレージや計算の制約に適応できる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:14:56 GMT)
FLAIR: Frequency- and Locality-Aware Implicit Neural Representations [11.1] Implicit Representations (INR) はニューラルネットワークを利用して、座標を対応する信号にマッピングし、連続的かつコンパクトな表現を可能にする。
既存のINRは周波数選択性、空間的局所化、スパース表現に欠けており、冗長な信号成分への過度な依存につながっている。
本稿では2つの重要なイノベーションを取り入れたFLAIR(Frequency- and Locality-Aware Implicit Representations)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:06:04 GMT)
LLM-Enhanced Linear Autoencoders for Recommendation [11.0] 大規模言語モデル(LLM)は、レコメンダシステムにおけるテキスト項目情報のセマンティック表現を強化するために広く採用されている。
L3AE は LLM を LAE フレームワークに統合した最初の L3AE である。
大規模な実験により、L3AEは3つのベンチマークデータセット上で、最先端のLLM強化モデルよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:20:14 GMT)
Powering Job Search at Scale: LLM-Enhanced Query Understanding in Job Matching Systems [10.9] LLM(Large Language Model)を利用した統合クエリ理解フレームワークを提案する。
提案手法は,ユーザクエリとプロファイル属性などのコンテキスト信号とを共同でモデル化し,構造化された解釈を生成する。
このフレームワークは、オンラインA/Bテストにおける関連品質を改善し、システムの複雑さを著しく低減する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:35:43 GMT)
Stereo-based 3D Anomaly Object Detection for Autonomous Driving: A New Dataset and Baseline [10.9] 3D検出技術は自動運転の分野で広く利用されている。
道路上に現れる稀な異常カテゴリーでは、3D検出モデルはしばしば誤検出または異常検出に失敗する。
本稿では,ステレオによる3次元異常物体検出(S3AD)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:26:24 GMT)
CLIPSym: Delving into Symmetry Detection with CLIP [10.9] 本稿では,CLIPモデルが自然画像記述にみられる追加の対称性の手がかりを活用することで,対称性検出に有効かどうかを検討する。
本稿では,CLIPのイメージおよび言語エンコーダを活用するCLIPSymと,Transformerと$G$-Convolutionのハイブリッドをベースとした回転等価デコーダを提案する。
実験により,CLIPSymは3つの標準対称性検出データセットにおいて,現状よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:43:14 GMT)
DREAMS: Preserving both Local and Global Structure in Dimensionality Reduction [10.7] DREAMSは,$t$-SNEの局所構造保存とPCAのグローバル構造保存を簡単な正規化項で組み合わせた手法である。
DREAMSを、単細胞転写学の5つと集団遺伝学の1つを含む、現実世界の7つのデータセットでベンチマークする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:39:17 GMT)
Neural Cellular Automata for ARC-AGI [10.6] 本稿では,NACが正確な変換や数ショットの一般化を必要とするタスクに適用する際の動作について考察する。
具体的には,インプットグリッドを出力に変換する反復更新規則の学習に勾配に基づくトレーニングを用いる。
その結果,勾配学習型NAAモデルはARCの抽象的グリッドベースタスクに対して,有望かつ効率的なアプローチであることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:00:57 GMT)
Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer [10.5] モデルの局所スケール等式を改善するために,DEC(Deep equilibrium Canonicalizer)を提案する。
DECは既存のネットワークアーキテクチャに簡単に組み込むことができ、事前訓練されたモデルに適応することができる。
競合するImageNetベンチマークでは、DECはモデル性能と局所スケールの整合性の両方を改善している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:21:59 GMT)
DPad: Efficient Diffusion Language Models with Suffix Dropout [10.5] Diffusion Scratchpad (DPad) は、近くの接尾辞の小さなセットに注意を向ける訓練不要の手法である。
DPad は (i) 固定長の接尾辞窓を維持するスライディングウィンドウ, (ii) 距離デカイドロップアウト, (ii) 注意計算の前に遠接辞トークンを決定的に除去する2つの戦略を統合している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:56:51 GMT)
Segment Anything in Pathology Images with Natural Language [10.5] PathSegmentorは、病理画像に特化して設計された最初のテキストプロンプトセグメンテーション基盤モデルである。
PathSegは、病理分類のための最大かつ最も包括的なデータセットである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:06:01 GMT)
Multi-Plasticity Synergy with Adaptive Mechanism Assignment for Training Spiking Neural Networks [10.5] スパイキングニューラルネットワーク(SNN)は、低消費電力と時間的処理の優れた可能性で知られる脳にインスパイアされたモデルである。
より効果的なSNNトレーニングのために,複数の相乗的可塑性機構を組み込んだ,生物学的にインスパイアされたトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:18:35 GMT)
Towards safe control parameter tuning in distributed multi-agent systems [10.5] 自律ロボットや協調ロボットなど、多くの安全クリティカルな現実世界問題は、分散マルチエージェントの性質である。
安全性を確保しつつ、これらのシステムの性能を最適化するために、各エージェントのパラメータが結合して関数結合制約を補償する問題として、それらをキャストすることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:13:53 GMT)
Learning from Preferences and Mixed Demonstrations in General Settings [10.5] 人間のデータから学習するための新しいフレーミングを開発した。
これに基づいて、LEOPARD:Learning Estimated Objectives from Preferences and Ranked Demonstrationsを紹介する。
限定的な好みと実演フィードバックが得られれば、LEOPARDは既存のベースラインをかなり上回ります。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:37:35 GMT)
SRMA-Mamba: Spatial Reverse Mamba Attention Network for Pathological Liver Segmentation in MRI Volumes [10.4] 肝硬変は慢性肝疾患の予後に重要な役割を果たす。
既存の手法はMRIデータの空間的詳細を過小評価する。
我々は,MRIボリュームの複雑な解剖学的構造内の空間的関係をモデル化する,新しいマンバ型ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:05:00 GMT)
PersonaVlog: Personalized Multimodal Vlog Generation with Multi-Agent Collaboration and Iterative Self-Correction [10.3] PersonaVlogは自動マルチモーダルスタイリングVlog生成フレームワークである。
マルチモーダル大言語モデル(MLLM)に基づくマルチエージェント協調フレームワークを提案する。
また,テーマベースの自動ベンチマークフレームワークであるThemeVlogEvalを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:10:43 GMT)
Interactive Query Answering on Knowledge Graphs with Soft Entity Constraints [10.2] 本稿では,クエリに対する元の回答を乱すことなく,ソフト制約を組み込むことで,クエリ応答スコアの調整を目的としたニューラルクエリリランカ(NQR)を提案する。
NQRは対話的に動作し、好まれるエンティティと好ましくないエンティティの漸進的な例に基づいて回答を精査する。
我々の実験は、堅牢なクエリ応答性能を維持しながら、NQRがソフト制約を捕捉できることを実証した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:09:07 GMT)
AdapSNE: Adaptive Fireworks-Optimized and Entropy-Guided Dataset Sampling for Edge DNN Training [10.2] エッジデバイス上でのディープニューラルネットワーク(DNN)のトレーニングは、ドメイン適応やプライバシ保護といった課題に対する有望なソリューションを提供するため、注目を集めている。
本稿では,効率的な非モノトニック探索手法,すなわちファイアワークスアルゴリズム(FWA)を組み込んで,異常値を抑制するAdapSNEを提案し,アントロピー誘導最適化を用いて一様サンプリングを行う。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:48:01 GMT)
Enhancing Robustness of Implicit Neural Representations Against Weight Perturbations [10.2] Inlicit Neural Representation (INR)は、ニューラルネットワークを用いて離散信号を連続的に符号化する。
本稿では,INRのロバスト性を初めて検討し,微小な摂動でも性能劣化の原因となることを明らかにする。
重みに対する復元損失の勾配を調節する新たなロバスト損失関数を導出し,ロバスト性を高める。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:18:43 GMT)
POPri: Private Federated Learning using Preference-Optimized Synthetic Data [10.1] 実用的な設定では、ディファレンシャル・プライベート・フェデレーション・ラーニング(DP-FL)は、デバイス上のプライベート・クライアント・データからモデルをトレーニングするための主要な手法である。
近年の研究では,DP合成データを用いた手法によりDP-FLの強化や性能向上が示唆されている。
我々の重要な洞察は、従来のDP合成データ手法によって収集されたプライベートクライアントフィードバックは、RL(強化学習)報酬と見なせることである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:56:16 GMT)
Zero-knowledge LLM hallucination detection and mitigation through fine-grained cross-model consistency [10.1] 大規模言語モデル(LLM)は、様々なタスクにまたがる印象的な能力を示してきたが、幻覚(幻覚)の影響を受けにくい。
Finch-Zkは、FINeの粒度の交差モデルの整合性を利用して、外部の知識源を必要とせず、LLM出力の幻覚を検出・緩和するフレームワークである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:45:34 GMT)
BLACKOUT: Data-Oblivious Computation with Blinded Capabilities [10.0] メモリセーフなハードウェアをデータ公開プログラミング能力で拡張することで、メモリセーフ性とサイドチャネル耐性に対処する。
本稿では,CHERI-Tooobaプロセッサを用いたFPGAソフトコア上でのブラインド機能を実現するBLACKOUTを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:26:53 GMT)
MUFFIN: Mixture of User-Adaptive Frequency Filtering for Sequential Recommendation [9.9] シーケンシャルレコメンデーションは、シーケンシャルな振る舞いをモデル化することで、ユーザのその後のインタラクションを予測することを目的としている。
本稿では,2つの相補的モジュールを経由した新しい周波数領域モデルを提案する。
実験の結果、MUFFINは5つのベンチマークデータセットで最先端の周波数領域SRモデルより一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:16:15 GMT)
Upsample What Matters: Region-Adaptive Latent Sampling for Accelerated Diffusion Transformers [9.9] Region-Adaptive Latent Upsampling(ALU)は、空間次元に沿って推論を加速するトレーニング不要のフレームワークである。
1) グローバルセマンティック構造を効率的に捉えるための低分解能遅延拡散の低分解能化、2) 特定の領域に対する領域適応的なアップサンプリング、3) 詳細精細化のために全分解能で遅延アップサンプリングを行う。
FLUXで最大7.0$times$, 安定拡散3で3.0$times$を最小限の劣化で達成することで, 画像品質を保ちながら計算を著しく削減する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:13:39 GMT)
ITL-LIME: Instance-Based Transfer Learning for Enhancing Local Explanations in Low-Resource Data Settings [9.8] LIME(Local Interpretable Model-Agnostic Explanations)は、ブラックボックス機械学習モデルの解釈可能性を向上させる。
LIMEの摂動とサンプリングにおける固有のランダム性は、局所性と不安定性の問題を引き起こす。
本稿では,データ制約環境における説明の忠実さと安定性を高めるための新しいインスタンスベーストランスファーラーニングLIMEフレームワーク(ITL-LIME)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:18:20 GMT)
Enhancing Targeted Adversarial Attacks on Large Vision-Language Models through Intermediate Projector Guidance [9.7] 現在の敵対者は、エンコーダレベルでターゲットテキストや参照画像とグローバルな類似性を最大化するために、摂動画像を攻撃します。
この制限は粒度を攻撃し、背景を保ちながら車を変更するなどの微粒な操作を妨げる。
本稿では,プロジェクタモジュールの中間段階,特に広く採用されているQ-Formerを用いた攻撃手法であるIPGAを提案する。
本手法は,ブラックボックス環境において,標準的なグローバル画像キャプションタスクときめ細かな視覚的質問応答タスクの両方において,既存の手法よりも一貫して優れる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:23:09 GMT)
PII Jailbreaking in LLMs via Activation Steering Reveals Personal Information Leakage [9.6] 本稿では、LCMアライメントを回避し、プライバシ関連クエリに対する応答動作を変更することができるかに焦点を当てる。
プライバシ評価器ラベルをトレーニングした軽量線形プローブを用いて,個人属性に対する予測拒否行動の注意点を同定する。
我々は、訓練されたプローブによって導かれるこれらの注目ヘッドの小さなサブセットの活性化を操縦し、非拒否応答を生成するためにモデルを誘導する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:18:58 GMT)
SAGA: Learning Signal-Aligned Distributions for Improved Text-to-Image Generation [9.2] 最先端のテキスト画像モデルは視覚的に印象的な結果をもたらすが、しばしばテキストプロンプトへの正確なアライメントに苦慮する。
本稿では,ターゲットプロンプトに条件付き高精度分布を学習する手法を提案する。
提案手法は,過度な最適化を緩和する微粒化制御を実現することで,デノナイズプロセス中の信号成分を明示的にモデル化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:31:15 GMT)
NovoMolGen: Rethinking Molecular Language Model Pretraining [9.1] 我々は、デノボ分子生成のための15億分子を事前訓練したトランスフォーマーベースの基礎モデルであるNovoMolGenを紹介する。
実験的な分析により,事前学習中の測定値と実際の下流のパフォーマンスとの間には弱い相関関係が認められた。
NovoMolGenは、新しい最先端の結果を確立し、制約のない分子生成タスクとゴール指向の分子生成タスクの両方において、Moll-LLMや特殊生成モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:04:48 GMT)
Assessing UML Diagrams by ChatGPT: Implications for Education [9.1] ChatGPTはこの評価作業を完了できるが、人間の専門家に取って代わることはできない。
ChatGPTと人間の専門家の間には5つの相違点がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:13:45 GMT)
Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance [9.1] 電子健康記録(EHR)推論のための大規模言語モデル(LLM)は、正確で一般化可能な臨床予測を可能にするために不可欠である。
EAG-RL は LLM の EHR 推論能力を高めるために設計された新しい2段階学習フレームワークである。
EAG-RLは、まず、専門家誘導モンテカルロ木探索を用いて、高品質で段階的な推論軌道を構築する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:24:48 GMT)
A Generalized Learning Framework for Self-Supervised Contrastive Learning [9.0] 自己教師付きコントラスト学習(SSCL)は、最近、複数の下流タスクにおいて優位性を示した。
本稿では,標準SSCL手法を,整合部と制約部という2つの部分からなる一般化学習フレームワーク(GLF)に一般化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:00:29 GMT)
Incorporating Attributes and Multi-Scale Structures for Heterogeneous Graph Contrastive Learning [8.9] 異種グラフのための新しいコントラスト学習フレームワーク(ASHGCL)を提案する。
ASHGCLには3つの異なるビューがあり、それぞれがノード属性、高階構造情報、低階構造情報に焦点を当てている。
本稿では,属性情報と属性情報を組み合わせた属性強化型正のサンプル選択手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:06:31 GMT)
Hierarchy-Consistent Learning and Adaptive Loss Balancing for Hierarchical Multi-Label Classification [8.9] HMCはマルチタスク学習における構造的一貫性の維持と損失重み付けのバランスに関する課題に直面している。
プロトタイプのコントラスト学習と適応的タスク重み付け機構を統合したMTLに基づくHCALと呼ばれる分類器を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:15:41 GMT)
Comparing Model-agnostic Feature Selection Methods through Relative Efficiency [8.9] 本稿では,線形モデル,非線形加法モデル,単層ニューラルネットワークを模倣する単一インデックスモデルという3つのモデル設定の下で理論的比較を行う。
実験結果と合わせて, GCM関連手法が適切な規則性条件下でのLOCOよりも優れていたことが示唆された。
我々のシミュレーションと実データ分析には、ニューラルネットワークや勾配木などの機械学習手法が広く使われている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:55:43 GMT)
Nonlinear-linear duality for multipath quantum interference [8.7] 量子光学において、非退化パラメトリックダウンコンバージョンプロセスのポストセレクションは、部分時間反転を介してビームスプリッタ(BS)にリンクされる。
利得が低い特別な例は、量子イメージングにおけるクリシュコの先進波像を思い起こさせるものである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:16:12 GMT)
ChronoLLM: Customizing Language Models for Physics-Based Simulation Code Generation [8.6] オープンおよびクローズドソースの大規模言語モデル(LLM)の精細化とカスタマイズのためのフレームワークを提案する。
我々は、PyChrono仮想実験を実行するスクリプトを生成する上で、AIの力を利用する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:12:51 GMT)
AdaDocVQA: Adaptive Framework for Long Document Visual Question Answering in Low-Resource Settings [8.2] Document Visual Question Answering (Document VQA)は、低リソース環境で長いドキュメントを処理する場合、重大な課題に直面します。
本稿では、3つのコアイノベーションを通じてこれらの課題に対処する統一適応フレームワークであるAdaDocVQAについて述べる。
日本語文書VQAベンチマークの実験では,Yes/No質問に対して83.04%の精度で大幅な改善が示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:12:45 GMT)
Democratizing News Recommenders: Modeling Multiple Perspectives for News Candidate Generation with VQ-VAE [8.2] 過去のクリックに基づく現在のNews Recommender Systemsはエンゲージメントのために設計されているが、推奨コンテンツの多様性を制限するコストがかかる。
第一に、彼らは幅広い視点に公平にアクセスする必要がある規範的な多様性を説明できない。
第2に、多くのコンテンツがフィルタリングされた後、一般的にシステムのパイプラインの後半に多様性を適用します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:13:54 GMT)
Multimodal Data Storage and Retrieval for Embodied AI: A Survey [8.1] EAI(Embodied AI)エージェントは物理的世界と相互作用し、巨大で異質なマルチモーダルデータストリームを生成する。
EAIの中核となる要件は、物理的グラウンディング、低レイテンシアクセス、動的スケーラビリティである。
私たちの調査は180以上の関連する研究の包括的なレビューに基づいており、堅牢で高性能なデータ管理フレームワークを設計するための厳密なロードマップを提供しています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:04:02 GMT)
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning [8.1] 第一フレーム制御は第一フレームの制御を提供するが、その後のフレームの柔軟性には欠ける。
フレキシブルなビデオ編集のための2Vモデルに適応するマスクベースのLoRA(Low-Rank Adaptation)手法を提案する。
実験結果から,本手法はベースライン法よりも優れた映像編集性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:11:40 GMT)
DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework [8.1] 明示的なセマンティックガイダンスを提供するデュアルストリームフレームワークであるDualSGを提案する。
本稿では、自然言語のトレンドパターンを要約した明示的なプロンプトフォーマットである時系列キャプションを紹介する。
さまざまなドメインの実際のデータセットに関する実験によると、DualSGは15の最先端ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:47:49 GMT)
Natural Language Generation from Visual Events: State-of-the-Art and Key Open Questions [8.1] 画像やフレームのシーケンスから自然言語を生成するタスクは、時間とともに展開する視覚イベントと、それらを解釈、記述、ナレーションするために使用される言語の特徴との間の複雑な関係をモデル化する、より広範で一般的な問題の一例である、と我々は主張する。
我々は5つの一見異なるタスクを考えており、このより広いマルチモーダル問題の魅力的な事例であると主張している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:12:30 GMT)
ViT-FIQA: Assessing Face Image Quality using Vision Transformers [8.0] 顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を予測することを目的としている。
ViT-FIQAは、学習可能なクオリティトークンを通じてFRに最適化された標準のViTバックボーンを拡張する新しいアプローチである。
挑戦的なベンチマークとCNNとViTベースのアーキテクチャを含むいくつかのFRモデルの実験は、ViT-FIQAが一貫してトップレベルのパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:50:07 GMT)
MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings [8.0] 本稿では,背景電気グラム(EEG)アーチファクト/ノイズから発作イベントを効率よく識別する,新しいエンド・ツー・エンドモデル"MR-EEGWaveNet"を提案する。
このモデルには、畳み込み、特徴抽出、予測という3つのモジュールがある。
提案したMR-EEGWaveNetは、従来の非多重分解能アプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:49:50 GMT)
Ransomware Negotiation: Dynamics and Privacy-Preserving Mechanism Design [7.9] 本稿では, 有限水平交互連系ゲームモデルを用いて, 現代のランサムウェアインシデントにおける攻撃者と被害者の相互作用の形式的解析を行う。
我々の分析は、交渉が双方の最適な戦略をどう変えるかを示している。
我々の知る限りでは、ランサムウェアのネゴシエーションダイナミクスの形式解析を基礎とした、最初の自動プライバシ保護型ネゴシエーションメカニズムである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:29:12 GMT)
Towards Understanding and Harnessing the Transferability of Prognostic Knowledge in Computational Pathology [7.9] WSI(Whole-Slide Image)はがん患者の予後を評価する重要なツールである。
本稿では,病理学における予後知識伝達に関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:24:19 GMT)
Joint Problems in Learning Multiple Dynamical Systems [7.8] 時系列のクラスタリングはよく研究されている問題であり、代謝物濃度から得られる代謝の定量的にパーソナライズされたモデルから、量子情報理論における状態判別まで幅広い応用がある。
我々は,一組のトラジェクトリと複数のパーツを与えられた場合,各パーツのトラジェクトリと線形力学系(LDS)モデルを共同で分割し,全てのモデルにおける最大誤差を最小化するために検討する。
本稿では,グローバル収束法とEMを,有望な計算結果とともに提示する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:56:38 GMT)
Where to Go Next Day: Multi-scale Spatial-Temporal Decoupled Model for Mid-term Human Mobility Prediction [7.7] 本研究は,日常の移動パターンを把握し,次の日または週の移動経路を予測することを目的とした中期移動予測に対処する。
本研究では,空間情報と時間情報を効率的に抽出する多段階空間分離予測器(MSTDP)を提案する。
提案手法では,マルチスケールの時間パターンをモデル化する階層型エンコーダを用いて,日毎の繰り返しや週毎の周期などのパターンをモデル化し,トランスフォーマーベースのデコーダを用いて,位置や時間連鎖の予測情報へのグローバルな対応を行う。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:26:55 GMT)
DIME-Net: A Dual-Illumination Adaptive Enhancement Network Based on Retinex and Mixture-of-Experts [7.7] 本稿では,DIME-Netと呼ばれるデュアルイルミネーション向上フレームワークを提案する。
Retinex理論を統合することで、このモジュールは低照度画像とバックライト画像の両方に合わせた拡張を効果的に実行する。
DIME-Netは, 実世界の低照度データセットとバックライトデータセットの両方において, 再トレーニングを伴わずに, 競合性能を達成できることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:17:47 GMT)
LLM4VV: Evaluating Cutting-Edge LLMs for Generation and Evaluation of Directive-Based Parallel Programming Model Compiler Tests [7.7] 本稿では,コンパイラテストの生成にLLMを用いたデュアルLLMシステムと実験について述べる。
LLMは、品質の高いコンパイラテストを生成し、それらを自動的に検証する有望な可能性を持っていることは明らかである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:08:54 GMT)
Learning Time-Varying Convexifications of Multiple Fairness Measures [7.7] フェアネスレギュラーの相対的な重みは、未熟であり、時間の変化があり、ハエで学ぶ必要があるかもしれない。
グラフ構造フィードバックを限定した複数公正度尺度の時間変動凸化の学習について検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:32:26 GMT)
Uncertainty-Aware PCA for Arbitrarily Distributed Data Modeled by Gaussian Mixture Models [7.7] 多次元データは、しばしば正規分布によってよく説明されない不確実性と関連付けられている。
我々は、不確実性を考慮した主成分分析(UAPCA)を用いて、多次元分布を低次元空間に投影する方法を示す。
提案手法とUAPCAを用いて得られた低次元空間の分布をサンプルベース投影による分布と比較することにより,本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:31:41 GMT)
Bidirectional Information Flow (BIF) -- A Sample Efficient Hierarchical Gaussian Process for Bayesian Optimization [7.6] Bidirectional Information Flow (BIF)は、オンライントレーニングのための効率的なH-GPフレームワークである。
BIFは、オンライントレーニングのためのH-GPにおいて、親モデルと子モデル間の双方向情報交換を確立する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:38:23 GMT)
Hawkeye:Efficient Reasoning with Model Collaboration [7.3] CoT推論は,大規模言語モデル(LLM)の推論能力の向上に顕著な効果を示した。
ほとんどのCoTトークンは不要であり、そのごく一部しか保持していないため、高品質な応答を生成するのに十分である。
本稿では,大規模なモデルが簡潔なCoT命令を生成して,より小さなモデルに応答生成を誘導する,新しいトレーニング後推論フレームワークHAWKEYEを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:42:00 GMT)
A Robust Large-Period Discrete Time Crystal and its Signature in a Digital Quantum Computer [7.1] 我々は、より非自明な周期四重奏法DTC(4T$-DTCs)をサポートする二層粒子の相互作用系を開発する。
このような4T$-DTCの明確なシグネチャを量子プロセッサで観測する。
本研究は, 標準周期双曲力学を超越した時間結晶性の明確な実現を示すことによって, 時間結晶挙動のランドスケープを拡張した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:56:15 GMT)
Amortized Bayesian Meta-Learning for Low-Rank Adaptation of Large Language Models [7.1] 低ランク適応(LoRA)を用いた微調整型大規模言語モデルは、特定のデータセットから情報を組み込むためのコスト効率のよい方法である。
微調整 LLM がいかに一般化するか、すなわち、目に見えないデータセット上でどれだけうまく機能するかは、しばしば不明である。
我々は,大規模モデルへの一般化とスケールを改善するために,LoRA (ABMLL) のためのアモータライズベイズメタラーニングを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:57:59 GMT)
MF-LPR$^2$: Multi-Frame License Plate Image Restoration and Recognition using Optical Flow [7.0] ダッシュカム画像のナンバープレート領域は、解像度が低く、動きがぼやけ、光沢に悩まされることが多い。
事前訓練を頼りにしている既存の生成モデルは、そのような品質の悪いイメージを確実に復元することはできない。
本稿では,MF-LPR$2のマルチフレームプレート復元認識フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:18:14 GMT)
A Novel Image Similarity Metric for Scene Composition Structure [6.8] 生成AIモデルにとって重要な関心事は、画像の基盤となるシーン構成構造(SCS)の保存である。
従来の画像類似度指標は、しばしばSCSを評価するのに不足する。
SCS 類似度指数測定(SCSSIM)は,SCS の保存を定量化するための新しい,分析的,トレーニング不要な指標である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:31:00 GMT)
How Do Users Revise Architectural Related Questions on Stack Overflow: An Empirical Study [6.7] ユーザがStack Overflow (SO)上でアーキテクチャ関連質問(ARQ)をどのように修正するかを理解するための実証的研究を行った。
主な発見は以下のとおりである。
ARQのリビジョンはSOでは一般的ではなく、この質問が投稿された直後にARQリビジョンが開始される。
質問作成者(QC)と非質問作成者(QC)の両方が、ARQ修正に積極的に参加している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:24:57 GMT)
Convergent Reinforcement Learning Algorithms for Stochastic Shortest Path Problem [6.7] 本稿では,最短経路(SSP)問題に対する2つのアルゴリズムを提案する。
強化学習(RL)におけるSSP問題
すべてのアルゴリズムに対して近似がほぼ収束することを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:55:07 GMT)
Effect of Data Augmentation on Conformal Prediction for Diabetic Retinopathy [6.7] 糖尿病網膜症におけるコンフォメーション予測器の性能について検討した。
以上の結果から,Mixup や CutMix のようなサンプル混合手法は予測精度を向上するだけでなく,信頼性と効率のよい不確実性評価をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:55:06 GMT)
Tight Inter-Core Cache Contention Analysis for WCET Estimation on Multicore Systems [6.7] マルチコアアーキテクチャのWCET推定は、複数のコアで共有されるキャッシュ上の複雑なアクセスのため、特に難しい。
本稿では,タスク中のプログラム領域の順序に基づいて,リモートアクセスが発生した場合に影響を受ける可能性のあるメモリ参照を最初に同定する。
本研究では,タスクのコア間キャッシュ干渉が動的プログラミングによって得られることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:30:41 GMT)
SSD-TS: Exploring the Potential of Linear State Space Models for Diffusion Models in Time Series Imputation [6.4] 現在のDDPMに基づく確率的時系列計算手法は2種類の課題に直面している。
提案手法は,複数の実世界のデータセットに対して,最先端の時系列計算結果が得られる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:55:24 GMT)
Discrete Optimization of Min-Max Violation and its Applications Across Computational Sciences [6.4] 一般最適化問題として離散最小振動法(DMMV)を導入する。
この文脈自由な数学的定式化は、最悪のパフォーマンス要件を持つ幅広いユースケースに適用できる。
DMMVの数学的特性を利用して,解法過程を高速化するGPU加速出力器を開発した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:34:05 GMT)
Prompt Orchestration Markup Language [6.4] POMLは、論理構造のためのコンポーネントベースのマークアップと、シームレスなデータ統合のための特別なタグを採用している。
動的プロンプトのテンプレートと、バージョン管理とコラボレーションを改善するための包括的な開発者ツールキット(IDEサポート、SDK)が含まれている。
複雑なアプリケーション統合(PomLink)と精度性能(TableQA)への影響を示す2つのケーススタディを通じてPOMLを検証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:37:29 GMT)
Online 3D Gaussian Splatting Modeling with Novel View Selection [6.4] 本研究では,RGBのみのフレームからオンライン3DGSモデルを作成するという課題に対処する。
オンラインで復元品質を解析することにより,追加トレーニングのための最適な非鍵フレームを選択する。
また、3DGSモデリングプロセスを通して3D情報の一貫性を確保するために、オンラインマルチビューステレオアプローチを取り入れたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:25:12 GMT)
Prediction is not Explanation: Revisiting the Explanatory Capacity of Mapping Embeddings [6.3] 本稿では,単語埋め込みに符号化された知識を説明するための共通手法について検討する。
予測精度だけでは、真の特徴ベースの解釈可能性を示すものではない。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:00:47 GMT)
CORENet: Cross-Modal 4D Radar Denoising Network with LiDAR Supervision for Autonomous Driving [6.3] 4Dレーダーによる物体検出は、悪天候下での頑丈さに大きな注目を集めている。
4次元レーダーポイント雲のスパースでノイズの多い性質は、効果的な知覚に重大な課題をもたらす。
我々は、LiDAR監視を利用してノイズパターンを識別する新しいクロスモーダル・デノナイズ・フレームワークであるCORENetを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:30:21 GMT)
Improving DAPO from a Mixed-Policy Perspective [6.2] 本稿では,動的sAmpling Policy Optimization (DAPO)アルゴリズムに2つの新しい修正を加えている。
まず、政治以外の経験を提供するための、事前訓練された安定した指導方針を取り入れた手法を提案する。
次に、このアイデアを拡張してゼロ逆サンプルを再利用し、しばしば動的サンプリング戦略によって破棄される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:04:15 GMT)
Towards a Larger Model via One-Shot Federated Learning on Heterogeneous Client Models [6.1] フェデレートラーニング(Federated Learning)は、分散化されたクライアントが、生データを送信せずにモデルパラメータを交換することで、共用モデルのトレーニングを可能にする。
我々は,より大規模で包括的なサーバモデルをワンショット設定で構築するFedOLを提案する。
これにより、完全なモデル重みの代わりにコンパクトな予測を送信することで通信オーバーヘッドを低減する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:35:25 GMT)
Radio Map Estimation: Empirical Validation and Analysis [6.1] 本稿では,実データを用いた無線地図推定(RME)の総合的,厳密かつ再現性の高い研究について述べる。
既存の深度推定器の性能向上は、その複雑さを補うものではないかもしれない。
この研究のために収集された膨大な量のデータは、新しいスキームの研究を可能にするために開発されたシミュレータと共に公表されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:15:11 GMT)
Assessing Trustworthiness of AI Training Dataset using Subjective Logic -- A Use Case on Bias [5.9] 本稿では,AIトレーニングデータセットの信頼性を評価するための最初の公式フレームワークを紹介する。
バイアスの信頼性に関するこの枠組みをインスタンス化し,交通標識認識データセットに基づいて実験的に評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:17:41 GMT)
DiffIER: Optimizing Diffusion Models with Iterative Error Reduction [5.8] 高品質な生成のための最適化手法であるDiffIERを提案する。
本稿では,各ステップにおける反復誤差最小化により,累積誤差を効果的に低減できることを実証する。
この方法は、テキスト・ツー・イメージ生成、画像超解像、テキスト・ツー・音声生成において一貫した成功を達成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:41:49 GMT)
Characterizing Community Formation in Response to Extreme Weather Events through Human Mobility Networks [5.7] 地域社会の形成は、極端な気象現象の危険性を緩和する重要なメカニズムの1つである。
テキサス州ハリス郡における2021年冬の嵐Uriによる停電の実態について, 人体移動ネットワークについて検討した。
本研究では,人体移動ネットワーク内に形成されるコミュニティの3つの特徴について検討した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:38:50 GMT)
Towards Immersive Mixed Reality Street Play: Understanding Co-located Bodily Play with See-through Head-mounted Displays in Public Spaces [5.6] 我々は,Immersive Mixed Reality Street Play(IMRSP)の社会的意味,課題,機会,デザインレコメンデーションについて検討する。
マルチプレイヤーOmnipresent Fighting Arena (MOFA) は, 様々な公共施設に展開している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:25:03 GMT)
Parameter-Efficient Continual Fine-Tuning: A Survey [5.6] AIの次のブレークスルーは、進化する環境への効率的な適応を可能にすることです。
これらの大規模モデルを効率的に適応させる方法の1つが知られている。
PEFT(Efficient Fine-Tuning)
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:33:44 GMT)
Reinforcement Learning for Solving the Pricing Problem in Column Generation: Applications to Vehicle Routing [5.6] 我々は強化学習(RL)を用いて、価格問題(PP)において最も負のコストの低い列を見つける。
我々のモデルは、目的の助けなしに価格問題を独立して解決するので、エンドツーエンドのメカニズムをデプロイします。
本手法は, 走行時間が非常に短い場合において, 線形緩和を合理的なギャップまで解けることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:50:31 GMT)
Complete $k$-partite entanglement measure [5.6] a 110, 012405 (2024) に完全$k$絡み合い尺度の理論が確立されている
ここでは、完全$k$-partiteエンタングルメント測度を必要とする公理的仮定を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:53:14 GMT)
Unsupervised Urban Tree Biodiversity Mapping from Street-Level Imagery Using Spatially-Aware Visual Clustering [5.5] 都市部の樹木の多様性は、気候の回復力、生態学的安定性、および都市の自由性に重要である。
フィールドベースの在庫はシャノンとシンプソンの多様性の信頼できる見積もりを提供するが、コストと時間を要する。
街路レベルの画像からの視覚的埋め込みと空間的植込みパターンを統合し,ラベルなしで生物多様性を推定する,教師なしクラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:18:22 GMT)
Is The Watermarking Of LLM-Generated Code Robust? [5.5] コードベースのコンテキストでは、ウォーターマーキングのテクニックがはるかに脆弱であることを示します。
具体的には、変数リネームやデッドコード挿入といった単純なセマンティック保存変換が、ウォーターマークを効果的に消去できることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:25:28 GMT)
Position: We Need Responsible, Application-Driven (RAD) AI Research [5.5] このポジションペーパーは、人工知能(AI)による有意義な科学的および社会的進歩を達成するには、AI研究に対する責任あるアプリケーション駆動アプローチ(RAD)が必要であると主張している。
我々は、技術的に実現可能な方法で新しい価値を解放するアプリケーション駆動型AI研究の将来へのビジョンを提示する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:52:12 GMT)
A U-Statistic-based random forest approach for genetic interaction study [5.4] 本稿では,U-Statistic-based random forest approach(フォレストU-Test)を提案する。
シミュレーション実験により,フォレストUテストは既存手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:22:20 GMT)
Coarse-to-Fine Personalized LLM Impressions for Streamlined Radiology Reports [5.4] 放射線学報告の「印象」セクションは、放射線学者の燃え尽きの第一の要因である。
本稿では,オープンソースの大規模言語モデル(LLM)を活用し,臨床所見から印象を自動生成・パーソナライズする粗大なフレームワークを提案する。
LLaMAとMistralのモデルをシカゴ大学医学部からの大量のレポートのデータセットに微調整する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:54:40 GMT)
Automatic Image Colorization with Convolutional Neural Networks and Generative Adversarial Networks [5.3] 本稿では,分類と逆学習による画像の自動色付けについて検討する。
私たちは、事前の作業に基づいてモデルを構築し、特定のシナリオに修正を適用し、比較します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:06:05 GMT)
Customizing Speech Recognition Model with Large Language Model Feedback [5.3] 教師なしドメイン適応のための強化学習に基づくアプローチを提案する。
我々は、未ラベルデータを利用して転写品質、特にドメインミスマッチの影響を受ける名前付きエンティティを向上させる。
提案手法は,従来の自己学習手法に比べて,エンティティ単語の誤り率を21%向上させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:44:16 GMT)
Timestep-Compressed Attack on Spiking Neural Networks through Timestep-Level Backpropagation [5.2] スパイキングニューラルネットワーク(SNN)に対する最先端の敵攻撃は、重大な制限に直面している。
本稿では,TCA(Timestep-compressed attack)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:17:15 GMT)
STAS: Spatio-Temporal Adaptive Computation Time for Spiking Transformers [5.2] スパイキングニューラルネットワーク(SNN)は、人工知能ニューラルネットワーク(ANN)よりもエネルギー効率が高いが、高いレイテンシと計算オーバーヘッドに悩まされている。
本稿では,静的アーキテクチャと動的計算ポリシを協調設計するフレームワークSTAS(Spatio-Temporal Adaptive Computing Time for Spiking Transformers)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:18:21 GMT)
Beyond Turing: Memory-Amortized Inference as a Foundation for Cognitive Computation [5.2] 本稿では,メモリの潜時サイクル上での認識を推論としてモデル化する形式的フレームワークとして,メモリ記憶推論(MAI)を紹介した。
我々は,MAIがMountcastleのUniversal Cortical Algorithmの基本的な基盤を提供することを示す。
人工知能の実現にMAIが与える深い影響について,簡潔に論じる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:10:26 GMT)
Understanding and Mitigating Memorization in Generative Models via Sharpness of Probability Landscapes [5.1] 本稿では,ログ確率密度のシャープネスを用いて拡散モデルの記憶度を解析するための幾何学的枠組みを提案する。
本稿では,潜時拡散モデルにおける画像生成の初期段階におけるシャープネスを定量化する手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:16:17 GMT)
Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory [5.1] 理想的なニューロモルフィック・ニューラル-インスパイアされた神経平衡は局所的だがパラレルなパラメータの更新に頼り、2次プログラミングからイジングマシンまで幅広い問題を解決する。
本稿では,学習の内外熱力学を解析し,その結果のエネルギー効率の推定値がモデルに依存しないことを示す。
結果の実用性を示すため,我々は,大規模AIワークロードにおけるエネルギー対ソリューションの指標値の低バウンドを推定するために,分析を適用した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:34:48 GMT)
NodeShield: Runtime Enforcement of Security-Enhanced SBOMs for Node.js [4.9] ソフトウェアサプライチェーンは、悪意のあるアクターにとってますます一般的な攻撃ベクターである。
このような攻撃に対抗するため、研究コミュニティと実践者は、様々な静的および動的メカニズムを提案してきた。
本稿では,Node.jsアプリケーションの(サプライチェーンの)ランタイム保護機構について,互換性,自動化,オーバーヘッドの最小化,ポリシの簡潔さという野心的な目標を掲げて検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:43:06 GMT)
Temporal-Conditional Referring Video Object Segmentation with Noise-Free Text-to-Video Diffusion Model [4.8] Referring Video Object (RVOS) は、ビデオ内の特定のオブジェクトをテキスト記述に従って分割することを目的としている。
近年のRVOSアプローチは,特徴抽出や時間的モデリングに過度に重点を置いていることが多いが,セグメンテーションヘッドの設計は比較的無視されている。
本稿では,境界セグメンテーション機能を高めるために既存のセグメンテーション手法を統合したテンポラルコンディショナル参照ビデオオブジェクトモデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:36:04 GMT)
Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.8] 我々は、羅生門分割セット(RPS)と呼ばれるモデル不確実性のための新しい枠組みを提案する。
RPSは、最大後部(MAP)モデルに近い後部密度を持つすべてのモデルで構成されている。
実験的な例として,チャリタブルギフトの価格効果,染色体構造の不均一性,マイクロファイナンスの導入の3つを挙げる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:45:12 GMT)
Two Birds with One Stone: Multi-Task Detection and Attribution of LLM-Generated Text [4.8] DA-MTLは、テキスト検出と著者の属性を同時に扱うマルチタスク学習フレームワークである。
DA-MTLを9つのデータセットと4つのバックボーンモデルで評価し、複数の言語で高い性能を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:23:30 GMT)
GRAFT: Gradient-Aware Fast MaxVol Technique for Dynamic Data Sampling [4.7] ニューラルネットワークのためのスケーラブルなイントレーニングサブセット選択法であるGRAFTを紹介する。
GRAFTは、ウォールタイム時間、エネルギー消費、およびマザームCO$排出量を削減しつつ、トレーニング軌道を保存している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:03:39 GMT)
A robust and composable device-independent protocol for oblivious transfer using (fully) untrusted quantum devices in the bounded storage model [4.6] 本稿では,マジックスクエアデバイスを用いたOtlivious Transfer(OT)のためのデバイス非依存(DI)量子プロトコルを提案する。
DELAYと呼ばれる固定定数(実世界)時間間隔の後、量子状態は完全に解離する。
我々のプロトコルは(ラムダで)正当性とセキュリティ上のエラーを無視でき、NISQ時代に実装できる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:09:12 GMT)
Electronic structure prediction of medium and high entropy alloys across composition space [4.6] 本研究では,集中型合金の組成空間における電子密度を予測するための機械学習モデルを提案する。
トレーニングデータ要求を最小限に抑えるためにベイジアンアクティブラーニング(AL)を採用している。
本モデルでは, 電子密度とエネルギーの両方を合成空間にわたって予測する際の精度と一般化性を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:14:17 GMT)
Text2Weight: Bridging Natural Language and Neural Network Weight Spaces [4.5] T2Wは、自然言語の記述に基づいてタスク固有の重みを生成する拡散トランスフォーマーフレームワークである。
T2Wは階層的にネットワークパラメータを一様ブロックに処理し、CLIPからのテキスト埋め込みを事前の注意機構を通じて統合し、一般化を強化するために敵の訓練を使用する。
私たちの作業は、テキストの重み付けによるオープンソースのデータセットによってサポートされた、ウェイトスペースのダイナミックスでテキストセマンティクスを橋渡しします。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:47:34 GMT)
Model-based Multi-object Visual Tracking: Identification and Standard Model Limitations [4.5] 本稿では,2次元境界ボックス検出を用いた歩行者追跡の課題に対処するために,多目的追跡手法を用いる。
出生・生存確率を含む連続時間に根ざしたモデルパラメータの選択について論じる。
結果、PMBMアルゴリズムは有望な結果をもたらすが、SPOモデルとデータとのミスマッチが明らかになる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:57:32 GMT)
Trans-XFed: An Explainable Federated Learning for Supply Chain Credit Assessment [4.5] 本稿では,連合学習と説明可能なAI技術を組み合わせてサプライチェーンクレジットアセスメントを行うTrans-XFedアーキテクチャを提案する。
提案モデルは,プライバシ,情報サイロ,クラス不均衡,非同一かつ独立に分散された(Non-IID)データ,サプライチェーンクレジットアセスメントにおけるモデル解釈可能性など,いくつかの重要な課題に対処することを目的としている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:20:57 GMT)
Lexical Hints of Accuracy in LLM Reasoning Chains [4.4] コード、数学、一般知識ベンチマークの全体的なパフォーマンスを継続的に向上させるモデルを生成する前に、補修学習とCoT(Chain-of-Thought)を明示的に生成する大規模言語モデル(LLM)。
ここでは、COTの計測可能な性質がLLMの内部信頼度を信頼性の高い信号として提供するかどうかを検証する。
CoT内の不確実性指標は、高信頼マーカーよりも一貫して健全であり、正しい応答よりもエラーを予測しやすくする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:20:38 GMT)
Pixels to Play: A Foundation Model for 3D Gameplay [4.4] そこで,Pixels2Play-0.1(P2P0.1)を紹介した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:24:50 GMT)
Generalisation and benign over-fitting for linear regression onto random functional covariates [4.3] リッジレス最小二乗回帰法とリッジレス最小二乗回帰法の理論的予測性能について検討した。
我々は、$p$が$n$に対して急速に成長する体制における収束率を導出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:01:20 GMT)
Comparative Analysis of Time Series Foundation Models for Demographic Forecasting: Enhancing Predictive Accuracy in US Population Dynamics [4.3] 本研究は,アメリカ合衆国における時系列基盤モデルの人口変動予測への応用について検討した。
従来のベースラインに対する時系列基礎モデル(TimesFM)の性能評価を行った。
人口統計学的に多様性のある6州を対象に行った実験では、TimesFMが86.67%のテストケースで最低値のMean Squared Error(MSE)を達成した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:06:02 GMT)
Conflicting Scores, Confusing Signals: An Empirical Study of Vulnerability Scoring Systems [4.3] この研究は、4つの公開脆弱性スコアリングシステムの大規模な結果リンクによる実験的な比較を初めて提供する。
私たちは、MicrosoftのPatch Tuesdayの4ヶ月の開示から得られた600の現実世界の脆弱性のデータセットを使用しています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:54:58 GMT)
Diffusion MRI with Machine Learning [4.3] 脳の拡散強調磁気共鳴イメージング(dMRI)には、ユニークな機能がある。
機械学習は、dMRI分析の難しいタスクのいくつかに取り組むのに非常に適しているかもしれない。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:06:14 GMT)
FedUP: Efficient Pruning-based Federated Unlearning for Model Poisoning Attacks [4.1] フェデレート・アンラーニング(FU)は、このような脆弱性に対処するソリューションとして浮上している。
この研究は、悪意のあるクライアントの影響を効率的に緩和するために設計された軽量なFUアルゴリズムであるFedUPを提示する。
すべてのシナリオにおいて、FedUPは悪意のある影響を減らし、悪意のあるデータに対する精度を下げて、スクラッチから再トレーニングされたモデルと一致させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:14:58 GMT)
Red Teaming Methodology for Design Obfuscation [4.1] 我々は,設計難読化手法の安全性を評価するために,体系的なレッド・チーム・アプローチを提供する。
フロリダ大学が開発したRIPPERツールのケーススタディでは、一般的に考えられているよりも、オリジナルのデザインの構造についてより多くの情報がリークされていることが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:57:02 GMT)
DeH4R: A Decoupled and Hybrid Method for Road Network Graph Extraction [4.1] グラフ生成効率とグラフ成長ダイナミクスを組み合わせた新しいハイブリッドモデルであるDeH4Rを提案する。
CityScaleとSpaceNetベンチマークの総合的な評価は、最先端(SOTA)のパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:16:15 GMT)
Who Gets the Mic? Investigating Gender Bias in the Speaker Assignment of a Speech-LLM [4.1] 本研究では,話者配置をバイアス調査の分析ツールとして活用する手法を提案する。
我々は、テキスト・トゥ・スペーチ(TTS)モデルであるBarkを評価し、テキスト・プロンプトのデフォルト話者代入を分析した。
バークの話者選択がジェンダー付き連想と体系的に一致している場合、トレーニングデータやモデルデザインのパターンを明らかにする可能性がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:10:55 GMT)
TroLL: Exploiting Structural Similarities between Logic Locking and Hardware Trojans [4.1] 多くの論理ロック技術に共通する構造は、ハードウェアトロイの木馬(HWT)の望ましい特性を持っている。
そこで我々は, Logic Locking (TroLL) に基づく新しいタイプのHWTを構築し, 最先端のATPGベースのHWT検出技術を回避する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:49:18 GMT)
Detecting Many-Body Scars from Fisher Zeros [4.1] 我々はフィッシャーゼロに基づくQMBSの検出と診断のための代替ルートを提案する。
傷跡のある系では、フィッシャー零点の連続直線が虚数$beta$軸から現れ、上向きに伸びる。
個々の量子状態を徹底的に調べることなく、傷跡を発見できるという利点がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:27:57 GMT)
Optimal Subspace Embeddings: Resolving Nelson-Nguyen Conjecture Up to Sub-Polylogarithmic Factors [4.0] 我々は、隠蔽部分空間埋め込みの最適次元と空間性に関するネルソンとニュイエンの予想(FOCS 2013)の証明を与える。
任意の $ngeq d$ および $epsilongeq d-O(1)$ に対して、任意の $AinmathbbRntimes d に対して $tilde O(d/epsilon2)times n$ matrix $Pi$ with $tilde O(log(d)/epsilon)$ non-zeros per column が存在する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:45:52 GMT)
EDTalk++: Full Disentanglement for Controllable Talking Head Synthesis [3.9] 本稿では,制御可能な音声ヘッド生成のためのフレームワークであるEDTalk++を提案する。
本フレームワークは,映像や音声の入力に対して,口形状,頭部ポーズ,眼球運動,感情表現を個別に操作することを可能にする。
EDTalk++の有効性を示す実験が行われた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:55:25 GMT)
Hierarchical Vision-Language Retrieval of Educational Metaverse Content in Agriculture [3.9] 農業をテーマとした457の仮想博物館(AgriMuseums)を含む新しいデータセットについて紹介する。
本稿では,自然言語クエリを用いて関連するAgriMuseumを表現・検索する階層型視覚言語モデルを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:19:31 GMT)
MA-CBP: A Criminal Behavior Prediction Framework Based on Multi-Agent Asynchronous Collaboration [3.8] 公共の場での犯罪行為は、社会保障にとってますます深刻な脅威となる。
リアルタイムビデオストリームをフレームレベルのセマンティック記述に変換するフレームワークであるMA-CBPを提案する。
結果として生じる行動決定には、事象の主題、場所、原因などの重要な要素が含まれ、潜在的な犯罪行為の早期警告を可能にする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:14:11 GMT)
Statistical Comparative Analysis of Semantic Similarities and Model Transferability Across Datasets for Short Answer Grading [3.8] 本研究では、確立されたデータセットに基づいて訓練された最先端(SOTA)モデルの、未探索のテキストデータセットへの転送可能性について検討する。
この研究の主な目的は、SOTAモデルの潜在的な適用性と適応性に関する総合的な洞察を得ることである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:45:02 GMT)
Decentralized Contextual Bandits with Network Adaptivity [3.7] 我々は,NetLinUCBとNet-SGD-UCBという2つのネットワーク対応アッパー信頼境界(UCB)アルゴリズムを開発した。
提案手法は,グローバルおよびローカルなコンポーネントに学習を分解し,エージェントが完全に同期することなく共有構造を活用できるようにする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:09:03 GMT)
Consumer Autonomy or Illusion? Rethinking Consumer Agency in the Age of Algorithms [3.6] デジタル時代の金融決定は、義務消費、アルゴリズムによる説得、不安定な作業スケジュールといった外部からの圧力によって形成される。
本研究では, 消費の割引を前提とした形式モデルについて, その制約を考慮し検討する。
我々は、合理的でユーティリティを最大化するエージェントでさえ、代理店が限られている場合に、早期の財政破綻を経験できることを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:48:12 GMT)
Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning [3.6] 深層強化学習とグラフニューラルネットワーク(GNN)を用いた一般的な計画は、様々な象徴的計画領域において有望な結果を示している。
既存のアプローチでは、計画状態が完全に連結されたグラフとして表現され、問題スケールが大きくなるにつれて、エッジ情報や相当な間隔が爆発する。
本稿では, 局所的関係を符号化し, 目的に関連する空間的特徴を明示的に統合する, 疎結合なGNN表現を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:06:36 GMT)
Order Optimal Regret Bounds for Sharpe Ratio Optimization in the Bandit Setting [3.6] バンディット設定におけるシャープ比(SR)の逐次決定問題について検討する。
我々の理論的貢献にはシャープ比のために特別に設計された新しい後悔の分解が含まれる。
以上の結果から,トンプソンの対数的後悔は時間とともに達成され,リスク調整による腕の識別の難しさを把握できる分布依存因子が得られた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:41:34 GMT)
Benchmarking Federated Learning for Semantic Datasets: Federated Scene Graph Generation [3.5] フェデレートラーニング(FL)はデータのプライバシを維持しながら分散トレーニングを可能にするが、既存のFLベンチマークは比較的単純な分類タスクに対処する。
クライアント間のセマンティックな不均一性を制御可能なFLベンチマークを構築するためのベンチマークプロセスを提案する。
概念実証として,既存のPSG手法の有効性をFL設定で実証するフェデレートPSGベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:48:02 GMT)
Rapid Urban Visibility Hotspots: Quantifying Building Vertex Visibility from Connected Vehicle Trajectories using Spatial Indexing [3.5] 本研究では,位置可視性を客観的に定量化するデータ駆動手法を提案する。
各車両位置の前方視界を用いた動的運転場をモデル化する。
道路周辺における数千の潜在的関心点について、累積的な視覚的露出、または可視的数'を定量化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:42:46 GMT)
PENGUIN: Enhancing Transformer with Periodic-Nested Group Attention for Long-term Time Series Forecasting [3.4] 本稿では,PENGUINという,シンプルで効果的なグループ注意機構を提案する。
提案手法は, 周期パターンを明示的にモデル化することの重要性を強調し, 実効時系列モデリングに相対的注意バイアスを取り入れることである。
さまざまなベンチマークの実験により、PENGUINはTransformerベースのモデルとTransformerベースのモデルの両方を一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:19:12 GMT)
Exploring Content and Social Connections of Fake News with Explainable Text and Graph Learning [3.3] 偽情報は、しばしば「いいね!」やユーザーネットワークのようなソーシャルメディアのダイナミクスを利用して、そのリーチを増幅する。
本稿では、ファクトチェックを強化するために、コンテンツ、ソーシャルメディア、グラフベースの機能を組み合わせた説明可能なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:32:47 GMT)
Blending 3D Geometry and Machine Learning for Multi-View Stereopsis [3.3] GC MVSNet plusは、学習中に多視点、多スケールの教師あり幾何的一貫性を強制するための新しいアプローチである。
この統合GCチェックは、幾何学的に一貫性のないピクセルを直接ペナル化することにより、学習プロセスを著しく加速する。
提案手法は,DTUおよびBlendedMVSデータセット上での新たな技術状況を実現し,タンク・アンド・テンプルのベンチマークで2位を確保した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:00:04 GMT)
In-Context Decision Making for Optimizing Complex AutoML Pipelines [3.2] この作業はCASHフレームワークを拡張して、現代的なMLパイプラインを選択し、適応する。
我々は,PS(Posterior Sampling)を最大k腕バンディット問題に拡張することにより,適応MLパイプラインを効率的に探索し,活用するPS-PFNを提案する。
1つの新しいベンチマークタスクと2つの既存のベンチマークタスクの実験結果から、PS-PFNの他のバンディットおよびオートML戦略と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:05:16 GMT)
ReviewGraph: A Knowledge Graph Embedding Based Framework for Review Rating Prediction with Sentiment Features [3.2] 本研究は,テキストによる顧客レビューを知識グラフに変換する新しいフレームワークであるReviewGraph for Review Rating Prediction (RRP)を提案する。
グラフ埋め込み(Node2Vec)と感情機能を使用して、このフレームワークは機械学習分類器を通じてレビュー評価スコアを予測する。
ReviewGraphのアウトプットとプラットフォームをGitHubのページで公開します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:44:27 GMT)
ASAP: Unsupervised Post-training with Label Distribution Shift Adaptive Learning Rate [3.2] ASAPは、現在の出力と以前の出力の間の余剰距離を計算し、それを有界範囲にマッピングすることで学習率を調整する。
実験により、ASAPは精度と効率を一貫して改善し、教師なしモデル適応に実用的であることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:59:24 GMT)
Disentangling concept semantics via multilingual averaging in Sparse Autoencoders [3.2] 本稿では,スパースオートエンコーダを用いた概念アクティベーションの平均化により,Large Langue Modelsの概念セマンティクスを分離する手法を提案する。
Sparse Autoencoders のオープンソース Gemma Scope スイートを用いて,各クラスおよび言語バージョンに対する概念アクティベーションを得る。
以上の結果から,概念平均は単一言語自体と比較してクラス間の真の関係に一致することが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:18:56 GMT)
Accurate and Scalable Simulation of Cavity-Based Networks in Modular Quantum Architectures [3.1] キャビティを介する相互接続は、モジュラー量子コンピュータをスケールするための有望なプラットフォームである。
まず、Stimulated Raman Adiabatic Passage (STIRAP)プロトコルを用いて、決定論的チップ間量子状態伝達のダイナミクスをモデル化する。
次に,NetSquidシミュレータを拡張して,チップ間状態伝達と絡み合いの発生を媒介するキャビティベースの通信チャネルをサポートする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:01:54 GMT)
Hallucinations and Key Information Extraction in Medical Texts: A Comprehensive Assessment of Open-Source Large Language Models [3.1] 大規模言語モデル(LLM)は、このような要約の精度を自動化し改善する大きな可能性を示している。
放電報告から重要な事象を抽出するオープンソースLCMの有効性について検討する。
また,これらのモデルが生成した要約において,様々な種類の幻覚の出現率を評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:09:43 GMT)
VisionLaw: Inferring Interpretable Intrinsic Dynamics from Visual Observations via Bilevel Optimization [3.1] VisionLawは、視覚的な観察から固有の力学の解釈可能な表現を推論する二段階最適化フレームワークである。
既存の最先端手法を著しく上回り、新しいシナリオにおける対話型シミュレーションの強力な一般化を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:52:16 GMT)
Multi-User Contextual Cascading Bandits for Personalized Recommendation [3.1] Multi-User Contextual Cascading Banditモデルは、複数のユーザがシーケンシャルに表示されたアイテムと同時に対話するリアルなオンライン広告シナリオをキャプチャする。
我々はまず,UCBBP(Upper Confidence Bound with Backward Planning)を提案する。この設定に適したUCBスタイルのアルゴリズムで,$widetildeO(sqrtTHN)$が$T$以上,セッションステップが$H$,コンテキストが$N$以上となることを証明している。
多くのユーザが同時にシステムと対話するという事実に感銘を受けて、我々はActive Up Confidence Bound withという第2のアルゴリズムを導入しました。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:14:33 GMT)
InPars+: Supercharging Synthetic Data Generation for Information Retrieval Systems [3.1] この研究は、ニューラル情報検索(NIR)のための合成クエリ生成パイプラインを再考し、拡張する。
まず、SciFactベンチマークで、オリジナルのInPars、InPars-V2、Promptaパイプラインのセガレータを評価する。
クエリジェネレータをCPO(Contrastive Preference Optimization)経由で微調整することで、生成されたクエリの信号品質を改善するとともに、静的プロンプトテンプレートを動的にChain-of-Thought(CoT)最適化プロンプトに置き換える。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:23:18 GMT)
C2PSA-Enhanced YOLOv11 Architecture: A Novel Approach for Small Target Detection in Cotton Disease Diagnosis [3.1] 本研究は,綿病検出におけるYOLOv11の深層学習に基づく最適化について述べる。
移動配置システムにより,農業分野におけるリアルタイムの病害モニタリングと精密処理が可能となる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:54:18 GMT)
Robust Federated Learning under Adversarial Attacks via Loss-Based Client Clustering [3.1] フェデレートラーニング(FL)は、プライベートデータを共有せずに、複数のクライアント間で協調的なモデルトレーニングを可能にする。
FLサーバは信頼できる(正直な)サイドデータセットを持ち、FLクライアントが敵(ビザンチン)攻撃を受ける場合のFLシナリオを考察する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:06:11 GMT)
Active Learning of Mealy Machines with Timers [3.1] ブラックボックスのコンテキストでタイマーでMealyマシンをクエリする最初のアルゴリズムを提案する。
我々のアルゴリズムはVaandragerらのL#アルゴリズムを時間設定に拡張したものである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:58:06 GMT)
Crossing Borders Without Crossing Boundaries: How Sociolinguistic Awareness Can Optimize User Engagement with Localized Spanish AI Models Across Hispanophone Countries [3.0] 本稿では,ラテンアメリカとスペインにおけるスペイン語の変種の主な相違について検討する。
これらの違いは、方言群におけるスペイン語のクオーディアン使用における重要なギャップを効果的に担っていると論じる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:02:54 GMT)
iTBLS: A Dataset of Interactive Conversations Over Tabular Information [3.0] ITBLSデータセットは、解釈、修正、生成という3種類の表型タスクで構成されている。
本稿では,質問応答として表計算操作を再構築する新しい枠組みを提案する。
提案手法は, ITBLS に基づくシーケンス・ツー・シーケンス・モデリングのベースライン上でのタスクを改良する。
新たなアプローチでは、Exact-Matchの精度が13%向上し、BERTScoresが16%向上した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:43:41 GMT)
A Study of the Framework and Real-World Applications of Language Embedding for 3D Scene Understanding [2.9] Gaussian Splattingはリアルタイム3Dシーン表現の変換技術として登場した。
複雑なシーンを高い忠実度でレンダリングする能力は、シーン再構築、ロボティクス、インタラクティブなコンテンツ作成といった領域をまたいだ進歩を可能にした。
本調査では,言語指導と3次元ガウススプラッティングを組み合わせた最近の研究成果について概説する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:47:37 GMT)
Vision Backbone Efficient Selection for Image Classification in Low-Data Regimes [2.9] 我々は,コンピュータビジョンの新たな研究方向として,データセット固有のバックボーン選択を導入する。
単純な検索戦略でさえ、1300ドル以上の事前訓練されたモデルのプール内で、うまく適合したバックボーンを見つけることができる。
以上の結果から,単純な検索戦略であっても,単一のGPU上で10分以内の検索時間内に適切なバックボーンを見つけることができることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:02:03 GMT)
Spatial-Temporal Transformer with Curriculum Learning for EEG-Based Emotion Recognition [2.8] SST-CLは、空間時間変換器とカリキュラム学習を統合した新しいフレームワークである。
力に敏感なカリキュラム学習戦略は、高強度から低強度の感情状態へのトレーニングを指導する。
3つのベンチマークデータセットの実験では、様々な感情的強度レベルにわたる最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:24:33 GMT)
Fluorescence molecular optomic signatures improve identification of tumors in head and neck specimens [2.8] 組織分類のための光蛍光分子イメージングデータに放射線学的アプローチが拡張された「オプトミクス」
オプトミックは、蛍光によって伝達されるEGFR発現のテクスチャパターンの違いを探索することにより、腫瘍の同定を改善することを目指している。
改良された性能は、蛍光分子イメージングデータへの放射能アプローチの拡張が、蛍光誘導手術における癌検出に有望な画像解析技術を提供することを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:49:27 GMT)
In-hoc Concept Representations to Regularise Deep Learning in Medical Imaging [2.8] 医用画像における深層学習モデルは, 配電性能は高いが, 分布シフト下での一般化に苦慮することが多い。
LCRRegはLatent Concept Representationsを利用した新しい正規化手法である。
LCRRegは, 人工的, 実世界の医療タスクにまたがって評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:43:30 GMT)
MATA (māta): Mindful Assessment of the Telugu Abilities of Large Language Models [2.8] MATAは、テルグ語における大規模言語モデル(LLM)の能力を評価するための、新しい評価データセットである。
我々は,11個のオープンウェイトおよびクローズドソースLCMをデータセット上で評価し,その性能を詳細に分析した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:33:57 GMT)
RAPNet: A Receptive-Field Adaptive Convolutional Neural Network for Pansharpening [2.7] 本稿では,コンテンツ適応型畳み込みを利用した新しいアーキテクチャであるRAPNetを紹介する。
RAPNetはReceptive-field Adaptive Pansharpening Convolution (RAPConv)を採用している。
ネットワークには Pansharpening Dynamic Feature Fusion (PAN-DFF) モジュールが組み込まれており、空間的詳細化とスペクトルの忠実度を最適にバランスさせるためのアテンション機構が組み込まれている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:20:31 GMT)
A Mechanism for Mutual Fairness in Cooperative Games with Replicable Resources -- Extended Version [2.7] AIの最近の進歩は、人工知能と人間のエージェントが協力してグローバルな目標を実現するエージェントシステムに焦点を当てている。
このようなシステムを設計する上での大きな課題は、安全性と人間の価値との整合性を保証することである。
協調ゲーム理論は、値関数を介して協調エージェントの有用な抽象化を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:53:34 GMT)
A Comprehensive Re-Evaluation of Biometric Modality Properties in the Modern Era [2.7] 本研究は,24名のバイオメトリック・スペシャリストを含む専門家による調査を通じて,バイオメトリック・モダリティの評価を再考する。
この結果は、資産格付けが様々に大きく変化したことを示している。
例えば、顔認識では、技術進歩による評価が向上し、指紋では、新たな脆弱性や攻撃によって信頼性が低下している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:40:52 GMT)
Understanding Distribution Structure on Calibrated Recommendation Systems [2.7] 従来のレコメンデーターシステムは、ユーザのプロフィールのあまり目立たない部分からジャンルを省略する。
推薦リストの表示領域を減らした校正レコメンデーションシステムを開発した。
映画領域から3つのデータセットのユーザパターンを評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:59:10 GMT)
Uncertainty Tube Visualization of Particle Trajectories [2.6] ニューラルネットワーク(NN)による粒子軌道の予測は、多くの科学および工学領域を大幅に強化した。
不確実性について理解しなければ、定量化が最重要であるアプリケーションにおけるNNモデルの信頼性は著しく損なわれる。
本稿では,NN由来の粒子経路における不確実性を表すために,新しい,計算効率のよい可視化手法である不確実性管を紹介する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:44:33 GMT)
A Fully Transformer Based Multimodal Framework for Explainable Cancer Image Segmentation Using Radiology Reports [2.6] Med-CTX(Med-CTX)を導入した。
我々は,臨床放射線学報告を統合して,パフォーマンスと解釈可能性の両立を図った。
BUS-BRAデータセットでは、Diceスコアが99%、IoUが95%に達し、既存のベースラインであるU-Net、ViT、Swinを上回っている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:55:10 GMT)
Shape-from-Template with Generalised Camera [2.6] 複数のカメラの星座で観測される2次元キーポイントに3次元形状を非剛性登録する新しい手法を提案する。
我々は、一般化されたカメラモデルを用いて、そのようなマルチカメラのセットアップを表現する。
本稿では,多くの合成データおよび実データに対して提案手法の精度を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:51:19 GMT)
BiND: A Neural Discriminator-Decoder for Accurate Bimanual Trajectory Prediction in Brain-Computer Interfaces [2.6] BiND (Bimanual Neural Discriminator-Decoder) は、まずモーションタイプを分類し、次に特殊なGRUベースのデコーダを使用する2段階モデルである。
テトラプレジック患者からの13セッションの皮質内データセットを用いて,6つの最先端モデルに対してBiNDをベンチマークした。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:18:41 GMT)
Non-invertible symmetries out of equilibrium [2.5] 非可逆対称性が動的にどのように現れるかを示す。
非可逆対称性は、摂動の順序でのみ持ち上げることができるスペクトルの退化を引き起こすことが示されている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:11:19 GMT)
Extracting pairs of time-bin entangled photons from resonance fluorescence [2.5] 共鳴蛍光から自然に時間双絡光子を抽出することができる。
エンタングルメントはエミッタの弱い励起と強い励起の両方のために持続することを示す。
その結果, 共鳴蛍光を時間結合光子対の効率的な光源として確立した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:41:26 GMT)
Tailored First-order and Interior-point methods and a new semidefinite programming hierarchy for entanglement detection [2.5] 量子絡み合いは量子情報科学の核心にあるが、高次元またはノイズの多いシステムにおける信頼性の高い検出は、依然として基本的な計算課題である。
本稿では,EXT と DPS の間に挟まれた新しい SDP 階層 PST を導入する。
我々のアルゴリズムは数値的に安定しており、分離性の境界付近にある状態であっても、絡み合った証人や近接測度を生成することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:09:27 GMT)
Breakable Machine: A K-12 Classroom Game for Transformative AI Literacy Through Spoofing and eXplainable AI (XAI) [2.4] 本稿では,eXplainable AI(XAI)ベースの教室ゲーム「Breakable Machine」を提案する。
このゲームは生徒に、高信頼の誤分類を引き起こすために、外観や環境を操作することでイメージを偽造するよう促す。
AIモデルの構築に集中するのではなく、このアクティビティは、脆さ、バイアス、脆弱性を突破することに集中している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:49:01 GMT)
Can Masked Autoencoders Also Listen to Birds? [2.4] Masked Autoencoders (MAEs) は、効率的な自己教師型再構成タスクを通じて、音声分類におけるリッチな意味表現を学習する。
汎用モデルは、きめ細かいオーディオドメインに直接適用しても、うまく一般化できない。
この領域ギャップを埋めるには、ドメイン固有の事前学習データだけでなく、完全なパイプライン適応が必要です。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:35:29 GMT)
Cherenkov Imaged Bio-morphological Features Verify Patient Positioning with Deformable Tissue Translocation in Breast Radiotherapy [2.4] 本研究は, 放射線治療中のチェレンコフ画像解析による局所組織変形の追跡手法を提案する。
組織ファントムを用いたチェレンコフ画像では, 血管の検出とセグメンテーションが発達した。
乳がん10例の臨床チェレンコフデータから,第1分率に対して3.7+2.4mm,第1分率で95%,第3分率で最大3.3+1.9mm,第2分率で3.7+2.4mmの差が認められた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:11:45 GMT)
A Survey on Video Anomaly Detection via Deep Learning: Human, Vehicle, and Environment [2.3] ビデオ異常検出(VAD)は、コンピュータビジョンにおいて重要なタスクとして登場し、複数の分野にまたがる幅広い関連性を持つ。
近年のディープラーニングの進歩はこの分野に大きな進歩をもたらしているが、この分野はドメインや学習パラダイムにまたがって断片化されている。
この調査は、様々な監督レベルの文献を体系的に整理し、VADに関する包括的な視点を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:50:49 GMT)
"Haet Bhasha aur Diskrimineshun": Phonetic Perturbations in Code-Mixed Hinglish to Red-Team LLMs [2.3] 我々は,テキストおよび画像生成タスクにおいて,コードミキシングと音声の摂動をジェイルブレイクLLMに活用する新しい戦略を導入する。
本研究では,LLMにおける安全性フィルタを効果的に回避する手法を提案する。
我々の解釈可能性実験は、音声による摂動が単語のトークン化に影響を与え、ジェイルブレイクが成功することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:43:09 GMT)
Reliability comparison of vessel trajectory prediction models via Probability of Detection [2.3] この寄与は、異なる深層学習に基づくアプローチの評価に焦点を当てた血管軌跡予測(VTP)に対処する。
目的は、多様な交通量におけるモデル性能を評価し、アプローチの信頼性を比較することである。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:43:56 GMT)
A Conceptual Framework for AI-based Decision Systems in Critical Infrastructures [2.3] 安全クリティカルなシステムにおける人間とAIの相互作用は、既存のフレームワークによって部分的に対処されている、ユニークな課題のセットを示します。
これらの懸念に対処しながら、人間とAIの能力を総合的に統合するフレームワークが特に必要である。
本稿では、学際的アプローチを採用することにより、批判的インフラの全体的概念的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:52:22 GMT)
A Joint Multitask Model for Morpho-Syntactic Parsing [2.3] We present a joint multitask model for the UniDive 2025 Morpho-Syntactic Parsing shared task。
本システムでは,XLM-RoBERTaエンコーダとコンテンツワード識別,依存性解析,形態素的特徴予測の3つの専用デコーダを用いた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:09:36 GMT)
State of Abdominal CT Datasets: A Critical Review of Bias, Clinical Relevance, and Real-world Applicability [2.2] 本研究は, 腹部CTデータセットの公開と, 臨床現場における人工知能(AI)応用への適合性を臨床的に評価するものである。
46例の腹部CTデータセット(50,256例)について検討した。
我々は相当な冗長性(59.1%のケースリユース)と西/地理スキュー(75.3%の北米とヨーロッパから)を見出した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:36:00 GMT)
Preparing low-variance states using a distributed quantum algorithm [2.2] 低分散状態を生成するために、反復位相推定にインスパイアされた分散量子アルゴリズムを提案する。
提案手法では,量子デバイス毎の1つの補助量子ビットを用いて,そのダイナミクスを制御し,共同量子計測のためのポストセレクション戦略を用いる。
これにより,分散アルゴリズムが単一デバイス実装と比較してエネルギー分散を高速化することを示すことができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:33:16 GMT)
Quantum Chaos Diagnostics for Open Quantum Systems from Bi-Lanczos Krylov Dynamics [2.1] エルミート系では、クリロフ複雑性は量子力学の強力な診断として現れる。
ここでは、By-Lanczosアルゴリズムを用いて計算されたクリロフ複雑性が、開量子系におけるカオスおよび可積分相を効果的に同定することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:49:09 GMT)
The Social Context of Human-Robot Interactions [2.0] 本研究では,人間とロボットの相互作用の社会的文脈を記述する概念モデルを提案する。
我々は,対話の計画を立て,ロボットの行動モデルを開発し,対話がおこなわれた後に洞察を得ることのできる,社会的文脈のさまざまな属性について論じる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:15:58 GMT)
Dynamics-independent bounds on state transformations and precision in open quantum systems [2.0] 達成可能な量子状態変換における力学非依存上界を導出する。
初期システム状態と動的に到達可能な状態との間のR'enyiの分岐は、上から有界であることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:45:09 GMT)
Differentially Private aggregate hints in mev-share [2.0] Flashbotsは最近Mev-shareをリリースした。
本稿では,情報量的開示のための新たなタイプのヒントとして,DPアグリゲーションヒントを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:53:31 GMT)
FreqDGT: Frequency-Adaptive Dynamic Graph Networks with Transformer for Cross-subject EEG Emotion Recognition [1.9] クロスオブジェクトの一般化は、個人の多様性、認知的特徴、感情的な反応による課題である。
本稿では,周波数適応型動的グラフ変換器FreqDGTを提案する。
FreqDGTは、周波数適応性、空間力学、時間階層モデリングの統合の有効性を確認することにより、物体間感情認識の精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:57:12 GMT)
The StudyChat Dataset: Student Dialogues With ChatGPT in an Artificial Intelligence Course [1.9] 大規模言語モデル(LLM)は教育に大きな影響を与え、機会と課題の両方を提起している。
本研究では,LLMを用いた実世界の学生インタラクションのデータセットであるStudioChatを紹介する。
本稿では,ChatGPTのコア機能を再現したWebアプリケーションをデプロイし,学生のLLMとのインタラクションをログに記録する。
これらの相互作用を分析し、利用傾向を強調し、特定の生徒の行動がコースの結果とどのように関連しているかを分析する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:36:20 GMT)
Dataset Condensation with Color Compensation [1.9] 画像レベルの選択方法(コアセット選択、データセット量子化)は、凝縮不効率に悩まされる。
データセットの凝縮における重要な問題は、情報キャリアと基本的な意味表現ユニットとしてのカラーの二重の役割の監視である。
我々は、Color Compensationを用いたデータセット凝縮フレームワークDC3を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:05:53 GMT)
New Insights into Automatic Treatment Planning for Cancer Radiotherapy Using Explainable Artificial Intelligence [1.9] 本研究では,人工知能(AI)エージェントによる自動治療計画における不透明な意思決定プロセスを明らかにすることを目的とする。
本研究では,Actor-Critic with Experience Replay(ACER)ネットワークに基づくAIエージェントについて検討した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:38:16 GMT)
Inference Time Debiasing Concepts in Diffusion Models [1.8] テキストから画像への拡散に基づくモデルのデバイアス化手法であるDeCoDiを提案する。
画像品質は著しく変化せず、計算オーバーヘッドも無視でき、拡散ベースの画像生成モデルにも適用できる。
看護師,消防士,CEOという概念に対して,性別,民族,年齢を嫌悪する手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:21:02 GMT)
Evaluating Identity Leakage in Speaker De-Identification Systems [1.8] 話者識別は, 話者の身元を隠蔽し, 話者の身元を隠蔽することを目的としている。
3つの相補的誤り率で残差アイデンティティリークを定量化するベンチマークを導入する。
評価結果から,最先端話者識別システムはすべて識別情報を漏洩していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:20:25 GMT)
Categorical Policies: Multimodal Policy Learning and Exploration in Continuous Control [1.7] 中間カテゴリー分布を持つマルチモーダルな動作モードをモデル化するためにカテゴリーポリシーを導入する。
動作モードを選択するために潜在カテゴリー分布を利用することで、本手法はサンプリングトリックを通して完全に微分可能でありながら、マルチモーダル性を自然に表現する。
その結果, カテゴリー分布は, 連続制御における構造的探索と多モーダルな行動表現の強力なツールとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:18:01 GMT)
Fully Automated Segmentation of Fiber Bundles in Anatomic Tracing Data [1.7] マカクトレーサデータにおけるファイババンドルセグメンテーションのための合理化完全に自動化されたフレームワークを提案する。
提案手法では,端末をバンドルとして誤ラベルするなどの一般的なエラーを排除し,スパースバンドルの検出を20%以上改善し,FDR(False Discovery Rate)を40%削減する。
この新たなフレームワークは、大規模な解剖学的トレースデータの自動解析を容易にし、dMRIトラクトグラフィー手法の検証と最適化に使用できる、より基礎的なデータを生成する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:58:58 GMT)
On the Security and Privacy of Federated Learning: A Survey with Attacks, Defenses, Frameworks, Applications, and Future Directions [1.7] Federated Learning(FL)は、クライアントが生データを共有せずにグローバルモデルを協調的にトレーニングできる、新興の分散機械学習パラダイムである。
FLはデータプライバシを設計によって強化するが、さまざまなセキュリティやプライバシの脅威に対して脆弱である。
セキュリティ強化手法は、ビザンチン攻撃、中毒、シビル攻撃などの悪意ある行動に対してFLの堅牢性を改善することを目的としている。
プライバシー保護技術は、暗号化アプローチ、差分プライバシー、セキュアアグリゲーションを通じて機密データを保護することに重点を置いている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:06:20 GMT)
Advancing Toward Robust and Scalable Fingerprint Orientation Estimation: From Gradients to Deep Learning [1.7] この研究は、従来の手法からより高度な機械学習アプローチへの明確な進化を特定する。
この研究は、現在のアプローチの限界を強調し、次世代のアルゴリズムを設計することの重要性を強調している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:51:20 GMT)
Knowledge Graph Completion for Action Prediction on Situational Graphs -- A Case Study on Household Tasks [1.7] 本研究では,家庭用ロボットの制御や映像解析に有用である家庭用行動に関する知識グラフについて検討する。
後者の場合、ビデオから抽出された情報は不完全であることが知られており、状況画像を強化するための知識グラフの完成が不可欠である。
標準的なリンク予測問題ではあるものの、状況知識グラフには、多くのリンク予測アルゴリズムがジョブに適さない特別な特徴があり、単純なベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:24:29 GMT)
A Comparative Study of Decoding Strategies in Medical Text Generation [1.7] 正確性が不可欠である医療において、デコード戦略の影響はいまだに過小評価されている。
医療専門および汎用大規模言語モデルを用いた11個のデコード戦略の評価を行った。
以上の結果から,決定論的戦略は一般的にそれよりも優れており,etaおよびトップkサンプリングは最悪の結果となった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:25:25 GMT)
DyMixOp: Guiding Neural Operator Design for PDEs from a Complex Dynamics Perspective with Local-Global-Mixing [1.7] 本稿では、偏微分方程式(PDE)のための新しいニューラルネットワークフレームワークであるDyMixOpを紹介する。
慣性多様体理論に基づいて、DyMixOpは無限次元非線形PDEダイナミクスを有限次元潜在空間に変換する。
鍵となる革新は、乱流の対流力学にインスパイアされたLGM(Local-Global-Mixing)変換である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:41:26 GMT)
Exit Stories: Using Reddit Self-Disclosures to Understand Disengagement from Problematic Communities [1.6] Redditの「ex-」サブレディットは、ユーザーが社会的、イデオロギー的、政治的グループから離脱したことを記録できる。
本稿では,131件のサブレディットにまたがる15K件の出口を詳細に調査する。
宗教、マンスフェア、陰謀論、政治、ライフスタイルの5つの重要な分野に焦点を当てている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:57:55 GMT)
Vision Transformers for Kidney Stone Image Classification: A Comparative Study with CNNs [1.6] 本研究では,視覚変換器(ViT)とCNNモデルの比較分析を行った。
ImageNet-21kで事前訓練されたViTベースモデルは、複数の撮像条件で一貫してResNet50ベースラインを上回った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:38:59 GMT)
Optimizing Region of Interest Selection for Effective Embedding in Video Steganography Based on Genetic Algorithms [1.6] 本稿では,映像ステガノグラフィの新しい手法を提案する。この手法は,映像中の関心領域(ROI)を識別するための遺伝的アルゴリズム(GA)を利用する。
秘密データは、広く受け入れられている暗号化標準であるAdvanced Encryption Standard (AES)を使用して暗号化され、カバービデオに埋め込まれる。
提案手法は,64dBsから75dBsまでのPSNRの組込み能力と効率が高く,組込みデータが元の映像とほぼ区別できないことを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:16:45 GMT)
ViExam: Are Vision Language Models Better than Humans on Vietnamese Multimodal Exam Questions? [1.6] 視覚言語モデル(VLM)は、英語のマルチモーダルタスクにおいて顕著な能力を示す。
本研究は,VLMが実世界の言語間マルチモーダル推論を扱えるかどうかを考察する。
最先端のVLMは57.74%しか達成していないのに対し、オープンソースモデルは7つの学術領域で平均精度27.70%を達成している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:31:18 GMT)
TracSum: A New Benchmark for Aspect-Based Summarization with Sentence-Level Traceability in Medical Domain [1.6] 我々は、トレース可能なアスペクトベースの要約のための新しいベンチマークであるTracSumを紹介する。
生成された要約は文レベルの引用と組み合わせられ、ユーザが元のコンテキストに遡ることができる。
TracSumは、トレース可能なアスペクトベースの要約タスクの効果的なベンチマークとして機能することを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:57:45 GMT)
Beyond Human Judgment: A Bayesian Evaluation of LLMs' Moral Values Understanding [1.6] ソーシャルメディア,ニュース,フォーラムにまたがる100K以上のテキスト上の700のアノテーションから,250K以上のアノテーションにまたがるトップ言語モデルを評価する。
GPUに最適化されたBayesianフレームワークは、1M以上のモデルクエリを処理し、AIモデルは典型的に人間のアノテータの上位25%にランクされていることを明らかにした。
重要なことに、AIは人間よりもはるかに少ない偽陰性を生成し、より敏感な道徳的検出能力を強調している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:05:48 GMT)
SCRNet: Spatial-Channel Regulation Network for Medical Ultrasound Image Segmentation [1.5] CNNベースのメソッドは長距離依存を無視する傾向があり、Transformerベースのメソッドはローカルなコンテキスト情報を見落としてしまう。
本稿では,前層から2つの入力特徴を処理するために設計された新しい特徴集約モジュール(FAM)を提案する。
この戦略により、モジュールは長距離依存とローカルコンテキスト情報の両方に同時に集中することができます。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:02:27 GMT)
ASDFormer: A Transformer with Mixtures of Pooling-Classifier Experts for Robust Autism Diagnosis and Biomarker Discovery [1.5] ASDFormerはトランスフォーマーベースのアーキテクチャで、ASDに関連するニューラルシグネチャをキャプチャするために、Mixture of Pooling-Classifier Experts (MoE)を組み込んでいる。
ASDFormerは最先端の診断精度を実現し、ASDに関連する機能的接続障害に対する堅牢な洞察を明らかにする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:05:45 GMT)
Learning to Use AI for Learning: How Can We Effectively Teach and Measure Prompting Literacy for K-12 Students? [1.4] 次世代に応用し、対話し、評価し、AIシステムと協力する能力を持たせる必要性が高まっている。
このニーズに対処するため,我々はLarge-Language Model (LLM) ベースのモジュールを設計した。
第1報,第1報,第2報,第2報,第2報,第1報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第2報,第
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:54:51 GMT)
OccluNet: Spatio-Temporal Deep Learning for Occlusion Detection on DSA [1.4] デジタル・サブトラクション・アンギオグラフィーの解釈は、複雑さと解剖学的時間的制約による課題を引き起こす。
この研究は、一段階の物体検出器であるYOLOXを統合した時相ディープラーニングモデルであるOccluNetを提案する。
MR CLEAN RegistryによるDSA画像の評価では、時間的に一貫した特徴をキャプチャするモデルの能力が明らかにされた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:59:59 GMT)
When Secure Aggregation Falls Short: Achieving Long-Term Privacy in Asynchronous Federated Learning for LEO Satellite Networks [1.3] 低地球(LEO)衛星ネットワークのような動的で資源に制約のある環境では、従来の安全なアグリゲーション手法は2つの側面で不足している。
LEO衛星ネットワークの長期プライバシーを保護するFLフレームワークである-FLEOを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:55:04 GMT)
Fortifying the Agentic Web: A Unified Zero-Trust Architecture Against Logic-layer Threats [1.3] 本稿では,Zero-Trust IAMフレームワークを通じてエージェントWebを要塞化する統一セキュリティアーキテクチャを提案する。
このアーキテクチャは、分散ID(DID)と検証クレデンシャル(VC)を使用して、リッチで検証可能なエージェントIDの基礎の上に構築されている。
セキュリティはマルチレイヤのTrust Fabricを通じて運用される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:59:52 GMT)
Correlations Are Ruining Your Gradient Descent [1.2] 自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。
ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。
本稿では,ノード出力のデコレーションと白化のために提案された手法について述べるとともに,これを拡張し,分散コンピューティングや計算神経科学に特に有用な新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:29:38 GMT)
Disentangled Deep Smoothed Bootstrap for Fair Imbalanced Regression [1.2] 不均衡分布学習は、予測モデリングにおいて一般的で重要な課題であり、しばしば標準アルゴリズムの性能を低下させる。
本稿では,変分オートエンコーダ(VAE)を用いてデータ分布の潜在表現をモデル化し,定義する。
そこで我々は,不整合なVAEと潜伏空間に適用されるスムーズなブートストラップを組み合わせた,革新的なデータ生成手法を開発した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:40:04 GMT)
Augmenting cobots for sheet-metal SMEs with 3D object recognition and localisation [1.2] COOCK+ ROBUSTプロジェクトは、コボットをモバイルおよび再構成可能なプロダクションアシスタントに変換することを目的としている。
本稿では,これらの技術とコボティックシステムを産業環境で強化する機会と課題について考察する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:56:06 GMT)
subCellSAM: Zero-Shot (Sub-)Cellular Segmentation for Hit Validation in Drug Discovery [1.2] テキスト内学習戦略によって導かれるゼロショット設定にセグメンテーション基礎モデルを適用する新しい手法を提案する。
我々のアプローチでは、核、細胞、細胞内のセグメンテーションに3段階のプロセスを導入し、自己増殖機構を導入しています。
本手法は,標準セルセグメンテーションベンチマークと産業関連ヒット評価法の両方で検証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:07:27 GMT)
Formal Algorithms for Model Efficiency [1.2] KMR(Knob-Meter-Rule)は、ディープラーニングにおけるモデル効率技術を表現するための統一形式である。
KMRは効率最適化に関する数学的に正確でモジュラーな視点を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:54:02 GMT)
Efficient and Verifiable Privacy-Preserving Convolutional Computation for CNN Inference with Untrusted Clouds [1.2] 本稿では,CNN畳み込み層に適したプライバシー保護手法を提案する。
提案方式は,効率的な暗号化と復号化を可能にし,リソース制約のあるクライアントが信頼できないクラウドサーバにセキュアに計算をオフロードできるようにする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:03:27 GMT)
BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [1.2] 我々は,脳腫瘍の分類と分類に特化して設計されたBRISCという新しいMRIデータセットを提案する。
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
悪性腫瘍としてはグリオーマ、髄膜腫、下垂体腫瘍の3種類と非腫瘍の3種類がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:17:05 GMT)
Structured Prompting and Multi-Agent Knowledge Distillation for Traffic Video Interpretation and Risk Inference [1.1] 本稿では,高品質な交通シーンアノテーションとコンテキストリスク評価の自動生成を可能にする,新しい構造付きプロンプト・知識蒸留フレームワークを提案する。
我々のフレームワークは、2つの大きなビジョンランゲージモデル(VLM)を編成し、GPT-4oとo3-miniを構造化されたChain-of-Thought(CoT)戦略を用いてリッチで多視点出力を生成する。
VISTAという名前のコンパクトな3Bスケールモデルは、低解像度のトラフィックビデオを理解し、セマンティックに忠実でリスク対応のキャプションを生成することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:44:02 GMT)
Dynamic Design of Machine Learning Pipelines via Metalearning [1.1] 本稿では,AutoMLシステムのための探索空間を動的に設計するメタラーニング手法を提案する。
提案手法は,履歴メタ知識を用いて探索空間の有望な領域を選定し,最適化プロセスを高速化する。
本研究により,提案手法はランダム検索および検索空間において,ランタイムを89%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:33:33 GMT)
MMIS-Net for Retinal Fluid Segmentation and Detection [1.1] 本稿では,MMIS-Net(MultiModal Medical Image Network)を提案する。
MMIS-Netは、2つのモデルを構築するために、2つのモードにわたる19の臓器を含む10のデータセットでトレーニングされた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:27:17 GMT)
Guided sampling ansätzes for variational quantum computing [1.1] 本稿では,システム間相互作用や測定状態のサンプル,パラメータ空間に依存する,ガイド付きサンプリングアンサーゼについて紹介する。
量子コンピュータIonQ Aria上の構造1つあたりの回路の実行は200回しかなく、我々の計算は緩和された構造の周りに総エネルギーを発生させ、誤差は1.59times10-3$ Ha 以下であった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:21:23 GMT)
Toward Deployable Multi-Robot Collaboration via a Symbolically-Guided Decision Transformer [1.0] Symbolically-Guided Decision Transformer (SGDT)は、ニューロシンボリックメカニズムと因果トランスフォーマーを統合し、デプロイ可能なマルチロボットコラボレーションを実現する。
我々は,ゼロショットシナリオや少数ショットシナリオを含むタスクシナリオにおいて,SGDTの性能を評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:42:18 GMT)
DDoS Attacks in Cloud Computing: Detection and Prevention [1.0] DDoS攻撃は、組織や個人が直面している最も一般的で有害なサイバーセキュリティの脅威の1つだ。
この研究では、ボリューム、プロトコル、アプリケーション層攻撃など、さまざまな種類のDDoS攻撃を分析している。
パケットフィルタリング、侵入検知システム、マシンラーニングベースのアプローチなど、DDoS攻撃検出に使用されている既存の技術について検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:27:37 GMT)
Closed-Form Feedback-Free Learning with Forward Projection [1.0] フォワードプロジェクション(Forward Projection)は、トレーニング中の神経活動の逆行的なコミュニケーションを伴わない、解釈可能なニューラルネットワークモデルを生成する機械学習アプローチである。
4つのバイオメディカルデータセットにまたがるFPの有効性を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:50:27 GMT)
Deep Biomechanically-Guided Interpolation for Keypoint-Based Brain Shift Registration [1.0] キーポイントベースの登録法は、大きな変形や位相変化に対して堅牢性を提供する。
それらは通常、組織を無視して密度の高い変位場を作る単純な幾何学的補間器に依存している。
本稿では,スパース整合キーポイントから高密度で物理的に妥当な脳の変形を推定する新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:58:46 GMT)
The Promise of Large Language Models in Digital Health: Evidence from Sentiment Analysis in Online Health Communities [1.0] 大規模言語モデル(LLM)は、感覚分析のためのコンテキスト内学習を通じて専門家の知識を統合することができる。
LLMは専門家レベルの合意を示しながら優れたパフォーマンスを達成する。
このアプローチは、デジタルヘルス研究における専門家の知識不足に対する重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:54:56 GMT)
A Biased Random Key Genetic Algorithm for Solving the Longest Run Subsequence Problem [1.0] Biased Random Key Genetic Algorithm (BRKGA) を用いた最長ランサブシーケンス(LRS)問題の解を提案する。
その結果, BRKGAは現在, LRS問題の最先端技術であることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:27:29 GMT)
Genuine multipartite entanglement verification with convolutional neural networks [1.0] 我々は、GMEを検出するために、畳み込みニューラルネットワーク(CNN)と、圧縮励起(SE)で強化されたCNNを用いる。
半定値プログラミング手法を用いて、4から6キュービットのGME状態と4から20キュービットのGHZ対角状態とをランダムに生成した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:43:06 GMT)
Portfolio construction using a sampling-based variational quantum scheme [0.9] CVaR変動量子アルゴリズム (CVaR variational Quantum Algorithm, VQA) を用いて, 一定のサイズの超過が困難となる問題を解く。
IBM Heronプロセッサに関する我々の実験では、109量子ビットと4200個のゲートがあり、相対解誤差は0.49%である。
その結果、量子古典的ワークフローの組み合わせは、純粋に古典的な局所探索よりも精度が良いことが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:32:54 GMT)
ResPlan: A Large-Scale Vector-Graph Dataset of 17,000 Residential Floor Plans [0.9] 我々はResPlanを紹介した。ResPlanは17,000の詳細な、構造的に豊かな、現実的な住宅フロアプランからなる大規模なデータセットである。
それぞれの計画には、建築要素(壁、ドア、窓、バルコニー)と機能空間の正確なアノテーションが含まれている。
ResPlanは、ロボット工学、強化学習、生成AI、バーチャルおよび拡張現実、シミュレーション、ゲーム開発など、幅広いアプリケーションをサポートしている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:07:47 GMT)
PennyLane-Lightning MPI: A massively scalable quantum circuit simulator based on distributed computing in CPU clusters [0.9] 量子回路シミュレーションは、理論量子アルゴリズムと物理量子ハードウェアにおけるそれらの実現の間のギャップを埋める上で重要な役割を果たす。
この研究は、スケーラブルな量子回路シミュレーションを可能にするために、PennyLane-LightningスイートのMPIベースの拡張であるPennyLane-Lightning MPIを提示する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:23:16 GMT)
Comparing energy consumption and accuracy in text classification inference [0.9] 本研究は,テキスト分類推定におけるモデル精度とエネルギー消費のトレードオフを系統的に評価する。
精度の点で最高の性能モデルはエネルギー効率も良いが、より大きなLCMはより低い分類精度ではるかに多くのエネルギーを消費する傾向がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:00:08 GMT)
ALIGN: Word Association Learning for Cross-Cultural Generalization in Large Language Models [0.9] 文化的な知識が限られているため、文化をモデル化し、調整することは依然として課題である。
本稿では,母語話者の自由な単語連想規範をパラメータ効率で微調整する手法を提案する。
私たちの研究は、数百万の文化に根ざした協会が、コストのかかる再トレーニングなしに価値アライメントを組み込むことができることを示している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:55:20 GMT)
UNICON: UNIfied CONtinual Learning for Medical Foundational Models [0.9] 医用画像では、データの不足により、すべての領域、モダリティ、タスクに対する事前トレーニングが困難になる。
継続的学習は、異なるドメインやタスクでモデルを逐次微調整することで、ソリューションを提供する。
基礎モデルのシームレスな適応を可能にするフレームワークであるUNIfied Continual Learning for Medical Foundational Models (UNICON)を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:31:32 GMT)
Biased AI improves human decision-making but reduces trust [0.9] 現在のAIシステムは、イデオロギー的中立を強制することによってリスクを最小化するが、これは人間の意思決定における認知的関与を抑制することによって自動化バイアスをもたらす可能性がある。
我々は2500人の参加者とともにランダム化試験を行い、文化に偏ったAIが人間の意思決定を促進するかどうかを検証した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:58:06 GMT)
MedVisionLlama: Leveraging Pre-Trained Large Language Model Layers to Enhance Medical Image Segmentation [0.8] 本研究では、予め訓練されたLCMトランスブロックを統合することで、医用画像セグメンテーションのためのビジョントランス(ViT)の強化について検討する。
本稿では,グローバルな特徴学習と局所的な特徴学習を組み合わせたハイブリッド注意機構を提案する。
改良されたモデルでは、平均Diceスコアが0.74から0.79に向上し、精度、精度、ジャカード指数が向上した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:21:25 GMT)
Properties of the temporal transfer matrix in integrable Floquet circuits [0.8] 影響行列(IM)は、境界自由度の非平衡力学に関する完全な情報を符号化する量子状態と見なすことができる。
本稿では、IMが時間移動行列の特異な定常点であることを示す。
この設定で、さらに局所的な運動積分を発見し、ヨルダンブロックの次元と構造を解析できる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:44:41 GMT)
Collapsing ROC approach for risk prediction research on both common and rare variants [0.8] そこで本研究では, 危険予測研究のために, CROC方式の折り畳み受信機を設計する手法を提案する。
本手法は, 遺伝子解析ワークショップ17ミニエクソムデータセットから得られた37の候補遺伝子に533個の単一ヌクレオチド多型SNPを用いて評価した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:21:50 GMT)
Automated surgical planning with nnU-Net: delineation of the anatomy in hepatobiliary phase MRI [0.8] 本研究の目的は,肝解剖学における深層学習に基づく自動セグメンテーション手法の開発と評価である。
深層学習ネットワーク (nU-Net v1) は, 細い構造と地形保存に着目した72例を対象に訓練を行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:58:19 GMT)
Compressed Models are NOT Trust-equivalent to Their Large Counterparts [0.8] 大規模なディープラーニングモデルは、リソース制約のある環境にデプロイする前に圧縮されることが多い。
圧縮モデルの予測は、オリジナルの大モデルの予測を信頼するのと同じように信頼できますか?
本稿では,信頼等価性評価のための2次元フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:49:39 GMT)
FlowState: Sampling Rate Invariant Time Series Forecasting [0.8] FlowStateは、新しい時系列基礎モデル(TSFM)アーキテクチャである。
本質的に全ての可能な時間分解能を一般化し、予測する地平線を動的に調整する。
GIFT-ZSとChronos-ZSベンチマークの最先端である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:17:08 GMT)
Incident Analysis for AI Agents [0.8] AIエージェントがより広くデプロイされるにつれて、インシデントの数が増える可能性が高い。
本稿ではエージェントのインシデント分析フレームワークを提案する。
特定のインシデントに関連する要因を明らかにするのに役立つ、特定の情報を特定します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:39:37 GMT)
Regional quality estimation for echocardiography using deep learning [0.7] 心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。
過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。
本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:00:44 GMT)
Experimental Evidence for the Propagation and Preservation of Machine Discoveries in Human Populations [0.7] 超人的な能力を持つインテリジェントマシンは、人間の発見を超えた問題解決戦略を明らかにする可能性がある。
我々は、機械が人間の問題解決に根本的な影響を及ぼすための3つの重要な条件を特定した。
これらの条件が満たされれば、マシンが発見した戦略を人によって伝達し、理解し、保存することができることを実証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:15:37 GMT)
MMHMER:Multi-viewer and Multi-task for Handwritten Mathematical Expression Recognition [0.7] 本稿では,CNNとTransformerの強みを効果的に統合できるマルチビューマルチタスクフレームワークを提案する。
我々のモデルは手書きの数学的表現の複雑さをうまく扱える。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:55:31 GMT)
Simulating quantum collision models with Hamiltonian simulations using early fault-tolerant quantum computers [0.7] 我々は、繰り返し相互作用スキームとしても知られる量子衝突モデルをシミュレートするランダム化量子アルゴリズムを開発した。
我々の手法は、初期のフォールトトレラント量子コンピュータにおけるマルコフ力学と非マルコフ力学の両方に量子衝突モデルを利用することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:00:44 GMT)
Quantum Limited Spatial Resolution of NV-Diamond Magnetometry [0.6] 本研究では,光空間モードデマルチプレクシング(SPADE)を用いて,サブ回折スケールでの局所化と輝度推定精度を向上させる。
我々は、サブ回折光検出磁気共鳴(ODMR)とRabiセンシング実験のためのプロトコルの統計的性能を数値的に評価した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:39:03 GMT)
Large Language Models are Highly Aligned with Human Ratings of Emotional Stimuli [0.6] 感情は、普通の場所と高いストレスの両方のタスクにおいて、人間の行動と認知に大きな影響を及ぼす。
大規模言語モデルは、感情的に負荷された刺激や状況がどのように評価されるかを理解することによって、議論を知らせるべきである。
これらのケースにおけるモデルと人間の行動との整合性は、特定の役割や相互作用に対するLLMの有効性を知らせることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:22:00 GMT)
Can synthetic data reproduce real-world findings in epidemiology? A replication study using tree-based generative AI [0.6] 疫学データを合成するための効率的かつ便利な方法として, 対向ランダム林(ARF)を提案する。
6つの疫学論文から統計学的解析を再現し,原本と合成結果を比較した。
複数の合成データ複製の結果は、元の結果と一貫して一致している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:51:40 GMT)
Tensor Program Optimization for the RISC-V Vector Extension Using Probabilistic Programs [0.6] RISC-VベクトルユニットにAIワークロードを効率的にマッピングするためのTVMコンパイラに基づくワークフローを提案する。
本提案では,GCCのオートベクタ化機能と比較して,実行レイテンシが平均46%向上したことを示す。
コミュニティが他のRISC-V拡張をターゲットに拡張する提案をオープンソースとして公開しました。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:55:09 GMT)
Predicting brain tumour enhancement from non-contrast MR imaging with artificial intelligence [0.6] 我々は,非コントラストMRIのみによる脳腫瘍造影効果の予測が可能な深層学習モデルを開発した。
非コントラストT1-、T2-、T2/FLAIR強調画像のみを用いて、深層学習モデルを用いて腫瘍の予測とセグメンテーションを行った。
最高性能のnnU-Netは83%の精度、91.5%の感度、74.4%の特異性を達成した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:22:47 GMT)
Logical Error Rates for the Surface Code Under a Mixed Coherent and Stochastic Circuit-Level Noise Model Inspired by Trapped Ions [0.6] 仮想格子を用いた量子電荷結合デバイス(QCCD)上に実装された表面符号の論理誤差率について検討する。
具体的には、アイドリング面符号の論理チャネルを構築し、そのダイヤモンド誤差を混合コヒーレントおよび回路レベルのノイズモデルの下で検証する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:37:09 GMT)
Modeling Uncertainty: Constraint-Based Belief States in Imperfect-Information Games [0.6] 不完全な情報ゲームでは、エージェントはゲームの状態の部分的知識に基づいて決定をしなければならない。
Belief Gameモデルは、状態推定をゲームモデル自体に委譲することで、この問題に対処する。
本稿では,隠れたピースアイデンティティを持つゲームにおける信念を表現するための2つのアプローチについて検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:30:48 GMT)
Zobrist Hash-based Duplicate Detection in Symbolic Regression [0.5] 遺伝的プログラミング(GP)は、自然選択のメカニズムを通じて数学的表現の集団を進化させる進化的探索法である。
探索空間の多くの点がアルゴリズムによって何度も再訪・再評価され、時間の無駄な計算作業に繋がることを示す。
抽象ボードゲームでよく使われるハッシュの一種であるZobristハッシュに基づくキャッシュ機構を導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:18:16 GMT)
Training Machine Learning Models on Human Spatio-temporal Mobility Data: An Experimental Study [Experiment Paper] [0.5] 個人レベルの人体移動予測は、感染症のモニタリング、子供、高齢者のケアへの応用に関する重要な研究のトピックとして浮上している。
機械学習モデルをトレーニングするためのベストプラクティスを決定すること。
意味情報を明示的に含めることで、モデルが生活の個々のパターンをよりよく理解し、予測を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:52:50 GMT)
Thermalization and Many-Body Zeno Effect in monitored Hamiltonian Dynamics [0.5] ランダム量子状態は、量子情報科学における様々な応用に不可欠である。
真にランダムな状態を生成する以前のアプローチは、システムを熱化するために大きな入浴に依存していた。
ハミルトン進化によって駆動されるホログラフィック深部熱化に基づく別のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:06:13 GMT)
Efficient Construction of Feasible Solutions in Column Generation using Quantum Annealing [0.4] カラム生成(CG)は制約付き0-1次計画問題の解法として用いられている。
本稿では,CG による連続緩和から実現可能な 0-1 ソリューションを構築するための後処理手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:26:57 GMT)
Toward Errorless Training ImageNet-1k [0.4] 我々は、ImageNet 2012コンテストデータセットに基づいてトレーニングされたフィードフォワード人工ニューラルネットワークについて述べる。
最高の性能モデルは322,430,160のパラメータを使用し、4つの10桁の精度を持つ。
我々は、我々のモデルが100%精度を達成できない理由は、二重ラベル問題に起因すると推測する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:53:53 GMT)
Fusing Structural Phenotypes with Functional Data for Early Prediction of Primary Angle Closure Glaucoma Progression [0.4] 我々は,視神経頭(ONH)構造特徴とセクターベース視野(VF)機能パラメータを組み合わせた統合的アプローチを用いた。
急速な進歩は、VFIの減少(年2.0%)、遅い進行(年2.0%)であった。
主な予測因子は, MRW, 下側頭筋, 下側頭筋, 側頭筋LC曲率, 上側頭筋VF感度, 下側頭筋RNFL, GCL+IPL厚であった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:19:05 GMT)
Asymptotic freedom of dephased charging [0.3] 我々は、N量子ビットからなる量子電池の集合電荷を、スター構成の駆動量子ビット充電器と結合する。
電池に蓄積されるすべてのエネルギーを作業として抽出する「漸近的自由」のような挙動について検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:11:35 GMT)
Assessment of Using Synthetic Data in Brain Tumor Segmentation [0.3] 本研究では,プリトレーニングGANモデルを用いて生成した合成MRIデータをU-Netセグメンテーションネットワークに組み込むことが,概念実証として,U-Netセグメンテーションネットワークのトレーニングに与える影響について検討する。
BraTS 2020データセットの実際のデータ、メディガンライブラリで生成された合成データ、および実際のサンプルと合成サンプルを様々な割合で組み合わせたハイブリッドデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:35:17 GMT)
Langevin Monte-Carlo Provably Learns Depth Two Neural Nets at Any Size and Data [0.3] 我々は,Langevin Monte-Carloアルゴリズムが任意のサイズおよび任意のデータに対してディープ2ニューラルネットを学習できることを確立する。
q-Renyi の発散では、ランゲヴィン・モンテカルロのイテレートがフロベニウスのギブス分布に収束していることが示される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:00:15 GMT)
Tokens with Meaning: A Hybrid Tokenization Approach for NLP [0.3] 自然言語処理(NLP)におけるトークン化の役割
規則に基づく形態素解析と統計的サブワードセグメンテーションを組み合わせたハイブリッドトークン化フレームワークを提案する。
本手法は, 音韻正規化, ルートアフィックス, および形態素保存と語彙効率のバランスをとる新しいアルゴリズムを用いる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:17:42 GMT)
Trust and Reputation in Data Sharing: A Survey [0.3] データプロバイダとデータコンシューマの信頼は、データ共有イニシアチブを実現する上で最も重要な要素のひとつだと考えられている。
データ感度、プライバシ侵害、誤用に関する懸念は、さまざまなドメイン間でデータを共有することの難しさに寄与する。
信頼性、信頼性、評判を計測、把握、管理するための技術とアルゴリズムのソリューションが増えている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:39:31 GMT)
Neuro-inspired Ensemble-to-Ensemble Communication Primitives for Sparse and Efficient ANNs [0.3] G2GNetは、フィードフォワード層にまたがるスパースでモジュラーな接続を強制する新しいアーキテクチャである。
G2GNetの精度は最大75%まで向上し、ベンチマークでは最大4.3%向上した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:51:33 GMT)
Classifying Clinical Outcome of Epilepsy Patients with Ictal Chirp Embeddings [0.2] 本研究では,t-Distributed Neighbor Embedding (t-SNE) を利用して,様々な結果シナリオにおけるチャープ特徴の解釈可能な可視化を行うパイプラインを提案する。
データセットは、チャープベースの時間、スペクトル、周波数メトリクスから構成される。
t-SNEを用いて,群集問題に対処しながら地域住民関係を保存した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:14:41 GMT)
Superposition detection and QMA with non-collapsing measurements [0.2] 検証器が1つの非折り畳み測定を行う場合のQMAはNEXPと同じであることを示す。
これは、QMA+ = NEXP の修正された証明の系であることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:24:25 GMT)
New Upper Bounds on Exotic Neutron Spin-Electron Spin Interactions via Neutron Spin Rotation Measurements in a Compensated Ferrimagnet [0.1] 中性子と電子の異方性スピンスピン相互作用を、高密度の偏光電子媒質を通した低速中性子偏光画像を用いて探索する。
単位長さあたりの平均中性子スピン回転角$fracdbarphi_F5dz=[0.41pm6.30 (stat.)pm4.4 (sys.)]times10-3$ rad/mは0と一致する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:01:14 GMT)
When Algorithms Infer Gender: Revisiting Computational Phenotyping with Electronic Health Records Data [0.1] 電子健康記録における性別に関する不完全なデータ収集の実践的な解決策として、計算的表現型付けが登場している。
このアプローチは、患者の健康記録で利用可能なデータを用いて、患者の性別を推測するアルゴリズムに依存する。
EHRに基づくバイオメディカル研究において、トランスとジェンダーを対象とする人口の可視性を改善することを目的としているが、計算的表現型付けは、重要な方法論的および倫理的懸念を提起する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:40:29 GMT)
Scaling Intelligence: Designing Data Centers for Next-Gen Language Models [0.1] GPT-4のような1.8兆のパラメータを持つ大規模言語モデル(LLM)は、データセンターアーキテクチャの根本的な再考を要求する。
我々の研究は、FLOPS、帯域幅と容量、複数のネットワークトポロジを共同で探求する包括的な協調設計フレームワークを提供する。
我々は、重なり合う計算と通信の利点を定量化し、ハードウェアアクセラレーションされた集合体を活用し、スケールアウト領域を広げ、メモリ容量を増大させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:56:18 GMT)
MR6D: Benchmarking 6D Pose Estimation for Mobile Robots [0.1] 既存の6Dポーズ推定データセットは、主にロボットアームマニピュレータによって処理される小さな家庭用オブジェクトに焦点を当てている。
産業環境における移動ロボットの6次元ポーズ推定のためのデータセットであるMR6Dを紹介する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:21:34 GMT)
Input Time Scaling [0.1] 本稿では,クエリにリソースを配置することで,従来のスケーリング手法を補完する,新しいスケーリングパラダイムであるInput Time Scalingを提案する。
一見データ品質の低いデータセットがハイパフォーマンスになることに驚きました。
AIME24 (76.7%) と AIME25 (76.7%) のパス@1。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:04:13 GMT)
Agentic DraCor and the Art of Docstring Engineering: Evaluating MCP-empowered LLM Usage of the DraCor API [0.1] 本稿では,DraCor 用 Model Context Protocol サーバの実装と評価について報告する。
これにより、LLM(Large Language Models)がDraCor APIと自律的に対話できるようになる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:21:21 GMT)
Portable Laser-Pumped Rb Atomic Clock with Digital Circuits [0.1] 本研究は,レーザー励起Rb原子時計の周波数安定性,小型化,低消費電力化を特徴とする分散フィードバック(DFB)を提案する。
提案した原子時計は、吸収セルが323Kの低温で動作するように設計されている。
原子時計の短期安定性は1.8times10-12tau -1/2$(1-100s)と測定される
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:23:11 GMT)
Learning to Learn the Macroscopic Fundamental Diagram using Physics-Informed and meta Machine Learning techniques [0.1] この記事では、データ不足の問題を緩和するために、モデルに新たなタスクを理解して適応するように訓練するフレームワークを提案する。
開発されたモデルは、複数の都市のデータを活用して、他の都市のMFDを異なる検出器とトポロジ構造でモデル化することで、訓練され、テストされる。
その結果, 試験したループ検出器のサブセットに応じて, 17500~36000の流速予測が平均MSE改善した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:59:58 GMT)
Wave Mechanics as Realistic Local Theory without Hidden Variables and Measurement Problem [0.0] 振幅と位相が粒子の運動量の2つの場を一意に決定していることが示されている。
シュル「オーディンガー方程式」は、これらの場に対する局所方程式の閉系として記述することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:10:33 GMT)
Virtuous Machines: Towards Artificial General Science [0.0] ドメインに依存しないエージェント型AIシステムが、科学的なワークフローを独立してナビゲートできることを示します。
このシステムは視覚的作業記憶、精神的な回転、イメージの鮮明さに関する3つの心理学的研究を自律的に設計し実行した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:35:56 GMT)
Using Frame Randomization to Mitigate Errors in Quantum Optimization [0.0] 本稿では,量子近似最適化アルゴリズム(QAOA)に対して,超伝導量子回路上でのフレームランダム化を$p=1$とする。
具体的には, フラストレーションのあるイジングリングの最低エネルギー状態を計算するためにQAOAを用いて検討する。
この結果から,ランダム化コンパイルとパウリフレームランダム化では,最大エネルギー値5.25pm0.145$と4.08pm0.36$の誤差を緩和できることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:55:52 GMT)
Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution [0.0] メッセージの内容は、必ずしも公開されてはならないが、アタックベクターであるスタイル分析を公開している。
本稿では,スタイソメトリーの技法を解明し,対角的スタイソメトリーにおけるアンチテトラジを議論し,Unicodeステガノグラフィーによる拡張を考案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:34:25 GMT)
Uncloneable Encryption from Decoupling [0.0] security $widetildeOleft(tfrac1lambdaright)$ in the security parameter $lambda$。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:45:30 GMT)
Typed Topological Structures Of Datasets [0.0] R2$ 上のデータセット $X$ は有限位相空間である。
本稿では、データセットの$X$に対して、特殊な型とその関連した型付きトポロジーを開発する。
このような構造は、凸殻、穴、クラスタリング、異常検出などの問題に対する新しいアルゴリズムのプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:14:13 GMT)
Two-Photon Resonance Fluorescence in a Three-Level Ladder-Type Atom [0.0] 我々は、コヒーレントフィールドによって駆動される3レベルラダー型原子を考える。
2光子共鳴によって駆動されると、原子は最高エネルギー状態に励起される。
このスペクトルは、原子の服装状態間の遷移に対応する7つの異なる周波数を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:50:00 GMT)
Two-Factor Authentication Smart Entryway Using Modified LBPH Algorithm [0.0] 本稿では,顔認識とパスコード検証を用いたスマートエントリーウェイアクセス制御のための2要素認証システムを提案する。
このシステムは、顔認識とマスク検出を実行し、ユーザを登録するためのリモコンの操作を自動化し、ドアをロックまたはアンロックし、所有者に通知する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:28:40 GMT)
Trust, but verify [0.0] ガイアネットワークのアルゴリズムと実験データについて論じる。
また、EigenLayer AVSとして実装されたオブジェクト間検証システムについても論じる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:13:16 GMT)
Towards a Twisted Atom Laser: Cold Atoms Released from Helical Optical Tube Potentials [0.0] 我々は、最初にヘリカル光管(HOT)に閉じ込められ、その後自由空間に放出された冷媒原子の量子力学について研究した。
結果は、コヒーレント原子ビーム整形、物質波干渉計、量子物質の誘導輸送などの量子技術への応用に特に関心がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:18:43 GMT)
Towards Agent-based Test Support Systems: An Unsupervised Environment Design Approach [0.0] 本研究では,動的に変化するモードテスト環境における適応型センサ配置のためのエージェントベースの意思決定支援フレームワークを提案する。
このフレームワークは、部分的に観測可能なマルコフ決定プロセスを用いて問題を定式化し、一般の強化学習エージェントの訓練を可能にする。
鋼のカンチレバー構造に関する詳細なケーススタディでは, 周波数セグメント間のセンサ位置の最適化において, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:43:32 GMT)
Toward a Better Localization of Princeton WordNet [0.0] 本稿では、プリンストンWordNetのローカライズのための構造化フレームワークを提案する。
文化の正しさを損なうことなく、高品質な成果を達成するために必要な段階と手順を詳述する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:23:06 GMT)
Topological Data Analysis for Unsupervised Anomaly Detection and Customer Segmentation on Banking Data [0.0] 本稿では,銀行データにおける教師なし異常検出と顧客セグメンテーションのためのトポロジカルデータ解析(TDA)の高度な技術を紹介する。
我々は、トポロジ的情報を活用することにより、顧客の銀行データに意味のあるパターンを明らかにする、教師なしの手順を開発する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:58:00 GMT)
Tooth-Diffusion: Guided 3D CBCT Synthesis with Fine-Grained Tooth Conditioning [0.0] 歯面2次属性でガイドされた3次元歯量生成のための条件付き拡散フレームワークを提案する。
本手法では,ウェーブレットをベースとした denoising diffusion, FiLM conditioning, マスク付き損失関数を統合して, 関連する解剖学的構造を学習する。
その結果, FIDスコアが低く, 塗装性能が良好で, SSIM値が0.91以上であった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:21:35 GMT)
The illusion of a perfect metric: Why evaluating AI's words is harder than it looks [0.0] 自然言語生成(NLG)は、AIの実用化に不可欠である。
人間の評価はデファクトスタンダードと考えられているが、高価でスケーラビリティに欠ける。
決定的な解として単一の計量が現れることはなく、結果として、完全に含意を考慮せずに異なる計量を用いた研究が行われる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:22:41 GMT)
The calculus of variations of the Transformer on the hyperspherical tangent bundle [0.0] トークン空間を横断するラグランジアン最適化を通じて、トランスフォーマーの理論的背景を提供する。
トランスフォーマーはフローマップとして、高次元の単位球面に沿って各トークンの接ファイバーに存在する。
変換器のオイラー・ラグランジュ方程式を導出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:14:43 GMT)
The Statistical Validation of Innovation Lens [0.0] 情報過剰と科学の急速な進歩は、新たな研究提案に対する資源の評価と配分をますます困難にしている。
計算機科学・物理・PubMed領域において,2010~2024年の間に高引用型研究論文の予測に成功した分類器を訓練することにより,そのような構造を示す統計的証拠を提示する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:47:24 GMT)
The Spectral Barycentre of a Set of Graphs with Community Structure [0.0] Barycentreグラフは、グラフのトレーニングデータセットの平均トポロジと接続構造をキャプチャする「準グラフ」である。
正規化グラフラプラシアンの固有値を用いて定義されるマルチスケールスペクトル距離を用いる。
本研究では、バリセントグラフの正規化グラフラプラシアンの固有ベクトルに関する構造的制約を提案し、バリセントグラフがサンプルデータセットのグラフの位相的構造を継承することを保証している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:55:29 GMT)
The Collaboration Paradox: Why Generative AI Requires Both Strategic Intelligence and Operational Stability in Supply Chain Management [0.0] 経済環境における自律的、AI駆動エージェントの台頭は、その突発的な戦略行動に関する批判的な疑問を提起する。
本稿では,複数エケロン系サプライチェーンの協調的文脈におけるこれらのダイナミクスについて検討する。
私たちの中心的な発見は、"コラボレーションパラドックス"(colaboration paradox)です。これは、理論上優れた協調AIエージェントが非AIベースラインよりもさらにパフォーマンスが劣る、新しい、破滅的な障害モードです。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:31:23 GMT)
The AI-Fraud Diamond: A Novel Lens for Auditing Algorithmic Deception [0.0] 本稿では,従来のフラッド・トライアングルの拡張であるAI-フラッド・ダイアモンドを紹介し,圧力,機会,合理化とともに,技術的不透明度を第4条件として追加する。
従来の詐欺とは異なり、AI対応の詐欺は明確な人間の意図を伴わないが、不透明なモデル行動、欠陥のあるトレーニングデータ、規制されていないデプロイメントプラクティスといったシステムレベルの特徴から生じる可能性がある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:21:44 GMT)
The AI Risk Spectrum: From Dangerous Capabilities to Existential Threats [0.0] 本稿は、個々のユーザーに影響を与える現在の害から、人類の生存を危うくする現実的な脅威まで、AIリスクの全スペクトラムをマッピングする。
これらのリスクを3つの主要な因果分類に分類する。
私たちのゴールは、読者がAIリスクの全体像を理解するのを助けることです。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:05:51 GMT)
Structural and Connectivity Patterns in the Maven Central Software Dependency Network [0.0] Javaライブラリの最大のリポジトリの1つであるMaven Centralエコシステムを調査します。
我々は,その濃度集中度に基づいて,最高5000個の高連結人工物からなる試料を抽出した。
我々は,このグラフの包括的解析,計算次数分布,間性中心性,PageRank中心性,連結成分グラフ理論メトリクスについて検討した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:24:46 GMT)
Strong Confinement of a Nanoparticle in a Needle Paul Trap: Towards Matter-Wave Interferometry with Nanodiamonds [0.0] 大量の粒子を持つ物質波干渉計は、多くの基本的なアイデアをテストすることができる。
電極間距離を制御可能な針状のポールトラップを設計し,電気勾配を強くする。
効果的な充電方法であるエレクトロスプレーと組み合わせることで、最大40kHzのトラップ周波数に達する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:02:57 GMT)
Spore in the Wild: A Case Study of Spore.fun as an Open-Environment Evolution Experiment with Sovereign AI Agents on TEE-Secured Blockchains [0.0] Spore.funは、新しいオンチェーンエージェントの自律的な育種と進化を可能にする、現実世界のAI進化実験である。
本稿では,Spore.funの詳細なケーススタディとして,エージェントの行動とその進化的軌跡をデジタルエコロジーを用いて検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:40:20 GMT)
Saudi-Dialect-ALLaM: LoRA Fine-Tuning for Dialectal Arabic Generation [0.0] アラビア語の大きな言語モデル(LLM)は現代標準アラビア語(MSA)に支配されている。
この表現不足は、真正な方言の変化を捉える能力を妨げている。
サウジアラビア方言教育データセットを用いて,サウジアラビア方言生成の基礎モデルを構築した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:33:48 GMT)
STER-VLM: Spatio-Temporal With Enhanced Reference Vision-Language Models [0.0] 本稿では, VLMの性能を向上させる計算効率の高いフレームワーク, STER-VLMを紹介する。
WTS citekong2024wts と BDD citeBDD データセットの実験結果は、セマンティック・リッチネスとトラフィックシーンの解釈において大きな進歩を示している。
私たちのフレームワークは、AI City Challenge 2025 Track 2で、十分なテストスコア55.655で検証されています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:03:29 GMT)
Real-time bubble nucleation and growth for false vacuum decay on the lattice [0.0] 一次元イジングモデルに対する量子偽真空崩壊を再検討する。
我々は、真真空気泡のリアルタイム核生成と成長に焦点をあてる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:56:15 GMT)
Reactive Semantics for User Interface Description Languages [0.0] 本稿では,中核となるリアクティブUIDLであるSmaliteについて記述型セマンティックモデルを提案する。
この作業は、UIDLの正式に認証されたコンパイラを生成するためのステップストーンとして使用することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:16:28 GMT)
RED.AI Id-Pattern: First Results of Stone Deterioration Patterns with Multi-Agent Systems [0.0] RED.AIプロジェクトにおけるId-Patternシステム(Reabilitaccao Estrutural Digital atrav's da AI)は、石の劣化パターンの識別を支援するために設計されたエージェントシステムである。
専門家チームによる直接的な観察に基づく従来の方法論は正確だが、時間とリソースの面ではコストがかかる。
最初の結果から,基本モデルと比較して,システムのすべての指標が大幅に向上したことが分かりました。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:39:27 GMT)
Query Logs Analytics: A Aystematic Literature Review [0.0] 本稿では、データベース(DB)、データウェアハウス(DW)、Web、KGログを中心に、ログの利用状況に関する体系的な調査を行う。
300以上の出版物が3つの中心的な問題に対処するために分析された。
調査では、エンドツーエンドのアプローチの限られた数、ログ使用パイプライン間の標準化の欠如、さまざまなタイプのログ間で共有される構造要素の存在が明らかになった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:38:13 GMT)
Qudit-based scalable quantum algorithm for solving the integer programming problem [0.0] プログラミング (IP) はNPのハードな最適化問題であり、現実世界の様々な問題を表現するために広く使われている。
IPを解くためのほとんどの量子アルゴリズムは、整数を量子ビットにエンコードするため、非常に非効率である。
本研究では,回路ベースでスケーラブルな量子アルゴリズムを複数の相互作用量子ビットを用いて提案し,量子スピードアップを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:06:49 GMT)
Quantum state engineering of maximally entangled photon pairs by path identity [0.0] カットエッジ量子技術は、高忠実度ターゲット状態を確実に準備する高次元絡み合った状態(HDES)の源に依存している。
HDESを作成するために、異なるが区別できないソースから光子経路を重複させるアイデアが最近導入された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:51:28 GMT)
Quantum Thermal Analogs of Electric Circuits: A Universal Approach [0.0] 量子サーマルサーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル・サーマル
これは量子デバイス工学の現在のアーキテクチャに新たな光を放つ。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:24:53 GMT)
Quantum Sampling and Moment Estimation for Transformed Gaussian Random Fields [0.0] 本稿では、$d$次元領域上の変換されたガウス確率場を効率的にサンプリングする量子アルゴリズムを提案する。
有界性を含む点変換は、量子計算においてガウス的ランダム場を使用するには不可欠である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:42:52 GMT)
Quantifier Instantiations: To Mimic or To Revolt? [0.0] 量子式は、Satifiability Modulo Theories (SMT) の解法にとって重要な課題である。
e-matching、構文誘導、モデルベース、コンフリクトベース、列挙型メソッドといった既存のインスタンス化技術は、しばしば互いに補完する。
本稿では,これらの手法から動的に学習する新しいインスタンス化手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:16:25 GMT)
PlantDeBERTa: An Open Source Language Model for Plant Science [0.0] 植物ストレス応答型文献から構造化知識を抽出する,高性能でオープンソースな言語モデルであるPlantDeBERTaを提案する。
本手法は,トランスフォーマーに基づくモデリングと規則強化された言語後処理とオントロジーに基づく実体正規化を組み合わせた手法である。
計算プラント科学における透明性の促進と学際的イノベーションの促進を目的として,本モデルが公開された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:22:49 GMT)
Physics-Informed Neural Networks for Programmable Origami Metamaterials with Controlled Deployment [0.0] 本稿では, 物理インフォームドニューラルネットワーク(PINN)を用いて, 折り紙の前方予測と逆設計を行う。
このモデルは、非物理的アーティファクトを最小限にしながら、高精度で完全なエネルギー景観を予測する。
この研究は、折り紙にインスパイアされたメタマテリアルにおける複雑な機械的エネルギー景観をプログラミングするための汎用的でデータフリーなルートを確立する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:38:49 GMT)
Phase-Driven Precision Boost in Quantum Compression for Postselected Metrology [0.0] 我々は、量子圧縮チャネルの最適操作を規定する基本的な幾何学的基準として、非環状パンチャラトナム相を公表する。
この位相の調和により、パラメータ感度とパラメータ状態の並列進化の間の相互作用を正確に制御できる。
この最適位相のすぐ下にあるポストセレクションパラメータをチューニングすると、かなりの情報損失が発生するのに対して、このパラメータをチューニングすることで、望ましくない並列進化が完全に抑制されることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:26:26 GMT)
Parametric feedback cooling of librations of a nanodiamond in a Paul trap: Towards matter-wave interferometry with massive objects [0.0] 質量粒子を持つ物質波干渉計は、多くの基本的なアイデアをテストすることができる。
我々は、NDの回転がインターフェロメトリコントラストに与える影響に関する理論的研究を行う。
近い将来、必要なリブレーション温度が到達範囲内であることが示される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:44:39 GMT)
Optimizing Scalar Selection in Elliptic Curve Cryptography Using Differential Evolution for Enhanced Security [0.0] 楕円曲線暗号(英語: Elliptic Curve Cryptography、ECC)は、現代の公開鍵暗号の基本的な構成要素である。
本稿では,ビットレベルのエントロピーを明示的に最大化する最適化型スカラー生成手法を提案する。
提案手法は既存のECCベースのプロトコルに統合することができ、従来のランダム性に代わる決定論的、調整可能な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:26:07 GMT)
Operational work fluctuation theorem for open quantum systems [0.0] ジャジンスキーの等式は、熱平衡から駆動されるシステム上で実行される仕事と自由エネルギー差との正確な関係を確立する。
本稿では、駆動プロトコルで決定される外部測定可能な量子作業に有効な量子ゆらぎ定理を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:29:24 GMT)
Observation of Purcell Effect in Electrically Coupled Cavity-Magnet System [0.0] 電界結合を用いた空洞-金属磁石ハイブリッドシステムにおけるパーセル効果の観測を報告する。
その結果,マイクロ波磁場と金属磁石を幾何学的および電気的相互作用により結合する多用途アプローチが確立された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:10:10 GMT)
Nonlinear optical realization of non-integrable phases accompanying quantum phase transitions [0.0] 動的方程式におけるエキゾチック項は、四角形対称性を持つ異方性低複屈折ファイバーに沿って光学場の非線形偏光を支配していることを示す。
ファイバーに沿った非線形感受性の漸近調整により、ポアンカー球面上のストークスベクトルはハンナイ角と呼ばれる非可積分位相を蓄積する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:02:09 GMT)
Non-Markovian Quantum Heat Statistics with the Reaction Coordinate Mapping [0.0] 量子系と熱環境のカップリングが無視できないとき、複雑さが生じる。
反応座標法を2点測定プロトコルと組み合わせて熱の2つの異なる定義を比較する。
後者の定義は、高度に非マルコフ政権における熱浴の振る舞いをより期待していることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:11:59 GMT)
Noise-Resilient Spatial Search with Lackadaisical Quantum Walks [0.0] 2次元トロイダル格子上でのLQWに基づく探索の性能にリンクのデコヒーレンスがどう影響するかを示す。
我々はデコヒーレンスがループレスウォークを均一な分布に向けて駆動し、その探索能力を排除する一方で、自己ループを組み込むことにより、この効果を著しく軽減することを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:40:04 GMT)
Multiclass Portfolio Optimization via Variational Quantum Eigensolver with Dicke State Ansatz [0.0] 本稿では,ポートフォリオ最適化のための新しい量子フレームワークを提案する。
このアンザッツの重要な強みは、量子系を実現可能な状態のみの重ね合わせで初期化することである。
その結果、CMA-ESと組み合わせると、Dicke状態のアンザッツは収束率、近似比、測定確率の点で優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:45:07 GMT)
MultiFuzz: A Dense Retrieval-based Multi-Agent System for Network Protocol Fuzzing [0.0] MultiFuzz(マルチファズ)は、プロトコルファズリングのための、新しい高密度検索ベースのマルチエージェントシステムである。
セマンティック・アウェア・コンテキスト検索、特殊エージェント、構造化ツール支援推論を統合している。
ブランチカバレッジを大幅に改善し、より深いプロトコル状態と最先端のファジィの移行を探求する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:42:04 GMT)
MorphNAS: Differentiable Architecture Search for Morphologically-Aware Multilingual NER [0.0] MorphNASは、これらの課題に対処するために設計された、微分可能なニューラルアーキテクチャ検索フレームワークである。
言語固有の形態に合わせて最適なマイクロアーキテクチャ要素を自動的に識別する。
MorphNASは多言語NLPモデルの習熟度を最大化することを目的としており、これらの複雑な言語の理解と処理を改善している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:48:51 GMT)
Modeling the Diachronic Evolution of Legal Norms: An LRMoo-Based, Component-Level Approach [0.0] 本稿では,標準の進化をF2表現のダイアクロニック連鎖としてモデル化する,LRMooオントロジーに基づく時間モデリングパターンを提案する。
ブラジル連邦憲法に関するケーススタディでは、このきめ細かいイベント中心のアーキテクチャが、特定の日に法律文書の任意の部分の正確かつ決定論的検索と再構築を可能にすることを実証している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:16:21 GMT)
Minimizing the Weighted Number of Tardy Jobs: Data-Driven Heuristic for Single-Machine Scheduling [0.0] 我々は、各ジョブの重み、期間、予定日、期限によって定義されるシングルマシンスケジューリング問題に焦点を当てる。
本稿では,機械学習と問題固有の特徴を組み合わせた新しいデータ駆動スケジューリングを提案する。
実験結果から,本手法は最適解数,最適解数,適応性の観点から,最先端技術よりも優れていた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:09:02 GMT)
Mechanistic Exploration of Backdoored Large Language Model Attention Patterns [0.0] 大規模言語モデル(LLM)において'sleeper agent'を作成するバックドア攻撃は、重大な安全性のリスクを生じさせる。
本研究は, 内部構造の違いを解明するために, 機械的解釈可能性を用いる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:57:17 GMT)
Measurement-induced phase transitions for free fermions in a quasiperiodic potential [0.0] 準周期ポテンシャルにおける自由フェルミオンの連続測定の下でのダイナミクスについて検討する。
我々は,ロバストな対数的システムサイズスケーリングが臨界ポテンシャル強度$V_c/J sim 2.3$まで現れることを示した。
この結果は, 準周期ポテンシャルを導入し, 局所的占有数を連続的に監視することにより, 超低温原子で測定することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:32:36 GMT)
Matter-Wave Squeezing from Gouy Phase: Toward a New Tool for Quantum Technology [0.0] 位置-運動量相関を示すガウス波束の量子力学を解析する。
ウェーブパケットの進化の過程で量子拡散とスクイーズプロセスが出現し、グーイ相のコントリビューションが$pi/4$になる。
我々の発見は、量子センシングや精密測定を含む量子化技術の領域を広げた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 21:40:08 GMT)
Matrix Product Operator Constructions for Gauge Theories in the Thermodynamic Limit [0.0] 無限行列積状態(iMPS)を用いた低次元格子ゲージ理論の一般化手法を提案する。
ゲージ理論のハミルトンの定式化における中心的な課題は、ゲージ自由度に付随する非有界局所ヒルベルト空間である。
ある空間次元において、ガウスの法則はこれらのゲージ場を積分することを許し、物質場間の長距離相互作用を持つ実効ハミルトニアンを与える。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:34:16 GMT)
Many-body theory of false vacuum decay in quantum spin chains [0.0] 真空気泡の核生成とコヒーレントダイナミクスを記述する多体理論を開発する。
このボゾン理論により、パラメータ空間の異なる状態を特定し、基礎となる物理機構を解き放つことができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:29:11 GMT)
MACTAS: Self-Attention-Based Module for Inter-Agent Communication in Multi-Agent Reinforcement Learning [0.0] 本稿では,MARL内のエージェント間で情報交換を行う自己注意型通信モジュールを提案する。
提案手法は完全に差別化可能であり、エージェントは報酬駆動方式でメッセージを生成することができる。
SMACベンチマークによる実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:08:48 GMT)
Long-distance device-independent quantum key distribution with standard optics tools [0.0] デバイス非依存量子鍵分布(DI-QKD)は、情報理論的にリモートパーティ間の鍵交換を可能にする。
本稿では,単一光子干渉を用いたHeraldingスキームに基づく2つの長距離DI-QKDプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:25:29 GMT)
Learning to See Through Flare [0.0] フル可視光スペクトルにおける高忠実度センサ保護のための最初の計算画像フレームワークであるNeuSeeを紹介する。
NeuSeeは、ピークレーザーの照射を抑えるために、100Kのユニークな画像に対して逆向きに訓練されている。
他のDOEよりも優れており、フルスペクトルイメージングとレーザー抑制を初めて達成している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:06:59 GMT)
Learning to Drive Ethically: Embedding Moral Reasoning into Autonomous Driving [0.0] 本稿では,道徳的考察と標準的な運転目標を統合した階層型セーフ強化学習フレームワークを提案する。
決定レベルでは、衝突確率と危害を組み合わせた複合的倫理的リスクコストを用いてセーフRLエージェントを訓練し、高レベルな運動目標を生成する。
実行レベルでは、Proportional-Integral-Derivativeコントローラと組み合わせたパスプランニングが、これらのターゲットをスムーズで実現可能なトラジェクトリに変換する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:24:02 GMT)
Large Language Models as Visualization Agents for Immersive Binary Reverse Engineering [0.0] 没入型バーチャルリアリティ(VR)は、バイナリリバースエンジニアリング(RE)における認知的複雑さを軽減できる余裕を提供する
我々はこのプラットフォームを,バイナリ解析ツールをクエリし,没入型3Dビジュアライゼーションを生成するLLMエージェントで拡張する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:24:01 GMT)
KillChainGraph: ML Framework for Predicting and Mapping ATT&CK Techniques [0.0] 本稿では,サイバーキルチェーンの7つのフェーズにまたがる敵の振る舞いをエミュレートする,相認識型マルチモデル機械学習フレームワークを提案する。
我々は、LightGBM、カスタムトランスフォーマーエンコーダ、微調整BERT、グラフニューラルネットワーク(GNN)を評価し、重み付けされたソフト投票アンサンブルを通じて出力を統合する。
F1スコアは97.47%から99.83%となり、GNNのパフォーマンス(97.36%から99.81%)を0.03%--0.20%上回った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:10:01 GMT)
Investigating Techniques to Optimise the Layout of Turbines in a Windfarm using a Quantum Computer [0.0] 風力エネルギーは持続可能な電力システムへの移行において重要な役割を担っている。
タービンの最適配置は、複雑なウェイク相互作用のために難しい問題である。
本稿では,Qiskitの量子コンピュータシミュレータ上に実装された変分量子固有解器(VQE)を用いてQUBO問題の解法を検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:30:59 GMT)
Importance of Correlations for Neural Quantum States [0.0] ニューラル量子状態(NQS)は、量子多体波動関数を表す強力な変分アンサッツとして登場した。
我々は、相関に基づく解釈可能なニューラルネットワークアーキテクチャを用いて、NQSのような量子状態表現における相関の役割について検討する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:55:21 GMT)
High-Order Tensor Regression in Sparse Convolutional Neural Networks [0.0] 本稿では、現在の機械学習文献における従来の方法論とは大きく異なる、畳み込みに対する一般的なアプローチを示す。
スパース畳み込みニューラルネットワークの一般的な見方の枠組みとして、ニューラルネットワークにおける回帰の合理的理論が開発されている。
直接的な結果として、古典的バックプロパゲーションアルゴリズムは、この有理テンソルベースのアプローチと整合するように再定義され、最も単純で、最も一般的な形式で表される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 00:06:08 GMT)
Harnessing Structured Knowledge: A Concept Map-Based Approach for High-Quality Multiple Choice Question Generation with Effective Distractors [0.0] 本稿では, MCQ の生成において, LLM を誘導する構造的知識を提供する階層的概念マップベースフレームワークを提案する。
我々は,ベースLLMとRAGベースジェネレーションの2つのベースラインアプローチに対して,我々のフレームワークを評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:31:37 GMT)
HOPSO: A Robust Classical Optimizer for VQE [0.0] 変分量子固有解法(VQE)は、短期的な量子優位性への期待が集中する数少ないアプローチの1つである。
我々は,VQEアルゴリズムの古典的部分を適切に調整することで,現在の問題に対処できることを示し,大規模システムに対するスケーラビリティを期待する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:01:30 GMT)
HBAR entropy in causal diamond geometry: A near-horizon perspective [0.0] 我々は、ホライゾンブライト化加速放射フレームワークを、因果ダイヤモンド(CD)時空に拡張する。
放射スペクトルは温度$T_D = 1/(ピアルファ)$で、関連するフォン・ノイマンエントロピーフラックスは放射場のエントロピー生成を再現する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:03:49 GMT)
Gold-Standard Chemical Database 138 (GSCDB138): A diverse set of accurate energy differences for assessing and developing density functionals [0.0] GSCDB138は138データセットからなる厳格にキュレートされたベンチマークライブラリである。
主群および遷移金属反応エネルギー、障壁高さ、非共有相互作用、双極子モーメント、分極性、電界応答エネルギー、振動周波数をカバーしている。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:55:27 GMT)
Geometric Floquet theory [0.0] 折りたたみエネルギーは、断熱ゲージポテンシャル$U(1)mapstomathbbZ$の破れたゲージ群の結果である。
代わりに平行移動ゲージを用いてゲージ自由を固定すると、フロケ力学は純粋に幾何学的進化へと一意に分解される。
離散時間結晶で分裂する$pi$-quasienergyや、異常なフロケ・トポロジカル絶縁体の$pi$-edgeモードなど、本質的に非平衡効果の幾何学的起源を導出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:56:36 GMT)
Generics and Default Reasoning in Large Language Models [0.0] 本稿では,28の大規模言語モデルにおいて,汎用化を含む20の不可能な推論パターンを推論する能力について検討する。
いくつかのフロンティアモデルが多くのデフォルト推論問題をうまく処理しているのに対して、性能はモデルによって大きく異なり、スタイルが促される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:28:53 GMT)
Generalized invariants meet constitutive neural networks: A novel framework for hyperelastic materials [0.0] 我々は、等方的非圧縮材料に対する適切な不変量やモデルを同時に発見する新しいデータ駆動フレームワークを提案する。
本手法は一般化不変量のクラスで最も適切な不変量と対応するひずみエネルギー関数の両方を同定する。
可能な不変量の連続的なファミリを見ることで、モデルは異なる物質的挙動に柔軟に適応することができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 16:52:49 GMT)
GazeProphet: Software-Only Gaze Prediction for VR Foveated Rendering [0.0] ファブリケートレンダリングは、バーチャルリアリティーアプリケーションにおける計算要求を大幅に減少させる。
現在のアプローチは高価なハードウェアベースのアイトラッキングシステムを必要とする。
本稿では,VR環境における視線位置を予測するためのソフトウェアのみのアプローチであるGazeProphetを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:09:23 GMT)
Free Electron Paths from Dirac's Wave Equation Elucidating Zitterbewegung and Spin [0.0] 自由電子の世界線は、ディラックの速度演算子をディラック波動関数に適用することによって明らかにされる。
解析はディラックの波動方程式から直接ジッタベウグングの性質を確認する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 22:42:33 GMT)
Fracture Detection and Localisation in Wrist and Hand Radiographs using Detection Transformer Variants [0.0] 救急医療において, レントグラフによる手首・手関節骨折の正確な診断が不可欠である。
トランスフォーマーベースのモデルでは、医用画像解析の改善が期待できるが、その極端骨折への応用は限られている。
本研究では,手首と手首のX線に物体検出変換器を適用することで,このギャップを解消する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:41:49 GMT)
Forecasting Smog Events Using ConvLSTM: A Spatio-Temporal Approach for Aerosol Index Prediction in South Asia [0.0] 南アジアスモッグ(南アジアスモッグ、英: South Asian Smog)は、汚染レベルが高いこと、可視性が低下すること、社会経済的影響が著しいことなどが特徴である。
過去10年間で、穀物の残留物や自動車、天候の変化といった大気汚染の源が増加し、スモッグ現象が激化している。
エアロゾル指数はスモッグ形成と密接な関係があり、大気質指数(AQI)の計算において重要な要素である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:54:42 GMT)
Flag at origin: a modular fault-tolerant preparation for CSS codes [0.0] FT計算には、量子誤り訂正(QEC)符号における様々な論理安定化状態のフォールトトレラント(FT)準備が不可欠である。
この研究は、任意の距離のCSS符号におけるFT準備回路のモジュラ構造を導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:47:49 GMT)
Fisher-Orthogonal Projection Methods for Natural Gradient Descent with Large Batches [0.0] 本稿ではFOP(Fisher-Orthogonal Projection)を提案する。これは非常に大きなバッチサイズで2階法の有効性を復元する手法である。
FOPは2つのサブバッチを利用して分散対応更新方向を構築し、勾配差の成分で平均勾配を高める。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:02:22 GMT)
FedRAIN-Lite: Federated Reinforcement Algorithms for Improving Idealised Numerical Weather and Climate Models [0.0] 気候モデルにおけるサブグリッドパラメータ化は、伝統的に静的で、オフラインで調整される。
FedRAIN-Liteは一般的な循環モデルで使用される空間分解を反映するフレームワークである。
Deep Deterministic Policy Gradientは、静的と単一エージェントのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 23:54:13 GMT)
Fabrication of nano-diamonds with a single NV center: Towards matter-wave interferometry with massive objects [0.0] 質量粒子を持つ物質波干渉計は、空間重畳原理を含む多くの基本的なアイデアをテストすることができる。
本研究では,Stern-Gerlach力と組み合わさって,クローズドループ物質波干渉計を時空実現可能なナノダイアモンドを実験粒子として活用することに焦点を当てた。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:08:59 GMT)
FAMNet: Integrating 2D and 3D Features for Micro-expression Recognition via Multi-task Learning and Hierarchical Attention [0.0] マイクロ表現認識(MER)は多くの分野において必須の応用価値を持つが,マイクロ表現認識(ME)の短期的・低強度化はMERに重大な課題をもたらす。
本稿では,2次元CNNと3次元CNNを組み合わせることで,MEsの全方位特徴を完全に抽出する,マルチタスク学習と階層的注意に基づく新しいMER手法を提案する。
大規模な実験結果から,提案するFAMNetはタスク性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:27:15 GMT)
Extracting Structured Requirements from Unstructured Building Technical Specifications for Building Information Modeling [0.0] 本研究では,建築情報モデリングと自然言語処理(NLP)の統合について検討する。
建設業界における非構造化のフランス建築技術仕様書からの要求の抽出を自動化することを目的としている。
その結果,CamemBERTとFr_core_news_lgはNERにおいて優れた性能を示し,F1スコアは90%以上,Random ForestはREにおいて最も有効であり,F1スコアは80%以上であった。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:55:41 GMT)
Extending a Phylogeny-based Method for Detecting Signatures of Multi-level Selection for Applications in Artificial Life [0.0] 多段階選択は、短期的な個人レベルの生殖利害が長期的なグループレベルのフィットネス効果と矛盾する場合に起こる。
Bonetti Franceschi & Volz (2024) は、偶然に予想されるよりも頻繁に集団に現れる突然変異をスクリーニングすることで、多段階選択のダイナミクスを検出することを提案した。
ここでは,エージェント・ベース・モデリングと既知の基礎的真理を用いて,このアプローチの有効性を評価する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:42:38 GMT)
Exploring Nonreciprocal Noise Transfer under Onsager-Casimir Symmetry in Synthetic-Field Optomechanics [0.0] 基本的重要性の最適力学系は、2つの結合した機械共振器からなる。
この閉ループと全体の損失構成は2つの例外点(EP)を持つ。
内部および出力変動のノイズパワースペクトル密度プロファイルを解析する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:04:11 GMT)
Explainability of Algorithms [0.0] 多くの複雑な機械学習アルゴリズムの不透明さは、人工知能(AI)の倫理的発展の主要な障害の一つとしてしばしば言及されている。
この章では、不透明さの理解方法と、それらそれぞれに由来する倫理的意味について考察する。
分析が示すように、説明可能なAI(XAI)は依然として多くの課題に直面している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:42:19 GMT)
Excitonic Coupling and Photon Antibunching in Venus Yellow Fluorescent Protein Dimers: A Lindblad Master Equation Approach [0.0] We showed strong excitonic coupling and photon antibunching in Venus yellow fluorescent protein (YFP) dimers。
低温冷却はコヒーレンス寿命を量子ゲート操作に必要な状態にまで延長する可能性がある。
結果は、排他的結合、デコヒーレンス、タンパク質アーキテクチャを結合する構造設計の原則を強調している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:44:59 GMT)
Evaluation of Circular Complex Permeability in Single-Crystal Yttrium Iron Garnet at Cryogenic Temperatures [0.0] 本研究では,300Kから2Kの温度範囲で低損失フェライト材料を特性評価する手法を開発した。
円偏光共振モード(textTE_11n)を用いることで、円複素透磁率の直接推定が可能となる。
本手法は, 小型低温非相反素子の候補となる各種低損失フェライト材料の特性評価に有効である。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:02:52 GMT)
Evaluating Open-Source Vision Language Models for Facial Emotion Recognition against Traditional Deep Learning Models [0.0] 顔の感情認識(FER)は、人間とコンピュータの相互作用やメンタルヘルス診断などの応用に不可欠である。
本研究では,オープンソースのビジョン・ランゲージモデル(VLM)と従来のディープラーニングモデルとの実証的な比較を行った。
VLMのトレーニング仮定とFERデータのノイズ特性のミスマッチに対処するために,新しいパイプラインを導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:33:10 GMT)
Erasure-tolerance scheme for the surface codes on neutral atom quantum computers [0.0] 克服すべき重要な課題は、非Pauliエラー、特にエラーの消去とリークエラーの存在である。
以前の研究では、リークエラーは消去エラーに変換可能であることが示されているが、これらの(変換された)消去エラーは継続的に発生し、時間の経過とともに蓄積される。
そこで本研究では,k-shift消去回復法という新たな手法を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:04:44 GMT)
Environmental Feature Engineering and Statistical Validation for ML-Based Path Loss Prediction [0.0] 無線通信は経路損失モデリングに依存しており、伝搬環境の物理的詳細を含む場合に最も効果的である。
このような詳細へのアクセスにより、伝搬モデルはより正確にカバレッジを予測し、無線デプロイメントにおける干渉を説明できる。
本稿では,厳密な統計的評価とテストセットのホールドアウトによるモデル一般化の証明をしながら,予測精度を向上させる機能拡張を導入する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:16:14 GMT)
Entanglement witnesses for stabilizer states and subspaces beyond qubits [0.0] 多部共役の絡み合いは多部共役の場合で最も価値の高い絡み合いである。
多部量子状態におけるこの形の絡み合いを検出するために、典型的には絡み合いの証人を用いる。
局所的な高次元の量子系における真の多重粒子絡みを検出する証人は、マルチキュービット状態から導出されるものよりも、ノイズロバスト性に優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:12:11 GMT)
Entanglement in dual unitary quantum circuits with impurities [0.0] 不純物に摂動する量子回路における絡み合いのダイナミクスについて検討する。
不純物の有限距離内における半無限部分系と有限部分系の両方に対する絡み合いエントロピーを計算する。
しかし、有限部分系では、どちらの理論も質的に異なり、準粒子像は膜像とは対照的に非単調な成長を予測している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:11:52 GMT)
EmoSLLM: Parameter-Efficient Adaptation of LLMs for Speech Emotion Recognition [0.0] 音声からの感情認識は言語とパラ言語の両方を捉えることを必要とする難しい課題である。
最近の研究は、Large Language Models(LLM)が唯一の自然言語領域の外でタスクを実行する能力を強調している。
本研究は、感情予測のための音声およびテキスト表現を備えたLLMを微調整する新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:58:16 GMT)
Emergent symmetry in a two-Higgs-doublet model from quantum information and nonstabiliserness [0.0] 我々は、遷移行列による初期状態密度行列の可換性によって符号化された一般的な量子情報理論の原理で研究する。
任意の初期状態を散乱するポテンシャルのクォート部分の$mathrmSO(8)$対称性を示す一貫した条件の集合を見つける。
これは、初期状態におけるボース対称性を考慮し、アイソスピンとフレーバー部分空間の間の絡み合いをもたらす。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:34:53 GMT)
Dynamics-Informed Reservoir Computing with Visibility Graphs [0.0] 貯留層コンピューティングは、従来のディープラーニングに代わる計算的に効率的な代替手段を提供する。
その利点にもかかわらず、大まかにランダムな貯水池グラフアーキテクチャは、しばしば理解されていないダイナミクスを持つ最適以下のネットワークをもたらす。
本稿では,入力学習シーケンスから直接貯水池ネットワーク構造を体系的に推論する新しい動的インフォームド貯留層計算フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:25:34 GMT)
Dynamical quantum phase transition, metastable state, and dimensionality reduction: Krylov analysis of fully connected spin models [0.0] 完全連結スピンモデルの焼入れ力学について検討する。
この系は初期ハミルトニアンの基底状態で準備され、ハミルトニアンは突然別の形式に変化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:15:25 GMT)
Dispositions and Roles of Generically Dependent Entities [0.0] BFO 2020は、機能、配置、および一般的な依存的な連続体の役割をサポートしない。
この問題に対処する2つのアプローチが提示される。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:56:56 GMT)
Development of Pre-Trained Transformer-based Models for the Nepali Language [0.0] 全世界で約3200万人が話しているネパール語は、この領域では著しく過小評価されている。
ネパール語コーパスの約2.4倍の27.5GBのテキストデータを収集した。
我々のモデルは、Nep-gLUEベンチマークで既存の最良のモデルよりも2ポイント優れ、95.60得点、テキスト生成タスクで既存のモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:00:49 GMT)
Deterministic Mechanical Wigner Negativity via Nonlinear Cavity Quantum Optomechanics in the Unresolved-Sideband Regime [0.0] ウィグナー負性を示す機械運動の非ガウス量子状態は、量子技術と基礎物理学のテストに有望な能力を提供する。
キャビティ応答の非線形性と機械的位置を両立させることにより, 機械的ウィグナー負性度を非解決サイドバンド方式で決定的に作成できることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:20:30 GMT)
DeepRetro: Retrosynthetic Pathway Discovery using Iterative LLM Reasoning [0.0] DeepRetroは、大規模言語モデル(LLM)、従来のレトロシンセティックエンジン、反復設計ループにおける専門家のフィードバックを密に統合する、新しいオープンソースのフレームワークである。
DeepRetroをオープンソースツールとしてリリースすることで、化学者がますます野心的な合成ターゲットに取り組むようにしたいと思っています。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:39:25 GMT)
Content and Quality Analysis of Parent-Facing Applications for Feeding Children with Autism Spectrum Disorder [0.0] 世界100人に1人が自閉症スペクトラム障害(ASD)と診断される
モバイルヘルス(mHealth)アプリケーションは介護者に対する潜在的なサポートを提供するが、自閉症に関連する摂食問題をターゲットにしたアプリの品質と関連性はまだ不明だ。
この体系的なレビューは、2024年9月から10月にかけて、Apple App StoreとGoogle Play Storeで利用可能なモバイルアプリを評価した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:25:01 GMT)
Consolidating and Developing Benchmarking Datasets for the Nepali Natural Language Understanding Tasks [0.0] 我々は12の新しいデータセットを導入し、さまざまな自然言語理解(NLU)タスク間でモデルの性能を評価するための新しいベンチマークを作成します。
追加タスクには、単一文分類、類似性とパラフレーズタスク、自然言語推論(NLI)、汎用マスケッド評価タスク(GMET)などがある。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:54:02 GMT)
ConTextTab: A Semantics-Aware Tabular In-Context Learner [0.0] ConTextTabを導入し、セマンティック理解とアライメントをテーブルネイティブなICLフレームワークに統合する。
我々のモデルは、意味的にリッチなCARTEベンチマークで新しい標準を設定しながら、幅広いベンチマークでSOTAと競合する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 14:21:49 GMT)
Comparison of derivative-free and gradient-based minimization for multi-objective compositional design of shape memory alloys [0.0] 我々は, 機械モデルを代理材として使用し, 合金組成の探索に数値的手法を適用した。
本研究では、物理インフォームドデータ、機械学習モデル、最適化アルゴリズムを組み合わせることで、新しいSMAを探索する実践的なアプローチを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:43:35 GMT)
Comparative study of the butterfly velocity in holographic QCD models at finite temperature and chemical potential [0.0] 有限温度および化学ポテンシャルにおける様々なホログラムQCDモデルにおける量子カオスについて検討する。
我々は3つの異なる手法を用いてカオスパラメータ、蝶の速度の計算に焦点をあてる。
これら3つの手法で検討した全ホログラムQCDモデルに対して,バタフライ速度について同じ結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:58:08 GMT)
Color Spike Data Generation via Bio-inspired Neuron-like Encoding with an Artificial Photoreceptor Layer [0.0] スパイクニューラルネットワーク(SNN)の性能は、畳み込みニューラルネットワーク(CNN)よりまだ遅れている
本稿では,生体ニューロンの動作原理と機能に基づいてスパイクデータを生成するニューロン様積分法を提案する。
実験により,この生物学的にインスパイアされたアプローチはスパイク信号の情報量を効果的に増加させ,SNNの性能を向上させることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:36:37 GMT)
Clus-UCB: A Near-Optimal Algorithm for Clustered Bandits [0.0] Clus-UCBはクラスタリング構造を利用するように設計されており、腕を評価するための新しいインデックスを導入している。
そこで本研究では,本アルゴリズムのシミュレーション結果と,KL-UCBや他の腕を持つバンディット用アルゴリズムとの比較を行った。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:15:15 GMT)
Chaos-Mediated Quantum State Discrimination Near Unit Fidelity [0.0] 非線形離散時間カオス力学に基づく量子ビットの「量子顕微鏡」について検討する。
ベル型時間相関は, 2つの初期状態の分節差でも観測可能であることを示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 10:45:47 GMT)
Can Large Language Models (LLMs) Describe Pictures Like Children? A Comparative Corpus Study [0.0] 本研究では,大言語モデル (LLM) が, LLM 生成したテキストとドイツの児童による絵物語の記述を比較検討することにより, 子どものような言語を再現する方法について検討した。
単語の頻度,語彙の豊かさ,文章と単語の長さ,パート・オブ・音声タグ,単語の埋め込みによる意味的類似性など,心理言語学的テキスト特性の比較分析を行った。
その結果,LLM生成したテキストは長大だが語彙的にも豊かではないこと,高周波の単語に頼っていること,表現不足の名詞に頼っていることが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 12:13:54 GMT)
COMPASS: A Multi-Dimensional Benchmark for Evaluating Code Generation in Large Language Models [0.0] 我々は3次元にわたるコード生成を評価する包括的な評価フレームワーク、すなわち正確性、効率、品質を紹介します。
Anthropic Claude Opus 4、Google Gemini 2.5 Pro、OpenAI O4-Mini-Highの3つの主要な推論モデルの評価結果から、高い正確性スコアを達成するモデルは必ずしも効率的なアルゴリズムや保守可能なコードを生成するとは限らないことが判明した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 11:55:07 GMT)
CIA+TA Risk Assessment for AI Reasoning Vulnerabilities [0.0] 本稿では,AI推論プロセスのシステム的保護である認知サイバーセキュリティの枠組みについて述べる。
まず、従来のサイバーセキュリティとAIの安全性を補完する規律として、認知サイバーセキュリティを確立します。
第2に、CIA+TAを導入し、従来の機密性、統合性、信頼による可用性を拡張します。
第3に,経験的導出係数を用いた定量的リスク評価手法を提案し,組織が認知的セキュリティリスクを計測できるようにする。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:56:09 GMT)
CAI Fluency: A Framework for Cybersecurity AI Fluency [0.0] この研究は、サイバーセキュリティAI(CAI)フレームワークの教育プラットフォームであるCAI Fluencyを紹介している。
CAIフレームワークの主な目的は、人工知能ベースのサイバーセキュリティソリューションの普及と有効利用を促進することである。
この技術レポートはホワイトペーパーとして機能し、CAIフレームワークの背景にある原則を理解するのに役立つ詳細な教育的および実践的なガイドとして機能します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:42:54 GMT)
Bridging the Gap: Doubles Badminton Analysis with Singles-Trained Models [0.0] バドミントンは世界最速のラケットスポーツです
これまでの研究は主に、データの可用性と多人数追跡の課題のためにシングルに重点を置いてきた。
この研究は、ファストラケットスポーツのこの支配的だが未検討のフォーマットを理解するために、ダブルス固有のデータセットの基盤を確立する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 04:45:15 GMT)
Bridging Clear and Adverse Driving Conditions [0.0] ドメイン適応パイプラインは、透明な天候の画像を霧、雨、雪、夜間の画像に変換する。
我々は、既存のDA GANを活用し、補助的な入力をサポートするように拡張し、シミュレーションと実画像の両方を活用する新しいトレーニングレシピを開発した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:58:05 GMT)
Brace for impact: ECDLP challenges for quantum cryptanalysis [0.0] 我々は,Bitcoinの曲線を用いた楕円曲線離散対数(ECDLP)の難易度向上スイートを導入する。
各ビット長に対して、素数、基点および例公開鍵を提供する。
We calibrate classical cost against Pollard's rho records and quantum cost against resource estimation results for Shor's algorithm。
物理的エラー率、コード距離、非クリフォード供給に関する明示的でテスト可能な仮定の下で、私たちのシナリオは256ビットのインスタンスを2027-2033ウィンドウ内に配置します。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:16:31 GMT)
Bounding Causal Effects and Counterfactuals [0.0] この論文は、複数の因果シナリオにまたがる有界アルゴリズムを体系的に比較することで、課題に対処する。
我々は、共通の評価フレームワーク内で最先端のメソッドを実装し、拡張し、統一する。
我々の実証研究は、離散データ生成プロセスと連続データ生成プロセスの両方を含む何千ものランダム化シミュレーションにまたがる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 08:13:34 GMT)
Boolean Matrix Logic Programming on the GPU [0.0] 本稿では,ブール行列代数を用いた新しいデータログクエリ評価手法を提案する。
提案手法は,最先端システムよりも1~4桁の高速化を実現する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:25:33 GMT)
Beneath the Mask: Can Contribution Data Unveil Malicious Personas in Open-Source Projects? [0.0] 本稿では、GitHubのコントリビューションから収集したオープンソースインテリジェンス(OSINT)データをグラフデータベースとグラフ理論を用いて分析し、他のオープンソースプロジェクト間で"JiaT75"ペルソナが示す異常な振る舞いを効率的に識別する方法を示す。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:17:48 GMT)
Bell Inequality Violations Without Entanglement? It's Just Postselection [0.0] Wangらは、ベルの不平等が絡み合わずに違反していると報告している。
結果がポストセレクションの成果であることを示す。
どちらのバージョンもローカル因果性やローカルリアリズムに挑戦しない理由を詳しく説明する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:06:53 GMT)
Autoregressive Typical Thermal States [0.0] 本稿では,量子系の有限温度特性を計算するための自己回帰フレームワークを提案する。
このアルゴリズムをスピン1/2量子XY鎖の正確な結果と比較することにより、自己回帰的な典型的な熱状態が正確に熱観測値を計算することができることを示した。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:20:15 GMT)
Analytical phase boundary of a quantum driven-dissipative Kerr oscillator from classical stochastic instantons [0.0] ケルディシュ経路積分の枠組みは、熱平衡から引き離された量子系を簡潔に記述する。
光子占有の変動に関する熱力学的限界の中では、マルティン=シギア=ローズ=ジャンセン=ド・ドミニシス経路積分にマッピングする。
この視点は、モデルの安定性を記述する効果的な熱力学的ポテンシャルの探索で遭遇した困難に光を当てる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:21:02 GMT)
An Improved Multi-Agent Algorithm for Cooperative and Competitive Environments by Identifying and Encouraging Cooperation among Agents [0.0] 本稿では,エージェント間の協調行動が特定されると,エージェントが得られる報酬を増やすための新しいパラメータを提案する。
その結果、新しいアルゴリズムは、より高いチーム報酬と個人の報酬の両方を達成するのに役立ちます。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 09:13:36 GMT)
Alvorada-Bench: Can Language Models Solve Brazilian University Entrance Exams? [0.0] 本稿では,ブラジルの5つの大学入学試験から抽出した4,515件のテキストのみのベンチマークであるAlvorada-Benchについて述べる。
上位モデルは全体の94%を超えるが、数学やエンジニアリング指向のIMEおよびITA試験では精度が低下する。
コスト精度分析により、1Kトークンあたり2ドル以下で高い精度が得られることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:59:04 GMT)
AlphaX: An AI-Based Value Investing Strategy for the Brazilian Stock Market [0.0] 我々は、古典的な投資パラダイムである価値投資にインスパイアされたAIベースの戦略を提案する。
金融AIモデルは、生のトレーディング条件と比較してバックテストのパフォーマンスを著しく向上させる、バイアスやその他の形式のバイアスに非常に影響を受けやすい。
以上の結果から,提案手法はブラジルの主要市場ベンチマークより優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 01:04:38 GMT)
Age-Normalized HRV Features for Non-Invasive Glucose Prediction: A Pilot Sleep-Aware Machine Learning Study [0.0] 年齢正規化法は, 年齢因子による生値の分割により, HRV特徴量に適用した。
年齢正規化HRVの特徴は、従来のアプローチに比べてグルコース予測精度を著しく向上させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 13:01:13 GMT)
Adaptation and Optimization of Automatic Speech Recognition (ASR) for the Maritime Domain in the Field of VHF Communication [0.0] 海上無線用多言語自動音声認識装置(ASR)は、受信したVHF無線信号をテキストに変換する。
音声処理技術と機械学習アルゴリズムからなるmarFMのディープラーニングアーキテクチャについて述べる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 07:36:00 GMT)
Accelerating Image Classification with Graph Convolutional Neural Networks using Voronoi Diagrams [0.0] 本稿では,グラフ畳み込みネットワーク(GCN)とボロノイ図を併用したリレーショナルデータをモデル化する革新的なフレームワークを提案する。
本モデルは,いくつかのベンチマークデータセットにおいて,前処理時間と分類精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:29:25 GMT)
A high-temperature limit penalizing high-frequency quantum fluctuations [0.0] オーミックスペクトル密度を持つ量子ブラウン運動のカルデイラ・レゲットモデルを再検討する。
我々は、任意に大きなカットオフ周波数で新しい高温限界におけるデコヒーレンスカーネルへの追加的な寄与を導出する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 20:41:32 GMT)
A blueprint for experiments exploring the Poincaré quantum recurrence theorem [0.0] ポアンカーの反復定理(Poincar'e repeatence theorem)は、系が有限時間でその初期状態に任意に近い状態を返すという定理である。
再生確率と時間の両方について解析的および数値的な結果を示す。
本稿では,ポアンカーの再生理論とスケーリングに関する実測実験を提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 03:41:02 GMT)
A Systematic Study of Deep Learning Models and xAI Methods for Region-of-Interest Detection in MRI Scans [0.0] 本研究は, 膝関節MRIにおける興味領域の自動検出のためのAI(xAI)技術と組み合わせて, 各種ディープラーニングアーキテクチャの体系的評価を行う。
ResNet50, InceptionV3, Vision Transformers (ViT) および多層パーセプトロン (MLP) 分類器を付加した複数のU-Net変種について検討した。
以上の結果から,ResNet50は,MRNetデータセットの制約下でのトランスフォーマーベースモデルよりも優れた分類とROI識別が一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 17:42:45 GMT)
A Small Dataset May Go a Long Way: Process Duration Prediction in Clinical Settings [0.0] 手術室の利用は病院の主要なコスト・ドライバーである。
従来の研究では、手順の持続時間を予測するための様々な複雑なモデルが提案されていた。
我々は,少量のデータのみに基づいて,運用期間を予測する効率的かつ効率的なモデルの構築を目指している。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 19:37:04 GMT)
A Review of Developmental Interpretability in Large Language Models [0.0] 本総説では,大規模言語モデルの発達的解釈可能性について概説する。
我々は、トレーニングされたモデルの静的なポストホック解析から、トレーニングプロセス自体の動的調査まで、フィールドの進化をグラフ化する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 18:19:16 GMT)
A PC Algorithm for Max-Linear Bayesian Networks [0.0] 最大線形ベイズネットワーク(英: Max-linear Bayesian Network、MLBN)は、構造方程式モデルの比較的最近のクラスである。
MLBNはd-セパレーションに忠実ではないため、PCアルゴリズムやグリーディ同値探索のような古典的な因果探索アルゴリズムは真のグラフ構造を正確に復元することができない。
我々は,PCstarと呼ばれる新たな因果発見アルゴリズムを導入し,$Cast$-セパレーションに忠実さを仮定し,d-または$ast$-セパレーションのみで指向できない追加エッジをオリエントすることができる。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 15:57:55 GMT)
A Hierarchical Surrogate Model for Efficient Multi-Task Parameter Learning in Closed-Loop Control [0.0] 本稿では,効率的な制御パラメータ学習に適した階層型ベイズ最適化(BO)フレームワークを提案する。
閉ループコストをブラックボックスとして扱う代わりに,本手法は根本問題の構造的知識を活用する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 06:46:05 GMT)
A Fully Spectral Neuro-Symbolic Reasoning Architecture with Graph Signal Processing as the Computational Backbone [0.0] 本稿では,グラフ信号処理(GSP)を主計算バックボーンとして利用する,完全スペクトルのニューロシンボリック推論アーキテクチャを提案する。
本稿では、スペクトル推論のための完全な数学的枠組みとして、グラフフーリエ変換、帯域選択型アテンション、スペクトル規則グラウンドティングを提案する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 05:49:28 GMT)
A Causal Graph-Enhanced Gaussian Process Regression for Modeling Engine-out NOx [0.0] ガウス過程回帰を用いたエンジンアウトNOx排出予測モデルの開発と検証を行った。
入力ウィンドウとディープカーネル構造を用いる場合,本モデルにより予測性能が向上する。
論文参考訳(メタデータ) (Tue, 19 Aug 2025 02:36:46 GMT)