Scaling RL to Long Videos [107.4] LongVILA-R1-7Bはビデオベンチマークで高いパフォーマンスを達成し、ビデオMMEではそれぞれ65.0%と70.7%の精度を達成した。
LongVILA-R1は、入力ビデオフレーム数が増加するにつれて、安定したパフォーマンス向上を示す。
各種モダリティのRLトレーニングをサポートする,一般公開のためのトレーニングシステムをリリースする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:20:41 GMT)
Direct Dual-Energy CT Material Decomposition using Model-based Denoising Diffusion Model [106.0] 本稿では,Dual-Energy Decomposition Model-based Diffusion (DEcomp-MoD) と呼ばれる深層学習手法を提案する。
Decomp-MoDは、教師なしスコアベースモデルと教師なしディープラーニングネットワークより優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:00:06 GMT)
Checklists Are Better Than Reward Models For Aligning Language Models [99.2] チェックリストフィードバックからの強化学習(RLCF)を提案する。
指示からチェックリストを抽出し,各項目の応答がどの程度満足するかを評価する。
これらのスコアをAI判断器と特殊検証器プログラムの両方を用いて組み合わせ、RLの報酬を計算する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:58:00 GMT)
SafeWork-R1: Coevolving Safety and Intelligence under the AI-45$^{\circ}$ Law [91.3] 我々は,機能と安全性の共進化を示す最先端のマルチモーダル推論モデルであるSafeWork-R1を紹介する。
大規模でプログレッシブで安全指向の強化学習をポストトレーニングに取り入れたSafeLadderフレームワークを開発した。
さらに,SafeWork-R1-InternVL3-78B,SafeWork-R1-DeepSeek-70B,SafeWork-R1-Qwen2.5VL-7Bを開発した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:49:19 GMT)
Corrupted by Reasoning: Reasoning Language Models Become Free-Riders in Public Goods Games [87.6] 大規模言語モデルは、アライメント、堅牢性、安全なデプロイメントを保証する上で、いかに自己関心と集合的幸福のバランスをとるかが重要な課題である。
我々は、行動経済学から制度的に選択した公共財ゲームに適応し、異なるLLMがいかに社会的ジレンマをナビゲートするかを観察することができる。
意外なことに、o1シリーズのようなLCMの推論は、協調にかなり苦労している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:13:24 GMT)
When Autonomy Goes Rogue: Preparing for Risks of Multi-Agent Collusion in Social Systems [78.0] 悪意のあるマルチエージェントシステム(MAS)のリスクをシミュレートするための概念実証手法を提案する。
この枠組みを、誤情報拡散とeコマース詐欺という2つのリスクの高い分野に適用する。
その結果,分散システムの方が,集中型システムよりも悪意ある行動を実行するのに効果的であることが示唆された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:00:02 GMT)
FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.5] MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。
ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。
本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:31:36 GMT)
ExpliCa: Evaluating Explicit Causal Reasoning in Large Language Models [75.1] 明示的な因果推論において,LLM(Large Language Models)を評価するための新しいデータセットであるExpliCaを紹介する。
ExpliCa上で7つの商用およびオープンソース LLM をテストしました。
驚くべきことに、モデルは因果関係と時間的関係を関連付ける傾向にあり、そのパフォーマンスはイベントの言語的順序にも強く影響される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:47:56 GMT)
Promptomatix: An Automatic Prompt Optimization Framework for Large Language Models [72.5] LLM(Large Language Models)は、巧妙なプロンプトで最高の性能を発揮するが、プロンプトは手動で、一貫性がなく、非専門家にはアクセスできない。
Promptomatixは、手作業のチューニングやドメインの専門知識を必要とせずに、自然言語のタスク記述を高品質なプロンプトに変換する。
システムは、ユーザ意図を分析し、合成トレーニングデータを生成し、プロンプト戦略を選択し、コストを意識した目標を使用してプロンプトを洗練する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:49:26 GMT)
Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [72.4] 大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。
既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。
協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:17:41 GMT)
Non-perturbative switching rates in bistable open quantum systems: from driven Kerr oscillators to dissipative cat qubits [72.4] 単一モードバイスタブルオープン量子系におけるスイッチング率の予測にはパス積分手法を用いる。
本研究は,マルチ安定な単体および多体オープン量子系におけるスイッチング現象を探索するための新たな道を開く。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:01:36 GMT)
A Survey of Deep Learning for Geometry Problem Solving [72.2] 本稿では,幾何学的問題解決におけるディープラーニングの応用について調査する。
i)幾何学的問題解決における関連する課題の包括的概要、(ii)関連するディープラーニング手法の徹底的なレビュー、(iii)評価指標と手法の詳細な分析を含む。
我々の目標は、この分野のさらなる発展を促進するために、幾何学的問題解決のためのディープラーニングの包括的で実践的な参照を提供することである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:15:29 GMT)
Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.6] 単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。
本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。
画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:53:26 GMT)
Flash-VStream: Efficient Real-Time Understanding for Long Video Streams [64.3] Flash-VStreamは、非常に長いビデオを処理し、リアルタイムでユーザークエリに応答できるビデオ言語モデルである。
既存のモデルと比較して、Flash-VStreamは推論遅延を大幅に削減する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:25:10 GMT)
PARTE: Part-Guided Texturing for 3D Human Reconstruction from a Single Image [64.2] 構造的人間の部分は、単一の画像の見えない領域で人間のテクスチャを推測する重要な手がかりとなる。
本研究では,人間のテクスチャを再構築するための3次元情報を含むフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:16:29 GMT)
Zeroth-Order Fine-Tuning of LLMs in Random Subspaces [63.1] 言語モデルのサイズが大きくなるにつれて、バックプロパゲーションに対するメモリ要求が増加する。
Zeroth-order (ZO) 最適化手法はメモリ効率の良い代替手段を提供する。
本稿では,高次元摂動によって生じる課題に対処するために,部分空間ゼロ次最適化を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:21:10 GMT)
Improving Large Vision-Language Models' Understanding for Field Data [62.9] 本研究では、大規模ビジョン言語モデルのフィールドデータ理解を改善するためのフレームワークであるFieldLVLMを紹介する。
FieldLVLMは、フィールド対応言語生成戦略とデータ圧縮マルチモーダルモデルチューニングの2つの主要コンポーネントから構成される。
新たに提案されたベンチマークデータセットの実験結果から、フィールドLVLMは、科学的なフィールドデータを含むタスクにおいて、既存の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:28:53 GMT)
Recent Trends in Distant Conversational Speech Recognition: A Review of CHiME-7 and 8 DASR Challenges [58.8] CHiME-7と8つの遠隔音声認識(DASR)の課題は、多チャンネル、一般化可能、共同自動音声認識(ASR)、対話音声のダイアリゼーションである。
本稿では,参加者からの重要傾向を分析しつつ,課題の設計,評価指標,データセット,ベースラインシステムについて概説する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:56:24 GMT)
Outcome-Based Online Reinforcement Learning: Algorithms and Fundamental Limits [58.6] 結果に基づくフィードバックによる強化学習は、根本的な課題に直面します。
適切なアクションにクレジットを割り当てるには?
本稿では,一般関数近似を用いたオンラインRLにおけるこの問題の包括的解析を行う。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:21:12 GMT)
Optimizing against Infeasible Inclusions from Data for Semantic Segmentation through Morphology [58.2] 最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。
InSeInは、学習されたセグメンテーションモデルの予測において、実現不可能なセマンティックインクルージョンを最小化する新しいステップである。
様々な最先端ネットワークに対して一貫した、重要なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:22:40 GMT)
Revisiting LLM Reasoning via Information Bottleneck [57.5] 大規模言語モデル(LLM)は、最近、検証可能な報酬付き強化学習(RLVR)を通じて推論能力の顕著な進歩を示した。
本稿では,情報ボトルネック(IB)の原理に基づくLLM推論の理論的特徴について述べる。
IB対応推論最適化(IBRO)を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:14:25 GMT)
MathOPEval: A Fine-grained Evaluation Benchmark for Visual Operations of MLLMs in Mathematical Reasoning [57.4] 有望なアプローチでは、中間表現としてコードを使用し、推論ステップで画像を正確に表現し、操作する。
既存の評価はテキストのみの推論出力に重点を置いており、MLLMはコードによる正確な視覚操作をほとんど探索されていないままにしている。
この研究は、マルチモーダル数学的推論におけるMLLMのコードベース能力を評価することによって、そのギャップに対処する第一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:03:11 GMT)
Rectifying Magnitude Neglect in Linear Attention [57.1] リニアアテンションは、標準的なSoftmaxアテンションに比べて大幅にパフォーマンスが低下する。
我々は,線形注意の計算を改良し,クエリの規模を完全に組み込むMagnitude-Aware Linear Attention (MALA)を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:37:55 GMT)
GrAInS: Gradient-based Attribution for Inference-Time Steering of LLMs and VLMs [56.9] GrAInSは推論時ステアリングのアプローチで、言語のみのモデルと視覚言語の両方のモデルとタスクで動作する。
推論中、GrAInSはトークンレベルの属性信号によって誘導されるトランスフォーマー層で隠されたアクティベーションを隠蔽し、アクティベーションを正規化し、表現スケールを保存する。
微調整と既存のステアリングベースラインの両方を一貫して上回る。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:34:13 GMT)
OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation [56.5] OPERAは、ユーザペルソナ、ブラウザの観察、きめ細かいWebアクション、そして自己報告されたジャストインタイム論理を包括的にキャプチャする最初のパブリックデータセットである。
我々は,現在のLCMがユーザの次の行動と合理的性をどの程度予測できるかを評価するための最初のベンチマークを確立する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:52:49 GMT)
Self-Supervised Coarsening of Unstructured Grid with Automatic Differentiation [55.9] 本研究では,微分可能物理の概念に基づいて,非構造格子を階層化するアルゴリズムを提案する。
多孔質媒質中のわずかに圧縮可能な流体流を制御した線形方程式と波動方程式の2つのPDE上でのアルゴリズムの性能を示す。
その結果,検討したシナリオでは,関心点におけるモデル変数のダイナミクスを保ちながら,格子点数を最大10倍に削減した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:02:13 GMT)
Group Sequence Policy Optimization [55.4] Group Sequence Policy Optimization (GSPO) は、安定的で効率的でパフォーマンスの高い強化学習アルゴリズムである。
GSPOは、シーケンスの確率に基づいて重要度を定義し、シーケンスレベルのクリッピング、報酬、最適化を行う。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:50:32 GMT)
Observation of Magnetic Devil's Staircase-Like Behavior in Quasiperiodic Qubit Lattices [55.2] 悪魔の階段(DS)現象は、外界への磁化のフラクタル反応である。
我々は、単純で効果的なIsing-modelフレームワークにおいて、外部磁場の増加によって引き起こされる急激な磁気遷移を多数発見する。
本研究は,DSの挙動が周期的システムに限定されているという一般的な見方に挑戦する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:39:06 GMT)
HPS: Hard Preference Sampling for Human Preference Alignment [55.1] HPS(Hard Preference Sampling)は、堅牢で効率的な人間の選好アライメントのための新しいフレームワークである。
HPSはアライメント品質を維持しながら計算オーバーヘッドを低減する。
HH-RLHFとPKU-Safetyデータセットの実験はHPSの有効性を検証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:00:09 GMT)
3D Software Synthesis Guided by Constraint-Expressive Intermediate Representation [50.7] 本稿では,要求に敏感な3Dソフトウェア合成手法であるScenethesisを提案する。
Scenethesisは、ユーザ仕様と生成された3Dソフトウェアの間の形式的なトレーサビリティを維持している。
Scenethesisは、最先端の手法と比較して、BLIP-2視覚評価スコアが42.8%向上した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:58:03 GMT)
AI/ML Life Cycle Management for Interoperable AI Native RAN [50.6] 人工知能(AI)と機械学習(ML)モデルは、5Gラジオアクセスネットワーク(RAN)を急速に浸透させている
これらの開発は、AIネイティブなトランシーバーを6Gのキーイネーブルとして基盤を築いた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:04:59 GMT)
Omni-Thinker: Scaling Cross-Domain Generalization in LLMs via Multi-Task RL with Hybrid Rewards [50.2] Omni-Thinkerは多種多様なタスクにわたる大規模言語モデル(LLM)の性能を向上させる統合強化学習フレームワークである。
我々の手法はタスクタイプを一貫した最適化を可能にし、RLベースのトレーニングを主観的ドメインに拡張する。
4つの領域にまたがる実験の結果、カリキュラムの学習は、ジョイントトレーニングよりも5.2%、モデルマージより9.1%向上していることがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:25:54 GMT)
Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.1] 本稿では,文字のテキストワークに現れる言語パターンと独特の思考パターンの両方を再現するモデルである characterBot を紹介する。
著名な中国の作家ル・ジュンをケーススタディとして、17冊のエッセイ集から派生した4つの訓練課題を提案する。
これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。
言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:42:50 GMT)
Human Scanpath Prediction in Target-Present Visual Search with Semantic-Foveal Bayesian Attention [50.0] SemBA-FASTは、ターゲットの視覚検索における人間の視覚的注意を予測するためのトップダウンフレームワークである。
我々は、COCO-Search18ベンチマークデータセット上でSemBA-FASTを評価し、その性能を他のスキャンパス予測モデルと比較した。
これらの知見は、人間のような注意モデリングのためのセマンティック・フレーバー・確率的フレームワークの能力に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:19:23 GMT)
CRUISE: Cooperative Reconstruction and Editing in V2X Scenarios using Gaussian Splatting [48.9] 車間通信(V2X)は、自動運転車において重要な役割を担い、車とインフラの連携を可能にする。
本稿では,V2X運転環境向けに設計された総合的再構成合成フレームワークCRUISEを紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:48:44 GMT)
EarthLink: A Self-Evolving AI Agent for Climate Science [48.8] 我々は、地球科学者のための対話型ロボットとして設計された最初のAIエージェントであるEarthLinkを紹介する。
計画やコード生成からマルチシナリオ分析まで、エンドツーエンドの研究ワークフローを自動化する。
複数の専門家による評価において、EarthLinkは科学的に音の分析を行い、分析能力を示した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:12:15 GMT)
Efficient Agents: Building Effective Agents While Reducing Cost [48.7] LLM(Large Language Model)によるエージェントは、複雑なマルチステップタスクに対処するための高度なシステムを実現する。
この研究は、現代のエージェントシステムにおける効率効率性トレードオフに関する最初の体系的研究である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:56:51 GMT)
MEDTalk: Multimodal Controlled 3D Facial Animation with Dynamic Emotions by Disentangled Embedding [48.5] MEDTalkは、きめ細かなダイナミックな会話ヘッド生成のための新しいフレームワークである。
音声と音声のテキストを統合し、フレームワイドの強度変化を予測し、静的な感情特徴を動的に調整し、リアルな感情表現を生成する。
生成した結果は、産業生産パイプラインに便利に統合できます。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:47:54 GMT)
TELEVAL: A Dynamic Benchmark Designed for Spoken Language Models in Chinese Interactive Scenarios [47.1] 音声言語モデル(SLM)は近年急速に進歩し、性能評価のための多数のベンチマークが開発されている。
既存のベンチマークのほとんどは、SLMが大規模言語モデル(LLM)と同等の複雑なタスクを実行できるかどうかを評価することに重点を置いている。
リアルな中国語対話環境において,SLMの有効性を対話型エージェントとして評価するためのベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:23:55 GMT)
Leveraging Data Augmentation and Siamese Learning for Predictive Process Monitoring [45.0] SiamSA-PPMは、Siamese学習と予測プロセス監視のための統計的拡張を組み合わせた、自己教師型学習フレームワークである。
また,SiamSA-PPMは,次の活動および最終結果予測タスクにおいて,SOTAと比較して,競争力や優れた性能を発揮することを示した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:57:20 GMT)
The Integral Decimation Method for Quantum Dynamics and Statistical Mechanics [45.0] 多次元積分の直接数値評価は、次元数で指数関数的な計算コストを発生させる。
ここでは,多次元積分を行列値関数の積に圧縮する量子アルゴリズムを導出し,実装する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:01:19 GMT)
Programmable Exploration of Magnetic States in Lieb-Kagome Interpolated Lattices [45.0] 量子アニールは、実験的に実現可能なシステムにインスパイアされた分子量子ビット格子における磁気相互作用をシミュレートするために用いられる。
アナラーは、静的構造因子や広いパラメータ空間上の磁化のような可観測物へのアクセスを提供する。
このフレームワークは、化学、凝縮物質、量子情報科学にまたがる、エンジニアリングされた量子物質の限界を探索するためのモジュラーでスケーラブルなパラダイムを定義する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:47:54 GMT)
Learning to Generalize without Bias for Open-Vocabulary Action Recognition [43.8] オープンボキャブラリ動作認識のための静的デバイアス処理を備えた新しいメタ最適化フレームワークであるOpen-MeDeを紹介する。
我々は,Open-MeDeが,文脈内オープン語彙行動認識に適した最先端の正規化手法を超えるだけでなく,文脈外シナリオではかなり優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:56:00 GMT)
Delving into Mapping Uncertainty for Mapless Trajectory Prediction [41.7] 自動運転の最近の進歩は、地図のないアプローチに向かっている。
高精細(HD)マップは、センサーデータから直接オンラインで生成され、高価なラベリングとメンテナンスの必要性が軽減される。
本研究では,地図の不確実性が軌道予測に最も影響を与える運転シナリオを解析する。
本稿では,地図の不確かさを軌跡予測に適応的に組み込む新しいプロプライオセプティブシナリオゲーティングを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:13:11 GMT)
Adapting Large VLMs with Iterative and Manual Instructions for Generative Low-light Enhancement [41.7] たいていの低照度画像強調法は、事前訓練されたモデル事前、低照度入力、またはその両方に依存している。
提案する VLM-IMI は,大規模視覚言語モデルに反復的および手動命令を付加した新しいフレームワークである。
VLM-IMIは、所望のノーマルライトコンテンツのテキスト記述をエンハンスメントキューとして組み込んで、意味的にインフォメーションされた復元を可能にする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:35:20 GMT)
Technical Report of TeleChat2, TeleChat2.5 and T1 [40.9] 最新のTeleChatモデルについて紹介する: textbfTeleChat2, textbfTeleChat2.5, textbfT1。
モデルアーキテクチャの最小限の変更にもかかわらず、新しいシリーズは、強化されたトレーニング戦略によって、大幅なパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:00:48 GMT)
From Hypothesis to Publication: A Comprehensive Survey of AI-Driven Research Support Systems [40.1] 近年、人工知能(AI)技術の急速な発展は、研究者にAIが研究を加速し、強化する方法を探るきっかけとなった。
本稿では,本領域の進展を体系的に概観する。
我々は,関連する研究を仮説定式化,仮説検証,原稿出版という3つの主要なカテゴリに分類する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:59:25 GMT)
Fishers for Free? Approximating the Fisher Information Matrix by Recycling the Squared Gradient Accumulator [39.4] モデルのフィッシャー情報行列(フィッシャー対角線)の対角線はパラメータの感度を測定する手段として頻繁に用いられる。
本稿では,すでに計算済みの2乗勾配をリサイクルすることにより,フィッシャー対角線の近似を「無償」で得ることができるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:10:37 GMT)
Beamforming and Resource Allocation for Delay Minimization in RIS-Assisted OFDM Systems [38.7] 本稿では、ダウンリンク再構成可能なインテリジェントサーフェス(RIS)支援OFDMシステムにおけるビームフォーミングと資源配分の問題について検討する。
混合作用空間を効果的に処理し, 状態空間次元を低減するために, ハイブリッド深部強化学習(DRL)手法を提案する。
提案アルゴリズムは, 平均遅延を著しく低減し, 資源配分効率を向上し, システムの堅牢性と公平性を向上する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:56:07 GMT)
Wide-In, Narrow-Out: Revokable Decoding for Efficient and Effective DLLMs [37.9] Diffusion Large Language Models (DLLM) は、自動回帰モデルの魅力的な代替品として登場した。
既存のDLLMは、高速な並列復号化によって性能が著しく低下する、厳しい品質と速度のトレードオフに悩まされている。
本稿では,DLLMの復号化を可能にするトレーニング不要復号アルゴリズムであるWide-In, Narrow-Out (WINO)を紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:51:33 GMT)
RadioDUN: A Physics-Inspired Deep Unfolding Network for Radio Map Estimation [37.9] 限られた数のサンプルを実用的なシナリオで測定できるため、密度の高い無線マップを構築するのは難しい。
既存の研究は、深層学習を用いてスパースサンプルから密集した無線マップを推定しているが、無線マップの物理的特性と統合することは困難である。
適応的パラメータ調整と事前適合性を学習可能な方法で実現し,最適化プロセスの展開を目的としたRadio Deep Unfolding Network(RadioDUN)を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:41:43 GMT)
Causally Testing Gender Bias in LLMs: A Case Study on Occupational Bias [34.0] 生成言語モデルにおけるバイアス測定のための因果的定式化を導入する。
我々はOccuGenderというベンチマークを提案し、職業性バイアスを調査するためのバイアス測定手法を提案する。
以上の結果から,これらのモデルでは職業性バイアスがかなり大きいことが示唆された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:20:40 GMT)
MC3D-AD: A Unified Geometry-aware Reconstruction Model for Multi-category 3D Anomaly Detection [33.5] 本稿では,Multi-Category 3D Anomaly Detection (MC3D-AD) のための新しい統一モデルを提案する。
局所的およびグローバルな幾何認識情報を利用して、すべてのカテゴリの正規表現を再構築することを目的としている。
MC3D-ADは、公開されているReal3D-ADとAnomaly-ShapeNetデータセットで評価される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:03:56 GMT)
Nitrogen-vacancy centre formation via local femto-second laser annealing of diamond [33.4] ダイヤモンド中の窒素空孔(NV)中心に基づく量子技術は、欠陥密度、最適化されたNV生成過程、最小限の結晶ひずみを制御した慎重に設計された材料を必要とする。
フェムト秒(fs)レーザー処理による窒素ドープダイヤモンド中のNV中心形成について検討した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:59:35 GMT)
EgoExoBench: A Benchmark for First- and Third-person View Video Understanding in MLLMs [33.4] EgoExoBenchは、エゴセントリックなビデオ理解と推論のための最初のベンチマークである。
セマンティックアライメント、パースペクティブアソシエーション、時間的推論という、11のサブタスクにまたがる7,300以上の質問応答ペアで構成されている。
我々は、13の最先端MLLMを評価し、これらのモデルが単一視点のタスクに優れる一方で、視点間のセマンティクスの整合に苦慮し、視点を正確に関連付け、エゴ・エクソ・コンテキストにおける時間的ダイナミクスを推測する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:14:49 GMT)
BEARCUBS: A benchmark for computer-using web agents [33.1] BEARCUBSは、WebエージェントがWebから事実情報を検索、閲覧、識別する能力を評価するために設計された111の情報検索質問のベンチマークである。
BEARCUBSを解くには、合成されたページやシミュレーションされたページではなく、ライブのWebコンテンツにアクセスする必要がある。
人間による研究では、BEARCUBSの質問は解決可能であるが、非自明(84.7%の正確性)であり、ドメイン知識のギャップと見過ごされた詳細を共通の障害点として明らかにしている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:45:05 GMT)
A New Pair of GloVes [30.8] 本報告では,2024年の英語GloVe(Global Vectors for Word Representation)モデルについて述べる。
2014年に開発されたオリジナルのGloVeモデルは広く使われ、有用であることが分かり、言語と世界は進化し続けています。
われわれはWikipedia、Gigaword、およびDolmaのサブセットを使って単語埋め込みの2つのセットを訓練した。
語彙比較、直接テスト、NERタスクによる評価は、2024ベクターが新しい文化的、言語学的に関連のある単語を取り入れ、類似性や類似性などの構造的タスクを相補的に実行し、近年の時間的に改善された性能を示すことを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:29:18 GMT)
The Role of Orthographic Consistency in Multilingual Embedding Models for Text Classification in Arabic-Script Languages [30.4] アラビア文字のRoBERTa(AS-RoBERTa)ファミリー:RoBERTaをベースとした4つのモデルを紹介する。
アラビア文字を用いた言語におけるスクリプト認識特化の価値を強調し、スクリプトと言語特異性に根ざした事前学習戦略をさらに支援した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:28:33 GMT)
On the Convergence of Gradient Descent on Learning Transformers with Residual Connections [26.0] 本研究では, 自己アテンション, フィードフォワードネットワーク, 残差接続を含む構造的に完全な単一層トランスの収束挙動を解析する。
残余接続はこの出力行列の不調和を改善するのに役立ち、これはソフトマックス演算によって課される低ランク構造から生じる問題である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:56:37 GMT)
Learning Efficient and Generalizable Human Representation with Human Gaussian Model [25.9] 本稿では,予測されたガウスと人間のSMPLメッシュの接続をモデル化するために,Human Gaussian Graphを提案する。
我々は,全てのフレームからの情報を有効活用して,人間表現を復元できることを実証した。
新しいビュー合成と新しいポーズアニメーションの実験結果は,本手法の効率性と一般化を実証している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:18:59 GMT)
Understanding the Supply Chain and Risks of Large Language Model Applications [25.6] 本稿では,LLM(Large Language Models)サプライチェーンセキュリティの分析とベンチマークを行うための,最初の包括的なデータセットを紹介する。
実世界のLLMアプリケーション3,859件を収集し,相互依存解析を行い,109,211モデル,2,474データセット,9,862ライブラリを同定した。
以上の結果から,LLMアプリケーションへの依存性が深く,サプライチェーン全体の重大な脆弱性が指摘され,包括的セキュリティ分析の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:30:54 GMT)
Position: An Empirically Grounded Identifiability Theory Will Accelerate Self-Supervised Learning Research [25.6] 自己監視学習(SSL)は多くの現在のAIシステムを動かしている。
SSLのプラトン的見解は、異なる方法や工学的アプローチにもかかわらず、すべての表現は同じプラトン的イデアルに収束することを示唆している。
我々は Identifiability Theory (IT) を Singular Identifiability Theory (SITh) と呼ぶものに拡張することを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:53:07 GMT)
Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion [25.5] 拡散モデルが3次元LiDARシーン完了に適用された。
本稿では,ScoreLiDARと呼ばれる3次元Li-DARシーン完了モデルに適した蒸留法を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:55:16 GMT)
Masked Autoencoders that Feel the Heart: Unveiling Simplicity Bias for ECG Analyses [24.0] 単純性バイアス(Simplicity Bias, SB)として知られる細粒度だが臨床的に重要な手がかりを見越して, 支配的かつ反復的なパターンに適合する傾向を示した。
本稿では,1)ECG信号の動的特性を反映した時間周波数特性を捉えるための時間周波数対応フィルタと,2)2つの領域をまたいだ粗い表現学習のための多言語プロトタイプ再構成と,さらにSBを緩和する手法を提案する。
6つのECGデータセットにまたがる3つの下流タスクの実験により,本手法がSBを効果的に低減し,最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:31:13 GMT)
Enhancing Transformation from Natural Language to Signal Temporal Logic Using LLMs with Diverse External Knowledge [23.5] STL-Diversity-Enhanced (STL-DivEn) と呼ばれるNL-STLデータセットを提案する。
データセットを開発するために、まず手動でNL-STLペアの小さなシードセットを作成する。
代表的な例はクラスタリングを通じて識別され、大きな言語モデルをガイドするために使用される。
最後に、厳密なルールベースのフィルタと人間の検証によって、多様性と精度が保証される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:02:40 GMT)
Diffuse and Disperse: Image Generation with Representation Regularization [23.4] 拡散に基づく生成モデルを効果的に改善するプラグイン・アンド・プレイ・レギュレータである textitDispersive Loss を提案する。
我々の損失関数は、内部表現が、対照的な自己教師付き学習に類似した隠れ空間に分散することを奨励する。
最近の表現アライメント法(REPA)と比較して、我々のアプローチは自己完結型で最小限であり、事前学習も追加パラメータも外部データも必要としない。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:55:00 GMT)
TeEFusion: Blending Text Embeddings to Distill Classifier-Free Guidance [23.4] テキスト埋め込みに誘導の大きさを直接組み込む,新規で効率的な蒸留法TeEFusionを紹介する。
線形演算を使って条件付きおよび条件なしのテキスト埋め込みを融合することにより、TeEFusionは余分なパラメータを追加することなく、望ましいガイダンスを再構築する。
SD3のような最先端モデルを用いた実験により,本手法により,よりシンプルで効率的なサンプリング戦略で,教師のパフォーマンスを忠実に再現できることが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:45:40 GMT)
Parameter-Efficient Fine-Tuning of 3D DDPM for MRI Image Generation Using Tensor Networks [23.3] 3次元U-Netを用いた拡散確率モデル(DDPM)におけるパラメータ効率細調整(PEFT)の課題に対処する。
本研究では,3次元畳み込みバックボーンを有するDDPMを微調整するための新しいPEFT手法であるTenVOOを提案する。
この結果から, マルチスケール類似度指標(MS-SSIM)において, TenVOO が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:51:51 GMT)
TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation [23.2] 視覚的自己回帰(VAR)モデルのための、最初の一般的なテスト時間スケーリングフレームワークを提示する。
クラスタリングに基づく多様性探索と再サンプリングに基づく潜在的選択を提案する。
強力なVARモデルであるInfinityの実験は、注目すべき8.7%のGenEvalスコアの改善を示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:04:55 GMT)
Advances in 4D Generation: A Survey [23.0] 4D生成により、インタラクティブで没入的な体験がより豊かになる。
急速な進歩にもかかわらず、この分野には4D表現、生成フレームワーク、基本的なパラダイム、それに直面する中核的な技術的課題の統一的な理解が欠けている。
この調査は、4D世代環境の体系的かつ詳細なレビューを提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:45:53 GMT)
How do language models learn facts? Dynamics, curricula and hallucinations [22.7] 大規模言語モデルは事前学習中に膨大な知識を蓄積するが、この買収を統括する力学はいまだに理解されていない。
本研究は,人工的事実記憶課題における言語モデルの学習力学について検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:04:20 GMT)
YATE: The Role of Test Repair in LLM-Based Unit Test Generation [22.7] 本稿では,ルールベースの静的解析と再試行を組み合わせることで,これらの不正なテストのいくつかを修復する手法を提案する。
このシンプルなアプローチであるYATEを、6つのオープンソースプロジェクトのセットで評価する。
YATEは22%のラインカバレッジ、20%のブランチカバレッジ、20%のミュータントを同等のコストで削減する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:32:31 GMT)
Compositional Coordination for Multi-Robot Teams with Large Language Models [22.4] LAN2CBは、自然言語(NL)のミッション記述をマルチロボットシステムのためのPythonコードに変換する。
シミュレーションおよび実環境における実験により、LAN2CBは自然言語からの堅牢で柔軟なマルチロボット協調を可能にすることが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:25:12 GMT)
An Empirical Study on Virtual Reality Software Security Weaknesses [21.9] 本研究では,GitHub上でホストされている334のVRプロジェクトを調査し,1,681のソフトウェアセキュリティ脆弱性を調査した。
パブリックデータベース(National Vulnerability DatabaseやNVDなど)におけるVRソフトウェアセキュリティの弱点が限られているため、私たちはVRソフトウェアセキュリティの弱点に関する最初の体系的なデータセットを準備している。
たとえば、(i)VRの弱点はユーザーインターフェイスの弱点に強く影響され、(ii)VR開発ツールはVRアプリケーションよりも高いセキュリティリスクをもたらす;(iii)VRのセキュリティの弱点はVRソフトウェア誕生時にしばしば導入される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:05:47 GMT)
Unisoma: A Unified Transformer-based Solver for Multi-Solid Systems [21.7] 構造化モジュールによる固体変形に影響を及ぼす要因を組み込んだ,新しい明示的モデリングパラダイムを導入する。
具体的には,ソリッドの可変数の処理が可能な統一かつ柔軟なトランスフォーマーモデルであるUnisomaを提案する。
暗黙的なモデリング手法と比較して、明示的なモデリングは多様な結合パターンを持つマルチソリッドシステムに適している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:14:16 GMT)
PDB-Eval: An Evaluation of Large Multimodal Models for Description and Explanation of Personalized Driving Behavior [21.5] 本稿では、パーソナライズドドライバ動作の詳細な理解のためのベンチマークであるPDB-Evalを紹介する。
私たちのベンチマークは、PDB-XとPDB-QAの2つの主要コンポーネントで構成されています。
詳細な説明や説明に関する微調整MLLMは、MLLMと駆動領域のギャップを効果的に埋めることができる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:33:06 GMT)
NeuralDB: Scaling Knowledge Editing in LLMs to 100,000 Facts with Neural KV Database [21.3] 我々は,非線形ゲート付き検索モジュールを備えたニューラルKVデータベースとして,編集事実を表す編集フレームワークであるNeuralDBを提案する。
ZsREとCounterFactsデータセットで1万件の事実の編集を含む総合的な実験を行った。
結果は、NeuralDBが編集効率、一般化、特異性、流用性、一貫性に優れるだけでなく、6つの代表的なテキスト理解および生成タスク全体のパフォーマンスも維持していることを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:00:09 GMT)
HumanMaterial: Human Material Estimation from a Single Image via Progressive Training [20.6] フルボディのヒューマン逆レンダリングは、任意の照明下で写真リアルなレンダリングを実現するために高品質な材料を取得することを目的としている。
以前の研究は、トレーニング用の素材データセットを構築することでこの問題を緩和したが、その単純化された材料データとレンダリング方程式は、レンダリング結果に制限されたリアリズム、特に皮膚のレンダリング結果をもたらす。
我々は,スキャンした実データと統計資料データに基づいて,高品質なデータセット(OpenHumanBRDF)を構築した。
正常な拡散アルベド, 粗さ, 特異アルベドに加えて, 特に皮膚において, レンダリング結果の現実性を高めるために, 変位および地下散乱を生じさせる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:59:42 GMT)
Towards Greater Leverage: Scaling Laws for Efficient Mixture-of-Experts Language Models [20.4] 本稿では,高密度等価量上でのMoEモデルの計算優位性を定量化する指標として,レバレッジ効率(EL)を紹介する。
ELは、予測可能な電力法に従って、専門家のアクティベーション比と総計算予算によって駆動される。
我々はこれらの発見を統合スケーリング法則に統合し、その構成に基づいてMoEアーキテクチャのELを正確に予測する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:27:09 GMT)
Less is More: Adaptive Coverage for Synthetic Training Data [20.1] 本研究では,最大カバレッジ問題に基づく新しいサンプリングアルゴリズムを導入し,合成されたデータセットから代表サブセットを選択する。
この結果から,この文脈的にサンプリングされたサブセット上での分類器のトレーニングは,データセット全体のトレーニングよりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:36:49 GMT)
On the Structure and Semantics of Identifier Names Containing Closed Syntactic Category Words [19.9] 本稿では,文法パターンの概念を拡張した識別子名の言語構造について検討する。
特定の焦点はクローズドな構文カテゴリーであり、ソフトウェア工学で研究されることはめったにない。
閉圏文法パターンとプログラムの振る舞いの関係を、基底理論に着想を得た符号化、統計、パターン分析を用いて解析する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:44:52 GMT)
Fixing the Pitfalls of Probabilistic Time-Series Forecasting Evaluation by Kernel Quadrature [19.7] 最も広く使われている測度である連続ランク確率スコア(CRPS)は、厳密に適切なスコア関数である。
CRPS推定器に固有の推定バイアスが認められた。
本稿では,非バイアスのCRPS推定器を活用するカーネル・クアチュア・アプローチを導入し,計算のスケーラブル化にキュキュア構成を用いる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:38:00 GMT)
3D Test-time Adaptation via Graph Spectral Driven Point Shift [19.7] Graph Spectral Domain Test-Time Adaptation (GSDTTA)は、3Dポイントクラウド分類のための新しいアプローチである。
これは、グラフスペクトル領域への適応をシフトさせ、より少ないパラメータでグローバルな構造特性をキャプチャすることで、より効率的な適応を可能にする。
ベンチマークデータセットに対する実験結果とアブレーション研究により,GSDTTAの有効性が示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:18:39 GMT)
IntentVCNet: Bridging Spatio-Temporal Gaps for Intention-Oriented Controllable Video Captioning [19.5] 制御されたビデオキャプションは、カスタマイズされたユーザ意図に基づいて、ビデオ内の特定のターゲットに対するターゲット記述を生成することを目的としている。
現在のLVLM(Large Visual Language Models)は、強力な命令と視覚的理解能力を持つ。
本稿では,LVLMに固有の時間的・空間的理解を統一する新しいIntentVCNetを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:58:36 GMT)
Toward Super Agent System with Hybrid AI Routers [19.2] スーパーエージェントは、要約、コーディング、研究など、多様なユーザニーズを満たすことができる。
本稿では,ハイブリッドAIルータを用いたスーパーエージェントシステムの設計について述べる。
マルチモダリティモデルとエッジハードウェアの進歩により、ほとんどの計算はローカルで処理でき、クラウドのコラボレーションは必要なだけである、と私たちは考えています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:14:47 GMT)
VB-Mitigator: An Open-source Framework for Evaluating and Advancing Visual Bias Mitigation [19.1] VB-Mitigatorは、視覚バイアス軽減技術の開発、評価、比較分析を効率化するために設計されたオープンソースのフレームワークである。
VB-Mitigatorは、12の確立された緩和方法と7つの多様なベンチマークデータセットを含む統一された研究環境を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:20:00 GMT)
The Right to be Forgotten in Pruning: Unveil Machine Unlearning on Sparse Models [18.7] 機械学習は、訓練されたモデルから削除されたデータに関するメモリを効率的に排除し、忘れられる権利に対処することを目的としている。
本稿では,削除したデータがスパースモデルにおけるプルーンドトポロジに与える影響を実証的に確認する。
観察と忘れられる権利に動機付けられて、削除されたデータがモデルプルーニングに与える影響を排除するために、新しい用語「アンプルーニング(un-pruning)」を定義します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:13:26 GMT)
Adaptive Articulated Object Manipulation On The Fly with Foundation Model Reasoning and Part Grounding [18.5] アーティキュレートされたオブジェクトは、さまざまな操作課題をロボットにもたらす。
内部構造は直接観測できないため、ロボットは操作軌道を生成するために適応的に動作を探索し、洗練する必要がある。
AdaRPGは、基礎モデルを利用してオブジェクトを抽出する新しいフレームワークで、オブジェクト全体よりも局所的な幾何学的類似性を示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:25:58 GMT)
Scalable Frame Sampling for Video Classification: A Semi-Optimal Policy Approach with Reduced Search Space [18.5] 検索スペースを$O(TN)$から$O(TN)$に減らすという新しい視点を導入する。
O(TN)$空間全体を探索する代わりに、提案した半最適ポリシーは各フレームの独立推定値に基づいて上位の$N$フレームを選択する。
我々は, 準最適政策が, 特に実践的な条件下で, 最適政策を効率的に近似できることを確認した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:58:54 GMT)
Self-Reinforcing Prototype Evolution with Dual-Knowledge Cooperation for Semi-Supervised Lifelong Person Re-Identification [18.2] 本稿では,二知識協調フレームワーク(SPRED)を用いた自己強化型プロトタイプ開発について紹介する。
私たちの重要な革新は、動的プロトタイプガイド付き擬似ラベル生成と、新しい知識の協調的浄化の間の自己強化サイクルを確立することです。
確立されたSemi-LReIDベンチマークの実験は、SPREDが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:26:33 GMT)
A Transfer Learning-Based Method for Water Body Segmentation in Remote Sensing Imagery: A Case Study of the Zhada Tulin Area [17.9] アジア・ウォータータワーとして知られるチベット高原は、気候変動に対する高い敏感さのため、水安全保障上の大きな課題に直面している。
本研究では、SegFormerモデルを用いた2段階のトランスファー学習戦略を提案し、気候に敏感なアプリケーションのための堅牢なAIを開発する上で、ドメインシフトとデータスカーク-キーバリアを克服する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:37:18 GMT)
FrameFusion: Combining Similarity and Importance for Video Token Reduction on Large Vision Language Models [17.8] 既存のトークン削減手法は主に累積アテンションスコアなどの重要な指標に基づいたプルーーントークンである。
本稿では、類似性に基づくマージと重要度に基づくプルーニングを組み合わせた新しいトークン削減手法であるFrameFusionを提案する。
実験の結果、FrameFusionは視覚トークンを70%削減し、1.6-3.6倍のエンドツーエンドのスピードアップを実現し、平均的なパフォーマンスへの影響は3%未満である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:44:26 GMT)
Quantifying and Narrowing the Unknown: Interactive Text-to-Video Retrieval via Uncertainty Minimization [17.8] UMIVRは、Uncertainty-Minimizing Interactive Text-to-Video Retrievalフレームワークである。
3つの重要な不確実性(テキストの曖昧さ、マッピングの不確実性、フレームの不確実性)を、原則付き、トレーニング不要なメトリクスによって定量化する。
ユーザークエリを反復的に洗練し、検索のあいまいさを著しく低減します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:32:09 GMT)
Learning Temporal Abstractions via Variational Homomorphisms in Option-Induced Abstract MDPs [17.3] 大規模言語モデル(LLMs)は、明示的なChain-of-Thoughtプロンプトを通じて、顕著な推論能力を示している。
モデルがすべてのステップに対して明示的なテキストを生成することなく、潜在空間で"考え"する、効率的で暗黙的な推論のためのフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:23:56 GMT)
Demystify Protein Generation with Hierarchical Conditional Diffusion Models [17.2] 本稿では,特定の機能によって誘導される効率的なエンド・ツー・エンドタンパク質設計のための新しい条件付き拡散モデルを提案する。
異なるレベルの表現を同時に生成することにより、我々のフレームワークは、異なるレベルの階層関係を効果的にモデル化することができる。
また,生成したタンパク質の品質を評価するため,新しい信頼性評価指標であるProtein-MMDを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:34:02 GMT)
LLM Web Dynamics: Tracing Model Collapse in a Network of LLMs [17.1] LLM Web Dynamics(LWD)は,ネットワークレベルでのモデル崩壊を効率的に調査するためのフレームワークである。
検索拡張生成(RAG)データベースを用いてインターネットをシミュレートすることにより,モデル出力の収束パターンを解析する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:08:02 GMT)
RECALLED: An Unbounded Resource Consumption Attack on Large Vision-Language Models [16.6] 大規模言語モデル(LLM)の展開に対する重大な脅威として、リソース消費攻撃(RCA)が出現している。
視覚的モーダル性を利用してRCAをリピートする最初の手法であるRECALLEDを提案する。
本研究はLVLMのセキュリティ脆弱性を明らかにし,RCAに対する今後の防衛開発を促進するためのレッドチームフレームワークを構築した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:58:16 GMT)
DCFFSNet: Deep Connectivity Feature Fusion Separation Network for Medical Image Segmentation [16.6] 医用画像分割のためのDCFFSNet(Dual-Connectivity Feature Fusion-Separation Network)を提案する。
接続機能と他の機能の間の強度を定量化し、深い接続機能融合分離アーキテクチャを構築する。
セグメンテーションの断片化を効果的に解決し、スムーズなエッジ遷移を実現する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:46:50 GMT)
DSFormer: A Dual-Scale Cross-Learning Transformer for Visual Place Recognition [16.4] 本稿では,TransformerベースのクロスラーニングモジュールであるDual-Scale-Former(DSFormer)と,革新的なブロッククラスタリング戦略を統合する新しいフレームワークを提案する。
提案手法は,ほとんどのベンチマークデータセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:29:30 GMT)
GOAT-SLM: A Spoken Language Model with Paralinguistic and Speaker Characteristic Awareness [16.3] 本稿では,パラ言語的・話者的特徴認識を備えた新しい言語モデルGOAT-SLMを紹介する。
GOAT-SLMは、言語モデリングを音響的実現から切り離すデュアルモダリティヘッドアーキテクチャを採用している。
GOAT-SLMはセマンティックタスクと非セマンティックタスクの両方でバランスよく動作し、既存のオープンソースモデルよりも感情や方言の変化、年齢に敏感なインタラクションを処理できることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:10:29 GMT)
A Deep Dive into Retrieval-Augmented Generation for Code Completion: Experience on WeChat [16.1] Retrieval-augmented Generation (RAG) は、大規模言語モデル(LLM)のコード補完能力を向上するための有望な方法として登場した。
WeChatの産業規模におけるコード補完に広く用いられているRAG法の性能について,実証的研究を行った。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:36:31 GMT)
NWaaS: Nonintrusive Watermarking as a Service for X-to-Image DNN [15.8] ディープニューラルネットワーク(DNN)モデルは、透かしによって保護される。
現在のメソッドは、モデルパラメータを変更したり、構造を変更したりするため、本質的に侵入的です。
非定義ウォーターマーキング・アズ・ア・サービス(NW)は,X-to-Imageモデル用に設計された新しい信頼できないパラダイムである。
NWは、保護されたモデルのブラックボックスAPIに堅牢で非侵入的なサイドチャネルを確立することで、デプロイメントの課題に対処する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:07:28 GMT)
TDR: Task-Decoupled Retrieval with Fine-Grained LLM Feedback for In-Context Learning [15.7] インコンテキスト学習(ICL)は、いくつかのインプット・アウトプット・サンプルに基づいてLLMが様々なタスクを扱えるようにするための古典的なアプローチとなっている。
ICLの有効性はこれらの例の質に大きく依存しており、例検索能力の向上に重点を置いた以前の研究は印象的な成果を上げている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:12:04 GMT)
Degradation-Consistent Learning via Bidirectional Diffusion for Low-Light Image Enhancement [15.6] 低照度画像強調は、劣化した画像の視認性を改善し、人間の視覚的知覚とよりよく一致させることを目的としている。
本稿では,低照度画像と通常照度画像の両方の劣化過程を共同でモデル化する双方向拡散最適化機構を提案する。
本手法は,定量評価と定性評価の両方において最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:21:23 GMT)
SAR-TEXT: A Large-Scale SAR Image-Text Dataset Built with SAR-Narrator and Progressive Transfer Learning [15.6] 我々は130,000以上のSAR画像テキストペアからなる大規模で高品質なSAR画像テキストデータセットを構築した。
SAR-Textデータセットの有効性を検証するために,3つの典型的な視覚言語タスクについて実験を行った。
SAR-RS-CLIPは検索性能を大幅に改善し、平均リコール率は16.43%向上した。
キャプションタスクにおいて、SAR-RS-CoCaは、元のCoCaモデルよりもそれぞれ8倍、4倍、10倍のBLEU-4、SPICE、CIDErスコアを達成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:45:30 GMT)
Not All Features Deserve Attention: Graph-Guided Dependency Learning for Tabular Data Generation with Language Models [15.5] 本研究では,疎依存性グラフを大規模言語モデルの注意機構に統合する新しい手法であるGraDe(Graph-Guided Dependency Learning)を提案する。
GraDeは、外部から抽出された関数依存によってガイドされる軽量な動的グラフ学習モジュールを採用し、重要機能間の相互作用を優先し、無関係なものを抑制する。
さまざまな実世界のデータセットに対する我々の実験は、GraDeが既存のLCMベースのアプローチを12%も上回っていることを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:22:27 GMT)
Towards Improving Reward Design in RL: A Reward Alignment Metric for RL Practitioners [15.3] 強化学習エージェントは、彼らが学んだ報酬関数の品質によって、基本的に制限されている。
本稿では, 人的利害関係者の軌道分布ランキングと, 与えられた報酬関数によって誘導されるものとの類似性を定量化するために, トラジェクティブアライメント係数を導入する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:27:38 GMT)
Towards Effective Human-in-the-Loop Assistive AI Agents [15.1] 本稿では,AI指導が手続き的タスクのパフォーマンスに与える影響を評価するための評価フレームワークと人間-AIインタラクションのデータセットを紹介する。
また、料理から戦場医療まで、現実世界のタスクにおけるインタラクティブなガイダンスを提供するAR搭載AIエージェントも開発しています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:50:46 GMT)
Large Language Models in Argument Mining: A Survey [15.0] Argument Mining (AM) はテキストから議論的構造を抽出することに焦点を当てている。
LLM(Large Language Models)の出現は、AMを大きく変化させ、高度な文脈内学習を可能にした。
本研究は, LLM駆動型AMの最近の進歩を体系的に合成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:27:25 GMT)
Registration beyond Points: General Affine Subspace Alignment via Geodesic Distance on Grassmann Manifold [14.4] 本論文は、剛体変換に関して、2つのグラスマン的特徴間の最適化可能なコスト関数を明示的に導出した最初のものである。
本稿では,任意のアフィン部分空間の登録問題に適用可能な変換ベースに基づく最適化可能なコスト関数を提案する。
結果として生じるコスト関数と、その拡張性は、既存の解の収束を改善したり、様々なコンピュータビジョンタスクで性能を向上するために実証されている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:28:01 GMT)
DualXDA: Towards Sparse, Efficient and Explainable Data Attribution in Large AI Models [14.1] スパースで効率的かつ説明可能なデータ属性(DualDA)とeXplainable Data属性(XDA)のためのフレームワークであるDualXDAを紹介する。
DualDAでは,AI予測のための高速で自然なデータ属性を提供するために,Support Vector Machine理論を利用した効率的かつ効果的なDAを提案する。
我々はDualDAが高い属性品質を実現し、評価された下流タスクの解決に優れ、説明時間を最大4,100,000$times$で改善できることを実証した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:23:53 GMT)
Contraction, Criticality, and Capacity: A Dynamical-Systems Perspective on Echo-State Networks [13.9] 本稿では,機能解析,ランダム・アトラクタ理論,最近の神経科学的な知見を融合した統合的動的システム治療について述べる。
まず,大域リプシッツ力学とともにエコー状態特性(初期条件の洗い出し)がフェーディングメモリ特性をもたらすことを証明した。
第二に、ストーン・ワイエルシュトラスの戦略を用いて、非線形貯水池と線形リードアウトを持つESNが、因果的、タイムイン・フェイディング・メモリ・フィルタのバナッハ空間に密着していることを示す。
第3に、メモリ容量スペクトルを用いて計算資源を定量化し、どのように示すかを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:41:18 GMT)
A Two-armed Bandit Framework for A/B Testing [13.6] A/Bテストは、政策評価と製品展開のために現代技術企業で広く使われている。
本稿では,既存手法のパワー向上を目的とした二本腕バンディットフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:05:56 GMT)
Plan for Speed: Dilated Scheduling for Masked Diffusion Language Models [13.6] マスク付き拡散言語モデルは高速で非自己回帰的なテキスト生成を約束する。
モデルの信頼性に基づいてアンマスクするトークンを選択する既存のサンプルは、複数の位置を並列にアンマスクする際のインタラクションを無視する。
DUS(Dilated Unmasking Scheduler)は、列位置を非隣接拡張群に分割し、それらを並列に分割する推論のみのプランナーフリーな手法である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:58:50 GMT)
LagKV: Lag-Relative Information of the KV Cache Tells Which Tokens Are Important [13.5] LagKVはKVの圧縮戦略であり、KV自体の直接の前方比較にのみ依存する。
メインストリーム推論プラットフォームに簡単に統合できる、完全に注意を払わないメソッドです。
我々の手法は、同じ圧縮比で、注意重みベースのメソッドであるHO$を50ドル以上で上回ります。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:25:51 GMT)
Emotion Recognition from Skeleton Data: A Comprehensive Survey [13.4] 身体の動きによる感情認識は、従来の方法に代わる魅力的でプライバシー保護の手段として現れてきた。
近年の3Dスケルトン取得技術とポーズ推定アルゴリズムは, 全身運動に基づく感情認識の実現可能性を大幅に向上させた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:58:57 GMT)
Information Entropy-Based Framework for Quantifying Tortuosity in Meibomian Gland Uneven Atrophy [13.3] 本稿では,確率モデルとエントロピー理論を統合した情報エントロピーに基づくトルティシティ定量化フレームワークを提案する。
提案手法は, 対象曲線を基準曲線と比較することにより, 対象曲線の剛性を評価する。
生物学的に妥当な基準曲線が利用できる医療データにおいて、好奇性評価タスクにはより適している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:51:10 GMT)
Outdoor Monocular SLAM with Global Scale-Consistent 3D Gaussian Pointmaps [13.3] 3D Gaussian Splatting (3DGS) は、高忠実性合成とリアルタイムな新規ビュー性能によりSLAMにおいて一般的なソリューションとなっている。
以前の3DGS SLAM法では、屋外のシーンに幾何学的な先行性がないため、追跡に微分可能なレンダリングパイプラインを使用していた。
技術的には、3DGSポイントマップに固定された自己整合性トラッキングモジュールを構築し、累積スケールドリフトを回避し、より正確でロバストなトラッキングを実現する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:21:11 GMT)
Exploring the interplay of label bias with subgroup size and separability: A case study in mammographic density classification [13.3] 本研究では,ラベルバイアスの影響を受けやすいサブグループのサイズと分離性が,ディープラーニングモデルの学習特徴と性能に与える影響について検討した。
シミュレーションされたサブグループラベルバイアスは,学習したモデルの特徴表現に顕著な変化をもたらすことがわかった。
また,クリーンラベル付き検証セットを用いてモデルの分類しきい値を定義するかによって,サブグループ性能に顕著な差異が認められた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:21:12 GMT)
System Report for CCL25-Eval Task 10: SRAG-MAV for Fine-Grained Chinese Hate Speech Recognition [13.0] タスク再構成(TR)、自己検索型生成(SRAG)、マルチラウンド累積投票(MAV)を統合した新しいSRAG-MAVフレームワークを提案する。
提案手法は, 四重項抽出タスクを3重項抽出に再構成し, 文脈的プロンプトの生成にトレーニングセットからの動的検索を用い, 投票による多ラウンド推論を適用し, 出力安定性と性能を向上させる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:56:38 GMT)
T2VWorldBench: A Benchmark for Evaluating World Knowledge in Text-to-Video Generation [12.8] T2VWorldBenchは,テキスト・ビデオ・モデルのワールド・ナレッジ生成能力を評価するための,最初の体系的評価フレームワークである。
人間の嗜好とスケーラブルな評価の両方に対処するため,我々のベンチマークでは,視覚言語モデル(VLM)を用いた人的評価と自動評価の両方を取り入れている。
オープンソースから商用モデルまで、現在利用可能な10の高度なテキスト・ビデオモデルを評価し、ほとんどのモデルが世界の知識を理解し、真に正しいビデオを生成することができないことを発見した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:37:08 GMT)
Propagating Neutral Modes in an Intervalley Coherent State [12.8] ツイストした WSe2 モワール超格子における中性モードの空間的・時間的輸送について, 新たな超高速イメージング技術を用いて検討した。
ヴァン・ホーブ特異点(VHS)付近で、中間(3.54度)と大角(5度)ツイストしたWSe2の2つの新しい伝播集合モードを発見した。
高速伝搬モードは驚くほど大きな速度で3km/sであり、IGV状態のゴールドストーンモードと一致している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:39:21 GMT)
Observing Fine-Grained Changes in Jupyter Notebooks During Development Time [12.8] 開発期間中にJupyterノートブックのコード変更を収集するためのツールセットを紹介します。
次に、データ分析タスクと機械学習タスクに関連する100時間以上の作業を収集します。
収集したデータの解析では,実行間のセルへの変更を分類し,コード修正による変更のかなりの数を確認した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:24:46 GMT)
BiECVC: Gated Diversification of Bidirectional Contexts for Learned Video Compression [12.6] 局所的・非局所的コンテキストモデリングを多用した学習双方向ビデオ圧縮(BVC)フレームワークであるBiECVCを提案する。
BiECVCは最先端のパフォーマンスを実現し、Random Access (RA) 構成下でのVTM 13.2と比較してビットレートを13.4%と15.7%削減した。
私たちの知る限り、BiECVCは、すべての標準テストデータセットでVTM 13.2を上回った最初の学習ビデオです。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:57:30 GMT)
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [12.5] 本稿では,Agensar-Fin-R1シリーズを紹介する。
我々の最適化手法は、高品質で体系的な金融タスクラベルシステムを統合する。
われわれのモデルは、主要な金融指標を総合的に評価している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:46:58 GMT)
TCM-Tongue: A Standardized Tongue Image Dataset with Pathological Annotations for AI-Assisted TCM Diagnosis [12.4] 従来の中国医学(TCM)の舌診断は、主観的解釈と一貫性のない画像プロトコルによる標準化の課題に直面している。
このギャップに対処するため、AI駆動型TCM舌診断のための最初の特別なデータセットを提示する。
このデータセットは、標準化された条件下でキャプチャされ、20の病理症状カテゴリーで注釈付けされた6,719の高品質な画像を含んでいる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:49:31 GMT)
Meta Prompting for AI Systems [12.3] 本稿では,大規模言語モデルの推論能力を高めるフレームワークであるMeta Prompting(MP)を紹介する。
我々は、LLMが独自のプロンプトを生成し、洗練する自動化プロセスであるRecursive Meta Prompting (RMP) にMPを拡張した。
我々の主張は、Qwen-72Bベースモデルが1つの例に依存しないメタプロンプトによって誘導され、最先端の結果が得られることを示す広範な実験によって検証された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:19:38 GMT)
A Concept for Efficient Scalability of Automated Driving Allowing for Technical, Legal, Cultural, and Ethical Differences [12.3] 本稿では,望まれるシステムや環境への汎用能力のスケーラブルな適応という課題に対処する。
第1段階では、特定の環境への微調整は、国固有の報酬モデルによって行われる。
第2段階では、車両固有の伝達学習がシステム適応を促進し、設計決定の検証を統制する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:51:55 GMT)
The Curious Case of Class Accuracy Imbalance in LLMs: Post-hoc Debiasing via Nonlinear Integer Programming [12.3] 大規模言語モデル(LLM)は優れた知識ベースであるが、テキスト分類における全てのクラスで同等に機能するのに苦労する。
本稿では,LLMにおけるクラス精度の不均衡の事例について考察する。
バイアス識別の難しさと再トレーニングの到達性の難しさを克服するため,出力確率のみを用いたポストホックバランスクラスの精度について検討した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 23:51:47 GMT)
Q-Former Autoencoder: A Modern Framework for Medical Anomaly Detection [12.2] 本稿では,最新のオートエンコーダベースのフレームワークであるQ-Former Autoencoderを提案する。
凍結した視覚基盤モデルを特徴抽出器として直接利用し、ドメイン固有の微調整なしでリッチで多段階な高レベル表現を可能にする。
本研究は,視覚基盤モデルエンコーダが自然画像に基づいて事前訓練され,医用画像解析タスクに効果的に応用できる可能性を強調した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:55:33 GMT)
BadReasoner: Planting Tunable Overthinking Backdoors into Large Reasoning Models for Fun or Profit [12.2] 大規模言語モデル(LRM)は人工知能の重要な進歩として現れている。
本稿では,LRMに対する未探索攻撃ベクトルを同定し,これを「過度なチューナブル」と呼ぶ。
そこで本研究では,単純なオン/オフ攻撃を超越して,攻撃者がモデルの推論冗長性の範囲を正確に制御できるような,新たな調整可能なバックドアを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:24:35 GMT)
Leveraging the Structure of Medical Data for Improved Representation Learning [12.2] 一般化可能な医療AIシステムを構築するには、データ効率とドメイン認識の事前トレーニング戦略が必要である。
本稿では,医療データセットの固有構造を利用した自己教師型フレームワークを提案する。
教師付き目標やベースラインが構造を生かさずにトレーニングされているのに比べ、強いパフォーマンスを示します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:44:31 GMT)
I-CEE: Tailoring Explanations of Image Classification Models to User Expertise [12.2] I-CEEは,ユーザエキスパートに適した画像分類記述を提供するフレームワークである。
I-CEEは、ユーザの専門知識に依存するサンプルイメージのインフォメーション性をモデル化し、異なるユーザに対して異なるサンプルを生成する。
シミュレーションされたユーザによる実験は、I-CEEがモデルの判断を正確に予測する能力を改善することを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:44:19 GMT)
ReSem3D: Refinable 3D Spatial Constraints via Fine-Grained Semantic Grounding for Generalizable Robotic Manipulation [12.1] 本稿では,意味的に多様な環境に対する統一的な操作フレームワークReSem3Dを提案する。
本稿では,ReSem3Dがゼロショット条件下で多様な操作を行い,適応性と一般化性を示すことを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:07:31 GMT)
Multimodal Behavioral Patterns Analysis with Eye-Tracking and LLM-Based Reasoning [12.1] 視線追跡データは、ユーザの認知状態に関する貴重な洞察を明らかにするが、その構造化された非言語的な性質のために分析することは困難である。
本稿では、視線追跡信号からの認知パターン抽出を促進するために、マルチモーダルな人間-AI協調フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:49:53 GMT)
A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges [11.9] 本稿では,農業における拡散モデルの適用の最近の進歩を概観する。
作物の害虫や病気の検出、リモートセンシング画像の強化、作物の成長予測、農業資源管理に重点を置いている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:52:32 GMT)
Compressed and distributed least-squares regression: convergence rates with applications to Federated Learning [11.9] 機械学習の勾配アルゴリズムに対する圧縮の影響について検討する。
いくつかの非バイアス圧縮演算子間の収束率の差を強調した。
我々はその結果を連合学習の事例にまで拡張する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:23:22 GMT)
Revisiting Physically Realizable Adversarial Object Attack against LiDAR-based Detection: Clarifying Problem Formulation and Experimental Protocols [11.8] 3次元物体検出における適応的ロバスト性は、現実世界のシナリオに広く応用されているため、重要な研究領域である。
本稿では,物理対物攻撃の鍵となる要素を抽象化する,デバイスに依存しない標準化されたフレームワークを提案する。
我々は,現実のLiDAR知覚において,攻撃の成功に影響を与える要因と,敵の堅牢性に対する高度な理解に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:37:00 GMT)
AccessGuru: Leveraging LLMs to Detect and Correct Web Accessibility Violations in HTML Code [11.1] 本稿では,Webアクセシビリティ違反をSyntactic,Semantic,Layoutの3つの重要なカテゴリに分類する新しい分類法を提案する。
本稿では,既存のアクセシビリティテストツールとLarge Language Models(LLM)を組み合わせた新しい手法であるAccessGuruを提案する。
本ベンチマークでは,構文およびレイアウトのコンプライアンスを定量化し,人間の専門家による補正との比較分析により意味的精度を判定する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:59:30 GMT)
Agentic Program Repair from Test Failures at Scale: A Neuro-symbolic approach with static analysis and test execution feedback [11.1] 我々は、さまざまなソフトウェア製品にまたがる大規模なテスト失敗に基づいて、ソースコードを修正するエンジニアリングエージェントを開発した。
静的解析とテストの失敗を通じてエージェントにフィードバックを提供し、ソリューションを洗練できるようにします。
3ヶ月の間に、生成された修正の80%がレビューされ、そのうち31.5%が着陸した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:12:32 GMT)
Personalization Toolkit: Training Free Personalization of Large Vision Language Models [11.0] LVLM(Large Vision-Language Models)のパーソナライズには、特定のユーザやオブジェクトのインスタンスを認識し、コンテキストに合わせて調整された応答を生成するためのモデルをカスタマイズする必要がある。
既存のアプローチは一般的に、ユーザやオブジェクトごとに時間を要するテスト時間のトレーニングに依存します。
本稿では,LVLMのパーソナライズに対する新たなトレーニングフリーアプローチを提案するとともに,パーソナライズタスクのさまざまな側面を厳格に評価するために設計された,包括的な実世界ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:59:57 GMT)
Information upper bounds in composite quantum systems [11.0] 量子系のパラメータ間の基本的な相関構造を解析することにより、2量子ビット系の情報上限を証明した。
我々の中核的な結論は、$n$-qubitsシステムの情報搬送能力(情報上界)は$n$-qubitsである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:36:06 GMT)
Facial Demorphing from a Single Morph Using a Latent Conditional GAN [10.9] 提案手法は,不明瞭な形態や顔のスタイルから生成した画像の変形を可能にするために,遅延空間における形態を分解する。
本手法は, 合成顔から生成した形態を学習し, 任意の形態技術を用いて実顔から生成した形態を試験する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:41:47 GMT)
An Integrated Framework of Prompt Engineering and Multidimensional Knowledge Graphs for Legal Dispute Analysis [10.0] 本研究は,多次元知識グラフと即時エンジニアリングを組み合わせることで,法的な紛争分析を改善する枠組みを提案する。
感度は9.9%-13.8%、特異度は4.8%-6.7%、引用精度は22.4%-39.7%だった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:52:51 GMT)
VideoMind: An Omni-Modal Video Dataset with Intent Grounding for Deep-Cognitive Video Understanding [9.9] VideoMindは、ディープビデオコンテンツ認識と強化されたマルチモーダル特徴表現のために設計されたビデオ中心のオムニモーダルデータセットである。
すべてのビデオとそのオーディオは、表面から深度まで進行する3つの階層層(事実、抽象、意図)にまたがって記述される。
VideoMindは、細粒度のクロスモーダルアライメントのための強力なベンチマークとして機能し、詳細なビデオ理解を必要とするフィールドを前進させる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:19:43 GMT)
RUMI: Rummaging Using Mutual Information [9.9] Rummaging Using Mutual Information (RUMI) は、ロボットのアクションシーケンスをオンラインで生成する手法である。
我々は,ロボットの到達範囲内に物体を保持するために,情報ゲインコスト関数と到達可能性コスト関数を開発する。
RUMIは、ベースライン手法と比較してシミュレーションと実タスクの両方で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:51:36 GMT)
Datasets and Recipes for Video Temporal Grounding via Reinforcement Learning [9.8] Video Temporal Groundingは、自然言語クエリが与えられたビデオに関連のある時間セグメントをローカライズすることを目的としている。
既存のアプローチは、時間的認識の制限と一般化の低さに悩まされることが多い。
教師付き微調整と強化学習を統合した2段階学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:24:01 GMT)
LLM-based Embedders for Prior Case Retrieval [9.8] 先行事例検索(英: Prior Case Search, PCR)は、最も関係のある訴訟を自動的に識別することを目的とした情報検索タスクである。
最先端のディープラーニングIR法は2つの主要な課題のため、PCRでは成功していない。
データプライバシの懸念から、利用可能なPCRデータセットのサイズは制限されることが多く、ディープラーニングベースのモデルを効果的にトレーニングすることは困難である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:36:10 GMT)
The Role of the Time-Dependent Hessian in High-Dimensional Optimization [9.5] グラディエント降下は、特に機械学習アプリケーションにおいて、荒れた風景の中でミニマを見つけるのに一般的に使用される。
ここでは,信号が失われる前に,システムが信号を回復する能力である解像位相に着目した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:06:37 GMT)
It is Giving Major Satisfaction: Why Fairness Matters for Software Practitioners [9.3] 本研究は,ソフトウェア実践者の仕事満足度に対する公正感の関連について検討する。
調査の結果,4つの公正度は全体の仕事の満足度と仕事のセキュリティに対する満足度に有意な影響を及ぼすことがわかった。
フェアネスと仕事の満足度の関係は、女性、民族的に劣る、経験の浅い実践者、仕事の制限のある者にとってより強くなっている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:28:33 GMT)
CLEAR: Error Analysis via LLM-as-a-Judge Made Easy [9.3] LLMに基づくエラー解析のための対話型オープンソースパッケージであるCLEARを紹介する。
CLEARはまずインスタンスごとのテキストフィードバックを生成し、次に一連のシステムレベルのエラー問題を生成し、それぞれの問題の有効性を定量化する。
当社のパッケージはユーザに対して,集計視覚化による包括的なエラー解析を可能にする,インタラクティブなダッシュボードも提供しています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:15:21 GMT)
Evaluating Code-Mixing in LLMs Across 18 Languages [9.2] 会話の中で言語を切り替えるコードミキシングは、自然言語処理に特有の課題を提示している。
LinCEやGLUECoSといった既存のベンチマークは、狭い言語ペアリングとタスクによって制限されている。
7つの言語ファミリーから18言語にまたがるコード混合データに対して,大規模言語モデルの性能を包括的に評価する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:24:33 GMT)
Are AI-Generated Fixes Secure? Analyzing LLM and Agent Patches on SWE-bench [9.2] 我々は,SWE-benchデータセットから2万以上の問題を用いて,LLM生成パッチの大規模セキュリティ解析を行った。
スタンドアロンのLCM(Llama 3.3)によるパッチを評価し,開発者によるパッチと比較した。
また、データのサブセットに基づいて、トップパフォーマンスのエージェントフレームワーク(OpenHands、AutoCodeRover、HoneyComb)3つによって生成されたパッチのセキュリティを評価します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:50:13 GMT)
An Efficient Sparse Fine-Tuning with Low Quantization Error via Neural Network Pruning [9.2] ニューラルネットワークプルーニングのアイデアに基づく新しいSpFTフレームワークを開発した。
提案手法は,LoRAの変種のような最先端手法の精度に適合しながら,SpFTのメモリ効率を20~50%向上することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:14:45 GMT)
Orthogonal Constrained Minimization with Tensor $\ell_{2,p}$ Regularization for HSI Denoising and Destriping [9.2] ハイパースペクトル画像(HSI)は、ガウスノイズ、デッドライン、ストライプなどのようなノイズの混合によって汚染されることが多い。
マルチスケール低ランクテンソル正規化セル_2,p$アプローチを提案する。
提案するMLTL2p法は,平均ピーク信号-雑音比や視覚的品質といった指標を用いて,性能を実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:25:42 GMT)
OpenNav: Open-World Navigation with Multimodal Large Language Models [8.4] 大型言語モデル(LLM)は強力な常識推論能力を示しており、ロボットナビゲーションと計画タスクを約束している。
ロボットが複雑な言語命令を解釈して分解し、最終的には一連の軌跡を合成して、多様なナビゲーションタスクを完備化することを目指している。
室内および屋外の両方のシーンにおいて,ハスキーロボットを用いたシステムの有効性を検証し,実世界のロバスト性と適用性を示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:05:28 GMT)
Policy Disruption in Reinforcement Learning:Adversarial Attack with Large Language Models and Critical State Identification [8.3] 強化学習(Reinforcement Learning, RL)は、ロボット工学や自律運転などの分野で大きな成功を収めている。
既存のアプローチはしばしば環境やポリシーの変更に依存し、実用性を制限する。
本稿では,環境の変化を伴わずにターゲットポリシーを誘導し,準最適動作を出力する敵攻撃手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:52:06 GMT)
The Best is Yet to Come: Graph Convolution in the Testing Phase for Multimodal Recommendation [8.3] 本稿では,マルチモーダルレコメンデーションシステムにおける学習段階におけるグラフ畳み込みネットワーク導入に伴う課題を批判的に指摘する。
我々は,テスト段階でのみグラフ畳み込みをデプロイするフレームワークであるFastMMRecを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:02:22 GMT)
Is Circuit Depth Accurate for Comparing Quantum Circuit Runtimes? [8.0] ゲート認識深度は、アーキテクチャの平均ゲート実行時間を使用して、ゲートのランタイムへのコントリビューションを重み付けます。
ゲート認識深度はタスク(1)における予測の平均相対誤差を68回と18回減少させる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:44:04 GMT)
Elucidating the Design Space of Arbitrary-Noise-Based Diffusion Models [7.9] EDAは任意ノイズに基づく拡散モデルの設計空間を解明する。
EDAはMRIバイアス場補正、CT金属加工品の削減、自然画像の影除去の3つの典型的なタスクで検証されている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:01:34 GMT)
Diffusion-FS: Multimodal Free-Space Prediction via Diffusion for Autonomous Driving [7.7] 自由空間予測は、自律運転における基本的で決定的な問題である。
最近の研究は、非障害物道路地域全体を自由空間として表現することでこの問題に対処している。
本研究の目的は,道路地域全体の航行可能なサブセットである運転回廊を推定することである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:30:55 GMT)
HybridTM: Combining Transformer and Mamba for 3D Semantic Segmentation [7.7] 3次元セマンティックセグメンテーションのためにTransformerとMambaを統合した最初のハイブリッドアーキテクチャであるHybridTMを提案する。
さらに,注意とマンバをより微細な粒度で組み合わせた内層ハイブリッド戦略を提案する。
私たちのHybridTMは、ScanNet、ScanNet200、nuScenesベンチマークで最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:48:50 GMT)
Logical Characterizations of GNNs with Mean Aggregation [7.6] 本稿では,グラフニューラルネットワーク(GNN)の集約関数の平均表現力について検討する。
非均一な設定では、そのようなGNNは比モーダル論理と全く同じ表現力を持つことを示す。
均一な設定では、MSO に対する表現力は、修正自由なモーダル論理と全く同じであることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:21:49 GMT)
DiagR1: A Vision-Language Model Trained via Reinforcement Learning for Digestive Pathology Diagnosis [7.5] 内視鏡的所見と診断結果の両方を含む大規模な消化管病理データセットを構築した。
この設計は、画像特有の特徴をよりよく捉え、生成時のセマンティック一貫性を維持するためにモデルを導く。
臨床関連度は18.7%, 構造的完全性は32.4%改善し, 診断誤差は41.2%減少した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:12:20 GMT)
Transform Before You Query: A Privacy-Preserving Approach for Vector Retrieval with Embedding Space Alignment [7.5] STEER(textbfSecure textbfTransformed textbfEmbedding vtextbfEctortextbf Retrieval)は、プライベートベクトル検索フレームワークである。
検索精度を維持しながら、クエリテキストのプライバシを保護します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:41:34 GMT)
Exploiting Gaussian Agnostic Representation Learning with Diffusion Priors for Enhanced Infrared Small Target Detection [7.4] 赤外線小目標検出(ISTD)は多くの実用化において重要な役割を担っている。
性能境界を決定するために、研究者は大規模で高価な手動ラベルデータを用いて表現学習を行う。
このアプローチは、最先端のISTDメソッドが現実世界の課題において非常に脆弱であることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:03:33 GMT)
GeoAvatar: Adaptive Geometrical Gaussian Splatting for 3D Head Avatar [7.4] 既存の手法では、ガウシアンを顔領域の様々な幾何学的偏差に適応させるのに苦労している。
適応幾何学的ガウススプティングの枠組みであるGeoAvatarを提案する。
非常に表現力のある顔の動きを持つビデオデータセットであるDynamicFaceもリリースしました。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:41:40 GMT)
A Principled Approach for Data Bias Mitigation [7.4] データバイアスに対処する新たな緩和戦略を提案する。
我々の手法は説明可能であり、数学的に正確性を保証する。
本手法を公開データセット上で評価し,その結果を理論的に分析する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:01:33 GMT)
Towards Large Scale Geostatistical Methane Monitoring with Part-based Object Detection [7.3] 本稿では,フランスにおけるバイオダイアスターのメタン生成と排出について検討する。
そこで本研究では,初期検出を促進するために,本質的なバイオダイアグラムサブ要素を考慮したパートベース手法を開発した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:33:55 GMT)
Revisiting Bisimulation Metric for Robust Representations in Reinforcement Learning [7.3] 従来の模擬検定法では,2つの問題点が指摘されている。
本稿では,報酬ギャップのより正確な定義と適応係数を持つ新しい更新演算子を特徴とするバイシミュレーション・メトリックを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:42:22 GMT)
Strain-Tunable Topological Phase Transitions in Line- and Split-Graph Flat-Band Lattices [7.1] 単一のメカニカルノブは、自明な絶縁、ディラック半金属、および全ての格子上の量子スピンハル相の間の普遍的な遷移を駆動することを示す。
この枠組みはいくつかの平らなバンド格子を産み出すが、これは文学では欠落していたり、ほとんど探索されなかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:33:03 GMT)
Central limit theorems for the eigenvalues of graph Laplacians on data clouds [7.0] 我々は、ラプラシア作用素 $Delta_n$ を、$X_n$ 上の $varepsilon$-sqrt グラフに関連付けて考える。
公式な議論は、この分散をフィッシャー・ラオ幾何学に関する適切なエネルギーの散逸として解釈することができる。
ある種の重み付きラプラス・ベルトラミ作用素の固有値推定のためのクレイマー・ラオ下界の幾何学的分散の統計的解釈
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:03:20 GMT)
A Survey of Event Causality Identification: Taxonomy, Challenges, Assessment, and Prospects [6.5] 事象因果同定(ECI)は自然言語処理(NLP)において重要な課題となっている。
この総合的な調査は、基本的な概念とモデルを体系的に調査し、体系的な分類学を開発し、多様なモデルを批判的に評価する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:53:24 GMT)
TN-AutoRCA: Benchmark Construction and Agentic Framework for Self-Improving Alarm-Based Root Cause Analysis in Telecommunication Networks [6.1] 通信ネットワークにおけるルート原因分析(RCA)は重要な課題であるが、人工知能(AI)にとって非常に困難な課題である。
通信ネットワークにおけるRCAは重要な課題だが、AIにとって非常に難しい課題だ。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:40:08 GMT)
Unsupervised Concept Drift Detection from Deep Learning Representations in Real-time [6.0] 概念ドリフトは、基礎となるデータ分布と対象領域の統計的性質が時間とともに変化する現象である。
textscDriftLensはリアルタイムなコンセプトドリフトの検出とキャラクタリゼーションのための教師なしフレームワークである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:10:45 GMT)
AI Workflow, External Validation, and Development in Eye Disease Diagnosis [5.9] AIは診断精度が保証されるが、臨床および多様な集団の検証が不十分なため、現実の応用問題に直面している。
本研究は、年齢関連黄斑変性(AMD)診断と分類重症度に関するケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:49:32 GMT)
Agentic AI framework for End-to-End Medical Data Inference [5.9] 我々は、摂取から推論まで、臨床データパイプライン全体を自動化するエージェントAIフレームワークを導入する。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:56:25 GMT)
Active Learning For Repairable Hardware Systems With Partial Coverage [5.5] 本稿では,診断カバレッジ(DC),魚情報行列(FIM),診断試験予算を組み込んだMISDP(Mised Semidefinite Program)を提案する。
文献(エントロピー)において最も広く使われているAL AFに対する提案手法の評価を行った。
提案するAFは, 6,000の実験構成において, 代替AFの中では, 平均で最多であった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:51:58 GMT)
Synthetic Data Generation for Phrase Break Prediction with Large Language Model [5.5] 大規模言語モデル(LLM)は、NLPにおけるデータ課題への対処に成功している。
合成フレーズブレークアノテーションの生成にLLMを活用する方法について検討する。
この結果から,LLMに基づく合成データ生成は,フレーズブレーク予測におけるデータ課題を効果的に軽減することが示唆された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:45:03 GMT)
Factual Inconsistencies in Multilingual Wikipedia Tables [5.4] 本研究はウィキペディアの構造化コンテンツにおける言語間不整合について検討する。
ウィキペディアの多言語記事から表を収集・調整・分析する手法を開発した。
これらの洞察は、事実検証、多言語知識の相互作用、信頼性の高いAIシステムの設計に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:46:14 GMT)
Neuromorphic Computing for Embodied Intelligence in Autonomous Systems: Current Trends, Challenges, and Future Directions [5.2] 本稿では,ニューロモルフィックアルゴリズム,専用ハードウェア,層間最適化戦略の進歩について検討する。
イベントベースの動的視覚センサと、高速で効率的な知覚を可能にする役割には、特に注意が払われる。
機械学習、ロボティクス、ニューロサイエンス、ニューロモーフィックエンジニアリングの視点を統合して、この分野の総合的な展望を提供します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:01:52 GMT)
Why Do Class-Dependent Evaluation Effects Occur with Time Series Feature Attributions? A Synthetic Data Investigation [5.1] 「クラス依存評価効果」は、摂動解析が帰属品質を確実に測定するかどうかという疑問を提起する。
複数の帰属法を用いて,摂動に基づく劣化スコアと地中真理に基づく精度評価値を比較した。
最も重要な点として、摂動に基づく実測値と基底的実測値が、クラスごとの帰属品質の矛盾した評価をしばしば得ることが挙げられる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:17:21 GMT)
An Improved ChaCha Algorithm Based on Quantum Random Number [5.1] 量子乱数、すなわち量子乱数拡張ChaCha(QRE-ChaCha)に基づく改良された変種を提案する。
具体的には、設計XORは、初期定数を量子乱数で周期的に注入し、選択した状態語に量子乱数を注入する。
現在のChaChaと比較すると、差分攻撃に対する強い抵抗を示し、統計的ランダム性を持つキーストリームを生成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:50:17 GMT)
FedSA-GCL: A Semi-Asynchronous Federated Graph Learning Framework with Personalized Aggregation and Cluster-Aware Broadcasting [5.1] Federated Graph Learning(FGL)は、複数のローカルシステムに位置する大規模サブグラフ上での協調トレーニングを可能にする分散学習パラダイムである。
本稿では,効率的な学習のための新しいClusterCast機構を通じて,クライアント間ラベル分布のばらつきとグラフトポロジ特性の両方を活用する半非同期フェデレーションフレームワークであるFedSA-GCLを提案する。
我々は,LouvainとMetisの分割アルゴリズムを用いて,複数の実世界のグラフデータセット上でFedSA-GCLを評価し,9つのベースラインと比較した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:15:07 GMT)
Factors Impacting Faculty Adoption of Project-Based Learning in Computing Education: a Survey [5.0] プロジェクトベースの学習(PjBL)は、学生のモチベーション、エンゲージメント、批判的思考、コラボレーション、問題解決スキルを高める可能性がある。
これらの利点にもかかわらず、制度的支援の不足、時間の制約、訓練機会の制限、プロジェクトの設計やソーシング、コース目標との整合化といった課題のために、教員採用は相容れないままである。
本研究は,これらの障壁を調査し,導入を成功させる戦略と資源について検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:16:29 GMT)
Recognizing and Eliciting Weakly Single Crossing Profiles on Trees [4.9] 我々は、社会的選択論において、よく研究された単交差領域の一般化である木上の弱い単交差領域について研究する。
この領域に属する好みプロファイルを認識するための時間アルゴリズムを設計する。
そこで我々は,この領域に対して,優先権が逐次的にのみアクセス可能である場合でも有効である効率的なエレケーションアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:38:22 GMT)
A Foundation Model for Massive MIMO Precoding with an Adaptive per-User Rate-Power Tradeoff [4.8] 本稿では,mMIMOプリコーディングのためのトランスフォーマーベース基礎モデルを提案する。
エネルギー消費が等しく、提案した基礎モデルのゼロショット展開はゼロ強制よりも著しく優れ、重み付き平均二乗誤差性能を8倍の複雑さでアプローチする。
我々の研究は、データの可用性とトレーニングの複雑さの課題に対処することで、DLベースのソリューションを実践的に実装することを可能にする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:10:06 GMT)
RecPS: Privacy Risk Scoring for Recommender Systems [4.8] インタラクションとユーザレベルでのプライバシリスクを測定するために,MIAベースのプライバシスコア手法であるRecPSを提案する。
RecPSインタラクションレベルスコア定義は、ディファレンシャルプライバシから動機付けられ、ユーザレベルスコアメソッドに拡張される。
重要なコンポーネントは相互作用レベルMIAメソッドRecLiRAであり、高品質なメンバシップ推定を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:46:30 GMT)
MambaNeXt-YOLO: A Hybrid State Space Model for Real-time Object Detection [4.8] YOLOシリーズモデルは、速度と精度のバランスをとることで、強力なベンチマークを設定している。
トランスフォーマーは自己アテンション機構のため、計算の複雑さが高い。
精度と効率のバランスをとる新しいオブジェクト検出フレームワークであるMambaNeXt-YOLOを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:28:09 GMT)
What does the public want their local government to hear? A data-driven case study of public comments across the state of Michigan [4.7] 本稿では,2つの側面に沿ってコメントを特徴付ける枠組みを提案する。
ミシガン州の15都市から集めた公開コメントの膨大な記録に基づいています。
そして、我々のフレームワークが、我々のデータに生ずる健全なローカルな関心事や社会的関心事を調べるのにどのように役立つかを実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:10:04 GMT)
GaussianFusionOcc: A Seamless Sensor Fusion Approach for 3D Occupancy Prediction Using 3D Gaussians [4.6] 3Dセマンティック占有予測は、自動運転の重要なタスクの1つである。
本稿では,複雑な環境下での3Dセマンティック占有度を予測する新しい手法を提案する。
セマンティックな3Dガウスアンと、革新的なセンサー融合機構を併用する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:46:38 GMT)
OpenCAMS: An Open-Source Connected and Automated Mobility Co-Simulation Platform for Advancing Next-Generation Intelligent Transportation Systems Research [4.6] OpenCAMSはオープンソースで、同期化され、共同シミュレーションフレームワークである。
SUMO、CARLA、OMNeT++の3つの最高のクラスシミュレーションツールを密に結合している。
OpenCAMSは交通安全、モビリティ、サイバーセキュリティに関する高度な研究を支援するように設計されている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:21:57 GMT)
HLSTester: Efficient Testing of Behavioral Discrepancies with LLMs for High-Level Synthesis [4.5] 高レベル合成(HLS)における行動の相違をテストする既存の方法はまだ未熟である。
本研究では,大規模言語モデル(LLM)を用いたテストフレームワークHLSTesterを提案する。
LLMの幻覚を緩和するために、オリジナルのC/C++プログラムのテストベンチを利用して、LS互換のテストベンチを生成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:26:14 GMT)
MetaSel: A Test Selection Approach for Fine-tuned DNN Models [4.5] ディープニューラルネットワーク(DNN)は、データ分散シフトによるデプロイメントの課題に直面している。
ファインチューニングは、より小さなラベル付きセットを必要とする新しいコンテキストに事前訓練されたモデルを適用する。
本稿では、ラベルなし入力からテストを選択する新しいアプローチであるMetaSelを紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:16:42 GMT)
New source, new possibilities: An exploratory study of Bluesky posts referencing scholarly articles [4.5] 本研究は,ブルースキーにおける学術論文の普及について,初めて大規模な分析を行ったものである。
我々は2024年2月から2025年4月までの72,898の学術論文を参照して、87,470件のブルースキーの投稿を収集し、分析した。
2024年11月、ブルースキーの学術的活動が急激に増加し、Xから広く学術的な変化が見られた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:31:28 GMT)
Learning Gentle Grasping Using Vision, Sound, and Touch [4.5] 本稿では,視覚的,触覚的,聴覚的信号を用いて物体を安定かつ優雅に把握・再生することを提案する。
把握時の優しさの指標として音声信号を使用し、生のビジュオ触覚入力から行動条件モデルを訓練する。
1500以上の握力試験を多指ハンドで行った実験結果から,本モデルは柔らかい握力に有用であることが判明した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:08:12 GMT)
Safeguarding RAG Pipelines with GMTP: A Gradient-based Masked Token Probability Method for Poisoned Document Detection [4.1] Masked Token Probability (GMTP) は、敵に作られた文書を検出・フィルタリングする新しい防御手法である。
GMTPは、関連する文書を保持しながら、90%以上の有毒なコンテンツを除去することができる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:58:41 GMT)
StyleAdaptedLM: Enhancing Instruction Following Models with Efficient Stylistic Transfer [4.1] StyleAdaptedLMは、スタイリスティックな特徴を命令追従モデルに効率的に転送するフレームワークである。
LoRAアダプタは、まず様々な非構造化スタイリスティックコーパスを持つベースモデルで訓練され、その後、個別の命令追従モデルとマージされる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:57:32 GMT)
Complex Frequency Fingerprint: Basic Concept and Theory [4.1] 複素周波数グリーン関数 (GF) を検出するための実験的手法として, 複素周波数指紋 (CFF) を導入する。
$omega$ が実数である実周波数 GF とは異なり、この複素周波数 GF は非エルミート系と量子多体系の両方において必要不可欠な役割を果たす。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:11:54 GMT)
On Reconstructing Training Data From Bayesian Posteriors and Trained Models [4.1] トレーニングされたパラメータでモデルの仕様を公開することにより、相手はトレーニングデータに関する情報を再構築することが可能になる。
本稿では,問題を表現するための数学的枠組みを確立すること,最大平均差分同値によって脆弱なトレーニングデータの特徴を特徴づけること,ベイジアンモデルと非ベイジアンモデルの両方でデータを再構成するためのスコアマッチングフレームワークを概説すること,の3つの主要な貢献を行う。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:49:41 GMT)
A general language model for peptide identification [4.0] PDeepPPは、事前訓練されたタンパク質言語モデルとハイブリッドトランスフォーマー-畳み込みアーキテクチャを統合する統合ディープラーニングフレームワークである。
大規模かつ正確なペプチド分析を可能にすることにより、PDeepPPは生物医学研究と疾患治療のための新しい治療標的の発見を支援している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:48:10 GMT)
ViGText: Deepfake Image Detection with Vision-Language Model Explanations and Graph Neural Networks [4.0] 本稿では、グラフベースのフレームワーク内で画像と説明を統合し、ディープフェイク検出を改善する新しいアプローチであるViGTextを紹介する。
ViGTextは、イメージをパッチに体系的に分割し、画像とテキストグラフを構築し、グラフニューラルネットワーク(GNN)を使用して分析してディープフェイクを識別する。
広範囲な実験により、ViGTextは、ユーザがカスタマイズしたディープフェイクを検出すると、一般化と顕著なパフォーマンス向上を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:04:58 GMT)
How does Chain of Thought Think? Mechanistic Interpretability of Chain-of-Thought Reasoning with Sparse Autoencoding [3.9] CoT(Chain-of- Thought)は、多段階タスクにおけるLarge Language Modelsの精度を高める。
しかし、生成された「考え」が真の内部推論過程を反映しているかどうかは未解決である。
本研究は,CoT忠実度に関する最初の特徴レベル因果研究である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:25:46 GMT)
When Retriever Meets Generator: A Joint Model for Code Comment Generation [3.7] RAGSumは、単一のCodeT5バックボーンを使用して、ヒューズ検索と生成の上に構築されている。
対照的な事前学習フェーズは、最寄りの探索のためのコード埋め込みを形作る。
最終出力を研磨するために、軽量な自己精製ループが配置される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:07:10 GMT)
A Multi-Faceted Evaluation Framework for Assessing Synthetic Data Generated by Large Language Models [3.7] 生成AIと大規模言語モデル(LLM)は、合成データを生成するための新たな道を開いた。
潜在的なメリットにもかかわらず、プライバシー漏洩に関する懸念が浮上している。
我々は,合成表データの忠実さ,有用性,およびプライバシー保護を評価するために設計されたオープンソースの評価フレームワークであるSynEvalを紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:19:19 GMT)
When Noisy Labels Meet Class Imbalance on Graphs: A Graph Augmentation Method with LLM and Pseudo Label [3.7] 本稿では,雑音ラベル付きクラス不均衡グラフのロバストノード分類を体系的に検討する。
本稿では,Large Language Model(LLM)とPseudo-labeling(Pseudo-labeling)に基づくグラフ拡張フレームワークであるGraphALPを提案する。
実験結果から,GraphALPは,ノイズラベル付きクラス不均衡グラフの最先端手法よりも優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:39:07 GMT)
Robust sensitivity control in digital pathology via tile score distribution matching [3.6] 最適輸送とMIL(Multiple Instance Learning)に基づくWSI分類モデルの感度制御のための新しいアプローチを提案する。
本手法は,少数の校正サンプルのみを用いて頑健な感度制御が可能であり,信頼性の高い計算病理システム構築のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:45:59 GMT)
Exploring the Jupyter Ecosystem: An Empirical Study of Bugs and Vulnerabilities [3.5] 本研究の目的は,Notebookエコシステムのバグと脆弱性に関する大規模な実証研究を提供することである。
我々は2つの主要なプラットフォームからノートブックの大規模なデータセットを収集し分析した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:09:21 GMT)
Deep Learning-Based Age Estimation and Gender Deep Learning-Based Age Estimation and Gender Classification for Targeted Advertisement [3.4] 本稿では, 顔画像から年齢と性別を同時分類する, 深層学習に基づく新しいアプローチを提案する。
両タスクに最適化された独自の畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
実験の結果,性別分類の精度が向上し,95%が達成され,年齢推定に5.77年を要した平均絶対誤差が得られた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:41:26 GMT)
Finite-temperature quantum topological order in three dimensions [3.3] 我々は、十分に小さいがゼロでない温度で長距離の絡み合いを示す3次元システムを特定する。
通常の3次元トーリック符号の変種であるフェルミオントーリック符号は、創発的なフェルミオン点様励起を認めている。
非零温度における位相秩序のさらなる例は、異常な2-形式対称性を持つ離散ゲージ理論によって与えられると推測する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:35:54 GMT)
Beyond Euclid: An Illustrated Guide to Modern Machine Learning with Geometric, Topological, and Algebraic Structures [3.3] 現代の機械学習は、本質的に非ユークリッド的なリッチな構造化されたデータに遭遇する。
そのような非ユークリッドデータから知識を抽出するには、より広範な数学的視点が必要である。
我々は最近の進歩を直感的な統合フレームワークに統合するグラフィカルな分類法を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:41:43 GMT)
Information Security Based on LLM Approaches: A Review [3.3] 大規模言語モデル(LLM)は、情報セキュリティの分野で幅広い応用可能性を示している。
本稿では,ニューラルネットワークとTransformerアーキテクチャに基づいて,大規模言語モデルの技術的基盤を分析する。
大規模言語モデリングの導入は,検出精度の向上とセキュリティシステムの誤警報率の低減に有効である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:09:36 GMT)
GenAI for Automotive Software Development: From Requirements to Wheels [3.3] 本稿では,GenAIを活用した自動車ソフトウェアの自動開発手法を提案する。
プロセスは要求を入力として開始し、主要な出力はシミュレーション環境のテストシナリオコードである。
弊社のアプローチは、コンプライアンスと再エンジニアリングのサイクルを短縮し、ADAS関連の機能に関して開発とテストの時間を短縮することを目的としている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:17:13 GMT)
A Study of Anatomical Priors for Deep Learning-Based Segmentation of Pheochromocytoma in Abdominal CT [3.3] 本研究は,深層学習に基づくPCCセグメンテーションを改善する構成を特定するために,解剖学的先行を体系的に評価する。
フェオクロモサイトーマの正確な3次元セグメンテーションのための11のアノテーション戦略を評価するためにnnU-Netフレームワークを使用した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:33:50 GMT)
On the Performance of Concept Probing: The Influence of the Data (Extended Version) [3.2] 概念探索は、モデルの内部表現を人間の定義した関心の概念にマッピングするために、追加の分類器を訓練することで機能する。
概念探索の研究は、主に調査対象のモデルや、探索対象のモデル自体に焦点を当てている。
本稿では,探索モデルの訓練に使用するデータが性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:18:46 GMT)
Concept Probing: Where to Find Human-Defined Concepts (Extended Version) [3.2] 本研究では,ニューラルネットワークモデルにおけるどのレイヤの表現を,人が定義した関心を持つ概念を探索する際に考慮すべきかを自動的に識別する手法を提案する。
我々は、異なるニューラルネットワークモデルとデータセットに対する徹底的な経験的分析を通じて、この結果を検証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:30:10 GMT)
Conformidade com os Requisitos Legais de Privacidade de Dados: Um Estudo sobre Técnicas de Anonimização [3.2] 本研究の目的は,匿名化手法を解析し,法的要件とデータの有効性を保証する上での有効性を評価することである。
この分析により、プライバシーとユーティリティデータのバランスを取る必要性が強調された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:31:28 GMT)
PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving [3.2] Plan from Raw Pixels (prix)は、カメラデータのみを使用して、明示的なBEV表現なしで、エンドツーエンドの自動運転アーキテクチャである。
PRIX は NavSim と nuScenes のベンチマークで最先端の性能を達成し,より大規模な多モード拡散プランナの能力に匹敵することを示す。
私たちの作業はオープンソースで、コードはhttps://maxiuw.github.io/prix.comで公開されます。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:04:42 GMT)
Vision Transformers in Precision Agriculture: A Comprehensive Survey [3.2] ビジョントランスフォーマー(ViT)は、長距離依存の処理の改善や視覚タスクのスケーラビリティ向上といった利点を提供する。
本研究は、CNNとViTの比較分析と、ハイブリッドモデルとパフォーマンス改善のレビューを含む。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:57:18 GMT)
Swin-TUNA : A Novel PEFT Approach for Accurate Food Image Segmentation [3.1] 本稿では,TUNable Adapterモジュール(Swin-TUNA)を紹介する。
マルチスケールトレーニング可能なアダプタを組み込んだPEFT法
Swin Transformerアーキテクチャ。
実験では、この手法がFoodSeg103とUECFoodPix Completeデータセットで50.56%と74.94%のmIoUを達成することを示した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:46:21 GMT)
Exploring the Impact of Instruction-Tuning on LLM's Susceptibility to Misinformation [3.0] 本研究では,大規模言語モデルが誤情報に対する感受性に与える影響について検討する。
分析の結果,命令調整型LPMはユーザによって提示された誤情報を受けやすいことがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:58:47 GMT)
Long-Short Distance Graph Neural Networks and Improved Curriculum Learning for Emotion Recognition in Conversation [3.0] 本稿では,会話における感情認識(ERC)に対する新しいマルチモーダルアプローチを提案する。
遠距離グラフニューラルネットワークと短距離グラフニューラルネットワークを構築し、遠距離および近距離発話のマルチモーダル特徴を得る。
IEMOCAPとMELDデータセットの実験結果は、我々のモデルが既存のベンチマークより優れていることを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:15:18 GMT)
Real-time analog circuit for auto-correlative weak-value amplification in the time domain [3.0] 自己相関弱値増幅(AWVA)技術は、量子パラメータ推定のための標準弱値増幅(SWVA)よりも明確な利点を示す。
我々は、AD835乗算器とNE5532演算増幅器を用いて、AWVAのリアルタイムアナログ回路を実装した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:26:40 GMT)
DR.EHR: Dense Retrieval for Electronic Health Record with Knowledge Injection and Synthetic Data [3.0] EHRは臨床実践において重要な役割を担っているが、その検索は主に意味的ギャップの問題によって困難である。
近年の高密度検索の進歩は有望なソリューションを提供するが、医療知識の不足やトレーニングコーパスのミスマッチにより、一般ドメインとバイオメディカルドメインの両方の既存のモデルは不足している。
本稿では,EHR検索に適した高密度検索モデルであるtexttDR.EHRを紹介する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:02:46 GMT)
AraTable: Benchmarking LLMs' Reasoning and Understanding of Arabic Tabular Data [3.0] AraTableは、アラビア語データに適用した場合の大規模言語モデルの推論と理解能力を評価するために設計されたベンチマークである。
AraTableは、直接質問応答、事実検証、複雑な推論など、さまざまな評価タスクで構成されている。
本稿では,自己検証機構を用いた完全自動評価フレームワークを提案し,人間の判断とほぼ同じ性能を実現する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:26:41 GMT)
Cloud gap-filling with deep learning for improved grassland monitoring [2.9] 本研究では,クラウドフリー光(Sentinel-2)観測と気象非依存(Sentinel-1)レーダデータを統合する,革新的なディープラーニング手法を提案する。
提案手法では,CNNとリカレントニューラルネットワーク(RNN)を組み合わせたハイブリッドアーキテクチャを用いて連続NDVI時系列を生成する。
我々は,生成したNDVI時系列がモーイングイベント検出の下流タスクに与える影響を評価することにより,観測継続性の重要性を示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:04:35 GMT)
MoRPI-PINN: A Physics-Informed Framework for Mobile Robot Pure Inertial Navigation [2.9] 我々は,慣性に基づく正確な移動ロボットナビゲーションのための物理インフォームドニューラルネットワークフレームワークとして,MoRPI-PINNを提案する。
実世界の実験では,他の手法と比較して85%以上の精度向上が見られた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:02:13 GMT)
Decoupling Knowledge and Reasoning in LLMs: An Exploration Using Cognitive Dual-System Theory [2.9] 大規模言語モデル(LLM)は推論中に知識と推論の両方を活用する。
本稿では,知識と推論の貢献を分離する認知帰属の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:24:52 GMT)
Compliance Brain Assistant: Conversational Agentic AI for Assisting Compliance Tasks in Enterprise Environments [2.9] Compliance Brain Assistant (CBA) は、企業環境における人員の日々のコンプライアンスタスクの効率を高めるために設計された、対話型のエージェントAIアシスタントである。
応答品質とレイテンシのバランスを良くするために,FastTrackモードとFullAgenticモードをインテリジェントに選択できるユーザクエリルータを設計する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:50:13 GMT)
Does visualization help AI understand data? [2.9] 2つの視覚言語モデルでは、生データが散布されたときに合成データセットをより正確に記述する。
私たちの結果は、人間のようにAIシステムが視覚化の恩恵を受けるという最初の証拠です。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:47:34 GMT)
A COCO-Formatted Instance-Level Dataset for Plasmodium Falciparum Detection in Giemsa-Stained Blood Smears [2.8] 我々は、オブジェクト検出トレーニングをサポートするために、COCOフォーマットの詳細なバウンディングボックスアノテーションを備えた、公開可能なNIHマラリアデータセットの強化版を提示する。
我々は,感染および非感染赤血球,および白血球を検出するために,より高速なR-CNNモデルを訓練することにより,改訂されたアノテーションを検証した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:56:18 GMT)
Machine Learning Solutions Integrated in an IoT Healthcare Platform for Heart Failure Risk Stratification [2.8] 慢性心不全(HF)の管理は、現代医療において重要な課題である。
本稿では,HFリスクのある患者を識別するための機械学習(ML)技術に基づく予測モデルを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:55:05 GMT)
Object segmentation in the wild with foundation models: application to vision assisted neuro-prostheses for upper limbs [2.8] 本研究では,多種多様な対象に対して訓練された基礎モデルを用いて,日常的な対象を含む特定のイメージを微調整することなく,対象のセグメンテーションを行うことができるかどうかを検討する。
本稿では,視線修正に基づくプロンプト生成手法を提案し,セグメンテーションシナリオにおけるセグメンション・アロシング・モデル(SAM)を導出する。
IoUセグメンテーションの品質指標は, 実世界のグラスピング・イン・ザ・ワイヤードコーパスの課題データから最大0.01ポイント向上した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:40:44 GMT)
Mechanistic Indicators of Understanding in Large Language Models [2.8] 我々は,Large Language Models (LLM) が,接続の確認に係わる理解と機能的に類似した内部構造を発達させることを論じる。
概念的理解は、モデルが潜在空間の方向として「機能」を形成し、何かの多様な表現の間のつながりを学ぶときに現れる。
第二に、状態の理解は、モデルが機能間の連続した事実的なつながりを学び、世界の変化を動的に追跡するときに現れる。
第三に、モデルが記憶された事実の集まりに頼るのをやめ、これらの事実を繋ぐ「循環」を発見すると、原則化された理解が生まれる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:23:53 GMT)
Pauli spin blockade at room temperature in double-quantum-dot tunneling through individual deep dopants in silicon [2.7] パウリスピン遮断(英: Pauli spin blockade、PSB)は、スピン依存の電荷輸送プロセスである。
PSBは半導体量子ビットを読み取るためにナノ構造中の単一スピンの基本的な研究に用いられている。
このユニークなシステムの開発は、シリコン技術に基づく室温量子技術につながる可能性がある。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:00:46 GMT)
TextSAM-EUS: Text Prompt Learning for SAM to Accurately Segment Pancreatic Tumor in Endoscopic Ultrasound [2.3] TextSAM-EUSはSegment Anything Model (SAM) のテキストによる適応であり、推論時に手動の幾何学的プロンプトを必要としない。
膵臓の公衆内視鏡超音波データベースTextSAM-EUSは82.69%のDiceと85.28%の正規化表面距離(NSD)を達成している
私たちのコードは受理時に公開されます。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:17:06 GMT)
How Well Do LLMs Predict Prerequisite Skills? Zero-Shot Comparison to Expert-Defined Concepts [2.3] 本稿では,大規模言語モデル (LLM) がゼロショット設定で前提条件のスキルを予測できるかどうかを検討する。
GPT-4, Claude 3, Gemini, LLaMA 4, Qwen2, Score, DeepSeekを含む13の最先端LCMを評価した。
以上の結果から,LLaMA4-Maverick,Claude-3-7-Sonnet,Qwen2-72Bなどのモデルが,専門家の地上真実と密接に一致した予測を生成することがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:54:45 GMT)
Identity-related Speech Suppression in Generative AI Content Moderation [2.2] 同一性に関連する音声は、他の音声よりも誤って抑圧される傾向にある。
その結果,不正確なフラグ付け行動の理由は,ステレオタイプやテキストアソシエーションに基づくアイデンティティによって異なることがわかった。
創造的なAIシステムは、創造的な作業にますます使われているので、これがアイデンティティ関連コンテンツの作成にどう影響するか、さらに注意を促します。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:32:14 GMT)
GCC-Spam: Spam Detection via GAN, Contrastive Learning, and Character Similarity Networks [2.2] 本稿では,3つのイノベーションを統合した新しいスパムテキスト検出フレームワークであるGCC-Spamを提案する。
文字類似性ネットワークは、文字難読攻撃に対する正書法と音声の特徴をキャプチャする。
対照的な学習は、スパムと通常のテキスト間の潜在空間距離を最適化することで差別性を高める。
Generative Adversarial Network (GAN)は、データ不足を軽減するために、現実的な擬似スパムサンプルを生成する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:46:28 GMT)
Gotta catch 'em all! Towards File Localisation from Issues at Large [2.2] この作業は、イシューファイルローカライゼーションデータセットを作成するためのデータパイプラインを提供する。
従来の情報検索手法を用いて,ファイルローカライゼーション問題に対するベースライン性能評価を行う。
我々は、統計分析を用いて、バグローカライゼーションコミュニティで知られているバイアスがデータセットに与える影響を調査する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:42:13 GMT)
OR-LLM-Agent: Automating Modeling and Solving of Operations Research Optimization Problems with Reasoning LLM [2.1] 自動操作研究問題解決のためのLLMを推論するAIエージェントであるOR-LLM-Agentを提案する。
エージェントは、タスクを数学的モデリング、コード生成、デバッグの3段階に分解する。
実験結果から, OR-LLM-AgentはGPT-o3, Gemini 2.5 Pro, ORLMなどの先進的な手法よりも, 少なくとも7%の精度で優れていた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:09:58 GMT)
GVCCS: A Dataset for Contrail Identification and Tracking on Visible Whole Sky Camera Sequences [2.1] 地上カメラで記録したコントラルのオープンデータセットを可視域内に提示する。
各コントラルは個別にラベル付けされ、時間とともに追跡され、そのライフサイクルを詳細に分析することができる。
また,汎視的セグメンテーションモデルを用いた反則解析のための統合ディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:57:59 GMT)
FinDPO: Financial Sentiment Analysis for Algorithmic Trading through Preference Optimization of LLMs [2.1] そこで,FinDPOについて紹介する。FinDPOは,トレーニング後の人間の嗜好のアライメントに基づく,ファイナンス固有の感情分析フレームワークである。
提案したFinDPOは、標準的な感情分類ベンチマークで最先端のパフォーマンスを達成する。
FinDPOは、毎年67%の実質的なポジティブリターンを維持し、高いリスク調整性能を維持するための、最初の感情ベースのアプローチである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:57:05 GMT)
Degradation-Agnostic Statistical Facial Feature Transformation for Blind Face Restoration in Adverse Weather Conditions [2.0] 逆の天気は画像の品質を著しく低下させ、それによって認識精度が低下する。
本稿では,局所統計的顔特徴変換 (SFFT) と劣化非依存特徴埋め込み (DAFE) の2つの重要な要素を統合した新しいGANベースのブラインドFIRフレームワークを提案する。
実験により, 従来のFIR法よりも優れた劣化非依存型SFFTモデルが得られた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:13:12 GMT)
Dissecting the Dental Lung Cancer Axis via Mendelian Randomization and Mediation Analysis [2.0] 本研究は, 2種類のメンデルランダム化法を用いて, 歯質と肺癌の因果関係について検討した。
1つの標準偏差増加は、扁平上皮癌の188.0%のリスクを伴っていた。
歯周炎には因果性は認められなかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:46:43 GMT)
On the Approximation of Stationary Processes using the ARMA Model [1.8] 我々は、ARMAモデルの転送関数表現をとり、対応する$Linfty$ノルムが有効な代替ノルムを提供することを示す。
我々は、ARMAモデルを含む定常過程のある種の部分空間が、$Linfty$ノルムの下でバナッハ代数を形成することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:00:26 GMT)
Deep Unfolding for MIMO Signal Detection [1.7] 本稿では,Wirtinger計算を用いた複素数値計算を組み込んだ深部展開型ニューラルネットワークMIMO検出器を提案する。
提案アルゴリズムは少数のトレーニング可能なパラメータしか必要とせず、簡易なトレーニングが可能である。
数値計算により,提案手法はより少ない繰り返しと少ない計算量で優れた検出性能が得られることを示した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:48:04 GMT)
Overcoming the Loss Conditioning Bottleneck in Optimization-Based PDE Solvers: A Novel Well-Conditioned Loss Function [1.6] 近年,スカラー損失関数を最小化するPDEソルバが注目されている。
このような手法は古典的反復解法よりもはるかにゆっくりと収束し、一般に非効率的とみなされる。
この研究は理論的な洞察を与え、平均二乗誤差(MSE)損失の使用に非効率性をもたらす。
重みパラメータをチューニングすることにより、制限ケースでのMSE損失を低減しつつ、元のシステムとその正規方程式の間の条件数を柔軟に変調する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:17:02 GMT)
Fast Bilateral Teleoperation and Imitation Learning Using Sensorless Force Control via Accurate Dynamics Model [1.6] この研究は、力覚フィードバックによる高速遠隔操作が、力覚のない低コストマニピュレータでも実現可能であることを示した。
本手法は,正確に同定されたマニピュレータ力学に基づいて非線形項補償,速度,外力推定を統合する。
4チャンネルの双方向制御によって収集されたデータを用いて、学習ポリシーの入力と出力の両方に力情報を統合することで、模倣学習のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:40:26 GMT)
The Moral Gap of Large Language Models [1.6] 道徳的基盤検出は、社会的言論を分析し、倫理的に整合したAIシステムの開発に不可欠である。
この研究は、ROC、PR、DET曲線解析を用いて、TwitterとRedditのデータセットにまたがる最先端のLSMと微調整されたトランスフォーマーの包括的な比較を初めて提供する。
LLMは高い偽陰性率を示し, 迅速な工学的努力にもかかわらず, 道徳的内容の体系的過小判定を行う。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:49:06 GMT)
Towards reliable use of artificial intelligence to classify otitis media using otoscopic images: Addressing bias and improving data quality [1.6] 本研究は, 定量的および定性的手法を用いて, 3つの公開耳鏡画像データセット(Chile, Ohio, USA, T"urkiye")を体系的に評価した。
定量分析の結果,チリとオハイオのデータセットには有意な偏りが認められた。
標準化されたイメージングプロトコル、多様なデータセットのインクルージョン、改善されたラベリングメソッドを通じて、これらのバイアスに対処することが不可欠である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:44:01 GMT)
Comparing Non-minimal Semantics for Disjunction in Answer Set Programming [1.6] 解答集合プログラミングにおける解答のための4つの異なる意味論を比較する。
これらの3つのアプローチ(フォーク、正当化されたモデル、DIセマンティクスの合理的な緩和)が実際に一致することを証明します。
この共通意味論は、常にプログラムの安定モデルのスーパーセットを提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:54:37 GMT)
Data Transmission over a Bosonic Arbitrarily Varying Quantum Channel [1.5] 半古典的攻撃を受けるボソニックチャネルの損失に対する明示的な容量公式を与える。
我々は、最近予想された新しい量子エントロピーパワーが、我々の容量公式にどのように関係しているかを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:01:16 GMT)
Effective Multi-Task Learning for Biomedical Named Entity Recognition [1.5] 本稿では、複数のデータセットを統合しながらネストした名前付きエンティティを処理するために設計された新しいアプローチであるSRU-NERを紹介する。
SRU-NERは、損失計算を動的に調整することでアノテーションギャップを緩和し、与えられたデータセットに存在しないエンティティタイプのペナライズ予測を回避する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:08:15 GMT)
MemoCoder: Automated Function Synthesis using LLM-Supported Agents [1.5] 我々は,過去の修正から協調的な問題解決と永続的な学習を可能にするフレームワークであるMemoCoderを提案する。
中央メンタエージェントは、繰り返し発生するエラーパターンを特定し、ハイレベルな修正戦略を精査することにより、修復プロセスを監督する。
実験の結果,MemoCoderはゼロショットプロンプトと自己修復戦略の両方を一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:23:44 GMT)
Multiscale Neural PDE Surrogates for Prediction and Downscaling: Application to Ocean Currents [1.5] 高解像度の電流データは、沿岸管理、環境モニタリング、海洋安全に不可欠である。
本研究では、偏微分方程式を解くニューラルネットワークに基づく教師付きディープラーニングフレームワークを提案する。
提案手法は, 入力解像度に関わらず, PDEをモデル化し, 任意の解を任意の解で予測することができる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:42:06 GMT)
Enhanced continuous-variable quantum key distribution protocol via adaptive signal processing [1.5] 量子鍵分布(QKD)は、セキュアな通信のための有望なアプローチを提供する。
CV-QKDは、地上繊維の損失や自由空間チャネルの大気シンチレーションといった課題によって制限されている。
本稿では,確率フィルタを用いて最適ガウス変調CV-QKD(GG02)プロトコルを超えるQKDプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:55:02 GMT)
RealDeal: Enhancing Realism and Details in Brain Image Generation via Image-to-Image Diffusion Models [1.5] この研究は、イメージ・ツー・イメージ拡散モデルとして、リアリズムの強化と詳細付加プロセスを定式化している。
本稿では,RealDealが生成した画像のノイズ分布,シャープさ,テクスチャの両面での現実性を示すための新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:04:39 GMT)
Trek-Based Parameter Identification for Linear Causal Models With Arbitrarily Structured Latent Variables [1.4] 潜在変数を持つ線形構造方程式モデルにおいて因果効果が識別可能であるかどうかを検証するための基準を開発する。
我々の新しい潜在サブグラフ基準は、因果効果の識別に十分な、純粋にグラフィカルな条件である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:10:44 GMT)
An Empirical Study of GenAI Adoption in Open-Source Game Development: Tools, Tasks, and Developer Challenges [1.4] 生成AI(GenAI)は、コンテンツ作成、ゲームプレイシミュレーション、デザインアイデアのための新しいツールを提供することで、ゲームの設計と開発方法を再構築し始めている。
GenAIが現実世界のコンテキスト、特にオープンソースコミュニティにおいて、開発者によってどのように採用されているか、という経験的な理解は限られています。
本研究の目的は、GitHub上の課題議論を分析し、GenAI技術がどのように議論され、採用され、オープンソースゲーム開発に統合されるかを検討することである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:03:12 GMT)
Origin-Destination Extraction from Large-Scale Route Search Records for Tourism Trend Analysis [1.4] この調査は3億8000万件の経路探索ログを分析し、観光地に関するオンライン検索行動を調査した。
その結果,サーチボリュームの傾向とピーク観光シーズンの期間との間には強い相関関係が認められた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:44:16 GMT)
FedVSR: Towards Model-Agnostic Federated Learning in Video Super-Resolution [1.4] ビデオスーパーレゾリューションは、空間情報と時間情報の両方を活用することで低解像度ビデオを強化することを目的としている。
我々は、VSR用に特別に設計された最初のFLフレームワークであるFedVSRを紹介する。
モデル非依存かつステートレスであり、DWTに基づく軽量な損失関数を導入し、ローカルトレーニング中の高周波の詳細をよりよく保存する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:12:39 GMT)
Neurodivergent Influenceability as a Contingent Solution to the AI Alignment Problem [1.4] AIアライメント問題は、人工知能(AI)システムが人間の価値観に従って行動することを保証することに重点を置いている。
狭義のAIからAI(Artificial General Intelligence, AGI)やスーパーインテリジェンス(Superintelligence, 超知能)への進化に伴い、制御に対する恐怖と現実的なリスクがエスカレートした。
ここでは、避けられないAIのミスアライメントを受け入れることが、競合するエージェントの動的なエコシステムを育むための緊急戦略であるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:12:59 GMT)
E.A.R.T.H.: Structuring Creative Evolution through Model Error in Generative AI [1.4] E.A.R.T.フレームワークは、モデル生成エラーを創造的資産に変換する5段階の生成パイプラインである。
Refineの段階では、クリエイティビティスコアは52.5%(1.179 to 1.898, t = -5.56, p modal, t = 0.86, p modal)増加し、最終的な出力は2.010 – 70.4%改善した。
人間の評価では、出力の60%が >=4.0 であり、比喩的なスローガンはリテラルよりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:39:19 GMT)
Pseudo-Labeling for Kernel Ridge Regression under Covariate Shift [1.4] 対象分布に対する平均2乗誤差が小さい回帰関数を,ラベルなしデータと異なる特徴分布を持つラベル付きデータに基づいて学習する。
ラベル付きデータを2つのサブセットに分割し、カーネルリッジの回帰処理を行い、候補モデルの集合と計算モデルを得る。
モデル選択に擬似ラベルを用いることで性能を著しく損なうことはないことが判明した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:59:49 GMT)
Erasure cost of a quantum process: A thermodynamic meaning of the dynamical min-entropy [1.2] 量子過程の消去(および準備)に伴う熱力学的コストについて検討する。
我々は、削減されたダイナミクスの敵の消去コストに焦点をあてる。
この洞察は熱力学、情報理論、量子計算の基本的な限界を橋渡しする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:30:32 GMT)
Certifying non-classicality and non-Gaussianity through optical parametric amplification [1.2] 光の非ガウス状態は多くの量子情報プロトコルに必須である。
我々は,光学パラメトリック増幅と従来の強度検出器を組み合わせることで,この手法を効果的に置き換えることができることを理論的,実験的に実証した。
我々は、擬似単光子状態の非ガウス性を証明することに成功した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:01:39 GMT)
Quantum Machine Learning in Precision Medicine and Drug Discovery -- A Game Changer for Tailored Treatments? [1.1] 伝統的な計算手法は、しばしば不足し、遅延し、時には非効率な診断や治療につながる。
本稿では,Quantum Computing (QC) とQuantum Machine Learning (QML) が医療に革命をもたらす可能性のある変革的進歩を提供する分野を要約する。
ソフトウェア(形式的手法)の特定,開発,検証を行う数学的手法は,QCの信頼性と正確性を高めることができることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:47:46 GMT)
Meeting Patients Where They're At: Toward the Expansion of Chaplaincy Care into Online Spiritual Care Communities [1.1] 米国ではスピリチュアルケアの必要性が高まりつつあるが、しばしば不足している、アクセスできない、誤解されている。
この学際的な研究は、スピリチュアルケアがオンライン空間にどのように拡張されるか(あるいはそうでないか)に関する基礎的な理解を深めることを目的としている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:48:58 GMT)
Exploring and Evaluating Interplays of BPpy with Deep Reinforcement Learning and Formal Methods [1.1] 本研究では,行動プログラミング (BP) と人工知能 (AI) と形式的手法 (FM) の相互作用について検討・評価する。
本稿では,PythonベースのBPの実装であるBPpyフレームワークがどのように拡張され,さまざまなFMおよびAIツールによって拡張されているかを検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:21:21 GMT)
Interact2Vec -- An efficient neural network-based model for simultaneously learning users and items embeddings in recommender systems [1.1] 本稿では,ユーザとアイテムの分散埋め込みを同時に学習するニューラルネットワークモデルを提案する。
このモデルは、自然言語処理モデルがトレーニングフェーズを最適化し、最終的な埋め込みを強化するために一般的に使用する最先端の戦略を採用している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:44:54 GMT)
ToonifyGB: StyleGAN-based Gaussian Blendshapes for 3D Stylized Head Avatars [0.9] StyleGANベースのToonifyは、顔画像のスタイリングに広く使われている。
そこで我々は,Toonifyを多種多様な3Dヘッドアバターに拡張するための効率的な2段階フレームワークToonifyGBを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:15:16 GMT)
GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface [0.9] 我々は、名前付きエンティティ認識、テキスト分類、階層的構造化データ抽出をサポートするために、元のGLiNERアーキテクチャを強化する統一フレームワークであるGLiNER2を提案する。
実験では,抽出タスクと分類タスクの競合性能を実証し,デプロイメントアクセシビリティを大幅に改善した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:11:14 GMT)
NLML-HPE: Head Pose Estimation with Limited Data via Manifold Learning [0.9] 頭部ポーズ推定(HPE)は、人間とコンピュータの相互作用や顔認識など、様々なコンピュータビジョンアプリケーションにおいて重要な役割を果たす。
非線形多様体学習による限られた訓練データを用いた頭部ポーズ推定のための新しい深層学習手法を提案する。
本手法は,顔のランドマークから物体の回転特性を正確に把握するので,限られたトレーニングデータでリアルタイムのパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:08:33 GMT)
How do Data Journalists Design Maps to Tell Stories? [0.9] 本研究は,ニュースメディアが採用する地図デザインプロセスについて,より深く理解することを目的としている。
我々は,3ヶ月にわたって発行された5つの大手ニュースメディアから,ニュース記事に使用される462件のジャーナリズムマップの大規模なコーパスを収集し,分析した。
私たちは、編集チームによる最も一般的な設計根拠と、現在のプラクティスにおける潜在的なギャップを特定しました。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:54:49 GMT)
Your ATs to Ts: MITRE ATT&CK Attack Technique to P-SSCRM Task Mapping [0.8] マッピングは、4つの独立した戦略によって作成され、合意されたアップオンマッピングを見つける。
このマッピングは、MITRE ATT&CKと他の著名な政府および業界フレームワークのマッピングでもある。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:14:00 GMT)
Exploitation Over Exploration: Unmasking the Bias in Linear Bandit Recommender Offline Evaluation [0.8] Multi-Armed Bandit (MAB)アルゴリズムは、継続的な漸進的な学習を必要とするレコメンデーションシステムで広く使われている。
本研究は、複数の線形MABの大規模なオフライン実験比較を行う。
興味深いことに、さまざまなデータセットの90%以上にわたって、厳密な線形モデルであり、探索のタイプがないため、一貫してトップレベルのパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:14:39 GMT)
Retrieving Classes of Causal Orders with Inconsistent Knowledge Bases [0.8] 大規模言語モデル(LLM)は、テキストベースのメタデータから因果的知識を抽出するための有望な代替手段として登場した。
LLMは信頼できない傾向があり、幻覚を起こす傾向があり、その限界を考慮に入れた戦略を必要とする。
本稿では,非循環型トーナメントのクラスを導出する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:38:53 GMT)
On the Complexities of Testing for Compliance with Human Oversight Requirements in AI Regulation [0.8] 人間の監視要件は、欧州AI法の中核的な要素である。
これらの課題は、社会技術AIガバナンスの将来における幅広い課題を浮き彫りにしている、と私たちは主張する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:13:15 GMT)
A PBN-RL-XAI Framework for Discovering a "Hit-and-Run" Therapeutic Strategy in Melanoma [0.8] 抗PD-1免疫療法に対する自然抵抗性はメラノーマの主要な臨床的課題である。
患者腫瘍生検の転写データを用いた動的確率的ブールネットワークモデルを構築した。
2つのタンパク質 (LOXL2) のようなリシルオキシダーゼの4段階の一時的阻害が最も有効な戦略であった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:04:13 GMT)
The Limits of Quantum Information Scrambling [0.8] 量子情報スクランブル(Quantum Information scrambling、QI-scrambling)は、量子多体システムの研究において重要な調査領域である。
この研究は、マリグラダの不等式を適用することにより、スクランブルレートの数学的上界と下界を導出する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:32:37 GMT)
Unsupervised Domain Adaptation for 3D LiDAR Semantic Segmentation Using Contrastive Learning and Multi-Model Pseudo Labeling [0.7] セグメントレベルでの教師なしのコントラスト学習は、バックボーンネットワークを事前訓練するために使用される。
多様な最先端アーキテクチャのアンサンブルを利用して、マルチモデル擬似ラベル戦略を導入する。
Semantic KITTIからラベルのないターゲットデータセットに適応する実験は、セグメンテーション精度を大幅に改善したことを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:21:43 GMT)
Magnetic Memory and Hysteresis from Quantum Transitions: Theory and Experiments on Quantum Annealers [0.7] 本稿では,2段階のZener遷移を一階のピースワイド・プロパゲータと半古典的ドメインウォール運動学で組み合わせることで,観察行動を説明する概念的枠組みを提案する。
本フレームワークは,3種類のD波アンナーから観測された密度,ループ,形状,縦方向のスイープレートスケーリング傾向を再現する。
これらの結果は、量子ボディシステムにおけるメモリ依存非平衡力学を探索するための強力なテストベッドとして、プログラマブルな量子アニールを確立する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:03:04 GMT)
Advancing the hBN Defects Database through Photophysical Characterization of Bulk hBN [0.7] 六方晶窒化ホウ素 (hBN) の量子放出体は、幅広い欠陥のために大きな注目を集めている。
hBN欠陥に関するほとんどの理論的研究は単層をシミュレートするが、これはバルク構造を計算するよりも計算的に安価である。
本研究では、hBN欠陥と励起状態光物理特性のデータベースを拡張した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:10:55 GMT)
Self-Supervised Ultrasound-Video Segmentation with Feature Prediction and 3D Localised Loss [0.6] 自己教師付き学習(SSL)は、役に立たないデータを活用して有用な表現を学習することで、有望なソリューションを提供する。
ビデオデータに対するSSLの最近の開発には、機能予測のみに基づくフレームワークであるV-JEPAが含まれている。
本稿では,V-JEPA事前トレーニング中のVT表現の局所性を改善するために,新しい3次元局所化補助タスクを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:01:02 GMT)
LingBench++: A Linguistically-Informed Benchmark and Reasoning Framework for Multi-Step and Cross-Cultural Inference with LLMs [0.6] LingBench++は、大規模言語モデル(LLM)を評価するためのベンチマークおよび推論フレームワークである。
構造化された推論トレース、ステップワイズ評価プロトコル、90以上の言語にまたがるリッチな型付けメタデータを提供する。
本稿では,外部知識源と反復推論を用いたモデルが,精度と解釈性の両方において単一パスアプローチより優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:51:13 GMT)
LMM-Det: Make Large Multimodal Models Excel in Object Detection [0.6] 本研究では,LMM-Detを提案する。LMM-Detは,大規模なマルチモーダルモデルを用いて,特定の検出モジュールを依存せずに,バニラオブジェクトの検出を行う。
具体的には,大規模なマルチモーダルモデルとオブジェクト検出が一致した場合の総合的な探索分析を行い,リコールレートが専門的検出モデルと比較して著しく低下することを明らかにする。
大規模なマルチモーダルモデルでは、余分な検出モジュールを使わずに検出能力を有する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:05:24 GMT)
Foundations for Risk Assessment of AI in Protecting Fundamental Rights [0.5] この章では、AIの質的リスクアセスメントの概念的フレームワークを紹介します。
法的コンプライアンスと基本的権利保護の複雑さに対処し、定義的バランスとデファシブルな推論を反復する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:52:22 GMT)
Actively evaluating and learning the distinctions that matter: Vaccine safety signal detection from emergency triage notes [0.5] 新型コロナウイルス(COVID-19)ワクチンは、世界社会が感染症に対処する能力を誇示している。
臨床治験における安全データ収集の窓が限られており、早期の実施により、ライセンス後監視システムの必要性が高まっている。
本研究は、自然言語処理技術とアクティブラーニングを用いて、緊急部署のノートからワクチンの安全性問題を検出する分類器を迅速に開発することを目的とする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:18:34 GMT)
A comparison of stretched-grid and limited-area modelling for data-driven regional weather forecasting [0.5] 限界領域モデル (LAM) とストレッチグリッドモデル (SGM) は高分解能な地域予測を生成するために出現している。
本研究の目的は,モデル設計の違いが相対的な性能と潜在的な応用に与える影響を理解することである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:54:08 GMT)
Enhancing Scene Transition Awareness in Video Generation via Post-Training [0.4] 我々は,複数のシーン遷移を伴う前処理ビデオクリップからなるtextbfTransition-Aware Videoデータセットを提案する。
実験の結果,textbfTAVデータセットのポストトレーニングにより,プロンプトベースのシーン遷移理解が向上し,必要なシーンと生成されたシーンのギャップが狭まり,画質が維持されることがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 02:50:26 GMT)
Predictive Scaling Laws for Efficient GRPO Training of Large Reasoning Models [0.4] 本稿では,動的トレーニングをモデル化し,資源利用の最適化を支援する予測フレームワークを提案する。
モデルサイズ,初期性能,トレーニング進捗に基づく経験的スケーリング法則を導出する。
特定のエポック数を超えるトレーニングでは、ほとんど利益が得られず、早い段階で停止することで、パフォーマンスを犠牲にすることなく計算を大幅に削減できることが示唆されている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:09:25 GMT)
Explicit noise and dissipation operators for quantum stochastic thermodynamics [0.4] 熱雑音を伴う量子散逸の厳密な定式化は、現在も活発な研究のトピックである。
古典的熱力学と量子マスター方程式の形式的対応性を確立する。
量子レベルでの熱雑音は多次元の幾何量子化過程として現れることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:31:19 GMT)
LLM-D12: A Dual-Dimensional Scale of Instrumental and Relational Dependencies on Large Language Models [0.3] 人々が大規模言語モデル(LLM)とどのように相互作用するかを理解することへの関心が高まっている。
LLM-D12(LLM-D12)とよばれるLCM依存度を測定する新しい12項目アンケートを開発し,その妥当性を検証した。
このスケールは、著者の以前の理論的研究に基づいており、それに応じてアイテムが開発され、イギリスで526人の参加者から回答が集められた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:00:31 GMT)
Digital Twin Simulations Toolbox of the Nitrogen-Vacancy Center in Diamond [0.3] この研究は、一般的な実験条件下でのパルス列における窒素空孔(NV)スピンダイナミクスをシミュレートするPythonソフトウェアを開発した。
このライブラリーは電磁パルスやその他の環境入力を扱い、システムの時間進化力学を解くのに使用される。
全体として、このデジタルツインはNVスピンダイナミクスの堅牢で詳細な数値モデリングを提供し、シンプルでアクセスしやすい使い勝手を持ち、広範囲の応用範囲を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:22:23 GMT)
Exact steady state of quantum van der Pol oscillator: critical phenomena and enhanced metrology [0.3] 定常状態特性の急激な変化を伴う散逸相転移に対応する閾値を示す。
臨界挙動と有限サイズ効果は解析的定常状態を通して研究される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:00:16 GMT)
Learning from Hard Labels with Additional Supervision on Non-Hard-Labeled Classes [0.3] 付加的な監督の不可欠な要素は、非ハードラベルクラスにおける分布の情報であることを示す。
我々は,我々の理論に基づいて,追加の監督を設計することで,分類精度が向上することが実験的に実証された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:19:07 GMT)
SCOPE: Stochastic and Counterbiased Option Placement for Evaluating Large Language Models [0.3] 大規模言語モデル(LLM)は、選択肢の位置やラベルに固有のバイアスを生かして、複数の選択タスクの膨らませたスコアを達成できる。
本研究では,データセットに依存しない方法で選択バイアスを計測・緩和するSCOPEを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:28:17 GMT)
Multipath Interference Suppression in Indirect Time-of-Flight Imaging via a Novel Compressed Sensing Framework [0.3] Indirect Time-of-Flight (iToF) システムの深度再構成精度とマルチターゲット分離能力を向上させるための新しい圧縮センシング手法を提案する。
本手法は単一変調周波数で動作し,複数位相シフトと狭周期連続波を用いたセンシング行列を構成する。
提案手法は,ハードウェアの変更を加えることなく,復元精度と堅牢性の両方において従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:54:27 GMT)
Zero-shot OCR Accuracy of Low-Resourced Languages: A Comparative Analysis on Sinhala and Tamil [0.3] 本研究では,2つの低リソース言語(LRL)上での6つのOCRエンジンのゼロショット性能の比較分析を行った。
選択されたエンジンには、各カテゴリの強度を評価することを目的とした、商用およびオープンソース両方のシステムが含まれている。
Cloud Vision API、Surya、Document AI、TesseractはSinhalaとTamilで評価され、Subasa OCRとEasyOCRは制限のために1つの言語で検査された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:08:43 GMT)
Entanglement-based quantum key distribution with non-Gaussian continuous variables [0.3] 絡み合った状態に光子を加える手法について述べる。
秘密鍵レートの増加と、鍵を配布する際の最大距離について示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:30:29 GMT)
Integrating Evidence into the Design of XAI and AI-based Decision Support Systems: A Means-End Framework for End-users in Construction [0.2] 本稿では,XAI対応DSSを設計するための理論的,エビデンスに基づくエンドフレームワークを提案する。
それはAIが生成した説明をサポートするさまざまな種類の証拠の強さ、関連性、有用性を評価することに焦点を当てている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:11:52 GMT)
The AlphaPhysics Term Rewriting System for Marking Algebraic Expressions in Physics Exams [0.2] 本稿では,物理検査を自動的にマークする手法を提案する。
マーキング問題は、基底真理解に対する正当性について、型付き学生回答を評価することである。
我々は,2023年のオーストラリア物理学オリンピックで,1500人以上の学生の受験結果の豊富なプールにおいて,本システムの評価を行った。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:08:49 GMT)
FMI Meets SystemC: A Framework for Cross-Tool Virtual Prototyping [0.2] 物理ハードウェアを必要とせずにソフトウェアを開発するためには、フルシステムシミュレータが一般的に使用される。
SystemCにはネイティブなFMIサポートがないため、より広い共ミュレーション環境への統合が制限されている。
本稿では,FMIを用いてSystemCベースのVPを制御・操作するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:11:47 GMT)
SuperARC: An Agnostic Test for Narrow, General, and Super Intelligence Based On the Principles of Recursive Compression and Algorithmic Probability [0.1] アルゴリズムの確率を基礎としたオープンエンドテストを導入する。
これはフロンティアモデルの定量的評価においてベンチマーク汚染を避けることができる。
圧縮はシステムの予測力と等価であり、直接的に比例することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:40:47 GMT)
A 3D Cross-modal Keypoint Descriptor for MR-US Matching and Registration [0.1] 術前MRIへのリアルタイム超音波の術中登録は未解決の課題である。
我々はMRI-iUSマッチングと登録のための新しい3Dクロスモーダルキーポイント記述子を提案する。
本手法は, 術前MRIから合成iUS量を生成する患者固有のマッチング・バイ・シンセシス法を用いている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:19:08 GMT)
What Makes You CLIC: Detection of Croatian Clickbait Headlines [0.0] 本稿では,20年間にわたるクロアチアのニュースヘッドラインのクリックベイト検出のための新しいデータセットについて述べる。
このタスクでBERTi'cモデルを微調整し、その性能をLLMベースのICL法とクロアチア語と英語のプロンプトと比較する。
分析した見出しの半分近くはクリックベイトが含まれており、微調整されたモデルの方が一般的なLCMよりも良い結果をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:10:17 GMT)
Wavefunctions and oscillator strengths of Rydberg excitons in cuprous oxide quantum wells [0.0] 酸化銅量子井戸におけるリドベルク励起子の固有状態、すなわち波動関数について検討する。
状態の対称性と波動関数の非分離性について説明する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:54:45 GMT)
Urban Green Governance: IoT-Driven Management and Enhancement of Urban Green Spaces in Campobasso [0.0] カンポバッソ市のスマートグリーンシティのユースケースは、グリーン都市部の持続可能な管理のための革新的なモデルである。
このプロジェクトはIoTシステムとデータ駆動型ガバナンスプラットフォームを統合し、木や緑地の健康状態のリアルタイム監視を可能にする。
クラウドベースのプラットフォームは、グリーンアーバンマネージャ、技術専門家、運用スタッフのための総合的なリアルタイム意思決定をサポートする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:45:04 GMT)
Unconventional Thermalization of a Localized Chain Interacting with an Ergodic Bath [0.0] 相互作用するアンダーソン量子太陽モデルを導入し、従来の期待から大きく逸脱する。
標準的な局部的およびエルゴード的な位相に加えて,中間スペクトル統計と共存する体積法的な絡み合いを示す機構を同定する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:46:06 GMT)
To be or not to be, but where? [0.0] 量子力学における物理サブシステムの同定は、古典力学と比較して概念的な問題を引き起こす。
共変線型化量子重力はゲージ不変局所代数の形成を阻止することによってこの枠組みを妨害する。
古典と量子システムの識別は固定ではなく進化し、単一世界のユニタリ量子力学の可能性を開くべきである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:56:01 GMT)
Three-qubit encoding in ytterbium-171 atoms for simulating 1+1D QCD [0.0] 我々は中性原子量子プロセッサの個々のイッテルビウム-171原子中に3つの量子ビットを符号化する。
2つの原子が真空持続振動と弦破壊の両方をシミュレートするのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:04:51 GMT)
Three-flavor neutrino oscillations using the Phase Space Approach [0.0] 位相空間近似(PSA)アプローチは、8つのニュートリノの正確な解に対して有効に検証される。
PSAは、多種多様で予測的で、容易に並列化可能なアプローチで、3つのフレーバー問題に対処する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:55:37 GMT)
The hidden subgroup problem for infinite groups [0.0] HSP は有理数の加法群と非アーベル自由群の正規部分群に対して NP-ハードであることを示す。
HSPのShorKitevアルゴリズムを標準クエリコストで$mathbbZk$で一般化する。
したがって、任意の有限生成アーベル群の HSP もまた指数時間アルゴリズムを拡張している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:16:20 GMT)
The Price equation reveals a universal force-metric-bias law of algorithmic learning and natural selection [0.0] プライス方程式による変化の単純な記法分割は、普遍力計量バイアス(FMB)法則を明らかにすることを示す。
FMB法は、規律を越えて学習アルゴリズムを理解し、比較し、設計するための原則化された基盤を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:13:56 GMT)
Tell Me What You See: An Iterative Deep Learning Framework for Image Captioning [0.0] 本稿では,基礎画像キャプションモデルの体系的かつ反復的な展開について述べる。
Genesisから始まり、Nexusで終了する5つのモデルを提示する。
我々の実験は、アーキテクチャ拡張の影響をグラフ化し、古典的なCNN-LSTMパラダイムにおける重要な発見を実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:20:44 GMT)
Statistical Runtime Verification for LLMs via Robustness Estimation [0.0] ランタイムクリティカルなアプリケーションにLLM(Large Language Models)を安全にデプロイするためには、逆の堅牢性検証が不可欠である。
ブラックボックス配置環境におけるLCMのオンライン実行時ロバスト性モニタとしての可能性を評価するために,RoMA統計検証フレームワークを適応・拡張するケーススタディを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:03:09 GMT)
State of Health Estimation of Batteries Using a Time-Informed Dynamic Sequence-Inverted Transformer [0.0] 電池はエネルギー貯蔵システムの効率と安全性において中心的な役割を担っているが、充電サイクルが繰り返されているため、必然的に時間の経過とともに劣化する。
したがって、運用上の信頼性と安全性を確保するためには、バッテリーの状態(SoH)の正確な推定が不可欠である。
我々は新しいアーキテクチャを提案する: Time-Informed Dynamic Sequence Inverted Transformer (TIDSIT)
NASAのバッテリー劣化データセットの実験結果によると、TIDSITは既存のモデルを大幅に上回り、予測誤差を50%以上削減し、SoH予測誤差を0.58%以下に維持している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:43:46 GMT)
Spin current compensation from competing magnon modes in ferrimagnets [0.0] 反強磁性体は右利きのマグノンモードと左利きのマグノンモードの両方をサポートしている。
左利きモードと右利きモードの競合は、補償温度をもたらす。
モード分解されたスピン輸送の重要な特徴は、単純化され分析的に透明なモデルによって捉えることができる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:49:50 GMT)
SCORE-SET: A dataset of GuitarPro files for Music Phrase Generation and Sequence Learning [0.0] このデータセットは、MAESTROとGiantMIDIのMIDIノートから派生したもので、リズムギターのトラックに適合している。
これらのトラックは、曲げ、スライド、ビブラート、パームミューティングなど、ギター演奏に典型的な様々な表現設定を含むように処理される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:13:12 GMT)
Role of Nonstabilizerness in Quantum Optimization [0.0] 量子近似最適化アルゴリズム(QAOA)の資源要件について検討する。
最終解状態へのアプローチにおいて,QAOAの非安定化剤性は,回路深さが最大に達する前に増加し,再び低下することを示す。
簡単な再スケーリングの下で崩壊する異なる深さに対応する曲線を見つけ、最終的な非安定度と成功確率との間には非自明な関係を明らかにする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:37:26 GMT)
Restoring Rhythm: Punctuation Restoration Using Transformer Models for Bangla, a Low-Resource Language [0.0] 分岐復元は、Banglaのような低リソース言語における自動音声認識タスクに不可欠である。
本研究では,変圧器を用いたモデル,具体的にはXLM-RoBERTa-largeを用いて,不動Banglaテキストの句読点を自動的に復元する方法について検討する。
我々の最高の性能モデルは、α = 0.20%の増進係数で訓練され、Newsテストセットで97.1%の精度を達成する。
その結果、参照とASRの書き起こしに対する強い一般化が示され、実世界のノイズの多いシナリオにおけるモデルの有効性が示される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:33:13 GMT)
Relaxation Dynamics in Atomic-Molecular Bose Condensates in the Presence of Gaussian Noise [0.0] ホワイトノイズの存在下でのFeshbachデチューニングにより結合した原子および分子ボソンのダイナミクスについて検討した。
両種間の個体群不均衡の時間進化と系統のコヒーレンスを解析した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:10:06 GMT)
Recommender systems, representativeness, and online music: A psychosocial analysis of Italian listeners [0.0] レコメンダシステムは、オンラインプラットフォームで広く採用されているため、世界中の音楽聴取を形作っている。
これらのシステムが引き起こす表現的害に関する関心が高まっていることは、今日では科学と公共の議論の一部となっている。
本研究は, 表現障害に対処するための学際研究の必要性と, 信頼性の高い推薦システム開発におけるアルゴリズム意識とデジタルリテラシーの役割を明らかにするものである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:10:29 GMT)
Recommendations to overcome language barriers in the Vera C. Rubin Observatory Research Ecosystem [0.0] 報告では、ヴェラ・C・ルービン天文台の研究生態系における言語障壁を減らすことを推奨している。
科学における英語のヘゲモニーは、参加と生産性を制限している。
マルチ言語によるプレゼンテーション形式、学術的な執筆訓練、仮想筆記センター、言語サポートプログラム、筆記辞退など。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:34:26 GMT)
Reasoning Beyond the Obvious: Evaluating Divergent and Convergent Thinking in LLMs for Financial Scenarios [0.0] ConDiFi(コンディフィ、ConDiFi)は、金融業務におけるLLMにおける分散思考と収束思考を共同で評価するベンチマークである。
GPT-4oはノベルティとアクションビリティに劣り、DeepSeek-R1やCohere Command R+のようなモデルは、投資決定に適した行動可能な洞察を生み出すトップにランクインしている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:47:29 GMT)
Reality Proxy: Fluid Interactions with Real-World Objects in MR via Abstract Representations [0.0] 本稿では,対話対象を物理オブジェクトからプロキシに切り替えるシステムであるReal Proxyを紹介する。
基本的な選択を容易にするだけでなく、Real ProxyはAIを使用して、対応する物理オブジェクトのセマンティック属性と階層的な空間的関係でプロキシを豊かにする。
本稿では,オフィス情報検索,大規模空間ナビゲーション,マルチドローン制御など,さまざまなシナリオにまたがる現実的プロキシの汎用性を実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:13:36 GMT)
Real-Time Object Detection and Classification using YOLO for Edge FPGAs [0.0] 本稿では,FPGA 展開に最適化された YOLOv5 に基づく資源効率の高いリアルタイムオブジェクト検出・分類システムを提案する。
実験の結果,電力消費3.5W,処理速度9fps/秒(FPS)の分類精度が99%であった。
これらの知見は,エッジコンピューティングアプリケーションにおいて,リアルタイムかつ資源効率の高いオブジェクト検出と分類を可能にする手法の有効性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:17:37 GMT)
Proceedings 19th International Workshop on the ACL2 Theorem Prover and Its Applications [0.0] ACL2ワークショップシリーズは、ACL2定理証明システムの利用者のための主要な技術フォーラムである。
ACL2(ACL2)は、ボウアー=ムーアの定理証明系の最新式である産業力の自動推論システムである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:42:15 GMT)
Probing metric fluctuations with the spin of a particle: a quantum simulation with bimodal optical cavities [0.0] ディラックフェルミオンと相互作用する(2+1)Dの巨大重力玩具モデルは、特定の時空変動をサポートすることができる。
我々は、フェルミオンのスピンが時空のゆらぎと結合することによる進化に焦点をあてる。
このシステムのエミュレーションには、原子内のスピン自由度を符号化することが含まれる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:22:54 GMT)
Percentile-Based Deep Reinforcement Learning and Reward Based Personalization For Delay Aware RAN Slicing in O-RAN [0.0] オープンRAN(O-RAN)アーキテクチャにおける無線アクセスネットワークスライシングの課題に対処する。
我々の焦点は、物理リソースブロックに競合する複数のモバイル仮想ネットワークオペレータ(MVNO)を含むネットワークに焦点を当てている。
報酬に基づくパーソナライズ手法では,各エージェントが各エージェントのパフォーマンスに基づいて,他のエージェントのモデルの重み付けを優先順位付けする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:45:41 GMT)
Orbital-rotated Fermi-Hubbard model as a benchmarking problem for quantum chemistry with the exact solution [0.0] 我々は、量子化学アルゴリズムのスケーラブルで正確に解けるベンチマーク問題として、軌道回転フェルミ・ハバード(ORFH)モデルを紹介した。
我々は演算子ノルムと電子相関を含む複数の観点からORFHハミルトニアンを解析する。
以上の結果から,ORFHモデルは量子化学アルゴリズムをベンチマークするための多用途でスケーラブルなテストベッドを提供することが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:06:54 GMT)
Optimizing Metachronal Paddling with Reinforcement Learning at Low Reynolds Number [0.0] メタクロナルパドリング(Metachronal paddling)は、生物が一定の位相ラグで隣接する手足のセットを振動させる水泳戦略である。
学習アルゴリズムがこのメタ時間リズムを選択するか、あるいは他の調整パターンが現れるかを検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 23:38:06 GMT)
Optimising Call Centre Operations using Reinforcement Learning: Value Iteration versus Proximal Policy Optimisation [0.0] 本稿では、コールセンタにおける呼び出しルーティングを最適化するための強化学習(RL)の適用について検討する。
経験から学ぶPPO(Proximal Policy optimization)を用いたモデルフリーアプローチと、既知のシステムダイナミクス下での値反復(VI)を用いたモデルベースアプローチを比較した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:31:38 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:46:49 GMT)
On decoherence in surface hopping: the nonadiabaticity threshold [0.0] 本研究は,最少スイッチ面ホッピング法におけるデコヒーレンスを効率よく安全に説明するための戦略を示す。
単純で一般的な解法は、次元のないマッシーパラメータによって測定された低い非可逆性の領域へのデコヒーレンスを制限することである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:57:13 GMT)
Observation of period doubling and higher multiplicities in a driven single-spin system [0.0] ダイヤモンド中の窒素空孔中心として実現され、環境条件下での特定のコヒーレンス特性はコヒーレント$k$tupling振動をモニターすることができる。
この領域内での感度向上を検証し、検知プロトコルを改良するための新しい手段を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:06:21 GMT)
Neural Tangent Kernels and Fisher Information Matrices for Simple ReLU Networks with Random Hidden Weights [0.0] ランダムな隠蔽重みを持つ2層ReLUネットワークのための釣り情報行列とニューラルネットワークカーネル(NTK)について論じる。
NTKのスペクトル分解は, 固有値を持つ固有関数の具体的な形式で可能であることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:26:52 GMT)
NIST Post-Quantum Cryptography Standard Algorithms Based on Quantum Random Number Generators [0.0] 本研究では,量子乱数生成法(QRNG)に基づくポスト量子暗号(PQC)アルゴリズムを提案する。
これらのアルゴリズムは量子コンピューティングを利用して乱数を生成し、キーペア生成、キーカプセル化、デジタルシグネチャ生成の基礎となる。
6つのQRNGの時間計算およびQRNGベースのML-KEM、QRNGベースのML-DSA、QRNGベースのSLH-DSAの性能を評価する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:27:23 GMT)
Multi-Year Maintenance Planning for Large-Scale Infrastructure Systems: A Novel Network Deep Q-Learning Approach [0.0] 本稿では,大規模インフラネットワークにおける資産管理戦略を最適化する,新たな強化学習フレームワークを提案する。
ネットワークレベルのMarkov Decision Process(MDP)を個別の資産レベルのMDPに分解することにより、提案フレームワークは計算複雑性を低減し、学習効率を向上し、スケーラビリティを向上させる。
このフレームワークは予算配分機構を通じて年間予算の制約を直接組み込んでおり、メンテナンス計画が最適かつ費用対効果であることを保証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:27:31 GMT)
Multi-Model Ensemble and Reservoir Computing for River Discharge Prediction in Ungauged Basins [0.0] 多くの地域では十分な河川流出観測が行われておらず、降雨・流出解析のスキルが制限されている。
我々は,マルチモデルアンサンブルと貯水池計算を用いた流体予測法を開発した。
我が国の87河川流域のデータを用いてHYPERを評価した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:00:18 GMT)
Mobile Impurity in a Two-Leg Bosonic Ladder [0.0] 2脚のボソニック・はしごにおける移動不純物の力学について検討した。
不純物は脚に沿って移動し、はしごに存在するボゾン粒子の浴槽と相互作用する。
我々は解析的(トモナガ・ラッティンガー液-TLL)法と数値的(密度行列再正規化群-DMRG)法の両方を用いて不純物のグリーン関数を計算する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:15:00 GMT)
Measuring time in a timeless universe [0.0] 物理系は通常、量子論において問題となる外部時間パラメータに対して進化すると仮定される。
Page & Wootters (1984) は、宇宙は定常状態にあり、外部時間パラメータの必要性をなくすことによってこれを解決した。
ページ・ウォッタース構造の中核的な特徴を保ちながら、クロックを計測できることを実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:12:40 GMT)
Market Making Strategies with Reinforcement Learning [0.0] 市場メーカー(MM)は流動性の提供において基本的な役割を担っているが、在庫リスク、競争、非定常市場ダイナミクスから生じる重大な課題に直面している。
本研究は, 自律的, 適応的, 収益的な市場形成戦略を開発するために, 強化学習をいかに活用できるかを考察する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:17:49 GMT)
MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmentation [0.0] セグメント化精度と計算効率のバランスをとるために設計されたマルチスケール軽量Residual UNETR++アーキテクチャ。
4つの公開ベンチマークデータセットの実験は、MLRU++が最先端のパフォーマンスを達成することを示した。
MLRU++は, 3次元画像分割タスクに対して, 実用的で高性能なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:17:09 GMT)
Learned LSM-trees: Two Approaches Using Learned Bloom Filters [0.0] キーバリューストアは書き込み最適化のためにログ構造化マージ(LSM)木に大きく依存している。
Bloomフィルタのような補助構造は役に立つが、ツリーの深さとデータセットサイズでスケールするメモリコストを課す。
学習データ構造の最近の進歩は、機械学習モデルがこれらのコンポーネントを拡張したり置き換えたりする可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:23:52 GMT)
LeanKAN: A Parameter-Lean Kolmogorov-Arnold Network Layer with Improved Memory Efficiency and Convergence Behavior [0.0] Kolmogorov-Arnoldネットワーク(KAN)は、データ駆動モデリングのための多層パーセプトロン(MLP)に代わる有望な代替品である。
ここでは、MultKAN層が出力層において限定的な適用性に悩まされていることが分かる。
我々は、MultKANと従来のAddKANレイヤを直接かつモジュール的に置き換えるLeanKANを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:04:51 GMT)
KuiSCIMA v2.0: Improved Baselines, Calibration, and Cross-Notation Generalization for Historical Chinese Music Notations in Jiang Kui's Baishidaoren Gequ [0.0] 本稿は1202年(建仁2年)の江空の影響力あるコレクション『梅紙田蘭画』の光学音楽認識の大幅な進歩について紹介する。
不均衡なデータに対する文字認識モデルを開発し,評価する。
我々のモデルは、平均的な人間のCERが15.9%、ベストケースのCERが7.6%という、人間のトランスクライバーよりも優れています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:40:38 GMT)
Justifications for Democratizing AI Alignment and Their Prospects [0.0] 我々は、民主主義的アプローチは、理論的正当化よりも政治的に満たすことを目的とした正当化的ギャップを埋めることを目的としていると論じる。
我々は、民主的アプローチにおける重要な課題、特にAIアライメントによる不正な強制の防止について同定する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 17:16:19 GMT)
Integrating an ISO30401-compliant Knowledge management system with existing business processes of an organization [0.0] ISO30401は2018年に導入されたマネジメントシステム標準であり、組織に知識管理システムを設置するための普遍的な要件を確立する。
この記事では、プロセスの原則をISOの文脈で要約し、私たちの経験に基づいて、ISO30401準拠の知識管理システム(KMS)が、統合管理システムの他のすべてのプロセスとどのように絡み合うかを探る。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 08:54:19 GMT)
Integrated Learning and Optimization for Congestion Management and Profit Maximization in Real-Time Electricity Market [0.0] 我々は,経済派遣(ED)と直流最適潮流(DCOPF)問題を解決するため,新たな統合学習・最適化手法を開発した。
提案手法は、負荷とPTDF予測を経済的な操作よりも正確に訓練する逐次学習と最適化(SLO)と比較する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:25:26 GMT)
Initial Steps in Integrating Large Reasoning and Action Models for Service Composition [0.0] サービス構成は、適応的でインテリジェントなソフトウェアシステムを構築する上で、依然として中心的な課題である。
本稿では,Large Reasoning Models (LRM) とLarge Action Models (LAM) の2つの新しいパラダイムの統合について検討する。
本稿では、自動サービス構成の進歩に向けた有望な方向性として、統合型LRM-LAMアーキテクチャフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:57:18 GMT)
Improving Bird Classification with Primary Color Additives [0.0] 既存のモデルは低SNRや多種多様な録音に苦しむ。
スペクトル画像に適用された深層学習モデルは助けとなるが、種間で類似したモチーフが混同される。
これを軽減するために、一次色添加剤を用いて周波数情報を分光器に埋め込む。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:05:17 GMT)
Hybrid and Unitary Fine-Tuning of Large Language Models: Methods and Benchmarking under Resource Constraints [0.0] 微調整された大規模言語モデル(LLM)は、スケールとメモリ要求のため、計算上のボトルネックのままである。
本稿では,LoRA,BOFT,LoRA-GA,uRNNなどのパラメータ効率向上技術について包括的な評価を行った。
勾配ノルムで導かれる階層ごとの適応的な更新を演算することにより、ハイブリッド法は様々なタスクにまたがる収束効率と一般化を向上する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:00:02 GMT)
Hybrid Tokenization Strategy for DNA Language Model using Byte Pair Encoding and K-MER Methods [0.0] 従来のk-merトークン化は、局所的なDNA配列構造を捉えるのに効果的であるが、しばしば課題に直面している。
選択したBPEトークンを600のBPEサイクルで生成し,ユニークな6merトークンと組み合わせることを提案する。
このハイブリッドアプローチにより、バランスの取れたコンテキスト対応の語彙が保証され、モデルがショートパターンとロングパターンの両方をキャプチャできる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 16:45:23 GMT)
HeartUnloadNet: A Weakly-Supervised Cycle-Consistent Graph Network for Predicting Unloaded Cardiac Geometry from Diastolic States [0.0] エンドダイアストリック(ED)メッシュから直接、非負荷左室形状を予測するディープラーニングフレームワークであるHeartUnloadNetを導入する。
HeartUnloadNet は、平均 DSC 0.986 と HD 0.083 cm のサブミリ秒精度を実現し、推論時間を1ケースあたり 0.02 秒に短縮する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:31:35 GMT)
HIVMedQA: Benchmarking large language models for HIV medical decision support [0.0] HIV管理は、その複雑さのために魅力的なユースケースである。
大規模言語モデル(LLM)を臨床実践に統合すると、正確性、潜在的な害、臨床受理に関する懸念が高まる。
本研究は、HIV治療におけるLSMの現在の能力を評価し、その強度と限界を強調した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:06:30 GMT)
Geometric Measures of Complexity for Open and Closed Quantum Systems [0.0] 量子チャネルの比較的一般的な族に対する幾何学的複雑性の定義を示す。
これらのチャネルは、量子回路などのノイズをモデル化し、これらの量子チャネルの幾何学的複雑さを分析するのに有用である。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:22:57 GMT)
Generation of Synthetic Clinical Text: A Systematic Review [0.0] 本稿では,合成医療用フリーテキストの作成について,体系的なレビューを行うことを目的とする。
我々はPubMed、ScienceDirect、Web of Science、Scoops、IEEE、Google Scholar、arXivデータベースを検索した。
我々は1,398件のうち94件の関連記事を特定した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:35:16 GMT)
Generalizing Adam to Manifolds for Efficiently Training Transformers [0.0] アダムはニューラルネットワークのトレーニングに広く使われているが、解釈が難しいことで知られている。
多様体の特別な構造を利用する新しいアプローチが提示される。
グローバル接空間表現は、アダムのすべてのステップを実行するために使われる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:08:33 GMT)
Generalised state space geometry in Hermitian and non-Hermitian quantum systems [0.0] 一般化された意味で相互に双対な接続の族を構築することは可能であることを示す。
また、量子的自然勾配降下問題における計量の役割を解明する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:01:04 GMT)
Fully quantum description of the four-wave mixing contribution to correlated Stokes-anti-Stokes scattering [0.0] ストークス反ストークス散乱は、絡み合った光子対を生成することができる。
ストークス反ストークス散乱は量子光学技術にとって有望なツールである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:03:05 GMT)
Finite time path field theory and a new type of universal quantum spin chain quench behavior [0.0] 急激なクエンチと急激なクエンチの差は,摂動の非定常スイッチングが時間とともに指数関数的に消えることを示す。
また、類似の普遍的行動は、障害のクエンチ、そして究極的には大域的行動に存在することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:00:53 GMT)
FeynTune: Large Language Models for High-Energy Theory [0.0] 8ビリオンパラメータLlama-3.1モデルの20種類の微調整された変種として得られた理論高エネルギー物理のための大規模言語モデルについて述べる。
すべてのモデルは、2つの異なる低ランク適応微調整アプローチと異なるデータセットサイズを使用して微調整された。
我々は、高エネルギー理論物理学のための特殊言語モデルをさらに発展させるための洞察を導き出す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:21:03 GMT)
Fast generation of Pauli transfer matrices utilizing tensor product structure [0.0] パウリ転移行列は、$n$-qubit のパウリ基底における線型写像の作用を示す。
パウリ基底のテンソル積構造を明示的に利用する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:30:58 GMT)
Fashion-AlterEval: A Dataset for Improved Evaluation of Conversational Recommendation Systems with Alternative Relevant Items [0.0] Conversational Recommendation Systems (CRS)では、各ターンに推奨項目に対するフィードバックを提供する。
提案する2つのメタユーザシミュレータは,収集した判定値を用いて,シミュレーションされたユーザが好みを表現できるようにする。
シミュレータによる代替案の知識を利用することで、既存のCRSモデルの評価に大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 01:18:24 GMT)
Exploring the Landscape of Fairness Interventions in Software Engineering [0.0] 現実の世界におけるAIの適用は、データ内の潜在的なリスク要因によって、複数のリスクとデメリットをもたらします。
本論文は,フェアネス問題に対処するために開発された様々な研究とアプローチを要約した調査として機能する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:16:44 GMT)
Exploring Entanglement and Parameter Sensitivity in QAOA through Quantum Fisher Information [0.0] 量子フィッシャー情報(QFI)は、量子状態がその変動パラメータの変化にどれだけ敏感に反応するかを定量化するために用いられる。
正規化対角 QFI から突然変異確率とステップサイズを設定する QFI-Informed Mutation (QIm) を提案する。
7キュービットと10キュービットのインスタンスでは、QImは100回の実行で同じ確率とランダムリスタートのベースラインよりも平均と低分散を実現している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:59:53 GMT)
Exploiting individual differences to bootstrap communication [0.0] 本研究では,集団における個人行動の違いにより,コミュニケーションシステムがいかに出現するかを示す。
この結果に責任を負う2つの重要な認知能力は、所定の状況下で予測可能である。
我々の結果は、言語のような大きな柔軟で社会的に学習されたコミュニケーションシステムが、社会的認知のための汎用的だが十分に発達した能力の産物である、という理論と相容れない。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 15:44:57 GMT)
Even Faster Simulations with Flow Matching: A Study of Zero Degree Calorimeter Responses [0.0] 流れマッチング(FM)は、ALICE実験において、0度カロリーの高速シミュレーションのための代理モデルを開発するために用いられる。
本稿では,パラメータ数が極めて少ない高速生成モデルのトレーニングを可能にする効果的なトレーニング戦略を提案する。
FMモデルでは, 推定時間0.46ms, 推定時間1.20, 推定時間約109msに対して, ZNシミュレーションのワッサースタイン距離1.27を達成している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:21:33 GMT)
Evaluation of facial landmark localization performance in a surgical setting [0.0] 多くの顔検出アルゴリズムは神経外科、眼科、整形外科に応用されている。
これらのアルゴリズムを使用する際の一般的な課題は、患者を特定、正確に局所化するための様々な照明条件と検出位置の柔軟性である。
提案実験では,手術光と幻覚が一定位置にある状態で自動的に位置を調整するロボットアームを用いて,制御された環境下で顔のランドマークを検出するためのMediaPipeアルゴリズムを試験した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:40:47 GMT)
Evaluating Large Language Models (LLMs) in Financial NLP: A Comparative Study on Financial Report Analysis [0.0] 大規模言語モデル(LLM)は、さまざまな金融自然言語処理(FinNLP)タスクで顕著な機能を示している。
本研究は,5つのLLM,GPT,Claude,Perplexity,Gemini,DeepSeekの総合的な比較評価を行う。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:10:27 GMT)
Evaluating Ensemble and Deep Learning Models for Static Malware Detection with Dimensionality Reduction Using the EMBER Dataset [0.0] 本研究では,EMBERデータセットを用いた静的マルウェア検出における機械学習アルゴリズムの有効性について検討した。
LightGBM, XGBoost, CatBoost, Random Forest, Extra Trees, HistGradientBoosting, k-Nearest Neighbors (KNN), TabNetの8つの分類モデルを評価した。
モデルは精度、精度、リコール、F1スコア、AUCに基づいて評価され、予測性能とロバスト性の両方を調べる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 22:23:53 GMT)
Entanglement Generation on the Double Quantum Transition of NV Ground State Via Globally Addressing Microwave Pulse [0.0] エンタングルメント(Entanglement)は、量子センサーがハイゼンベルク限界までの感度を向上させるための重要な量子機能である。
NV中心のプラットフォームでは、ハイゼンベルク極限はNV中心の軸が平行であるときにのみ達成できる。
2つの双極子結合NV中心の二重量子遷移において、絡み合った状態を作るための実行可能なメカニズムを初めて提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:38:16 GMT)
Emergent-gravity Hall effect from quantum geometry [0.0] 量子幾何学から生じる有効重力場によって駆動されるホール効果を提案する。
我々の発見は、量子系における重力効果を探索するための新たな道を開く。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:37:07 GMT)
Early State Exclusion in 7-Qubit Spin Chains [0.0] 第3節では、環境効果と最も隣り合う相互作用を経験する量子ビットの連鎖を考察し、ESEと無関係のヤコビ行列の7倍7$の無限族を提示する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:35:32 GMT)
Discovering the dynamics of \emph{Sargassum} rafts' centers of mass [0.0] 2011年以降、浮かぶエフェサガサムのいかだは、アメリカ大陸内海の沿岸部をしばしば妨害している。
eBOMBモデルと呼ばれるこの方程式は、EmphSargassumの塊と地球の自転の相互作用を組み込んだマクシー・ライリー次元方程式に基づいている。
いかだの中心の質量に関する予測法が存在しないことは、機械学習の必要性を示唆している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:40:00 GMT)
Deepfake Detection Via Facial Feature Extraction and Modeling [0.0] 本稿では,ディープフェイク検出に顔のランドマークのみを用いるアプローチを提案する。
本稿では,人間の顔のディープフェイクと真のビデオの両方からなるデータセットを用いて,顔のランドマークを抽出するアプローチについて述べる。
実験により, この特徴抽出法は様々なニューラルネットワークモデルに有効であることが示された。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:30:51 GMT)
Deep Reinforcement Learning for Real-Time Green Energy Integration in Data Centers [0.0] 本稿では,eコマースデータセンターを対象とした,DRL(Deep Reinforcement Learning)最適化エネルギー管理システムの実装について検討する。
提案システムは, 再生可能エネルギー源, エネルギー貯蔵, グリッド電力の統合を動的に管理し, リアルタイムの変動エネルギー利用に適応する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 00:59:56 GMT)
Deep Neural Network Driven Simulation Based Inference Method for Pole Position Estimation under Model Misspecification [0.0] シミュレーションベース推論(SBI)は,従来のカイ二乗最小化よりも高精度な共振パラメータ推定値が得られることを示す。
これは、pi-pi散乱とrho(770)共鳴のケーススタディによって実証される。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:49:58 GMT)
Decompiling Rust: An Empirical Study of Compiler Optimizations and Reverse Engineering Challenges [0.0] Rustバイナリの分解は、言語のリッチな型システム、アグレッシブなコンパイラ最適化、ハイレベルな抽象化の広く使われるため、難しい。
コアRust機能とコンパイラビルドモードの非コンパイル品質をベンチマークで評価する。
私たちの調査結果は、ツール開発者にとって実用的な洞察を提供し、Rust対応のデコンパイル戦略の必要性を強調しています。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:26:42 GMT)
Computational Study of the Spectral Behaviour of Different Isospectrally Patterned Lattices [0.0] IPLの格子ハミルトンは、すべての同じ固有値を持つ結合細胞から構成される。
局所化状態は, ほぼ縮退したペアに出現し, このほぼ縮退状態は非局在化体制に入ると持ち上げられることを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:44:27 GMT)
Comparison of Segmentation Methods in Remote Sensing for Land Use Land Cover [0.0] 土地利用土地被覆(LULC)マッピングは都市・資源計画に不可欠である。
本研究では,Look-Up Table (LUT) をベースとした大気補正を,Cartosat Multispectral (MX) センサ画像に適用した高度なLULCマッピング手法について検討した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:23:02 GMT)
Comparative Analysis of Vision Transformers and Convolutional Neural Networks for Medical Image Classification [0.0] ビジョントランスフォーマー (ViT) はコンピュータビジョンに革命をもたらしたが、医療画像における従来の畳み込みニューラルネットワーク (CNN) と比較すると、その効果は未発見のままである。
本研究は,胸部X線肺炎検出,脳腫瘍分類,皮膚癌メラノーマ検出の3つの重要な医用画像のCNNおよびViTアーキテクチャの比較分析を行った。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:40:13 GMT)
Compact vacuum levitation and control platform with a single 3D-printed fiber lens [0.0] 高開口レンズ(NA)を備えた単一光ファイバは、ファイバフェートに直接印刷される。
これにより、コンパクトで堅牢な光浮揚・検知システムが、すべてファイバーベースのコンポーネントで構成されている。
我々のプラットフォームは、浮遊粒子に基づく実用的でポータブルなセンサーの道を開く。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 07:06:25 GMT)
Co-optimization of codon usage and mRNA secondary structure using quantum computing [0.0] 本稿では,コドン使用量と二次構造を同時に最適化する新しい変分フレームワークを提案する。
提案手法では,コドン適応指数(CAI)と最小自由エネルギー(MFE)のバランスをとる二重目的関数を用いる。
我々は、IBMの127量子ビットイーグルプロセッサを用いて、このエンドツーエンドワークフローを実際の量子ハードウェア上で実行可能であることを実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:32:44 GMT)
CityHood: An Explainable Travel Recommender System for Cities and Neighborhoods [0.0] CityHoodはインタラクティブなレコメンデーションシステムであり、ユーザの関心領域に基づいて都市や近隣を推薦する。
このシステムは、地理的、社会的、政治的、文化的指標に富んだ大規模なGoogle Placesレビューを活用するユーザーの興味をモデル化する。
ユーザーは指定した好みに基づいてレコメンデーションを探索し、ビジュアルインターフェースを通じて各提案の背後にある推論を検査することができる。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:01:24 GMT)
Chaotic signatures in free field theory [0.0] 有限体積における自由スカラー相対論的場の理論を平衡外とみなす。
特定のクエンチプロトコルの量子系において、カオス的な振る舞いがどのように現れるかを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:51:59 GMT)
Broadband optical time-domain reflectometry for security analysis of quantum key distribution [0.0] 本稿では,広帯域の実用的なファイバーベース量子鍵分布(QKD)システムに起動するトロイの木馬攻撃(THA)に対するセキュリティ解析手法を提案する。
我々の知る限りでは、我々のOTDRセットアップとそれに対応する結果は、幅広いスペクトル範囲で最初のものである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:19:00 GMT)
Bridging Cloud Convenience and Protocol Transparency: A Hybrid Architecture for Ethereum Node Operations on Amazon Managed Blockchain [0.0] 本稿では、Amazon EC2ベースのオブザーバビリティ、IAM強化セキュリティポリシ、AWS Cloud Development Kitによる再現可能な自動化を使用して、フルノードのデプロイと監視を行うハイブリッドなサービス指向アーキテクチャを提案する。
提案したハイブリッドアーキテクチャは,クラウド環境におけるセキュアで観測可能な,再現可能なノード操作を可能にする。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:55:35 GMT)
Bayesian Active Learning of (small) Quantile Sets through Expected Estimator Modification [0.0] 本稿では,ガウス的プロセスモデリングに基づくベイズ的アクティブラーニング戦略を提案する。
この戦略は、我々が期待する推定量修正(EEM)と呼ぶより広い原理に属する新しいサンプリング基準によって推進される。
ROTOR37圧縮機モデルを含むいくつかの合成例と工業応用事例について,この戦略の性能を概説した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:20:08 GMT)
Average-computation benchmarking for local expectation values in digital quantum devices [0.0] 対象の計算をその変種と組み合わせ、平均化すると古典的に解ける相関関数を実現できるスキームを導入する。
この変種は、ゲートを古典的にシミュレート可能なセットに単純化することなく、回路構造と深さを正確に保存する。
平均計算期待値の推定には,限られた数の異なる回路の実現しか必要としないことを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:00:27 GMT)
Automated Code Review Using Large Language Models with Symbolic Reasoning [0.0] 本研究では,記号的推論手法を大規模言語モデルと組み合わせたハイブリッド手法を提案する。
提案手法は,自動コードレビューの精度と効率を向上することを示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 14:50:27 GMT)
Assessment of Quantitative Cyber-Physical Reliability of SCADA Systems in Autonomous Vehicle to Grid (V2G) Capable Smart Grids [0.0] 電気自動車(EV)をV2G(EV-to-Grid)システムで送電網に組み込むことは日々増えている。
V2Gは分散エネルギーストレージとアシラリーサービスを提供することでグリッド信頼性を向上させることができる。
国家電力グリッドのサイバー物理的攻撃面を包含するスコープを持ち、監視および監視制御およびデータ取得(SCADA)システムに新たな脆弱性を導入している。
本稿では,AV2G(Autonomous Vehicle to Grid)通信インフラによる悪意について検討し,SCADAシステムの信頼性に対する影響を評価する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 06:57:10 GMT)
Apparent energy-speed relationship poses no challenge to Bohmian mechanics [0.0] この体制における実験によって測定される速度は架空のものである。
パイロット波の観点から系の適切な解析は、通常の量子論と同じ粒子位置の分布を予測することを示している。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 21:54:09 GMT)
An Initialization-free Quantum Algorithm for General Abelian Hidden Subgroup Problem [0.0] 我々のアルゴリズムは、任意の未知混合状態を補助レジスタとして適用することができる。
また,計算終了後に補助レジスタの状態を元の形式に復元する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 04:50:28 GMT)
An Explainable Equity-Aware P2P Energy Trading Framework for Socio-Economically Diverse Microgrid [0.0] 本稿では、多目的混合整数線形プログラミング(MILP)、協調ゲーム理論、強化学習(RL)によって駆動される動的エクイティ調整機構を統合する新しいフレームワークを提案する。
この枠組みは、最大72.6%のピーク需要削減と、大きな協力的な利益を示す。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 18:38:51 GMT)
An Empirical Study of Complexity, Heterogeneity, and Compliance of GitHub Actions Workflows [0.0] GitHub Actions(GHA)は、GitHubとの深い統合により、支配的なサービスとして登場した。
GHAは公式ドキュメンテーションとコミュニティが支援するベストプラクティスを提供する。
本研究は,オープンソースソフトウェアリポジトリにおけるGHAの構造,複雑性,コンプライアンスについて検討する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 03:26:38 GMT)
Alternative Loss Function in Evaluation of Transformer Models [0.0] 平均絶対方向損失関数は予測生成モデルを最適化するのにより適している。
その結果,Transformerの結果はLSTMで得られた結果よりも有意に優れていることがわかった。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 09:56:46 GMT)
Algorithmic idealism: what should you believe to experience next? [0.0] 私は「世界の状況」を問うのではなく、この疑問をタイトルセンターのステージに置いておく物理学の基礎へのアプローチを論じます。
まず、量子論は、次に何を見るべきかをエージェントに伝えるものとして理解されるべきである、と論じます。
アルゴリズム的理想主義(英: Algorithmic idealism)は、いくつかの数学的形式を許容する2つの仮定に基づく概念的枠組みである。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:44:27 GMT)
Advancing Vision-based Human Action Recognition: Exploring Vision-Language CLIP Model for Generalisation in Domain-Independent Tasks [0.0] ヒトの行動認識は、患者の行動監視、転倒検出、手術ロボットの監督、手続き的スキルアセスメントなど、医療や医療において重要な役割を担っている。
近年の視覚言語モデル、特にトランスフォーマーベースのCLIPモデルは、ビデオデータからアクション認識を一般化する有望な機能を提供する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 13:13:28 GMT)
A comprehensive study of LLM-based argument classification: from LLAMA through GPT-4o to Deepseek-R1 [0.0] 大規模言語モデル(LLM)は、引数のセマンティクスの分析と抽出の効率を高めた。
本稿では,Args.me や UKP などの多種多様なデータセットを用いた LLM の選択について検討する。
その結果,ChatGPT-4oは引数分類ベンチマークで他よりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:49:06 GMT)
A Walk across Europe: Development of a high-resolution walkability index [0.0] 本研究は,欧州における標準化された高解像度歩行性指標を開発する。
歩行可能な通りの長さ、交差点密度、緑地、斜面、公共交通機関へのアクセス、土地利用の混合、および15分間の歩行アイソクロンの7つの中核コンポーネントが選択された。
この指数は、バルセロナ、ベルリン、ミュンヘン、パリ、ワルシャワなどの都市を歩行可能なリーダーとして強調した。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 12:35:51 GMT)
A Multimodal Seq2Seq Transformer for Predicting Brain Responses to Naturalistic Stimuli [0.0] Algonauts 2025 Challengeは、自然主義的なマルチモーダル映画に対する全脳のfMRI反応を予測するエンコーディングモデルを開発するようコミュニティに呼びかけた。
本稿では,視覚,聴覚,言語入力からfMRI活動を自動的に予測するシーケンス・ツー・シーケンス・トランスフォーマを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 05:29:37 GMT)
A Multi-Dataset Benchmark for Semi-Supervised Semantic Segmentation in ECG Delineation [0.0] 半教師付きセマンティックセマンティックセグメンテーション(SemiSeg)のECGデライン化における最初の体系的ベンチマークを示す。
我々は、これまで未使用だったソースを含む複数の公開データセットをキュレートし、統一し、堅牢で多様な評価をサポートしました。
その結果, 半教師付きECGデライン化において, 変圧器は畳み込みネットワークよりも優れていた。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 11:49:46 GMT)
A Modular PyTheus Quantum Network Interpreter: Automated Analysis and Visualization of Optimized Quantum Architectures [0.0] PyTheus最適化量子ネットワークのためのモジュラーインタプリタを提案する。
自動最適化によって発見された複雑な量子アーキテクチャを自動的に分析し視覚化する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 10:21:55 GMT)
A Fisher's exact test justification of the TF-IDF term-weighting scheme [0.0] TF-IDF (Term frequency-inverse document frequency) は、情報検索史上最も有名な数学的表現である。
本稿では,TF-IDFを統計的コミュニティに活用することを正当化し,評価された表現が重要テストの観点からどのように理解できるかを実証する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 19:47:16 GMT)
2048: Reinforcement Learning in a Delayed Reward Environment [0.0] 遅延とスパース報酬は、強化学習(RL)エージェントの基本的な障害となる。
本稿では,長距離性能を直接最適化するための分散分散多段階RLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 24 Jul 2025 20:58:48 GMT)