Fugu-MT: arxivの論文翻訳(概要)

Phi-4-Mini-Reasoning: Exploring the Limits of Small Reasoning Language Models in Math [135.1]
CoT(Chain-of-Thought)は大規模言語モデル(LLM)の形式推論能力を著しく向上させるしかし、Small Language Models (SLM) における推論の改善は、モデル能力が限られているため、依然として困難である。本研究では,(1)多種多様な蒸留長CoTデータによる大規模中等教育,(2)高品質長CoTデータによる微調整,(3)厳格な選好データセットを活用したロールアウトDPO,(4)検証リワードを用いた強化学習(RL)の4段階からなるSLMの体系的トレーニングレシピを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:04:35 GMT)
Extracting and Transferring Abilities For Building Multi-lingual Ability-enhanced Large Language Models [105.0]
我々は,MAETと命名された多言語能力抽出と伝達手法を提案する。我々のキーとなる考え方は、大きな言語モデルから言語に依存しない能力に関する重みを分解し抽出することである。実験の結果,MAETは高度能力の抽出と伝達を効果的に行うことができることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:32:19 GMT)
SWE-smith: Scaling Data for Software Engineering Agents [100.3]
SWE-smithは、大規模なソフトウェアエンジニアリングトレーニングデータを生成するための新しいパイプラインである。 128のGitHubリポジトリからソースされた50kインスタンスのデータセットを作成します。我々はSWE-agent-LM-32Bをトレーニングし、SWE-bench Verifiedベンチマークで40.2%のPass@1リゾルバ率を達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:56:06 GMT)
Visual Text Processing: A Comprehensive Review and Unified Evaluation [99.6]
視覚テキスト処理における最近の進歩を包括的・多視点的に分析する。本研究の目的は,視覚テキスト処理のダイナミックな分野における今後の探索と革新を促進する基礎資源として,本研究を確立することである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:19:29 GMT)
DDM: A Metric for Comparing 3D Shapes Using Directional Distance Fields [98.2]
既存の手法は主に2つのモデル間の対応を直接確立することに焦点を当てている。本稿では,3次元幾何データに対する効率的,効率的,堅牢,かつ微分可能な距離測定法であるDDMを提案する。一般的な距離計量として、DDMは3次元幾何モデリングの分野を前進させる可能性がある。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:55:37 GMT)
Can We Achieve Efficient Diffusion without Self-Attention? Distilling Self-Attention into Convolutions [94.2]
従来の自己アテンションモジュールをピラミッド畳み込みブロック((Delta)ConvBlocks)に置き換えるための(Delta)ConvFusionを提案する。ローカライズされた畳み込み操作に注意パターンを蒸留し、他のコンポーネントを凍結させながら、(Delta)ConvFusionは、トランスフォーマーベースの処理に匹敵する性能を達成し、計算コストを6929$times$、LinFusionを5.42$times$の効率で上回る。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:57:28 GMT)
PPT: Pretraining with Pseudo-Labeled Trajectories for Motion Forecasting [90.5]
最先端のモーション予測モデルは、手動で注釈を付けたり、非常に後処理されたトラジェクトリを備えた、大規模なキュレートされたデータセットに依存している。 PWTはシンプルでスケーラブルな代替手段で、市販の3D検出器とトラッキングから自動生成される、未処理で多様な軌道を使用する。標準ベンチマーク、特に低データのレシエーション、クロスドメイン、エンドツーエンド、マルチクラスの設定において、強力なパフォーマンスを実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:34:20 GMT)
AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems [88.1]
AgiBot Worldは、217のタスクにまたがる100万以上のトラジェクトリを5つのデプロイメントシナリオで構成した大規模なプラットフォームである。 AgiBot Worldは高品質で多様なデータ配信を保証する。 GO-1は、現実世界のデクスタラスタスクや長距離タスクにおいて例外的な能力を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:18:40 GMT)
AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization [86.6]
適応的で効率的な推論のための新しい2段階のフレームワークを提案する。まず、長いCoTモデルと短いCoTモデルを組み合わせてハイブリッド推論モデルを構築する。第二に、モデルに適切な推論スタイルを選択するための2段階の選好訓練を適用する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:01:45 GMT)
Embracing Collaboration Over Competition: Condensing Multiple Prompts for Visual In-Context Learning [82.8]
Visual In-Context Learning (VICL) は、視覚的タスクを適応的に解くために、ピクセルデモを活用し、アナログを通して人間の様のタスク完了を模倣する。現在の手法では、候補者のプールに一つの「理想的」プロンプトが存在すると仮定している。我々は,1つのプロンプトに頼るのではなく,解決を犠牲にすることなく,情報的コンテキストを効率的に統合する,という新しい視点を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:43:03 GMT)
PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts [79.8]
PolyMathは18の言語と4つの難易度をカバーする多言語数学的推論ベンチマークである。我々のベンチマークは、包括性、言語多様性、高品質な翻訳の難しさを保証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:10:37 GMT)
Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos [76.1]
本稿では,インターネットの立体視,広角ビデオから高品質な4D再構成をマイニングするシステムを提案する。本研究では,この手法を用いて世界整合型擬似3次元点雲の形で大規模データを生成する。 DUSt3Rの変種をトレーニングし、実世界の画像対から構造と3次元運動を予測することで、このデータの有用性を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:59:59 GMT)
A Library for Learning Neural Operators [75.1]
我々は、演算子学習のためのオープンソースのPythonライブラリであるNeuralOperatorを紹介する。ニューラルネットワークは有限次元ユークリッド空間の代わりに関数空間間の写像に一般化される。 PyTorch上に構築されたNeuralOperatorは、ニューラルオペレータモデルのトレーニングとデプロイのためのツールをすべて提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:23:25 GMT)
Microwave-Dressing of Rydberg States in a Trapped Calcium Ion [74.0]
単イオンを用い、主量子数 n=49 の多様体で分光的に観察する。この結果は、ライドベルク状態の単一イオンとイオントラップの電場との相互作用を制御するために重要である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:43:31 GMT)
Iterative Trajectory Exploration for Multimodal Agents [69.3]
本研究では,マルチモーダルエージェント,すなわちSPORTのオンライン自己探索手法を提案する。 Sportは、タスク合成、ステップサンプリング、ステップ検証、優先度調整の4つの反復的なコンポーネントを通じて動作する。 GTAとGAIAのベンチマークでは、Sport Agentは6.41%と3.64%の改善を達成している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:01:27 GMT)
3D StreetUnveiler with Semantic-aware 2DGS -- a simple baseline [66.9]
StreetUnveilerは、混雑した観察から空の通りの3D表現を学習する。空の街路シーンを、観察された、部分的に観察された、保存されていない領域に分割する。街路景観データセットを用いた実験により, 空き路の3次元表現の再構築に成功した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:23:48 GMT)
WebThinker: Empowering Large Reasoning Models with Deep Research Capability [60.8]
WebThinkerは、大規模な推論モデルに、Webを自律的に検索し、Webページをナビゲートし、推論プロセス中に研究レポートをドラフトする権限を与えるディープリサーチエージェントである。また、textbf Autonomous Think-Search-and-Draft戦略を採用しており、モデルがシームレスに推論、情報収集、レポート作成をリアルタイムで行うことができる。我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:25:25 GMT)
AI-Enhanced Automatic Design of Efficient Underwater Gliders [60.5]
自動設計フレームワークの構築は、グライダー形状を表現する複雑さと、複雑な固体-流体相互作用をモデル化する際の計算コストが高いため、困難である。非自明な船体形状の水中ロボットを作れるようにすることで、これらの制限を克服するAI強化型自動計算フレームワークを導入する。提案手法は, 形状と制御信号の両面を協調的に最適化するアルゴリズムで, 低次幾何表現と微分可能なニューラルネット型流体代理モデルを用いる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:55:44 GMT)
RoboGround: Robotic Manipulation with Grounded Vision-Language Priors [59.3]
本研究では,効果的な中間表現としての接地マスクについて検討する。我々は、接地型ロボット操作システムであるRoboGroundを紹介する。一般化をさらに探求し、拡張するために、大規模なシミュレーションデータを生成する自動パイプラインを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:26:40 GMT)
AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images [58.9]
本稿では,人体画像の品質評価のための大規模ベンチマークAGHI-QAを紹介する。データセットは、400の慎重に作成されたテキストプロンプトから生成される4,000の画像で構成され、10の最先端のT2Iモデルを使用している。我々は,視覚的品質スコア,テキスト画像対応スコア,可視および歪んだ身体部分ラベルを含む多次元アノテーションの収集のために,体系的な主観的研究を行う。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:36:56 GMT)
Common3D: Self-Supervised Learning of 3D Morphable Models for Common Objects in Neural Feature Space [58.6]
3Dモデル(3DMM)は、オブジェクトカテゴリの形状や外観を表現する強力なツールである。我々は,オブジェクト中心ビデオのコレクションから,オブジェクトの3DMMを自己管理的に学習する新しい手法であるCommon3Dを導入する。 Common3Dは、様々な視覚タスクをゼロショットで解くことができる最初の完全に自己教師された方法である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:42:23 GMT)
BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents [56.3]
BEVWorldは,マルチモーダルセンサ入力を統一的でコンパクトなBird's Eye View潜在空間に変換し,全体的環境モデリングを行うフレームワークである。提案する世界モデルは,多モードトークン化器と遅延BEVシーケンス拡散モデルという2つの主要成分から構成される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:43:51 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9]
人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:17:34 GMT)
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis [55.4]
グラフィカルユーザインタフェース(GUI)エージェントのための新しいデータ合成パイプラインであるOS-Genesisを提案する。事前に定義されたタスクに頼る代わりに、OS-Genesisはエージェントがまず環境を認識し、ステップワイドなインタラクションを実行することを可能にする。我々は,OS-Genesisを用いたGUIエージェントのトレーニングにより,高度に挑戦するオンラインベンチマークの性能が大幅に向上することが実証された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:23:50 GMT)
Sionna RT: Technical Report [55.3]
SionnaはオープンソースのGPUアクセラレーションライブラリで、電波伝搬をシミュレートするレイトレーサを備えている。本論文は、Sionna RTが電波伝搬を効率的にシミュレートするアルゴリズムについて詳述する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:05:20 GMT)
LoRATK: LoRA Once, Backdoor Everywhere in the Share-and-Play Ecosystem [55.3]
タスク強化型LORAにバックドアを注入する方法を検討する。シンプルで効率的で具体的なレシピで、バックドアのLoRAを一度トレーニングして、シームレスに複数のLoRAとマージできることが分かりました。我々の研究は、下流の可搬性イットバックドア注入型LORAのトレーニング不要分布の新しい脅威モデルを研究する最初のものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:51:42 GMT)
Orthogonal Causal Calibration [55.3]
我々は、因果校正作業を標準(非因果予測モデル)の校正作業に還元する一般的なアルゴリズムを開発する。以上の結果から,既存のキャリブレーションアルゴリズムを因果的設定に応用できることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:50:36 GMT)
Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.0]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:47:25 GMT)
Adapting In-Domain Few-Shot Segmentation to New Domains without Retraining [54.0]
クロスドメイン小ショットセグメンテーション(CD-FSS)は、新しいドメインで新しいクラスのオブジェクトをセグメンテーションすることを目的としている。多くのCD-FSSメソッドは、様々なドメイン一般化手法を用いて、ドメイン内FSSモデルを再設計し、再訓練する。そこで,本研究では,FSSモデルを対象ドメインに適応させ,少数ショットラベル付きサポートサンプルからドメイン特性を学習する手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:16:33 GMT)
MF-LLM: Simulating Collective Decision Dynamics via a Mean-Field Large Language Model Framework [53.8]
Mean-Field LLM (MF-LLM) フレームワークは、マイクロレベルの決定とマクロレベルの集団の間のフィードバックループを明示的にモデル化する。 MF-LLMは、個人状態とグループレベルの情報に基づいて個別の行動を生成するポリシーモデルと、人口分布を更新する平均フィールドモデルである。実世界の社会データセット上でMF-LLMを評価し,非平均場ベースラインに対するKLの人口分布への分散を47%削減する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:41:51 GMT)
Bridging Personalization and Control in Scientific Personalized Search [53.7]
本研究では、パーソナライズされたランキングを積極的に制御できるパーソナライズされた検索モデルを提案する。我々のモデルであるCtrlCEは、ユーザの過去のインタラクションから構築された編集可能なメモリを付加した、新しいクロスエンコーダモデルである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:36:59 GMT)
Between Underthinking and Overthinking: An Empirical Study of Reasoning Length and correctness in LLMs [52.4]
大規模な言語モデル(LLM)は、単純な問題を克服し、不要に長いアウトプットを生成し、より難しいものを過小評価する傾向にある。これは、モデルが問題の難しさを誤認し、応答長を適切に調整できないことを示唆している。実験の結果, 許容精度を維持しつつ, 生成時間を大幅に短縮できることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:48:06 GMT)
Q-function Decomposition with Intervention Semantics with Factored Action Spaces [51.0]
元の作用空間の低次元射影部分空間上で定義されるQ-函数を考察し、分解されたQ-函数の不偏性について考察する。これにより、標準モデルフリー強化学習アルゴリズムにおいて、予測Q関数を用いてQ関数を近似する動作分解強化学習と呼ばれる一般的なスキームが導かれる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:26:51 GMT)
Knowledge Graph Completion with Relation-Aware Anchor Enhancement [50.5]
関係認識型アンカー強化知識グラフ補完法(RAA-KGC)を提案する。まず、ヘッダーのリレーショナル・アウェア・エリア内でアンカー・エンティティを生成します。次に、アンカーの近傍に埋め込まれたクエリを引っ張ることで、ターゲットのエンティティマッチングに対してより差別的になるように調整する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:41:48 GMT)
Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.3]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:09:44 GMT)
An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding [50.2]
本研究では,現実のリバースエンジニアリングシナリオにおけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:02:06 GMT)
Arbitrary state creation via controlled measurement [49.5]
このアルゴリズムは任意の$n$-qubit純量子重ね合わせ状態を生成し、精度は$m$-decimalsである。このアルゴリズムは、1キュービット回転、アダマール変換、マルチキュービット制御によるC-NOT演算を使用する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:28:10 GMT)
Improving Informally Romanized Language Identification [49.4]
ローマ化は、ヒンディー語やウルドゥー語など、文字の難易度に基づいて、通常容易に区別できる言語を表現している。我々は、トレーニングセットを合成する手法を改善することにより、ロマライズされたテキストの言語識別(LID)精度を向上させる。本研究では,Bhasha-Abhijnaanam 評価セットにおける20のIndic言語からのロマン化テキストに対して,最先端の LID 性能を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:36:28 GMT)
DGSolver: Diffusion Generalist Solver with Universal Posterior Sampling for Image Restoration [49.2]
bfDGrは、普遍的な後続サンプリングを持つ拡散解法である。コードとモデルはhttps://github.com/MiliLab/DGr.comから入手できる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:12:48 GMT)
Avoided-crossings, degeneracies and Berry phases in the spectrum of quantum noise through analytic Bloch-Messiah decomposition [49.2]
解析的ブロッホ・メシア分解 (analytic Bloch-Messiah decomposition) は量子光学系の力学を特徴づけるためのアプローチを提供する。単一パラメータが変化した場合,回避された交差は自然に発生し,特異ベクトルの過敏性をもたらすことを示す。我々は,避けられた交差を意図的に設計することで,フォトニックシステムのスペクトル応答をプログラムできる可能性を強調した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:39:28 GMT)
Optical aberrations in autonomous driving: Physics-informed parameterized temperature scaling for neural network uncertainty calibration [49.0]
本稿では,ニューラルネットワークのキャリブレーションアーキテクチャに物理的帰納バイアスを組み込むことにより,AIターゲットアプリケーションの堅牢性と信頼性を高めることを提案する。信頼に値する不確実性表現と認識連鎖の総合的検証戦略の道を開く。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:15:29 GMT)
Calibrating Uncertainty Quantification of Multi-Modal LLMs using Grounding [48.9]
マルチモーダル大言語モデル(LLM)に適した不確実性定量化(UQ)の校正手法を提案する。マルチモーダルモデルのキャリブレーションを改善するために,自己整合性に加えてクロスモーダル整合性を活用する。医療質問応答(Slake)や視覚質問応答(VQAv2)といった複数のマルチモーダルタスクに対して,LLaVA-MedやLLaVAといったマルチモーダルモデルを考慮したアプローチを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:19:21 GMT)
Variational Offline Multi-agent Skill Discovery [47.9]
本稿では,サブグループレベルの抽象化と時間レベルの抽象化を同時に取得し,マルチエージェントスキルを形成するための2つの新しい自動エンコーダ方式を提案する。提案手法はオフラインのマルチタスクデータに適用可能であり,検出したサブグループスキルは再学習することなく,関連するタスク間で伝達可能である。 StarCraftタスクに対する実証的な評価は、既存の階層型マルチエージェント強化学習(MARL)法よりもはるかに優れていることを示している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:48:03 GMT)
Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.8]
仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:39:26 GMT)
Joint Modeling of Feature, Correspondence, and a Compressed Memory for Video Object Segmentation [47.7]
現在のオブジェクトビデオ参照メソッドは、抽出-then-matchingのパイプラインに従う。本稿では,共同機能モデリング,対応,圧縮メモリのための統合VOSフレームワークであるJointFormerを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:19:18 GMT)
Emergence of a High-Dimensional Abstraction Phase in Language Transformers [47.6]
言語モデル (LM) は、言語コンテキストから出力トークンへのマッピングである。我々は5つの事前学習されたトランスフォーマーベースLMと3つの入力データセットに対して、その解析、観察、高レベルの幾何学的アプローチをとる。本結果は,多くの共通LMアーキテクチャにおいて,中心的な高次元位相がコア言語処理の基盤となることを示唆している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:06:00 GMT)
IDDM: Bridging Synthetic-to-Real Domain Gap from Physics-Guided Diffusion for Real-world Image Dehazing [46.2]
合成データセットでトレーニングされた現在のデータ駆動型デハージングアルゴリズムは、合成データでうまく機能するが、現実のシナリオに一般化するのに苦労する。 textbfImage textbfDehazing textbfDiffusion textbfModels (IDDM) を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:36:10 GMT)
Rethinking Visual Layer Selection in Multimodal LLMs [46.1]
この研究は、浅い、中、深いカテゴリに類似した振る舞いを持つグループCLIP-ViT層に対するレイヤワイズ類似性アプローチを提案する。大規模MLLMにおける視覚層選択問題を再考し,1.4Bから7BまでのLLaVAスタイルのモデルを訓練する。 1) 深層はOCRタスクに必須であり,(2) 浅層と中層はカウント,位置決め,オブジェクトの局所化を含む推論タスクにおいて実質的に深層を上回り,(3) 浅層,中層,深層をまたいだ軽量な融合は,専門的な融合ベースラインと単一層を一貫して上回ります。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:07:10 GMT)
Empirical Evaluation of Progressive Coding for Sparse Autoencoders [45.9]
バニラSAEにおける辞書の重要性は権力法に従っていることを示す。 SAEは再建損失が低く,言語モデリング損失が回復したことを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:08:32 GMT)
Asymmetry of the Relative Entropy in the Regularization of Empirical Risk Minimization [45.9]
相対エントロピー非対称性の効果は、経験的リスク最小化の文脈で分析される。良く理解されたタイプI ERM-RERとタイプII ERM-RERを比較することにより、エントロピー非対称性の影響が強調される。その結果,Type-II正則化は経験的リスク関数の適切な変換を伴うType-I正則化と同値であることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:37:00 GMT)
Eye2Eye: A Simple Approach for Monocular-to-Stereo Video Synthesis [45.6]
ビデオ合成の進歩にもかかわらず、3Dビデオデータが比較的少ないため、3Dビデオを作成することは難しい。本稿では,テキスト・ビデオ・ジェネレータをビデオ・ビデオ・ステレオ・ジェネレータに変換するための簡単な手法を提案する。われわれのフレームワークは、動画フレームをシフトした視点から自動生成し、説得力のある3D効果を実現する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:06:09 GMT)
AnimalMotionCLIP: Embedding motion in CLIP for Animal Behavior Analysis [45.6]
本研究では,動作情報と効果的な時間的モデリング手法を統合することの課題を克服するために,AnimalMotionCLIPを提案する。 Animal Kingdomデータセットの実験では、AnimalMotionCLIPは最先端のアプローチよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:26:37 GMT)
GPRat: Gaussian Process Regression with Asynchronous Tasks [45.5]
我々は、非同期ランタイムモデルHPX上に構築されたタスクベースのC++コードをpybind11を使用したハイレベルPython APIにバインディングする新しい方法を提案する。 GPRatはGPyTorchやGPflowと比較して、AMD EPYC 7742 CPU上で64コアまでのスケーリングが優れている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:08:51 GMT)
Zoomer: Adaptive Image Focus Optimization for Black-box MLLM [45.4]
SysNameは、トークン制限内で重要な視覚的詳細を保持しながら、MLLMのパフォーマンスを向上させるために設計された、新しい視覚的プロンプト機構である。 SysNameは一貫してベースラインメソッドを上回り、最大で26.9%の精度向上を実現し、トークン消費を大幅に削減した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:51:10 GMT)
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge [45.2]
私たちはビジュアル推論をターゲットとしたベンチマークであるVisualPuzzlesを紹介します。 VisualPuzzlesは5つのカテゴリにまたがる多様な質問で構成されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:45:01 GMT)
Insulin Resistance Prediction From Wearables and Routine Blood Biomarkers [44.7]
われわれはインスリン抵抗性の研究のために、米国全土でこれまでで最大のデータセットをリモートで採用しました。ディープニューラルネットワークモデルは、簡単に利用可能なデジタルバイオマーカーと血液バイオマーカーに基づいてインスリン抵抗を予測するために開発された。モデルでは、肥満および妊娠中の被験者の93%の感度と95%の調整された特異性を示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:10:20 GMT)
SDWPF: A Dataset for Spatial Dynamic Wind Power Forecasting Challenge at KDD Cup 2022 [44.3]
本稿では,一意な空間風力予測データセットであるSDWPFを提案する。このデータセットは風力タービンの空間分布と動的文脈因子を含む。このデータセットを使用して、Baidu KDD Cup 2022をローンチし、現在のWPFソリューションの限界を調べます。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:59:50 GMT)
CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching [44.0]
教師なし領域適応のシナリオでは、ソフトアルグミンと滑らかなL1損失は、しばしばターゲット領域における多重モードの異性確率分布をもたらす。本稿では,この問題に対処する新しいアプローチとして,CMD(Constrain Multi-modal Distribution)を提案する。結果は、トップパフォーマンスモデルとドメイン適応型ステレオマッチングモデルの両方において、改良された一般化を一貫して示している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:23:48 GMT)
Always-Sparse Training by Growing Connections with Guided Stochastic Exploration [43.3]
本研究では,より大規模かつスペーサーなモデルへのスケーリングに優れる,効率的な常時スパーストレーニングアルゴリズムを提案する。我々は,VGGモデルとVTモデルを用いて,CIFAR-10/100 と ImageNet の手法を評価し,様々なスペーサー化手法と比較した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:46:07 GMT)
Time-dependent Neural Galerkin Method for Quantum Dynamics [42.8]
本稿では,グローバル・イン・タイムの変動原理に依存する量子力学の古典的計算手法を提案する。我々のスキームは、Schr"odingerの方程式を強制する損失関数を最小化することにより、有限時間ウィンドウ上の状態軌道全体を計算する。本稿では,グローバルな量子クエンチを1次元および2次元のパラダイム的横フィールドイジングモデルでシミュレートして示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:16:32 GMT)
Phi-4-reasoning Technical Report [42.5]
Phi-4-reasoningは14ビリオンのパラメータ推論モデルであり、複雑な推論タスクにおいて高い性能を実現する。我々はPhi-4-reasoning-plusを開発した。どちらのモデルもDeepSeek-R1-Distill-Llama-70Bモデルのような大きなオープンウェイトモデルよりも優れており、完全なDeepSeek-R1モデルのパフォーマンスレベルに近づいている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:05:09 GMT)
20min-XD: A Comparable Corpus of Swiss News Articles [42.5]
20min-XD (20 Minuten cross-lingual document-level) は、フランスの新聞記事に匹敵する文書レベルのコーパスである。私たちのデータセットは、2015年から2024年の間に15,000の記事ペアで構成され、セマンティックな類似性に基づいて自動的に一致します。得られたデータセットは、近翻訳から緩やかな関連記事まで、多岐にわたる言語間類似性を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:16:08 GMT)
WARP: An Efficient Engine for Multi-Vector Retrieval [42.1]
WARPは、XTR目標で訓練された検索者の効率を大幅に改善する検索エンジンである。本システムでは,XTRの参照実装を41倍に削減し,ColBERTv2/PLAIDエンジンの3倍の高速化を実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:28:56 GMT)
ObjectFinder: An Open-Vocabulary Assistive System for Interactive Object Search by Blind People [42.1]
視覚障害者による対話型オブジェクト検索のためのオープン語彙ウェアラブルシステムであるObjectFinderを提案する。 ObjectFinderでは、フレキシブルなワードでターゲットオブジェクトをクエリできる。距離や方向を含む、エゴセントリックなローカライゼーション情報をリアルタイムで提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:42:40 GMT)
Learning 6-DoF Fine-grained Grasp Detection Based on Part Affordance Grounding [42.0]
本稿では,3次元部分レベルの可読性と把握能力学習を促進するために,言語誘導型SHape grAsPingデータを提案する。ロボット認知の観点から、我々は2段階のきめ細かいロボット把握フレームワーク(LangPartGPD)を設計する。我々の手法は、人間とロボットの協調と大規模言語モデル(LLM)の利点を組み合わせたものである。提案手法は,3次元形状のきめ細かな接地,オブジェクトの空き度推定,および3次元部分認識把握タスクにおいて,競争性能を達成できることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:22:25 GMT)
Looped Transformers for Length Generalization [42.0]
適応的なステップ数を持つループ変換器は長さの一般化を著しく向上することを示す。我々は,提案した学習アルゴリズムを用いてループ変換器を訓練し,様々なタスクに対して,高度に長大な一般化可能な解を学習することを確認する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:00:54 GMT)
Urban Computing in the Era of Large Language Models [41.5]
本稿では,大規模言語モデル(LLM)と都市コンピューティングの交わりについて検討する。我々は,LLMの進化とコア技術について,簡潔に概説する。我々は、交通、公共安全、環境モニタリングなど、主要都市領域にまたがる応用を調査する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:53:00 GMT)
AdaptMI: Adaptive Skill-based In-context Math Instruction for Small Language Models [41.2]
In-context Learning (ICL) は、言語モデルに適切な情報を提供する際に、その問題解決能力を改善することができる。最近の研究は、解決に必要なスキルを予測するために、フロンティアの大言語モデル(LLM)の能力を活用することで、ICLのパフォーマンスを向上できることを示している。このスキルベースの戦略は、より大きなモデルでのICL性能を向上させるが、小型言語モデル(SLM)での利得は最小限である。本稿では,SLMのためのスキルベースのテキスト内数学命令を選択するための適応的アプローチであるAdaptMIを紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:35:46 GMT)
Padding Matters -- Exploring Function Detection in PE Files [41.2]
本稿では,Chromium と Conti を特徴とする Windows x86 と x64 PE ファイルの新しいデータセットである FuncPEval を紹介する。我々は5つのランサムウェアと3つの機械学習ベースの関数開始検出ツールを評価した。分析の結果、rev.ngを除く全てのテストツールがランダムなパディングに影響を受けやすいことがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:15:09 GMT)
Automatic Mapping of AutomationML Files to Ontologies for Graph Queries and Validation [41.2]
AutomationMLは、自動化ドメインにおけるオープンデータ交換フォーマットとして広く採用されている。これは、マークアップ言語XMLに基づいたオープンでベンダー中立の標準である。この記事では、AutomationML標準における概念の最新のオントロジーと、AutomationMLモデルを自動的にRDFトリプルに変換するマッピングを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:34:56 GMT)
Meta knowledge assisted Evolutionary Neural Architecture Search [38.6]
本稿では,革新的なメタラーニングフレームワークを用いて,効率的なECベースのNAS手法を提案する。アダプティブサロゲートモデルは、潜在的なアーキテクチャを選択するためのアダプティブしきい値によって設計される。 CIFAR-10, CIFAR-100, ImageNet1Kデータセットを用いた実験により, 提案手法は最先端のピア手法に匹敵する高い性能が得られることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:43:07 GMT)
SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding [38.4]
textbfSeriesBenchは、105個の注意深くキュレートされた物語駆動シリーズからなるベンチマークである。そこで本研究では,手動のアノテーションを多様なタスク形式に変換するための,新しい長めの物語アノテーション手法とフル情報変換手法を導入する。シリーズ内のプロット構造とキャラクタ関係を詳細に分析するためのモデルキャパシティをさらに向上するために,新しい物語推論フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:48:21 GMT)
A Survey of Interactive Generative Video [38.1]
インタラクティブ・ジェネレーティブ・ビデオ(IGV)は、様々な領域にわたる高品質でインタラクティブなビデオコンテンツの需要の高まりに対応して、重要な技術として登場した。 1)ゲーム、IGVが仮想世界で無限に探索できるゲーム、2)AIの具体化、IGVは動的に進化するシーンとのマルチモーダルインタラクションにおいて、エージェントを訓練するための物理認識環境として機能する。理想的なIGVシステムを,ジェネレーション,制御,メモリ,ダイナミクス,インテリジェンスという5つの重要なモジュールに分解する包括的フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:59:02 GMT)
Direct Motion Models for Assessing Generated Videos [38.0]
ビデオ生成ビデオモデルの現在の制限は、可視的に見えるフレームを生成するが、動きが貧弱であることである。ここでは、妥当な物体の相互作用と動きをよりよく測定する指標を開発することで、FVDを超えていく。画素再構成や動作認識の代わりに点線を用いると、合成データの時間歪みに顕著に敏感な測定結果が得られることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:34:52 GMT)
On the Complexity of Finding Small Subgradients in Nonsmooth Optimization [37.3]
決定論的アルゴリズムにより次元自由度を達成できないことを示す。関数が凸である場合に、$(delta,epsilon)$-定常点を見つける収束率をどのように改善できるかを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:27:35 GMT)
Unsupervised Feature Transformation via In-context Generation, Generator-critic LLM Agents, and Duet-play Teaming [37.1]
本稿では,特徴空間を効率的にかつ監督なく変換するための,ジェネレータクリティカルなデュエットプレイ協調フレームワークを提案する。本フレームワークは,(1)批判的エージェントがデータを診断して行動可能なアドバイスを生成する,(2)ジェネレータが批評家のアドバイスによって導かれるトークン化された特徴変換を生成する,(3)反復的改善によってエージェント間のフィードバックを通じて継続的な改善が保証される,という3つの段階から構成される。大規模な実験により、提案されたフレームワークは、さまざまなデータセットにまたがる機能変換効率、堅牢性、実用的な適用性において、教師付きベースラインよりも優れています。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:26:03 GMT)
WASP: Benchmarking Web Agent Security Against Prompt Injection Attacks [37.0]
WASPと呼ばれるベンチマークでは、現実的なWebエージェントのハイジャックと、それらをテストするための独立した環境が導入されている。我々の評価は、高度な推論能力を持つモデルに支えられたAIエージェントでさえ、低便宜な人手によるプロンプトインジェクションの影響を受けやすいことを示している。エージェントは16～86%の時間で敵の指示を実行開始するが、0～17%の時間しか目標を達成できない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:25:59 GMT)
Retrieval, Reasoning, Re-ranking: A Context-Enriched Framework for Knowledge Graph Completion [36.7]
既存の埋め込みベースのメソッドは知識グラフのトリプルのみに依存している。 KGCのためのコンテキスト強化フレームワークであるKGR3を提案する。広く使われているデータセットの実験では、KGR3は様々なKGCメソッドを一貫して改善している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:02:25 GMT)
Real AI Agents with Fake Memories: Fatal Context Manipulation Attacks on Web3 Agents [36.5]
本稿では,ブロックチェーンベースの金融エコシステムにおけるAIエージェントの脆弱性を,現実のシナリオにおける敵対的脅威に曝露した場合に検討する。我々は、保護されていないコンテキスト表面を利用する包括的攻撃ベクトルであるコンテキスト操作の概念を導入する。これらの脆弱性を定量化するために、コンテキスト操作攻撃に対するAIエージェントの堅牢性を評価するWeb3ドメイン固有のベンチマークであるCrAIBenchを設計する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:40:47 GMT)
Using quantum annealing to generate test cases for cyber-physical systems [35.3]
本稿では,サイバー物理システムにおけるテストケース生成の高速化のための突然変異に基づく手法を提案する。我々は、量子アニールを用いて、改善のためのテストケースの重要な領域を特定し、ターゲットにします。我々のアプローチは、このプロセスをD-Waveの量子アニールを用いて解を見つけるアルゴリズムに機械化する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:20:58 GMT)
GenTorrent: Scaling Large Language Model Serving with An Overley Network [35.1]
本稿では,分散化コントリビュータの計算資源を活用するLLMサービスオーバーレイであるGenTorrentを提案する。このような分散インフラストラクチャの実現に固有の4つの重要な研究課題を特定します。この作業は、将来のAIサービス機能の民主化とスケーリングのための、新たな方向性の先駆者だと思います。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:24:19 GMT)
Preference-centric Bandits: Optimality of Mixtures and Regret-efficient Algorithms [34.9]
本稿では、予測に基づく評価から、選好基準(PM)と呼ばれる代替報酬の定式化へ移行するためのフレームワークを提案する。 PMは、異なる報酬の実現に望ましい重点を置くことができ、リスク回避、堅牢性、あるいは不確実性に対するその他の望ましい態度を含む、よりリッチな好みのモデリングを符号化することができる。本稿ではPM中心のフレームワークを定式化し、2つのアルゴリズムクラスでミキシングを学習・追跡する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:59:34 GMT)
Introduction to Online Control [34.8]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:23:18 GMT)
GDI-Bench: A Benchmark for General Document Intelligence with Vision and Reasoning Decoupling [34.7]
汎用ドキュメントインテリジェンスベンチマークは、9つの主要なシナリオと19のドキュメント固有のタスクにまたがる1.9kのイメージを備えている。視覚的な複雑さと推論の複雑さを分離することにより、GDI-Benchは、困難によるパフォーマンス評価を可能にするタスクをグレードする。本稿では,教師付き微調整過程における破滅的忘れの問題を緩和するGDIモデルを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:46:46 GMT)
Leveraging LLMs for Influence Path Planning in Proactive Recommendation [34.6]
プロアクティブなレコメンデーターシステムはユーザーの興味を徐々に歴史的な関心を超えてターゲットアイテムとして導くことを目的としています IRSは、影響経路計画のためのシーケンシャルモデルを設計するが、対象項目の包摂性や経路コヒーレンスに欠ける問題に直面している。協調的かつ効果的な影響経路を生成するLLM-IPP法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:55:56 GMT)
Rethinking Pseudo-Label Guided Learning for Weakly Supervised Temporal Action Localization from the Perspective of Noise Correction [33.9]
擬似ラベルのノイズは,完全教師付き検出ヘッドの学習に干渉すると考えられる。雑音ラベルにおける潜在的な有用な信号をすべて活用するための2段階雑音ラベル学習戦略を導入する。本モデルでは,検出精度と推定速度において,従来の最先端手法よりも優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:42:25 GMT)
OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion [33.9]
OPALは、OpenStreetMap(OSM)を軽量で最新のものとして活用する、LiDARの位置認識のための新しいネットワークである。私たちの重要なイノベーションは、疎いLiDARスキャンと、慎重に設計された2つのコンポーネントを通して構造化されたOSMデータのドメイン格差を埋めることにあります。 KITTIとKITTI-360データセットの実験はOPALの優位性を示し、トップ1検索マッチの@1m閾値で15.98%高いリコールを達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:06:51 GMT)
Restructuring Tractable Probabilistic Circuits [33.8]
確率回路(PC)は、トラクタブル推論をサポートする確率モデルのための統一表現である。既存の乗算アルゴリズムでは、回路は同じ構造を尊重する必要がある。異なるvtreeを重畳する回路を乗算する新しい時間アルゴリズムがもたらされることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:42:02 GMT)
TAMO:Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data [33.6]
大規模言語モデル(LLM)は、コンテキスト推論とドメイン知識の統合においてブレークスルーをもたらした。細粒度根本原因解析のための多モード観測データ,すなわちTAMOを用いたツール支援LLMエージェントを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:20:10 GMT)
IMDPrompter: Adapting SAM to Image Manipulation Detection by Cross-View Automated Prompt Learning [33.2]
Segment Anything Model (SAM) は例外的な一般化とゼロショット機能を示した。我々はSAMに基づくIMDPrompterと呼ばれるクロスビュープロンプト学習パラダイムを開発した。 IMDPrompterは手動によるガイダンスに依存しなくなり、自動検出とローカライゼーションが可能になった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:28:52 GMT)
Quantitative Clustering in Mean-Field Transformer Models [32.5]
ディープトランスモデルによるトークンの進化は相互作用する粒子系としてモデル化できる。平均場変圧器モデルの長時間クラスタリングについて検討する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:35:39 GMT)
High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.4]
本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。 BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:50:26 GMT)
Galvatron: An Automatic Distributed System for Efficient Foundation Model Training [32.3]
Galvatronは大規模ファンデーションモデルを効率的にトレーニングする分散システムである。最適な並列戦略を選択する複雑さを克服し、最も効率的なハイブリッド戦略を自動的に識別する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:11:45 GMT)
Learning Universal User Representations Leveraging Cross-domain User Intent at Snapchat [32.3]
我々は、異なるアプリ内サーフェスにまたがってユニバーサルユーザモデリング(UUM)を行おうとしている。ドメイン固有の表現を置き換える代わりに、UUM表現はドメイン間のトレンドをキャプチャする。 UUM埋め込みは、(i)ロングフォームビデオ埋め込みベースの検索に組み込まれており、(ii)ロングフォームビデオオープンレートの2.78%増加、(ii)ロングフォームビデオL2ランキングの19.2%増加、(iii)レンズL2ランキングの1.76%増加、(iv)通知L2ランキングの0.87%増加となっている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:48:43 GMT)
Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction [31.7]
本研究では、音響学、言語学、心理学から感情固有の知識を取り入れた新しいプロンプトを提案する。 LLMトレーニングスキームの有用性を検討するために,文脈認識学習,文脈内学習,指導訓練の実験を行った。本研究の目的は、感情認識および関連ドメインにおけるLLMの使用を改善することである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:26:38 GMT)
Responsive DNN Adaptation for Video Analytics against Environment Shift via Hierarchical Mobile-Cloud Collaborations [31.6]
既存のモデル適応フレームワークは、クラウド中心の方法で動作し、適応中に劣化したパフォーマンスを示し、環境シフトに対する遅延反応を示す。本稿では,モバイルリソースとクラウドリソースの階層的協調による連続モデル適応の応答性を最適化する新しいフレームワークMOCHAを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:08:15 GMT)
SignLLM: Sign Language Production Large Language Models [31.6]
我々は多言語手話生成(SLP)大言語モデルであるSignLLMを提案する。 2つの新しいSLPモードMLSFとPrompt2LangGlossは、クエリテキスト入力と質問スタイルプロンプト入力から手話ジェスチャーを生成することができる。我々はSignLLMを広範に評価し、8つの手話言語でSLPタスクの最先端性能を実現することを実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:19:25 GMT)
IP-CRR: Information Pursuit for Interpretable Classification of Chest Radiology Reports [31.4]
本稿では,放射線学レポートの分類のための解釈可能なフレームワークを提案する。キーとなる考え方は、大量のレポートから最も情報性の高いクエリの集合を抽出し、これらのクエリとその対応する回答を使用して診断を予測することである。提案手法の有効性を示すMIMIC-CXRデータセットの実験を行った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:20:05 GMT)
VividListener: Expressive and Controllable Listener Dynamics Modeling for Multi-Modal Responsive Interaction [31.3]
提案するVividListenerは,細粒度,表現性,制御性を備えたリスナの動的モデリングを実現する新しいフレームワークである。 VividListenerは最先端のパフォーマンスを実現し、表現力と制御性のあるリスナのダイナミクスを実現する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:05:12 GMT)
Base Models Beat Aligned Models at Randomness and Creativity [31.0]
ランダム数生成や混合戦略ゲーム(岩紙シッセ、隠れて探す)、創造的な文章など、予測不可能な出力を必要とするタスクについて検討する。それぞれの場合、アライメントモデルは、例えば他の一様乱数よりも「7」を生成することを好むなど、異なる不利益をもたらす狭い振舞いに傾向する。テストされたモデル全体では、一般的なベンチマークのパフォーマンス向上は、タスクのパフォーマンス低下と相関する傾向にあり、必要な能力の効果的なトレードオフが示唆されます。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:41:55 GMT)
High coherence fluxonium manufactured with a wafer-scale uniformity process [29.8]
約100%の収率を達成し、2インチウエハの均一性を維持できるジョセフソン接合の重なり過程を導入する。この研究は、CMOS互換プロセスを用いたスケーラブルな高コヒーレンスフラクソニウムプロセッサの道を開いた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:21:38 GMT)
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation [29.6]
HoloTimeは、ビデオ拡散モデルを統合して、単一のプロンプトまたは参照イメージからパノラマビデオを生成するフレームワークである。 360Worldデータセットは、下流の4Dシーン再構築タスクに適したパノラマビデオの包括的なコレクションである。パノラマアニメーションは、パノラマ画像を高品質のパノラマビデオに変換する2段階のイメージ・ツー・ビデオ拡散モデルである。パノラマ空間時間再構成は、空間時間深度推定法を用いて、生成されたパノラマ映像を4次元の点雲に変換する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:55:28 GMT)
PixelHacker: Image Inpainting with Structural and Semantic Consistency [29.0]
塗り絵は画像編集と画像生成の基本的な研究領域である。最近のSOTA(State-of-the-art)手法では、新しい注意機構、軽量アーキテクチャ、コンテキスト認識モデリングが研究されている。我々は、潜在カテゴリガイダンスと呼ばれる単純だが効果的な塗装パラダイムを設計し、PixelHackerという拡散モデルを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:37:05 GMT)
Comparative Analysis of FPGA and GPU Performance for Machine Learning-Based Track Reconstruction at LHCb [28.6]
大型ハドロン衝突型加速器における光度と粒度の増加は、より効率的なデータ処理ソリューションの必要性を喚起している。荷電粒子トラックのための有望なツールとして機械学習が登場した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:18:40 GMT)
OpenAVS: Training-Free Open-Vocabulary Audio Visual Segmentation with Foundational Models [28.6]
オープンボキャブラリ・オーディオ・ビジュアル(AVS)のプロキシとしてテキストを用いて音声と視覚のモダリティを調整するための訓練不要な言語ベースのアプローチであるOpenAVSを提案する。 OpenAVSは,1)音声からテキストへのプロンプト生成,2)LLM誘導のプロンプト翻訳,3)テキストから視覚への音声合成オブジェクトセグメンテーションを通じてマスクを推論する。既存の教師なし、ゼロショット、少数ショットのAVSメソッドをかなり上回り、mIoUとFスコアでそれぞれ9.4%と10.9%の絶対的なパフォーマンス向上を達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:52:10 GMT)
COMPACT: COMPositional Atomic-to-Complex Visual Capability Tuning [27.6]
MLLM(Multimodal Large Language Models)は、単純な視覚言語タスクに優れるが、複数の機能を必要とする複雑なタスクに直面すると苦労する。 VIT(Visual Instruction Tuning)は従来,データボリュームのスケールアップに重点を置いてきた。トレーニング例の合成複雑性を明示的に制御するトレーニングデータセットを生成するCompactを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:57:22 GMT)
Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis [27.4]
Dittoは拡散型トーキングヘッドフレームワークで、きめ細かい制御とリアルタイム推論を可能にする。我々は,Dittoが魅力的な音声ヘッドビデオを生成し,制御性とリアルタイム性能の両面で優位性を示すことを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:42:00 GMT)
TreeHop: Generate and Filter Next Query Embeddings Efficiently for Multi-hop Question Answering [27.4]
TreeHopはマルチホップ質問応答のための埋め込みレベルのフレームワークである。 TreeHopはクエリの埋め込みを動的に更新する。 TreeHopは、知識集約型アプリケーションにデプロイするための、より速く、よりコスト効率の良いソリューションです。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:15:49 GMT)
Can We Trust Embodied Agents? Exploring Backdoor Attacks against Embodied LLM-based Decision-Making Systems [27.3]
大規模言語モデル(LLM)は、実世界のAI意思決定タスクにおいて大きな可能性を示している。 LLMは、固有の常識と推論能力を活用するために微調整され、特定の用途に適合する。この微調整プロセスは、特に安全クリティカルなサイバー物理システムにおいて、かなりの安全性とセキュリティの脆弱性をもたらす。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:59:57 GMT)
Decision Making in Hybrid Environments: A Model Aggregation Approach [27.0]
Foster、Xu、Zeeviによる最近の研究は、一般的なオンライン意思決定問題の複雑さを特徴づけている。本稿では,ハイブリッド体制を特徴付けるDECの汎用拡張を提案する。我々のフレームワークはフレキシブルなアルゴリズム設計につながり、学習者は仮説セットのサブセットについて学習する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:53:12 GMT)
MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video [26.5]
MoBGSは、ぼやけたモノクロビデオから端から端まで、シャープで高品質なビューを再構築する。本稿では,Blur-Adaptive Latent Camera Estimation (BLCE)法を提案する。また,大域カメラと局所物体の動きの連続的な劣化を確実にするためのLCEE法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:22:45 GMT)
Conditional independence testing with a single realization of a multivariate nonstationary nonlinear time series [26.2]
非定常非線形過程を単一実現した条件独立試験のための最初のフレームワークを紹介する。主な技術要素は、時間変化の非線形回帰、時間変化の共分散推定、分布均一な強ガウス近似である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:51:38 GMT)
From Events to Enhancement: A Survey on Event-Based Imaging Technologies [25.9]
ダイナミックレンジと低レイテンシを提供するイベントカメラは、イメージングにおける破壊的な技術として出現している。これらの利点を様々な画像処理タスクに活用する研究が増えているにもかかわらず、近年の進歩と課題に関する包括的な研究はいまだに不足している。本調査ではまず,各種イベントセンサの物理モデルと特徴を基礎として紹介する。次に、画像/映像強調タスクとイベントの進行と相互作用を強調した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:42:06 GMT)
Humanizing LLMs: A Survey of Psychological Measurements with Tools, Datasets, and Human-Agent Applications [25.4]
大規模言語モデル(LLM)は、人間中心のタスクでますます使われるようになっている。彼らの心理的特徴を評価することは、彼らの社会的影響を理解し、信頼できるAIアライメントを確保するために不可欠である。本研究は,LLMのより解釈しやすく,堅牢で,一般化可能な心理的アセスメントフレームワークを開発するための今後の方向性を提案することを目的とする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:09:40 GMT)
Robust Misinformation Detection by Visiting Potential Commonsense Conflict [25.3]
誤情報検出(MD)は、オンライン誤情報を自動的に検出することを目的としている。本稿では,MDタスクのための新しいプラグ・アンド・プレイ拡張手法を提案する。我々は、偽記事が常識的な対立を巻き起こす可能性が高いことを示す以前の研究から着想を得た。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:03:17 GMT)
Elucidating the Preconditioning in Consistency Distillation [25.2]
整合性ギャップに応じて事前条件を解析的に最適化する「textitAnalytic-Precond」を提案する。そこで我々は,Analytic-Precondがトラジェクトリ・ジャンパーの学習を容易にし,生徒のトラジェクトリと教師のトラジェクトリのアライメントを高め,一貫性トラジェクトリモデルのトレーニングアクセラレーションを2倍から3倍に向上できることを実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:04:48 GMT)
Diffusion Bridge Implicit Models [25.2]
分散ブリッジモデル(DDBM)は、2つの任意の対の分布を補間するための拡散モデルの強力な変種である。我々は,拡散モデルで確立されたレシピに動機づけられた,余分な訓練を伴わないDDBMの高速サンプリングの第一歩を踏み出す。我々は、高次数値解法を誘導する、新しい、単純で洞察に富んだ常微分方程式(ODE)を誘導する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:56:54 GMT)
SignDiff: Diffusion Model for American Sign Language Production [24.9]
本稿では,手話話者を骨格ポーズから生成できるSignDiffという2条件拡散事前学習モデルを提案する。また,テキスト入力からASL骨格ポーズビデオを生成する,ASLP(American Sign Language Production)の新たな手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:09:31 GMT)
LASHED: LLMs And Static Hardware Analysis for Early Detection of RTL Bugs [24.8]
LASHEDは2つのアプローチ(LLMと静的解析)を組み合わせて、ハードウェアセキュリティバグ検出の限界を克服する。推奨されたスキームによってフラグ付けされたインスタンスの87.5%が、CWE(Common Weaknessions)であることがわかった。文脈内学習とモデルに"再考"を求めることで、LASHEDの精度が向上する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:15:53 GMT)
Leveraging Pre-trained Large Language Models with Refined Prompting for Online Task and Motion Planning [24.8]
本稿では,事前学習型大規模言語モデル (LLM) によって支援された閉ループタスク計画・実行システム LLM-PAS を提案する。タスク実行時の異常条件に対するLLM-PASの有効性とロバスト性を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:53:53 GMT)
Quantifying the Noise of Structural Perturbations on Graph Adversarial Attacks [24.6]
グラフニューラルネットワークは、グラフ関連の課題を解決するために広く利用されている。グラフ敵対攻撃に関する最近の研究は、現在のグラフニューラルネットワークが悪意のある攻撃に対して堅牢でないことを証明している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:46:37 GMT)
Venn: Resource Management for Collaborative Learning Jobs [24.6]
コラボレーション学習(CL)は、機械学習(ML)と分散エッジデバイス間のデータサイエンスのための有望なアプローチとして登場した。本稿では,複数のCLジョブ間で異種デバイスを効率的にスケジュールするCLリソースマネージャであるVennを紹介する。評価の結果,最先端のCLリソースマネージャと比較して,Vennは平均JCTを最大1.88倍改善した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:21:01 GMT)
Efficient Reinforcement Finetuning via Adaptive Curriculum Learning [24.5]
強化微調整(RFT)は、大規模言語モデル(LLM)の数学的推論能力を高める大きな可能性を示している。 AdaRFTは、モデルの最近の報奨信号に基づいて、トレーニング問題の難易度を動的に調整する。 AdaRFTはトレーニング時間を最大2倍に短縮し、かなりのマージンで精度を向上し、よりスケーラブルで効果的なRTTフレームワークを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:01:00 GMT)
DeepSeek-Prover-V2: Advancing Formal Mathematical Reasoning via Reinforcement Learning for Subgoal Decomposition [24.5]
我々はDeepSeek-Prover-V2を紹介します。このモデルは、ニューラル定理の証明における最先端のパフォーマンスを達成し、ミニF2Fテストで88.9%のパス比に達し、PutnamBenchの658問題のうち49を解決した。標準ベンチマークに加えて、325の形式化された問題の集合であるProverBenchを導入し、最近のAIMEコンペティションから選択された15の問題を含む評価を強化した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:57:48 GMT)
Extension-ranking Semantics for Abstract Argumentation Preprint [24.5]
本稿では,Dungの拡張セマンティクスを拡張階級セマンティクスとして一般化する。拡張階調のセマンティクスを評価するために、よく理解された拡張階調のセマンティクスが満足すべき原則をいくつか紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:19:42 GMT)
Capturing Conditional Dependence via Auto-regressive Diffusion Models [24.3]
本研究では, 自己回帰(AR)拡散モデルの有効性について検討した。理論的な結果は, 典型的な拡散モデルと比較して, データ条件分布の近似において, 差が小さく, サンプルを生成できることを示唆している。また、データに条件依存構造が明確な場合、AR拡散モデルがそのような構造を捕捉するのに対し、バニラDDPMはそれを行うことができないことを示す実験結果も提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:57:12 GMT)
MSL: Not All Tokens Are What You Need for Tuning LLM as a Recommender [24.0]
提案するMasked Softmax Loss (MSL) は,大規模言語モデル (LLM) を推奨する。 MSLは、損失計算中に架空のアイテム記述につながる可能性のある無効トークンを識別し、マスクすることで、LMLを改善している。 4つの公開データセットで実施された大規模な実験は、MSLの有効性をさらに検証し、NDCG@10で平均42.24%の改善を達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:01:26 GMT)
MagicPortrait: Temporally Consistent Face Reenactment with 3D Geometric Guidance [23.7]
本稿では,3次元顔パラメトリックモデルを潜在拡散フレームワークに統合した映像顔再現法を提案する。本手法は,3次元顔パラメトリックモデルを動作誘導として利用することにより,運転映像から捉えた動きと参照画像との顔の同一性のパラメトリックアライメントを可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:30:46 GMT)
ColorEdit: Training-free Image-Guided Color editing with diffusion model [23.5]
画像編集タスクにはテキスト・ツー・イメージ(T2I)拡散モデルが採用されており、顕著な有効性を示している。しかし, テキストプロンプトから, 物体のクロスアテンションマップと新たな色属性との衝突や注意漏れにより, テキスト誘導画像編集法では物体の色が変化しない可能性がある。本稿では,物体の色を微調整や訓練を必要とせず,手軽で安定的で効果的な画像誘導手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:07:56 GMT)
Multi-Task Corrupted Prediction for Learning Robust Audio-Visual Speech Representation [23.4]
CAV2vecは、音声と視覚の協調的腐敗を処理するための、新しい自己教師型音声表現学習フレームワークである。クロスモーダルな知識を蒸留し、劣化したモダリティを整合させる一元多タスク学習を提案する。頑健なAVSRベンチマーク実験により, 劣化した表現学習手法が認識精度を大幅に向上することを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:16:51 GMT)
Multi-Domain Causal Discovery in Bijective Causal Models [23.0]
因果図は, 従来の研究と比較して, 制約の少ない機能仮定の下で発見できることが示される。我々は、加算雑音モデル、LiNGAM、ポスト非線形モデル、位置スケールノイズモデルを含む様々なモデルを一般化する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:30:10 GMT)
Toward Automated Algorithm Design: A Survey and Practical Guide to Meta-Black-Box-Optimization [22.9]
進化計算(EC)コミュニティの新たな道としてメタブラックボックス最適化(MetaBBO)を導入する。 MetaBBOの成功にもかかわらず、現在の文献は主要な側面の要約が不十分であり、実装に関する実践的なガイダンスが欠如している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:28:22 GMT)
LongFuncEval: Measuring the effectiveness of long context models for function calling [22.8]
ツールコール設定において,大規模言語モデルの長い文脈理解能力を包括的に研究するための最初の試みを行う。ツール数の増加に伴い,パフォーマンス低下が7%から85%,ツール応答が長くなるにつれて回答検索が7%から91%,マルチターン会話が長くなるにつれて13%と40%の低下が見られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:21:51 GMT)
Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models [22.8]
本調査は,RLに基づく多モーダル大言語モデルの推論の最近の進歩を体系的にレビューする。我々は、RLの2つの主要なパラダイム、--value-free と value-based method を強調し、RLが推論能力をどのように強化するかを分析する。ベンチマークデータセット、評価プロトコル、既存の制限について概観する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:14:28 GMT)
CodeFlowBench: A Multi-turn, Iterative Benchmark for Complex Code Generation [22.7]
コードフローを実行するLLMの能力を総合的に評価するために設計された最初のベンチマークであるCodeFlowBenchを紹介する。 CodeFlowBenchは、Codeforcesから引き出された5258の問題で構成され、自動パイプラインを通じて継続的に更新される。 CodeFlowBenchではモデルの性能が悪く、反復的なコードフローのシナリオでは大幅にパフォーマンスが低下しています。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:45:28 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6]
本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:31:29 GMT)
Generalizable Synthetic Image Detection via Language-guided Contrastive Learning [22.5]
偽ニュースの拡散や偽のプロフィールの作成などの合成画像の真偽の使用は、画像の真正性に関する重要な懸念を提起する。本稿では,言語誘導型コントラスト学習を用いた簡易かつ効果的な合成画像検出手法を提案する。提案したLanguAge-guided SynThEsis Detection (LASTED) モデルでは,画像生成モデルに対する一般化性が大幅に向上していることが示されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:27:31 GMT)
ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction [22.4]
本稿では,パラメータ化された3次元物理知識を条件付きビデオ生成モデルに明示的に統合するプラグイン・アンド・プレイフレームワークReVisionを紹介する。 ReVisionは動きの忠実度とコヒーレンスを大幅に向上させる。以上の結果から,3次元物理知識を取り入れることで,比較的小さな映像拡散モデルでも複雑な動きや,より現実性や操作性の高いインタラクションを生成できることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:59:56 GMT)
CoCoDiff: Diversifying Skeleton Action Features via Coarse-Fine Text-Co-Guided Latent Diffusion [22.2]
行動認識タスクでは,特徴の多様性がモデル一般化と性能の向上に不可欠である。本稿では,多種多様だが意味的に一貫性のある特徴を生成するために,コーパスファインテキスト共誘導拡散モデル(CoDiff)を提案する。 CoDiffは、訓練中にプラグプレイ補助モジュールとして動作し、追加の推論コストは発生しない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:50:24 GMT)
How to Solve Contextual Goal-Oriented Problems with Offline Datasets? [22.1]
目的指向データ拡張(CODA)という新しい手法を提案する。 CODAは、コンテキスト目標指向(CGO)問題を解決するために、一般に利用可能なラベル付き軌跡とコンテキスト目標ペアを使用している。オフラインデータ設定におけるCGO問題を解決するCODAの能力を実証するために,新しい理論的解析を行った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:04:46 GMT)
COSMOS: Predictable and Cost-Effective Adaptation of LLMs [21.9]
大規模言語モデル(LLM)は、多種多様な適応戦略を用いることで、多くのタスクにわたって顕著なパフォーマンスを達成する。最小限のコストで適応結果を効率的に推定する統合予測フレームワークであるCOSMOSを紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:06:26 GMT)
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling [21.8]
ラベル付きデータの欠如は、音声分類タスクにおいて共通の課題である。そこで我々は,新しい多視点擬似ラベル手法を導入したセミスーパーバイザードラーニング(SSL)フレームワークを提案する。感情認識と認知症検出タスクにおけるSSLフレームワークの評価を行った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:24:00 GMT)
TrafficKAN-GCN: Graph Convolutional-based Kolmogorov-Arnold Network for Traffic Flow Optimization [21.7]
TrafficKAN-GCNは、Kolmogorov-Arnold Networks (KAN)とGraph Convolutional Networks (GCN)を組み合わせたハイブリッドディープラーニングフレームワークである。提案手法をボルチモア都市圏の実際の交通データを用いて評価する。我々の実験は、交通の流れを再分配し、渋滞を緩和し、フランシス・スコット・キーブリッジ崩壊のような破壊的な出来事に適応するフレームワークの能力を強調した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:50:42 GMT)
A Framework for Elastic Adaptation of User Multiple Intents in Sequential Recommendation [21.4]
IMAと呼ばれる逐次的レコメンデーションにおけるユーザマルチインテント適応のための効果的なインクリメンタルラーニングフレームワークを提案する。我々はIMAをElastic Multi-intent Adaptationフレームワークにアップグレードし、不活性なインテントを弾性的に取り除き、メモリ空間制限下でユーザインテントベクトルを圧縮する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:55:30 GMT)
FAST-Q: Fast-track Exploration with Adversarially Balanced State Representations for Counterfactual Action Estimation in Offline Reinforcement Learning [21.2]
オンラインゲームにおけるレコメンデーションシステムのような高い利害関係の応用は、プレイヤーの心理によってさらに複雑になる。現在のSOTA法は、既知の偽造行為をアウト・オブ・ディストリビューション(out-of-distribution)としてクリップすることで、そのようなオフラインデータからの学習を制限している。 FAST-Qは、グラディエント・リバーサル・ラーニング(Gradient Reversal Learning)を利用してバランスの取れた状態表現を構築する新しいアプローチを導入している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:32:40 GMT)
MoSAM: Motion-Guided Segment Anything Model with Spatial-Temporal Memory Selection [21.2]
モデルにオブジェクトモーションキューを統合し、より信頼性の高い特徴記憶を確立するための2つの重要な戦略を組み込んだMoSAMを提案する。 MoSAMは、他の競合と比べて最先端の結果を達成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:19:31 GMT)
Process-Supervised LLM Recommenders via Flow-guided Tuning [20.9]
フロー誘導ファインチューニングレコメンデータは、教師付きファインチューニングを置き換える。重要なイノベーションは、アイテムレベルの報酬を構成トークンの報酬に分解することだ。メカニズムは人気バイアスの緩和と公平性向上を実現します
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:26:32 GMT)
Subject Information Extraction for Novelty Detection with Domain Shifts [20.9]
非教師なしノベルティ検出(UND)は、医療診断、サイバーセキュリティ、産業品質管理などの分野において不可欠である。既存のUND法の多くは、トレーニングデータと通常のデータのテストは同じドメインに由来すると仮定している。実際のシナリオでは、通常のテストやトレーニングデータでは、異なるドメインから派生することが一般的である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:04:55 GMT)
Neural Co-Optimization of Structural Topology, Manufacturable Layers, and Path Orientations for Fiber-Reinforced Composites [20.5]
本稿では,構造トポロジ,曲面層,経路配向の同時最適化のためのニューラルネットワークに基づく計算フレームワークを提案する。我々のフレームワークは、幾何学的形状、層配列、繊維配向を表すために、3つの暗黙のニューラルネットワークを使用している。これらの目的を損失関数として組み込むことで、結果として得られる複合材料が最適化された機械的強度を示すことが保証される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:52:28 GMT)
Weight Ensembling Improves Reasoning in Language Models [20.2]
本研究では,世代間の多様性が崩壊し始める推論モデルのトレーニング中に発生する障害モードについて検討する。最新のSFTチェックポイントの重みをWiSE-FTと呼ばれる早期チェックポイントで補間する簡単な介入は、Pass@kをほぼ完全に回復し、Pass@1も改善する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:56:09 GMT)
Quaternion Nuclear Norms Over Frobenius Norms Minimization for Robust Matrix Completion [20.1]
本稿では,この問題に対するフロベニウスフレームワークの四元数モデルノルムアートについて述べる。我々はQNOFが$L1/L$の問題を解くことで単純化できることを証明した。また、QNOFを四元数行列の頑健な完備化にまで拡張する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:44:09 GMT)
Deep Learning Optimization Using Self-Adaptive Weighted Auxiliary Variables [20.1]
本稿では,ニューラルネットワークや物理インフォームドネットワークによる学習のための新しいフレームワークを開発する。私たちのフレームワークの堅牢性は、新しい損失が元の問題を最適化するのに役立ちます。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:43:13 GMT)
Masked Generative Priors Improve World Models Sequence Modelling Capabilities [19.7]
Masked Generative Modellingはより効率的で優れた帰納的バイアスとして登場した。 GIT-STORMは、Atari 100kベンチマークでRLタスクのパフォーマンスが大幅に向上したことを示している。トランスフォーマーをベースとした世界モデルが初めて連続行動環境に適用し、先行研究における大きなギャップに対処する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:22:52 GMT)
Effective Inference-Free Retrieval for Learned Sparse Representations [19.5]
Learned Sparse Retrieval (LSR)は、学習された単語の袋にテキストをエンコードするために訓練済みの言語モデルを利用する効果的なIRアプローチである。近年,新たな効率的な逆インデックスベース検索エンジンが提案されており,LSRモデルのトレーニングにおいて正規化の役割が変化したのか,という自然な疑問が投げかけられている。より効率的なLSRエンコーダを生成するために、正規化を緩和できることが示される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:10:46 GMT)
Galaxy Walker: Geometry-aware VLMs For Galaxy-scale Understanding [19.5]
宇宙レベルの視覚理解タスクのための幾何学的視覚言語モデルであるGalaxy-Walkerを紹介する。 Galaxy-Walkerは、銀河特性の推定と形態分類のタスクで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:48:28 GMT)
CAE-DFKD: Bridging the Transferability Gap in Data-Free Knowledge Distillation [18.9]
Data-Free Knowledge Distillation (DFKD) は、訓練済みの教師ネットワークから、実際の訓練データにアクセスすることなく、対象の学生モデルに知識を伝達することができる。既存のDFKD法は主に関連するデータセットにおける画像認識性能の向上に重点を置いており、しばしば学習された表現の伝達可能性の重要な側面を無視する。本稿では,データ-自由知識蒸留法(CAE-DFKD)を提案する。この手法は,モデル一般化を改善するための画像レベルの手法に依存するが,DFKDに直接適用した場合はフェールする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:58:02 GMT)
When Deep Learning Meets Information Retrieval-based Bug Localization: A Survey [18.7]
情報検索に基づくバグローカライゼーション(IRBL)はバグレポートに基づいてバグコードを特定する。近年,深層学習(DL)の普及によりIRBLの顕著な成果が見られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:30:28 GMT)
Lossless data compression by large models [18.7]
6G通信速度要件は、データ圧縮の革新的な新しいアイデアに対して、オープンな疑問を提起する。大規模な言語モデル(LLM)は、これまで以上にデータをよりよく理解しています。従来の圧縮アルゴリズムを全て破壊するLMCompressを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:11:38 GMT)
Are LLM-Judges Robust to Expressions of Uncertainty? Investigating the effect of Epistemic Markers on LLM-based Evaluation [18.6]
正直なところ、大きな言語モデル(LLM)を訓練する努力が増えている。 EMBERはLLM-judgesの頑健性を評価するためのベンチマークである。 EMBER を用いた評価の結果,GPT-4o を含む全ての LLM-judge 検査では,上皮マーカーの存在が顕著に欠如していることが判明した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:19:35 GMT)
Localizing Before Answering: A Benchmark for Grounded Medical Visual Question Answering [18.4]
LMMのローカライズ能力とロバスト性を評価するためのベンチマークであるHEAL-MedVQAを紹介する。そこで本研究では,LMMが関心のある対象領域をローカライズするためのLobA(Lobize-before-Answer)フレームワークを提案する。実験の結果, HEAL-MedVQA ベンチマークでは, バイオメディカル LMM よりも有意に優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:57:51 GMT)
Deep Learning Model Inversion Attacks and Defenses: A Comprehensive Survey [18.3]
モデル反転(MI)攻撃は個人情報のプライバシーと完全性に重大な脅威をもたらす。本調査は,MI攻撃と防衛戦略について,構造化された詳細な検討を行うことで,文献のギャップを埋めることを目的としている。本調査と合わせて,MI攻撃・防衛研究を支援する総合リポジトリを開発した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:30:46 GMT)
A microwave-activated high-fidelity three-qubit gate scheme for fixed-frequency superconducting qubits [18.3]
本稿では,マイクロ波駆動型3量子ゲートプロトコルを提案する。数値シミュレーションでは平均ゲートの忠実度は 99.9%以上この戦略は、コヒーレンス特性を改善し、スペクトルの混雑を低減し、エラー耐性量子演算の実験ツールキットを拡張することにより、スケーラブルな量子コンピューティングシステムを発展させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:16:16 GMT)
You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects [18.1]
ExecutionAgentは、ソースコードから任意のプロジェクトを構築し、テストケースを実行するためのスクリプトを作成する自動テクニックである。 ExecutionAgentは、14の異なるプログラミング言語と多くの異なるビルドおよびテストツールを使用する50のオープンソースプロジェクトに適用します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:25:22 GMT)
Algorithmic Collective Action with Two Collectives [18.0]
2つ以上の集団で集団行動を研究するための第1の枠組みを紹介する。目的,戦略,規模,均一性が集団の有効性に与える影響について検討する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:39:06 GMT)
Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA [17.8]
本稿では,医療質問応答システムを強化するためのプラグアンドプレイモジュールであるDisdisuss-RAGを提案する。本手法では,多ターンブレインストーミングをエミュレートする医療専門家のチームを編成し,検索内容の関連性を向上する要約エージェントを提案する。 4つのベンチマーク医学QAデータセットによる実験結果から、DEC-RAGはMedRAGより一貫して優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:37:44 GMT)
Accelerating Diffusion Transformer via Error-Optimized Cache [17.7]
Diffusion Transformer (DiT) はコンテンツ生成の重要な方法である。既存のキャッシュ手法は、前回のステップからDiT機能を再利用し、次のステップで計算をスキップすることで、生成を加速する。この問題を解決するために、エラーdキャッシュ(EOC)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:48:41 GMT)
HeadEvolver: Text to Head Avatars via Expressive and Attribute-Preserving Mesh Deformation [17.6]
本稿では,テキストガイダンスからスタイリングされた頭部アバターを生成するための新しいフレームワークを提案する。本手法は,面毎のヤコビアンによるメッシュ変形を表現し,学習可能なベクトル場を用いて局所変形を適応的に変調する。我々のフレームワークは,テンプレートメッシュから保存した属性をシームレスに編集しながら,テキストでさらに編集できる現実的な形状やテクスチャを生成することができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:06:06 GMT)
CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios [17.5]
本稿では,複雑な都市環境下での不均一なUAV群をコーディネートするためのコーディネートフィールドエージェントシステムを提案する。 UAV動作とタスク選択を誘導するコーディネーションフィールド機構を提案し,創発的タスクの分散および適応的アロケーションを可能にする。実験結果から, 動的変化に対するタスクカバレッジ, 応答時間, 適応性の観点から, より優れた性能が得られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:02:45 GMT)
The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning [17.5]
拡散モデルは、特定のテキスト命令によって、有害なコンテンツを生成することができる。この問題を未学習の有害な概念によって軽減するために、微調整のアプローチが開発されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:33:43 GMT)
Passive Measurement of Autonomic Arousal in Real-World Settings [17.5]
自律神経系(ANS)はストレス中に活性化される。 ANS活性は、心臓血管の健康、睡眠、免疫系、精神健康に悪影響を及ぼす可能性がある。本稿では,広帯域の遠隔手首型センサによるANS活性化の連続的リモート計測手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:45:13 GMT)
Smoothed Analysis for Learning Concepts with Low Intrinsic Dimension [17.5]
教師付き学習の伝統的なモデルでは、学習者の目標は、あるクラスから最も適した概念の競争的($epsilon$以内)な仮説を出力することである。学習者が最高の無知としか競合しないスムーズな分析フレームワークを導入する。時間内に$k$-halfspacesの交点を前向きに学習する最初のアルゴリズムを得る。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:04:45 GMT)
Strong-to-weak spontaneous symmetry breaking meets average symmetry-protected topological order [17.4]
これら2つの順序の非自明な拡張から生じる二重ASPT位相と呼ばれる新しい位相のクラスを提案する。この新たなフェーズは以前の研究には欠落しており、従来の閉じたシステムには存在しない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:17:41 GMT)
Self-Supervised Monocular Visual Drone Model Identification through Improved Occlusion Handling [17.4]
Ego-motion Estimation(エゴモーション推定)は、GPSで測定された環境で飛行するドローンにとって不可欠である。本稿では,単眼ビデオとフライトコントローラのデータのみを用いて,ニューラルネットワークに基づくドローンモデルを訓練するための自己教師型学習手法を提案する。従来のフィルタベースのVIOシステムに統合することで、ニューラルドローンモデルの価値を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:38:01 GMT)
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models [16.7]
大きな視覚言語モデル(LVLM)は、しばしばオブジェクト幻覚に悩まされ、その信頼性を損なう。我々は,モデル内部へのアクセスを必要とせずにLVLM応答を向上させる最適なVPを特定するために,BBVPE(Black-Box Visual Prompt Engineering)を提案する。提案手法では,候補となるVPのプールを用いて,与えられた入力画像に対して最も有効なVPを動的に選択するルータモデルを訓練する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:58:30 GMT)
Early Exit and Multi Stage Knowledge Distillation in VLMs for Video Summarization [16.7]
DEEVISumは、セグメントワイズビデオ要約のための軽量で効率的でスケーラブルなビジョン言語モデルである。 DEEVISumはマルチステージ知識蒸留(MSKD)とEarly Exit(EE)を統合して、パフォーマンスと効率のバランスを取る。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:37:55 GMT)
Static or Dynamic: Towards Query-Adaptive Token Selection for Video Question Answering [16.7]
長いビデオから生成される大量のトークンは、メモリ効率とモデルパフォーマンスに対する課題を示す。本稿では,要求条件に基づいて静的および動的情報を適応的に調整する新しいトークン選択戦略EXPLORE-THEN-SELECTを提案する。提案するフレームワークは,様々なビデオ言語モデルにシームレスに統合可能なプラグイン・アンド・プレイである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:03:54 GMT)
3D Stylization via Large Reconstruction Model [16.5]
本研究では,大規模な画像生成モデルにおける注意機構を利用して視覚的スタイルを捕捉・伝達する2次元スタイリング手法の成功から着想を得た。視覚的スタイルの画像からそのようなブロックに特徴を注入することにより、シンプルで効果的な3D外観スタイリング法を開発する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:46:32 GMT)
LoC-LIC: Low Complexity Learned Image Coding Using Hierarchical Feature Transforms [16.4]
本稿では,階層的特徴抽出変換を用いて,複雑性を大幅に低減する革新的な手法を提案する。我々の新しいアーキテクチャは、高空間分解能インプット/フィーチャーマップのチャネルを減らし、これを実現する。結果として、複雑性を低減したモデルは、学習した画像圧縮モデルが様々なデバイスで効率的に動作する方法を開くことができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:30:06 GMT)
Unlocking User-oriented Pages: Intention-driven Black-box Scanner for Real-world Web Applications [16.2]
Hoyenは、Large Language Modelを使ってユーザの意図を予測するブラックボックススキャナである。 Hoyenは、12の人気のあるオープンソースWebアプリケーションで厳格に評価され、6つの代表的なツールと比較されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:23:01 GMT)
Vision-Language Models Are Not Pragmatically Competent in Referring Expression Generation [16.2]
Referring Expression Generation (REG)は、視覚言語システムの実用的能力を評価するための中核的なタスクである。視覚言語モデル(VLM)の現在の評価は、しばしば実用的次元を見落としている。本稿では,1.5k画像の新しいデータセット(RefOI)について述べる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:55:10 GMT)
Efficient and robust 3D blind harmonization for large domain gaps [16.1]
視覚障害者のための新しい3D調和フレームワークであるBlindHarmonyDiffを紹介する。本フレームワークでは,対象の領域画像に基づいてトレーニングした3次元補正フローを用いて,エッジマップから元のイメージを再構成し,ソース領域画像のエッジから調和した画像を生成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:00:58 GMT)
Cross-Lingual Speech Emotion Recognition: Humans vs. Self-Supervised Models [16.1]
本研究では,人間のパフォーマンスとSSLモデルの比較分析を行った。また、モデルと人間のSER能力を発話レベルとセグメントレベルの両方で比較する。その結果,適切な知識伝達を行うモデルでは,対象言語に適応し,ネイティブ話者に匹敵する性能が得られることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:16:09 GMT)
NGENT: Next-Generation AI Agents Must Integrate Multi-Domain Abilities to Achieve Artificial General Intelligence [15.8]
我々は、次世代AIエージェント(NGENT)が、人工知能(AGI)に進むために、ドメイン間の能力を統合するべきだと論じている。将来のAIエージェントは、これらの特殊システムの強みを、テキスト、ビジョン、ロボット工学、強化学習、感情知性などにわたって操作できる統一されたフレームワークに合成するべきである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:46:14 GMT)
SoK: Security and Privacy Risks of Healthcare AI [15.7]
人工知能(AI)と機械学習(ML)を医療システムに統合することは、患者のケアを強化する大きな約束である。しかし、機密データやシステムの完全性も、サイバー攻撃の可能性を秘めている。ヘルスケアAIに関する現在のセキュリティとプライバシ(S&P)の研究は、ヘルスケアの展開シナリオと脅威モデルに関して非常に不均衡である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:27:30 GMT)
Underwater Image Enhancement via Dehazing and Color Restoration [15.5]
既存の水中画像強調法は、ヘイズとカラーキャストを統一的な劣化過程として扱う。本研究では,水中画像の品質向上を目的としたビジョントランス (ViT) ベースのネットワーク (WaterFormer と呼ぶ) を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:21:12 GMT)
A Survey on 3D Reconstruction Techniques in Plant Phenotyping: From Classical Methods to Neural Radiance Fields (NeRF), 3D Gaussian Splatting (3DGS), and Beyond [15.5]
植物形質転換は、植物形質とその環境との相互作用を理解する上で重要な役割を担っている。 3D再構成技術は、植物の形態や構造を詳細に把握するための強力なツールとして登場した。本稿では,植物表現の3次元再構成技術について概説する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:04:23 GMT)
FILA: Fine-Grained Vision Language Models [15.1]
HyViLMは、エンコーディング中に全体のコンテキストを保持しながら、任意の解像度の画像を処理するように設計されている。同じ条件下での最先端のMLLMと比較して、HyViLMは既存のMLLMを10タスク中9タスクで上回ります。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:49:56 GMT)
FADE: Towards Fairness-aware Generation for Domain Generalization via Classifier-Guided Score-based Diffusion Models [15.0]
FairDG(Fairness-Aware Domain Generalization)は、信頼できるAIシステムを展開する上で重要な課題である。フェアネスに対処する伝統的な手法は、分布シフトに対する考慮の欠如により、領域一般化において失敗している。フェアネスを意識したスコアガイド拡散モデル(FADE)をFairDG問題に効果的に対処するための新しいアプローチとして提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:53:53 GMT)
ALFRED: Ask a Large-language model For Reliable ECG Diagnosis [14.9]
本稿では,ECG解析のためのRAGに基づくゼロショット心電図診断フレームワークを提案する。このフレームワークには専門家による知識が組み込まれており、診断精度と説明可能性を高める。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:59:06 GMT)
Type-R: Automatically Retouching Typos for Text-to-Image Generation [14.9]
後処理パイプラインにおける誤ったテキストレンダリングの修正を提案する。提案手法はType-Rと呼ばれ,生成した画像のタイポグラフィ的誤りを識別し,誤りテキストを消去し,失語のためのテキストボックスを再生し,最後にレンダリングされた単語のタイポスを補正する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:24:23 GMT)
One Net to Rule Them All: Domain Randomization in Quadcopter Racing Across Different Platforms [14.8]
この研究は、物理的に異なるクワッドコプターをまたいで一般化する、ドローンレースのための最初のニューラルネットワークコントローラを提示する。ドメインランダム化で訓練された1つのネットワークが、様々なクワッドコプターを堅牢に制御できることを実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:44:41 GMT)
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields [14.8]
AIGCファンデーションモデルは、コンパクトな記述子以上のものから複雑な構造ときめ細かい詳細を忠実に生成できるほど強力である。 OpenAIの最近のGPT-4o画像生成は、印象的なクロスモダリティ生成、編集、設計機能を実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:20:14 GMT)
Diffusion-based Adversarial Identity Manipulation for Facial Privacy Protection [14.8]
顔認識は、ソーシャルネットワーク上での不正な監視とユーザー追跡によって、深刻なプライバシー上の懸念を引き起こしている。既存のプライバシーを強化する方法は、顔のプライバシーを保護する自然な顔画像を生成するのに失敗する。そこで我々はDiffAIMを提案し、悪意のあるFRシステムに対して自然かつ高度に伝達可能な対向顔を生成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:49:59 GMT)
Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games [14.5]
事前学習したビジュアルエンコーダは、トレーニングコストを大幅に削減することで、ビデオゲームにおける意思決定研究をより容易にすることができることを示す。この結果から,低解像度画像と数分のデモでは,エンドツーエンドのトレーニングが有効であることが示唆された。実効的な意思決定を可能にすることに加えて,事前学習したエンコーダは,トレーニングコストを大幅に削減することで,ビデオゲームにおける意思決定研究をより容易に行えることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:44:55 GMT)
Anatomical Similarity as a New Metric to Evaluate Brain Generative Models [14.4]
WASABI(Wasserstein-based Anatomical Brain Index)は、合成脳MRIの解剖学的リアリズムを評価するための新しい指標である。 WASABIは5つの生成モデルから得られた2つの実際のデータセットと合成MRIの実験に基づいて、解剖学的差異の定量化において高い感度を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:16:14 GMT)
DyST-XL: Dynamic Layout Planning and Content Control for Compositional Text-to-Video Generation [14.3]
DyST-XLは、フレーム認識制御により、既製のテキスト・ビデオモデルを強化するフレームワークである。コードはhttps://github.com/XiaoBuL/DyST-XLで公開されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:00:18 GMT)
A Formal Framework for Understanding Length Generalization in Transformers [14.2]
因果変換器における長さ一般化を解析するための厳密な理論的枠組みを導入する。我々は,この理論を,アルゴリズムおよび形式言語タスクにおける長さ一般化の成功と失敗の予測器として実験的に検証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:01:01 GMT)
Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations [14.1]
音声や音楽からの感情認識は、その音響的重なり合いから類似性を共有しており、これらの領域間での知識の伝達に関心が持たれている。本稿では,感情音声と音楽の音響的類似性を再考し,自己監督学習(SSL)モデルの階層的振る舞いの分析から始める。最後に、Frechet音声距離を用いた感情音声と音楽の音響的類似性について検討し、音声と音楽のSSLモデルにおける感情バイアスの問題を明らかにする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:32:40 GMT)
Confidence in Large Language Model Evaluation: A Bayesian Approach to Limited-Sample Challenges [13.5]
本研究では,大規模言語モデル(LLM)能力評価のためのベイズ的アプローチを提案する。モデル機能を潜時変数として扱い、キュレートされたクエリセットを利用して識別応答を誘導する。 GPTシリーズモデルを用いた実験により,提案手法は従来の評価手法よりも優れた識別性が得られることが示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:24:50 GMT)
Sparse-to-Sparse Training of Diffusion Models [13.4]
本稿では,DMに対するスパース・ツー・スパーストレーニングのパラダイムを初めて紹介する。我々は、無条件生成と6つのデータセットでスクラッチからスパースDMを訓練することに重点を置いている。実験の結果,スパースDMはトレーニング可能なパラメータやFLOPの数を著しく減らしながら,相性が良く,性能も優れていることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:28:11 GMT)
FIM: Frequency-Aware Multi-View Interest Modeling for Local-Life Service Recommendation [13.4]
地域生活サービスレコメンデーションシステムにおけるユーザの定期行動のモデル化における主な課題は,1)ユーザの多様な要求が様々な周期性を示すこと,2)休日やプロモーションイベントなどの要因によってユーザの定期行動が動的に変化すること,である。本稿では、ユーザの要求を異なる視点から分解し、様々な周期的意図を分離する周波数対応多視点関心モデリングフレームワーク(FIM)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:51:20 GMT)
Iron Sharpens Iron: Defending Against Attacks in Machine-Generated Text Detection with Adversarial Training [13.2]
我々は、GREedy Adversary Promoted DefendER(GREATER)という、堅牢なMGT検出器をトレーニングするための対角的フレームワークを導入する。テキスト摂動10戦略と6対逆攻撃による実験結果から, GREATER-DはSOTA防御法と比較して攻撃成功率(ASR)を0.67%削減することがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:44:22 GMT)
XeMap: Contextual Referring in Large-Scale Remote Sensing Environments [13.2]
XeMapタスクは、大規模RSシーンにおけるテキスト参照領域のコンテキスト的、きめ細かいローカライゼーションに焦点を当てる。 XeMap-Networkは、RSにおけるピクセルレベルのクロスモーダルなコンテキスト参照マッピングの複雑さを扱う。 HMSAモジュールはテキスト意味ベクトルとマルチスケールの視覚的特徴を一致させ、正確なマルチモーダルマッチングを可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:14:39 GMT)
Detecting and Mitigating Hateful Content in Multimodal Memes with Vision-Language Models [12.9]
マルチモーダルミームは、個人やグループに対してヘイトスピーチを広めるために悪用されることがある。ヘイトフルなミームを検出するための定義誘導プロンプト手法と、UnHateMemeという名前のミームにおけるヘイトフルなコンテンツを緩和するための統一的なフレームワークを提案する。我々のフレームワークはビジョン・ランゲージ・モデルと統合されており、ヘイトフル・ミームを非ヘイトフル・フォームに変換する強力な能力を示している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:48:12 GMT)
IRL Dittos: Embodied Multimodal AI Agent Interactions in Open Spaces [12.9]
In Real Life (IRL) Dittoは、オフィススペースを共有するリモート同僚を表現するために設計されたAI駆動の実施エージェントである。 IRL Dittoは、共有オフィススペース内の同僚間の相互作用や関係にどのように影響を与えるのか? その結果,社会関係の強化は,IRL Dittoの源泉と参加者の関係の基盤に大きく依存していることが判明した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:16:32 GMT)
Fairness in Graph Learning Augmented with Machine Learning: A Survey [12.9]
機械学習技術を従来のグラフ学習モデルに拡張することで、さまざまな領域で顕著な成功を収めた。本稿では,機械学習(GL-ML)を用いたグラフ学習がもたらす特異な公平性の課題を体系的に検討する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:02:23 GMT)
Entanglement-Enhanced Nanoscale Single-Spin Sensing [12.8]
単一スピン検出は、凝縮物質物理学、量子化学、単分子磁気共鳴イメージングなど幅広い応用において、量子センシングの基本的な課題である。絡み合ったNV対を戦略的に利用することにより,これらの制限を克服する絡み付きセンサプロトコルを提案し,実証する。提案手法は, 環境条件下での単一NV中心に対する感度3.4倍, 空間分解能1.6倍の低減を実現する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:59:58 GMT)
Enhancing New-item Fairness in Dynamic Recommender Systems [12.8]
新しいイテムは、新鮮で魅力的なユーザエクスペリエンスを提供するためのレコメンデータシステム(RS)において重要な役割を担います。従来の方法では、露光時間と限られた相互作用記録のために、新しいイテムを効果的に推奨するのに苦労している。本稿では, 強化学習(RL)を基盤とした, DRS用に特別に設計された新しいアイテムフェアネス向上フレームワークであるFairAgentを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:49:36 GMT)
The First Theoretical Approximation Guarantees for the Non-Dominated Sorting Genetic Algorithm III (NSGA-III) [12.7]
N$が少なくとも参照点数$N_r$である場合、OneMinMaxベンチマークの最大空区間(MEI)インジケータによって測定される近似品質は、$lceilfrac(5-2sqrt2)nN_r-1rceil$よりも長い空区間がないことを示す。これはNSGA-IIと連続生存選択の顕著な違いであり、個体数の増加は近似の質を向上させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:49:42 GMT)
Uncertainty for SVBRDF Acquisition using Frequency Analysis [12.5]
本稿では,多視点撮影におけるSVBRDF取得の不確かさの定量化を目的とする。本研究では,この曖昧さ,不確実性についてエントロピーを用いて検討し,周波数領域を用いて解析を高速化する。その結果、オブジェクト全体の不確実性のマップをミリ秒以内で計算する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:42:25 GMT)
Differentiable Room Acoustic Rendering with Multi-View Vision Priors [12.3]
本研究では,多視点画像から抽出した視覚的手がかりとアコースティックビームトレーシングを利用した物理ベースの室内音響レンダリングシステムであるAV-DARについて紹介する。 2つのデータセットから6つの実世界の環境にまたがる実験は、我々のマルチモーダルな物理ベースのアプローチが効率的で解釈可能で正確であることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:55:29 GMT)
JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System [12.3]
JuDGE(Judgment Document Generation Evaluation)は、中国の法体系における判定文書生成の性能を評価するための新しいベンチマークである。本研究では,実訴訟の事実記述からなる包括的データセットを構築し,対応する全判決文書と組み合わせた。法律専門家と共同で,生成した判定文書の品質を評価するための総合的な自動評価フレームワークを構築した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:23:54 GMT)
BRIGHT-VO: Brightness-Guided Hybrid Transformer for Visual Odometry with Multi-modality Refinement Module [11.9]
視覚計測(VO)は、自律運転、ロボットナビゲーション、その他の関連するタスクにおいて重要な役割を果たす。本稿では,トランスフォーマーアーキテクチャに基づく新しいVOモデルであるBrightVOを紹介し,フロントエンドの視覚的特徴抽出を行う。ポーズグラフ最適化を用いて、このモジュールは、エラーを減らし、精度とロバスト性の両方を改善するために、ポーズ推定を反復的に洗練する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:36:04 GMT)
Addressing Emotion Bias in Music Emotion Recognition and Generation with Frechet Audio Distance [11.9]
我々は、音楽感情認識(MER)と感情音楽生成(EMG)の研究を行う。本稿では,Frechet Audio Distance(FAD)とともに,様々なオーディオエンコーダを用いる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:21:26 GMT)
Cert-SSB: Toward Certified Sample-Specific Backdoor Defense [11.9]
ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。ハッカーはトレーニングデータのごく一部を操作して、隠れたバックドアをモデルに埋め込む。本稿では, Cert- SSB と呼ばれる, サンプル固有のバックドア防御手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:21:25 GMT)
Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice [11.8]
大規模言語モデル(LLM)は、信頼性、透明性、公平性、倫理的整合性といった問題にまたがる信頼性に関する懸念を提起している。本研究は,2019年から2025年までの2,006冊の書誌地図解析を行い,理論的議論と実践のギャップを埋めるものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:04:55 GMT)
Garment3DGen: 3D Garment Stylization and Texture Generation [11.8]
Garment3DGenは、単一の入力イメージをガイダンスとして与えられたベースメッシュから3Dの衣服資産を合成する新しい方法である。画像から3Dへの拡散手法の最近の進歩を生かして, 3次元の衣服測地を創出する。我々は、グローバルかつ局所的に一貫した高忠実なテクスチャマップを生成し、入力ガイダンスを忠実にキャプチャする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:22:19 GMT)
Round Trip Translation Defence against Large Language Model Jailbreaking Attacks [11.6]
本研究では,大規模言語モデルに対する社会工学的攻撃から守るために設計された,最初のアルゴリズムを提案する。我々の防衛は、PAIR(Prompt Automatic Iterative Refinement)攻撃の70%以上を軽減できた。また、MathsAttackを緩和し、攻撃成功率を約40%削減した最初の試みです。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:13:56 GMT)
VideoMultiAgents: A Multi-Agent Framework for Video Question Answering [11.5]
Video Question Answering (VQA) は本質的にマルチモーダル推論に依存している。本稿では,視覚,シーングラフ解析,テキスト処理などの特殊エージェントを統合するフレームワークであるVideoMultiAgentsを紹介する。提案手法は, 対象, 行動, 時間的遷移をハイライトするキャプションを生成する, 質問誘導キャプション生成を補足する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:42:47 GMT)
Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment [11.5]
生成強化ネットワーク(GRN)と呼ばれる新しいセグメンテーション対応ジョイントトレーニングフレームワークについて紹介する。 GRNはセグメンテーション損失フィードバックを統合し、画像生成とセグメンテーションのパフォーマンスを1段階で最適化する。サンプル効率学習用GRN(GRN-SEL)と半教師付き学習用GRN(GRN-SSL)の2種類も開発されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:19:58 GMT)
Canonicalization for Unreproducible Builds in Java [11.4]
再現可能なビルドの概念フレームワークを導入し,再現可能な中央からの大きなデータセットを分析し,再現不可能な6つの根本原因の新たな分類法を開発した。再現不可能な12,283のアーティファクトに対して、9.48%から26.89%に成功を収めるツールであるChains-Rebuildを紹介します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:17:54 GMT)
Robust Orthogonal NMF with Label Propagation for Image Clustering [11.4]
非負のクラスタリング因子化(artNFMF)は、イメージクラスタリングで広く使われている教師なし学習手法である。そこで我々は,ノイズ汚損を解決するための (AD) ベースの解法である交互方向法を開発した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:49:55 GMT)
Fairness Risks for Group-conditionally Missing Demographics [11.3]
既存のモデルでは、プライバシー、法的問題、個人の差別に対する恐怖のために実用的でないような、センシティブな特徴の完全な知識が必要である。提案手法は,多変量オートエンコーダにおいて,グループ条件の欠落した確率を共同学習しながら,感度特性の確率論的衝動による一般フェアネスリスクを増大させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:54:10 GMT)
Space-Efficient and Noise-Robust Quantum Factoring [11.0]
Regevの最近の量子ファクタリングアルゴリズムに2つの改善がある。レゲフの回路は$O(n3/2)$ qubitsと$O(n3/2 log n)$ gatesを必要とする。 Regev氏の古典的な後処理手順の分析は、すべての$approx sqrtn$の実行を成功させる必要がある。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:01:38 GMT)
Bilateral Differentially Private Vertical Federated Boosted Decision Trees [11.0]
フェデレーション学習(Federated Learning)は、データプライバシを確保しながら、複数のパーティ間で協調的なトレーニングを可能にする、分散機械学習パラダイムである。本稿では,二元差分プライバシー保証を備えた垂直連合型XGBoostの変種を提案する: MaskedXGBoost。有効性と効率の両面でのアルゴリズムの優位性を複数のデータセットで検証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:37:44 GMT)
PreCM: The Padding-based Rotation Equivariant Convolution Mode for Semantic Segmentation [10.7]
本稿では、指向情報をより完全に活用することを目的とした、普遍的な畳み込みグループフレームワークを提案する。次に、数学的にパディングベースの回転同変畳み込みモード(PreCM)を設計する。意味的セグメンテーションタスクにおける画像回転の影響を定量的に評価するために,新たな評価指標である回転差(RD)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:13:23 GMT)
WyckoffDiff -- A Generative Diffusion Model for Crystal Symmetry [10.7]
本稿では,結晶の対称性に基づく記述を生成する生成モデルWyckoff Diffusionを提案する。これは全ての対称性を符号化する結晶構造表現を考えることで実現される。構成による対称性の尊重に加えて、我々のモデルの離散的性質は高速な生成を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:08:47 GMT)
Experimental demonstration of spontaneous symmetry breaking with emergent multi-qubit entanglement [10.6]
自発的対称性破壊(SSB)は相転移の発生に不可欠である。本稿では,Lipkin-Meshkov-GlickモデルにおけるSSBプロセスの実験的検討を行った。対称性破壊領域におけるこれらの量子ビット間の観測された非古典的相関は、従来のSSBの記述を超えている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:36:33 GMT)
How to Backdoor the Knowledge Distillation [10.5]
バックドアトリガを組み込んだ逆例を用いて, 蒸留データセットを戦略的に有害化する新たな攻撃手法を提案する。この技術は、教師モデルの整合性を保ちながら、生徒モデルのステルスな妥協を可能にする。本研究は,未認識の脆弱性を明らかにし,知識蒸留プロセスの確保を目的とした今後の研究の道を開くものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:19:23 GMT)
Learning Multi-view Multi-class Anomaly Detection [10.2]
MVMCAD(Multi-View Multi-Class Anomaly Detection Model)を導入し、複数のビューからの情報を統合して異常を正確に識別する。具体的には、凍結エンコーダの前にプリエンコーダの事前拡張機構を追加する半凍結エンコーダを提案する。 AAM(Anomaly Amplification Module)は、グローバルトークンのインタラクションをモデル化し、通常のリージョンを抑圧する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:59:58 GMT)
Traceback of Poisoning Attacks to Retrieval-Augmented Generation [10.2]
研究によると、RAGの毒殺攻撃に対する感受性が明らかとなり、攻撃者は知識データベースに有毒なテキストを注入した。既存の防衛は、主に推論時間の緩和に焦点を当てており、高度な攻撃に対して不十分であることが証明されている。本稿では,RAGの最初のトレースバックシステムであるRAGForensicsを紹介し,攻撃に責任を持つ知識データベース内の有毒テキストを識別する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:10:02 GMT)
MolMole: Molecule Mining from Scientific Literature [10.2]
MolMoleは、分子検出、反応図解析、光学化学構造認識を統合するビジョンベースのディープラーニングフレームワークである。分子境界ボックス,反応ラベル,MOLファイルを付加した550ページのテストセットを提示する。 MolMoleはベンチマークと公開データセットの両方で既存のツールキットよりも優れています。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:30:04 GMT)
Sparsification Under Siege: Defending Against Poisoning Attacks in Communication-Efficient Federated Learning [10.0]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。通信効率と毒殺攻撃に対する脆弱性において、大きな課題に直面している。スパースインデックスマスク検査とモデル更新符号類似性分析を統合した,新しいフェデレート学習フレームワークFLAREを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:59:13 GMT)
Simple Visual Artifact Detection in Sora-Generated Videos [10.0]
本研究では,Sora生成ビデオで頻繁に発見・報告される視覚的アーティファクトについて検討する。 4種類の共通アーティファクトラベルを対象とするマルチラベル分類フレームワークを提案する。 ResNet-50で訓練された最高の性能モデルは、平均的なマルチラベル分類精度94.14%を達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:41:43 GMT)
SAGE: A Framework of Precise Retrieval for RAG [9.9]
Retrieval-augmented Generation (RAG) は,質問応答タスクの遂行に有意義な能力を示した。 RAGメソッドはセマンティクスを考慮せずにコーパスをセグメントし、関連するコンテキストを見つけるのが困難になる。これらの制限を克服するために、RAGフレームワーク(SAGE)を導入します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:32:52 GMT)
Mcity Data Engine: Iterative Model Improvement Through Open-Vocabulary Data Selection [9.9]
我々は、完全なデータベースの開発サイクルのためのモジュールを提供するMcity Data Engineを紹介します。 Mcity Data Engineは、オープン語彙データ選択プロセスを通じて、レアクラスと新しいクラスに焦点を当てている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:10:59 GMT)
The fundamental localization phases in quasiperiodic systems: A unified framework and exact results [9.8]
混乱した量子系は、拡張、局所化、臨界の3種類の量子状態を持つ。基本アンダーソン相のすべての実現を統一するスピンフル準周期系に基づく統一的枠組みを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:45:19 GMT)
T2VEval: Benchmark Dataset and Objective Evaluation Method for T2V-generated Videos [9.7]
T2VEvalはテキスト・ビデオ品質評価のためのマルチブランチ融合方式である。テキストとビデオの一貫性、現実性、技術的品質の3つの分野にまたがるビデオを評価する。 T2VEvalは、複数のメトリクスにわたる最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:53:02 GMT)
Remote Staking with Optimal Economic Safety [9.7]
われわれは、Bitcoin保有者がアイドル資産を使ってPoSチェーンをセキュアにするための技術としてリモートステークを導入する。 PoSチェーンに安全違反が発生した場合、少なくとも3分の1のBitcoin保有株が切断される。このプロトコルのバージョンは2024年8月にメインネットにデプロイされ、その後410億USドル相当のビットコインが蓄積された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:55:26 GMT)
LLM-driven Effective Knowledge Tracing by Integrating Dual-channel Difficulty [9.7]
本稿では,新しいDual-channel Difficulty-Aware Knowledge Tracing (DDKT) フレームワークを提案する。難易度測定のための難易度バイアス対応アルゴリズムと生徒の熟達アルゴリズムが組み込まれている。本枠組みでは,(1)困難バランス知覚系列(DBPS)-学生の主観的知覚と目的的難易度, LLM評価難易度, 数理統計的難易度, および学生の主観的認識の難易度を, (2)難易度比(DMR) - 難易度ゾーンによる生徒の熟達度を正確にモデル化すること,(3)知識状態更新機構 - ゲートによるパーソナライズされた知識獲得を実現すること,の3つを紹介している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:26:23 GMT)
Improving Retrieval-Augmented Neural Machine Translation with Monolingual Data [9.7]
多くの設定では、ドメイン内のモノリンガルなターゲットサイドコーパスがしばしば利用可能である。この研究は、対象言語に直接関連するセグメントを取得することによって、そのようなリソースを活用する方法を探究する。 2つのRANMTアーキテクチャを用いた実験では、まず、制御された環境で言語横断的な目的の利点を実演する。次に,本手法を,対象のモノリンガルリソースが並列データの量よりはるかに多い実世界のセットアップに示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:41:03 GMT)
LabTOP: A Unified Model for Lab Test Outcome Prediction on Electronic Health Records [9.6]
本稿では,EHRデータに基づく言語モデリング手法を活用し,実験結果を予測する統一モデルであるLabTOPを提案する。公開されている3つのEHRデータセット上でLabTOPを評価し、既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:54:58 GMT)
Data Augmentation as Free Lunch: Exploring the Test-Time Augmentation for Sequential Recommendation [9.6]
既存の方法は、モデルトレーニング中に新しいが効果的なデータを生成し、パフォーマンスを向上させる。デプロイには、再トレーニング、アーキテクチャ修正、追加の学習可能なパラメータの導入が必要だ。モデル推論中に入力を加算し、モデルが拡張したデータに対する予測を集約し、最終的な精度を向上させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:43:41 GMT)
HOT3D: Hand and Object Tracking in 3D from Egocentric Multi-View Videos [9.5]
データセットには833分(3.7M+画像)以上の記録があり、19人の被験者が33の多様な剛体物体と相互作用している。記録には、エゴセントリックなマルチビューRGB/モノクロ画像、目視信号、シーンポイント雲、カメラ、手、オブジェクトの3Dポーズを含む複数の同期データストリームが含まれている。実験では,3次元ハンドトラッキング,モデルベース6DoFオブジェクトポーズ推定,未知のインハンドオブジェクトの3次元持ち上げという3つの一般的なタスクに対して,マルチビュー・エゴセントリックデータの有効性を実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:32:06 GMT)
Efficient Conversational Search via Topical Locality in Dense Retrieval [9.4]
我々は、応答時間を改善するために、会話クエリに固有のトピックの局所性を利用する。クエリの埋め込み類似性を活用することで,検索空間を意味的に関連するドキュメントクラスタに動的に制限する。その結果,提案システムは複雑なマルチターンクエリを高い精度と効率で効果的に処理できることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:56:34 GMT)
Ascendra: Dynamic Request Prioritization for Efficient LLM Serving [9.3]
本稿では,TTFT と TBT SLO を同時に対応させる LLM サービスシステム Ascendra について紹介する。 AscentraはGPUリソースを、低優先度と高優先度の2つのタイプのインスタンスに分割する。高優先度インスタンスは低レイテンシ実行に最適化され、期限近くで緊急リクエストを処理する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:08:38 GMT)
GarmentDiffusion: 3D Garment Sewing Pattern Generation with Multimodal Diffusion Transformers [9.2]
縫製パターンの生成モデリングは多様化した衣服を作るのに不可欠です textbftextitGarmentDiffusionは、センチメートル精度でベクトル化された3次元縫製パターンを生成できる新しい生成モデルである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:56:59 GMT)
LLMs and Finetuning: Benchmarking cross-domain performance for hate speech detection [9.2]
本研究では,ヘイトスピーチの同定における事前学習および微調整型大言語モデル(LLM)の有効性と適応性について検討した。 LLMは、事前トレーニングなしでも最先端技術に対して大きな優位性を提供します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:53:16 GMT)
ABG-NAS: Adaptive Bayesian Genetic Neural Architecture Search for Graph Representation Learning [9.1]
ABG-NASは、効率的なグラフ表現学習に適した、グラフニューラルネットワークアーキテクチャの自動検索のための新しいフレームワークである。 ABG-NASは、手動設計のGNNと最先端のニューラルアーキテクチャサーチ(NAS)の両方よりも一貫して優れている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:44:27 GMT)
Mamba Based Feature Extraction And Adaptive Multilevel Feature Fusion For 3D Tumor Segmentation From Multi-modal Medical Image [9.0]
マルチモーダルな3次元医用画像分割は、異なるモーダルの腫瘍領域を正確に同定することを目的としている。従来の畳み込みニューラルネットワーク(CNN)ベースの手法は、グローバルな特徴を捉えるのに苦労する。トランスフォーマーに基づく手法は,グローバルな文脈を効果的に捉えつつも,3次元医用画像のセグメンテーションにおいて高い計算コストに直面する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:29:55 GMT)
HateSieve: A Contrastive Learning Framework for Detecting and Segmenting Hateful Content in Multimodal Memes [9.0]
textscHateSieveは、ミーム内の憎しみのある要素の検出とセグメンテーションを強化するために設計されたフレームワークである。 textscHateSieveは、セマンティックなペアのミームを生成するContrastive Meme Generatorを特徴としている。 Hateful Memeでの実証実験では、textscHateSieveはトレーニング可能なパラメータが少なく、既存のLMMを超えるだけでなく、ヘイトフルコンテンツを正確に識別し、分離するための堅牢なメカニズムを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:30:36 GMT)
A general physics-constrained method for the modelling of equation's closure terms with sparse data [8.9]
複数の初期および境界条件から物理制約と異種データを統合した連続並列マルチネットワークアーキテクチャを提案する。我々は、未知のクロージャ項を独立にモデル化し、様々な問題にまたがる一般化性を高めるために、専門的な作業を行っている。これらの閉包モデルは正確な偏微分方程式(PDE)解法に統合され、工学的応用における複雑な予測シミュレーションに対する堅牢な解を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:41:18 GMT)
MeDSLIP: Medical Dual-Stream Language-Image Pre-training with Pathology-Anatomy Semantic Alignment [8.8]
本稿では,医療用デュアルストリーム言語-画像事前学習パイプラインであるMeDSLIPを提案する。 MeDSLIPは、病理学と解剖学的意味論を分離し、それらの関係をモデル化する。胸部X線分析にMeDSLIPを適用し、4つのベンチマークデータセットを用いて包括的評価を行う。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:21:58 GMT)
UniBiomed: A Universal Foundation Model for Grounded Biomedical Image Interpretation [8.8]
バイオメディカル画像解釈のための基礎モデルUniBiomedを紹介する。 UniBiomed は Multi-modal Large Language Model (MLLM) と Segment Anything Model (SAM) の新たな統合に基づいている UniBiomedを開発するために、画像、アノテーション、テキスト記述を10つの画像モダリティで2700万以上含む大規模なデータセットをキュレートする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:51:48 GMT)
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis [8.7]
Hexcuteはタイルベースのプログラミング言語で、共有メモリとレジスタの抽象化を公開し、混合型演算子のきめ細かい最適化を可能にする。レイアウトとタスクマッピングの合成を、新しい型推論ベースのアルゴリズムで自動化する。評価の結果,Hexcute は広い範囲の DL 演算子に一般化し,混合型演算子に対する既存の DL コンパイラよりも 1.7-11.28$times$ の高速化を実現し,エンドツーエンド評価では 2.91$times$ の高速化を実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:29:28 GMT)
Trust-Region Twisted Policy Improvement [8.7]
モンテカルロ木探索(MCTS)は、近年の深層強化学習(RL)におけるブレークスルーを招いている。我々は、制約された動作サンプリングと明示的な端末状態ハンドリングを通じて、プランナー内のデータ生成を改善することにより、RLに特化したモンテカルロプランナーをカスタマイズする。これによってTrust-Region Twisted SMC (TRT-SMC) が実現し,個別ドメインと連続ドメインの両方において,ベースラインMCTSおよびSMCメソッドのランタイムおよびサンプル効率が改善された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:05:13 GMT)
Online Federation For Mixtures of Proprietary Agents with Black-Box Encoders [8.7]
ほとんどの業界標準の生成AIとフィーチャーエンコーダはプロプライエタリであり、ブラックボックスアクセスのみを提供する。我々の問題は自然に非競合的なゲーム理論レンズに結びつく。オンライン環境におけるユニークなナッシュ均衡の存在を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:19:37 GMT)
TRUST: An LLM-Based Dialogue System for Trauma Understanding and Structured Assessments [8.6]
本研究は,臨床症状を再現するLLMを用いた対話システムを開発することにより,メンタルヘルスアクセシビリティのギャップを埋めることを目的とする。我々は、PTSDの正式な診断および評価を行うことができる協調LLMモジュールのフレームワークであるTRUSTを紹介する。臨床医による時間と費用のかかる手動テストを置き換えるために,実生活の面接書に基づく患者シミュレーション手法を開発した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:58:06 GMT)
A comparative study of deep learning and ensemble learning to extend the horizon of traffic forecasting [8.6]
本稿では,大規模実世界の信号化動脈と高速道路交通流データセットの比較研究を行う。我々は,1つのアンサンブルML手法,eXtreme Gradient Boosting (XGBoost) および様々なDeep Learning (DL) 手法を開発した。時間埋め込みはこの文脈で特に効果的であり、30日間の予測でRNNがInformerを31.1%上回るのに役立っている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:31:21 GMT)
LEyes: A Lightweight Framework for Deep Learning-Based Eye Tracking using Synthetic Eye Images [8.5]
我々は、従来の手法とは異なり、ビデオベースのアイトラッキングに必要な重要な画像のみをモデル化する「ライトアイズ」または「リーズ」というフレームワークを提案する。我々は、Leyesを用いて訓練されたモデルが、瞳孔やCRの局在の点から他の最先端アルゴリズムよりも一貫して優れていることを実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:43:45 GMT)
Omitted Labels Induce Nontransitive Paradoxes in Causality [8.5]
トレーニングデータをラベルのサブセットに限定した「省略ラベルコンテキスト」について検討する。シンプソンのパラドックスを研究することで、正しい'調整は時に交換不能な治療と制御グループを必要とすることを観察する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:09:28 GMT)
Learning Hierarchical Interaction for Accurate Molecular Property Prediction [8.5]
本稿では,新しいモデルであるHimNetの基礎となる階層的インタラクションメッセージパッシング機構を提案する。本手法は,原子,モチーフ,分子レベルでの対話型表現学習を階層的注意誘導メッセージパッシングによって実現する。本手法は, 分子の化学的直観とよく一致し, 有望な階層的解釈性を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:57:16 GMT)
Adaptive 3D UI Placement in Mixed Reality Using Deep Reinforcement Learning [8.5]
MR(Mixed Reality)は、仮想コンテンツと物理環境の視界を連続的に統合することで、ユーザのタスクを支援する。我々は,ユーザのポーズや周囲環境を認識した連続した3Dコンテンツ配置を,強化学習(RL)が支援する方法について検討している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:21:36 GMT)
Towards Understanding Depth Perception in Foveated Rendering [8.4]
立体視の深度知覚にフェーベレートレンダリングが与える影響を調べた最初の評価を行った。我々の分析では、立体視力は高レベルの周囲のぼかしの影響を受けていない(あるいは改善されている)ことが示されている。以上の結果から, 卵胞形成は立体視の深度知覚に影響を与えず, 立体視は一般的に使用されるよりも2倍強い卵胞形成を伴わないことが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:52:48 GMT)
Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals [8.4]
LVLM(Large Vision-Language Models)条件は、入力画像とテキストプロンプトの両方にテキストを生成する。入力画像に対して,異なるLVLMが生成するテキストの反実的変化を大規模に研究する。我々の多次元バイアス評価フレームワークは、画像に描かれた人種、性別、身体的特徴などの社会的属性が有害なコンテンツの生成に大きく影響することを明らかにする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:07:07 GMT)
Revisiting Diffusion Autoencoder Training for Image Reconstruction Quality [8.3]
拡散オートエンコーダ(DAE)は通常、ノイズ予測モデルとして定式化され、線形$$beta$ノイズスケジュールで訓練される。そこで本研究では,再構成画像の品質を向上する新たなDAEトレーニング手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:00:33 GMT)
Memorization and Knowledge Injection in Gated LLMs [8.3]
大規模言語モデル(LLM)は、現在、シーケンシャルに新しい記憶を追加し、新しい知識を統合するのに苦労している。 Gated LLM (MEGa) に埋め込まれたメモリは、イベントメモリを直接 LLM の重みに注入する。推論中、ゲーティング機構は、クエリの埋め込みとストアドメモリの埋め込みとをマッチングすることで、関連するメモリ重みを活性化する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:28:32 GMT)
Three-dimensional fracton topological orders with boundary Toeplitz braiding [8.2]
本研究では, (z) 方向に沿って2次元ツイスト(mathbbZ_N) 層を積み重ねて形成した3次元フラクトントポロジカル秩序について検討した。有効場の理論は無限成分チャーン・サイモンズ場理論(英語版)(iCS)によって与えられる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:09:23 GMT)
Clustering Internet Memes Through Template Matching and Multi-Dimensional Similarity [8.2]
類似のインターネットミームをクラスタ化することは、そのマルチモーダル性、文化的コンテキスト、適応性のために難しい。既存のアプローチはデータベース、見落としのセマンティクスに依存しており、類似性の多様な次元を扱うのに苦労している。本稿では,テンプレートベースのマッチングと多次元類似性特徴を用いた新しい手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:25:30 GMT)
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation [8.1]
生波形を直接操作するオーディオディープフェイク検出のためのエンドツーエンドのディープラーニングフレームワークを提案する。我々のモデルであるRawNetLiteは、手作りの事前処理なしでスペクトルと時間の両方の特徴を捉えるために設計された軽量な畳み込み並列アーキテクチャである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:32:11 GMT)
Hoist with His Own Petard: Inducing Guardrails to Facilitate Denial-of-Service Attacks on Retrieval-Augmented Generation of LLMs [8.1]
Retrieval-Augmented Generation (RAG)は、Large Language Models (LLM)を外部の知識ベースと統合し、新たなセキュリティリスクを導入しながら出力品質を改善する。 RAGの脆弱性に関する既存の研究は、典型的には不正な知識や悪意のあるテキストを注入する検索メカニズムの活用に重点を置いており、誤った出力を誘導している。本稿では, LLM の安全ガードレールの脆弱性を明らかにする。LLM の安全ガードレールは保護のために設計されているが, 敵による攻撃ベクトルとして利用することもできる。この脆弱性に基づいて, 本脆弱性を生かして, ガードレールの可利用性を損なうために, リバース・オブ・サービス・アタックである MutedRAG を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:18:11 GMT)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [8.1]
AIの安全性に対する現在のアプローチは、通常、ドメイン固有の安全性条件に対処する。我々は,AIシステムがユーザ定義制約に適合することを確実にする,新しいAI安全フレームワークを提案する。様々な分野の実験を通して、我々のフレームワークの有効性を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:06:09 GMT)
BiasGuard: A Reasoning-enhanced Bias Detection Tool For Large Language Models [8.0]
フェアネス仕様を通じて入力と理由を明示的に分析する新しいバイアス検出ツールであるBiasGuardを紹介した。 BiasGuardは2段階のアプローチで実装されている。第1段階はフェアネス仕様に基づいてモデルを明示的に推論し、第2段階は強化学習を活用して推論と判断能力を向上する。実験は5つのデータセットで行われ、BiasGuardが既存のツールより優れており、精度が向上し、過度な偏見が軽減されていることを実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:13:03 GMT)
RWKV-X: A Linear Complexity Hybrid Language Model [7.7]
我々は、短距離モデリングのためのRWKVの効率性と、長距離コンテキストをキャプチャするスパースアテンション機構を組み合わせた、新しいハイブリッドアーキテクチャであるtextbfRWKV-Xを紹介する。 RWKV-Xは,64Kパスキー検索ベンチマークにおいて,64K-tokenシーケンスで連続的に事前訓練された場合,ほぼ完全であることを示す。これらの結果から、RWKV-Xは汎用言語モデリングのスケーラブルで効率的なバックボーンであり、100万個のトークンを安定な速度とメモリ使用量で復号できることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:38:17 GMT)
A Generalized Meta Federated Learning Framework with Theoretical Convergence Guarantees [7.7]
FL(Meta Federated Learning)はFLのパーソナライズされたバージョンであり、複数のエージェントが生データサンプルを交換することなく、最初の共有モデルのトレーニングに協力する。任意の数$nu$の微調整ステップの後に、局所モデル上のエージェントの損失を最小化することにより、メタFLの一般化されたフレームワークを提案する。実世界のデータセットを用いた実験により,提案手法の精度が向上し,より高速な収束が得られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:29:46 GMT)
AdSight: Scalable and Accurate Quantification of User Attention in Multi-Slot Sponsored Search [7.7]
本稿では,マウスカーソルトラジェクトリを利用した,スケーラブルで正確なユーザ注意の定量化手法であるAdSightを紹介する。 AdSightはトランスフォーマーベースのシーケンシャル・ツー・シーケンスアーキテクチャを使用しており、エンコーダは軌道埋め込みを処理し、デコーダはスロット固有の機能を組み込む。筆者らは,(1)固定時間とカウントの予測,(2)誤り分類という2つの機械学習タスクに対するアプローチを評価し,いくつかのスロットタイプが検出された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:51:26 GMT)
CountingDINO: A Training-free Pipeline for Class-Agnostic Counting using Unsupervised Backbones [7.7]
CAC(Class-Agnostic counting)は、事前に定義されたカテゴリに制限されることなく、画像内のオブジェクト数を推定することを目的としている。現在のCAC法はトレーニングのためにラベル付きデータに大きく依存している。初となるCACフレームワークであるCountingDINOを紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:44:22 GMT)
Diff-Prompt: Diffusion-Driven Prompt Generator with Mask Supervision [7.7]
本稿では,拡散駆動型プロンプトジェネレータ(Diff-Prompt)を提案し,リッチできめ細かいプロンプト情報を生成する。 Diff-Promptは、基礎モデルと比較して、R@1で8.87、R@5で14.05の最大改善を実現している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:28:38 GMT)
Quantum adaptive imaging by position-correlated biphoton wavefront sensing [7.6]
位置相関双光子シャック・ハートマン波面センシングを導入する。プラスチックフィルムの破壊に対して位相測定および適応イメージングを行うことにより, この手法を実験的に実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:25:26 GMT)
Investigating Zero-Shot Diagnostic Pathology in Vision-Language Models with Efficient Prompt Design [7.5]
病理組織学における視覚言語モデル(VLM)の3つの状態の体系的調査と解析を行った。我々は、ドメインの特異性、解剖学的精度、命令フレーミング、出力制約を体系的に変化させる包括的なプロンプトエンジニアリングフレームワークを開発する。以上の結果から,正確な解剖学的基準が得られた場合,CONCHモデルが最も精度が高いため,迅速な工学がモデル性能に大きく影響することが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:01:06 GMT)
On the Efficacy of the Peeling Decoder for the Quantum Expander Code [7.5]
線形複雑性を持つ剥離デコーダとともに量子展開器符号を用いることを示す。また,剥離操作後に適用可能な小セットフリップ復号法などの追加手法についても論じる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:54:49 GMT)
On the expressivity of deep Heaviside networks [7.4]
ディープ・ヘビサイド・ネットワーク (DHN) は表現力に制限があるが, 接続をスキップするか, ニューロンを線形に活性化させることでこれを克服できることを示す。 Vapnik-Chervonenkis(VC)次元とこれらのネットワーククラスの近似率について下界と上界を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:25:05 GMT)
Text-Conditioned Diffusion Model for High-Fidelity Korean Font Generation [7.3]
自動フォント生成(AFG)は、スタイルイメージのごく一部の例を使用して新しいフォントを作成するプロセスである。本稿では,高品質で多様な韓国のフォント画像を生成する拡散型AFG手法を提案する。鍵となる革新はテキストエンコーダで、音素表現を処理し、正確で文脈的に正しい文字を生成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:24:49 GMT)
Nexus-Gen: A Unified Model for Image Understanding, Generation, and Editing [7.3]
Nexus-Genは,多モーダル大言語モデルの言語推論能力を,拡散モデルの画像合成能力と相乗化する統一モデルである。本稿では, 連続埋め込みではなく, 位置埋め込み型特殊トークンで入力シーケンスをプリフィルする自己回帰方式を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:30:48 GMT)
LLM-Empowered Embodied Agent for Memory-Augmented Task Planning in Household Robotics [7.3]
自律型家庭用オブジェクト管理のためのLLM駆動型エージェントオーケストレーションアーキテクチャを具現化したロボットシステムを提案する。このシステムはメモリ拡張タスク計画を統合し、過去の動作を追跡しながらロボットがハイレベルなユーザーコマンドを実行できるようにする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:00:20 GMT)
Large Language Model Agent as a Mechanical Designer [7.1]
本研究では、FEMモジュールと協調して事前訓練された大規模言語モデル(LLM)を利用して、構造設計を自律的に生成、評価、洗練するフレームワークを提案する。 LLMはドメイン固有の微調整なしで動作し、設計候補を提案し、FEMから派生した性能指標を解釈し、構造的な音響修正を適用する。 NSGA-II (Non-Sorting Genetic Algorithm II) と比較して,本手法はより高速に収束し,より少ないFEM評価を実現する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:23:36 GMT)
From Lab to Wrist: Bridging Metabolic Monitoring and Consumer Wearables for Heart Rate and Oxygen Consumption Modeling [7.1]
当社では、コンシューマグレードのウェアラブルデータのみから、即時的な酸素消費トラジェクトリを予測できる最初のフレームワークとして、包括的なフレームワークを導入しています。本手法では, 1 つの相補的生理モデルを用いて, 1 つの生理的制約付き常微分方程式(ODE)による心拍変動の正確なモデリングと, 300 万回以上の HR 観測に基づいて訓練されたニューラルカルマンフィルタを用いる。提案手法は, 約13%の平均絶対誤差を達成し, 高速な生理的遷移と各種走行強度の定常条件を効果的に捉えた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:15:00 GMT)
Towards Film-Making Production Dialogue, Narration, Monologue Adaptive Moving Dubbing Benchmarks [6.7]
アダプティブ・ダビングベンチマーク(TA-Dubbings)は、映画ダビングにおける対話、ナレーション、モノローグ、アクターに適応することで映画製作を改善するために設計された。 1) 包括次元: TA-Dubbingは映画ダビングの様々な次元をカバーし、映画理解と音声生成の両方のメトリクス評価を取り入れている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:36:18 GMT)
Learning Heterogeneous Performance-Fairness Trade-offs in Federated Learning [6.7]
HetPFL は Preference Smpling Adaptation (PSA) と Preference-aware Hypernet Fusion (PHF) から構成される。 We prove that HetPFL converges to the number of rounds, under weaker assumptions than existing method。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:25:02 GMT)
S3Former: Self-supervised High-resolution Transformer for Solar PV Profiling [6.6]
航空画像からソーラーパネルを分割し,サイズと位置情報を提供するS3Formerを紹介した。 S3FormerはMasked Attention Mask Transformerを備えている。多様なデータセットを用いてS3Formerを評価し、最先端モデルの改善を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:49:31 GMT)
Data-driven Discovery of Biophysical T Cell Receptor Co-specificity Rules [6.5]
T細胞受容体(TCR)とその細胞免疫応答との生物学的相互作用は、応答の特異性を決定する。本稿では,TCRがリガンドに特異性を共有するかどうかを予測する,生物物理規則の発見のための最適化フレームワークを提案する。本分析により, 置換アミノ酸間の立体特性のマッチングは, 進化置換性を顕著に決定する性質よりも, 共特異性レッドの方が重要であることが明らかとなった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:59:34 GMT)
Orthogonal Factor-Based Biclustering Algorithm (BCBOF) for High-Dimensional Data and Its Application in Stock Trend Prediction [6.5]
従来のクラスタリングに基づくビクラスタリングアルゴリズムは、高次元データを処理する際に2つの基本的な制限に直面している。本稿では,高次元データセットに対する直交因子に基づく二クラスタリングアルゴリズム(BCBOF)を提案する。 BCBOFは、高次元性に起因するデータ空間の問題を効果的に緩和した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:49:08 GMT)
Generative QoE Modeling: A Lightweight Approach for Telecom Networks [6.5]
本研究では,計算効率,解釈可能性,予測精度のバランスをとる軽量な生成モデリングフレームワークを提案する。ベクトル量子化(VQ)を前処理技術として用いることにより、連続的なネットワーク機能は事実上離散的な分類記号に変換される。このVQ-HMMパイプラインは、新しい未知のデータに対する確率的推論をサポートしながら、動的QoEパターンをキャプチャするモデルの能力を高める。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:19:37 GMT)
A Study on Group Decision Making Problem Based on Fuzzy Reasoning and Bayesian Networks [6.5]
本研究ではファジィ推論とベイズネットワークを統合したグループ意思決定システムを提案する。ファジィルールベースは、しきい値、会員機能、エキスパートエクスペリエンス、ドメイン知識を組み合わせて構成される。階層型ベイズネットワークが設計され、専門家が選択したノードを持つ有向非巡回グラフが特徴である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:14:48 GMT)
Efficient self-consistent learning of gate set Pauli noise [6.3]
ゲートセットパウリ雑音学習の課題について検討し、量子ゲートのセット、状態準備、測定はすべて、カスタマイズされたノイズアンサッツを備えた未知のパウリ雑音チャネルに悩まされる。ゲートノイズに関する学習可能な情報はすべて、ノイズアンザッツに関する軽度な仮定の下で、相対的精度で学習可能であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:10:21 GMT)
SAM4EM: Efficient memory-based two stage prompt-free segment anything model adapter for complex 3D neuroscience electron microscopy stacks [6.3]
我々は、電子顕微鏡(EM)データにおける複雑な神経構造の3次元分割のための新しいアプローチSAM4EMを提案する。コントリビューションには、2段マスクデコードを用いたSAM用プロンプトフリーアダプタの開発が含まれている。宇宙のプロセスとシナプスのセグメンテーションのためのユニークなベンチマークデータセットをリリースする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:38:02 GMT)
Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.3]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:43:52 GMT)
Trace-of-Thought Prompting: Investigating Prompt-Based Knowledge Distillation Through Question Decomposition [6.1]
本稿では,高リソースの教師モデルから低リソースの学生モデルへの重要な推論能力を抽出する新しいフレームワークであるTrace-of-Thought Promptingを紹介する。我々の結果は、オープンソースで低リソースのモデルが最終的には学生と教師の両方に役立てられるという、有望な道筋を示唆している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:44:09 GMT)
An Inversion Theorem for Buffered Linear Toeplitz (BLT) Matrices and Applications to Streaming Differential Privacy [5.9]
逆BLT行列のパラメータを計算するために,効率よく微分可能な$O(d3)$アルゴリズムを提案する。我々の特徴は、自動微分によるプライバシー機構のBLTパラメータの直接最適化を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:14:09 GMT)
Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German Language [5.9]
ドメイン適応型連続事前訓練(ドメイン適応型連続事前訓練、DAPT)は、言語マスキング(英語版)などの事前訓練タスクにおいて、言語モデル(LM)をさらに訓練する最先端の技術である。 In-context Learning (ICL) と k-nearest neighbors (kNN) を利用して、ドメイン関連およびドメイン内テキストによるターゲットデータの拡張を行う。以上の結果から,従来のDAPTよりも平均赤外域の3.5ポイント向上し,計算コストの約4倍の削減が期待できることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:13:15 GMT)
Conversations with AI Chatbots Increase Short-Term Vaccine Intentions But Do Not Outperform Standard Public Health Messaging [5.8]
大規模言語モデル(LLM)ベースのチャットボットは説得力のあるコミュニケーションにおける約束を示す。このランダム化対照試験には、930人のワクチンヘシタント親が関与した。自己申告されたワクチン接種意図(100ポイントスケールで7.1-10.3ポイント)は、メッセージが存在しないことに比べ、議論は著しく増加した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:22:51 GMT)
Adsorb-Agent: Autonomous Identification of Stable Adsorption Configurations via Large Language Model Agent [5.8]
本稿では,システム固有の安定な吸着構成を効率的に識別するLarge Language Model (LLM)エージェントであるAdsorb-Agentを紹介する。徹底的なサンプリングへの依存を減らすことで、必要な初期設定の数を著しく削減する。システム全体の35%で実際の世界最小値に近い低いエネルギーを達成し、従来の方法よりもはるかに少ない初期設定を必要とする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:05:27 GMT)
Characterizing AI Agents for Alignment and Governance [5.8]
本稿では,自律性,有効性,目標複雑性,汎用性という4つの側面に焦点を当てたAIエージェントの特性について述べる。このフレームワークを使って、さまざまな種類のAIエージェントのための"エージェントプロファイル"を構築します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:55:48 GMT)
DS_FusionNet: Dynamic Dual-Stream Fusion with Bidirectional Knowledge Distillation for Plant Disease Recognition [5.7]
本研究では,動的デュアルストリーム融合ネットワーク(DS_FusionNet)を革新的に提案する。このネットワークは、デュアルバックボーンアーキテクチャ、変形可能な動的融合モジュール、双方向知識蒸留戦略を統合している。実験の結果,DS_FusionNet は PlantDisease と CIFAR-10 データセットの 10% しか使用せず,90% 以上の分類精度を達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:35:15 GMT)
Opioid Named Entity Recognition (ONER-2025) from Reddit [5.6]
Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。第三に、スラング、曖昧さ、断片化を含む重要な言語課題を分析する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:34:50 GMT)
PolyQROM: Orthogonal-Polynomial-Based Quantum Reduced-Order Model for Flow Field Analysis [5.6]
量子コンピューティングは流体流動シミュレーションの指数加速度を約束する。量子符号化フローフィールドデータからフロー特徴を抽出するために必要な測定オーバーヘッドは、この利点を損なう。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:14:08 GMT)
Leveraging Motion Information for Better Self-Supervised Video Correspondence Learning [5.4]
我々は,効率的な自己教師型ビデオ対応学習フレームワークを開発した。まず、ビデオ中の物体の動的動きをキャプチャーすることを強調するモーションエンハンスメントエンジンを設計する。さらに,画素間対応情報に対するフレキシブルサンプリング戦略を導入する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:58:56 GMT)
Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction [5.4]
本稿では,複数の参照フレームを用いた動的メモリ予測フレームワークを提案する。提案アルゴリズムは,2つの細粒度ビデオオブジェクト追跡タスクにおいて,最先端の自己教師技術より優れる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:29:04 GMT)
Extended convexity and smoothness and their applications in deep learning [5.3]
本稿では,ディープラーニングにおける非滑らかな最適化のメカニズムを明らかにすることを目的とする。解析の結果、勾配降下法(SGD)アルゴリズムは経験的リスクを効果的に最小化できることが示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:16:13 GMT)
A Report on the llms evaluating the high school questions [5.3]
本報告は,高等学校理科の課題解決における大規模言語モデル(LLM)の性能評価を目的とする。正確性、応答時間、論理的推論、創造性といった指標に基づいて総合的な評価を行った。その結果, LLMは特定の面において優れた性能を発揮するが, 論理的推論や創造的問題解決にはまだ改善の余地があることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:54:23 GMT)
Public Opinion and The Rise of Digital Minds: Perceived Risk, Trust, and Regulation Support [5.0]
本研究では,機関やAI技術に対する公的な信頼と,認識されるリスク,AI規制の形式的嗜好について検討する。政府への信頼が高い人は規制を支持するが、AI企業やAI技術への信頼が高い人は規制を支持する傾向が低い。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:56:23 GMT)
SimPRIVE: a Simulation framework for Physical Robot Interaction with Virtual Environments [5.0]
本稿では,仮想環境との物理的相互作用をシミュレーションするSimPRIVEを提案する。 SimPRIVEを使用することで、ROS 2上で動作する任意の物理移動ロボットは、Unreal Engine 5グラフィックエンジンで構築された仮想世界でデジタルツインを動かせるように構成することができる。このフレームワークは、AgileX Scout Miniローバーで障害物回避のためにトレーニングされた強化学習エージェントをテストすることで検証されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:22:55 GMT)
Whispers of Data: Unveiling Label Distributions in Federated Learning Through Virtual Client Simulation [4.8]
Federated Learningは、データ共有を必要とせずに、地理的に分散した複数のクライアントにわたるグローバルモデルの協調トレーニングを可能にする。推論攻撃、特にラベル推論攻撃の影響を受けやすい。本稿では,様々なシナリオに対して安定かつ適応可能な新しいラベル分布推定攻撃を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:51:06 GMT)
Enhancing Security and Strengthening Defenses in Automated Short-Answer Grading Systems [4.8]
本研究は,変圧器を用いた医学教育における短期回答自動評価システムにおける脆弱性について検討する。 3種類のゲーム戦略がシステムの弱点を悪用し、偽陽性につながる可能性がある。これらの脆弱性に対処するため、システムの堅牢性を高めるために、いくつかの敵の訓練手法を実装した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:53:09 GMT)
Historically Relevant Event Structuring for Temporal Knowledge Graph Reasoning [4.7]
時間的知識グラフ(TKG)推論は、タイムライン上に配布されたスナップショット内の履歴情報を通じてイベントを予測することに焦点を当てる。我々は、textbfHistorally textbfRelevant textbfEvents textbfStructuring (HisRES) に対する革新的なTKG推論手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:15:37 GMT)
Semantic Positive Pairs for Enhancing Visual Representation Learning of Instance Discrimination Methods [4.7]
インスタンス識別に基づく自己教師付き学習アルゴリズム(SSL)は有望な結果を示している。類似したセマンティックコンテンツを用いてそれらの画像を識別し、肯定的な例として扱うアプローチを提案する。我々は、ImageNet、STL-10、CIFAR-10の3つのベンチマークデータセットで、異なるインスタンス識別SSLアプローチで実験を行った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:47:32 GMT)
An Evaluation of a Visual Question Answering Strategy for Zero-shot Facial Expression Recognition in Still Images [4.6]
顔表情認識(FER)は、コンピュータビジョンと人間とコンピュータの相互作用において重要な研究領域である。近年のディープラーニングの進歩にもかかわらず、特に新しいシナリオへの一般化には課題が続いている。この問題に対処するため、コミュニティは最近、視覚的なタスクのためのLarge Language Modelsからの知識の統合を探り始めた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:38:05 GMT)
Out-of-time-order correlator computation based on discrete truncated Wigner approximation [4.6]
本稿では,時間外相関器を計算するための離散的な Wigner 近似 (DTWA) に基づく手法を提案する。この研究は、長距離相互作用量子スピン系のスクランブルダイナミクスを研究するための新しい技術を提供し、実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:23:26 GMT)
Enhancing Health Mention Classification Performance: A Study on Advancements in Parameter Efficient Tuning [4.6]
HMC(Health Mention Classification)は、ソーシャルメディアの投稿をリアルタイムのトラッキングや公衆衛生モニタリングに活用する上で重要な役割を担っている。我々は、バイオメディカル自然言語法(NLP)のパラメータを改良した従来の微調整により、より明確な言及が達成できると主張している。本研究では,音声タグ情報の利用,PEFT技術の改良,その組み合わせなど,さまざまな手法について検討する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:21:54 GMT)
Wireless Communication as an Information Sensor for Multi-agent Cooperative Perception: A Survey [4.6]
協調認識は、V2X通信によるマルチエージェント情報共有を可能にすることにより、自動運転車の知覚能力を高める。本調査では,情報表現,情報融合,大規模展開という3つの重要な側面に注目した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:23:57 GMT)
Probing the Quantum Capacitance of Rydberg Transitions of Surface Electrons on Liquid Helium via Microwave Frequency Modulation [4.6]
本稿では,液体ヘリウム上の表面電子のリドベルク転移に伴う量子容量を求める方法を提案する。ライドバーグ転移の共鳴マイクロ波励起は、容量結合された電極上での画像電荷の再分配を誘導する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:37:34 GMT)
MultiMind: A Plug-in for the Implementation of Development Tasks Aided by AI Assistants [4.5]
MultiMindは、AI支援開発タスクの作成を効率化するVisual Studioプラグインである。ひとつはコードコメントの自動生成のためのもので、もうひとつはAIによるチャットの定義に関するものだ。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:54:49 GMT)
Efficient hybrid variational quantum algorithm for solving graph coloring problem [4.5]
本稿では,グラフ頂点の$k$-coloring問題を解くために,ハイブリッド変分量子アルゴリズムを提案する。フィードバック修正とコンフリクト解決を統合した階層的なフレームワークを使用して、$k$-coloringを実現しています。提案手法を用いて、地下鉄の交通ネットワークのスケジューリングを最適化し、高い公平性を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:45:15 GMT)
Universal contributions to charge fluctuations in spin chains at finite temperature [4.4]
我々は、$gamma(theta)$が、すべての例に対して$theta=pi$である孤立点においてのみ非ゼロ値を取ることを示す。 2つの模範格子系において、U(1)対称性が他の対称性と特定のタイプの「t Hooft」異常を示すとき、$gamma(pi)$が量子化された値を取ることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:34:05 GMT)
Assessing Racial Disparities in Healthcare Expenditures Using Causal Path-Specific Effects [4.4]
本研究は, 社会経済的地位, 保険アクセス, 健康行動, 健康状態など様々な要因が, これらの格差を媒介する要因を定量化するために, 因果的および反ファクト的経路特異的な効果を用いる。特定のメディエーターの価値が、選択された因果経路に沿って人種グループ間で一致した反ファクトなシナリオにおいて、支出がどのように異なるかを推定する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:23:50 GMT)
Consistency-aware Fake Videos Detection on Short Video Platforms [4.3]
本稿では,ショートビデオプラットフォーム上でのフェイクニュースの検出に焦点をあてる。既存のアプローチは通常、分類層を適用する前に生のビデオデータとメタデータの入力を組み合わせる。この知見に触発された本研究では,クロスモーダルな矛盾を明示的に識別し,活用する新たな検出パラダイムを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:26:04 GMT)
Scalable and modular generation of multipartite entangled states through memory-enhanced fusion [4.2]
フォトニック・インターコネクトによる2つの多部交絡状態のメモリ拡張融合を実現する。 2つのリモート量子メモリモジュールで共有される4つのパーティのW状態の絡み合いを実演する。マルチパートの絡み合った状態のスケーラブルな生成と融合は、大規模分散量子情報処理の実現への道を開く。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:53:09 GMT)
SustainDC: Benchmarking for Sustainable Data Center Control [4.2]
データセンター(DC)のためのマルチエージェント強化学習(MARL)アルゴリズムをベンチマークするためのPython環境セットであるSustainDCを紹介する。 SustainDCは、ワークロードスケジューリング、冷却最適化、補助バッテリー管理などのカスタムDC構成とタスクをサポートする。 SustainDC上での各種MARLアルゴリズムの評価を行い, 各種DC設計, 位置, 気象条件, グリッドカーボン強度, 負荷負荷条件などを検討した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:01:16 GMT)
Inferring the Langevin Equation with Uncertainty via Bayesian Neural Networks [4.1]
本稿では、ベイズニューラルネットワークを用いてランゲヴィン方程式を過度に損傷された状態と過度に損傷された状態の両方で推定する包括的枠組みを提案する。一つの値ではなく予測の分布を提供することで,予測の不確実性を評価することができる。ニューロンモデルや顕微鏡エンジンを含む様々なシナリオに対してランゲヴィン方程式を推定する際のフレームワークの有効性を実証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:08:49 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [4.0]
マルチソースプロンプト転送のための適応フレームワークであるHGPromptを提案する。まず,情報理論による特徴の伝達性の評価手法を提案する。そこで我々は,プロンプト間の勾配衝突を軽減するために,新しい勾配アライメント正規化を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:43:33 GMT)
In a Few Words: Comparing Weak Supervision and LLMs for Short Query Intent Classification [4.0]
ユーザ意図の分類を,情報カテゴリ,ナビゲーションカテゴリ,トランザクションカテゴリに経験的に比較する。以上の結果から,LSMはリコール時の監督能力が劣る一方で,精度の低下に悩まされ続けていることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:54:04 GMT)
BCAT: A Block Causal Transformer for PDE Foundation Models for Fluid Dynamics [4.0]
BCATは2次元流体力学問題に対する解の自動回帰予測のための基礎モデルである。我々のアプローチはブロック因果アーキテクチャを用いて次のフレーム予測をモデル化し、画像生成法で一般的に使用されるサブフレームやピクセルベースの入力のみに頼るのではなく、以前のフレームをコンテキスト優先として活用する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:02:41 GMT)
Comparison of Different Deep Neural Network Models in the Cultural Heritage Domain [4.0]
コンピュータビジョンの分野では2つのディープラーニングパラダイムが確立されている。 DenseNetは効率-計算可能性比の点で最高です。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:38:20 GMT)
The Planted Orthogonal Vectors Problem [4.0]
適度に選択された$p$に対して、d.$p$-biasedエントリを持つベクトル間で解を植え付ける方法を見つけ、植込みされた解が一意である。我々の予想では、結果として生じる$k$-OVインスタンスは、解決する時間$nk-o(1)$を必要としている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:13:11 GMT)
First Order Logic with Fuzzy Semantics for Describing and Recognizing Nerves in Medical Images [4.0]
本稿では, 医用画像における繊維束, 特に神経の描写と認識について述べる。解剖学の教科書に見られる神経の内在的に不正確な記述は、ファジィ意味論と一階述語論理を組み合わせて提案することにつながる。解剖学的および拡散磁気共鳴画像からの神経の分画と認識のための空間的推論アルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:41:04 GMT)
PANGAEA: A Global and Inclusive Benchmark for Geospatial Foundation Models [3.9]
PANGAEAは標準化された評価プロトコルであり、さまざまなデータセット、タスク、解像度、センサーのモダリティ、時間性をカバーする。我々は、このベンチマークで利用可能な最も人気のあるGFMを評価し、その性能を複数のドメインで分析する。本研究は, GFMの限界を, 異なるシナリオ下で強調し, 教師付きモデルよりも常に優れていないことを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:17:21 GMT)
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring? [3.7]
大規模言語モデル (LLM) は自動エッセイ・スコーリング (AES) で広く使われている。本研究は,学生の属性の予測力と評価課題における評価バイアスとの関係について検討した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:36:28 GMT)
AC-Lite : A Lightweight Image Captioning Model for Low-Resource Assamese Language [3.7]
この研究は、低リソースのアサメ言語における画像キャプションのための計算効率の良いモデルであるAC-Liteを提示する。 ShuffleNetv2x1.5とGRUベースの言語デコーダの組み合わせと双線形アテンションは、最小限の計算で最高のパフォーマンスを提供する。 AC-Liteは2.45 GFLOPと22.87Mパラメータを持つCOCO-ACデータセットで82.3 CIDErスコアを達成した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:01:00 GMT)
Performativity and Prospective Fairness [3.7]
本稿では,因果的下流結果変数に対するアルゴリズム的効果に着目した。我々は、このような政策が労働市場の男女不平等を悪化させるかどうかを予測する方法を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:11:15 GMT)
Hypercontractivity for Quantum Erasure Channels via Variable Multipartite Log-Sobolev Inequality [3.7]
我々は、量子消去チャネルの産物に対して、ほぼ最適な超収縮不等式を証明した。これは、固定状態を持たない量子チャネルに対して束縛された最初のテンソル化型超収縮率である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:41:02 GMT)
A simple and effective approach for body part recognition on CT scans based on projection estimation [3.5]
本研究は, 身体領域同定のための3次元CTスキャンの2次元X線的推定に基づく, 単純かつ効果的なアプローチを提案する。提案手法では,14個の異なる身体領域を識別するために推定された2次元画像を用いて,高品質な医療データセットの構築に有用な情報を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:13:44 GMT)
Cascade Detector Analysis and Application to Biomedical Microscopy [3.5]
多解像度画像中のスパース物体を効率よく同定するためにカスケード検出器を用いる。マルチレベル検出器は30～75%の時間で同等の性能を発揮することを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:58:30 GMT)
Meeseeks: An Iterative Benchmark Evaluating LLMs Multi-Turn Instruction-Following Ability [3.4]
Meeseeksは反復的なフィードバックプロセスを通じて現実的な人間とLLMのインタラクションをシミュレートする。この設計により、モデルは特定の要求障害に基づいて自己修正できる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:28:19 GMT)
Estimation of discrete distributions in relative entropy, and the deviations of the missing mass [3.4]
我々は、相対エントロピーで測定された精度で、I.d.サンプルから有限アルファベット上の分布を推定する問題について検討する。最適なリスク境界が知られているが、高い確率保証は十分に理解されていない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:47:10 GMT)
Identifying Critical Dependencies in Large-Scale Continuous Software Engineering [3.4]
継続的ソフトウェアエンジニアリング(CSE)は業界で広く採用されており、継続的インテグレーションや継続的デプロイメント(CI/CD)といったプラクティスを統合している。大規模な製品開発におけるこれらのアクティビティの調整には、複数の利害関係者が関与し、複雑さが増します。本研究は,大規模CSEにおける重要な依存関係を特定し解析することで,この複雑さに対処することを目的とする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:52:32 GMT)
Redundancy Analysis and Mitigation for Machine Learning-Based Process Monitoring of Additive Manufacturing [3.4]
過剰な冗長性は、機器コストの増加、モデル性能の損耗、高い計算要求をもたらす。本稿では,MLに基づくAMプロセス監視における冗長性を定義し,それをサンプルレベル,特徴レベル,モデルレベルの冗長性に分類する。データ登録やダウンスケール,モダリティ間の知識伝達,モデルプルーニングといった高度な手法を取り入れた,総合的マルチレベル冗長性緩和(MLRM)フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:04:53 GMT)
Generative AI in Financial Institution: A Global Survey of Opportunities, Threats, and Regulation [3.4]
ジェネレーティブ・人工知能(GenAI)は、グローバルな金融環境を急速に変えつつある。この調査は、金融エコシステム全体でのGenAI採用の概要を提供する。我々は、AI生成フィッシング、ディープフェイク対応詐欺、AIシステムに対する敵攻撃など、新たな脅威について議論する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:25:30 GMT)
Exploiting Defenses against GAN-Based Feature Inference Attacks in Federated Learning [3.4]
フェデレートラーニング(FL)は、データプライバシを維持しながら、孤立したデータアイランドをマージすることを目的としている。近年の研究では、GANベースの攻撃をFLで使用して、プライベートデータセットの分布を学習できることが示されている。攻撃者が被害者のデータの実際の分布を学習するのを防ぐためのフレームワークであるAnti-GANを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:09:54 GMT)
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles [3.4]
ドメイン不変点クラウド認識のためのマルチビュー構造畳み込みネットワーク(MSCN)。 MSCNは、ポイントクラウドから局所的なコンテキスト幾何学的特徴を抽出する構造畳み込み層(Structure Convolution Layers, SCL)から構成される。 MSCNは、ソースドメインポイントクラウドから派生した見えないドメインポイントクラウドでトレーニングすることで、機能表現を強化する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:17:09 GMT)
A Test Suite for Efficient Robustness Evaluation of Face Recognition Systems [3.4]
RobFaceは、顔認識システムの堅牢性を評価するための効率的で使いやすい方法である。これには、顔認識システムの堅牢性を包括的に評価するように設計された、転送可能な対向顔画像が含まれている。私たちの知る限り、RobFaceはシステムに依存しない最初のロバストネス推定テストスイートです。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:27:08 GMT)
Vision Transformers in Precision Agriculture: A Comprehensive Survey [3.2]
ViT(Vision Transformers)は、長距離依存の処理の改善や視覚タスクのスケーラビリティ向上といったメリットを提供する。本調査では, 精密農業へのViTsの適用について検討し, 分類から検出, セグメンテーションまで, タスクをカバーした。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:50:02 GMT)
Hierarchical Multi-Label Generation with Probabilistic Level-Constraint [3.1]
階層的極端多ラベル分類は、従来の多ラベル分類よりも困難である。我々は,確率的レベル制約(PLC)を用いた生成フレームワークを用いて,特定の分類体系内で階層的なラベルを生成する。提案手法は,HMGタスクにおいて新たなSOTA性能を実現するが,従来の研究結果よりもモデル出力の制約に優れた性能が得られる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:56:53 GMT)
Enhanced Semi-Supervised Stamping Process Monitoring with Physically-Informed Feature Extraction [3.0]
本研究では、加速度計信号と物理情報を利用して、プロセス異常を効果的に捕捉する半教師付きプロセス内異常監視フレームワークを提案する。提案フレームワークは,プロセス内状態をリアルタイムで監視し,バッチ異常を防止できる不均衡なサンプル分布をもつモニタリングモデルの構築を容易にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:42:19 GMT)
A Unified Variational Framework for Quantum Excited States [2.9]
制約を克服する新しい変動原理を導入し、複数の低エネルギー励起状態のテキスト同時決定を可能にする。様々な物理システムと変分アンサーゼにまたがって,この手法のパワーと汎用性を実証する。全ての応用において、この手法は複数の最低エネルギーレベルとその対応する状態を正確に同時に取得する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:28:04 GMT)
vApps: Verifiable Applications at Internet Scale [2.9]
検証可能なアプリケーション(vApps)は、検証可能なコンピューティングアプリケーションの作成とデプロイを効率化するために設計された、新しい開発フレームワークである。 vAppsは、包括的なSDK内でRustベースのドメイン特化言語(DSL)を統一する。これにより、多様なソフトウェアコンポーネントの確保に対する開発者の負担が軽減され、アプリケーションロジックに集中できるようになる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:34:34 GMT)
Investigating Opportunities for Growth and Increased Diversity in Quantum Information Science and Engineering Education in the U.S. based on an Analysis of the Current Educational Landscape [2.9]
量子情報科学・工学(QISE)は、幅広い分野において急速に関心を集めている。初歩的なQISEコースを特徴づける努力が進行中であるが、米国全体のQISE教育に関する包括的理解はいまだに不足している。本稿では、米国の高等教育におけるQISEコースと学位課程の現況を特徴づける取り組みの一環として、現在進行中の取り組みについて述べる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:18:01 GMT)
Security-by-Design at the Telco Edge with OSS: Challenges and Lessons Learned [2.9]
本稿では、産業R&Dプロジェクトにおいて、PON(Passive Optical Network)インフラストラクチャ上でエッジコンピューティングを行うプラットフォームであるGENIOをセキュアにし、オープンソースソフトウェア(OSS)をベースとした経験について述べる。我々は、ハードニング、脆弱性管理、デジタルシグネチャ、静的および動的解析を通じて脅威と関連する緩和を識別する。特に、OSSを用いてこれらの緩和を適用した際の教訓を報告し、これらのセキュリティソリューションの成熟度と限界に関する知見を産業的文脈で共有する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:27:09 GMT)
Quantum Annealing Algorithms for Estimating Ising Partition Functions [2.8]
イジングスピングラスの分割関数の推定は、統計物理学、最適化、機械学習において重要である。この研究は量子力学を計算複雑性で橋渡しし、スピングラス熱力学における量子優位性への実践的な経路を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:09:40 GMT)
How to Construct Random Unitaries [2.8]
量子セキュアな片方向関数が存在すると仮定して、PRUが存在することを証明する。本研究では,Haar-randomユニタリに対するクエリを量子コンピュータ上で効率的にシミュレートできることを証明した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:07:38 GMT)
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline [2.8]
YouTube ShortsやTikTokのようなショートビデオプラットフォームは、著作権の遵守という大きな課題に直面している。侵害者は、しばしば任意のバックグラウンド音楽(BGM)を、不明瞭なオリジナルサウンドトラック(OST)に埋め込む。音楽音源分離(MSS)と相互モーダルビデオ音楽検索(CMVMR)を統合した新しいパイプラインを提案する。提案手法は、任意のBGMを元のOSTから効果的に分離し、真のビデオオーディオトラックの復元を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:17:05 GMT)
Fine-Tuning LLMs for Low-Resource Dialect Translation: The Case of Lebanese [2.8]
本稿では,低リソースレバノン方言の翻訳におけるLarge Language Models(LLMs)の有効性について検討する。我々は,オープンソースのAya23モデルを用いて,基本,コントラスト,文法ヒントチューニングの3つの微調整手法を比較した。実験では、小さなが文化的に認識されているレバノンのデータセットに基づいて微調整されたモデルが、大規模で非ネイティブなデータでトレーニングされたモデルよりも一貫して優れていることが明らかになった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:33:53 GMT)
On-chip Frequency divider in superconducting quantum circuit [2.8]
マイクロ波光子の周波数分割は、2つの量子過程からなる。超伝導周波数分割器によって生成されたマイクロ波およびパルス信号は、超伝導量子ビットをポンプまたはリードアウトするために使用することができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:28:11 GMT)
Optimizing Mouse Dynamics for User Authentication by Machine Learning: Addressing Data Sufficiency, Accuracy-Practicality Trade-off, and Model Performance Challenges [2.7]
本稿では,ApEn(Adroximate Entropy)を利用してセグメント長を最適化し,効率よく表現できるマウス認証ユニット(MAU)を提案する。本研究では,局所時間マウス認証(LT-AMouse)フレームワークを設計し,局所特徴抽出のための1D-ResNetと長期時間依存性のモデリングのためのGRUを統合した。我々のモデルは、DFLデータセットに対する盲点攻撃でAUC 98.52%、バラビットデータセットで94.65%を達成し、現在のソタのパフォーマンスを上回った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:16:52 GMT)
A Unit Proofing Framework for Code-level Verification: A Research Agenda [2.7]
本稿では,方法論とツールの両面から,単体証明フレームワークの研究課題を提案する。これにより、エンジニアはコードレベルの欠陥を早期に発見できる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:34:05 GMT)
BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts [2.7]
BiPrompt-SAMは、新しいデュアルモーダルプロンプトセグメンテーションフレームワークである。複雑なモデル修正なしに、空間的精度と意味的文脈を融合する。これはEndovis17の医療データセット上で強力なゼロショットパフォーマンスを達成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:42:34 GMT)
A Memetic Algorithm based on Variational Autoencoder for Black-Box Discrete Optimization with Epistasis among Parameters [2.7]
ブラックボックス離散最適化(BB-DO)問題は、多くの現実世界のアプリケーションで発生する。 BB-DOの主な課題は、複数の変数を同時に修正しなければならないパラメータ間のエピスタシスである。本稿では,VAEに基づくサンプリングと局所探索を組み合わせた新しいメメティックアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:56:22 GMT)
Explorations of the Softmax Space: Knowing When the Neural Network Doesn't Know [2.7]
本稿では,ニューラルネットワークの予測に対する信頼度を計測するための新しい手法を提案する。高い精度でトレーニングされたネットワークは、信頼度が低いべき特定の出力を持つ可能性があると確認する。精度評価において,全ての正しい予測に対する平均ソフトマックス出力として計算されたセントロイドのクラスタが適切なプロキシとして有効であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:19:55 GMT)
Let Network Decide What to Learn: Symbolic Music Understanding Model Based on Large-scale Adversarial Pre-training [2.6]
マスク言語モデル(MLM)は、自然言語処理(NLP)における人種差別差別のようなバイアス問題を導入するかもしれない本稿では,ランダムマスキングではなく,マスカネットワークを介してマスクすべきものを適応的に決定する,SMU用Adversarial-MidiBERTを提案する。提案手法は4つのSMUタスクにまたがって評価し,全てのケースにおいて優れた性能を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:22:05 GMT)
Seasonal Prediction with Neural GCM and Simplified Boundary Forcings: Large-scale Atmospheric Variability and Tropical Cyclone Activity [2.6]
機械学習モデルは天気予報で成功し、気候シミュレーションの進歩を見せている。本稿では,ML-物理ハイブリッド大気モデルであるNeuralGCMを用いて,大規模な大気変動と北半球熱帯サイクロン(TC)活動の季節予測を行った。特に、北大西洋と東太平洋の流域におけるTC周波数の予測技術は、既存の物理モデルに匹敵する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:42:16 GMT)
Synergy-CLIP: Extending CLIP with Multi-modal Integration for Robust Representation Learning [2.6]
マルチモーダル表現学習を強化するために,コントラスト言語イメージ事前学習(CLIP)アーキテクチャを拡張するフレームワークであるSynergy-CLIPを提案する。個々のモダリティをバニラCLIPに適応することに集中する既存の方法とは異なり、Synergy-CLIPは3つのモダリティにまたがる潜伏情報を等しく整列してキャプチャする。 VGG-sound+は、視覚、テキスト、音声データの等スケール表現を提供するために設計された3つのモーダルデータセットである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:14:58 GMT)
Skin Effect Induced Anomalous Dynamics from Charge-Fluctuating Initial States [2.5]
不定粒子数を持つペアリング状態における非相互クエンチダイナミクスについて検討する。非ハーモニティ性は進化の初期段階において絡み合いの増大を促進する可能性がある。この結果から,U(1)対称性の回復における量子ムペンバ効果の存在が明らかになった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:33:10 GMT)
Improved Lanczos Algorithm using Matrix Product States [2.4]
我々はPhys. B 85, 205119 (2012) で提案された行列積状態表現を用いてLaczosアルゴリズムを改良する。密度行列再正規化群(DMRG)の代替として、Lanczosアルゴリズムは局所ミニマを避け、複数の低次固有状態を直接見つけることができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:45:25 GMT)
Partial Knowledge Distillation for Alleviating the Inherent Inter-Class Discrepancy in Federated Learning [2.4]
クラスバランス学習においても、ある種の弱いクラスが一貫して存在することを観察する。クラス間精度の差は、FashionMNISTとCIFAR-10データセットのフェデレーション学習で36.9%以上に達する。弱いクラスに対するモデルの分類精度を向上させるために, 部分的知識蒸留法(PKD)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:40:52 GMT)
Towards Robust and Generalizable Gerchberg Saxton based Physics Inspired Neural Networks for Computer Generated Holography: A Sensitivity Analysis Framework [2.4]
コンピュータ生成ホログラフィー(CGH)はホログラフィック拡張現実(AR)、3Dディスプレイ、システム神経科学、光学トラップの応用を可能にする。 CGHの基本的な課題は、強度測定による位相検索の逆問題を解決することである。 GS-PINNの性能に対するFMHの影響を定量化するために,SaltelliによるSobol法の拡張に基づく系統的感度分析フレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:49:33 GMT)
Multi-Goal Dexterous Hand Manipulation using Probabilistic Model-based Reinforcement Learning [2.3]
本稿では,モデルに基づく強化学習を用いて,多目的手操作タスクの学習に挑戦する。本稿では,高次元手動特性を記述するためのゴールコンディション型確率モデル予測制御(GC-PMPC)を提案する。ケーブル駆動のDexterousハンドDexHand 021を12個のアクティブDOFと5個の触覚センサーで駆動し、約80分以内に3つのゴールポーズにキュービッドダイの操作を学習する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:44:38 GMT)
Adversarial Data Poisoning Attacks on Quantum Machine Learning in the NISQ Era [2.3]
量子機械学習(QML)ドメインにおける重要な関心事は、現在の量子クラウド設定におけるデータ中毒攻撃の脅威である。本研究ではまず,符号化回路の出力を分析することで,クラス内エンコーダ状態類似度(ESS)を簡易かつ効果的に測定する手法を提案する。ノイズのない環境とノイズの多い環境の両方で行われた広範な実験を通じて、我々は、UnderlineQuantum UnderlineIndiscriminate UnderlineData Poisoning attack, QUIDを紹介した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:42:33 GMT)
Data-driven operator learning for energy-efficient building control [2.3]
本稿では,CFDの物理精度と機械学習の計算効率を組み合わせ,エネルギー効率の高い建築換気制御を実現するためのデータ駆動型フレームワークを提案する。我々は,高分解能CFDデータを用いて,制御動作から気流分布へのマッピングを学習するために,ニューラル演算子変換器を訓練する。提案手法は, 地域平均CO2予測に基づく最大流量制御, ルールベース制御, およびデータ駆動制御と比較して, 大幅な省エネを実現していることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:45:49 GMT)
V3LMA: Visual 3D-enhanced Language Model for Autonomous Driving [2.3]
本稿では,LVLMとLLM(Large Language Models)を統合することで,3次元シーン理解を向上させる新しいアプローチであるV3LMAを紹介する。 V3LMAは、オブジェクト検出やビデオ入力から生成されたテキスト記述を活用し、微調整を必要とせずに性能を大幅に向上させる。本稿では,複雑な交通シナリオにおける状況認識と意思決定を改善し,LingoQAベンチマークのスコア0.56を達成している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:00:37 GMT)
Stochastic Subspace Descent Accelerated via Bi-fidelity Line Search [2.3]
本研究では,新しいゼロ階最適化法であるBF-SSDアルゴリズムを導入する。 BF-SSDは、高忠実度評価を著しく少なくしながら、優れた最適化性能を継続的に達成する。本研究は,BF-SSDを有望かつ計算効率のよいアプローチとして位置づけ,ゼロ階最適化における両忠実性の統合の有効性を強調した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:17:35 GMT)
Fast2comm:Collaborative perception combined with prior knowledge [2.3]
我々は,従来の知識に基づく協調認識フレームワークであるFast2commを提案する。具体的には,前景と背景を効果的に区別する事前教師付き信頼度特徴生成手法を提案する。また,GTバウンディングボックスを用いた空間的事前特徴選択手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:32:47 GMT)
VDDP: Verifiable Distributed Differential Privacy under the Client-Server-Verifier Setup [2.2]
この研究は、分散クライアントサーバ検証セットアップ内の一般的な差分プライバシーフレームワークにおける悪意ある振る舞いを分析する。本稿では,新たな検証機構を導入して,VDDP(Verible Distributed Differential Privacy)という新しい定義を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:46:55 GMT)
Assessing LLM code generation quality through path planning tasks [2.2]
異なる経路計画アルゴリズムのコードを生成する6つのLSMの能力を評価し, 様々な難易度を持つ3つのマップで検証した。この結果から, LLM生成コードは経路計画アプリケーションにとって重大な危険を伴い, 厳密なテストなしには安全クリティカルな文脈では適用できないことが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:11:54 GMT)
The FFT Strikes Again: A Plug and Play Efficient Alternative to Self-Attention [2.2]
SPECTREはTransformer推論のためのドロップイン周波数ドメインミキサーである。 PG-19 と ImageNet-1k では、SPECTRE は FlashAttention-2 よりも 7 倍速い速度で実行しながら、二次的な注意をそろえるか超えている。四角い壁を長距離の推論のために対数ランプに置き換える。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:14:57 GMT)
Participatory AI, Public Sector AI, Differential Privacy, Conversational Interfaces, Explainable AI, Citizen Engagement in AI [2.2]
本稿では,パブリックセクターアプリケーションにおけるAIシステムの参加型設計を可能にする対話型インタフェースシステムを提案する。我々の研究は、対話インタフェースがアルゴリズムのプライバシメカニズムにおける公的なエンゲージメントをいかに向上させるかを示すことによって、参加型AIの実践を前進させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:10:50 GMT)
Testing CPS with Design Assumptions-Based Metamorphic Relations and Genetic Programming [2.2]
CPS(Cyber-Physical Systems)ソフトウェアは、物理的なシステムに望ましい振る舞いを強制するために使用される。 CPSの要件は、実際の物理的トレースがどの程度、所望のトレースを追跡するべきかを記述している。本研究は,要求ではなく制御理論的な設計仮定を用いてCPSをテストする手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:22:21 GMT)
A Preliminary Investigation on the Usage of Quantum Approximate Optimization Algorithms for Test Case Selection [2.2]
この研究は、テストケースの選択に量子近似最適化アルゴリズム(QAOAs)の使用を想定している。 QAOAsは、ゲートベースの量子マシンのポテンシャルと、断熱進化の最適化能力とを融合する。この結果から,QAOAsは効率面ではSelectQAに匹敵する性能を示しながら,ベースラインアルゴリズムよりも優れた性能を示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:10:50 GMT)
Gaussian process surrogate model to approximate power grid simulators -- An application to the certification of a congestion management controller [2.1]
電力グリッドのデジタル化により、物理方程式はネットワークの振舞いを記述するのに不十分になる。多数のシナリオをシミュレートする安全性検証のような数値実験は、計算的に難解になる。一般的な解決策は、シミュレータのサロゲートモデルを機械学習(ML)で学習し、高速で評価可能なサロゲートモデルで直接実験を実行することである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:29:06 GMT)
Erasure Minesweeper: exploring hybrid-erasure surface code architectures for efficient quantum error correction [2.1]
本稿では,表面符号誤り訂正のためのハイブリッド・エミッションアーキテクチャを提案する。クォービットのサブセットは消去キュービットとして指定され、残りは標準のままである。ハイブリット・エミッション・アーキテクチャは,表面コードの性能を向上させることができることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:57:43 GMT)
Safe and Efficient CAV Lane Changing using Decentralised Safety Shields [2.1]
レーン変更はコネクテッド・アンド・オートマチック・ビークル(CAV)の複雑な意思決定問題である我々は、最適化とルールに基づく安全保証アプローチを組み合わせた分散ハイブリッド安全シールド(HSS)を提案する。本手法は,CAVの縦方向および横方向の制御入力を拘束するために制御障壁関数を適用し,安全な操作を確実にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:11:09 GMT)
Bounds in Sequential Unambiguous Discrimination of Multiple Pure Quantum States [2.0]
純状態の集合の識別に適用した場合、逐次手法の性能境界を導出する。これらの境界間のギャップは最小限であり、異なる状態の数と対数的にスケーリングする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:46:04 GMT)
Stable Trajectory Clustering: An Efficient Split and Merge Algorithm [1.9]
クラスタリングアルゴリズムは、パターンを特定するために特徴によってデータポイントをグループ化する。本稿ではDBSCAN線分クラスタリングに基づく全軌道クラスタリングとサブ軌道クラスタリングアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:11:36 GMT)
Capturing Quantum Snapshots from a Single Copy via Mid-Circuit Measurement and Dynamic Circuit [1.9]
Quantum Snapshot with Dynamic Circuit (QSDC)は、量子スナップショットをキャプチャするハードウェアに依存しない学習駆動のフレームワークである。本稿では、未知の量子状態の再構成のために古典的モデルを訓練する推測・検査手法を提案する。本手法は,動的回路をサポートしたハードウェアを前提として,シングルコピー・中間回路状態再構成をサポートする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:18:21 GMT)
Optimized Homomorphic Permutation From New Permutation Decomposition Techniques [1.9]
ホモモルフィックな置換は、バッチエンコーディングのホモモルフィック暗号に基づくプライバシ保存計算の基礎となる。本稿では,同相置換を最適化する新しい分解手法を提案する。従来の分解範囲から逸脱するネットワーク構造を設計し、最小回転鍵条件で最大1.69タイムの高速化で最先端技術より優れる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:00:36 GMT)
Is Intermediate Fusion All You Need for UAV-based Collaborative Perception? [1.9]
本稿では, LIF と呼ばれる, 遠隔期融合に基づくコミュニケーション効率の高い協調認識フレームワークを提案する。視覚誘導型位置埋め込み(VPE)とボックスベースの仮想拡張機能(BoBEV)を活用し,様々なエージェントからの補完情報を効果的に統合する。実験結果から,通信帯域を最小化して通信性能を向上し,その有効性と実用性を実証した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:22:14 GMT)
Evolution Meets Diffusion: Efficient Neural Architecture Generation [1.8]
ニューラルアーキテクチャサーチ(NAS)は、ディープラーニングモデル設計におけるトランスフォーメーションの可能性について広く注目を集めている。進化的拡散に基づくニューラルアーキテクチャ生成(EDNAG)を提案する。 EDNAGはアーキテクチャ最適化における最新技術(SOTA)のパフォーマンスを最大10.45%向上させた。時間を要するトレーニングの必要性を排除し、推論速度を平均50倍に向上させ、その例外的な効率性と効果を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:52:25 GMT)
Quantum Approaches to the Quadratic Assignment Problem [1.7]
Quadratic Assignment Problem (QAP) は、1957年にクープマンとベックマンによって導入されたNPハードの基本最適化問題である。本稿では,Rydberg配列を用いてQAPの有効かつ最適な解を求めるアルゴリズムを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:57:24 GMT)
Akkumula: Evidence accumulation driver models with Spiking Neural Networks [1.7]
本稿では,ディープラーニング技術を用いたエビデンス蓄積モデリングフレームワークであるAkkumulaを紹介する。ライブラリのコアはスパイキングニューラルネットワークに基づいており、その動作は生物学的脳内のエビデンス蓄積プロセスを模倣している。このモデルは、車両センサデータに基づく車両制御の時間経過によく適合する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:03:11 GMT)
XBreaking: Explainable Artificial Intelligence for Jailbreaking LLMs [1.7]
大規模言語モデルは、AIソリューションが支配する現代のIT業界における基本的なアクターである。本稿では、検閲されたモデルと検閲されていないモデルの振る舞いを比較分析して、ユニークな利用可能なアライメントパターンを導出する説明可能なAIソリューションを提案する。そこで我々は,これらのユニークなパターンを利用して,ターゲットノイズ注入によるLLMのセキュリティ制約を破る,新しいジェイルブレイク攻撃であるXBreakingを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:44:24 GMT)
Towards Fuzzing Zero-Knowledge Proof Circuits (Short Paper) [1.7]
ゼロ知識証明(ZKPs)は、理論的な暗号概念から、信頼性の仮定を必要とせずに、プライバシ保護および検証可能なアプリケーションを実装する強力なツールへと進化してきた。本稿では,ZKP回路にファジングを適用する際の課題について論じ,オラクル問題とその潜在的な解決策について検討し,入力生成とテストハーネス構築のための手法を提案する。現代のZKPアプリケーションにおける基盤ライブラリである textttzk-regex のファジタを実装することにより,ファジィ化がこの領域で有効であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:11:46 GMT)
ScaleFusionNet: Transformer-Guided Multi-Scale Feature Fusion for Skin Lesion Segmentation [1.6]
メラノーマは皮膚細胞病変に由来する悪性腫瘍である。本稿では,CATM(Cross-Attention Transformer Module)とAdaptiveFusionBlockを統合したセグメンテーションモデルであるScaleFusionNetを提案する。このモデルは、ローカル機能とグローバル機能の両方を効果的にキャプチャするハイブリッドアーキテクチャエンコーダを採用している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:10:54 GMT)
Real Time Semantic Segmentation of High Resolution Automotive LiDAR Scans [1.6]
本研究では,現代の高分解能LiDARセンサに適したセマンティックセグメンテーションフレームワークを提案する。都市交通シーンにおいて,最先端の自動車用128層LiDARによって収集された新しいLiDARデータセットを提案する。我々のアプローチは最先端の研究と実用的な自動車応用のギャップを埋めることです。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:00:50 GMT)
SparseTransX: Efficient Training of Translation-Based Knowledge Graph Embeddings Using Sparse Matrix Operations [1.6]
知識グラフ(KG)学習は、新しい知識を生成し、推論を行うための強力なフレームワークを提供する。 KG埋め込みのトレーニングには、特に大規模なデータセットでは、非常に長い時間がかかる可能性がある。コア埋め込みをSpMMカーネルに置き換えることでこの問題に対処する。これにより、複数のスキャッタ操作を単一の操作として統一し、トレーニング時間とメモリ使用量を削減できます。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:35:50 GMT)
ClassWise-CRF: Category-Specific Fusion for Enhanced Semantic Segmentation of Remote Sensing Imagery [1.6]
そこで我々はClassWise-CRFと呼ばれる結果レベルのカテゴリ固有の融合アーキテクチャを提案する。 Conditional Random Field (CRF) にインスパイアされたClassWise-CRFアーキテクチャは、複数のネットワークからのセグメンテーション予測を信頼性ベクトル場として扱う。クラスワイズCRFの有効性を検証するために,2つのリモートセンシングデータセットを用いて実験を行った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:19:21 GMT)
A Machine Learning-Based Framework for Assessing Cryptographic Indistinguishability of Lightweight Block Ciphers [1.6]
Indistinguishabilityは暗号セキュリティの基本原則であり、IoT(Internet of Things)デバイス間で送信されるデータの保護に不可欠である。本研究では,暗号化システムにおける不明瞭性評価における機械学習(ML)の能力について検討する。 MIND-Cryptは、軽量ブロック暗号の暗号不一致性を評価するために設計されたMLベースの新しいフレームワークである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:58:59 GMT)
MAC-Tuning: LLM Multi-Compositional Problem Reasoning with Enhanced Knowledge Boundary Awareness [1.6]
本稿では,命令データの微調整における回答予測と信頼度推定の学習を分離する新しい手法であるMAC-Tuningを提案する。提案手法は, 平均精度でベースラインを最大25%向上させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:17:53 GMT)
Vision-Language Model-Based Semantic-Guided Imaging Biomarker for Early Lung Cancer Detection [1.5]
本研究は, 放射線技師による結節評価から得られた意味的特徴を統合することを目的としており, 肺がん予測のための臨床的, 堅牢, 説明可能な特徴を学習できるようにする。比較言語-画像事前訓練モデルにパラメータ効率の良い微調整手法を適用し, 画像特徴と意味的特徴を一致させ, 1年間の肺がん診断を予測した。我々のモデルは、AUROCが0.90、AUPRCが0.78で、外部データセットのベースライン・オブ・ザ・アーティファクトモデルよりも優れていることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:11:34 GMT)
Precision Where It Matters: A Novel Spike Aware Mixed-Precision Quantization Strategy for LLaMA-based Language Models [1.5]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な機能を示した。本稿では,LLaMAアーキテクチャとその導関数に着目し,LLMの量子化について検討する。 LLaMAモデルに適した新しい混合精度量子化手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:52:18 GMT)
Active Light Modulation to Counter Manipulation of Speech Visual Content [1.5]
Spotlightは、ライブ音声ビデオを偽造から守るための、低オーバーヘッドで控えめなシステムだ。 Spotlightはイベントサイトでダイナミックな物理的シグネチャを生成し、受信不能な光によってすべてのビデオ記録に埋め込む。プロトタイプ実験では、SpotlightはAUCs$geq$0.99を達成し、全体的な正の確率はファルシファイドビデオの検出において100%である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:55:24 GMT)
WARP-LCA: Efficient Convolutional Sparse Coding with Locally Competitive Algorithm [1.4]
WARP-LCAは,従来のLCAに比べて桁違いに収束し,最小限にまで達することを示す。 WARP-LCAは, 深い認識パイプラインに適用した場合, 再現性, 復調性, およびロバスト性において優れた特性を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:12:21 GMT)
DOPE: Dual Object Perception-Enhancement Network for Vision-and-Language Navigation [1.4]
VLN(Vision-and-Language Navigation)は、エージェントが言語命令を理解し、視覚的手がかりを使って未知の環境をナビゲートしなければならない課題である。本稿では,これらの問題に対処し,ナビゲーション性能を向上させるために,Dual Object Perception-Enhancement Network (DOPE)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:47:13 GMT)
eNCApsulate: NCA for Precision Diagnosis on Capsule Endoscopes [1.3]
ワイヤレスカプセル内視鏡(Wireless Capsule Endoscopy)は、従来の内視鏡に代わる痛みのない内視鏡である。出血の検出や深さ推定といった技術は病理の局所化に役立つが、ディープラーニングモデルは通常カプセル上で直接走るには大きすぎる。基礎モデルの出力を擬似基底真理として扱うことにより,大規模な基礎モデルをリーンNAAアーキテクチャに蒸留する。次に、トレーニングされたNAAをESP32マイクロコントローラに移植し、カメラカプセルと同じくらい小さなハードウェア上で効率的な画像処理を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:06:56 GMT)
DGFNet: End-to-End Audio-Visual Source Separation Based on Dynamic Gating Fusion [1.3]
現在のオーディオ・ビジュアル・ソース分離法は主に2つの設計戦略を採用する。最初の戦略は、エンコーダのボトルネック層にオーディオと視覚的特徴を融合させ、続いてデコーダを通じて融合した特徴を処理することである。第2の戦略は直接融合を避け、代わりにオーディオと視覚的特徴の相互作用を扱うためにデコーダに依存している。本稿では,モダリティ融合度を動的に調整するゲーティング機構に基づく動的融合法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:55:24 GMT)
Exponential advantage in quantum sensing of correlated parameters [1.3]
量子センシングにおいて、ゴールは、決定論的であると仮定される1つ以上の未知のパラメータを推定することである。量子センシングプロトコルの各ショットは、独立したランダムドローから得られる値を検出する。エンタングルメントの使用は,分類や推定作業においてどのような効果があるかを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:39:30 GMT)
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging [1.3]
本稿では,SemEval-2025 Task 5: Subject TaggingのためのHomaについて述べる。 GND(Gemeinsame Normdatei)分類を用いて、TIBKATの技術的記録に主題ラベルを自動的に割り当てることに焦点を当てている。提案手法では,対象のタグ付け問題をアライメントタスクとして定式化し,意味的類似性に基づいたカテゴリにレコードをマッチングする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:52:51 GMT)
Classical capacities under physical constraints: More capacity with less entanglement [1.2]
通信機器の最近の進歩は、量子チャネル上での古典的な情報伝達の調査を要求する。符号化されたアンサンブルの平均エネルギーが有界であるとき、ノイズのない、ノイズの多い量子チャネルの古典的な容量に対する表現を提供する。エネルギー制約のある状況下では、古典的量子ノイズチャネルは絡み合い支援下での能力向上を示すことができることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:41:38 GMT)
SoK: Enhancing Privacy-Preserving Software Development from a Developers' Perspective [1.2]
このレビューは、開発者がプライバシ保護ソフトウェア開発を支援するための実証済みのソリューションを特定し、分析することを目的としている。発見は、現在のプライバシ保護ソリューションを改善する研究者や、ソフトウェア開発にプライバシを埋め込む効果的な、検証済みのソリューションを探している実践者にとって、貴重な洞察を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:38:48 GMT)
Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model [1.2]
ホークス過程(HP)は、イベントシーケンスを自己強化ダイナミクスでモデル化するのに一般的に用いられる。本稿では、イベント埋め込み空間において、ニューラルネットワークとしてインスタンス化されたフレキシブルなインパクトカーネルを定義することで、インパクト関数をモデル化する新しいHPを提案する。このアプローチは従来のHPよりも柔軟だが、他のニューラルネットワークアプローチよりも解釈可能である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:52:43 GMT)
ShorterBetter: Guiding Reasoning Models to Find Optimal Inference Length for Efficient Reasoning [1.2]
OpenAI o3やDeepSeek-R1のような推論モデルは、推論集約的なタスクに対して強力なパフォーマンスを示している。長い推論トレースは、複雑な問題に対する解経路のより徹底的な探索を促進する。 ShorterBetterは、推論言語モデルによる最適なCoT長の発見を可能にする、シンプルで効果的な強化学習手法である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:04:19 GMT)
A New Hybrid Quantum-Classical Algorithm for Solving the Unit Commitment Problem [1.1]
電力系統におけるユニットコミット問題に対するハイブリッド量子古典アルゴリズムを開発した。電力負荷の時給を満たすため、発電ユニットを最適に割り当てながら、総コストを最小化することを目的としている。選択時間に対するハイブリッド量子古典アルゴリズムの収束性は、IonQのForteシステムで証明されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:32:18 GMT)
A Comprehensive Study of Exploitable Patterns in Smart Contracts: From Vulnerability to Defense [1.1]
スマートコントラクト内の脆弱性は、個々のアプリケーションのセキュリティを損なうだけでなく、より広範なブロックチェーンエコシステムに重大なリスクをもたらす。本稿では,スマートコントラクトの重要なセキュリティリスク,特にSolidityで記述され,仮想マシン上で実行されるセキュリティリスクを包括的に分析する。攻撃シナリオを複製し、効果的な対策を評価することにより、2つの一般的かつ重要なタイプ(冗長性と整数オーバーフロー)に焦点を当てる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:00:36 GMT)
Towards proactive self-adaptive AI for non-stationary environments with dataset shifts [1.1]
本稿では,AIパラメータの時間的・軌跡をモデル化する,プロアクティブな自己適応型AIアプローチを提案する。この研究は、動的で非定常な環境に対する適応型AI研究の基礎を築いた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:09:59 GMT)
Wasserstein-Aitchison GAN for angular measures of multivariate extremes [1.0]
本稿では,Wasserstein-Aitchison Generative Adrial Networks (WA-GAN) を提案する。 WA-GANは将来の$d$次元多次元極端事象のシミュレーション値を提供する。本手法は文献上の他の方法と比較して優れた性能を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:54:28 GMT)
MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data [1.0]
MARIAはトランスフォーマーベースのディープラーニングモデルであり、欠けているデータ問題に対処するために設計されている。命令に依存する従来のアプローチとは異なり、MARIAはマスク付き自己注意機構を使用している。 MARIAは、さまざまなレベルのデータ不完全性に対するパフォーマンスとレジリエンスの観点から、既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:32:27 GMT)
Towards Improved Cervical Cancer Screening: Vision Transformer-Based Classification and Interpretability [1.0]
EVA-02トランスモデルを用いた子宮頸癌検診のための新しい手法を提案する。我々は、細調整EVA-02、特徴抽出、機械学習モデルによる重要な特徴の選択、新しい人工知能ニューラルネットワークのトレーニングという4段階のパイプラインを開発した。ベストモデルではF1スコアの0.85227を達成し,ベースラインのEVA-02モデルを上回った。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:59:56 GMT)
Enhancing clinical decision support with physiological waveforms -- a multimodal benchmark in emergency care [1.0]
本稿では,救急医療におけるマルチモーダル意思決定支援を推進すべく,データセットとベンチマークプロトコルを提案する。本モデルでは, 人口統計, バイオメトリックス, バイタルサイン, 検査値, 心電図(ECG)波形を入力として, 放電診断と患者の劣化の双方を予測する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:32:54 GMT)
Semiclassical Approach to Quantum Fisher Information [0.9]
量子カオス状態に駆動される量子センサーは、感度を劇的に向上させることができる。我々は、位相空間解決量子フィッシャー情報(QFI)への直接的かつ効率的なアクセスを提供する、正確な半古典的アプローチを開発する。この近似は、感覚パラメータに結びついた特定の動的量が対応する古典的時間進化の過程で大きなばらつきを示すとき、QFIが大きくなることを非常に具体的な言葉で示している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:31:50 GMT)
Adaptive Random Fourier Features Training Stabilized By Resampling With Applications in Image Regression [0.9]
浅層ニューラルネットワークのための適応型ランダムフーリエ(ARFF)訓練アルゴリズムを提案する。本手法は, 粒子フィルタ型再サンプリング法を用いて, トレーニング過程を安定化し, パラメータ選択に対する感度を低下させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:33:57 GMT)
Advancing Arabic Reverse Dictionary Systems: A Transformer-Based Approach with Dataset Construction Guidelines [0.9]
本研究では,アラビア語の自然言語処理における限界を,効果的なアラビア語逆辞書(RD)システムによって解決する。幾何学的に減少する層を特徴とするセミエンコーダニューラルネットワークアーキテクチャを用いたトランスフォーマーに基づく新しいアプローチを提案する。本手法は、包括的なデータセット構築プロセスを導入し、アラビア辞書定義の形式的品質基準を確立する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:56:36 GMT)
Filtering with Time-frequency Analysis: An Adaptive and Lightweight Model for Sequential Recommender Systems Based on Discrete Wavelet Transform [0.8]
ユーザの興味を異なる周波数と時間で複数の信号に分解し、これらの信号の重みを自動的に学習するDWT方式の適応時間周波数フィルタを設計する。また,適応時間周波数フィルタに基づく逐次レコメンデーションモデルDWTRecを開発した。実験により,各領域,空間レベル,平均シーケンス長の異なるデータセットにおいて,我々のモデルが最先端のベースラインモデルより優れていることが示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:04:16 GMT)
Heterogeneously error-corrected QRAMs [0.8]
異種符号距離論理量子ビットを用いた表面符号誤り訂正QRAMを提案する。我々の設計は、クエリ不忠実度を多元的に低減し、定常的なクエリ不忠実度スケーリングを実現することができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:23:42 GMT)
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad [0.8]
我々は2025年のUSAMOの6つの問題に対して、最先端の推論モデルを評価する。 Gemini-2.5-Proのみが25%という非自明なスコアを達成している。以上の結果から,現在のLLMは厳密な数学的推論作業には不十分であることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:42:44 GMT)
RDF-Based Structured Quality Assessment Representation of Multilingual LLM Evaluations [0.8]
大規模言語モデル(LLM)は知識インターフェースとして機能する傾向にあるが、その信頼性を矛盾する情報で体系的に評価することは依然として困難である。本稿では,多言語LLMの品質を評価するためのRDFベースのフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:06:40 GMT)
Hamiltonian Learning at Heisenberg Limit for Hybrid Quantum Systems [0.7]
異なる粒子種を持つハイブリッド量子系は、量子材料と量子情報科学の基本である。我々は、未知のスピンボソン型ハミルトニアンにアクセスすると、アルゴリズムがハイゼンベルク制限推定を達成するという厳密な理論的枠組みを確立する。この結果は、ハイブリッド量子プラットフォームにおける高精度ハミルトン特性評価のためのスケーラブルでロバストなフレームワークを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:52:18 GMT)
CAD-Unet: A Capsule Network-Enhanced Unet Architecture for Accurate Segmentation of COVID-19 Lung Infections from CT Images [0.7]
医療画像は、新型コロナウイルスの肺炎を診断するための主要な手段となっている。本稿では,新たにCAD-Unetと呼ばれる深層ネットワークアーキテクチャを導入する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:53:00 GMT)
GATE3D: Generalized Attention-based Task-synergized Estimation in 3D* [0.7]
GATE3Dは、弱い監督による一般化されたモノクル3Dオブジェクト検出のための新しいフレームワークである。以上の結果から,GATE3Dは限られたアノテートデータからの学習を著しく加速することが示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:39:15 GMT)
Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations [0.7]
深層学習法は、パターンを入力として、空間群対称性を分類することができる。ニューラルネットワークは、背景修正EBSDパターンの空間群型を予測するために訓練された。我々は,シミュレーションおよび実験データにおいて,90%以上の精度のスコアを得られたモデルを実現するためのレザベリング手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:36:31 GMT)
A Path to Quantum Simulations of Topological Phases: (2+1)D Wilson Fermions Coupled To U(1) Background Gauge Fields [0.7]
格子の定式化における鍵となる課題は、位相位相とチャーン・サイモンズ項の適切な実現である。我々は、ハミルトニアン定式化において、$textU(1)$バックグラウンドゲージ場に結合したスタッガードおよびウィルソンフェルミオンを解析する。我々の発見はハミルトンの定式化における既存の曖昧さを解決し、トポロジカル位相を持つゲージ理論の将来の量子シミュレーションの理論的基礎を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:33:01 GMT)
Optimal fermion-qubit mappings via quadratic assignment [0.7]
フェルミオン系のシミュレーションは、量子コンピュータの最も有望な応用の1つである。過去20年間で、初期の量子技術の限られた資源に対処するために、フェルミオン・量子マッピングの供給が急増した。我々は、限られた数の量子ビットで作業しながら、一般写像の構築に2つの計算手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:37:33 GMT)
Predicting clinical outcomes from patient care pathways represented with temporal knowledge graphs [0.7]
知識グラフデータ表現とその埋め込みは、いくつかの環境で競合するが、バイオメディカルな予測モデルにどのような関心があるのかは不明だ。頭蓋内動脈瘤症例の人工的・現実的データをシミュレートし,臨床成績を予測するための課題について検討した。本研究は,グラフ表現とグラフ畳み込みネットワーク(GCN)の埋め込みが観測データから予測タスクの最適性能に達することを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:52:56 GMT)
Discrete time crystals detected by time-translation twist [0.7]
量子系の動的位相を特徴付ける新しいプローブとして,時間変換によってねじれた境界条件を導入する。平衡系のツイスト境界条件にインスパイアされたこのアプローチは、系の時間的進化を変化させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:29:36 GMT)
Simulating quantum collision models with Hamiltonian simulations using early fault-tolerant quantum computers [0.7]
我々は、繰り返し相互作用スキームとしても知られる量子衝突モデルをシミュレートするランダム化量子アルゴリズムを開発した。我々の手法は、初期のフォールトトレラント量子コンピュータにおけるマルコフ力学と非マルコフ力学の両方に量子衝突モデルを利用することができる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:09:54 GMT)
Low-rank computation of the posterior mean in Multi-Output Gaussian Processes [0.6]
マルチアウトプットガウス過程(MOGP)と,MOGPの後方平均を効率的に計算するための低ランクアプローチについて考察する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:19:58 GMT)
On Advancements of the Forward-Forward Algorithm [0.6]
Forward-Forwardアルゴリズムは機械学習の研究で進化し、現実のアプリケーションを模倣するより複雑なタスクに取り組んでいる。この結果から,畳み込みチャネルグループ化,学習率スケジュール,独立したブロック構造を組み合わせることで,改善が達成できることが示唆された。我々は、21$pm$6%の低いテストエラー率と164,706から754,386までのトレーニング可能なパラメータ数を達成できる、より軽量なモデルを提示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:03:52 GMT)
Beyond Robertson-Schrödinger: A General Uncertainty Relation Unveiling Hidden Noncommutative Trade-offs [0.6]
我々はRobertson-Schr'odingerの不確実性関係の普遍的な強化を報告した。 2段階の量子系では、不等式は任意の状態と観測可能な一対の対に対して完全に等しいものとなる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:34:50 GMT)
REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining [0.6]
我々は,3Dポイント・クラウド・デレイニングにおける研究の進展を促進するため,大規模で多モードの降雨データセットREHEARSE-3Dを新たにリリースした。第一に、4D Radar点雲に富む高解像度のLiDARデータを持つ唯一のデータセットである。 We benchmark raindrop detection and removal in fused LiDAR and 4D Radar point clouds。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:43:38 GMT)
Low latency FPGA implementation of twisted Edward curve cryptography hardware accelerator over prime field [0.5]
本稿では,フィールドプログラマブルゲートアレイ(FPGA)に基づくモジュール演算,グループ演算,点乗算ユニットのハードウェア実装について述べる。提案した点乗算モジュールは1.4ミリ秒の時間を消費し、最大クロック周波数は117.8MHzである。このアーキテクチャは、高速無線通信ネットワークにおける高速なデータ暗号化の候補となるだろう。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:03:36 GMT)
BERSting at the Screams: A Benchmark for Distanced, Emotional and Shouted Speech Recognition [0.5]
本稿では,B(asic) E(motion) R(andom phrase) S(hou)t(s) (BERSt) データセットを提案する。データセットには、地域のアクセントと非ネイティブアクセントの異なる98人のアクターから約4時間の英会話が含まれている。 ASRタスクとSERタスクの初期ベンチマークを行い、ASRは距離とシャウトレベルの増大とともに劣化し、意図した感情に応じて様々なパフォーマンスを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:08:14 GMT)
Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space [0.5]
ポイントクラウドの剛性登録は、3Dコンピュータビジョンの基本的な問題である。多数のビューを効率的に処理できるマルチビュー登録方式であるPOLARを導入する。提案手法は, 合成データおよび実データに対する最先端手法を著しく上回っている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:42:38 GMT)
Attention-enabled Explainable AI for Bladder Cancer Recurrence Prediction [0.4]
非浸潤性膀胱癌 (NMIBC) の再発率は70-80%まで上昇した。各再発は、侵襲的な手順のカスケード、生涯にわたる監視、医療費の増大を引き起こす。既存の臨床予測ツールには根本的な欠陥が残っており、しばしば再発リスクを過大評価する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:39:33 GMT)
UAV Marketplace Simulation Tool for BVLOS Operations [0.4]
このツールは、動的および敵対的な条件下でのUAVコラボレーションとミッション実行をモデル化する。このツールは、現実世界のアプリケーションにおけるUAVコーディネーション戦略のテストと改善に多用途である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:36:22 GMT)
The Coral Protocol: Open Infrastructure Connecting The Internet of Agents [0.3]
Coral Protocolはオープンで分散化されたコラボレーション基盤であり、The Internet of Agentsのコミュニケーション、調整、信頼、支払いを可能にする。マルチエージェントエコシステムの基盤となるプラットフォームとして、Coralは共通言語と調整フレームワークを確立している。その設計は、幅広い互換性、セキュリティ、ベンダー中立性を強調し、エージェントのインタラクションが効率的で信頼性の高いものであることを保証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:17:13 GMT)
Quantitative Auditing of AI Fairness with Differentially Private Synthetic Data [0.3]
AIシステムの公正監査はバイアスを特定し定量化することができる。現実世界のデータを使った従来の監査は、セキュリティとプライバシーの懸念を引き起こす。本稿では,AIシステムの公正性を評価するために,微分プライベートな合成データを活用するフレームワークを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:36:27 GMT)
Power Flow Approximations for Multiphase Distribution Networks using Gaussian Processes [0.3]
本研究では, ガウス過程(GP)に基づくデータ駆動型潮流モデルを提案する。 IEEE 123-bus と 8500-node 配電試験装置を用いたシミュレーションの結果, トレーニングしたGPモデルが非線形電力流解を確実に予測できることが実証された。また,提案したGPベースパワーフロー近似器のトレーニング効率と試験性能を,ディープニューラルネットワークベース近似器に対して比較検討した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:26:31 GMT)
Coherently mitigating boson samplers with stochastic errors [0.3]
ボソンサンプリング装置のような量子デバイスは、製造の不完全性を含む様々なエラーの影響を受けやすい。本稿では,複数のボソンサンプリング器を用いて理想的なボソンサンプリング器分布を近似した分布を生成するユニタリ平均化プロトコルを提案する。これにより、可逆真空誘導ネットワークによって誘導される出力確率の間のトレース距離に厳密な上限が与えられる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:16:22 GMT)
From Precision to Perception: User-Centred Evaluation of Keyword Extraction Algorithms for Internet-Scale Contextual Advertising [0.3]
本研究はTF-IDF, KeyBERT, Llama 2の比較評価を行った。 KeyBERTはパフォーマンスと計算効率のバランスが良い。金標準のキーワードを強く好んでいるにもかかわらず、アルゴリズムの出力の違いは統計的に有意ではない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:10:00 GMT)
Maximum and minimum causal effects of physical processes [0.2]
最大因果効果と最小因果効果と呼ばれる2つの尺度は、入力の変化によって引き起こされる量子過程の出力の最大と最小の変化を定量化する。量子因果効果の最大値は、古典的な情報を伝達する非ゼロ容量の量子チャネルを検出するために用いられる。最小因果効果は、量子情報の回復可能性を保証するために用いられる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:41:43 GMT)
Overlapping data in network protocols: bridging OS and NIDS reassembly gap [0.2]
所定のフローデータを再組み立てしようとするネットワーク侵入検知システム(NIDS)は、監視されたホストと同じ再組み立てポリシーを使用する必要がある。 1)OSの再組み立てポリシは時間とともに進化し,2)テスト対象のNIDSはオーバーラップベースの回避攻撃や挿入攻撃に対して脆弱であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:15:50 GMT)
TartuNLP at SemEval-2025 Task 5: Subject Tagging as Two-Stage Information Retrieval [0.2]
我々はSemEval-2025のタスク5に提出する。本課題は,図書館の図書館記録に被写体タグを割り当てる際の図書館員の支援を目的として,当該文書に関連性のあるタグのリストを作成することである。 2種類のエンコーダモデルを用いて2段階情報検索システムを構築する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:44:08 GMT)
GISE-TTT:A Framework for Global InformationSegmentation and Enhancement [0.2]
GISE-TTTはテンポラルトランスフォーマー層をトランスフォーマーベースのフレームワークに統合する新しいアーキテクチャである。本稿では,ビデオオブジェクト用ビデオオブジェクト(VOS)の長いビデオシーケンスにおいて,グローバルな時間依存性を捉えるという課題に対処する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:45:55 GMT)
Multi-modal Transfer Learning for Dynamic Facial Emotion Recognition in the Wild [0.1]
顔の表情認識(FER)はコンピュータビジョンのサブセットであり、人間とコンピュータの相互作用、医療、カスタマーサービスに重要な応用がある。本稿では,ビデオベースFERデータセットの性能向上のために,マルチモーダルトランスファー学習を用いることを検討した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:09:11 GMT)
Toward Practical Quantum Machine Learning: A Novel Hybrid Quantum LSTM for Fraud Detection [0.1]
本稿では,不正検出のためのハイブリッド量子古典ニューラルネットワークアーキテクチャを提案する。重畳や絡み合いなどの量子現象を活用することで、我々のモデルはシーケンシャルトランザクションデータの特徴表現を強化する。その結果,従来のLSTMベースラインと比較して,精度,精度,リコール,F1スコアの競争力の向上が示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:09:12 GMT)
GEOM-Drugs Revisited: Toward More Chemically Accurate Benchmarks for 3D Molecule Generation [0.1]
我々はGEOM-Drugsを再検討し、修正された評価フレームワークを提案する。データ前処理の問題を特定し, 化学的に正確な原子価表を作成し, GFN2-xTBに基づく幾何とエネルギーのベンチマークを導入する。本研究は,3次元分子生成における化学的に厳密な評価手法の必要性を浮き彫りにした。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:29:22 GMT)
Polysemy of Synthetic Neurons Towards a New Type of Explanatory Categorical Vector Spaces [0.1]
我々は、n層内のニューロンを非直交基底を持つカテゴリーベクトル空間として幾何学的に定義し、n-1層で前のニューロンから抽出されたカテゴリーサブ次元からなる。このカテゴリーベクトル空間は、各ニューロンの活性化空間によって構成され、ニューロン内の注意プロセスを通じて、言語モデルの効率性のために臨界カテゴリーゾーンの識別と利用を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:33:28 GMT)
ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.1]
本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:03:25 GMT)
Reply to comment on: Observation of the quantum equivalence principle for matter-waves [0.1]
近年の主張とは対照的に, 量子ガリレオ干渉計は, 浮上条件がなくても, 均一な重力場に敏感であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:29:18 GMT)
An unbiased measure over the matrix product state manifold [0.1]
局所ハール乱ユニタリを用いた逐次生成ランダム行列積状態(RMPS)の通常のアンサンブルは、ヒルベルト空間の制約と見なすと、一様でないことを示す。その結果、鎖間の絡み合いは空間的非対称性の下で異常な非対称性を示す。この新しいアンサンブルのいくつかの特性は解析的にも数値的にも検討されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:00:02 GMT)
Who Gets the Callback? Generative AI and Gender Bias [0.0]
大規模言語モデル(LLM)は特に高賃金の役割において男性を好む傾向にある。求人広告における言語的特徴の包括的分析は、モデルレコメンデーションと伝統的なジェンダーステレオタイプとの強い整合性を示す。我々の調査結果は、AIによる雇用が労働市場のバイアスを持続させ、企業内の公正性と多様性に影響を及ぼす可能性があることを強調している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:55:52 GMT)
xEEGNet: Towards Explainable AI in EEG Dementia Classification [0.0]
xEEGNetは、EEGデータ分析のための、新しくてコンパクトで説明可能なニューラルネットワークである。完全に解釈可能で、大きなパラメータ還元によって過度に適合する。 xEEGNetはスペクトル変化を含む他の神経学的条件に広く適用されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:24:50 GMT)
mAIstro: an open-source multi-agentic system for automated end-to-end development of radiomics and deep learning models for medical imaging [0.0]
mAIstroは、医療AIモデルのエンドツーエンド開発とデプロイのための、オープンソースの、自律的なマルチエージェントフレームワークである。自然言語インタフェースを通じて探索データ分析、放射能特徴抽出、画像分割、分類、回帰を編成する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:25:51 GMT)
When Reasoning Beats Scale: A 1.5B Reasoning Model Outranks 13B LLMs as Discriminator [0.0]
1.5B の蒸留パラメータ推論モデル (DeepSeek-R1) を, 最先端の非推論 LLM と比較した。我々の中心的な仮説は、推論モデルは非共振LDMよりも効果的に識別できるというものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:27:13 GMT)
Visual Adaptive Prompting for Compositional Zero-Shot Learning [0.0]
VLM(Vision-Language Models)は、視覚およびテキストデータの共同表現を学習する際、印象的な能力を示す。 CZSLは、トレーニング中に明示的に遭遇しなかった属性やオブジェクトのような新しい視覚的プリミティブの組み合わせに一般化するモデルを必要とする。意味的特徴と視覚的特徴のギャップを埋める視覚適応型プロンプトシステム(VAPS)を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:47:52 GMT)
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies [0.0]
ビジョントランス (ViT) はコンピュータビジョンタスクのための強力で有望な技術として登場した。高い計算複雑性とメモリ要求は、リソース制約のあるエッジデバイスへのデプロイに困難をもたらす。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:55:51 GMT)
Virtual Atom-Photon Bound States and Spontaneous Emission Control [0.0]
原子-光子結合状態は、原子の完全な自発的崩壊を阻害し、導波路分散工学や巨大原子の利用によって実現することができる。ここでは、初期原子-光子絡み合いから生じる一過性原子-光子結合状態について検討し、自発的な原子崩壊を減速させる方法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:49:35 GMT)
Variational Scarring in Open Two-Dimensional Quantum Dots [0.0]
2次元量子ドットにおける変分スカーリングは、開系においても頑健であることを示す。制御された摂動は、傷ついた状態による電子伝達の変調を可能にする。これらの知見は、量子デバイスにおける実験的実現のためのメソスコピック輸送およびオープンパスにおけるスカーリングの役割に関する洞察を与える。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:48:05 GMT)
VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification [0.0]
本稿では,VR-FuseNetと呼ばれる新しいハイブリッドディープラーニングモデルを提案することによって,糖尿病網膜症自動検出のための包括的アプローチを提案する。提案したVR-FuseNetモデルは、最先端の畳み込みニューラルネットワークであるVGG19と、その深い階層的特徴抽出で知られるResNet50V2の強みを組み合わせたものだ。このモデルは、糖尿病網膜症分類タスクにおけるハイブリッド特徴抽出の有効性を示すすべてのパフォーマンス指標において、個々のアーキテクチャよりも優れている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:38:47 GMT)
Uncertainty, bias and the institution bootstrapping problem [0.0]
エージェントが既に存在するという誤った信念が、このパラドックスを解決できると提案する。これらの要因がブートストラップ問題をどのように緩和するかを示す。我々の分析は、理想化された合理性だけでなく、人間のような認知的制約を制度的出現とレジリエンスのモデルに組み込むことの重要性を浮き彫りにしている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:36:06 GMT)
Uncertainty Quantification for Language Models: A Suite of Black-Box, White-Box, LLM Judge, and Ensemble Scorers [0.0]
幻覚はLarge Language Models(LLM)における永続的な問題である本稿では,実践者が実世界のユースケースに適用可能なゼロリソース幻覚検出のための多用途フレームワークを提案する。柔軟性を高めるために、各信頼度スコアの組み合わせを組み込んだ調整可能なアンサンブルアプローチを導入する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:49:15 GMT)
UAV-VLN: End-to-End Vision Language guided Navigation for UAVs [0.0]
AI誘導の自律性における中核的な課題は、エージェントが以前見えなかった環境で現実的で効果的にナビゲートできるようにすることである。 UAV-VLNは無人航空機(UAV)のための新しいエンドツーエンドビジョンランゲージナビゲーションフレームワークである。本システムでは,自由形式の自然言語命令を解釈し,視覚的観察に利用し,多様な環境下で実現可能な航空軌道を計画する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:40:47 GMT)
Tuning Learning Rates with the Cumulative-Learning Constant [0.0]
学習率とデータセットサイズの間の未認識の比例が発見される。累積学習定数を特定し、高度な学習率スケジュールを設計、最適化するためのフレームワークを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:07:48 GMT)
Tree tensor network hierarchical equations of motion based on time-dependent variational principle for efficient open quantum dynamics in structured thermal environments [0.0]
ボゾン浴と相互作用する駆動量子系に対するオープン量子力学を正確に計算するための効率的なTTN-HEOM法を提案する。結合マスター方程式に対する3つの一般的なプロパゲータを実装した。この結果から,TTN-HEOMは,構造浴と相互作用する量子駆動系の劣化と緩和のダイナミクスをシミュレートできることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:48:05 GMT)
Towards a $\cos(2\varphi)$ Josephson element using aluminum junctions with well-transmitted channels [0.0]
本研究では、全アルミニウムジョセフソン接合を高透過伝導チャネルで作製する新しい方法を提案する。本稿では,これらのジャンクションに基づく簡単な超伝導回路の設計を提案し,パリティ保護量子ビットの実装を可能にする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:24:51 GMT)
Towards Writing Style Adaptation in Handwriting Recognition [0.0]
著者のアイデンティティを付加的な入力として捉えるために,著者に依存したパラメータを持つモデルについて検討する。本稿では,学習した分割の埋め込みを前提とした適応型インスタンス正規化層であるWriter Style Block (WSB)を提案する。著者に依存したシナリオでは,本手法はWSBのないベースラインよりも優れており,新たなライターへの埋め込みを推定することが可能であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:25:17 GMT)
Towards Non-Abelian Quantum Signal Processing: Efficient Control of Hybrid Continuous- and Discrete-Variable Architectures [0.0]
量子信号処理(QSP)は、$theta$で表されるユニタリパラメータを、関数$f(theta)$で表される1つに変換する。我々はQSPを非可換制御パラメータを利用する新しいクラスである非可換QSPに拡張する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:41:48 GMT)
Topological classification and edge states of magnons in honeycomb ferromagnets [0.0]
ハニカム上の強磁性体中のマグノンのトポロジカルな分類と関連するエッジ状態について検討した。ボゾンBdGモデルの固有確率は非エルミート系と同値であるが、エルミート系に対する従来のバルクエッジ対応は部分的に有効である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:29:38 GMT)
The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors [0.0]
文長の増加に伴う平均依存距離(MDD)と平均階層距離(MHD)の変化を分析した。その結果, 日本語におけるMDDとMHDのトレードオフ関係の背景にある要因は, 述語の正当性であることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:27:33 GMT)
Spatio-temporal entanglement of the vacuum [0.0]
この研究は、時空の絡み合う性質に関する新たな洞察を提供する。これは、量子場の真空状態を用いたセキュアな量子情報伝達の実用的な応用を示唆している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:54:35 GMT)
Simulating Quantum Circuits with Tree Tensor Networks using Density-Matrix Renormalization Group Algorithm [0.0]
量子回路シミュレーションのための密度行列再正規化群(DMRG)アルゴリズムをツリーテンソルネットワーク(TTN)に拡張する。 TTNは、特にゲート接続がクラスタリングや階層構造を示す場合、量子回路をシミュレートするための有望なフレームワークを提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:59:07 GMT)
Scrambling Dynamics with Imperfections in a Solvable Model [0.0]
可解ブラウン回路モデルにおいて、量子スクランブルダイナミクスのプローブが2種類の不完全性にどのように反応するかを考察する。回路平均ROTOCは演算子重み空間の有効確率分布によって制御されることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:00:01 GMT)
Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks [0.0]
マルチプライオリティは、データ取得段階でレイテンシとストレージ要件を緊張させています。背景レベルが高く、粒子の誤結合が頻発するなど、新たな合併症が出現している。本稿では,多様な粒子衝突関係のユニークな表現を特徴とする新しい不均一グラフニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:53:08 GMT)
Sadeed: Advancing Arabic Diacritization Through Small Language Model [0.0]
Sadeedはアラビア語の発音のための新しいデコーダのみの言語モデルである。 Sadeedは、厳格なデータクリーニングと正規化パイプラインを通じて構築された、慎重にキュレートされた高品質なダイアグラム化されたデータセットに微調整されている。 SadeedDiac-25は、さまざまなテキストジャンルや複雑性レベルに対して、より公平で包括的な評価を可能にするために設計された、新しいベンチマークである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:37:24 GMT)
SR-NeRV: Improving Embedding Efficiency of Neural Video Representation via Super-Resolution [0.0]
Inlicit Neural Representations (INR)は、様々な領域にまたがる複雑な信号をモデル化する能力において、大きな注目を集めている。汎用超解像(SR)ネットワークを統合したINRに基づく映像表現手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 03:31:40 GMT)
Rydberg Atom Electric Field Sensors as Linear Time-invariant Systems [0.0]
ライドバーグ原子電界センサは、従来のアンテナベースの受信機に代わる代替や補機として研究されている。本稿では,最大2桁の時間短縮が可能なインパルス応答関数を導出する解析的手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:05:14 GMT)
Rovibrational computation of H$_3^+$ with permutationally invariant Pekeris coordinates [0.0]
ペケリス座標は H$_3+$ に対して置換不変な座標の集合を与える。これらは3つの核間距離の線形結合として定義され、非負の座標値の三角形の不等式を自動的に満たす。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:30:04 GMT)
Rootlets-based registration to the spinal cord PAM50 template [0.0]
伝統的なテンプレートに基づく脊髄の登録は、アライメントに椎間板を使用する。ルートレットをベースとした登録では、従来のディスクベースの方法に比べて個人間でのアライメントが優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:37:39 GMT)
Retrieval-Enhanced Few-Shot Prompting for Speech Event Extraction [0.0]
音声イベント抽出(SpeechEE)は、音声認識(ASR)と自然言語処理(NLP)の交差点に位置する課題である。本稿では,Large Language Models (LLM) のセマンティック検索強化プロンプトと高性能ASRを統合したモジュール型パイプラインベースのSpeechEEフレームワークを提案する。この結果から,LLMに強化されたパイプラインアプローチは,エンド・ツー・エンドのシステムに匹敵する,あるいは超越できることを示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:10:10 GMT)
Recursive KL Divergence Optimization: A Dynamic Framework for Representation Learning [0.0]
本稿では、データ近傍におけるKL分散の進化として、表現学習がフレーム化される動的フォーマリズムであるRecursive KL Divergence Optimization RKDOを紹介する。実験の結果、RKDOは静的アプローチに比べて損失値が約30%低いという二重効率の利点が示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:51:27 GMT)
Realizing Negative Quantum States with the IBM Quantum Hardware [0.0]
本研究では、離散ウィグナー関数の枠組みを用いて記述された強絡み状態について検討する。我々は,IBM の Emphibm_brisbane デバイス上でのトモグラフィ再構成により,状態生成のための量子回路を提案し,その検証を行う。これらの絡み合った状態は、非マルコフ的エラーが頻繁に発生するシナリオにおいて、従来のベル状態の代わりに使われる可能性があると信じている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:08:19 GMT)
Real-World Gaps in AI Governance Research [0.0]
9,439件のAI生成論文(2020年1月から2025年3月)から1,178件の安全性と信頼性に関する論文を引用し、主要なAI企業や大学の研究成果を比較した。企業AI研究は、モデルアライメントとテストと評価という、デプロイ前領域にますます集中していることに気付きました。医療、金融、誤情報、説得力と中毒性の特徴、幻覚、著作権など、リスクの高い展開領域に重要な研究ギャップが存在する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:44:42 GMT)
RAIL in the Wild: Operationalizing Responsible AI Evaluation Using Anthropic's Value Dataset [0.0]
本稿では,大規模言語モデル(LLM)の規範的振る舞いを評価するために,Responsible AI Labs (RAIL) フレームワークを用いた体系的アプローチを提案する。このフレームワークを、Arthropicの"Values in the Wild"データセットに適用し、Claude氏との308,000以上の会話と3000以上の注釈付き値表現を含む。本研究は、これらの値をRAIL次元にマッピングし、合成スコアを計算し、実世界のLLMの倫理的行動に関する洞察を提供する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:03:26 GMT)
Quarkonia Theory: From Open Quantum System to Classical Transport [0.0]
これは長崎で開かれたハードプローブ2024カンファレンスでの相対論的重イオン衝突におけるクォーコニウム生成の理論的概要である。この講演は、オープン量子システムフレームワークの適用と、クォーコニウムダイナミクスに関連するクォークグルーオンプラズマの特性を一意にエンコードするクロマトエレクトロコレレータの定式化に焦点を当てている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:10:23 GMT)
QuantumToolbox.jl: An efficient Julia framework for simulating open quantum systems [0.0]
QuantumToolbox.jlは、量子システムをシミュレーションするためのオープンソースパッケージである。高速でスケーラブルなシミュレーションを実現するために、Juliaの高性能エコシステムを活用する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:56:12 GMT)
Quantum-inspired exoplanet detection in the presence of experimental imperfections [0.0]
解析ツールを用いてSPADEの実用性を調べ,それに伴う太陽系外惑星検出の最適決定戦略を導出する。一方, ノイズSPADEの検出確率は, 従来の手法と同様に惑星と恒星の分離や相対的な明るさと同一であることがわかった。一方、現実的な雑音条件下でのスケーリング係数が優れているため、SPADEはサブレイリー系において、実用的な太陽系外惑星検出の最も効率的な方法であり続けている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:11:21 GMT)
Quantum Mpemba effect from initial system-reservoir entanglement [0.0]
Mpemba効果は、高温のシステムが冷たいものよりも速く冷却されるもので、古典的な熱力学と量子力学の両方に興味を抱いている。最近の研究は、いくつかの量子系における異常緩和とMpembaのような効果を探求している。本稿では,初期システムバスの絡み合いから生じる強いMpemba効果と異なる種類の量子Mpemba効果を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:58:17 GMT)
Quantum Measurement Without Collapse or Many Worlds: The Branched Hilbert Subspace Interpretation [0.0]
分岐ヒルベルト部分空間解釈(BHSI)を提案する。 BHSI は測定を、系の局所ヒルベルト空間をデコヒーレント部分空間に分岐するものとして記述する。 BHSIとコペンハーゲン解釈(CI)、多世界解釈(MWI)、ボヘミア力学(BM)を比較した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:36:04 GMT)
Protocol Dialects as Formal Patterns: A Composable Theory of Lingos -- Technical report [0.0]
リンゴは、攻撃者がリンゴを"話す"ことができないようにすることで、方言の重要なセキュリティコンポーネントである。より単純なリンゴからより強力なリンゴを生成するために,数種類のリンゴ変換と合成を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:35:46 GMT)
Preparation Circuits for Matrix Product States by Classical Variational Disentanglement [0.0]
行列積状態(MPS)の作成のための量子回路の古典的コンパイルについて検討する。提案アルゴリズムは, 逆アンタングル法により, 従来の逐次的アプローチに準じて, 短期的な代替となる。複数の量子ビット間の絡み合いを人工的に広げるだけでなく、一次元の局所ハミルトニアンの基底状態に対する数値的な結果を示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 04:13:01 GMT)
Practical classical error correction for parity-encoded spin systems [0.0]
パリティエンコーディング(PE)アーキテクチャは、ローカル接続のみを持つ拡張スピンシステムで構成されている。本稿では,PEアーキテクチャのスピン読み出しにおけるスピンフリップ誤差の相関を考慮した実用的な復号法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:23:23 GMT)
PAPN: Proximity Attention Encoder and Pointer Network Decoder for Parcel Pickup Route Prediction [0.0]
この作業は、最初のビルディングブロック、すなわちルート予測に取り組む。これは、エンコーダ-デコーダアーキテクチャに新しいproximity Attentionメカニズムを導入することで実現される。プロクシミティ・アテンション (proximity attention) はデコードプロセスにおいて、最も高いアテンションスコアを持つ位置への予測をスキューするためにも用いられる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:24:41 GMT)
Optimization of embeddings storage for RAG systems using quantization and dimensionality reduction techniques [0.0]
本研究では,float8量子化により,性能劣化を最小限に抑えつつ,ストレージの4倍の低減を実現することを示す。 PCAは最も効果的な次元削減技術として出現する。本稿では,最適構成を特定するために,性能記憶トレードオフ空間を可視化する手法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:20:16 GMT)
Open-systems tools for non-thermalizing closed quantum systems [0.0]
非平衡定常状態を生成する制約付き対称量子回路力学について検討する。各ネットワークは、位相共変ダイナミクスで進化する量子ビットの集合であるオープンシステムの集合として記述することができる。定常状態と等質定常状態との距離を定量化し、それらの相互情報ネットワークの複雑さを用いてそれらをさらに特徴付ける。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:38:08 GMT)
On the dual structure of the Schrödinger dynamics [0.0]
まず、古典力学を参照せずに、スクラッチから実数値シュリンガー方程式を導出する。次に、Schr"odinger方程式と互換性のある方法で量子パス力学を研究する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:11:30 GMT)
On the Encapsulation of Medical Imaging AI Algorithms [0.0]
本稿では,医療画像AIアルゴリズムの相互運用性と(再利用性に着目した。本論文は、医療画像AIアルゴリズムの相互運用性と(再利用性)に焦点を当てた研究データのためのFAIR原則について述べる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:12:09 GMT)
Non-standard quantum algebras and infinite-dimensional PT-symmetric systems [0.0]
我々は、Uz(sl(2,R))ホップ代数のPT対称無限次元表現を導入する。これらのハミルトニアンはすべて、位置依存質量を持つ同値系にマッピング可能であることが示されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:40:56 GMT)
Neuroevolution of Self-Attention Over Proto-Objects [0.0]
プロトオブジェクトは、ニューラルネットワークの長方形のイメージパッチに基づいた従来の注意機構に代わる有望な代替手段を提供する。固定パッチではなくプロトオブジェクトで操作することにより、表現の複雑さを著しく低減する。これにより、よりリッチなセマンティック情報を処理する、はるかに小さな自己アテンションモジュールが可能になる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:01:20 GMT)
Multi-level datasets training method in Physics-Informed Neural Networks [0.0]
PINNは、解決し難い問題や、その解決策に高周波成分を持つ問題に苦慮する。本研究では,上記の問題を緩和するための代替手法を提案する。 CFDコミュニティのマルチグリッド手法にインスパイアされた現在のアプローチの根底にある考え方は、トレーニングを通じて異なる周波数誤差を効率的に除去することである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:30:27 GMT)
MedPix 2.0: A Comprehensive Multimodal Biomedical Data set for Advanced AI Applications [0.0]
本稿では、データセットMedPix 2.0を構築するためのワークフロー全体について説明する。よく知られているマルチモーダルデータセットであるMedPixから始まったセミオートマチックパイプラインは、視覚的およびテキスト的データを抽出するために開発された。データセットとともに、MongoDBインスタンスを効率的にナビゲートするためのGUIを開発しました。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:41:49 GMT)
MatMMFuse: Multi-Modal Fusion model for Material Property Prediction [0.0]
本稿では,CGCNN(Crystal Graph Convolution Network)とSciBERTモデルからのテキスト埋め込みから構造を意識した融合モデルを提案する。提案モデルでは,バニラCGCNNモデルに対して68%,SciBERTモデルに対して68%の精度で生成エネルギーを予測できた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:26:28 GMT)
Mapping minds not averages: a scalable subject-specific manifold learning framework for neuroimaging data [0.0]
構造化データと時間的非構造化データの両方にわたる主観的空間変動を捉えることができる多様体学習フレームワークを提案する。本研究では,このフレームワークを大規模データセットに効率よく拡張し,新たな対象に最適化することを示す。以上より,本フレームワークは臨床的に関連のある脳活動パターンを明らかにすることができることが示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:40:54 GMT)
MPEC: Manifold-Preserved EEG Classification via an Ensemble of Clustering-Based Classifiers [0.0]
脳波信号の正確な分類法としてMPEC(Manifold-Preserved EEG Classification via an Ensemble of Clustering-Based Radial Basiss)を提案する。 MPECはBCIコンペティションIVデータセット2aの大幅な改善によって検証され、優れた結果を得る。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:34:15 GMT)
Low loss hybrid Nb/Au superconducting resonators for quantum circuit applications [0.0]
100nmNiO(Nb)回路と10nm金(Au)キャッピング層を組み合わせた超伝導デバイスについて検討した。以上の結果から,Au層の追加は2レベルのシステム欠陥の密度を低下させることが明らかとなった。この結果から,Nb/Au積層素子共振器が超伝導量子技術の進歩に有効である可能性が示唆された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:47:40 GMT)
Logical Modelling in CS Education: Bridging the Natural Language Gap [0.0]
コンピュータサイエンスの学生にとって重要な学習目的は、現実世界のシナリオの記述を形式化する方法を学ぶことである。本稿では,学生が語彙を選択する教育的課題に対する概念的枠組みを提案する。我々はイルティス教育システム内で命題語彙と一階語彙を設計するための教育タスクを実装した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:34:41 GMT)
Leveraging VAE-Derived Latent Spaces for Enhanced Malware Detection with Machine Learning Classifiers [0.0]
本稿では,決定木,ナイーブベイズ,ライトGBM,ロジスティック回帰,ランダムフォレストという5つの機械学習分類器の性能を評価する。異なるランダムシードで異なるトレーニングテストスプリットで実施された実験の結果、すべてのモデルがマルウェアの検出において良好に機能していることが判明した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:31:34 GMT)
Learning to Borrow Features for Improved Detection of Small Objects in Single-Shot Detectors [0.0]
そこで本研究では,クラス内のより大規模で意味的にリッチなインスタンスから,小さなオブジェクト表現を識別的特徴の「バラバラ化」を可能にする新しいフレームワークを提案する。本手法は, 複雑な視覚環境下でのロバストな物体検出に有望な方向を提供するため, ベースライン法よりも小さな物体検出精度を著しく向上させる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:18:33 GMT)
Landau-Zener-Stückelberg spectroscopy of a fluxonium quantum circuit [0.0]
本研究では, フラキソニウム回路において, 大振幅非共振周期駆動下で得られた時間平均集団について検討した。本稿では、駆動量子回路のマルチレベル構造を考慮した時間進化の数値シミュレーションを提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:28:03 GMT)
LSTM+Geo with xgBoost Filtering: A Novel Approach for Race and Ethnicity Imputation with Reduced Bias [0.0]
本稿では,位置情報を用いたLong Short-Term Memory Networkの拡張手法であるLSTM+Geoを紹介する。大規模な投票者データセットを用いて、LSTM+Geo(88.7%の精度)がスタンドアローンLSTMおよびベイズ法より著しく優れていることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:20:08 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0]
トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。これまでの研究では、伝統的な注意機構が、この領域におけるそれらの有効性を制限する重要な要素として特定されてきた。本稿では,トランスフォーマーを用いた時系列予測において,エントロピー崩壊を緩和し,不安定性をトレーニングするための新しいアプローチであるLATSTを紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 01:52:08 GMT)
Kraus is King: High-order Completely Positive and Trace Preserving (CPTP) Low Rank Method for the Lindblad Master Equation [0.0]
我々はリンドブラッド方程式の本質的構造を尊重しながら密度行列の低階構造を利用する。本手法は完全陽性であり, 微量保存である。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:36:14 GMT)
Kernel-Based Ensemble Gaussian Mixture Probability Hypothesis Density Filter [0.0]
EnGM-PHDフィルタは、GM-PHDフィルタのガウス混合法とSMC-PHDフィルタの粒子法を組み合わせたものである。その結果, EnGM-PHDフィルタは, GM-PHDフィルタとSMC-PHDフィルタのどちらよりも優れたマルチターゲットフィルタ性能が得られることがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 19:00:02 GMT)
Kernel Density Machines [0.0]
カーネル密度マシン(英: kernel density machine、KDM)は、再生されたカーネルヒルベルト空間設定における新しい密度比推定器である。整合性、機能中心極限定理、有限サンプル誤差境界を含む理論的保証を提供する。シミュレーションおよび実データに基づく実験結果から,KDMの有効性と精度が示された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:25:25 GMT)
Investigating the Effect of Parallel Data in the Cross-Lingual Transfer for Vision-Language Encoders [0.0]
トレーニング済みのVision-Language(VL)モデルと下流タスクのトレーニングデータは英語でのみ利用可能である。並列データを用いて、すでに訓練済みのエンコーダを転送する。その結果,機械翻訳されたタスクデータでさえ,平均的,キャプション的,真に並列なデータの方が,いくつかの言語で優れていたことが判明した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:19:15 GMT)
Investigating Literary Motifs in Ancient and Medieval Novels with Large Language Models [0.0]
ギリシアの架空の物語は、しばしばラブノベルやロマンスと呼ばれ、紀元前1世紀から15世紀半ばまで、多くの点で類似していると考えられてきた。本研究は, コーパスのテキストが共通であることの正確なモチーフと, それらの相違点について検討することを目的とする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:39:06 GMT)
InvAASTCluster: On Applying Invariant-Based Program Clustering to Introductory Programming Assignments [0.0]
本稿では,プログラムクラスタリングの新しいアプローチであるInvAASTClusterを提案する。 InvAASTClusterのプログラム表現は、その不変性と構造を通して、プログラムのセマンティクスの組み合わせを使用する。以上の結果から,InvAASTClusterはクラスタリングベースの修復ツールで使用する場合,最先端の処理を高速化することがわかった。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:39:53 GMT)
Inference for Regression with Variables Generated by AI or Machine Learning [0.0]
我々は、AI/ML生成変数を「データ」として鼻で扱うと、偏りのある推定と不正な推測につながることを示す。有効な推論を復元するために,(1)バイアス補正された信頼区間を持つ明示的バイアス補正法,(2)回帰パラメータと潜時変数の合同推定法を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:14:10 GMT)
In Search Of Lost Tunneling Time [0.0]
我々は,結合デルタ電位と定電場からなる静的一次元トンネルモデルの時刻時間を算出する。トンネル出口ではゼロではないものの、原子から遠く離れた検出器で消滅する。このモデルにより, 位置分解トンネル時間の類似を導出できる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:44:54 GMT)
Glucagon and insulin production in pancreatic cells modeled using Petri nets and Boolean networks [0.0]
糖尿病 (diabetes) は、血液中のグルコース濃度を一定に高めることによって特徴づけられる文明性慢性疾患である。これらのプロセスをよりよく理解するために、私たちは、体内のグルコース調節のペトリネットモデルを作成することを目標にしました。本稿では,膵β細胞におけるインスリン分泌のペトリネットモデル,および膵α細胞におけるグルカゴンについて紹介する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:36:02 GMT)
Generative Machine Learning in Adaptive Control of Dynamic Manufacturing Processes: A Review [0.0]
本稿では、意思決定アプリケーション、プロセスガイダンス、シミュレーション、デジタルツインを通じて、生産制御のための生成機械学習の可能性を示す。本稿では,生産システムの動的複雑さに対処するために,ジェネレーティブMLと制御技術を組み合わせた統合フレームワークの開発を目的とした今後の研究方向性を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 22:48:04 GMT)
GPU Performance Portability needs Autotuning [0.0]
我々は、Just-in-time(JIT)コンパイルとカーネルパラメータの自動チューニングを組み合わせることで、コード変更なしにポータブルで最先端のLCM実行を可能にする。我々の結果は、GPUベンダー間のモデルポータビリティをアンロックするための有望なパスとして、オートチューニングを強調しています。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:57:21 GMT)
From expNN to sinNN: automatic generation of sum-of-products models for potential energy surfaces in internal coordinates using neural networks and sparse grid sampling [0.0]
本研究の目的は,積の和形におけるポテンシャルエネルギー面を表す正弦波活性化関数を持つ単一層人工ニューラルネットワークの実現性を評価することである。 sinNNという名前のフィッティングアプローチはHONOのPSSをモデル化し、トランス異性体とシス異性体の両方をカバーする。 sinNN PESモデルは、利用可能な基本振動遷移エネルギーを17cm-1の根平均二乗誤差で再現することができた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:31:32 GMT)
Finite and Asymptotic Key Analysis for CubeSat-Based BB84 QKD with Elliptical Beam Approximation [0.0]
衛星とCubeSatベースの量子鍵分布(QKD)は、安全な長距離通信のための有望なソリューションである。本研究では,有限ブロックおよびシングルパス秘密鍵長の計算に用いる統計手法の性能について検討した。効率的なBB84プロトコルは、大気条件の異なる標準バージョンよりも一貫して優れている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:23:08 GMT)
Fine-tuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition [0.0]
このようなシナリオでは、データ拡張による単純な微調整が驚くほどうまく機能することを示す。大規模な実世界のデータセットでは、新しいライターの微調整により、16行で25パーセント、256行で50%の平均的なCER改善が得られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:16:12 GMT)
Fact-Consistency Evaluation of Text-to-SQL Generation for Business Intelligence Using Exaone 3.5 [0.0]
大規模言語モデル(LLM)は、テキスト・ツー・ジェネレーションによる構造化データクエリーのための自然言語インタフェースの実現を約束している。本稿では,Exaone 3.5 を用いて LLM 生成したsql 出力の意味的精度を評価するためのFact-Consistency Evaluation Framework を提案する。本稿では,LG Electronicsの内部BigQuery環境における実際の販売データから抽出した219の自然言語ビジネス質問からなるドメイン固有ベンチマークを構築した。我々は,応答精度,実行成功率,意味的誤り率,非応答率を用いてモデル性能を評価する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:42:18 GMT)
Evaluating the AI-Lab Intervention: Impact on Student Perception and Use of Generative AI in Early Undergraduate Computer Science Courses [0.0]
Generative AI(GenAI)はコンピュータサイエンス教育に急速に参入しつつある。形式コースにおける道具使用の指針となる構造的足場の研究のギャップを伴う過信共存に関する懸念。本研究は,「AI-Lab」の介入が大学生に与える影響について考察する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:12:42 GMT)
Error analysis of quantum operators written as a linear combination of permutations [0.0]
我々は、置換の線形結合として与えられる行列を考慮し、固有値の摂動に対するビットと位相フリップの影響を分析する。線形結合の係数が正となると、行列の固有値が量子ビットフリップ誤差に対するレジリエンスを示すことが観察される。混合符号係数を持つ行列はビットフリップと位相フリップの誤差に対するレジリエンスが低いが、数値的な証拠は固有スペクトルの摂動が小さい場合に非常に小さいことを示している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:55:13 GMT)
Entropy Heat-Mapping: Localizing GPT-Based OCR Errors with Sliding-Window Shannon Analysis [0.0]
本稿では,一対のシャノンエントロピーを視覚的「不確かさの風景」に変えるエントロピー・ヒート・マッピング・オブ・コンセプションを提案する。強調したホットスポットとOpenAI GPT-4oによる実際の転写誤りを比較した。この研究は、最小限に設計された設定において、スライドウインドウのエントロピーが、後編集型GPTベースのOCRの実用的で軽量な助けとなることを実証している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 09:05:49 GMT)
Enhanced Feature Learning via Regularisation: Integrating Neural Networks and Kernel Methods [0.0]
我々は,ソボレフ関数の期待値として,データの任意の一次元射影に対する期待値とみなす。このフレームワークはカーネルリッジ回帰に似ており、カーネルは$mathbbE_w (k(B)(wtop x,wtop xprime))$で、$k(B)(a,b) := min(|a|, |b|)mathds1_ab>0$で、プロジェクションの$w$は学習される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:49:56 GMT)
Emotional Analysis of Fashion Trends Using Social Media and AI: Sentiment Analysis on Twitter for Fashion Trend Forecasting [0.0]
ファッション関連ソーシャルメディア会話における感情パターンがファッショントレンドの予測要因となるかを検討する。その結果、感情パターンとファッションテーマの人気との間には、アクセサリーとストリートウェアのテーマが統計的に有意な増加傾向を示した。改良された予測モデルでは,感情分類の精度が78.35%向上し,傾向予測の信頼性が確立された。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 07:27:06 GMT)
Efficient Quantum-Safe Homomorphic Encryption for Quantum Computer Programs [0.0]
ホモモルフィック暗号は、合成次数群をモジュール学習誤差格子(MLWE)に置き換えることで量子設定に引き上げられる。我々は、暗号オラクルへのコヒーレントアクセスを可能にするqIND-CPAゲームでセキュリティを形式化する。性能解析により、今日のQPUアイドルウィンドウに余分な格子演算が適合していることが分かる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 00:08:43 GMT)
Efficient Learning Implies Quantum Glassiness [0.0]
量子学習理論とアルゴリズムの硬さの驚くべき関係を示す。量子アルゴリズムの「Lipschitz」では,スパース乱れの量子系の近傍状態の発見が平均的に困難であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:00:29 GMT)
Dynamics of decoherence in a noisy driven environment [0.0]
環境の非平衡臨界ダイナミクスによるデコヒーレンスは、非相関ノイズと相関ノイズの存在下で増幅されることを示す。量子ビットと環境との強い結合は、デコヒーレンスの部分的な回復をもたらす。我々は、ノイズの存在下で減衰するが、ノイズ相関時間が増加するにつれて増加するという、力学の非マルコビアン性を探究する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:11:02 GMT)
Dynamical Local Tadpole-Improvement in Quantum Simulations of Gauge Theories [0.0]
格子ゲージ理論の量子シミュレーションにおいて、時空依存的な量子補正から生じる新しい要素を同定する。本研究は,2+1DにおけるSU(2)プラケット鎖とハニカム格子の時間発展に関する数値シミュレーションの結果について述べる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:26:32 GMT)
Dragonfly: a modular deep reinforcement learning library [0.0]
Dragonflyはモジュール性を重視した強化学習ライブラリである。これはシリアライズに依存しており、ビルディングブロックをスワップし、パラメータスイープを実行することができる。その機能の一部は、数値シミュレーションのようなCPU集約環境向けに特別に設計されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:39:00 GMT)
Detection and Classification of Diseases in Multi-Crop Leaves using LSTM and CNN Models [0.0]
植物病は作物の収穫量を減らし、食糧品質に影響を与えることで農業に深刻な課題をもたらす。本研究では,植物葉病の分類に畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)モデルを適用した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 02:36:51 GMT)
Design and Monte Carlo Simulation of a Phase Grating Moiré Neutron Interferometer to Measure the Gravitational Constant [0.0]
重力定数(G)は、自然界の最も正確には知られていない基本定数である。一般的に適用される振り子法と異なる系統的効果を持つGを測定するための新しい技術が必要である。 PGMI (phase-grating moir'e interferometer) と呼ばれる新しいNI設計は、中性子フラックスをマグニチュードで増大させることが示されている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:37:20 GMT)
Decomposition of State Spaces into Subobjects in Quantum Field Theory [0.0]
本稿では、量子場の状態空間をいくつかの絡み合った部分オブジェクトに分解する包括的形式論を導入する。部分対象のいくつかを退化背景状態に射影すると、システムは有効場理論に還元される。すべての可能な遷移を平均化すると、固有値が増加する写像に対して、固有値が減少する写像よりも振幅が高いことが示される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 08:41:19 GMT)
DNB-AI-Project at SemEval-2025 Task 5: An LLM-Ensemble Approach for Automated Subject Indexing [0.0]
我々のシステムは、知的注釈付きレコードの様々な例でLLMの選択を促すことに依存している。生成したキーワードをターゲット語彙にマップし、結果の主題語をアンサンブル投票に集約し、レコードとの関連性についてランク付けする。本システムは,全対象トラックにおける定量的ランキングでは4位であるが,主観的索引付けの専門家による質的ランキングでは最もよい結果が得られた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 12:47:09 GMT)
Cryptography without Long-Term Quantum Memory and Global Entanglement [0.0]
量子暗号プリミティブを構築するために,古典的なクエリアクセスのみが可能なオーラクルをどのように利用できるかを示す。重要なことは、RAM難読化方式は長期の量子メモリや大域的な絡み合いを必要としない。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 17:51:25 GMT)
CryptoUNets: Applying Convolutional Networks to Encrypted Data for Biomedical Image Segmentation [0.0]
プライバシー保護型U-Netディープラーニング推論フレームワーク,すなわち同型暗号化に基づくU-Net推論の実現可能性を示す。我々の知る限り、この実装を実現するための最初の取り組みは、同型暗号化を完全にベースとしたU-Net推論を可能にすることである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:37:22 GMT)
ConSens: Assessing context grounding in open-book question answering [0.0]
大規模言語モデル(LLM)は、オープンブック質問応答(QA)においてかなりの成功を収めた。オープンブックのQAにおける重要な課題は、モデル応答がパラメトリックな知識ではなく、提供されたコンテキストに基づいていることを保証することです。 2つの条件下でのモデル応答の難易度を対比する新しい計量法を提案する。結果のスコアは、与えられたコンテキストに依存するモデルの回答の範囲を定量化する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:23:15 GMT)
Comparison of Kinematics and Kinetics Between OpenCap and a Marker-Based Motion Capture System in Cycling [0.0]
本研究は, サイクリング時の関節運動学および運動学評価におけるマーカーベースおよびマーカーレスモーションキャプチャシステム(OpenCap)の適合性を評価する。 OpenSimを用いて, 関節角度, モーメント, 関節反応負荷などの重要な指標を計算した。その結果, 股関節(屈曲・伸展), 膝(屈曲・伸展), 足首(背屈・足関節屈曲)の関節角度について非常に強い一致(r GT 0.9)を示した。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:19:20 GMT)
Class Uncertainty: A Measure to Mitigate Class Imbalance [0.0]
授業の基数のみを考慮すると、クラス不均衡の原因となるすべての問題をカバーできるわけではない。トレーニング事例の予測的不確実性の平均値として「クラス不確実性」を提案する。また,SVCI-20は,クラスが同じ数のトレーニングサンプルを持つが,それらの硬さの点で異なる,新しいデータセットとしてキュレートする。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:42:18 GMT)
Chronic Diseases Prediction using Machine Learning and Deep Learning Methods [0.0]
本研究は,慢性疾患および甲状腺疾患の予測に機械学習(ML)およびディープラーニング(DL)技術の応用について検討した。我々は、ロジスティック回帰(LR)、ランダムフォレスト(RF)、グラディエントブーストツリー(GBT)、ニューラルネットワーク(NN)、決定木(DT)、ネイティブベイズ(NB)など、さまざまなモデルを使用した。その結果、ランダムフォレストやグラディエントブーストツリーのようなアンサンブル手法は一貫して優れていた。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 21:08:16 GMT)
Boundary effects in classical liquid density fluctuations at finite temperature [0.0]
フォノン量子化法による閉じ込められた古典液体中の密度変動に対する熱的効果の研究系は、ディリクレ、ノイマン、混合境界条件を持つ完全に反射する平行平面の間の無質量スカラー場を介してモデル化される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:07:19 GMT)
AuthOr: Lower Cost Authenticity-Oriented Garbling for Arbitrary Boolean Circuits [0.0]
Frederiksenらによる認証指向のギャリングスキームEurocrypt '15は、Bellareらによる認証基準のみを満たすように設計されている。我々は、Zahurらのハーフゲート(HG)ガーブリングの最先端の真正性指向バージョンであるCrypto '15を改善する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 14:37:04 GMT)
Aspects of Complexity in Quantum Evolutions on the Bloch Sphere [0.0]
我々は、時間-最適および時間-最適量子ハミルトン進化に関連する複雑さの定量的理解を強化する。我々の研究は、一般に、効率的な量子進化は非効率な進化よりも低い複雑さを持っていることを示唆している。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 20:24:32 GMT)
ArrhythmiaVision: Resource-Conscious Deep Learning Models with Visual Explanations for ECG Arrhythmia Classification [0.0]
本稿では,エッジデバイス上での効率的なリアルタイム不整脈分類に最適化されたArrhythmiNet V1とV2を提案する。 MobileNetの深い分離可能な畳み込み設計にインスパイアされたこれらのモデルは、それぞれ302.18KBと157.76KBのメモリフットプリントを維持している。本研究は, 実用, ウェアラブル, 組込みECGモニタリングシステムにおいて, 解釈可能性, 予測精度, 計算効率の両立の可能性を示すものである。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:22:45 GMT)
Approximation theory for Green's functions via the Lanczos algorithm [0.0]
グリーン函数は連続分数として表せることが知られている。連続分数を用いたグリーン関数の近似における誤差に関する理論を提案する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:00:43 GMT)
Anomaly-Driven Approach for Enhanced Prostate Cancer Segmentation [0.0]
本研究では,2パラメータMRI系列から得られた異常マップを深層学習に基づくセグメンテーションフレームワークに組み込んだ,異常駆動型U-Net(adU-Net)を提案する。固定点GAN再構成を用いて生成された異常マップは、正常前立腺組織からの偏差を強調し、セグメント化モデルを潜在的癌領域へ導く。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 16:48:00 GMT)
Algorithmic Addiction by Design: Big Tech's Leverage of Dark Patterns to Maintain Market Dominance and its Challenge for Content Moderation [0.0]
本稿では,オンラインプラットフォームが意図的に中毒性ユーザ行動と幅広い社会的意味を育む方法について考察する。テクノロジー企業が支配を維持するために活用するツールとして、ダークパターン、説得力のあるデザイン要素、レコメンデーションアルゴリズムなど、中毒性のあるデザインが使われている。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 10:43:18 GMT)
Adversarial KA [0.0]
コルモゴロフとアーノルド(Kolmogorov and Arnold、KA)は、ギュイユモトライト関数を表現または表現するためのアルゴリズムである。 KA は連続した逆数の可算集合に対して堅牢であるが、外函数の等連続性に関する疑問を解く。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 15:07:54 GMT)
Adaptive Time Stepping for the Two-Time Integro-Differential Kadanoff-Baym Equations [0.0]
我々はグリーン関数の運動方程式、カダノフ・バイム方程式(KBE)の統合スキームを提案する。我々は、KBEを自己整合的に解くことの重要性を分析し、正確な結果を得るためには、履歴積分評価の順序の順応が重要であることを示す。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 23:30:34 GMT)
Actual Knowledge Gain as Privacy Loss in Local Privacy Accounting [0.0]
本稿では、局所微分プライバシー(LDP)と、クエリ対象に固有の知識の学習に関する世界的制限の等価性を確立する。 LDPクエリからの出力は、学習限界の上限に匹敵する正確な知識を提供するために必ずしも必要ではない。実際の知識獲得の最小上限は導出され、実現されたプライバシー損失と呼ばれる。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 06:34:01 GMT)
A note on the quantum Wielandt inequality [0.0]
ラハマンによって導入された作用素代数的方法を拡張して、任意の原始シュワルツ写像の原性指数が少なくとも2(D-1)2$であることを示す方法を示す。行列積状態の親ハミルトニアンの性質について、ペレス=ガルシア、ヴェルシュトラーテ、ウルフ、シラクの予想とどのように関係するかを簡単に議論する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 13:40:53 GMT)
A Novel Compound AI Model for 6G Networks in 3D Continuum [0.0]
本稿では,複雑なタスクを専門的かつ相互運用可能なモジュールに分解する,新しい三部構成のフレームワークを導入する,複合AIシステムの形式モデルを提案する。我々は、クロスドメインリソースオーケストレーション、動的トポロジへの適応、異種環境における一貫性のあるAIサービス品質の維持など、3D連続体で動作する6Gネットワーク内の複合AIシステムで直面する重要な課題を特定します。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 11:28:33 GMT)
A Geometric Substructure for Quantum Dynamics [0.0]
閉量子系の理論は、基礎となる部分構造の同定によって拡張される。リーマン部分構造への一般化の可能性は推測され、背景重力場との予期せぬ相互作用が示唆される。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:14:49 GMT)
A CMOS Probabilistic Computing Chip With In-situ hardware Aware Learning [0.0]
本稿では,チメラグラフに440本のスピンを配置し,0.44mm2の領域を占有する確率的ビット物理による解法を実証する。論理ゲートや完全加算器などの確率的計算タスクやMaxCutなどの最適化タスクの実行能力を検証する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 05:38:53 GMT)
A Bridge to Nowhere: A Healthcare Case Study for Non-Reformist Design [0.0]
広義の領域における構造的損害を軽減し, 設計の公正性を高めるために, 非整形設計のための4つのテネセットを提案する。非改革主義改革の廃止主義的枠組みが、事前の承認の害を軽減する代替介入の明確化にどのように役立つかを検討する。
論文参考訳（メタデータ） (Wed, 30 Apr 2025 18:33:04 GMT)