RAG-6DPose: Retrieval-Augmented 6D Pose Estimation via Leveraging CAD as Knowledge Base [112.7] 本稿では,3次元CADモデルを知識ベースとして活用する検索拡張手法であるRAG-6DPoseを提案する。
標準的なベンチマークと実世界のロボットタスクによる実験結果は、我々のアプローチの有効性と堅牢性を示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:19:41 GMT)
One Step Diffusion via Shortcut Models [109.7] 単一ネットワークとトレーニングフェーズを用いて高品質なサンプルを生成する,生成モデルのファミリであるショートカットモデルを導入する。
ショートカットモデルは、現在のノイズレベルと所望のステップサイズにネットワークを条件付け、生成プロセスでモデルをスキップすることができる。
蒸留と比較して、ショートカットモデルは複雑性を1つのネットワークとトレーニングフェーズに減らし、推論時に様々なステップ予算を許容する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:26:35 GMT)
RLPR: Extrapolating RLVR to General Domains without Verifiers [103.1] 本稿では,RLVRを汎用ドメインに外挿するシンプルな検証不要なフレームワークであるRLPRを提案する。
このノイズの多い確率報酬の高分散に対処することが、それを機能させるためには不可欠である。
RLPRはGemma、Llama、Qwenベースのモデルの両方の領域における推論機能の改善を一貫して行っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:56:36 GMT)
From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.7] 推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:27:19 GMT)
MeRF: Motivation-enhanced Reinforcement Finetuning for Large Reasoning Models [95.6] MeRF(Motivation-enhanced Reinforcement Finetuning)は、大規模言語モデル(LLM)の強化学習を強化する直感的かつ効果的な手法である。
MeRFは報酬仕様を直接プロンプトに注入し、最適化目標を認識して応答を改善するためのコンテキスト内モチベーションとして機能する。
Knights and Knaves(K&K)論理パズル推論ベンチマークに関する実証的な評価は、texttMeRFがベースラインよりもかなりの性能向上を達成することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:37:57 GMT)
OMEGA: Can LLMs Reason Outside the Box in Math? Evaluating Exploratory, Compositional, and Transformative Generalization [88.8] 最近の大規模言語モデル (LLMs) は、DeepSeek-R1-のような長い鎖の推論を持ち、オリンピアード級数学において印象的な成果を上げている。
本稿では,3つの分布外一般化の軸を評価するために設計された3つの一般化 Axes-a ベンチマークを用いた OMEGA-Out-of-distriion Math Problems Evaluation を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:51:40 GMT)
Improving Weakly Supervised Temporal Action Localization by Exploiting Multi-resolution Information in Temporal Domain [84.7] 時間領域における多重解像度情報を完全に活用するための2段階の手法を提案する。
第1段階では、外観と動きの流れの両方に基づいて、信頼できる初期フレームレベルの擬似ラベルを生成する。
第2段階では、疑似ラベルを反復的に洗練し、信頼度の高い疑似ラベルを持つ選択されたフレームの集合を用いてニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:20:18 GMT)
Broken Tokens? Your Language Model can Secretly Handle Non-Canonical Tokenizations [83.9] ランダムにサンプリングされたトークン化が与えられた場合、命令調整されたモデルは元の性能の最大93.4%を維持している。
文字レベルのセグメンテーションは文字列操作とコード理解タスクを最大+14%改善する。
右列桁のグルーピングは、大数の算術を+33%向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:02:26 GMT)
Fast State-Augmented Learning for Wireless Resource Allocation with Dual Variable Regression [83.3] 本稿では,資源割当ポリシに対する状態拡張グラフニューラルネットワーク(GNN)のパラメトリゼーションが,ユビキタスな二段階的手法の欠点を回避する方法を示す。
ラグランジアンによる国家拡張政策の最大化は、オフライントレーニングフェーズ中に学習される。
収束結果と指数確率は、双対函数(有限値)最適性ギャップの剰余に縛られることを証明する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:20:58 GMT)
SlimMoE: Structured Compression of Large MoE Models via Expert Slimming and Distillation [82.5] SlimMoEは、大規模なMoEモデルをより小さく効率的な変種に変換するための多段階圧縮フレームワークである。
このフレームワークを用いて、Phi 3.5-MoE (41.9Bトータル/6.6Bアクティベートパラメータ)を圧縮し、Phi-mini-MoE (7.6Bトータル/2.4Bアクティベートパラメータ)とPhi-tiny-MoE (3.8Bトータル/1.1Bアクティベートパラメータ)を生成する。
実験により、圧縮されたモデルが他のモデルと同等の大きさのモデルよりも優れ、より大きなモデルと競合し続けていることが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:15:59 GMT)
LoRA vs Full Fine-tuning: An Illusion of Equivalence [76.1] 我々は,Low-Rank Adaptation (LoRA) とフルファインタニングによる事前学習モデルについて検討する。
特異値分解が全く異なる構造を示すLoRAおよび完全微調整収量行列が得られた。
我々は、LoRAが完全な微調整を忘れてはならないという発見を拡張し、その忘れ物は侵入者次元に大きく局所化されていることを発見した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:59:01 GMT)
Controlling Moments with Kernel Stein Discrepancies [74.8] Kernel Steindisrepancies (KSD) は分布近似の品質を測定する。
まず、弱収束制御に使用される標準KSDがモーメント収束制御に失敗することを示す。
次に、代替拡散KSDがモーメントと弱収束の両方を制御できる十分な条件を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:30:18 GMT)
4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time [74.1] 4D-LRMは、制約のないビューとタイムスタンプから入力を受け取り、任意のビュータイムの組み合わせをレンダリングする最初の大規模4D再構成モデルである。
統合された時空表現を学習し、時間を通してポーズされた画像トークンからピクセルごとの4Dガウスプリミティブを直接予測する。
1つのA100 GPU上で1.5秒未満で、24フレームのシーケンスを1フォワードパスで再構築する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:57:47 GMT)
FullLoRA: Efficiently Boosting the Robustness of Pretrained Vision Transformers [72.8] Vision Transformer (ViT) モデルは、様々なコンピュータビジョンタスクにおいて徐々に主流になりつつある。
既存の大きなモデルは、トレーニング中のパフォーマンスを優先する傾向があり、ロバストさを無視する可能性がある。
従来のLoRAモジュールよりも前に学習可能なレイヤ正規化を取り入れた新しいLNLoRAモジュールを開発した。
学習可能なLNLoRAモジュールをViTモデルの主要コンポーネントに組み込むことにより,FullLoRAフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:57:04 GMT)
Boosting Virtual Agent Learning and Reasoning: A Step-Wise, Multi-Dimensional, and Generalist Reward Model with Benchmark [72.5] Generalist Virtual Agents (GVA) は自律的なタスク実行において大きな可能性を示している。
これらの課題に対処するため,ステップワイズ多次元ジェネラリスト・リワードモデルを提案する。
同様に、エージェントトレーニング用のきめ細かい信号を提供し、推論時間スケーリングのためのより良いアクションを選択することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:17:25 GMT)
cuVSLAM: CUDA accelerated visual odometry and mapping [72.4] cuVSLAMは、視覚的同時ローカライゼーションとマッピングのための最先端のソリューションである。
複数のRGBと深度カメラ、慣性測定ユニットなど、さまざまなビジュアル慣性センサースイートで操作できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:42:12 GMT)
EEG Foundation Challenge: From Cross-Task to Cross-Subject EEG Decoding [71.3] 2つの課題からなる大規模なコードベースのコンペティションを導入します。
Transfer Challengeは参加者に対して,新たなタスクと新たな課題をEEGデータからゼロショットデコード可能なモデルの構築とテストを求めるものだ。
精神病理因子予測チャレンジでは、参加者に脳波データからメンタルヘルスの指標を推測するよう求めている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:25:19 GMT)
DuetGen: Music Driven Two-Person Dance Generation via Hierarchical Masked Modeling [70.8] 音楽から対話的な2人舞踊を生成するためのフレームワークであるDuetGenを提案する。
近年の運動合成の進歩に触発されて,我々は2段階の解法を提案する。
我々は、両方のダンサーの動きを統合された全体として表現し、必要な動きトークンを学習する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:22:50 GMT)
A Principled Approach to Randomized Selection under Uncertainty [68.4] 本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:59:30 GMT)
Orthogonal Projection Subspace to Aggregate Online Prior-knowledge for Continual Test-time Adaptation [67.8] 連続テスト時間適応(CTTA)は、新しいシナリオに継続的に適応するために、ソース事前訓練されたモデルを必要とするタスクである。
我々は、OoPkと呼ばれるオンライン事前知識を集約する新しいパイプラインOrthogonal Projection Subspaceを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:17:39 GMT)
Command-V: Pasting LLM Behaviors via Activation Profiles [67.1] Command-Vはバックプロパゲーションフリーな行動伝達法である。
既存の残留活性化アダプタをドナーモデルからコピーし、その効果を受信モデルに貼り付ける。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:21:49 GMT)
Diffusion Transformer-to-Mamba Distillation for High-Resolution Image Generation [65.5] 本稿では,効率的なトレーニングパイプラインを形成するための拡散変圧器-タンバ蒸留(T2MD)について紹介する。
我々は,効率とグローバルな依存関係を同時に達成する拡散自己注意とマンバハイブリッドモデルを確立する。
実験により、トレーニングパスはオーバーヘッドが低く、高品質のテキスト・ツー・イメージ生成につながることが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:01:19 GMT)
Learning from Stochastic Teacher Representations Using Student-Guided Knowledge Distillation [64.2] 教師表現のフィルタリングと重み付けのための自己蒸留(SSD)訓練戦略を導入し,タスク関連表現のみから抽出する。
UCR Archiveのウェアラブル/バイオサインデータセット、HARデータセット、画像分類データセットなどの実世界の感情コンピューティングに関する実験結果は、提案したSSD手法が最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:04:22 GMT)
Step1X-Edit: A Practical Framework for General Image Editing [64.1] 我々は、Step1X-Editと呼ばれる最先端の画像編集モデルをリリースする。
GPT-4oやGemini2 Flashのようなクローズドソースモデルと同等のパフォーマンスを提供できる。
評価のために,実世界のユーザ指示に根ざした新しいベンチマークであるGEdit-Benchを開発した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:11:44 GMT)
ADVLLM: Iterative Self-Tuning LLMs for Enhanced Jailbreaking Capabilities [63.6] 本稿では,対戦型LDMをジェイルブレイク能力に富んだ反復的自己調整プロセスであるADV-LLMを紹介する。
我々のフレームワークは,様々なオープンソース LLM 上で ASR を100% 近く達成しながら,逆接接尾辞を生成する計算コストを大幅に削減する。
Llama3のみに最適化されているにもかかわらず、GPT-3.5では99%のASR、GPT-4では49%のASRを達成している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:12:31 GMT)
LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Inconsistencies [63.1] M-ALERTは5つの言語における大規模言語モデルの安全性を評価するベンチマークである。
M-ALERTには言語毎に15kの高品質なプロンプトが含まれており、合計で75k、カテゴリワイドアノテーションがある。
39種類のLLMに関する実験は,言語固有の安全性解析の重要性を強調した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:45:09 GMT)
OmniGen2: Exploration to Advanced Multimodal Generation [62.6] 我々はOmniGen2を紹介した。OmniGen2は多種多様な生成タスクに統一されたソリューションを提供するために設計された汎用的でオープンソースな生成モデルである。
OmniGen v1とは異なり、OmniGen2はテキストと画像のモダリティのための2つの異なるデコードパスを備えており、未共有のパラメータと分離された画像トークンを使用する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:38:54 GMT)
Let Your Video Listen to Your Music! [62.3] 本稿では,音楽トラックのリズムに合わせてビデオを自動的に編集する新しいフレームワークMVAAを提案する。
我々は、タスクをMVAAの2段階のプロセスにモジュール化し、動きをオーディオビートと整列させ、次にリズム対応のビデオ編集を行います。
このハイブリッドアプローチは、CogVideoX-5b-I2Vをバックボーンとして使用した1つのNVIDIA 4090 GPU上で10分以内の適応を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:52:16 GMT)
Transferring Features Across Language Models With Model Stitching [61.2] 言語モデルの残差ストリーム間のアフィンマッピングは、モデル間で表現された特徴を転送するための安価な方法であることを示す。
小型モデルと大規模モデルは同様の表現空間を学習し、より小さなモデルでSAEなどの高価なコンポーネントをトレーニングし、FLOPの貯蓄でより大きなモデルに転送する動機付けをする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:21:57 GMT)
A Survey of AIOps in the Era of Large Language Models [60.6] 我々は,2020年1月から2024年12月にかけて発行された183件の研究論文を分析し,4つの重要な研究課題(RQ)に答えた。
現状の進歩と動向を議論し、既存の研究のギャップを識別し、今後の探査に向けて有望な方向性を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:40:16 GMT)
Universal Video Temporal Grounding with Generative Multi-modal Large Language Models [59.8] 本稿では,自然言語クエリに基づいて映像中の時間的モーメントを正確に局所化する,ユニバーサルビデオ時間的グラウンドの計算モデルを提案する。
生成型マルチモーダル大言語モデル(MLLM)の強力な視覚言語理解機能を活用した,堅牢で普遍的なビデオグラウンドモデルUniTimeを提案する。
我々のモデルは、複雑な言語クエリを解釈しながら、多様なビュー、ジャンル、長さの動画を効果的に処理する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:53:18 GMT)
InternSpatial: A Comprehensive Dataset for Spatial Reasoning in Vision-Language Models [59.7] InternSpatialは視覚言語モデル(VLM)における空間推論のための最大のオープンソースデータセットである
InternSpatialは、シングルビューとマルチビューの両方にまたがる1200万のQAペアで構成されている。
InternSpatial-Benchは、多様な命令形式で空間的理解を評価するために設計された評価ベンチマークである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:17:22 GMT)
TrajTok: Technical Report for 2025 Waymo Open Sim Agents Challenge [59.0] 本稿では、離散的な次トーケン予測に基づく行動生成モデルのためのトラジェクトリトークンであるTrajTokを紹介する。
我々は,SMARTモデルのトークン化と損失を採用し,2025年のオープン・シム・エージェント・チャレンジにおいて,リアリズムスコア0.7852の優れた性能を達成した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:32:05 GMT)
Chain-of-Experts: Unlocking the Communication Power of Mixture-of-Experts Models [58.5] CoE(Chain-of-Experts)は新しいMixture-of-Experts(MoE)アーキテクチャで、各レイヤ内でのシーケンシャルな専門家通信を導入している。
イテレーション間の動的専門家選択をサポートするために、CoEはレイヤ内の各ステップに専用のルータを使用している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:15:43 GMT)
Rethinking Click Models in Light of Carousel Interfaces: Theory-Based Categorization and Design of Click Models [57.8] 我々は、この時代遅れの見解は、クリックモデル設計の基本を適切に説明できないと論じる。
本稿では,クリックモデルが捉え得る統計的パターンを説明する3つの基本的キー設計選択を提案する。
これらの選択に基づいて、既存のすべてのクリックモデルと有意義な比較を可能にする、新しいクリックモデル分類を作成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:57:11 GMT)
Light of Normals: Unified Feature Representation for Universal Photometric Stereo [57.4] ユニバーサル測光ステレオ(英語版) (PS) は、任意の照明条件下で物体から高品質な表面の正常を回復することを目的としている。
2つの基本的な課題は、1) 様々な照明と表面の通常の特徴の深い結合、2) 複素曲面における高周波幾何学的詳細の保存である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:53:11 GMT)
Handling Numeric Expressions in Automatic Speech Recognition [57.0] 数値表現の認識と形式化のためのケースドとエンド・ツー・エンドのアプローチを比較した。
その結果,適応型エンドツーエンドモデルでは,低レイテンシと推論コストの利点を生かして,競争性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:45:07 GMT)
Context Biasing for Pronunciations-Orthography Mismatch in Automatic Speech Recognition [57.0] 本稿では,置換誤りの訂正を可能とし,難解な単語の認識精度を向上させる手法を提案する。
この手法により, 単語誤り率の相対的な改善を最大11%に抑えつつ, 単語誤り率の競争力を維持することができることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:42:03 GMT)
USAD: Universal Speech and Audio Representation via Distillation [56.9] Universal Speech and Audio Distillation (USAD)は、音声表現学習における統一的なアプローチである。
USADは音声、音声、音楽の様々なタイプを単一のモデルに統合する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:02:00 GMT)
NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.4] 我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:28:30 GMT)
ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs [56.3] 本稿では,新しいトラジェクトリ対応PRMであるReasonFlux-PRMを紹介し,トラジェクトリ応答型推論トレースの評価を行う。
ReasonFlux-PRMはステップレベルとトラジェクトリレベルの両方の監視機能を備えており、構造化された連鎖データと整合した微粒な報酬割り当てを可能にする。
得られたReasonFlux-PRM-7Bは、教師付き微調整で平均12.1%、強化学習で4.5%、テスト時間スケーリングで6.3%向上した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:02 GMT)
Generalizing Vision-Language Models to Novel Domains: A Comprehensive Survey [56.0] 視覚言語事前学習は、視覚とテキストの両モードの強みを統合する変換技術として登場した。
本調査は, VLM文献における一般化設定, 方法論, ベンチマーク, 結果の総合的な要約を目的とする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:56:37 GMT)
VMem: Consistent Interactive Video Scene Generation with Surfel-Indexed View Memory [55.7] Surfel-Indexed View Memory (VMem) は3次元表面要素に基づいて幾何学的にインデックス化することで過去のビューを記憶する機構である。
VMemは、新しいビューを生成する際に、最も関連性の高い過去のビューを効率的に検索することを可能にする。
我々は,シーンコヒーレンスとカメラ制御の維持における従来の手法と比較して,長期シーン合成ベンチマークの課題に対するアプローチを評価し,優れた性能を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:56 GMT)
MIFNet: Learning Modality-Invariant Features for Generalizable Multimodal Image Matching [54.7] キーポイントの検出と記述方法は、しばしばマルチモーダルデータと競合する。
マルチモーダル画像マッチングにおけるキーポイント記述に対するモダリティ不変特徴量を計算するためのモダリティ不変特徴量学習ネットワーク(MIFNet)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:56:43 GMT)
HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model [54.6] 操作ポリシー設計の基本的な目的は、ロボットに人間の指示を理解し、シーンの手がかりを推論し、動的な環境で一般化されたアクションを実行することである。
近年の自己回帰的視覚言語行動(VLA)法は、視覚言語モデル(VLM)から常識推論能力を継承し、次の行動予測を行う。
拡散に基づく行動の連続的な性質と自己回帰の文脈的推論を吸収する統合フレームワークであるHybridVLAを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:37:53 GMT)
LAPIG: Language Guided Projector Image Generation with Surface Adaptation and Stylization [54.3] LAPIGはユーザテキストプロンプトを入力として、プロジェクタを使って表面スタイルを変換することを目的としている。
投影面適応(PSA)は補償可能な表面スタイリングを生成する。
生成した画像は、視覚的に表面の形状を楽しませるために投影される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:49:00 GMT)
Holistic Physics Solver: Learning PDEs in a Unified Spectral-Physical Space [54.1] Holistic Physics Mixer (HPM) は、スペクトルと物理情報を統一された空間に統合するためのフレームワークである。
我々はHPMが精度と計算効率の両面で最先端の手法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:07:36 GMT)
Finite-Time Information-Theoretic Bounds in Queueing Control [54.1] 本稿では, 待ち行列の待ち行列を, 待ち行列と待ち行列の双方で処理するネットワーク上のスケジューリング問題において, 待ち行列の総長を求める新しいポリシーを導出する。
これらの結果は「ドリフトオンリー」な手法の基本的な制限を明らかにし、待ち行列制御における原則的、非漸近的最適性への道を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:14:40 GMT)
SPoRt -- Safe Policy Ratio: Certified Training and Deployment of Task Policies in Model-Free RL [54.0] 本研究では,モデルフリーでエピソードな環境において,新しいタスク固有ポリシーの安全性特性に違反する確率に制約を課す理論的結果を示す。
この境界は、時間的に拡張された性質(安全性の他に)や堅牢な制御問題にも適用できる。
本研究は,このトレードオフを実証し,経験的違反率から得られる理論的境界と後続境界とを比較した実験結果である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:50:00 GMT)
Image Captions are Natural Prompts for Text-to-Image Models [53.5] テキストから画像への生成モデルでは,手作りのプロンプトで情報学習データを合成することは困難である。
我々は,ImageNet分類によって検証された,シンプルで効果的な手法を提案する。
この単純なキャプションは,合成データの情報性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:21:02 GMT)
Dynamic Knowledge Exchange and Dual-diversity Review: Concisely Unleashing the Potential of a Multi-Agent Research Team [53.4] IDVSCIは、大規模言語モデル(LLM)上に構築されたマルチエージェントフレームワークである。
動的知識交換機構とデュアルダイバーシティ・レビュー・パラダイムという2つの重要なイノベーションが組み込まれている。
結果は、IDVSCIが2つのデータセットで常に最高のパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:12:08 GMT)
ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation [53.1] 大規模推論モデル(LRM)の最近の進歩は、チェーン・オブ・ソート(CoT)による生成長のスケールアップにより、複雑な推論タスクにおける顕著な性能向上を実現している。
本稿では,推論過程のトークン生成中にテキストヒントを注入することにより,推論モデルに簡潔な発話を促すフレームワークであるConciseHintを提案する。
DeepSeek-R1 や Qwen-3 シリーズを含む最先端の LRM 実験により,本手法は性能を良好に保ちながら簡潔な推論過程を効果的に生成できることが実証された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:20:44 GMT)
Speaker Embeddings to Improve Tracking of Intermittent and Moving Speakers [53.1] 話者埋め込みを用いた個人識別再割り当て後追跡を提案する。
ビームフォーミングは、話者埋め込みを計算するために、話者の位置に対する信号を強化するために使用される。
不活発な期間に話者の位置が変化するデータセット上で,提案した話者埋め込みに基づくアイデンティティ再割り当て手法の性能を評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:02:20 GMT)
The Gittins Index: A Design Principle for Decision-Making Under Uncertainty [52.1] Gittinsインデックスは、不確実性に関わるさまざまな意思決定問題を最適に解決するツールである。
このチュートリアルは、Gittinsインデックスが実践的な問題に実効的に適用可能であることを実証するものだ。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:41:05 GMT)
MCN-SLAM: Multi-Agent Collaborative Neural SLAM with Hybrid Implicit Neural Scene Representation [51.1] 既存のNeRFベースのマルチエージェントSLAMフレームワークは通信帯域幅の制約を満たすことができない。
本稿では,ハイブリッドシーン表現を用いた分散マルチエージェント協調型ニューラルSLAMフレームワークを提案する。
シーン再構成を改善するために, 新規な三面体グリッド共同シーン表現法を提案する。
局所的(単一エージェント)と大域的(複数エージェント)の整合性を実現するために,新しいイントラ・トゥ・インターループ・クロージャ法が設計された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:22:29 GMT)
VisualChef: Generating Visual Aids in Cooking via Mask Inpainting [50.8] 我々は,調理シナリオに適したコンテキスト視覚支援を生成するVisualChefを紹介する。
初期フレームと指定されたアクションが与えられた後、VisualChefはアクションの実行と結果のオブジェクトの外観の両方を描写した画像を生成する。
3つのエゴセントリックなビデオデータセット上でVisualChefを定量的に定性的に評価し、最先端の手法による改善を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:23:21 GMT)
Pretraining Language Models to Ponder in Continuous Space [50.5] 単一のトークン生成ステップ内で,前処理を繰り返し呼び出すことによって,この思考プロセスを言語モデルに導入する。
人間のアノテーションを使わずに、自己教師付き学習を通じて、この方法でモデルを学習できることが示される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:48:37 GMT)
A Set-to-Set Distance Measure in Hyperbolic Space [50.1] 双曲空間における集合間の相似性を計算するための双曲的集合間距離測度を提案する。
位相的差を考慮すると、HS2SDは2つの双曲集合の間の関係をより微妙に理解する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:31:40 GMT)
On Equivariant Model Selection through the Lens of Uncertainty [49.1] 等変モデルは、予測性能を改善するために対称性に関する事前の知識を活用するが、不特定なアーキテクチャ上の制約がそれを傷つける可能性がある。
我々は、頻繁な(コンフォーマル予測による)、ベイジアン(限界確率による)、およびキャリブレーションに基づく評価による誤りに基づく評価の比較を行った。
不確実性指標は一般的に予測性能と一致するが,ベイズ模型の証拠は矛盾する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:35:06 GMT)
Geometry-aware Distance Measure for Diverse Hierarchical Structures in Hyperbolic Spaces [48.9] 双曲空間における幾何対応距離測度を提案し、様々な階層構造に動的に適応する。
我々の手法は、固定距離測定を用いた学習方法よりも一貫して優れている。
可視化は、双曲空間におけるクラス境界の明確化とプロトタイプ分離の改善を示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:43:39 GMT)
Maximizing Confidence Alone Improves Reasoning [48.8] RENT: エントロピー最小化による強化学習(Reinforcement Learning via Entropy Minimization)は、完全な教師なしのRL手法であり、外部の報酬や地道的な回答を必要としない。
得られた回答に高いモデル信頼をもたらす思考の連鎖を強化することで、モデルは推論能力を向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:30:04 GMT)
On Union-Closedness of Language Generation [48.4] Kleinberg と Mullainathan によるモデルで,Li,Raman,Tewari によって拡張された言語生成について検討する。
我々の結果は、生成可能なクラスや不均一に生成可能なクラスの有限和を証明することによって、Li と al. の2つの開問題を解決する。
提案手法は,言語生成の進展領域に独立した関心を持つ可能性のある,新たな対角化の議論とともに,注意深く構築されたクラスを利用する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:42:25 GMT)
When Diffusion Models Memorize: Inductive Biases in Probability Flow of Minimum-Norm Shallow Neural Nets [47.8] 鍵となる問題は、確率フローがデータ多様体上のトレーニングサンプルまたはより一般的な点に収束する時である。
我々は、最小$ell2$ノルムで訓練された浅いReLUニューラルネットワークデノイザの確率フローを解析することによって、これを解析する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:38:55 GMT)
Critical Batch Size Revisited: A Simple Empirical Approach to Large-Batch Language Model Training [47.4] 本稿では,トレーニング中の勾配雑音尺度に基づいて,臨界バッチサイズ(CBS)を推定する方法を示す。
CBSがバッチサイズのウォームアップを動機づけてどのように変化するかについての知見は,小規模なトレーニングランからCBSが大規模トレーニングランを知らせる可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:58:20 GMT)
TC-Light: Temporally Consistent Relighting for Dynamic Long Videos [47.2] TC-Lightは、2段階のポスト最適化機構を特徴とする新しいパラダイムである。
提案手法は,時間的コヒーレンスに優れ,低コストで物理的に妥当なリライト結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:58 GMT)
NSFW-Classifier Guided Prompt Sanitization for Safe Text-to-Image Generation [47.0] 大きな言語モデルの"jailbreak"攻撃は、微妙な迅速な修正を通じて制限をバイパスする。
PromptSanは、モデルアーキテクチャを変更することなく有害なプロンプトを解毒するための新しいアプローチである。
PromptSanは、複数のメトリクスにわたる有害なコンテンツ生成を減らすことで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:17:30 GMT)
Radio Map Prediction from Aerial Images and Application to Coverage Optimization [46.9] 畳み込みニューラルネットワークを用いた経路損失無線マップの予測に着目する。
既存の無線地図データセットに対して開発された最先端モデルがこの課題に効果的に適応できることを示す。
UNetDCNと呼ばれる新しいモデルを導入し、複雑さを低減した最先端モデルと比較して、同等以上の性能を実現した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:42:36 GMT)
Controlled Generation with Equivariant Variational Flow Matching [46.6] 変動流マッチング(VFM)の枠組みにおける制御された生成目標を導出する。
本研究では,(1)条件付き生成モデルのエンドツーエンドトレーニング,あるいは(2)ベイズ推論問題として,制御生成を実現する方法を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:42:48 GMT)
OAgents: An Empirical Study of Building Effective Agents [46.5] キーエージェントコンポーネントにおける一般的な設計選択の影響を,公平かつ厳密な方法で検討する。
この結果に基づいて,新たな基盤エージェントフレームワークであるOAgentsをオープンソースとして開発しています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:22:39 GMT)
PuckTrick: A Library for Making Synthetic Data More Realistic [46.2] Pucktrickは、制御エラーを導入して、合成データセットを体系的に汚染するように設計されたPythonライブラリである。
系統的なデータ汚染がモデル性能に与える影響を評価する。
その結果、汚染された合成データに基づいて訓練されたMLモデルは、純粋に合成されたエラーのないデータで訓練されたモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:51:45 GMT)
Craw4LLM: Efficient Web Crawling for LLM Pretraining [45.9] Craw4LLMは、LLM事前学習の好みに基づいてWebグラフを探索する効率的なWebクローリング手法である。
商用検索エンジンのインデックスから9億のWebページを含むWebグラフを用いた実験により,高品質な事前学習データを得る上でのCraw4LLMの有効性が示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:24:30 GMT)
LettinGo: Explore User Profile Generation for Recommendation System [45.4] 本稿では,多様なユーザプロファイルを生成するための新しいフレームワークであるLetinGoを紹介する。
我々のフレームワークは、推奨精度、柔軟性、文脈認識を著しく向上させます。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:51:52 GMT)
Infi-MMR: Curriculum-based Unlocking Multimodal Reasoning via Phased Reinforcement Learning in Multimodal Small Language Models [45.2] Infi-MMRは、マルチモーダル小言語モデルの推論能力を体系的に解放するフレームワークである。
第1フェーズであるFoundational Reasoning Activationは、高品質なテキスト推論データセットを活用して、モデルの論理推論能力を活性化し、強化する。
第2のフェーズであるクロスモーダル推論適応は、キャプション拡張されたマルチモーダルデータを使用して、推論スキルをマルチモーダルコンテキストにプログレッシブに転送する。
第3フェーズであるMultimodal Reasoning Enhancementでは、言語バイアスを緩和し、堅牢なクロスモーダル推論を促進するために、キュレートされたキャプションフリーなマルチモーダルデータを採用している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:47:25 GMT)
LEGATO: Large-scale End-to-end Generalizable Approach to Typeset OMR [44.9] Legatoは、フルページまたはマルチページのタイプセットの楽譜を認識できる最初の大規模事前訓練型OMRモデルである。
本モデルは,様々なタイプセットスコアにまたがる強力な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:35:59 GMT)
MDeRainNet: An Efficient Macro-pixel Image Rain Removal Network [44.8] 我々は,LF画像から降雨ストリーク除去を行うために,MDeRainNetと呼ばれる効率的なネットワークを提案する。
提案するネットワークはマルチスケールエンコーダデコーダアーキテクチャを採用し, 直接マクロピクセル画像(MPI)を用いて降雨除去性能を向上する。
そこで本研究では,MDeRainNetのための新しい半教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:22:17 GMT)
A Motivational Architecture for Open-Ended Learning Challenges in Robots [42.8] 我々は,新たな目標を自律的に発見し,達成に必要なスキルを習得し,相互依存型タスクに取り組むためのスキルシーケンスを生成し,非定常環境に適応する階層型アーキテクチャH-GRAILを紹介する。
我々はH-GRAILを実際のロボットシナリオでテストし、提案手法がオープンエンド学習の様々な課題に効果的に対処する方法を実証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:46:05 GMT)
Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks [42.8] 大きな言語モデル(LLM)は関数レベルのコード生成を約束しているが、リポジトリレベルのソフトウェアエンジニアリングタスクは依然として難しい。
本稿では,オープンソース LLM がエージェントベースアプローチを必要とせずに,リポジトリレベルのタスクを効果的に処理できるかどうかを検討する。
リポジトリコードグラフ構造をLLMのアテンション機構に統合するコードグラフモデル(CGM)を導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:05:49 GMT)
SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications [42.0] 本稿では,BIRDCRITICを紹介した。
また、オープンソースのモデル機能を高めるためのトレーニング環境であるSixGymを紹介します。
これらのコンポーネントをオープンソースのエージェントであるBirdFixer-2.5-14Bに統合します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:41:37 GMT)
Topological crystals and soliton lattices in a Gross-Neveu model with Hilbert-space fragmentation [41.9] 単一フレーバーGross-Neveu-Wilson(GNW)モデルの有限密度位相図について検討する。
我々はヒルベルト空間の断片化のメカニズムの実空間バージョンから生じる不均一な基底状態の列を見つける。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:19:35 GMT)
Robots and Children that Learn Together : Improving Knowledge Retention by Teaching Peer-Like Interactive Robots [41.9] 本研究では,対話型強化学習(Interactive Reinforcement Learning)を,教示可能な社会ロボットの認知モデルとして紹介する。
LbT状態の小児は自己実践状態の児に比べて保持率が高くなった。
本研究は,(1)ピアロボット学習の教育的効果的でスケーラブルなモデルとしてインタラクティブRLを導入し,(2)実教室で複数の自律ロボットを同時に展開する可能性を示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:51:04 GMT)
Semantic Structure-Aware Generative Attacks for Enhanced Adversarial Transferability [40.9] 生成的敵攻撃は、ホワイトボックス・サロゲートモデルで摂動発生器を訓練し、工芸品の摂動を見えないブラックボックスの犠牲者モデルに適用する。
これまで、既存の研究は意味情報の保存と活用のために生成モデルの表現能力を完全に活用していなかった。
本稿では,時間的スムーズな特徴参照として機能する意味的構造認識型攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:35:09 GMT)
FilMaster: Bridging Cinematic Principles and Generative AI for Automated Film Generation [40.9] FilMasterは、プロ級映画制作のための現実の映画原理を統合するエンドツーエンドのAIシステムである。
我々の世代ステージでは、プロのカメラ言語を生成するためのAIをガイドするマルチショットRAGカメラ言語設計モジュールが強調されている。
撮影後段階は,映像制御モジュールを設計し,プロの映画製作をエミュレートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:16 GMT)
AnchorCrafter: Animate Cyber-Anchors Selling Your Products via Human-Object Interacting Video Generation [40.8] アンカースタイルの製品プロモーションビデオは、eコマース、広告、消費者エンゲージメントにおいて有望な機会を提供する。
AnchorCrafterは、ターゲットの人間とカスタマイズされたオブジェクトを特徴とする2Dビデオを生成するために設計された、新しい拡散ベースのシステムである。
本稿では,物体の外観認識を任意の視点から拡張するHOI-appearance Recognitionと,複雑な人間と物体の相互作用を可能にするHOI-motion Injectionという2つの重要なイノベーションを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:27:21 GMT)
GeNeRT: A Physics-Informed Approach to Intelligent Wireless Channel Modeling via Generalizable Neural Ray Tracing [40.3] 一般化,精度,効率を向上した一般化可能なニューラルRTフレームワークであるGeNeRTを提案する。
Fresnelにインスパイアされたニューラルネットワーク設計を取り入れることで、マルチパスコンポーネント(MPC)予測の精度も向上する。
屋外シナリオで行われた実験では、GeNeRTはシナリオ内の訓練されていない領域と完全に見えない環境にまたがってうまく一般化されていることが示されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:17:01 GMT)
Learnable-Differentiable Finite Volume Solver for Accelerated Simulation of Flows [40.1] 本研究では,粗い格子上の流動の効率的かつ正確なシミュレーションを行うため,LDrと呼ばれる学習可能で微分可能な有限体積解法を提案する。
実験により、LDrは、顕著なマージンを持つベースラインモデルを上回る効率を達成することが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:22:27 GMT)
LED: LLM Enhanced Open-Vocabulary Object Detection without Human Curated Data Generation [39.6] 大規模視覚言語データに基づいてトレーニングされた大規模な基礎モデルは、OVD(Open-Vocabulary Object Detection)を加速させる。
本稿では,Large Language Models (LLMs) のデコーダ層を利用して,視覚的グラウンド化を強化する手法を提案する。
中間的なLCM層は、既にリッチな空間意味論を符号化しており、初期層のみを適用すると、ほとんどの利得が得られる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:58:26 GMT)
SWE-Dev: Building Software Engineering Agents with Training and Inference Scaling [39.5] 大規模言語モデル(LLM)は、会話による問題解決から、ツール使用に関わる現実的なタスクへの対処まで、急速に進歩している。
この問題に対処するために、オープンソースのLLM上に構築されたSWEエージェントであるSWE-Devを提案する。
SWE-bench-Verifiedベンチマークの実験は、SWE-Devモデルが全てのオープンなSWEエージェントの中で最高のパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:00:06 GMT)
NIC-RobustBench: A Comprehensive Open-Source Toolkit for Neural Image Compression and Robustness Analysis [39.5] JPEG AIは、エンドツーエンドのニューラルイメージ圧縮(NIC)メソッドの最初の標準である。
これまでの研究は、限られた範囲のコーデックとアタックに限られていた。
textbfNIC-RobustBenchは、NICの堅牢性と敵防衛の効率を評価するための最初のオープンソースフレームワークである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:11:15 GMT)
Better Language Model Inversion by Compactly Representing Next-Token Distributions [39.4] 言語モデルの逆転は、言語モデルの出力のみを使用して隠れたプロンプトを復元しようとする。
そこで本研究では,次の確率からヒントを抽出することで,隠れプロンプトを復元する手法を提案する。
我々の手法は、隠されたプロンプトを復元する従来の最先端手法よりも大幅に向上する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:39:37 GMT)
Parallel Continuous Chain-of-Thought with Jacobi Iteration [39.4] 思考の連続的連鎖は、大きな言語モデルに対する推論トークンの保存に有効であることが示されている。
本稿では,遅延した思考トークンに対してジャコビ処理を行い,逐次ではなく反復的に更新する並列連続チェイン・オブ・ワット(PCCoT)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:35:41 GMT)
Drive-R1: Bridging Reasoning and Planning in VLMs for Autonomous Driving with Reinforcement Learning [39.0] 本稿では,自律運転におけるシナリオ推論と動作計画の橋渡しとしてDrive-R1を提案する。
Drive-R1は強化学習フレームワークの中で訓練されており、計画にとってより有益な推論経路の発見を動機付けている。
我々は、Drive-R1がADにおける推論と計画の橋渡しに有望な方向性を示し、将来の研究や応用の方法論的な洞察を提供すると考えている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:57:14 GMT)
PERSCEN: Learning Personalized Interaction Pattern and Scenario Preference for Multi-Scenario Matching [38.8] 効果的なマルチシナリオレコメンデーションの鍵は、すべてのシナリオで共有されるユーザの好みと、シナリオ固有のシナリオ対応の好みの両方をキャプチャすることだ。
ユーザ固有のモデリングをマルチシナリオマッチングに組み込む革新的なアプローチであるPERSCENを提案する。
PERSCENは、ユーザ特性に基づいて、ユーザ固有の特徴グラフを構築し、高次のインタラクションパターンをキャプチャするために、軽量なグラフニューラルネットワークを使用している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:15:16 GMT)
TreeSynth: Synthesizing Diverse Data from Scratch via Tree-Guided Subspace Partitioning [38.7] 決定木にインスパイアされた木誘導サブスペースデータ合成手法であるTREESYNTHを紹介する。
タスク固有の全データ空間を多数のアトミック部分空間に分割するために、空間分割木を構築する。
このグローバルな分割合成法は、最終的にサブスペースサンプルを包括的なデータセットに収集する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:32:03 GMT)
HiRAG: Retrieval-Augmented Generation with Hierarchical Knowledge [38.5] グラフベースのRetrieval-Augmented Generation (RAG)法は,大規模言語モデル(LLM)の性能を大幅に向上させた。
既存のRAG法は、人間の認知において自然に生ずる階層的知識を適切に利用していない。
本稿では階層的知識を利用してRAGシステムの意味的理解と構造的捕捉能力を高める新しいRAG手法、HiRAGを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:08:00 GMT)
Compositional Scene Understanding through Inverse Generative Modeling [38.3] 自然画像が与えられたシーンの特性を理解するために生成モデルをどのように利用できるかを検討する。
シーン上の小さなモデルから合成された視覚的生成モデルを構築する。
これにより、グローバルなシーン要因を推測し、新しいシーンへの堅牢な一般化を可能にする方法について説明する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:26:04 GMT)
Use Property-Based Testing to Bridge LLM Code Generation and Validation [38.3] 大きな言語モデル(LLM)はコード生成において優れていますが、その出力が機能的に正しいことを保証することは、永続的な課題です。
本稿では,Property-Generated Solverを紹介した。Property-Based Testing (PBT)を活用して,高レベルのプログラム特性を検証する新しいフレームワークである。
プロパティ生成ソルバーには、コード生成と反復リファインメント専用のジェネレータと、PBTライフサイクルを管理するテスタという、2つの共同LLMベースのエージェントが使用されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:01:12 GMT)
Escaping the SpuriVerse: Can Large Vision-Language Models Generalize Beyond Seen Spurious Correlations? [37.7] 微調整は、非重要特徴とターゲットラベルの間に急激な相関を引き起こす可能性がある。
実世界の視覚探索探索(VQA)ベンチマークにおいて,GPT-4oエラーを抽出してベンチマークを作成する。
SpuriVerse上で15のオープンソースLVLMを評価し、最先端のクローズドソースモデルでもかなり苦労していることを発見した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:11:43 GMT)
Efficient Beam Selection for ISAC in Cell-Free Massive MIMO via Digital Twin-Assisted Deep Reinforcement Learning [37.5] 我々は、誤報率制約の下で複数の受信APに対して共同目標検出確率の分布を導出する。
次に、マルコフ決定過程(MDP)としてビーム選択手順を定式化する。
リアルタイムエージェント環境相互作用の高コスト化とそれに伴うリスクを解消するために,新しいディジタルツイン(DT)支援オフラインDRL手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:17:57 GMT)
CaughtCheating: Is Your MLLM a Good Cheating Detective? Exploring the Boundary of Visual Perception and Reasoning [37.5] MLLMは、人間のためのいくつかの専門家レベルのタスクに優れていると報告されている。
しかし、彼らは優れた人間の刑事のパフォーマンスにマッチできるだろうか?
GPT-o3がまだ処理可能ないくつかの難しいシナリオを調査し、o3のパフォーマンスがほぼゼロになる一般的なシナリオを見つけます。
CaughtCheatingは、優れた価値と実用性を備えた、難解な視覚認識と推論タスクのクラスを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:05:21 GMT)
HistoART: Histopathology Artifact Detection and Reporting Tool [37.3] ワイルスライドイメージング(WSI)は、組織標本の詳細な高分解能検査のために広く用いられている。
WSIは、スライドの準備とスキャンの間に導入されたアーティファクトに弱いままです。
本稿では,WSIに対する3つのロバストなアーティファクト検出手法を提案し,比較する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:22:19 GMT)
API Agents vs. GUI Agents: Divergence and Convergence [37.1] APIとGUIベースの大規模言語モデル(LLM)は、グラフィカルなユーザインターフェースを人間的な方法で操作する。
本稿では,それらの分散と潜在的収束を系統的に解析する。
LLMベースの自動化における継続的なイノベーションは、APIとGUI駆動エージェントの境界線を曖昧にする可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:01:02 GMT)
Referring Expression Instance Retrieval and A Strong End-to-End Baseline [37.0] 現実世界のシナリオは、大きなギャラリーをまたいだインスタンスレベルの検索とローカライゼーションの両方を必要とすることが多い。
本稿では,インスタンスレベルの検索とローカライゼーションを共同でサポートするReferring Expression Instance Retrieval (REIR)を提案する。
本稿では,MSCOCOインスタンスとRefCOCOインスタンスの微細な表現を生成するために,視覚言語モデルによって構築された大規模ベンチマークであるREIRCOCOを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:28:44 GMT)
Accelerating Photonic Integrated Circuit Design: Traditional, ML and Quantum Methods [36.1] フォトニック集積回路(PIC)は、より優れた速度、帯域幅、エネルギー効率を提供する。
その可能性にもかかわらず、PICの設計と統合は電子製品よりも遅れ、画期的な進歩を要求した。
本稿では,従来のシミュレーション手法と機械学習手法を比較し,PIC設計の現状を概説する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:17:22 GMT)
Sensing Cardiac Health Across Scenarios and Devices: A Multi-Modal Foundation Model Pretrained on Heterogeneous Data from 1.7 Million Individuals [36.1] 広大で異質な健康記録から統一された表現を学習する心センシング基礎モデル(CSFM)を提案する。
我々のモデルは、複数の大規模データセットからのデータの革新的なマルチモーダル統合に基づいて事前訓練されている。
CSFMは従来のワンモーダル・ワン・タスク・アプローチより一貫して優れている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:58:12 GMT)
C-SEO Bench: Does Conversational SEO Work? [36.0] 大規模言語モデル (LLM) は,検索エンジンを会話型検索エンジン (CSE) に変換する。
C-SEO Benchは、複数のタスク、ドメイン、アクター数にまたがるC-SEOメソッドを評価するために設計された最初のベンチマークである。
文献で報告された結果とは対照的に,現在のC-SEO法はほとんど無効果であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:56:31 GMT)
ProxSparse: Regularized Learning of Semi-Structured Sparsity Masks for Pretrained LLMs [35.9] ProxSparseは,正規化最適化によりマスク選択が可能な学習ベースのフレームワークである。
ProxSparseは従来提案していた半構造化マスク選択法より一貫して優れていた。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:39:56 GMT)
Harnessing the Power of Reinforcement Learning for Language-Model-Based Information Retriever via Query-Document Co-Augmentation [35.7] LLM(Large Language Models)は、ユーザクエリとコーパスドキュメントの拡張に使用することができる。
ユーザクエリとコーパスドキュメントの両方を拡張できるLLMベースのレトリバーを提案する。
提案手法は,疎密な設定と密な設定の両方において,LLMに基づく検索性能を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:14:43 GMT)
GAF: Gaussian Action Field as a Dynamic World Model for Robotic Manipulation [35.3] 既存のアプローチは、視覚入力から直接アクションを予測するV-A(Vision-to-A)パラダイムや、中間的な3D表現を活用するV-3D-to-A(Vision-to-A)パラダイムに従うのが一般的である。
ガウスアクション場(GAF)を用いた動き認識4D表現から直接のアクション推論を可能にするビジョン・ツー・4D・ツー・アクションフレームワークを提案する。
実験では、+11.5385 dB PSNRと-0.5574 LPIPSの改善を達成し、ロボット操作タスクにおける平均成功率を10.33%向上させた。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:02:31 GMT)
LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning [34.7] 本稿では、強化学習(RL)を利用したインセンティブベースのアプローチを提案し、超長大で高品質なテキスト生成能力の出現を促進する。
Qwen2.5-32BからトレーニングされたLongWriter-Zeroモデルは、長文処理において従来のSFTメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:59:02 GMT)
Systematic Reward Gap Optimization for Mitigating VLM Hallucinations [34.7] 本稿では,報酬ギャップ構成の体系的最適化を目的とした新しいフレームワークであるトピックレベルの参照書き換え(TPR)を紹介する。
TPRは、詳細なセマンティック詳細をトピックレベルに制御し、高度なデータキュレーション戦略を可能にする。
ObjectHal-Benchでは幻覚を最大93%減少させ、堅牢で費用対効果の高いVLMアライメントに対して優れたデータ効率を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:12:17 GMT)
A Survey on Large Language Model based Human-Agent Systems [34.3] 大規模言語モデル(LLM)は、完全に自律的なエージェントの構築への関心が高まっている。
LLM-HASは、システムの性能、信頼性、安全性を高めるために、人為的な情報、フィードバック、制御をエージェントシステムに組み込む。
本稿は, LLM-HASの総合的かつ構造化された最初の調査である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:45:18 GMT)
FORGE: An LLM-driven Framework for Large-Scale Smart Contract Vulnerability Dataset Construction [34.2] FORGEはスマートコントラクト脆弱性データセットを構築するための最初の自動化アプローチである。
81,390のソリッドリティファイルと27,497の脆弱性を296のCWEカテゴリに分類したデータセットを生成した。
その結果、現在の検出能力の重大な制限が明らかになった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:03:16 GMT)
Improved Baselines with Synchronized Encoding for Universal Medical Image Segmentation [34.1] SyncSAMは、医用画像符号化を強化するために、畳み込みとトランスフォーマー機能を統合した同期デュアルブランチエンコーダを使用する。
SyncSAMはテストセットで最先端のパフォーマンスを実現し、目に見えないデータセットで強力なゼロショット機能を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:43:31 GMT)
From Virtual Games to Real-World Play [34.0] 本稿では,ユーザ制御信号からインタラクティブなビデオ生成を可能にするニューラルネットワークベースのリアルワールドゲームエンジンであるRealPlayを紹介する。
RealPlayは、現実世界の映像に似た、写真リアリスティックで時間的に一貫したビデオシーケンスを作ることを目指している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:53 GMT)
TCDiff++: An End-to-end Trajectory-Controllable Diffusion Model for Harmonious Music-Driven Group Choreography [33.7] TCDiff++は、調和したグループダンスを生成するように設計された音楽駆動のエンドツーエンドフレームワークである。
ダンサー同士の衝突を緩和するため,ダンサー間の相対的な位置決めをよりよく維持するために,ダンサーの位置決め埋め込みを利用する。
単段スライディングの問題に対処するために,ダンサースワッピングパターンを示すスワップモードの埋め込みを導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:15:20 GMT)
"I understand why I got this grade": Automatic Short Answer Grading with Feedback [33.6] 本稿では,フィードバックによる短時間回答自動グルーピングのためのデータセットであるEngineering Short Answer Feedback (EngSAF)を紹介する。
我々は,我々のラベル認識合成フィードバック生成(LASFG)戦略を用いて,最先端の大規模言語モデル(LLM)の生成能力を活用することで,データセットにフィードバックを組み込む。
最高のパフォーマンスモデル(Mistral-7B)は、それぞれ75.4%と58.7%の精度で、未確認の回答と未確認の質問テストセットで達成している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:24:28 GMT)
CUPID: Curating Data your Robot Loves with Influence Functions [33.6] CUPIDは、模倣学習ポリシーのための新しい影響関数理論定式化に基づく、ロボットデータキュレーション手法である。
我々は,1)政策パフォーマンスを損なうトレーニングデモをフィルタリングし,2)政策を最も改善する新たなトラジェクトリをサブセレクトするために,CUPIDを用いてデータをキュレートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:49:34 GMT)
Vision as a Dialect: Unifying Visual Understanding and Generation via Text-Aligned Representations [33.1] 本稿では,共有意味表現における視覚的理解と生成を統一する枠組みを提案する。
中心となるのはText-Aligned Tokenizer (TA-Tok) で、これは大きな言語モデル(LLM)の語彙から投影されたテキスト整列コードブックを用いて画像を個別のトークンに変換する。
ベンチマークによる実験では、Tarは既存のマルチモーダルLLMメソッドと一致し、より高速な収束とトレーニング効率の向上を実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:14 GMT)
Phase-Dependent Squeezing in Dual-Comb Interferometry [32.7] 2つの独立周波数コムレーザーを用いた時間領域二重コム干渉計における位相依存性Kerrソリトンスクイーズとアンチスクイーズの測定を行った。
信号は非定常量子ノイズとして現れるが、これはインターフェログラムの縁の位相に変化し、ショットノイズレベル以下では、ゼロクロスの交互に3.8dBまで変化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:35:14 GMT)
AdapThink: Adaptive Thinking Preferences for Reasoning Language Model [32.5] 強化学習(RL)に基づくポストトレーニングは、言語モデルの複雑な推論能力を大幅に向上させた。
しかし、この緩やかな思考のパラダイムは、効率を推理する上で重要な課題である。
より効率的な思考を促すために,適応的なポストトレーニングフレームワークAdapThinkを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:06:04 GMT)
Spiritual-LLM : Gita Inspired Mental Health Therapy In the Era of LLMs [32.3] 本研究では,Bhagavad Gitaの霊的知恵を,先進的な大規模言語モデルGPT-4oと統合することによって,新たな枠組みを導入する。
我々は、精神保健特定モデルと汎用モデルの両方を含む12の最先端LCMに対して、GITをベンチマークする。
以上の結果から,ユーザ満足度の向上とサポート成果の認識のために,霊的指導に富むAIシステムの可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:02:57 GMT)
MinD: Unified Visual Imagination and Control via Hierarchical World Models [32.1] ビデオ生成モデル(VGM)は、ロボット工学における統一世界モデリングのための有望な経路を提供する。
Manipulate in Dream (MinD) は階層的拡散に基づく世界モデルフレームワークであり、視覚言語操作にデュアルシステム設計を採用する。
MinDは、VGMを低周波で実行し、リアルタイムインタラクションに高周波拡散ポリシを活用しながら、映像予測特徴を抽出する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:06 GMT)
Emergent Temporal Correspondences from Video Diffusion Transformers [30.8] DiffTrackは、この問題に答えるために設計された最初の定量的分析フレームワークである。
分析の結果,特定のクエリキーの類似性がすべてではないが,時間的マッチングにおいて重要な役割を担っていることが明らかとなった。
本研究は,映像の時間的整合性を改善する新たなガイダンス法により,動画の動作向上に拡張する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:14:32 GMT)
SaGIF: Improving Individual Fairness in Graph Neural Networks via Similarity Encoding [30.4] グラフニューラルネットワーク(GNN)における個人公正(IF)は、類似した個人が同様の結果を受け取る必要性を強調している。
そこで我々は,Simisity-Aware GNNs for individual Fairness, named SaGIFを提案する。
SaGIFは、実用性能を維持しながら、最先端のIFメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:34:26 GMT)
PrITTI: Primitive-based Generation of Controllable and Editable 3D Semantic Scenes [30.4] 大規模な3Dセマンティックシーン生成は、主にボクセルに基づく表現に依存している。
プリミティブは、操作や構成が容易なコンパクトで粗い3D構造を使って、セマンティックなエンティティを表現する。
PrITTIは遅延拡散に基づくフレームワークで、プリミティブを作曲、制御可能、編集可能なシーンレイアウトを生成するための基本的な要素として活用する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:47:18 GMT)
TReB: A Comprehensive Benchmark for Evaluating Table Reasoning Capabilities of Large Language Models [30.3] 表構造データによる推論は、大規模言語モデル(LLM)に重大な課題をもたらす
本稿では,表理解能力と表推論能力の両方を測定する総合的な表推論進化ベンチマークTReBを提案する。
我々は3つの異なる推論モード(TCoT, PoT, ICoT)でテーブル推論能力を頑健に測定する評価フレームワークを構築した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:02:04 GMT)
Airalogy: AI-empowered universal data digitization for research automation [30.2] Airalogyは、カスタマイズ可能な標準化されたデータレコードを使用して研究全体を表現し、インテリジェントなQ&A、自動データ入力、分析、研究自動化のための高度なAI研究コミッションを提供する。
エアロロジーは、大学、産業、そして地球規模の研究コミュニティにおいて、人類全体に対して究極的に利益をもたらす可能性を秘めている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:43:16 GMT)
The 4th Dimension for Scaling Model Size [29.7] 4次元の仮想論理深度(VLD)を探索し,パラメータの総数を変化させることなく,効率的なアルゴリズム深度を増大させる。
VLDスケーリングにより、モデルの知識容量はほぼ一定であり、わずかなバリエーションしか持たない。
パラメータの数は知識能力と相関するが、推論能力には関連しない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:56:25 GMT)
RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models [29.5] イメージキャプションをパーソナライズするための強化学習に基づくポストトレーニングフレームワークを提案する。
本手法は,MLLMの視覚認識能力とパーソナライズ機能の両方を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:55:52 GMT)
Learning Causal Graphs at Scale: A Foundation Model Approach [29.0] 複数線形構造方程式モデル(SEM)を学習するための新しい注意機構に基づくアーキテクチャであるAttention-DAG(ADAG)を提案する。
ADAGは、非線形アテンションベースのカーネルを介して、観測データからグラフ構造とパラメータの両方へのマッピングを学習する。
提案手法をベンチマークデータセット上で評価し,DAG学習精度とゼロショット推論効率の両方において,ADAGが大幅に向上することを確認した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:41:02 GMT)
Physical Layer Challenge-Response Authentication between Ambient Backscatter Devices [28.8] Ambient Backscatter Communication (AmBC)は、ユビキタスIoT(Internet of Things)アプリケーションにおいて不可欠な部分となっている。
従来の認証手法は、高い計算要求のため、リソース制約された後方散乱装置間では実装できない。
本稿では,AmBCにおけるBD間の物理層チャレンジ応答認証方式であるPLCRA-BDを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:36:27 GMT)
Correlated Error Bursts in a Gap-Engineered Superconducting Qubit Array [28.5] 我々は、ギャップエンジニアリングの存在下で持続する新しいタイプの衝撃誘起相関誤差を同定する。
この変化は、J領域におけるQP-量子相互作用に由来することを示す。
シフト誘起位相誤差は、量子誤り訂正プロトコルの性能に有害であることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:31:26 GMT)
MedSeg-R: Medical Image Segmentation with Clinical Reasoning [28.3] MedSeg-Rは、臨床推論にインスパイアされた軽量でデュアルステージのフレームワークである。
その認知段階は、医療報告を、トランスフォーマーブロックを介して融合される構造化セマンティックプリエントに解釈する。
挑戦的なベンチマークでは、MedSeg-Rは重なり合う構造とあいまいな構造において大きなDiceの改善をもたらす。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:14:09 GMT)
Impact of Visual Context on Noisy Multimodal NMT: An Empirical Study for English to Indian Languages [28.0] 本研究では,大規模・事前学習型NMTシステムに付加された画像特徴が翻訳に与える影響について検討した。
この研究は英語からヒンディー語、ベンガル語、マラヤラム語に翻訳され、最先端のベンチマークを著しく上回っている。
これは、特にノイズの多い環境での視覚的コンテキストの役割に光を当て、ノイズの多いニューラルネットワーク翻訳のための新しい研究方向を開く。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:07:19 GMT)
AViLA: Asynchronous Vision-Language Agent for Streaming Multimodal Data Interaction [28.0] 本稿では、アドホックなクエリを処理し、タイムアウェアなレスポンスを提供する、ストリーミングデータインタラクションのための視覚言語エージェントであるAViLAを紹介する。
実験の結果,既存のモデルでは適切なタイミングで応答できない場合が多く,AViLAでは時間的認識の精度が著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:11:30 GMT)
Decoding Safety Feedback from Diverse Raters: A Data-driven Lens on Responsiveness to Severity [27.9] 本稿では,複数のデータセットの粒度評価を解釈するための新しいデータ駆動型手法を提案する。
安全違反の度合いの異なるレベルを評価する際に,レーダの整合性を定量化する非パラメトリック応答性指標を蒸留する。
提案手法は,異なる階層群をまたいだニュアンスな視点を捉えることで,レーダの選択やフィードバックの解釈に役立てることができることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:34:20 GMT)
Multi-Agent Online Control with Adversarial Disturbances [27.8] 障害を伴う多エージェント線形力学系におけるオンライン制御について検討する。
マルチエージェント制御問題により、平衡ギャップ保証を導出する時間変化ポテンシャルゲームが導出されることが示される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:24:31 GMT)
Physics-Guided Radiotherapy Treatment Planning with Deep Learning [27.6] 放射線治療計画のための2段階物理誘導深層学習パイプラインを提案する。
前立腺癌133例に対して,均一な2-arc VMATプロトコルを用いてアプローチを訓練し,評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:44:56 GMT)
Radar and Event Camera Fusion for Agile Robot Ego-Motion Estimation [27.3] ロボットの移動速度を積極的に推定するためのIMUフリー・機能連想フリーフレームワークを提案する。
瞬時生イベントとドップラー計測を用いて、回転速度と翻訳速度を直接導出する。
本研究では,時間と事象を併用した連続時間状態空間モデルを提案し,よりスムーズな方法でエゴ運動速度を推定する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:27:22 GMT)
YouTube-Occ: Learning Indoor 3D Semantic Occupancy Prediction from YouTube Videos [27.0] 本稿では,屋内インターネットデータのみを用いて3次元空間的精度のトレーニングを行うことを実証する。
我々は、強力な3次元屋内知覚に到達するために、アクセス可能な2次元事前知識を活用するために、完全に自己教師付きモデルを構築した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:44:43 GMT)
DIP: Unsupervised Dense In-Context Post-training of Visual Representations [26.8] DIPは、コンテキスト内シーン理解のための大規模事前学習型視覚エンコーダにおける濃密な画像表現を強化するために設計された、教師なしのポストトレーニング手法である。
擬似的なコンテキスト内タスクを通じて密表現を学習することにより、さまざまな下流現実世界のコンテキスト内シーン理解タスクに対して強いパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:01:14 GMT)
Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [26.6] 我々は、新型コロナウイルス患者の臨床結果を予測するために、畳み込みニューラルネットワークとファンデーションモデルの伝達可能性を評価し、比較した。
評価は、広範囲にわたるフルデータシナリオと、より現実的なFew-Shot Learning設定の両方を含む、複数の学習パラダイムで実施された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:16:04 GMT)
FARCLUSS: Fuzzy Adaptive Rebalancing and Contrastive Uncertainty Learning for Semi-Supervised Semantic Segmentation [26.6] 半教師付きセマンティックセグメンテーション(SSSS)は、ラベルのないデータを効果的に活用する上で、永続的な課題に直面している。
現在のアプローチは、しばしば支配階級を優先する厳格なしきい値によって不確実な地域を捨てる。
我々は,不確実性を4つの主要コンポーネントを通じて学習資産に変換する総合的な枠組みを導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:58:30 GMT)
Amplifying Machine Learning Attacks Through Strategic Compositions [25.8] 我々は,モデルの推論フェーズにおいて,逆例,属性推論,メンバシップ推論,プロパティ推論という,よく研究された4つの攻撃に焦点を当てた。
本研究では,属性推論を準備レベルで支援するプロパティ推論と,その実行レベルでのプロパティ推論を補助する逆例の4つの効果的な攻撃成分を同定する。
我々の研究は、研究者や実践者が、複数の攻撃戦略を含む高度な敵の設定を検討するために役立ちます。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:38:48 GMT)
Finetuning a Weather Foundation Model with Lightweight Decoders for Unseen Physical Processes [25.1] 本研究では,水文学変数の予測における最先端のオーロラ基礎モデルの性能評価を行った。
我々は、これらの新しい変数を予測するために、事前訓練されたモデルの潜在表現に基づいて訓練された浅層デコーダを用いた軽量なアプローチを導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:03:53 GMT)
GRAND-SLAM: Local Optimization for Globally Consistent Large-Scale Multi-Agent Gaussian SLAM [25.0] マルチエージェント・ガウシアンSLAMは環境の迅速な探索と再構築に有望なアプローチである。
本研究では,サブマップ上の局所的最適化に基づく暗黙的なトラッキングモジュールであるGRAND-SLAMを提案する。
実験の結果、GRAND-SLAMはReplica屋内データセットの既存の手法よりも28%高いPSNR、91%低いマルチエージェントトラッキングエラー、既存のマルチエージェントメソッドよりもレンダリングが改善された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:55:42 GMT)
RePST: Language Model Empowered Spatio-Temporal Forecasting via Semantic-Oriented Reprogramming [25.0] 我々は,事前学習言語モデル(PLM)の推論と一般化能力を活用して,複雑な時間的予測を実現することを目的とする。
本稿では,時間的予測に適した意味指向型 PLM プログラミングフレームワーク RePST を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:42:58 GMT)
RDPO: Real Data Preference Optimization for Physics Consistency Video Generation [24.8] 本稿では,実世界のビデオから直接物理先行情報を抽出するアノテーションのないフレームワークであるReal Data Preference Optimisation(RDPO)を提案する。
RDPOは、トレーニング済みのジェネレータで実ビデオシーケンスを逆サンプリングし、物理的正確性の観点から区別可能な好みペアを自動的に構築する。
多段階反復訓練スケジュールは、ジェネレータが物理法則に従うように誘導する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:55:24 GMT)
CPAM: Context-Preserving Adaptive Manipulation for Zero-Shot Real Image Editing [24.7] コンテキスト保存適応マニピュレーション(CPAM)は複雑な非厳密な実画像編集のための新しいフレームワークである。
我々は,オブジェクトと背景を効果的に保存し,独立に制御する自己認識機構を調整した保存適応モジュールを開発した。
また,多様な画像操作作業を簡易に行うためのマスク誘導戦略も導入した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:19:38 GMT)
Evolutionary Optimization of Physics-Informed Neural Networks: Evo-PINN Frontiers and Opportunities [23.9] 物理インフォームドニューラルネットワーク(PINN)は、数学的に表現可能な自然法則を応用して、トレーニング損失関数に注入される。
PINNは、リミテッドデータレシエーションにおける純粋にデータ駆動モデルよりもアドバンテージを提供し、フィジカルAIへの有望なルートとして提示する。
本研究は,モデル最適化と一般化の観点から初めてPINNについて検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:04:45 GMT)
When to Forget? Complexity Trade-offs in Machine Unlearning [23.5] Machine Unlearning(MU)は、トレーニングされたモデルから特定のデータポイントの影響を取り除くことを目的としている。
本研究では,非学習手法の効率を解析し,この問題に対するミニマックス時間における第1の上限値と第2の上限値の設定を行う。
未学習度比の位相図 – 最高の未学習手法の計算コストと完全なモデル再学習を比較する新しいメトリクスを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:08:08 GMT)
Text Detoxification: Data Efficiency, Semantic Preservation and Model Generalization [23.3] ソーシャルメディア上の有害コンテンツの普及は、オンライン環境と公衆の会話の両方に深刻な脅威をもたらす。
既存のアプローチは、強力なデトキシフィケーション性能、セマンティック保存、およびアウト・オブ・ディストリビューションデータを実現するのに苦労することが多い。
本稿では,データ効率,セマンティック保存,モデル一般化を協調的に最適化する2段階トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:48:10 GMT)
ShowFlow: From Robust Single Concept to Condition-Free Multi-Concept Generation [23.3] ShowFlowは、制御可能な画像合成のための包括的なフレームワークである。
ShowFlow-Sはシングルコンセプト生成用であり、ShowFlow-Mは複数の概念を扱うためのものだ。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:44:19 GMT)
Multi-Stage Manipulation with Demonstration-Augmented Reward, Policy, and World Model Learning [23.1] ロボット操作における長期作業は、強化学習において重要な課題である。
視覚入力から効率的に学習するためのフレームワークであるDEMO3を提案する。
評価の結果,データ効率は平均40%,特に困難なタスクでは70%向上した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:41:17 GMT)
Instability in Diffusion ODEs: An Explanation for Inaccurate Image Reconstruction [23.1] 拡散再構成は、画像編集、復元、スタイル転送といった様々な応用において重要な役割を果たしている。
本研究では, PF-ODE 生成プロセスにおけるより深い固有の特性, 不安定性を同定し, 再構成誤差をさらに増幅する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:59:49 GMT)
Circuit Compositions: Exploring Modular Structures in Transformer-Based Language Models [22.9] 言語モデル内の高構成サブタスクの回路解析により,ニューラルネットワークのモジュラリティについて検討する。
以上の結果から,機能的に類似した回路は,ノード重なりとクロスタスク忠実度の両方を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:05:58 GMT)
SLR: An Automated Synthesis Framework for Scalable Logical Reasoning [22.7] 大規模言語モデル(LLM)の体系的評価と訓練のためのエンドツーエンドフレームワークであるSLRを紹介する。
SLRは、正確に制御された困難を伴う帰納的推論タスクのスケーラブルで自動化された合成を可能にする。
各タスクについて、SLRは、(i)潜伏した基底真実規則、(ii)記号的判断者がモデル出力を確定的に検証するために使用する実行可能な検証プログラム、(iii)推論タスクの指示プロンプトを合成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:27:44 GMT)
Simulation-Free Differential Dynamics through Neural Conservation Laws [22.4] 超汎用関数上での連続時間拡散過程のトレーニングのための,シミュレーション不要な新しいフレームワークを提案する。
本稿では,時間依存密度関数(確率経路)と,この確率経路を生成する拡散過程のダイナミクスを共同でモデル化する結合パラメータ化を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:04:23 GMT)
Conformal Prediction for Causal Effects of Continuous Treatments [22.1] 本研究では, 連続処理の潜在的な結果に対する新しいコンフォメーション予測法を提案する。
共形予測区間が正当性スコアが未知であっても有効となるように、不確実性推定によって導入された追加的不確実性を考慮する。
我々の知る限りでは、確率スコアが不明で、データから推定しなければならない場合、我々は、継続的治療のための共形予測を最初に提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:52:25 GMT)
An Expanded Benchmark that Rediscovers and Affirms the Edge of Uncertainty Sampling for Active Learning in Tabular Datasets [22.0] Active Learning (AL)は、マシンが戦略的クエリを通じてラベル付きサンプルを効率的に収集できるという重要な課題に対処する。
多くのAL戦略の中で、不確実性サンプリング(US)が最も広く採用されている。
アメリカよりも優れた代替案を示唆する文献の主張にもかかわらず、地域全体での受容はいまだにあり得ない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:59:45 GMT)
VQ-Insight: Teaching VLMs for AI-Generated Video Quality Understanding via Progressive Visual Reinforcement Learning [21.4] VQ-Insightは、AIGCビデオ品質評価のための新しい推論スタイルのフレームワークである。
画像品質のウォームアップ、タスク固有の時間学習、およびビデオ生成モデルとの協調最適化を組み合わせる。
選好比較、多次元スコア、自然なビデオスコアにおいて、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:20:14 GMT)
Human-Aligned Faithfulness in Toxicity Explanations of LLMs [21.0] 我々は,自由形態の毒性説明が理想的な条件下での合理的な人間とどのように一致しているかを測定するための新しい基準を開発する。
3つのLlamaモデルと8B Ministralモデルで5つの多様な毒性データセット上で実験を行った。
以上の結果から,LSMは単純なプロンプトに対して妥当な説明を導出するが,原因の完全セット,個人的理由,毒性のスタンスとの微妙な関係が引き起こされた場合,毒性に関する推論は失敗することが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:41:45 GMT)
Federated Loss Exploration for Improved Convergence on Non-IID Data [21.0] Federated Loss Exploration (FedLEx)は、これらの課題に対処するために特別に設計された革新的なアプローチである。
FedLExは、既存のFLメソッドの非IID設定における欠点に特化している。
最先端のFLアルゴリズムによる実験により,性能が大幅に向上した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:42:07 GMT)
LoopSR: Looping Sim-and-Real for Lifelong Policy Adaptation of Legged Robots [20.7] デプロイ後の段階において、RLポリシーを継続的に洗練する、生涯にわたるポリシー適応フレームワークであるLoopSRを提案する。
LoopSRはトランスフォーマーベースのエンコーダを使用して、現実世界の軌道を潜在空間にマッピングする。
オートエンコーダアーキテクチャとコントラスト学習手法を採用し、実世界のダイナミクスの特徴抽出を強化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:59:08 GMT)
FutureFill: Fast Generation from Convolutional Sequence Models [20.7] FutureFillは畳み込み演算子に基づく任意のシーケンス予測アルゴリズムのための汎用的な高速生成法である。
深部畳み込みシーケンス予測モデルから生成する際の有効性を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:20:46 GMT)
When Large Language Models Meet Vector Databases: A Survey [20.6] VecDBは、LLM操作に固有の高次元ベクトル表現を保存、検索、管理するための効率的な手段を提供する。
VecDBは、LLM操作に固有の高次元ベクトル表現を保存、取得、管理する効率的な手段を提供することによって、これらの問題の魅力的な解決策として浮上する。
本調査は、高度なデータ処理と知識抽出機能のためのLLMとVecDBの合流点の最適化に関するさらなる研究を触媒することを目的としている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:05:15 GMT)
Fast AI Model Splitting over Edge Networks [20.4] 複雑なAIモデルアーキテクチャは、最適なモデル分割を得るために高い計算複雑性をもたらす。
そこで本研究では,DAGを再構成した高速なDAGモデル分割アルゴリズムを提案する。
ブロック構造を持つAIモデルを考慮し,計算複雑性を低減するブロックワイドモデル分割アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:14:04 GMT)
Adaptive Mask-guided K-space Diffusion for Accelerated MRI Reconstruction [20.0] 仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
本研究は,k空間データに基づく周波数分布の適応調整を利用する適応マスク(AMDM)に基づく拡散モデルを提案する。
実験により,本手法が特定の周波数情報を学習し,MRI再建の質を向上させる能力について検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:54:53 GMT)
Cost-Aware Routing for Efficient Text-To-Image Generation [19.8] 本稿では,その複雑さに応じて,各プロンプト毎に計算量を変動させるフレームワークを提案する。
私たちは、COCOとDiffusionDBで、すでに訓練された9つのテキスト・ツー・イメージモデルへのルートを学ぶことで、これらのモデルだけで達成可能な平均品質を提供することができることを実証的に示しています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:44:17 GMT)
Global Context-aware Representation Learning for Spatially Resolved Transcriptomics [19.6] 複数のスポット間のグローバルな関係を捉えるために、Simisity Telescopeモジュールを導入した新しいフレームワークであるSpotscapeを提案する。
また,スライス内スポットとインタースライススポット間の距離を制御し,効率的なマルチスライス統合を実現するための類似性スケーリング戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:46:50 GMT)
InstructAttribute: Fine-grained Object Attributes editing with Instruction [19.3] テキスト・ツー・イメージ(T2I)拡散モデルは画像編集において強力な生成能力のために広く利用されている。
本研究では,新しいトレーニングフリーフレームワークであるStructure Preservation and Attribute Amplification (SPAA)を紹介した。
InstructAttributeは,自然言語のプロンプトによる細粒度およびオブジェクトレベルの属性の編集を可能にする命令調整モデルである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:49:33 GMT)
Multi-Agent Reinforcement Learning for Inverse Design in Photonic Integrated Circuits [19.2] フォトニック集積回路(PIC)の逆設計は、伝統的に勾配に基づく最適化に依存してきた。
PICの設計のための強化学習環境とマルチエージェントRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:34:27 GMT)
Benchmarking Music Generation Models and Metrics via Human Preference Studies [19.0] 我々は、12の最先端モデルを用いて6k曲を生成し、2.5k人の被験者と15k対のオーディオ比較を行った。
我々の知る限りでは、この研究は人間の好みに基づいて現在最先端の音楽生成モデルとメトリクスをランク付けする最初のものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:01:29 GMT)
A Random Matrix Analysis of In-context Memorization for Nonlinear Attention [18.9] 非線形注意は、ランダムな入力に対する線形リッジ回帰よりも高い記憶誤差をもたらすことを示す。
その結果,非線形注意の記憶性能を管理するために,非線形性と入力構造がどのように相互作用するかが明らかになった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:56:43 GMT)
Step-by-Step Unmasking for Parameter-Efficient Fine-tuning of Large Language Models [18.9] 我々はパラメータの重要度を連続的に計算する新しい選択型PEFT法である$textID3$を紹介した。
解析的に、$textID3$は勾配更新数を2倍に減らし、計算効率が向上することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:25:27 GMT)
Detection of subsurface structures with a vehicle-based atom gravity gradiometer [18.9] 原子重力勾配計(AGG)は最も正確な移動重力勾配計の1つであるが、現在は可搬性と感度のトレードオフによって制限されている。
本稿では,94Lの超コンパクトセンサヘッドを備えた高感度移動型AGGについて述べる。
実験室では、77E/sqrtHz$(1E=1$times10-9$/s$2$)の感度と0.5E以上の長期的な安定性を達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:58:55 GMT)
Sycophancy in Vision-Language Models: A Systematic Analysis and an Inference-Time Mitigation Framework [18.5] 本稿では,視覚言語ベンチマーク間のサイコフィナンシーを分析し,推論時間緩和フレームワークを提案する。
我々のフレームワークは、中立なプロンプトの性能を維持しながら、評価されたすべてのモデルでサイコフィナンシーを効果的に軽減します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:00:38 GMT)
VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models [18.4] VideoMarkは、ビデオ拡散モデルのための歪みのない堅牢な透かしフレームワークである。
固定された透かしシーケンスを用いて擬似乱数誤り訂正(PRC)符号を用いたフレームワイド透かし方式を用いる。
透かし抽出のために,編集距離を利用して復号されたメッセージと元の透かしシーケンスを整列する時間マッチングモジュール(TMM)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:08:22 GMT)
OC-SOP: Enhancing Vision-Based 3D Semantic Occupancy Prediction by Object-Centric Awareness [18.3] 本稿では,検出ブランチから抽出した高レベルなオブジェクト中心キューを,意味的占有率予測パイプラインに統合するフレームワークを提案する。
このオブジェクト中心の統合により、前景オブジェクトの予測精度が大幅に向上する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:03:53 GMT)
Indeterminate Probability Theory [18.3] 本稿では,不確定確率論(IPT)を提案する。
IPTは観測者中心のフレームワークであり、実験結果は地上の真実と観測誤差を組み合わせた分布として表される。
IPTは古典的確率論と一致しており、観測誤差の極限における頻繁な方程式を仮定する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:56:46 GMT)
Quantifying Uncertainty in the Presence of Distribution Shifts [18.3] ニューラルネットワークは正確な予測を行うが、しばしば信頼できる不確実性推定を提供することができない。
我々は不確実性推定のためのベイズ的枠組みを提案する。
本手法は,合成データと実世界のデータの両方で評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:30:36 GMT)
Understanding Software Engineering Agents: A Study of Thought-Action-Result Trajectories [18.1] 大規模言語モデル(LLM)ベースのエージェントは、複雑なソフトウェアエンジニアリングタスクを自動化するためにますます採用されている。
広く採用されているにもかかわらず、これらのエージェントの内部決定プロセスはほとんど解明されていない。
本研究は,3種類のLLM系エージェントの思考-反感-反感の軌跡について,大規模な実証的研究を行った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:34:52 GMT)
First-Order Sparse Convex Optimization: Better Rates with Sparse Updates [18.0] Inは、疎最適解を用いた凸最適化問題に対して線形収束率を持つことが最近確立された。
改良された混合ノルム条件数に依存する線形収束速度はスパース更新のみを用いて得られることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:44:37 GMT)
What You Think Is What You Get: Bridge User Intent and Transfer Function Design through Multimodal Large Language Models [18.0] 直接ボリュームレンダリング(DVR)は、意味のある構造を抽出する上で重要な役割を果たす転送関数(TF)を用いて、ボリュームデータを可視化する基本的な技術である。
しかし、ユーザ意図とTFパラメータ空間のセマンティックなギャップがあるため、効果的なTFを設計するのは直感的ではない。
本稿では、MLLM(Multi-model Large Language Models)を活用して、ユーザ意図に基づいたTF最適化を導出するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:42:57 GMT)
HiddenDetect: Detecting Jailbreak Attacks against Large Vision-Language Models via Monitoring Hidden States [17.6] 本研究は,LVLMが内的アクティベーションにおける安全性関連信号を本質的にエンコードしているかどうかを考察する。
その結果,LVLMは安全でないプロンプトを処理する際に,異なる活性化パターンを示すことが明らかとなった。
HiddenDetectは、内部モデルのアクティベーションを活用して安全性を高める、新しいチューニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:11:32 GMT)
Rational Metareasoning for Large Language Models [17.5] 大きな言語モデル(LLM)を使用するためのコアテクニックとして,推論への関与を促す声が上がっている。
本研究は,認知科学で用いられるメタレゾニングの計算モデルに基づく新しいアプローチを導入する。
我々は不必要な推論を罰することで計算の価値を組み込む報酬関数を開発する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:59:37 GMT)
CLIP-GS: CLIP-Informed Gaussian Splatting for View-Consistent 3D Indoor Semantic Understanding [17.4] 室内シーンのオープンな3Dセマンティック理解のためのCLIPモデルを用いた3Dガウススティング(3DGS)が注目されている。
提案するセマンティック属性コンパクト性(SAC)と3Dコヒーレント正規化(3DCR)を用いて、3次元屋内シーンのコヒーレントな意味理解を効率的に実現するCLIP-GSを提案する。
ScanNetとReplicaのデータセット上で,mIoUの21.20%と13.05%の改善を実現し,既存の最先端手法を著しく抑制する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:10:31 GMT)
TextBraTS: Text-Guided Volumetric Brain Tumor Segmentation with Innovative Dataset Development and Fusion Module Exploration [17.4] 我々は、ペア化されたMRIボリュームとリッチなテキストアノテーションを含む、初めて公開されたボリュームレベルのマルチモーダルデータセットであるTextBraTSデータセットを紹介する。
提案手法は,脳腫瘍のセグメンテーション精度を大幅に向上させ,効果的なマルチモーダル統合技術に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:15:40 GMT)
MedTVT-R1: A Multimodal LLM Empowering Medical Reasoning and Diagnosis [17.3] MedTVT-R1は臨床用マルチモーダルデータを統合して複数の疾患の推論と診断を行うためのフレームワークである。
MedTVT-QAは,生理学レベルの解釈と疾患レベルの診断のための質問応答ペアを提供する。
MedTVT-R1のマルチモーダル特徴利用とマルチディスリーズ診断における優位性を示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:06:31 GMT)
MagicPose4D: Crafting Articulated Models with Appearance and Motion Control [17.2] 我々は4次元生成における外観と動きの制御を洗練させるフレームワークであるMagicPose4Dを提案する。
現行の4D生成方法とは異なり、MagicPose4Dはモーションプロンプトとしてモノクラービデオやメッシュシーケンスを受け入れる。
我々はMagicPose4Dが4Dコンテンツ生成の精度と一貫性を著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:47:55 GMT)
A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.1] HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:41:29 GMT)
LLM Web Dynamics: Tracing Model Collapse in a Network of LLMs [17.1] LLM Web Dynamics(LWD)は,ネットワークレベルでのモデル崩壊を効率的に調査するためのフレームワークである。
検索拡張生成(RAG)データベースを用いてインターネットをシミュレートすることにより,モデル出力の収束パターンを解析する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:09:58 GMT)
On the Existence of Universal Simulators of Attention [17.0] 注意出力と基礎となる基本行列を同一に再現し、RASPを介してアクティベーション操作を行う方法を提案する。
我々の証明は、これまで学習によってのみ近似することが知られていたアルゴリズムによって達成可能なデータ非依存の解の存在を初めて示すものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:15:25 GMT)
S4Fusion: Saliency-aware Selective State Space Model for Infrared Visible Image Fusion [17.0] 画像融合のためのS4Fusion(Saliency-aware Selective State Space Fusion Model)を提案する。
S4Fusionは、両方のモダリティからのグローバルな空間情報に焦点を合わせながら、それらの相互作用を促進する。
両方の画像から適切なターゲットを適応的に強調する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:30:17 GMT)
Phantom-Data : Towards a General Subject-Consistent Video Generation Dataset [17.0] textbfPhantom-Dataは、最初の汎用的対ビデオ整合性データセットである。
本データセットは,(1)汎用かつ入力整合性のある対象検出モジュール,(2)5300万本以上のビデオと30億枚以上の画像からの大規模クロスコンテキスト対象検索,(3)文脈変動下での視覚的整合性を確保するための事前誘導型識別検証という3段階のパイプラインで構築されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:11:56 GMT)
Your Token Becomes Worthless: Unveiling Rug Pull Schemes in Crypto Token via Code-and-Transaction Fusion Analysis [16.9] Rug Pullの詐欺は暗号通貨に対する永続的な脅威として現れ、大きな損失をもたらした。
現在の方法は、コードリスクを検出するために事前に定義されたパターンに依存するか、統計的トランザクションデータを使用して検出モデルをトレーニングする。
本稿では,Rug Pull検出のためのコードとトランザクションを統合する新しい手法であるRPhunterを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:34:15 GMT)
Adaptive alert prioritisation in security operations centres via learning to defer with human feedback [16.9] L2DHF(Learning to Defer with Human Feedback)を紹介する。
L2DHFはDeep Reinforcement Learning from Human Feedbackを使って遅延決定を最適化する。
UNSW-NB15ではAPの精度が13-16%向上し、CICIDS 2017では60-67%向上した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:59:58 GMT)
MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners [16.9] MuseControlLiteは、正確な条件付けのためにテキストから音楽への生成モデルを微調整するように設計されている。
興味のある状態が時間の関数である場合、位置埋め込みが重要となる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:08:03 GMT)
Align and Distill: Unifying and Improving Domain Adaptive Object Detection [16.9] ドメイン適応オブジェクト検出(DAOD)手法は近年,この問題に対処する上で大きな成果を上げている。
過去の結果を疑問視し、さらなる進歩を妨げるような、システムベンチマークの落とし穴を特定します。
ベンチマークと実装の統一フレームワークAlign and Distill(ALDI)を導入することで、これらの問題に対処する。
新しいベンチマークデータセットであるCFC-DAODは、さまざまな実世界のデータの評価を可能にし、(4)最先端の結果を大きなマージンで達成する新しいメソッドALDI++である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:18:32 GMT)
Distributionally Robust Active Learning for Gaussian Process Regression [16.9] 本稿では,GPRの最悪の予測誤差を効果的に低減する2つのAL手法を提案する。
最短ケースの予測二乗誤差の上限が上界であることを示し、この誤差は穏やかな条件下で有限個のデータラベルによって任意に小さくなることを示唆する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:32:30 GMT)
A Survey on Data Selection for LLM Instruction Tuning [16.8] 本稿では,データ選択手法の新たな分類法を提案し,最近の進歩を詳細に紹介する。
我々はオープンな課題を強調し、このタスクの新たなフロンティアを提示する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:30:46 GMT)
Double Machine Learning for Conditional Moment Restrictions: IV Regression, Proximal Causal Learning and Beyond [16.8] 条件モーメント制限(CMR)は統計学、因果推論、計量学において重要な問題である。
ほとんどのCMR推定器は2段階の手法を用いており、第1段階の推定は第2段階に直接差し込んで関心の関数を推定する。
DML-CMRは、2段階のCMR推定器であり、高速収束率を保証する不偏推定を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:27:16 GMT)
Multi-modal Anchor Gated Transformer with Knowledge Distillation for Emotion Recognition in Conversation [16.8] 会話における感情認識(Emotion Recognition in Conversation、ERC)は、会話中の個々の発話の感情を検出することを目的としている。
各発話に対して効率的かつモダリティ固有の表現を生成することは、依然として重要な課題である。
ERCタスクに対する知識蒸留を用いたマルチモーダルアンカーGated Transformer(MAGTKD)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:53:22 GMT)
Multi-Scale Representation of Follicular Lymphoma Pathology Images in a Single Hyperbolic Space [16.8] 自己教師付き学習を用いた悪性リンパ腫の病理像の表現法を提案する。
疾患進行の過程で発生する形態変化を捉えるため,本手法では組織とそれに対応する核像を互いに近接して埋め込む。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:25:55 GMT)
RealSR-R1: Reinforcement Learning for Real-World Image Super-Resolution with Vision-Language Chain-of-Thought [16.5] リアルワールド・イメージ・スーパーリゾリューションは、画像修復において最も難しい課題の1つです。
既存の手法は、劣化した画像の内容の正確な理解に苦慮している。
本稿では、RealSRモデルに理解と推論機能を持たせるRealSR-R1を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:42:18 GMT)
Accurate and scalable exchange-correlation with deep learning [16.5] Skalaは最新のディープラーニングベースのXC関数で、データから直接表現を学習することで、高価な手設計の機能をバイパスする。
スカラは半局所DFTの計算効率を保ちながら、小さな分子の原子化エネルギーの化学的精度を達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:52:42 GMT)
PARALLELPROMPT: Extracting Parallelism from Large Language Model Queries [16.4] 本稿では,自然ユーザプロンプトにおけるクエリ内並列性を測定する最初のベンチマークであるPARALLELPROMPTを紹介する。
我々のデータセットは、パブリックなLLMチャットログから37,000以上の実世界のプロンプトで構成されています。
並列戦略とシリアル戦略をベンチマークし、レイテンシ、構造的忠実度、セマンティック忠実度を計測する実行スイートを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:05:54 GMT)
Incentives for Responsiveness, Instrumental Control and Impact [16.4] 本稿ではエージェントのインセンティブを記述する3つの概念を紹介する。
応答インセンティブは、センシティブな人口統計情報などの環境における変数が最適な政策の下で決定に影響を及ぼすことを示す。
統合制御インセンティブは、エージェントのポリシーが、ユーザの好みや指示など、環境の一部を操作するために選択されるかどうかを示す。
インパクトインセンティブは、エージェントが意図的に、あるいは他の目的で、どの変数に影響を及ぼすかを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:26:44 GMT)
Survey of HPC in US Research Institutions [16.4] AI、データ集約科学、デジタルツインテクノロジーは、ハイパフォーマンスコンピューティングに対する前例のない需要を駆り立ててきた。
この調査は、米国全大学におけるHPCの展望を総合的に評価するものである。
計算能力、建築設計、ガバナンスモデル、エネルギー効率を分析し、50以上の主要な研究機関について検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:13:36 GMT)
Finding Clustering Algorithms in the Transformer Architecture [16.3] 変換器は$k$-meansクラスタリングのための基本的かつ広く使用されるアルゴリズムを実装可能であることを示す。
我々はこの変換器を数値的に実装し、我々のアーキテクチャとロイドのアルゴリズムの正確な対応を実験で実証する。
我々の研究結果は、トランスに正確なアルゴリズムを実装する上で、明確かつ解釈可能な視点を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:52:01 GMT)
DDOT: A Derivative-directed Dual-decoder Ordinary Differential Equation Transformer for Dynamic System Modeling [16.3] 本稿では,多次元ODEをシンボル形式で再構成するトランスフォーマーモデルであるDDOTを紹介する。
ODEのデリバティブを予測する補助タスクを組み込むことで、DDOTは構造と動的挙動の両方を効果的にキャプチャする。
DDOTは既存のシンボリック回帰法よりも優れており、復元とタスクの一般化のために$P(R2 > 0.9)$で4.58%と1.62%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:24:52 GMT)
SWA-SOP: Spatially-aware Window Attention for Semantic Occupancy Prediction in Autonomous Driving [16.3] 空間認識型ウィンドウアテンション(SWA)は、局所的な空間コンテキストを注意に組み込む新しいメカニズムである。
SWAはシーン補完を大幅に改善し、LiDARベースのSOPベンチマークで最先端の結果を得る。
我々は、SWAをカメラベースのSOPパイプラインに統合することで、その一般化をさらに検証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:54:28 GMT)
Holographic deep thermalization for secure and efficient quantum random state generation [16.0] 我々は,セキュアでハードウェア効率のよい量子乱数状態発生器であるホログラフィック深熱化を導入する。
スクランブル測度リセットプロセスのシーケンシャルな適用を採用することで、時間とともに空間を交換し、必要なアンシラサイズを大幅に削減する。
リソースの削減により、我々の回路ベースのIBM Quantumデバイスの実装は、合計8ドルキュービットしか利用せずに、真に5ドルキュービットのランダムな状態生成を実現した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:18:48 GMT)
BAnG: Bidirectional Anchored Generation for Conditional RNA Design [15.9] 既存の計算手法では、特定のタンパク質ごとに既知のRNA配列がかなり必要である。
RNA-BAnGは,タンパク質相互作用のためのRNA配列を生成するための深層学習モデルである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:26:44 GMT)
SHAMaNS: Sound Localization with Hybrid Alpha-Stable Spatial Measure and Neural Steerer [15.9] 本稿では、観測信号に対する$alpha$-stableモデルと、ステアリングベクトルをモデル化するためのニューラルネットワークに基づくアプローチを組み合わせた、音源定位(SSL)手法について述べる。
具体的には、ニューラルネットワーク(Neural Steerer)と呼ばれる物理インフォームドニューラルネットワークを用いて、測定されたステアリングベクトル(SV)を固定されたマイクロフォンアレイ上に補間する。
提案手法は,複数音源の場合の最先端手法より優れる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:11:29 GMT)
Smart-LLaMA-DPO: Reinforced Large Language Model for Explainable Smart Contract Vulnerability Detection [15.7] 既存の脆弱性検出方法は2つの大きな問題に直面している。
嗜好学習には包括的カバレッジと高品質な説明が欠如している。
大規模言語モデル(LLM)は、スマートコントラクトのセキュリティにおいて、特定の概念を正確に解釈するのに苦労することが多い。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:24:07 GMT)
A Large Language Model-based Multi-Agent Framework for Analog Circuits' Sizing Relationships Extraction [15.6] 本稿では,学術論文から抽出したアナログ回路のサイズ関係のための大規模言語モデル(LLM)に基づくマルチエージェントフレームワークを提案する。
3種類の回路でテストを行い、最適化効率を2.32 sim 26.6 倍に改善した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:03:58 GMT)
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs [15.5] 本研究では,空間推論強化MLLMを用いたCAD合成法CAD-GPTを紹介する。
空間展開機構を用いて3次元空間位置と3次元スケッチ平面回転角を1次元言語特徴空間にマッピングする。
また、2Dスケッチ座標を適切な平面空間に識別し、空間開始位置、スケッチ方向、および2Dスケッチ座標変換の正確な決定を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:49:04 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.5] 大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークでのタスク成功率を、GPT-4o miniのHugging Face Agentsと比較して29%改善した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:43:03 GMT)
DipLLM: Fine-Tuning LLM for Strategic Decision-making in Diplomacy [15.5] 大規模言語モデル(LLM)は、AIシステムの平衡探索に代わる有望な代替手段を提供する。
外交の均衡政策を学習する微調整LDMエージェントDipLLMを提案する。
本研究は,マルチプレイヤーゲームにおける複雑な戦略決定処理のための微調整LDMの可能性を示すものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:49:08 GMT)
DUMB and DUMBer: Is Adversarial Training Worth It in the Real World? [15.5] 敵の例は小さく、しばしば、愚かな機械学習モデルのために作られた、知覚不能な摂動である。
侵入攻撃(英語: Evasion attack)とは、入力がテスト時に誤分類を引き起こすように修正される敵攻撃の一種であり、その伝達性のために特に不快である。
本稿では,DUMB法の基礎の上に構築された攻撃フレームワークであるDUMBerを紹介し,敵の訓練したモデルの弾力性を評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:16:21 GMT)
Frequency-Weighted Training Losses for Phoneme-Level DNN-based Speech Enhancement [15.3] 時間周波数領域で定式化され、周波数依存重み付け方式によって変調されるSDR損失の知覚的インフォームド変種を提案する。
これらの損失を利用して、FaSNetマルチチャネル音声強調モデルを訓練する。
実験の結果、SDRなどの標準指標はわずかに改善されているものの、知覚周波数重み付けの指標の方が大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:52:34 GMT)
Exactly solvable models for universal operator growth [15.2] 一般多体系の量子可観測性は、作用素のクリロフ空間における普遍的な成長パターンを示す。
我々は、普遍作用素成長と整合したランツォ係数の広い族を導入し、探求する。
家族の1つにとって、クリロフ複雑性は正確に計算される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:20:35 GMT)
BulletGen: Improving 4D Reconstruction with Bullet-Time Generation [15.2] BulletGenは、生成モデルを利用してエラーを訂正し、動的なシーン表現で行方不明情報を完成させるアプローチである。
提案手法は,静的および動的シーン成分と生成コンテンツをシームレスにブレンドし,新しいビュー合成と2D/3Dトラッキングの両タスクの最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:03:42 GMT)
AI-Generated Song Detection via Lyrics Transcripts [15.2] AIベースの音楽生成ツールの近年の能力向上は、音楽産業の隆盛を生み出している。
本稿では、一般的な自動音声認識(ASR)モデルを用いて曲を翻訳することで、このギャップを解決することを提案する。
我々の手法は、音声が様々な方法で摂動されるとき、最先端のオーディオベースよりも頑丈である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:42:50 GMT)
Experimenting, Fast and Slow: Bayesian Optimization of Long-term Outcomes with Online Experiments [15.1] 意思決定者は、システム変更の長期的な治療効果を最適化したいと考えています。
高速な実験(例えば、偏りのある実験は数時間から数日しか実行されない)と長時間の遅い実験を組み合わせた新しいアプローチについて述べる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:18:54 GMT)
Statistical Inference for Optimal Transport Maps: Recent Advances and Perspectives [15.0] 最適輸送(OT)の多くの応用において、主要な関心の対象は最適輸送写像である。
この写像は、特定のコストを最小化し、最も効率的な方法で、ある確率分布から別の確率分布へ質量を並べ替える。
我々は、基礎となる分布のサンプルを用いて、OTマップの極限定理の推定と開発における最近の進歩についてレビューする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:28:48 GMT)
Shaken, Not Stirred: A Novel Dataset for Visual Understanding of Glasses in Human-Robot Bartending Tasks [15.0] 我々は,ヒューマノイドロボットプラットフォームであるNICOL(Neuro-Inspired COLlaborator)上で収集された,新しい実世界のガラスオブジェクトデータセットを提供する。
トレーニングされたベースラインモデルは、最先端のオープンボキャブラリアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:51:48 GMT)
Historical Report Guided Bi-modal Concurrent Learning for Pathology Report Generation [14.9] 病理学者の診断的推論を模擬したリポート「textbfBi-modal Concurrent Learning Framework for Pathology Report textbfGeneration (BiGen)」
BiGenは、ハイアテンションパッチにマッチして、事前に構築された医療知識銀行からWSI関連知識を取得する。
提案手法は,NLP指標が7.4%,Her-2予測のための分類指標が19.1%向上し,最先端性能を実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:00:21 GMT)
Object-aware Sound Source Localization via Audio-Visual Scene Understanding [14.8] 既存の手法は複雑な場面における音像の正確な位置決めに苦慮している。
この制限は、主に単純な音声と視覚の対応に依存することから生じる。
マルチモーダル大言語モデルを利用した新しい音源定位フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:08:07 GMT)
Do Concept Bottleneck Models Respect Localities? [14.8] 概念に基づく説明可能性法は、人間の理解可能な仲介者を用いて機械学習モデルの説明を生成する。
我々は,概念予測者が関係する特徴を活用して予測を行うかどうかを,局所性と呼ぶ用語として評価する。
概念予測器は必ずしも明確な概念を区別できないため、実際には多くの概念ベースモデルは局所性を尊重しない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:43:27 GMT)
Learning interpretable positional encodings in transformers depends on initialization [14.7] 位置符号化(PE)は、シーケンス内のトークンの位置と順序を区別する重要な情報を提供する。
学習可能なPEの選択は、解釈可能なPEを学習する能力に大きな影響を及ぼすことを示す。
極小分布から学習したPEは、複数の次元で真実の位置を反映する解釈可能なPEを発見できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:01:16 GMT)
MIRAGE: A Multi-modal Benchmark for Spatial Perception, Reasoning, and Intelligence [14.7] MIRAGEは、Counting(オブジェクト属性認識)、Relation(空間リレーショナル推論)、Counting with Relationにおけるモデルの能力を評価するために設計されたベンチマークである。
これらの基礎的能力をターゲットにして、MIRAGEは将来の研究における時間的推論に向けた空間認識への道筋を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:22:36 GMT)
Morse: Dual-Sampling for Lossless Acceleration of Diffusion Models [14.6] 拡散モデルを損失なく加速するための二重サンプリングフレームワークであるMorseを提案する。
特にMorseには、DashとDotという2つのモデルがあり、互いに対話する。
DashとDotモデルの出力をタイムインターリーブ方式でチェーンすることで、Morseはフレキシブルに所望の画像生成性能を得るというメリットを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:43:21 GMT)
NLPnorth @ TalentCLEF 2025: Comparing Discriminative, Contrastive, and Prompt-Based Methods for Job Title and Skill Matching [14.5] ジョブのマッチングは、候補マッチング、キャリアパス予測、およびジョブマーケット分析を改善するため、計算ジョブマーケット領域において非常に関連性の高いタスクである。
本稿では,NLPnorthのTalentCLEF 2025への提出について概説する。
タスクAでは、テストデータの平均平均精度(MAP)が0.492、英語、スペイン語、ドイツ語で平均される。
全体として、最大の多言語言語モデルが両方のタスクに最適であることがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:18:25 GMT)
Towards Group Fairness with Multiple Sensitive Attributes in Federated Foundation Models [14.1] フェデレーション・ファンデーション・モデル(FFM)の時代において、グループフェアネスの達成は、ますます顕著な問題となっている。
本稿では,FFMにおけるグループフェアネスとグループフェアネスの関係の因果解析に向けた最初の試みを行う。
我々は、FFM構造を拡張し、複数の機密属性を同時に交換し、因果発見と推論によってグループフェアネスの背後にある因果効果を定量化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:09:14 GMT)
Bohdi: Heterogeneous LLM Fusion with Automatic Data Exploration [13.8] Bohdiは、合成データのみのヘテロジニアスなLarge Language Model(LLM)融合フレームワークである。
知識ドメインを階層木構造にまとめることで、Bohdiは自動ドメイン探索とマルチドメインデータ生成を可能にします。
Bohdiは、既存のベースラインを複数のLLMで大幅に上回っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:03:18 GMT)
Symmetric Reinforcement Learning Loss for Robust Learning on Diverse Tasks and Model Scales [13.8] 強化学習(RL)トレーニングは、移動目標や高勾配分散などの要因により本質的に不安定である。
本研究では,雑音データに対する教師付き学習から逆クロスエントロピー(RCE)を適用し,対称的なRL損失を定義することにより,RLトレーニングの安定性を向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:56:21 GMT)
Quantifying Fairness in LLMs Beyond Tokens: A Semantic and Statistical Perspective [13.7] 大規模言語モデル(LLM)は、しばしば固有のバイアスを伴う応答を生成し、現実のアプリケーションにおける信頼性を損なう。
既存の評価手法は、LLM出力の長文応答におけるバイアスと本質的変動をしばしば見落としている。
人口集団間での長文応答の微妙な意味的差異を検知し,LLMにおけるグループレベルの公平性を評価するための新しい統計フレームワークであるFiScoを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:31:22 GMT)
Song Form-aware Full-Song Text-to-Lyrics Generation with Multi-Level Granularity Syllable Count Control [13.7] 単語,フレーズ,行,段落レベルで多段階の音節制御を可能にする歌詞生成フレームワークを提案する。
提案手法は,入力テキストと歌唱形式に条件付けされた完全な歌詞を生成し,特定の音節制約に適合することを保証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:18:25 GMT)
ContinualFlow: Learning and Unlearning with Neural Flow Matching [13.6] 本研究では、フローマッチングによる生成モデルにおける目標未学習のための原則的フレームワークであるContinualFlowを紹介する。
本手法では,スクラッチからのトレーニングやサンプルへの直接アクセスを必要とせずに,エネルギーによる再加重損失を利用して,データ分布の不要領域をソフトに減算する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:20:58 GMT)
Less Data Less Tokens: Multilingual Unification Learning for Efficient Test-Time Reasoning in LLMs [13.6] 本稿では,大規模言語モデル(LLM)のテスト時間スケーリングの課題について考察する。
パイロット研究に基づいて多言語推論の多様性を強調した。
我々は,新しいアプローチ (L2) を導入し,多言語統一学習を行った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:47:28 GMT)
Learning to Insert for Constructive Neural Vehicle Routing Solver [13.6] 建設的NCOの学習手法として,挿入型パラダイム(L2C-Insert)を用いた構築学習を提案する。
従来のアプローチとは異なり、L2C-Insertは、現在の部分解の任意の有効な位置において、意図しないノードを戦略的に挿入することで、ソリューションを構築する。
トラベリングセールスマン問題 (TSP) とキャパシタント車両ルーティング問題 (CVRP) の総合的および実世界の事例において、L2C-Insert が一貫して優れた性能を発揮することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:00:03 GMT)
Plan for Speed -- Dilated Scheduling for Masked Diffusion Language Models [13.6] 仮面拡散言語モデル (MDLM) は非自己回帰的テキスト生成に強く期待されている。
既存のサンプルは暗黙のプランナーとして機能し、デノイザーの信頼やエントロピースコアを通じてアンマスクするトークンを選択する。
DUS(Dilated-scheduled Unmasking Strategy)は、追加のトレーニングを必要としない推論のみのプランナーフリーな手法である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:49:23 GMT)
Local Learning Rules for Out-of-Equilibrium Physical Generative Models [13.5] 本研究では,スコアベース生成モデル(SGM)の非平衡駆動プロトコルを局所学習規則により学習可能であることを示す。
駆動プロトコルのパラメータに関する勾配は、力の測定や観測されたシステムダイナミクスから直接計算される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:11:40 GMT)
Multi-level Compositional Feature Augmentation for Unbiased Scene Graph Generation [13.3] シーングラフ生成(SGG)は、与えられた画像内のすべての視覚的関係三重項、pred、obj>を検出することを目的としている。
ユビキタスな長い尾の述語分布のため、今日のSGGモデルはいまだに頭部述語に偏っている。
本稿では,三重項特徴の多様性を高めることを目的とした,MCFA(Multi-level Compositional Feature Augmentation)戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:54:47 GMT)
MCP-Zero: Active Tool Discovery for Autonomous LLM Agents [13.0] ツール発見の自律性を LLM 自体に復元する,アクティブエージェントフレームワークである MCP-Zero を紹介する。
すべての利用可能なツールで圧倒的なモデルを使用する代わりに、CP-Zeroはエージェントが能率ギャップを積極的に識別し、特定のツールをオンデマンドで要求することを可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:33:05 GMT)
Context-Aware Human Behavior Prediction Using Multimodal Large Language Models: Challenges and Insights [12.9] 本研究では,事前学習したMLLMを文脈を考慮した人間の行動予測に応用する体系的解析手法を提案する。
我々のフレームワークは、ターゲットフレームにおける人間の振る舞いを予測する際に、92.8%のセマンティック類似性と66.1%の正確なラベル精度に達することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:43:46 GMT)
Distilling Tool Knowledge into Language Models via Back-Translated Traces [12.7] 本稿では,ツール知識を言語モデル(LLM)に純粋に抽出するための新しいパラダイムを提案する。
Translator Agentは、個々のツールコールの説明を生成し、Rephrase Agentはそれらを合体させて、流動的でグローバルに一貫性のある物語にする。
これらの合成トレース上で小さなオープンソースモデルを微調整することで、ツール知識と構造化推論パターンの両方を内部化できることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:10:38 GMT)
Can Argus Judge Them All? Comparing VLMs Across Domains [12.6] VLM(Vision-Language Models)は、マルチモーダルAIを推進しているが、タスク間のパフォーマンス一貫性は過小評価されている。
CLIP、BLIP、LXMERTを検索、キャプション、推論にまたがる多様なデータセットでベンチマークする。
我々の評価には、タスク精度、生成品質、効率、新しいクロスデータセット一貫性(CDC)メトリクスが含まれる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:58:35 GMT)
AdaLRS: Loss-Guided Adaptive Learning Rate Search for Efficient Foundation Model Pretraining [12.6] オンライン最適学習率探索を行うプラグイン・アンド・プレイ適応学習率探索アルゴリズムである textbfAdaLRS を提案する。
実験により,AdaLRSは最適近傍の最適学習率を顕著な効率と有効性で調整することが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:18:17 GMT)
HAWAII: Hierarchical Visual Knowledge Transfer for Efficient Vision-Language Models [12.6] HAWAIIは、複数の視覚専門家から知識を単一の視覚エンコーダに抽出する新しいフレームワークである。
教師間の対立を軽減するため,教師固有のローランド適応 (LoRA) アダプタを提案する。
きめ細かいレベルでは、各教師の最も情報性の高いトークンを適応的に強調するためにトークン重要度スコアが用いられる。
粗粒度レベルでは、複数の教師の知識を要約し、ルータ付き汎用LoRAアダプタを用いて学生に伝達する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:43:25 GMT)
SALT: A Flexible Semi-Automatic Labeling Tool for General LiDAR Point Clouds with Cross-Scene Adaptability and 4D Consistency [12.5] 一般のLiDAR点雲に対するフレキシブルな半自動ラベリングツール(SALT)を提案する。
SALTは、生のLiDARデータを直接操作し、自動でプリセグメンテーション結果を生成する。
私たちは、SALTのオープンソース化が現在のLiDARデータセットの大幅な拡張を触媒することを期待しています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:49:10 GMT)
Large Language Models powered Malicious Traffic Detection: Architecture, Opportunities and Case Study [12.4] 大規模言語モデル(LLM)は膨大なテキストコーパスで訓練される。
悪意のあるトラフィック検出においてLLMの潜在能力を最大限に活用することに注力する。
本稿では,LLMを用いたDDoS検出の設計を事例として紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:35:39 GMT)
Selective Social-Interaction via Individual Importance for Fast Human Trajectory Prediction [12.4] 本稿では、Importance Estimatorと呼ばれる人物選択モジュールを提案する。
一次者の将来の軌跡を予測するために,各隣接する人物の重要性を出力する。
JRDBデータセットで行った実験から,本手法は競合予測精度でプロセスの高速化を図っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:01:24 GMT)
PlanGenLLMs: A Modern Survey of LLM Planning Capabilities [12.3] LLMは計画を生成する大きな可能性を秘めており、初期世界の状態を望ましい目標状態に変換する。
これらのシステムの多くは特定の問題に適応しており、それらを比較したり、新しいタスクに最適なアプローチを決定することは困難である。
我々の調査は、このギャップを埋めるために、現在のLLMプランナの概要を概観することを目的としている。
1990年、カルタムとウィルキンスによる基礎研究に基づいて、完全性、実行可能性、最適性、表現、一般化、効率の6つの重要な性能基準を検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:32:12 GMT)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [12.2] 哲学的なレンズによるNLPの探索は、古典的な哲学の学派と計算方法の橋渡しとして、研究者の目に近づきつつある。
本稿では,LLMの自己回帰を可能にするために,ヘーゲル方言に触発された哲学的枠組みを紹介する。
我々の実験は、数学的および記号的推論の大幅な改善とともに、アイデアの有望な結果を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:59:06 GMT)
Disentangling representations of retinal images with generative models [12.2] 患者属性をカメラ効果から効果的に切り離す網膜基底画像の集団モデルを提案する。
提案するモデルは,不整合部分空間において所望の情報を符号化し,学習した部分空間に基づいて制御可能な画像生成を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:48:12 GMT)
A Prior-Guided Joint Diffusion Model in Projection Domain for PET Tracer Conversion [12.2] PET(Positron emission tomography)は代謝活性を評価するために広く用いられているが、その応用は放射性物質の利用によって制限されている。
18F標識フルオロデオキシグルコース(18F-FDG)が最も一般的に使用されるトレーサーであるが、特定の腫瘍に対して有効性は限られている。
18F-fluoro-3,4-dihydroxy-L-phenylalanine (18F-DOPA)は神経内分泌腫瘍や神経疾患に対して高い特異性を示す。
本研究では18F-FDG PET シングラムを18F-DOPA PET シングラムに変換するためのPJDMモデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:40:34 GMT)
Multi-label Scene Classification for Autonomous Vehicles: Acquiring and Accumulating Knowledge from Diverse Datasets [12.2] 本稿では,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を併用した新しい学習システムを提案する。
ドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインモデルよりも56.1%のパフォーマンス向上が示されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:01:57 GMT)
Offline Goal-Conditioned Reinforcement Learning with Projective Quasimetric Planning [12.1] 非対称な距離を学習し、それを再利用する構成的枠組みである射影準距離計画(ProQ)を導入する。
メカニカルラーニング、キーポイントカバレッジ、ゴール条件制御を統一することにより、我々のアプローチは意味のあるサブゴールを生成し、長期目標達成を強力に推進する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:07:20 GMT)
Managing Technical Debt in a Multidisciplinary Data Intensive Software Team: an Observational Case Study [12.1] データ集約型(DI)ソリューションへの投資と開発が増加している。
慎重な管理がなければ、この成長する投資は関連する技術的負債(TD)も増加させる。
この研究は、多分野のDIチームTDマネジメントプラクティスに関する経験的、実践に基づく洞察に貢献する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:53:45 GMT)
MOST: MR reconstruction Optimization for multiple downStream Tasks via continual learning [12.1] 個別に訓練された再構成ネットワークと下流タスクネットワークをカスケーディングすることで、性能劣化がもたらされることが示されている。
連続学習によって連続的に導入される複数の下流タスクに最適化を適用できるように拡張する。
提案手法は,リプレイに基づく連続学習と画像誘導損失の手法を統合し,破滅的な忘れを克服する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:52:36 GMT)
Time-IMM: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series [12.1] Time-IMMは、マルチモーダル時系列における原因駆動不規則を捉えるために設計されたデータセットである。
IMM-TSFは不規則なマルチモーダル時系列を予測するためのベンチマークライブラリである。
実験結果から,不規則な時系列データ上でのマルチモーダリティを明示的にモデル化すると,予測性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:10:15 GMT)
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation [11.7] 音声駆動フルボディビデオ生成モデルであるOmniAvatarを紹介する。
人間のアニメーションを強化し、リップシンク精度と自然な動きを改善した。
実験では、顔と半体の両方のビデオ生成で既存のモデルを上回っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:33:03 GMT)
Bures-Wasserstein Flow Matching for Graph Generation [11.6] グラフ生成は分子設計から薬物発見まで、分野において重要なタスクとして現れてきた。
グラフの基本的な幾何学を尊重するグラフ生成のためのフローマッチングフレームワークであるBWFlowを紹介する。
新たなフレームワークは、連続的および離散的なフローマッチングアルゴリズムの両方に適用できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:31:42 GMT)
IndexTTS2: A Breakthrough in Emotionally Expressive and Duration-Controlled Auto-Regressive Zero-Shot Text-to-Speech [11.5] IndexTTS2は、音声持続時間制御のための、新しくて自己回帰的なモデルフレンドリーな方法である。
感情表現と話者同一性の間の絡み合いを達成し、音色と感情の独立的な制御を可能にする。
既存のゼロショットTSモデルよりも、単語エラー率、話者類似度、感情的忠実度が優れている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:33:40 GMT)
Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment [11.5] 生成強化ネットワーク(GRN)と呼ばれる新しいセグメンテーション対応ジョイントトレーニングフレームワークについて紹介する。
GRNはセグメンテーション損失フィードバックを統合し、画像生成とセグメンテーションのパフォーマンスを1段階で最適化する。
サンプル効率学習用GRN(GRN-SEL)と半教師付き学習用GRN(GRN-SSL)の2種類も開発されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:08:10 GMT)
Collaborative Mean Estimation Among Heterogeneous Strategic Agents: Individual Rationality, Fairness, and Truthful Contribution [11.4] 我々は、$m$エージェントがベクトル$mu =(mu_k, sigma2)_kin[d]$を推定しようとする協調学習問題を研究する。
独立して作業する代わりに、エージェントはデータを交換し、より安価なサンプルを収集し、コストのかかるデータと引き換えにそれらを共有できるため、コストと推定エラーの両方を削減できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:32:45 GMT)
ThermalLoc: A Vision Transformer-Based Approach for Robust Thermal Camera Relocalization in Large-Scale Environments [11.3] 熱カメラは、熱放射によって環境データをキャプチャする。
従来の視覚的再局在法は熱画像に直接適用できない。
本研究では,熱画像再局在化のための新しいエンドツーエンド深層学習手法であるHeatherLocを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:52:35 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [11.3] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。
既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。
そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:51:33 GMT)
EmoAgent: A Multi-Agent Framework for Diverse Affective Image Manipulation [11.3] Affective Image Manipulationは、画像内の視覚的要素を変更して、視聴者からの感情的な反応を誘発する。
既存のAIMアプローチは、感情と視覚的手がかりの間の堅固な音素間マッピングに依存している。
本稿では,D-AIMに特化した最初のマルチエージェントフレームワークであるemphEmoAgentを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:03:50 GMT)
Mathematical Proof as a Litmus Test: Revealing Failure Modes of Advanced Large Reasoning Models [11.3] RFMDataset(Reveal Failure Modes)は200種類の数学的証明問題の集合である。
先進モデルの性能を徹底的に評価する。
解析により,現在の大規模推論モデルの基本的制約を示す10種類のきめ細かい誤差型が明らかになった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:11:44 GMT)
Proper Noun Diacritization for Arabic Wikipedia: A Benchmark Dataset [11.2] 英語のウィキペディアと同等の用語で、様々な起源のアラビア語の固有名詞を手作業で分類したデータセットを導入する。
GPT-4oは、アラビア語と英語の未分類形態を考慮し、完全発音を回復する作業についてベンチマークを行った。
我々の結果は、タスクの難しさと改善されたモデルとリソースの必要性の両方を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:59:17 GMT)
Matrix-Game: Interactive World Foundation Model [11.1] Matrix-Gameは、制御可能なゲームワールドジェネレーションのためのインタラクティブなワールドファンデーションモデルである。
本モデルでは,参照画像,動作コンテキスト,ユーザアクションを条件とした,制御可能な画像から世界への生成パラダイムを採用している。
17億以上のパラメータを持つMatrix-Gameは、キャラクタアクションとカメラの動きを正確に制御できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:40:49 GMT)
LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently [10.8] 本稿では,Low-Rank Adaptation (LoRA) を用いた大規模言語モデルを用いて,理論が実用的なアルゴリズムをガイドし,拡張する方法について検討する。
勾配降下の下では、LoRAアダプタは1ステップの完全な微調整勾配の特異部分空間と整列する。
本稿では, 線形収束を構築し, プリコンディショナーを取り入れた理論駆動型アルゴリズムLoRA-Oneを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:29:57 GMT)
Reading Smiles: Proxy Bias in Foundation Models for Facial Emotion Recognition [10.8] ファンデーションモデル(FM)はAffective Computing(AC)を急速に変化させており、ビジョン言語モデル(VLM)はゼロショット設定で感情を認識することができる。
この論文では、これらのモデルが影響を推測するために依存する視覚的手がかりは何か、心理的に根拠づけられているのか、あるいは表面的に学習されているのか、という批判的だが未解明の疑問を調査する。
AffectNetデータセットのアノテートされた部分集合上で異なるスケールのVLMをベンチマークし、目に見える歯の有無に応じて一貫した性能変化を見出す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:56:30 GMT)
These are Not All the Features You are Looking For: A Fundamental Bottleneck In Supervised Pretraining [10.7] トランスファーラーニングは、最新の機械学習の基盤であり、幅広いデータで事前訓練されたモデルを、最小限の新しいデータで新しいタスクに適応する方法を約束する。
本研究では,各タスクに対する事前学習混合物からのモデル伝達を評価し,事前学習した特徴がタスク固有の直接訓練のパフォーマンスに適合するかどうかを評価する。
ディープラーニングモデルでは、トレーニング中に同様の機能をエンコードすると、ネットワークが新しい機能を学習できないという、基本的な制限を特定します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:04:29 GMT)
Enhanced Hybrid Transducer and Attention Encoder Decoder with Text Data [10.7] 共同トランスデューサとアテンションベースエンコーダデコーダ(TAED)モデルを提案し,大量のテキストコーパスを活用し,ASR精度を向上させる。
実験の結果、J-TAEDは音声と言語情報を一つのモデルに統合し、WERを5.812.8%減らすことに成功した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:51:39 GMT)
Dual-Forward Path Teacher Knowledge Distillation: Bridging the Capacity Gap Between Teacher and Student [10.6] 容量ギャップ問題に対処するため,Dual-Forward Path Teacher Knowledge Distillation (DFPT-KD)を提案する。
DFPT-KDは、学生の学習を監督する新しいデュアルフォワードパスの教師に、事前訓練された教師を置き換える。
実験により、DFPT-KDがバニラKDよりも優れたパフォーマンスを示すことが示されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:22:53 GMT)
CGS-GAN: 3D Consistent Gaussian Splatting GANs for High Resolution Human Head Synthesis [10.2] 3次元ガウススプラッティングに基づく3次元GANは、人間の頭部の高品質な合成のために提案されている。
既存の方法は、現在のカメラ位置でランダム潜伏ベクトルを条件にすることにより、トレーニングを安定させ、急な視点からレンダリング品質を向上させる。
ビューコンディショニングを必要とせずに、安定した訓練と高品質な頭部合成を可能にする新しい3DガウススプラッティングGANフレームワークであるCGS-GANを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:26:46 GMT)
Taming Vision-Language Models for Medical Image Analysis: A Comprehensive Review [10.2] 現代の視覚言語モデル(VLM)は、クロスモーダルな意味理解において前例のない能力を示す。
彼らは、幅広い医療画像分析タスクのための有望なソリューションとして現れました。
しかし、汎用的なVLMを医療分野に適用することは、多くの課題をもたらす。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:11:24 GMT)
Near-Tight Runtime Guarantees for Many-Objective Evolutionary Algorithms [10.2] 我々は、(グローバル)SEMO、SMS-EMOA、バランスの取れたNSGA-II、NSGA-III、SPEA2を含む大規模なMOEAについて検討する。
ほとんどの境界は、ビットストリングの目的数や長さの小さな要素とは密接な関係にある。
このような厳密な境界がMOEAの多目的利用に対して証明されたのはこれが初めてである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:42:35 GMT)
Inferring Diffusion Structures of Heterogeneous Network Cascade [10.1] カスケードデータから多層拡散ネットワークを推定する新しいモデルを提案する。
提案モデルはカスケード経路を異なる層にまたがる拡散ネットワークの混合として表現する。
本研究では,多様な拡散構造を復元する際のモデルの性能を示すため,広範囲なシミュレーション研究を行う。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:26:19 GMT)
ILIAS: Instance-Level Image retrieval At Scale [10.0] ILIASはインスタンスレベルイメージ検索のための新しいテストデータセットである。
それは、現在および将来の基礎モデルと、特定のオブジェクトを認識するための検索技術を評価するために設計されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:43:24 GMT)
MORTAR: Multi-turn Metamorphic Testing for LLM-based Dialogue Systems [10.0] マルチターンインタラクションは、対話システムの現実世界での一般的な使用法である。
これは主にマルチターンテストにおけるオラクルの問題に起因する。
メタモルフィックなマルチターン対話テスト手法であるMORTARを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:23:35 GMT)
R3eVision: A Survey on Robust Rendering, Restoration, and Enhancement for 3D Low-Level Vision [10.0] 3次元低レベルビジョン(3D LLV)は、古典的な2次元低レベルビジョンタスクを3次元空間領域に拡張する。
LLVをニューラルレンダリングフレームワークに統合する最近の手法は、有害な条件下で高忠実度3D再構成を可能にする方法を説明するために分類される。
本研究は、3D LLVを実環境におけるロバストな3Dコンテンツ生成とシーンレベルの再構築の基本的な方向性として位置づける。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:06:37 GMT)
Lemmatization as a Classification Task: Results from Arabic across Multiple Genres [9.9] アラビア語のような曖昧な正書法を持つ形態学的に豊かな言語におけるNLPタスクには、レマタイゼーションが不可欠である。
本稿では,Lemma-POS-Gloss (LPG) タグセットの分類として,補題化を枠組み化する2つの新しい手法を提案する。
また、既存のデータセットと共に標準化された様々なジャンルをカバーする新しいアラビア語の補題化テストセットも提示する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:34:33 GMT)
Kernel spectral joint embeddings for high-dimensional noisy datasets using duo-landmark integral operators [9.8] 本研究では、2つの独立に観測された高次元ノイズデータセットの結合埋め込みを実現する新しいカーネルスペクトル法を提案する。
得られた低次元埋め込みは、同時クラスタリング、データの可視化、デノイングなど、多くの下流タスクに利用できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:35:04 GMT)
Tracing Errors, Constructing Fixes: Repository-Level Memory Error Repair via Typestate-Guided Context Retrieval [9.7] 本稿では,LLM(Large Language Models)を利用したメモリエラーの自動修復手法であるLTFixを紹介する。
提案手法では,有限型オートマトンを用いてエラー伝達経路とコンテキストトレースの追跡を誘導し,空間的(記憶状態)と時間的(実行履歴)の両方のエラー挙動をキャプチャする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:30:00 GMT)
Small Language Models in the Real World: Insights from Industrial Text Classification [9.7] ChatGPTは、テキスト分類と関連するタスクが大幅に進歩している。
より小さな言語モデルがテキスト分類タスクを効果的に扱えるかどうかという問題は、重要な関心事として浮上する。
本研究は,トランスフォーマーを用いたテキスト分類のための,プロンプトエンジニアリングと教師付き微調整手法の総合評価を行う。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:09:36 GMT)
A Modular Taxonomy for Hate Speech Definitions and Its Impact on Zero-Shot LLM Classification Performance [9.7] 本研究は, ヘイトスピーチを取り巻くあいまいさを, 文献から既存の定義を収集し, 分析することによって解決する。
実験レベルでは、3つのLDMの系統的ゼロショット評価に定義の収集を用いる。
異なる定義、すなわち、エンコードされた要素の観点で異なる特異性を持つ定義を選択することは、モデルの性能に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:28:13 GMT)
Context Consistency Learning via Sentence Removal for Semi-Supervised Video Paragraph Grounding [9.3] 半教師付き学習を強化するための新しいコンテキスト一貫性学習(CCL)フレームワークを提案する。
CCLは、半教師付き学習を強化するために、一貫性の正規化と擬似ラベルのパラダイムを統一する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:22:46 GMT)
Security Assessment of DeepSeek and GPT Series Models against Jailbreak Attacks [9.3] 本稿では,DeepSeekシリーズモデルの最初の系統的ジェイルブレイク評価について述べる。
HarmBench ベンチマークを用いて GPT-3.5 と GPT-4 を比較した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:53:31 GMT)
Hidden Breakthroughs in Language Model Training [9.2] 本稿では、同様のブレークスルーがトレーニングを通して頻繁に発生するが、すべての変動を1つのスカラーに分解する損失指標によって隠蔽されていることを論じる。
低ランクトレーニングサブスペースの任意のベースに沿った損失変化を分解するPOLCAを導入する。
POLCAがモデル能力の解釈可能なブレークスルーを表すクラスタを復元することを示すため,合成算術と自然言語のタスクに対する本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:55:45 GMT)
Geometry-Aware Preference Learning for 3D Texture Generation [9.0] 本稿では,3次元生成パイプライン全体を通じて人間の嗜好をバックプロパガンダする,エンドツーエンドで微分可能な選好学習フレームワークを提案する。
提案する4つの新しい幾何認識報酬関数を用いて,本フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:24:12 GMT)
TAMMs: Temporal-Aware Multimodal Model for Satellite Image Change Understanding and Forecasting [8.9] 本研究では,時間変化の理解と将来のシーン生成を両立させる新しい課題に対して,MLLM(Multimodal Large Language Model)の能力について検討する。
衛星画像の理解と予測のための時間対応マルチモーダルモデルTAMMを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:26:16 GMT)
SOF: Sorted Opacity Fields for Fast Unbounded Surface Reconstruction [8.9] 3次元ガウス表現は、画像に基づくシーン再構成の品質と効率を大幅に改善した。
多くの既存手法は近似深度推定と大域的ソートに依存しており、アーティファクトを導入し、再構成メッシュの忠実さを制限することができる。
本稿では,3次元ガウスから詳細な表面を高速かつ高精度に復元する手法であるSorted Opacity Fields (SOF)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:20:52 GMT)
SEAL: Scaling to Emphasize Attention for Long-Context Retrieval [8.8] 我々は、長期文脈検索(SEAL)における注意を強調するためのスケーリングと呼ばれる新しいアプローチを導入する。
我々は、特定の注意ヘッドが長文検索と密接に結びついていることを観察し、検索スコアと正あるいは負の相関を示す。
本稿では、これらのヘッドを強調するために生成されたデータを活用する学習ベースのメカニズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:24:16 GMT)
Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures [8.6] 本稿では,プレシンプレクティフィケーション・ネットワーク(PSN)について紹介する。
我々のアーキテクチャは、繰り返しエンコーダとフローマッチングの目的を組み合わせることで、エンド・ツー・エンドの位相空間力学を学習する。
次に、エネルギー、運動量、制約満足度を保ちながら、制約された軌道の予測に軽量なシンプレクティックネットワーク(SympNet)を付加する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:23:37 GMT)
Make It Efficient: Dynamic Sparse Attention for Autoregressive Image Generation [8.6] 適応動的スパース注意(adaptive Dynamic Sparse Attention, ADSA)と呼ばれる新しい学習自由コンテキスト最適化手法を提案する。
ADSAは、局所的なテクスチャの整合性を維持するのに欠かせない歴史的トークンと、グローバルなセマンティック・コヒーレンスを確保するのに欠かせないトークンを特定し、効率的に注意を合理化する。
また、ADSAに適した動的KV-cache更新機構を導入し、推論中のGPUメモリ消費量を約50%削減する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:27:06 GMT)
Topological Phase Transitions and Edge-State Transfer in Time-Multiplexed Quantum Walks [8.6] 格子対称性を持つ時間多重非単位量子ウォークの位相相転移とエッジ状態特性について検討する。
我々は,非ユニタリ位相の理解を深め,非エルミート量子系におけるエッジ状態の実験的実現と制御のための貴重な知見を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:59:44 GMT)
A Deep Learning Based Method for Fast Registration of Cardiac Magnetic Resonance Images [8.4] 本論文では、心臓のひずみを定量化するために、高速で容積的な登録モデルを提案する。
提案するディープラーニングニューラルネットワーク(DLNN)は,畳み込みを極めて効率的に計算できるアーキテクチャを利用するように設計されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:06:07 GMT)
Posterior Contraction for Sparse Neural Networks in Besov Spaces with Intrinsic Dimensionality [8.4] この研究は、スパースベイズニューラルネットワークが異方性ベソフ空間とその階層的構成に対して最適な後部収縮率を達成することを証明している。
これらの先行は, 真の関数の滑らか度が未知であっても, 後部を最適速度で収縮させることにより, レート適応を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:29:40 GMT)
TD-Paint: Faster Diffusion Inpainting Through Time Aware Pixel Conditioning [8.3] Time-Aware Diffusion Paint (TD-Paint) は、画素レベルでの可変ノイズレベルをモデル化することによって拡散プロセスに適応する新しいアプローチである。
専用のアーキテクチャや高価な生成ループを必要とする従来の拡散ベースの塗装モデルとは異なり、TD-Paintはアーキテクチャの変更なしにより高速なサンプリング時間を実現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:51:31 GMT)
The Impact of Input Order Bias on Large Language Models for Software Fault Localization [8.2] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクにおいて大きな可能性を示しています。
本研究では,入力順序と文脈サイズがLLM性能に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:51:16 GMT)
LLMs on a Budget? Say HOLA [8.1] エッジデバイス上での大規模言語モデル(LLM)の実行は、高い計算量とメモリ要求によって制限される。
我々は,効率的なLLMデプロイメントのためのエンドツーエンド最適化フレームワークであるHOLAを紹介する。
GSM8Kで17.6% EMA、ARCで10.5% MCA、Jetson Nanoのようなエッジデバイスでレイテンシとメモリを削減し、スケーラブルでプロダクション対応の両方を実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:20:47 GMT)
Fast Rate Information-theoretic Bounds on Generalization Errors [8.1] 学習アルゴリズムの一般化誤差は、学習アルゴリズムの学習データにおける損失と、目に見えないテストデータにおける損失との違いを指す。
一般化誤差に関する様々な情報理論境界が文献で導出されている。
本稿では,これらの境界の厳密性について,それらの収束速度の標本サイズ依存性の観点から検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:15:18 GMT)
Tight and Robust Consecutive Measurement Theorems with Applications to Quantum Cryptography [7.9] 連続測定定理(CMT)はこれらの量の間に一般的な関係を与える。
まず、厳密なCMTを確立し、それを特定の非局所ゲームにおける量子値の最高の上限を達成するために適用する。
次に、ロバストなCMTを開発し、CMTの新たな応用を探求し、量子オブリバスト移動の最も厳密なノーゴー定理を得る。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:48:26 GMT)
Reconstructing Tornadoes in 3D with Gaussian Splatting [7.8] 実験室をベースとした竜巻のマルチビューデータセットを新たにリリースした。
3DGSを用いて,この竜巻の3次元構造を効果的に再構築し,可視化できることを実証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:22:28 GMT)
Spatial frequency information fusion network for few-shot learning [7.8] 本稿では,革新的なデータ前処理機能を備えたSFIFNetを提案する。
この手法の鍵は、周波数領域情報と空間領域情報を統合することにより、画像特徴表現の精度を高めることである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:47:11 GMT)
RAPID: Long-Context Inference with Retrieval-Augmented Speculative Decoding [7.8] LLM(Long-context Large Language Model)は、従来の検索拡張世代(RAG)に代わる有望な代替手段を提供する。
本稿ではRAPID(Retrieval-Augmented Speculative Decoding)を提案する。
提案手法は,計算効率を維持しつつ,同一スケールあるいはそれ以上のLLMをRAGドラフトとして機能させる,新たなパラダイムを実現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:05:26 GMT)
Existing LLMs Are Not Self-Consistent For Simple Tasks [7.7] 大きな言語モデル(LLM)はますます強力になってきていますが、その決定が透明性を維持し、信頼できるものには自己整合性が必要です。
我々の研究によると、単純なタスクでも、すべての小さなモデルは非常に一貫性がなく、DeepSeek-R1やGPT-o4-miniのような最先端モデルでさえ完全に自己整合ではない。
これらの矛盾を定量化し緩和するために、不整合指標を導入し、2つの自動化手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:50:21 GMT)
Position is Power: System Prompts as a Mechanism of Bias in Large Language Models (LLMs) [7.7] 大規模言語モデル(LLM)におけるシステムプロンプトは、モデル動作を導く事前定義された指示である。
LLMのデプロイでは、コンテキスト間の一貫性のあるレスポンスを保証するために、ますます使用されている。
システムプロンプトがより複雑になるにつれて、直接的または間接的に、副作用の未報告を導入することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:43:45 GMT)
Fast Bayesian Optimization of Function Networks with Partial Evaluations [7.7] 本稿では,クエリ効率をわずかに損なうことなく計算オーバーヘッドを削減する,高速化されたp-KGFNアルゴリズムを提案する。
我々のアプローチの鍵は、1つの安価なグローバルモンテカルロシミュレーションによってネットワークの各ノードに対してノード固有の候補入力を生成することである。
数値実験により,元のp-KGFNアルゴリズムの16倍の高速化を達成しつつ,競合クエリ効率を維持する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:42:55 GMT)
Med-REFL: Medical Reasoning Enhancement via Self-Corrected Fine-grained Reflection [7.6] Med-REFL, underlinetextbfMedical underlinetextbfReasoning underlinetextbfEnhancement via self-corrected underlinetextbfFine-grained refunderlinetextbfLection。
本手法は,医学的疑問を微粒な推論経路に分解し,各ステップとそのその後のリフレクションを定量的に評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:33:59 GMT)
Optimization-Induced Dynamics of Lipschitz Continuity in Neural Networks [7.5] リプシッツ連続性は、小さな入力摂動に対するニューラルネットワークの最悪の感度を特徴づける。
勾配降下訓練におけるリプシッツ連続性の時間的進化をモデル化するための厳密な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:49:13 GMT)
Deep CNN Face Matchers Inherently Support Revocable Biometric Templates [7.4] 生体認証スキームは、個人がそのスキームの現在の登録を無効にできる場合、取り消し可能である。
現代のディープCNNの顔マッチングは、本質的には頑健な生体認証方式が可能であることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:09:04 GMT)
Including Semantic Information via Word Embeddings for Skeleton-based Action Recognition [7.4] 本稿では,単語の埋め込みを利用して意味情報をエンコードすることで,入力表現を豊かにするスケルトンに基づく行動認識手法を提案する。
本手法は, ワンホット符号化を意味ボリュームに置き換えることで, モデルが関節と物体間の有意義な関係を捉えることを可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:57:06 GMT)
ViDAR: Video Diffusion-Aware 4D Reconstruction From Monocular Inputs [7.4] 本稿では,新しい4D再構成フレームワークであるビデオ認識拡散再構成(ViDAR)を紹介する。
ViDARは、単分子の曖昧さによって導入された人工物を緩和しながら、きめ細かな外観の詳細を回復する。
極端な視点の変化を伴う挑戦的なベンチマークであるDyCheckの実験は、ViDARがすべての最先端ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:01:15 GMT)
How Robust is Model Editing after Fine-Tuning? An Empirical Study on Text-to-Image Diffusion Models [7.3] T2I拡散モデルにおけるモデル編集と微調整の相互作用について検討する。
編集が微調整によって継続できないのは、微調整が具体的あるいは無関係である場合であってもである。
これらの発見は、デプロイされたAIシステムの信頼性の高い長期的な制御とアライメントを保証するための、より堅牢な技術の必要性を強調している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:10:29 GMT)
Normality Prior Guided Multi-Semantic Fusion Network for Unsupervised Image Anomaly Detection [7.3] 教師なし異常検出のための新しい正規性事前誘導型マルチセマンティックフュージョンネットワークを提案する。
上記のマルチセマンティックな特徴を融合してデコーダへの入力として使用し、異常の復元を近似正規性に導く。
MVTec LOCO ADデータセット上でのSOTA性能は、ピクセルsPROが5.7%、イメージAUROCが2.6%向上している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:54:15 GMT)
MLLP-VRAIN UPV system for the IWSLT 2025 Simultaneous Speech Translation Translation task [7.2] 本研究は,IWSLT 2025 同時音声翻訳トラックの共有作業におけるMLLP-VRAIN研究グループの参加について述べる。
本論文は, 長期音声のリアルタイム翻訳における特異な課題を, モジュラーカスケードシステムの構築によって解決するものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:44:01 GMT)
The Open Proof Corpus: A Large-Scale Study of LLM-Generated Mathematical Proofs [7.2] 提案するOpen Proof Corpus(OPC, Open Proof Corpus)は, 最先端のLLMによって生成される5000以上の人的評価された証明からなるデータセットである。
OPCは、証明生成研究における幅広い適用性と下流利用のために特別に設計された。
本研究では,(1)自然言語と形式的証明生成のパフォーマンスギャップ,(2)最終回答精度と完全正当性との相違,(3)証明品質に対する最良選択の影響について考察する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:31:58 GMT)
Trustworthy Prediction with Gaussian Process Knowledge Scores [7.1] 確率モデルは、観測できないデータ空間の領域で予測するためにしばしば使用される。
本研究では,観測データによって予測の不確実性が低下した程度を定量化する予測のための知識スコアを提案する。
我々は,GPRモデルからの予測が正確である場合に,知識スコアが予測できることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:36:06 GMT)
Black-Box Test Code Fault Localization Driven by Large Language Models and Execution Estimation [7.0] システムテストコードの欠陥ローカライゼーションのための,完全に静的なLLM駆動型アプローチを提案する。
私たちのメソッドは、テストの実行トレースを推定するために、単一障害実行ログを使用します。
事故事例の工業的データセットを用いて, 機能, ブロック, ラインレベルの評価を行った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:04:51 GMT)
Harmony: A Joint Self-Supervised and Weakly-Supervised Framework for Learning General Purpose Visual Representations [7.0] 本稿では,視覚言語学習と差別的・生成的自己スーパービジョンを組み合わせたフレームワークであるHarmonyを紹介する。
本フレームワークは,自己教師型学習パスにおけるネガティブな例に頼らず,Webスクラッドデータに特化して動作するように設計されている。
様々な視覚的下流タスクにおけるハーモニーの評価を行い、ベースラインCLIPを著しく上回ります。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:13:37 GMT)
ReDit: Reward Dithering for Improved LLM Policy Optimization [6.8] DeepSeek-R1は、ルールベースの報酬システムを通じて、LLM(Large Language Model)推論機能の拡張に成功した。
報酬のハッキングを効果的に軽減する「完璧な」報酬システムであるが、そのような報酬機能はしばしば離散的である。
本稿では、単純なランダムノイズを加えることで離散的な報酬信号をディザリングするReDit(Reward Dithering)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:36:24 GMT)
Prompt, Translate, Fine-Tune, Re-Initialize, or Instruction-Tune? Adapting LLMs for In-Context Learning in Low-Resource Languages [6.8] この研究は、5つの多様なターゲット言語、3つのベースLLM、7つの下流タスク、4,100GPUトレーニング時間(9,900以上のTFLOP)にまたがる。
以上の結果から,数発のプロンプトと翻訳テストの設定は勾配に基づく適応法よりも優れる傾向が示唆された。
我々の知る限り、この研究は、列車計算と考慮された適応手法の数に関して、低リソース言語における文脈内学習における最大の研究である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:22:11 GMT)
RareSpot: Spotting Small and Rare Wildlife in Aerial Imagery with Multi-Scale Consistency and Context-Aware Augmentation [6.8] RareSpotは、マルチスケールの一貫性学習とコンテキスト認識強化を統合した堅牢な検出フレームワークである。
提案手法は最先端性能を実現し,ベースライン法と比較して検出精度を35%以上向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:03:43 GMT)
Numerical simulation of the false vacuum decay at finite temperature [6.7] 経路積分による偽真空の減衰率を数値計算する。
熱ゆらぎのシナリオに対する減衰速度とそのポテンシャル形状への依存性について検討した。
シミュレーション結果と有限温度有効場理論の理論的予測との相違が観察された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:29:45 GMT)
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition [6.5] サンプル空間の概念を導入し,LiDARを用いた位置認識のための新しいサンプリング手法を提案する。
このアプローチは、さまざまなデータセット間で堅牢なパフォーマンスを示し、屋内シナリオから屋外シナリオへのシームレスな適応を可能にします。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:17:11 GMT)
Frequency-Domain Fusion Transformer for Image Inpainting [6.4] 本稿では,周波数領域融合を取り入れたトランスフォーマーによる画像描画手法を提案する。
実験により,提案手法は高周波数情報を保存することにより,画像の塗装品質を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:19:04 GMT)
Context-Aware CodeLLM Eviction for AI-assisted Coding [6.2] Code Large Language Models (CodeLLMs) を利用したAI支援コーディングツールは、現代のソフトウェア開発にますます統合されている。
プライバシやレイテンシ、モデルのカスタマイズに関する懸念に対処するため、多くの企業は、これらのモデルをセルフホストすることにしました。
本稿では,リソース制約下での自己ホスト型CodeLLMの最適化に特化して設計された,コンテキスト対応モデル消去戦略であるCACEを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:03:32 GMT)
LOGICPO: Efficient Translation of NL-based Logical Problems to FOL using LLMs and Preference Optimization [6.2] 本稿では、選好最適化データセットにファインタニングを用いて、自然言語問題全体を一貫した論理プログラムに解析し、表現することを提案する。
Phi-3.5による最良のモデルでは、GPT-3.5-turboよりも10%精度が高く、構文エラーが14%少ない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:15:24 GMT)
Noise2Score3D: Tweedie's Approach for Unsupervised Point Cloud Denoising [6.1] ノイズ2Score3Dはノイズデータから直接基礎となる点雲分布のスコア関数を学習する。
本手法は,既存の教師なし手法の反復処理を回避するため,単一ステップでデノナイズを行う。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:47:30 GMT)
Personalized News Recommendation with Multi-granularity Candidate-aware User Modeling [6.1] 本研究では,マルチグラニュラリティ候補を考慮したユーザモデリングフレームワークを提案する。
候補ニュースエンコーディングとユーザモデリングの2つの主要コンポーネントで構成されている。
実世界のデータセットの実験では、提案モデルがベースラインモデルを大幅に上回ることを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:47:42 GMT)
USVTrack: USV-Based 4D Radar-Camera Tracking Dataset for Autonomous Driving in Inland Waterways [6.1] 我々は,水上輸送システムにおける自律走行に適した,最初の4Dレーダーカメラ追跡データセットであるUSVTrackを紹介する。
本稿では,RCMと呼ばれる簡易かつ効果的なレーダカメラマッチング手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:13:57 GMT)
FREQuency ATTribution: Benchmarking Frequency-based Occlusion for Time Series Data [5.8] FreqATTは、ポストホックネットワークが時系列解析を解釈できるフレームワークである。
本稿では、周波数領域における解析が、既存の手法よりも入力信号の関連領域のみを強調できることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:34:44 GMT)
Open Set Recognition for Endoscopic Image Classification: A Deep Learning Approach on the Kvasir Dataset [5.8] ResNet-50、Swin Transformer、ハイブリッドResNet-Transformerモデルなど、いくつかの代表的なディープラーニングアーキテクチャのOSR機能をクローズドセットおよびオープンセット条件下で評価・比較する。
この研究は、Kvasirデータセットにオープンセット認識を適用するための最初の取り組みの1つであり、医療画像解析においてOSRのパフォーマンスを評価するためのベンチマークを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:39:07 GMT)
jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval [5.8] テキストと画像表現を統一するマルチモーダル埋め込みモデルであるjina-embeddings-v4を導入する。
このモデルにはタスク固有のローランド適応(LoRA)アダプタが組み込まれ、さまざまな検索シナリオのパフォーマンスを最適化する。
また、この機能の評価を容易にするために、視覚的にリッチな画像検索に特化した新しいベンチマークであるJina-VDRを導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:55 GMT)
Latent Space Analysis for Melanoma Prevention [5.4] メラノーマは重要な健康リスクであり、早期に解釈可能な診断ツールの必要性を強調している。
この研究は、分類を超えた新しいアプローチを導入し、解釈可能なリスクモデリングを可能にした。
提案手法は, 病変間の意味的関係を捉える構造的潜在空間を学習し, 形態的差異の連続的評価を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:49:57 GMT)
Predictive Analytics for Collaborators Answers, Code Quality, and Dropout on Stack Overflow [5.4] 予測モデルの開発にStack Overflowを使用した以前の研究では、しばしば3-5モデルの限られたベンチマークや任意の選択方法が採用されていた。
本研究は,ユーザが回答する可能性のある質問数,コード品質違反,ドロップアウト状況など,3つのタスクにまたがる21のアルゴリズムを評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:23:12 GMT)
T-CPDL: A Temporal Causal Probabilistic Description Logic for Developing Logic-RAG Agent [5.4] T-CPDL(Temporal Causal Probabilistic Description Logic)は、Description Logicを時間間隔演算子、明示的な因果関係、確率的アノテーションで拡張する統合フレームワークである。
T-CPDLは、言語モデル出力の推論精度、解釈可能性、信頼性校正を大幅に改善する。
この研究は、高度なLogic-Retrieval-Augmented Generation (Logic-RAG)フレームワークの開発の基礎となる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:11:15 GMT)
From RAG to Agentic: Validating Islamic-Medicine Responses with LLM Agents [5.4] アヴィチェンナの『医学のカノン』や預言的な『ティブ・エ・ナバウィ』のようなイスラム教のテキストは、予防医療、栄養、全体療法の富を符号化している。
既存の言語モデルベンチマークでは、事実のリコールやユーザの好みに焦点が当てられている。
そこで我々は,30個の予言・医学的質問を人為的な治療と一致させる統合評価パイプラインTibbe-AGを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:12:38 GMT)
MARL-MambaContour: Unleashing Multi-Agent Deep Reinforcement Learning for Active Contour Optimization in Medical Image Segmentation [5.4] MARL(Multi-Agent Reinforcement Learning)に基づく最初の輪郭型医用画像分割フレームワークであるMARL-MambaContourを紹介する。
提案手法は,位相的に一貫したオブジェクトレベルの輪郭を生成することに焦点を当てたマルチエージェント協調タスクとしてセグメンテーションを再構成する。
5つの多様な医用画像データセットの実験は、MARL-MambaContourの最先端性能を示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:22:49 GMT)
Can boundary configuration be tuned to optimize directional quantum steering harvesting? [5.4] 真空無質量スカラー場と局所的に相互作用する2つの静的検出器間の量子ステアリングの収穫について検討した。
検出器と境界の間の距離が増加すると、境界は一方の方向の量子ステアリングを抑制し、他方の方向の量子ステアリングを増強する傾向にある。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:11:41 GMT)
A Question Bank to Assess AI Inclusivity: Mapping out the Journey from Diversity Errors to Inclusion Excellence [5.4] 本稿では,AIの傾きを評価するために設計された253の質問からなる,構造化されたAI傾き質問銀行を紹介する。
質問銀行の開発には、文献レビューやD&Iガイドライン、責任あるAIフレームワークからの洞察を取り入れた、反復的なマルチソースアプローチが含まれていた。
シミュレーション評価は、異なるAIジョブに関連する70のAI生成ペルソナを用いて実施され、質問銀行のAIインクリビティとの関連性と有効性を評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:48:38 GMT)
Catastrophic Forgetting Mitigation via Discrepancy-Weighted Experience Replay [5.3] トラフィック監視のためのクラウドエッジ協調オブジェクト検出におけるエッジモデルの継続的な適応は、破滅的な忘れに悩まされる。
本稿では,適応的な経験リプレイに基づくエッジモデル更新アルゴリズムER-EMUを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:11:50 GMT)
TranslationCorrect: A Unified Framework for Machine Translation Post-Editing with Predictive Error Assistance [5.3] 機械翻訳(MT)後編集と研究データ収集は、しばしば非効率な翻訳に頼っている。
本稿ではこれらのタスクを合理化するための統合フレームワークであるTranslationCorrectを紹介する。
NLLBのようなモデルを使ったMT生成、XCOMETやLLM APIのようなモデルを使った自動エラー予測(詳細な推論を提供する)、単一環境における直感的な後編集インターフェースを組み合わせたものだ。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:38:49 GMT)
TRAIL: Trace Reasoning and Agentic Issue Localization [5.0] この研究は、エージェントワークフロートレースに対する堅牢でダイナミックな評価方法の必要性を明確に示している。
我々は,この分類法を用いて構築され,確立されたエージェント・ベンチマークに基づいて構築された148個の大型人名跡(TRAIL)について述べる。
生態学的妥当性を確保するため,単一エージェントシステムとマルチエージェントシステムの両方のトレースをキュレートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:06:11 GMT)
CDI: Copyrighted Data Identification in Diffusion Models [4.9] 拡散モデル(DM)は、トレーニングのための大規模で多様なデータセットの恩恵を受ける。
このデータは、データ所有者の許可なくインターネットから取り除かれることが多いため、著作権や知的財産権保護に関する懸念が高まる。
我々は、データ所有者がデータセットを使用してDMをトレーニングするかどうかを特定するためのフレームワークであるCDIを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:31:25 GMT)
LIGHTHOUSE: Fast and precise distance to shoreline calculations from anywhere on earth [4.8] 我々はAnywhere on Earth(AoE)から高速で効率的な沿岸距離計算のための新しいデータセットとアルゴリズムを導入する。
既存のデータよりも100倍以上の精度で,グローバルな海岸線データセットを10mの解像度で提供します。
このような規模でクエリを行う際の計算的課題に対処するため,我々は新しいライブラリを新たに導入する: 階層的階層的階層的テライン指向統一検索エンジン(Lighthouse)。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:00:34 GMT)
A Multi-view Divergence-Convergence Feature Augmentation Framework for Drug-related Microbes Prediction [4.7] 薬物関連微生物予測(DCFA_DMP)のための多様性収束機能拡張フレームワークを提案する。
発散相において、DCFA_DMPは異種情報と類似情報との相補性と多様性を強化する。
収束段階において、異なる視点間の相補的特徴を深く相乗化するために、二方向性相乗的注意機構が提案されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:03:46 GMT)
A Rigorous Evaluation of LLM Data Generation Strategies for Low-Resource Languages [4.7] 大規模言語モデル(LLM)は、より小さな専門的なモデルを訓練するための合成テキストデータを生成するために、ますます使われている。
本稿では,11言語にまたがる生成戦略とその組み合わせの性能を評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:52:34 GMT)
NovelHopQA: Diagnosing Multi-Hop Reasoning Failures in Long Narrative Contexts [4.7] NovelHopQAは、83の長編小説から64k-128k区切り抜かれた抜粋に対して、1-4ホップQAを評価する最初のベンチマークである。
キーワード誘導パイプラインは、コヒーレントなストーリーラインに接したホップトケンチェーンを構築する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:41:05 GMT)
From Minimax Optimal Importance Sampling to Uniformly Ergodic Importance-tempered MCMC [4.7] 我々は、重要サンプリングスキームの使用に関して、密接に関連する2つの理論的貢献を行う。
まず、目標分布に1/2$以上の確率の原子が存在しない場合に限って、目標値と最小値の試行分布が最適であることを証明する。
第二に、定常分布を保ちながらメトロポリス-ハスティングスアルゴリズムを実行することは、しばしば有利であると主張する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:05:06 GMT)
Local Averaging Accurately Distills Manifold Structure From Noisy Data [4.6] 局所平均化(Local averaging)は、多様体のフィッティングとデノイングのための最先端の証明可能な手法の基盤である。
本稿では,$d$次元多様体から得られた雑音サンプルに対して,2ラウンドの局所平均化法について理論的に解析する。
提案手法は,低雑音環境向けに設計された幅広い証明可能な手法の事前処理ステップとして機能する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:32:16 GMT)
Detecting Collective Excitations in Self-Gravitating Bose-Einstein Condensates via Faraday Waves [4.6] 我々は、ボース=アインシュタイン凝縮体における集合励起のプローブとしてファラデー波を提案する。
我々は,SGBEC内のファラデー波の形成とダイナミクスを数値シミュレーションし,消散の影響を考察した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:53:45 GMT)
Ground tracking for improved landmine detection in a GPR system [4.6] GPRデータに存在するグラウンドバウンス(GB)は干渉の主な原因である。
カルマンフィルタ (KF) と粒子フィルタ (PF) を併用したGB追跡アルゴリズムを提案する。
我々は,GB追跡の改善が地雷検出問題の性能向上に寄与することが実証された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:06:55 GMT)
A Study of Dynamic Stock Relationship Modeling and S&P500 Price Forecasting Based on Differential Graph Transformer [4.6] 動的関係モデリングと価格予測のための差分グラフ変換器フレームワークを提案する。
我々のDGTは連続的なグラフ構造の変化を多面的自己認識に統合する。
クローサル時間的注意は、価格シーケンスのグローバル/ローカル依存関係をキャプチャする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:53:31 GMT)
Confucius3-Math: A Lightweight High-Performance Reasoning LLM for Chinese K-12 Mathematics Learning [4.6] Confucius3-Mathは,1つのコンシューマグレードGPU上で効率的に動作する14Bパラメータを備えた,オープンソースの大規模言語モデルである。
このレポートでは、開発レシピ、直面する課題、それらを克服するために開発するテクニックを共有します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:23:53 GMT)
Lemmanaid: Neuro-Symbolic Lemma Conjecturing [4.6] レマナイド(Lemmanaid)は、実用的な神経象徴性レムマ注射器具である。
LLM(Large Language Models)とシンボリックメソッドを組み合わせる。
我々はIsabelle証明アシスタントの証明ライブラリ上で評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:21:10 GMT)
Piloting Copilot, Codex, and StarCoder2: Hot Temperature, Cold Prompts, or Black Magic? [4.6] 入力変動が言語モデルの2つの構成に与える影響について検討する。
我々は、これらの入力を修正して、3つのLCMベースのコードアシスタントと2つのベンチマークに適用する特定の演算子を設計する。
この結果から,入力パラメータの変動により性能が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:31:33 GMT)
A Comprehensive Survey on Network Traffic Synthesis: From Statistical Models to Deep Learning [4.6] 合成ネットワークトラフィック生成は、ネットワーク領域における様々なデータ駆動アプリケーションのための有望な代替手段として登場した。
これは、データ不足、プライバシーの懸念、および実際のデータに関連する純粋性制約といった重要な課題に対処しながら、現実世界の特徴を保存する合成データの作成を可能にする。
この調査は、研究者や実践者の基盤資源として機能し、既存の手法、課題、および合成ネットワークトラフィック生成の機会に関する構造化された分析を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:08:18 GMT)
Area laws and tensor networks for maximally mixed ground states [4.5] 一般ハミルトニアンの地上空間において、最大混合状態$Omega$の相互情報に地域法則を示す。
類似性は、2次元フラストレーションのない局所的ハミルトン多様体の相互情報から導かれる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:31:33 GMT)
Spatial Regionalization: A Hybrid Quantum Computing Approach [4.5] 本稿では,空間的局所化に量子古典法を導入し,この問題を管理可能なサブプロブレムに分解する。
最初の結果から,空間的局所化問題とその変種に対する有望な量子性能の利点が示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:04:05 GMT)
ADNF-Clustering: An Adaptive and Dynamic Neuro-Fuzzy Clustering for Leukemia Prediction [4.4] 本稿では、畳み込みニューラルネットワークに基づく特徴抽出とオンラインファジィクラスタリングエンジンを組み合わせた、新しいストリーミング対応フレームワークであるAdaptive and Dynamic Neuro-Fuzzy Clusteringを紹介する。
C-NMC 白血病顕微鏡データセットでは, シルエットスコア0.51を達成し, 静的塩基性よりも優れた凝集度と分離性を示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:30:17 GMT)
Benchmarking the Pedagogical Knowledge of Large Language Models [4.4] 本稿では,その教育的知識に基づいて,大規模言語モデルを評価するための新しいデータセットであるThe Pedagogy Benchmarkを紹介する。
これらのベンチマークは、教師のための専門的開発試験から得られた、慎重にキュレートされた質問に基づいて構築されている。
本報告では, 教育的知識に関する質問に対して, 精度が28%から89%の範囲で, 97モデルの結果を報告する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:49:01 GMT)
FairCauseSyn: Towards Causally Fair LLM-Augmented Synthetic Data Generation [4.4] 合成データ生成は、生成モデルを用いて実世界のデータに基づいてデータを生成する。
実世界の健康データを用いて因果フェアネスを高めるために,初めてLLMを付加した合成データ生成法を開発した。
因果的公正予測器で訓練すると、合成データは実際のデータと比較して感度属性のバイアスを70%削減する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:59:26 GMT)
Rapeseed population point cloud completion network (RP-PCN) with dynamic graph convolution for 3D reconstruction of crop canopy occlusion architecture [4.4] そこで本研究では,シードからシリドステージまでのラピス個体群を3次元再構成するための点雲補完モデルを提案する。
仮想現実統合(VRI)シミュレーション手法を用いて,完全点クラウド生成フレームワークを開発した。
群落の完全点雲から建築指標を用いて収量を予測することにより, 点雲完成の有効性を検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:02:31 GMT)
Language Models Might Not Understand You: Evaluating Theory of Mind via Story Prompting [4.4] $textttStorySim$は、ストーリーを合成的に生成するためのプログラム可能なフレームワークである。
これは、非常に制御可能な$textttStoryboard$でアンカーされる、新規で構成的なストーリープロンプトを生成する。
われわれのフレームワークは、記事の以前の出来事に対する信頼度と傾向バイアスの証拠を見つけるのに役立った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:06:53 GMT)
Enhancing Image Restoration Transformer via Adaptive Translation Equivariance [4.3] 本研究では,各問合せのキー値対を効率よく選択する適応的スライディングインデックス機構を開発し,これをグローバルに集約したキー値対と並列に一般化する。
その結果、有効性、訓練収束性、一般化の点において、その優位性を強調した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:23:04 GMT)
Emergent deterministic entanglement dynamics in monitored infinite-range bosonic systems [4.3] 単一観測軌道に沿った量子揺らぎは、量子ジャンプと状態拡散の双方に決定論的限界を持つことを示す。
特に、運動方程式の階層構造は、絡み合い相転移と散逸相転移の一致を説明する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:31:54 GMT)
Machines and Mathematical Mutations: Using GNNs to Characterize Quiver Mutation Classes [4.2] グラフニューラルネットワークを使って、あるクイバーを別のクイバーに変換する操作である、Emphquiverの突然変異を調査します。
クラスター代数の研究において、置換同値性の問題は基本的な関心事である。
我々のモデルは、既知の基準を$D$から再構築できるように、その隠された表現内で構造をキャプチャすることを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:44:29 GMT)
Temporal Neural Cellular Automata: Application to modeling of contrast enhancement in breast MRI [4.2] 合成コントラスト増強は、高速な画像取得を可能にし、コントラスト剤の静脈内注入を不要にする。
最近の研究は、合成コントラスト生成の可能性を示している。
現在のSOTA(State-of-the-art)法は、一貫した時間的進化のための十分な尺度を欠いている。
我々は,NACを拡張・改良し,時間的に疎い非均一な画像データを効果的にモデル化するTeNCAを紹介した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:56:45 GMT)
2D Triangle Splatting for Direct Differentiable Mesh Training [4.2] 2DTS(2D Triangle Splatting)は、3次元ガウス原始体を2次元三角形のフェーレットに置き換える新しい方法である。
三角形プリミティブにコンパクト性パラメータを組み込むことで、光現実性メッシュの直接訓練を可能にする。
提案手法は,既存のメッシュ再構成手法と比較して,視覚的品質の優れた再構成メッシュを生成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:26:47 GMT)
Partitioning the electronic wave function using deep variational Monte Carlo [4.1] 本稿では,モンテカルロの深層学習とアンスアッツを融合した新しい波動関数分割法を提案する。
我々のアンゼは、曲線、双極子モーメント、反応エネルギー、電離エネルギー、原子サイズなどの基礎となる物理と化学的性質を正確に再現する。
WFの中核部分は、異なる分子とそれらのジオメトリー間でほぼ一定であり、より複雑なシステムのWFにおける中核部分の移動と再利用を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:26:41 GMT)
Fundamental Scaling Limit in Critical Quantum Metrology [3.9] 系の位相空間軌跡の巻線数は、量子フィッシャー情報のスケーリング境界を決定する。
量子フィッシャー情報の指数的スケーリングが得られ、そのためには総進化時間で巻数を増やす必要があることを実証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:01:58 GMT)
Towards Provable (In)Secure Model Weight Release Schemes [3.9] 最近のセキュアなウェイトリリーススキームは、モデルのオーナシップを保護し、誤用を防止しながら、オープンソースのモデル配布を可能にすると主張している。
これらのアプローチには厳格なセキュリティ基盤がなく、非公式なセキュリティ保証のみを提供する。
暗号の確立された研究に触発されて、いくつかの具体的なセキュリティ定義を導入することで、ウェイトリリーススキームのセキュリティを形式化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:57:41 GMT)
Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics [3.9] 構造化状態空間モデリングをKAN(Kolmogorov-Arnold Network)と統合する新しいフレームワークを提案する。
SKANODEは、構造化されたNeural ODEフレームワーク内で、完全にトレーニング可能なkanをユニバーサル関数近似器として使用し、仮想センシングを行う。
我々はkanのシンボリック回帰機能を利用して、システムの制御力学のコンパクトで解釈可能な表現を抽出する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:42:43 GMT)
Blameless Users in a Clean Room: Defining Copyright Protection for Generative Models [3.9] 近距離アクセス自由度(NAF)だけでは侵害を防げないことを示す。
意味のある保証を定義するために、非難なしコピー保護フレームワークを導入します。
差分プライバシーと著作権に関する一般的な直観は,データセットが黄金である場合に,DPがクリーンルームコピー保護を意味することを証明することによって定式化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:46:51 GMT)
Multimode Bosonic State Tomography with Single-Shot Joint Parity Measurement of a Trapped Ion [3.9] 捕捉されたイオンのフォノン状態のジョイントパリティの直接単発測定を用いて、連続可変量子状態の再構成を行う新しいスキームを実証する。
単発継手パリティ測定はパリティフリップ誤りをリアルタイムで検出できることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:58:15 GMT)
Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings [3.9] 完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
膜環境におけるヒトドーパミンD2受容体の2マイクロ秒MD軌道であるD2R-MDを用いて、シーケンシャルおよび残基ベースプール戦略は、高い構造的忠実度で参照アンサンブルを再現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:56:39 GMT)
VRAIL: Vectorized Reward-based Attribution for Interpretable Learning [3.8] VRAILは、状態特徴から解釈可能な重み表現を学ぶ、価値に基づく強化学習(RL)のためのフレームワークである。
VRAILは、状態特徴を用いた推定値関数に適合する深層学習(DL)ステージと、これを用いて潜在ベース報酬変換による学習を形作るRLステージの2段階で構成されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:33:03 GMT)
Bloch Vector Assertions for Debugging Quantum Programs [3.8] Bloqはスケーラブルで自動化された障害ローカライゼーションアプローチである。
量子アルゴリズムからアサーションスキームを自動的に生成するBloqのコンポーネントであるAutoBloqを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:53:02 GMT)
Factual Knowledge in Language Models: Robustness and Anomalies under Simple Temporal Context Variations [3.7] 本稿では,事実知識における時間的文脈の変化に対する言語モデルの堅牢性について考察する。
LMが時間的文脈と特定の期間に有効な過去の事実を正しく関連付けることができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:49:40 GMT)
Asymptotic convexity of wide and shallow neural networks [3.7] ネットワークパラメータの関数としての入力出力マップのエピグラフは、凸関数のエピグラフを正確に近似することを示す。
これにより、観察された優れたパフォーマンスについて、もっともらしい説明が導かれる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:26:14 GMT)
Online high-precision prediction method for injection molding product weight by integrating time series/non-time series mixed features and feature attention mechanism [3.6] 本研究では,MFA-ANN(Mixed Feature attention-artificial Neural Network)モデルを提案する。
その結果, MFA-ANN モデルでは 0.5g の重量変動耐性を持つ 0.0281 のRMSE が達成され, 従来のベンチマークより優れていた。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:40:50 GMT)
A Multi-Scale Spatial Attention-Based Zero-Shot Learning Framework for Low-Light Image Enhancement [3.6] LucentVisionNetは、低照度画像強調のための新しいゼロショット学習フレームワークである。
我々のフレームワークは、高い視覚的品質、構造的整合性、計算効率を実現する。
モバイル写真、監視、自律ナビゲーションといった現実世界のアプリケーションにデプロイするのに適しています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:11:55 GMT)
Sharpening the Spear: Adaptive Expert-Guided Adversarial Attack Against DRL-based Autonomous Driving Policies [3.5] 深部強化学習(DRL)は自動運転のための有望なパラダイムとして浮上している。
DRLベースの政策は、敵の攻撃に対して非常に脆弱であり、現実世界の展開において深刻な安全リスクを生じさせる。
本稿では,攻撃政策訓練の安定性と効率性を両立させる適応的専門家誘導型敵攻撃法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:42:49 GMT)
Segment Anything for Satellite Imagery: A Strong Baseline and a Regional Dataset for Automatic Field Delineation [3.5] SAM(Segment Anything Model)に基づくフィールドデライン化のためのパイプラインを提案する。
本論文では,公開データセットの使用に加えて,補完的な地域データセットを取得する方法について述べる。
ERASとして知られる新しい地域データセットが公開されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:01:33 GMT)
Performance of diverse evaluation metrics in NLP-based assessment and text generation of consumer complaints [3.4] 本研究では, 消費者の安心度を評価する上で重要な意味的差異を効果的に認識する, 経験学習アルゴリズムを組み込むことによって, 課題に対処する。
本稿では,生成する逆数ネットワークのエキスパート評価を利用する合成データ生成手法について提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:26:38 GMT)
Standard Applicability Judgment and Cross-jurisdictional Reasoning: A RAG-based Framework for Medical Device Compliance [3.4] 自由テキストデバイス記述を前提として、キュレートされたコーパスから候補標準を抽出し、大規模言語モデルを用いて、管轄範囲固有の適用性を推定する。
我々は,専門家による標準マッピングを用いた医療機器記述の国際ベンチマークデータセットを構築し,検索専用,ゼロショット,ルールベースラインに対するシステム評価を行った。
提案手法は, 分類精度73%, トップ5検索リコール87%を達成し, 関連する規制基準の特定に有効であることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:04:58 GMT)
Thought Anchors: Which LLM Reasoning Steps Matter? [3.4] 大規模言語モデルの推論は、最近、多くの分野で最先端のパフォーマンスを達成した。
文レベルでの推論トレースの分析は、推論過程を理解するための有望なアプローチである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:28:45 GMT)
Multi-Scale Spectral Attention Module-based Hyperspectral Segmentation in Autonomous Driving Scenarios [3.4] 本稿では,スペクトル特徴抽出を強化したマルチスケール分光アテンションモジュール(MSAM)を提案する。
MSAMをUNetのスキップ接続(UNet-SC)に統合することにより,提案したUNet-MSAMはセマンティックセグメンテーション性能を大幅に改善する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:24:20 GMT)
TDACloud: Point Cloud Recognition Using Topological Data Analysis [3.4] 本稿では,点群から局所的な記述子抽出のための新しい手法TDACloudを提案する。
ボキセル化とは異なり,提案手法は原点雲を入力とし,固定サイズのTDAディスクリプタベクトルを出力する。
以上の結果から,雑音条件下での認識精度が向上し,大規模実世界の位置認識が可能となった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:59:39 GMT)
Audit & Repair: An Agentic Framework for Consistent Story Visualization in Text-to-Image Diffusion Models [3.3] 本稿では,マルチパネル・ストーリー・ビジュアライゼーションにおける不整合を自律的に識別し,修正し,洗練する,協調型マルチエージェント・フレームワークを提案する。
エージェントは反復ループで動作し、全シーケンスを生成せずに、きめ細かいパネルレベルの更新を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:29 GMT)
Attention-Based Ensemble Learning for Crop Classification Using Landsat 8-9 Fusion [3.3] 本研究は,中部パンジャブの灌水地域における作物被覆の同定に焦点をあてる。
データ収集は2つの段階で実行された。
第2段階では、ラベル付きデータセットを構築するために、各ジオコードフィールドのLandsat 8-9画像を取得する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:09:39 GMT)
BSMamba: Brightness and Semantic Modeling for Long-Range Interaction in Low-Light Image Enhancement [3.3] 現在の低照度画像強調法(LLIE)は、セマンティック一貫性、細部、計算効率を保ちながら、輝度を同時に改善する上で重要な制限に直面している。
BSMamba は,Brightness Mamba と Semantic Mamba の2つの特別に設計されたコンポーネントからなる新しい視覚的マンバアーキテクチャである。
BSMambaは、セマンティック一貫性を維持しながらLLIEで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:04:34 GMT)
Recipe for Discovery: A Framework for Systematic Open Source Project Identification [3.3] オープンソースソフトウェア開発は、特に大学や研究所のような機関内では、しばしば分散化され、追跡が困難である。
本稿では,分散システムにまたがるオープンソースプロジェクトの発見・分類・分析の課題について論じる。
カリフォルニア大学 (UC) を事例として, 機関関連リポジトリを体系的に同定する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:43:21 GMT)
MOSCARD -- Causal Reasoning and De-confounding for Multimodal Opportunistic Screening of Cardiovascular Adverse Events [3.2] MACE(Major Adverse Cardiovascular Events)は、2021年のGlobal Disease Studyで報告された、世界の死亡率の主要な原因である。
機会論的スクリーニングは、定期的な健康チェックから収集されたデータを活用し、マルチモーダルデータはリスクのある個人を特定する上で重要な役割を果たす。
そこで我々は,MOSCARD(MOSCARD, Multimodal causal reasoning with co-attention)という新たな予測モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:28:37 GMT)
Shift Happens: Mixture of Experts based Continual Adaptation in Federated Learning [3.1] フェデレートラーニング(FL)は、生データを共有することなく、分散クライアント間で協調的なモデルトレーニングを可能にする。
我々は,検出された分散シフトに応じて,特殊なグローバルモデルを作成し,訓練する専門家フレームワークのシフト対応ミックスであるShiftExを紹介する。
本研究では,5.5-12.9ポイントの精度向上と22-95%の適応率を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:59:21 GMT)
GANs vs. Diffusion Models for virtual staining with the HER2match dataset [3.1] HER2match データセットは、H&E と HER2 の両方で染色された同じ乳がん組織区間を持つ最初の公開データセットである。
以上の結果から,総じてGANはDMよりも優れた成績を示し,BBDMのみが同等の結果を示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:37:41 GMT)
Is There a Case for Conversation Optimized Tokenizers in Large Language Models? [3.0] 大規模言語モデル(LLM)の計算とエネルギーコストは、増大するモデルサイズによって指数関数的に増大している。
トークン化器はモデルの効率において重要な役割を担い、トレーニングコーパス内のテキストのトークン数を最小化するために慎重に最適化されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:18:46 GMT)
Learning High-Quality Latent Representations for Anomaly Detection and Signal Integrity Enhancement in High-Speed Signals [3.0] 本稿では,高速な動的ランダムアクセスメモリ信号における異常検出と信号整合性を改善するという2つの課題に対処する。
本稿では,自動エンコーダと分類器を統合して,より独特な潜在表現を学習する共同学習フレームワークを提案する。
本稿では,信号整合性を平均11.3%向上させる信号整合性向上アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:48:22 GMT)
ReFrame: Rectification Framework for Image Explaining Architectures [3.0] 画像説明中に認識される物体の不整合や不完全性を緩和する新しい手法を提案する。
本稿では,画像キャプチャ,視覚質問回答(VQA),PromptベースのAIなど,さまざまな画像説明フレームワーク上にプラグイン可能な解釈可能なフレームワークを提案する。
補正された説明の有効性を測定し,画像説明の不整合性および完全性の向上を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:58:09 GMT)
Enhancing Entity Aware Machine Translation with Multi-task Learning [3.0] 本稿では,エンティティ認識と機械翻訳という2つのサブタスクの性能を最適化するために,マルチタスク学習を適用する手法を提案する。
結果と分析は、SemEval 2025コンペティションのタスク2のオーガナイザが提供したデータセット上で行われる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:05:46 GMT)
The Anatomy of Speech Persuasion: Linguistic Shifts in LLM-Modified Speeches [2.9] 本研究は,大規模言語モデルが公用語における説得性の概念をどのように理解しているかを,音声書き起こしの修正によって検討する。
我々は, GPT-4oに, 説得力を高めるか低下させるよう促すとともに, 特徴量の観点から, オリジナル音声と生成された音声の言語的変化を解析する。
以上の結果から, GPT-4oは, 説得性を人間のように最適化するよりも, 体系的な形式的な修正を施すことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:28:33 GMT)
Tu(r)ning AI Green: Exploring Energy Efficiency Cascading with Orthogonal Optimizations [2.8] 本稿では, エネルギー効率を第一級市民として, 計算集約パイプラインの基本設計として扱うことを強調する。
5つのAIパイプラインフェーズ(データ、モデル、トレーニング、システム、推論)の戦略的選択によって、カスケード効率が向上することを示す。
組み合わせによってエネルギー消費は94.6ドル%まで減少し、最適化されていないパイプラインの元々のF1スコアの95.95ドル%を維持できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:52:08 GMT)
A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection [2.8] システム複雑性の増大により、ログベースの異常検出(LAD)のような自動ログ解析技術の必要性が高まっている。
現在の評価は主に検出精度に重点を置いているが、与えられたLADタスクに対するテクニックの適合性を決定するには不十分である。
本稿では,4つの基準にまたがる多種多様な教師付き,半教師付き,伝統的,深層ML手法を総合的な実証研究により評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:53:44 GMT)
DiffDesign: Controllable Diffusion with Meta Prior for Efficient Interior Design Generation [2.8] DiffDesignは、メタプリミティブを持つ制御可能な拡散モデルであり、効率的な内部設計生成を実現する。
具体的には,画像データセット上で事前学習した2次元拡散モデルの生成先行をレンダリングバックボーンとして利用する。
さらに、外観、ポーズ、サイズといったデザイン属性を横断的に制御し、視点整合性を強制する最適な転送ベースのアライメントモジュールを導入することで、デノナイジングプロセスをガイドする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:20:13 GMT)
Programming by Backprop: LLMs Acquire Reusable Algorithmic Abstractions During Code Training [2.7] ソースコード上での大規模言語モデル(LLM)のトレーニングは、その汎用推論能力を大幅に向上させる。
この効果の潜在的要因として,バックプロップ(PBB)によるプログラミングを提案する。
PBBは、自然発生したデータを反映した分布から引き出されたI/Oペアのトレーニングよりも、入力間でのプログラムの堅牢な評価につながることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:45:44 GMT)
Shape from Polarization of Thermal Emission and Reflection [2.7] 長波長赤外(LWIR)スペクトルにおける偏光の形状(SfP)技術を利用する。
我々は、放射と反射の複合効果を明示的に考慮した偏極モデルを定式化した。
我々はプロトタイプシステムを実装し、LWIR SfPのための最初の実世界のベンチマークデータセットであるThermoPolを開発した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:33:17 GMT)
Deterministic generation of frequency-bin-encoded microwave photons [2.7] 超伝導回路を用いたマイクロ波フォトニックモードの周波数ビン符号化法の実験的検討を行った。
我々は、その情報を異なる周波数で2つのフォトニックモードに同時に出力することで、超伝導量子ビットから量子情報を決定的に符号化する。
周波数ビン符号化フォトニックモードは、受信プロセッサで光子損失の発生を検出するために使用できる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:44:56 GMT)
Leveraging neural network interatomic potentials for a foundation model of chemistry [2.7] HackNIPは、事前訓練されたニューラルネットワークの原子間ポテンシャルを利用する2段階のパイプラインである。
まず、NIPファンデーションモデルから固定長特徴ベクトルを抽出し、次にこれらの埋め込みを使用して浅いMLモデルを訓練する。
本研究では、NIPのハッキングによるハイブリッド化アプローチが、エンドツーエンドのディープニューラルネットワークより優れているかどうかを検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:49:19 GMT)
Automatic Selection of Protections to Mitigate Risks Against Software Applications [2.6] 本稿では,MATEリスクを軽減するためのソフトウェア保護の自動選択手法を提案する。
保護決定に関わる重要な要素を定式化し,ゲーム理論モデルを用いて保護プロセスの枠組みを定式化する。
提案手法は,概念実証と専門家による評価によって検証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:11:23 GMT)
QISCIT: A validated concept inventory assessment for quantum information science [2.5] 量子情報科学(QIS)は、高度に教育された労働力を必要とする重要な学際分野である。
本稿では,QISCIT(Quantum Information Science Concept Introductory Test)と呼ばれる新しい評価尺度の体系的開発と内容検証について述べる。
11人のQIS専門家からのフィードバックを得て、量子状態、量子計測、量子ビット、絡み合い、コヒーレンスとデコヒーレンス、量子ゲートとコンピューティング、量子通信といった概念をカバーするQISCITの31itemバージョンを開発し、検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:22:33 GMT)
Advancing African-Accented Speech Recognition: Epistemic Uncertainty-Driven Data Selection for Generalizable ASR Models [2.5] 本稿では,アノテーションプロセスの自動化に不確実性を利用するマルチラウンド適応プロセスを提案する。
この手法はデータアノテーションを合理化し、モデルの不確実性に最も寄与するデータサンプルを戦略的に選択する。
以上の結果から,従来のベースラインよりも平均45%少ないデータを必要とする一方で,WERの相対的改善率は27%であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:16:54 GMT)
Exploring Efficient Quantification of Modeling Uncertainties with Differentiable Physics-Informed Machine Learning Architectures [2.4] モデリングの不確かさの定量化と伝播は、信頼性分析、堅牢な最適化、およびエンジニアリング設計と制御における他のモデルベースのアルゴリズムプロセスに不可欠である。
物理インフォームド・機械学習(PIML)手法は,近年,従来の計算モデリングや代理モデリング手法に代わる新しい手法として登場している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:32:20 GMT)
AlzheimerRAG: Multimodal Retrieval Augmented Generation for Clinical Use Cases using PubMed articles [2.4] AlzheimerRAG は、主に PubMed 論文からの Alzheimer's Disease case study に焦点を当てた、臨床応用のためのクロスモーダルRAG アプリケーションである。
実験の結果,BioASQやPubMedQAなどのベンチマークと比較して,ドメイン固有情報の検索・合成性能が向上した。
我々は、アルツハイマーRAGがヒトに不適切で幻覚率の低い精度で反応を生成できると推測する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:28:42 GMT)
Transformer World Model for Sample Efficient Multi-Agent Reinforcement Learning [2.4] 我々は、強化学習のための新しいトランスフォーマーベース世界モデルであるMulti-Agent Transformer World Model(MATWM)を提案する。
MATWMは、分散化された想像力フレームワークと半集中型の批評家とチームメイト予測モジュールを組み合わせる。
我々は,StarCraft Multi-Agent Challenge, PettingZoo, MeltingPotなど,幅広いベンチマークでMATWMを評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:47:17 GMT)
BrainSymphony: A Transformer-Driven Fusion of fMRI Time Series and Structural Connectivity [2.3] BrainSymphonyは、ニューロイメージングのための軽量でパラメータ効率の良い基礎モデルである。
かなり小さなパブリックデータセットで事前トレーニングされた状態で、最先端のパフォーマンスを実現する。
BrainSymphonyは、アーキテクチャを意識したマルチモーダルモデルがより大きなモデルを上回る可能性があることを証明している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:00:21 GMT)
Emergent Risk Awareness in Rational Agents under Resource Constraints [2.3] この研究は、生存圧力下で活動するAIエージェントの創発的行動の理解と解釈可能性を高めることを目的としている。
我々は、生存駆動の嗜好シフトの影響を定量化する理論的および経験的な結果を提供する。
リスク探索やリスク回避行動の出現を緩和するメカニズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:34:00 GMT)
AI-Facilitated Episodic Future Thinking For Adults with Obesity [2.3] エピソディック・フューチャー・シンキング(EFT)は、個人的な将来の出来事や経験を詳細に想像することを含む。
遅延割引を減らし、即時満足化を優先して遅延報酬を減らし、様々な不適応な健康行動における行動変化を促進する傾向にある。
GPT-4-Turbo大言語モデルを利用したAIチャットボットであるEFTeacherを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:56:13 GMT)
Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning [2.2] 我々は、置換不変の知覚処理を備えたニューラルアーキテクチャを導入した以前の作業に基づいて構築した。
鍵ベクトルに非線形変換を適用する改良されたアテンション機構を提案する。
本モデルは,ベースラインと同等の性能を維持しつつ,はるかに高速な収束とトレーニング効率の向上を実現している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:46:29 GMT)
Lightweight RGB-T Tracking with Mobile Vision Transformers [2.2] モバイルビジョン変換器(MobileViT)に基づく新しい軽量RGB-Tトラッキングアルゴリズムを提案する。
最先端のマルチモーダルトラッカーと比較して,本モデルではパラメータ数を大幅に削減しつつ,同等の精度を実現している。
本稿では,RGB-TトラッキングとマルチモーダルトラッキングにMobile Vision Transformerを用いたトラッカーを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:46:22 GMT)
Dual-level Behavioral Consistency for Inter-group and Intra-group Coordination in Multi-Agent Systems [2.2] 本稿では,グループ内およびグループ間の両方でエージェントの挙動を明示的に制御する新しいMARL制御法であるDual-Level Behavioral Consistency (DLBC)を紹介する。
DLBCはエージェントを異なるグループに分割し、これらのグループ内とグループ間の行動の多様性を動的に調節する。
様々なグループ連携シナリオにおける実験結果から,DLBCはグループ間協調性能とグループ間タスク専門化の両方を著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:54:34 GMT)
Thermalization of Quantum Many-Body Scars in Kinetically Constrained Systems [2.2] そこで本研究では,QMBSモデルの熱特性を記述するために,グランド・カノニカル・アンサンブルに基づく新しい記述を導入する。
我々の研究は、制約による非エルゴディディティと熱化パラダイムの基本的な緊張を解消する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:32:47 GMT)
Existence of a robust optimal control process for efficient measurements in a two-qubit system [2.2] 2ビット系の初期状態を指定された最終状態に駆動するユニタリ変換の存在を示す。
1つの測定で2量子系の絡み合いを決定できる最適制御法を見つける。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:50:24 GMT)
Soft decision trees for survival analysis [2.2] 本稿では,各分岐ノードにソフトスプリッティングルールを付加した新しい生存木モデル(SST)を提案する。
SSTとトレーニング定式化は、柔軟性と解釈可能性を組み合わせたものである。
SSTは4つの広く使用されている差別と校正の指標で3つのベンチマークサバイバルツリーを上回っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:06:25 GMT)
Bias vs Bias -- Dawn of Justice: A Fair Fight in Recommendation Systems [2.1] 本稿では,各カテゴリーの偏見を緩和するフェアネス・アウェア・リグレード・アプローチを提案する。
このアプローチは、性別、年齢、職業など、複数のセンシティブな属性に対するバイアスを軽減することができることを示す。
以上の結果から,この手法が社会的偏見の緩和にどのように役立つかが示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:19:02 GMT)
Rethinking Decoder Design: Improving Biomarker Segmentation Using Depth-to-Space Restoration and Residual Linear Attention [2.1] マルチスケールのローカル・グローバル・コンテクスト情報と新しいデコーダ設計を実現するアーキテクチャを提案する。
本手法は,MoNuSegが2.76%,DSBが3.12%,Electron Microscopyが2.87%,TNBCが4.03%という絶対的な性能向上を達成した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:32:36 GMT)
A generalized neural tangent kernel for surrogate gradient learning [2.0] 我々は、代理勾配学習(SGL)の分析を可能にする、ニューラルタンジェントカーネル(NTK)の一般化を提供する。
符号アクティベーション関数と有限幅のネットワークにおけるSGLを、サロゲート勾配NTKと比較して数値的に比較する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:54:50 GMT)
Anatomical basis of sex differences in the electrocardiogram identified by three-dimensional torso-heart imaging reconstruction pipeline [2.0] 女性では脳梗塞後のMI診断の欠如や合併症の頻度が高い。
ポストMI女性の場合、心臓は男性よりも後方と垂直に位置する。
女性のSTj振幅の低下は、より小さな心室と結びついている。
後MI, T波振幅, R軸偏差は, 女性において, より後方, 水平の心位置と強く関連している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:13:48 GMT)
Inverse-and-Edit: Effective and Fast Image Editing by Cycle Consistency Models [1.9] 本研究では,一貫性モデルを用いた画像のインバージョンを改善する新しいフレームワークを提案する。
本手法では,再設計精度を大幅に向上するサイクル一貫性最適化手法を提案する。
さまざまな画像編集タスクやデータセットに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:34:43 GMT)
Benchmarking histopathology foundation models in a multi-center dataset for skin cancer subtyping [1.9] 大規模なドメイン内データセットの事前トレーニングは、履歴病理基盤モデル(FM)にタスクに依存しないデータ表現を学習する能力を与える。
計算病理学では、スライド全体の自動解析には、スライドのギガピクセルスケールのため、複数のインスタンス学習(MIL)フレームワークが必要である。
本研究は,MIL分類フレームワーク内のパッチレベルの特徴抽出器として,病理組織学的FMを評価するための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:12:16 GMT)
Tight Generalization Error Bounds for Stochastic Gradient Descent in Non-convex Learning [1.8] 本研究では、ディープネットワークにおける非有界データを保証するために、より厳密な項を確立するために、グラディエント・Descent(SGD)を使用できることを示す。
MNISTARはトレーニングおよび神経訓練におけるT2pm-SGDの有効性を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:47:25 GMT)
Enhancing Document Retrieval in COVID-19 Research: Leveraging Large Language Models for Hidden Relation Extraction [1.8] 本稿では,検索システムであるCovrelex-SEを用いて,より高品質な検索結果を提供する方法を提案する。
我々は,大言語モデル(LLM)のパワーを利用して,ラベルのない出版物内の隠れた関係を抽出した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:55:53 GMT)
Staining normalization in histopathology: Method benchmarking using multicenter dataset [1.8] ヘマトキシリンとエオシン(H&E)は、何十年にもわたって組織分析における金の標準であった。
この変異は、病理学者とAIベースの下流分析にとって課題となる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:37:40 GMT)
MFTCXplain: A Multilingual Benchmark Dataset for Evaluating the Moral Reasoning of LLMs through Hate Speech Multi-hop Explanation [1.8] 本稿では,Large Language Models (LLM) の道徳的推論を評価するためのベンチマークデータセットを提案する。
このデータセットは、ポルトガル語、イタリア語、ペルシア語、英語の3000のツイートで構成され、二進的ヘイトスピーチラベル、道徳カテゴリー、テキストスパンレベルの合理性で注釈付けされている。
実証的な結果は、道徳的推論タスクにおけるLLM出力と人間のアノテーションの相違を浮き彫りにする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:44:21 GMT)
Identifying Heterogeneity in Distributed Learning [1.7] 最小データ伝送量を用いた分散M推定における不均一パラメータ成分の同定法について検討する。
1つは再正規化されたWaldテストに基づいており、分散データブロックの数が$K$で最小ブロックのサンプルサイズより小さいオーダーである限り一貫性がある。
2つ目は、データブロック間の最大と最小のコンポーネント単位でのパラメータの差に基づく、極端なコントラストテスト(ECT)である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:08:58 GMT)
AutoPDL: Automatic Prompt Optimization for LLM Agents [1.7] 本稿では,大規模言語モデルのための優れたエージェント構成を見つけるための自動アプローチであるAutoPDLを提案する。
PDLプロンプト言語を用いた共通プロンプトパターンを実装したライブラリを提案する。
我々は、一貫性のある精度向上(9.06pm15.3$%ポイント)を68.9ppまで示し、選択したプロンプト戦略がモデルやタスクによって異なることを明らかにした。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:56:03 GMT)
Causal Decomposition Analysis with Synergistic Interventions: A Triply-Robust Machine Learning Approach to Addressing Multiple Dimensions of Social Disparities [1.7] 複数の因果分解因子を同時に対象とする因果分解解析法を開発した。
本手法を高等学校縦断学習生のコホートに適用する。
高い成績の学校に通う学生の割合を平等にし、人種集団間でアルジェブラIの入学率を9年生に等しくすることで、これらの格差を減らしうるかを検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:50 GMT)
What do professional software developers need to know to succeed in an age of Artificial Intelligence? [1.6] ジェネレーティブAIは、ソフトウェア開発者にとって生産性向上の初期の証拠を見せている。
我々は、AIの使用の最先端にいる21人の開発者による研究について述べ、彼らが発見した12の作業目標と75の関連するタスク、それぞれに関するスキルと知識をまとめています。
私たちは、成功するAI開発者になるためのスキルと知識が、4つのドメインにまとめられていることに気づきました。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:27:54 GMT)
3D Arena: An Open Platform for Generative 3D Evaluation [1.5] 3D Arenaは、ジェネレーティブ3Dモデルを評価するためのオープンプラットフォームである。
19の最先端モデルのうち8,096人のユーザーから123,243票を集めている。
我々は、この嗜好データの分析を通して、人間の嗜好パターンに対する洞察を示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:57:10 GMT)
Simulation-Based Sensitivity Analysis in Optimal Treatment Regimes and Causal Decomposition with Individualized Interventions [1.4] 我々は、未測定の共同創業者をシミュレートするシミュレーションベースの感度分析を拡張した。
本稿では,二元的リスク要因に対する省略共起の強さをベンチマークする形式的バウンディング戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:05:30 GMT)
Transversal Surface-Code Game Powered by Neutral Atoms [1.4] 我々は、中性原子を動力とするフォールトトレラント量子計算の理論と実験を橋渡しする包括的な理論的枠組みを開発する。
我々は中性原子配列のユニークな強度を利用する理論ゲートFTQCの代替的なゲームベースパラダイムを提案する。
我々は,中性原子の物理操作が桁違い遅くても,超伝導量子ビットに対するベースライン格子サージェリーアプローチと時空性能の競合が可能であることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:02 GMT)
Machine-learning based high-bandwidth magnetic sensing [1.4] ダイヤモンド中の窒素空孔(NV)色中心は、多用途、高感度、高空間分解能磁気センサを提供する。
スピン共鳴磁気センシング(NV量子センシング)の現在のスキームは、感度、ダイナミックレンジ、帯域幅に関連するトレードオフに悩まされている。
我々は,大規模なダイナミックレンジシナリオにおける感度/帯域トレードオフの観点から,NV磁気センサを強化するための機械学習ツールを実装した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:20:23 GMT)
AI-Enhanced Deliberative Democracy and the Future of the Collective Will [1.4] 我々は、AIベースの民主的イノベーションを、集団意志、センスメイキング、そして合意を求める合理的な表現のための発見ツールとして探求する。
同時に、我々は、バインディング決定の有効化、段階的なアンパックメントの促進、政治的成果の合理化など、危険な悪用に注意する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:23:49 GMT)
Eye of Judgement: Dissecting the Evaluation of Russian-speaking LLMs with POLLUX [1.3] POLLUXは、ロシア語で大規模言語モデル(LLM)の生成能力を評価するために設計されたベンチマークである。
各タスクタイプについて、一連の詳細な基準を定義し、スコアリングプロトコルを開発する。
これにより、従来のリソース消費による人的比較を超えて、透過的で基準駆動的な評価が可能になる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:01:31 GMT)
Failure Modes of Time Series Interpretability Algorithms for Critical Care Applications and Potential Solutions [1.3] 解釈可能性(interpretability)は、ディープラーニングモデルをクリティカルケアで整列し、デプロイする上で重要な役割を担います。
グラディエント、Occlusion、Permutationベースのメソッドは、時間によって異なるターゲット依存性と時間的スムーズさに悩まされることが多い。
この作業は、これらの障害モードを体系的に分析し、学習可能なマスクベースの解釈可能性フレームワークをサポートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:45:47 GMT)
Towards a hybrid 3D transmon qubit with topological insulator-based Josephson junctions [1.2] 超伝導体-トポロジカル絶縁体-超伝導体(S-TI-S)ジョセフソン接合を用いたトランスモン状量子ビットの実験的進展を報告する。
本稿では,S-TI-S接合の直流輸送からRF分光,完全回路QED制御,ハイブリッド量子ビットの測定に至るまで,ハイブリッドデバイスを系統的に特徴付ける設計を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:49:57 GMT)
EXPRTS: Exploring and Probing the Robustness ofTime Series Forecasting Models [1.2] 我々は時系列を生成するための解釈可能でシンプルなフレームワークを開発する。
本手法は時系列分解と解析関数を組み合わせることで,分布内データと分布外データの両方に一致する特性を持つ時系列を生成することができる。
私たちは、モデルロバスト性を改善するために、我々のフレームワークが意味のあるOOD時系列を生成する方法を示します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:29:58 GMT)
Multi-contrast laser endoscopy for in vivo gastrointestinal imaging [1.2] マルチコントラストレーザー内視鏡(MLE)は、高速スペクトル、コヒーレント、指向性照明を備えた広視野臨床画像撮影のためのプラットフォームである。
我々は,MLEの3つの機能として,マルチスペクトル回折反射による組織色調コントラストの増強,レーザースペックルコントラストイメージングによる血流の定量化,および光度ステレオを用いた粘膜トポグラフィーのキャラクタリゼーションを行った。
31ポリプのMLE画像は、白色光や狭帯域画像と比較して、コントラストがほぼ3倍改善し、色差が5倍改善した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:19:48 GMT)
Single-photon emission modeling with statistical estimators for the exponential distribution [1.2] 単一光子源は、センシングやイメージングから通信まで、多くの量子技術で使用されている。
単一光子放出過程を記述するための統計的枠組みを提案し,この現象を定量化するための指数分布推定器を実装した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:19:42 GMT)
Improving Student-AI Interaction Through Pedagogical Prompting: An Example in Computer Science Education [1.2] 大規模言語モデル(LLM)アプリケーションは、興奮と懸念の両方を引き起こした。
最近の研究は、LLMの誤用が学習の妨げとなることを一貫して強調している。
本研究の目的は,LLMの学習改善を効果的に促進する方法を学生に教えることである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:39:17 GMT)
Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology [1.1] 本研究では,H&E染色組織試料から高忠実度IHC画像を生成するための高度な深層学習に基づく画像翻訳フレームワークを提案する。
ピラミッドピクス2ピクセルの損失関数を修飾することにより、生成逆数ネットワーク(GAN)の基本的制限であるモード崩壊を緩和する。
特にHER2陽性 (IHC 3+) 画像の翻訳に優れており, 複雑な形態変化のため, 既存の手法では困難である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:57:22 GMT)
Cellular Automata as Generators of Interleaving Sequences [1.1] 本報告では,1次元セルオートマトンをインターリービング配列のジェネレータとして用いる。
本研究の目的は,細胞間配列を生成するセルオートマタの容量を探索することにより,現在の文学界における顕著なギャップを埋めることである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:07:27 GMT)
Dataset of Yul Contracts to Support Solidity Compiler Research [1.1] YulCodeは、約135,013のユニークなコントラクトを含む348,840のYulベースのスマートコントラクトインスタンスの包括的なコレクションを提供する。
これらのコントラクトは、メインネットにデプロイされたSolidityソースファイルのコンパイルによって生成される。
YulCodeは、機械学習アプリケーションに限らず、さまざまな研究開発タスクのための豊富な基盤を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:43:05 GMT)
Enhancing Security in LLM Applications: A Performance Evaluation of Early Detection Systems [1.0] 迅速なインジェクション攻撃では、攻撃者はシステム命令を悪意を持って操作し、システムの機密性を侵害する。
本研究では,早期インジェクション検出システムの性能について検討し,様々なオープンソースソリューションで実装された技術の検出性能に着目した。
本研究は, 突発的漏洩検出手法の異なる解析方法と, それらの手法を実装した複数の検出方法の比較分析を行った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:39:43 GMT)
PRISM: Perceptual Recognition for Identifying Standout Moments in Human-Centric Keyframe Extraction [1.0] 本稿では,PRISM (Perceptual Recognition for Identifying Standout Moments) を導入した。
スタンアウトモーメントを識別するための知覚認識は、CIELAB色空間で動作し、色差メトリクスを使用して人間の視覚感度に合わせてフレームを識別する。
我々は、BBC、TVSum、SumMe、ClipShotsの4つのベンチマークデータセット上でPRISMを評価し、高い圧縮比を維持しながら、高い精度と忠実性を達成できることを実証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:06:45 GMT)
xInv: Explainable Optimization of Inverse Problems [1.0] 逆問題は医療、気候科学、農業など幅広い分野の中心となっている。
本稿では,ドメインの抽象化において人間によって解釈可能な説明を生成する手法を提案する。
後処理では、言語モデルを使用してイベントのリストから説明を作成します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:40:49 GMT)
Non-unital noise in a superconducting quantum computer as a computational resource for reservoir computing [0.9] 振幅減衰によるエネルギー散逸は、ネットワークの短期記憶能力と表現力を大幅に向上させる。
超伝導量子ビットに適用した現実的なノイズモデルをエミュレートすることにより、学習の改善を確認した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:08:16 GMT)
Online Learning for Dynamic Vickrey-Clarke-Groves Mechanism in Sequential Auctions under Unknown Environments [0.9] 本研究では,未知環境におけるシーケンシャルオークションにおけるオンライン動的メカニズム設計の問題点を考察する。
我々は,販売者が基礎となるMDPモデルを学習するためのオンライン強化学習アルゴリズムを開発した。
学習したオンラインメカニズムは, 任意の確率で効率, 真理性, 合理性を実現し, 様々な後悔の概念で性能を保証できることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:52:32 GMT)
An Exploratory Approach Towards Investigating and Explaining Vision Transformer and Transfer Learning for Brain Disease Detection [0.9] 本研究では、視覚変換器(ViT)と伝達学習(TL)モデルを用いて脳疾患の分類を行った。
その結果,ViTは伝達学習モデルを超え,94.39%の分類精度が得られた。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:56:46 GMT)
Which Company Adjustment Matter? Insights from Uplift Modeling on Financial Health [0.9] 企業調整が財務状況に与える影響を分析するために、アップリフト・モデリングを適用した。
企業調整の効果評価には、個々の処理特性だけでなく、この一連の処理の時間的順序も考慮する必要がある。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:10:24 GMT)
MR-CLIP: Efficient Metadata-Guided Learning of MRI Contrast Representations [0.8] MR-CLIPは、MR画像とDICOMメタデータを整合させてコントラスト認識表現を学習するマルチモーダルコントラスト学習フレームワークである。
クロスモーダル検索とコントラスト分類におけるその効果を実証し、その拡張性とさらなる臨床応用の可能性を強調した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:27:31 GMT)
Team LA at SCIDOCA shared task 2025: Citation Discovery via relation-based zero-shot retrieval [0.8] Citation Discovery Shared Taskは、所定の項の候補プールからの正しい引用を予測することに焦点を当てている。
本稿では,まず,与えられた段落から抽出した関係特徴に基づいて,トップkの最も類似した抽象概念を抽出するシステムを開発する。
このサブセットから、最も関連性の高い引用を正確に識別するために、LLM(Large Language Model)を利用する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:01:21 GMT)
VesselGPT: Autoregressive Modeling of Vascular Geometry [0.8] 解剖学的木は臨床診断と治療計画に重要である。
大規模言語モデルの最新の進歩に触発されて,解剖学的木の自動回帰手法を導入する。
この研究は、自己回帰的な方法で血管を初めて生成した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:57:18 GMT)
From Rows to Yields: How Foundation Models for Tabular Data Simplify Crop Yield Prediction [0.8] TabPFNは、さまざまな回帰および分類タスクにおいて、従来の機械学習(ML)モデルよりも優れたパフォーマンスを示している。
我々は、地球観測のデカダル (10日間) 時系列と格子状気象データを用いて、亜国家レベルでの夏季作物の収量を予測する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:05:56 GMT)
Policy gradient methods for ordinal policies [0.7] 強化学習において、ソフトマックスパラメトリゼーション(英: softmax parametrization)は、離散的な作用空間に対するポリシーの標準的なアプローチである。
強化学習環境に適応した順序回帰モデルに基づく新しい政策パラメトリゼーションを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:19:36 GMT)
Resampling Augmentation for Time Series Contrastive Learning: Application to Remote Sensing [0.7] 本稿では,アップサンプリング時系列によって正のペアを生成する新しい再サンプリング型拡張戦略を提案する。
我々は、Sentinel-2画像を用いて、複数の農業分類ベンチマークに対するアプローチを検証する。
本手法は,リモートセンシング時系列に対して,単純かつ効果的かつ対照的な学習拡張を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:48:19 GMT)
Understanding the Theoretical Guarantees of DPM [0.7] 本研究はディファレンシャル・プライベート・メカニズム(DPM)の有用性分析の詳細な検討である。
その結果,最小クラスタサイズと測定値の重み付けに制約があることが判明した。
以上の結果から, DPMをベースとした最適スプリットを用いた場合でも, クラスタリングのシルエットスコアは低下する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:27:19 GMT)
Dynamic Hybrid Modeling: Incremental Identification and Model Predictive Control [0.7] 動的ハイブリッドモデルの同定は、メカニスティックモデル構造にデータ駆動モデルを統合する必要があるため、依然として困難である。
本稿では,力学およびデータ駆動コンポーネントを分離した動的ハイブリッドモデルに対する漸進的同定手法を提案する。
このアプローチは、モデル構造適合性の早期評価を促進し、ハイブリッドモデルの開発を加速し、データ駆動コンポーネントの独立した識別を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:55:32 GMT)
Pr{é}diction optimale pour un mod{è}le ordinal {à} covariables fonctionnelles [0.7] 我々は損失関数を用いた最適予測を導入し、順序モデルの最小絶対値決定予測の明示的な形を与える。
提案手法を概説し,EssilorLuxottica が収集したデータセットに適用し,コネクテッドグラスの陰色制御アルゴリズムの開発を試みる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:20:33 GMT)
Evaluating Causal Explanation in Medical Reports with LLM-Based and Human-Aligned Metrics [0.6] 本研究は, 自動診断報告における因果的説明の質を, 異なる評価指標がいかに正確に把握するかについて検討した。
我々は、BERTScore、Cosine similarity、BioSentVec、GPT-White、GPT-Blackの6つの指標を比較し、観察ベースと複数選択ベースのレポート生成という2つの入力タイプにわたる専門家の質的評価を行った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:19:21 GMT)
A Deep Convolutional Neural Network-Based Novel Class Balancing for Imbalance Data Segmentation [0.6] 本稿では,網膜基底画像における血管のセグメンテーションを実現するために,深層学習と二層クラスバランスに基づく新しいパイプラインであるBLCB-CNNを提案する。
BLCB-CNNスキームは、CNN(Convolutional Neural Network)アーキテクチャと、コンテナクラスと非コンテナクラスのピクセルの分布のバランスをとるための実証的なアプローチを使用している。
提案手法を標準網膜基底画像で評価し,ROC曲線98.23%以下の領域,96.22%の精度,81.57%の感度,97.65%の特異性など,優れた性能測定を行う。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:15:54 GMT)
Talking to GDELT Through Knowledge Graphs [0.6] 本研究では,各アプローチの強みと弱みを質問応答解析で把握するために,様々なRAG(Retrieval Augmented Regeneration)アプローチについて検討する。
テキストコーパスから情報を取得するために,従来のベクトルストアRAGと,最先端の大規模言語モデル(LLM)に基づくアプローチを実装した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:39:34 GMT)
EMULATE: A Multi-Agent Framework for Determining the Veracity of Atomic Claims by Emulating Human Actions [0.6] EMULATEは、マルチエージェントフレームワークを使うことで、人間のアクションをよりうまくエミュレートするように設計されている。
いくつかのベンチマークの実験では、以前の作業よりも明らかな改善が示され、新しいマルチエージェントフレームワークの有効性が実証された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:58:51 GMT)
Unique Games and Games Based on Groups [0.6] 我々は、一意のゲームが 1 に近い量子アシスト値を持つなら、完全な決定論的戦略を持つ必要があることを証明している。
XOR ゲームを一般化する群に基づく一意的なゲーム群を導入し、群が位数 3 の巡回群であるとき、これらのゲームは有向グラフの3ラベリング問題に対応することを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:46:33 GMT)
SIM-Net: A Multimodal Fusion Network Using Inferred 3D Object Shape Point Clouds from RGB Images for 2D Classification [0.6] Shape-Image Multimodal Network (SIM-Net)は、RGB画像から推定される3Dポイントクラウド表現を統合する新しい2D画像分類アーキテクチャである。
SIM-Net は ResNet101 を一貫して上回り、9.9% の精度、12.3% のFスコアを達成している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:25:40 GMT)
Adapting Foundation Speech Recognition Models to Impaired Speech: A Semantic Re-chaining Approach for Personalization of German Speech [0.6] 脳性麻痺や遺伝性障害などの症状による音声障害は、自動音声認識システムに重大な課題をもたらす。
本稿では,ASRモデルをパーソナライズする実用的で軽量なパイプラインを提案し,単語の選択を形式化し,セマンティック・コヒーレンスによる音声障害者データセットを充実させる。
提案手法は,非典型的音声パターンを持つ個人に対するコミュニケーション障壁を低減する可能性を示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:30:50 GMT)
Learning Realistic Joint Space Boundaries for Range of Motion Analysis of Healthy and Impaired Human Arms [0.6] 本研究では,現実的な解剖学的制約のある上層域の運動境界を,モーションキャプチャーデータから学習するためのデータ駆動手法を提案する。
また,健常腕と障害腕の比較において,能力・障害の定量的評価を行う指標(II)を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:29:03 GMT)
Concentration of quantum channels with random Kraus operators via matrix Bernstein inequality [0.5] 我々はランダムなクラウス演算子を持つ量子チャネルを生成し、典型的にはほぼツイリングな量子チャネルと量子展開器を得る。
濃度現象を証明するために、行列ベルンシュタインの不等式を用いる。
有界および等方的ランダムクラス演算子によって生成される超作用素の新しい非ユニタリモデルを導入した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:42:53 GMT)
Application of the Cyberinfrastructure Production Function Model to R1 Institutions [0.5] 生産機能モデルが一般化され,コンピュータ資源やスタッフへの投資による制度的利益が肯定的であることが示唆された。
しかし、モデル入力とアウトプットの相対関係は機関によって異なり、しばしば理解可能な機関固有の要因に起因していると考えられる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:48:33 GMT)
Memory-Augmented Architecture for Long-Term Context Handling in Large Language Models [0.5] 大規模言語モデルは、文脈記憶が限られているため、拡張された対話よりもコヒーレントな相互作用を維持することの難しさに直面します。
本稿では,過去のインタラクションから関連情報を動的に取得し,更新し,蓄積するメモリ拡張アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:57:25 GMT)
ARD-LoRA: Dynamic Rank Allocation for Parameter-Efficient Fine-Tuning of Foundation Models with Heterogeneous Adaptation Needs [0.5] 本稿では,学習可能なスケーリング因子によるランク割り当てを自動化する新しいフレームワークであるAdaptive Rank Dynamic LoRA(ARD-LoRA)を紹介する。
ARD-LoRAは、連続的で、差別化可能な、ヘッドランクごとの適応を可能にする。
LLAMA-3.1-70BとPaliGemma-2の実験ではARD-LoRAの有効性が示され、トレーニング可能なパラメータは0.32%しかなかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:45:37 GMT)
AnalogNAS-Bench: A NAS Benchmark for Analog In-Memory Computing [0.4] AnalogNAS-Benchは、Analog In-Memory Computing(AIMC)に特化したNASベンチマークである。
本研究は,(1)標準量子化技術がAIMC固有のノイズを捕捉できないこと,(2)ロバストなアーキテクチャがより広く分岐したブロックを特徴付けること,(3)スキップ接続が時間的ドリフトノイズに対するレジリエンスを改善すること,の3つの重要な知見を明らかにする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:44:32 GMT)
IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection [0.4] Deepfake技術は、AIアシスタント、音声障害のアクセシビリティ向上、エンターテイメントの向上などのメリットを提供する。
また、セキュリティ、プライバシー、およびデジタルコミュニケーションに対する信頼に重大なリスクをもたらす。
既存のデータセットには多様な民族的アクセントがなく、現実世界のシナリオでは不十分である。
この研究はインディーフェイクデータセット(IFD)を導入し、インド語を話す50人の英語話者から27.17時間のボナフィドとディープフェイクのオーディオを収録した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:10:06 GMT)
PC-SRGAN: Physically Consistent Super-Resolution Generative Adversarial Network for General Transient Simulations [0.4] 機械学習はスーパーレゾリューション(SR)に革命をもたらした
我々のアプローチであるPC-SRGANは、解釈可能なシミュレーションのための物理的整合性を確保しながら、画像の解像度を向上させる。
ソースコードはhttps://github.com/hasan-rakibul/PC-SRGANで公開しています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:50:11 GMT)
MGHF: Multi-Granular High-Frequency Perceptual Loss for Image Super-Resolution [0.4] Invertible Neural Network (INN) ベースのナイーブな textbfMulti-textbfGranular textbfHigh-textbfFrequency (MGHF-n) パーセプチュアルな損失をImageNet でトレーニングし,これらの問題を克服する手法を提案する。
複数の視点にまたがって情報を保存し、優先順位付けし、調整するための、いくつかの制約のある包括的なフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:08:58 GMT)
A Comment On "The Illusion of Thinking": Reframing the Reasoning Cliff as an Agentic Gap [0.4] 我々は、観測された失敗は基本的な認知境界の証拠ではなく、システムレベルの制約の予測可能な結果であると主張している。
当初、テキストのみの世代に限定してパズルを宣言することは不可能であると宣言されたモデルは、現在ではエージェントツールを使用して解決するだけでなく、それまで克服できなかった難易度をはるかに超える複雑さを習得している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:14:21 GMT)
Modeling and Characterization of Arbitrary Order Pulse Correlations for Quantum Key Distribution [0.3] パルス相関を説明するための単純な線形モデルを提案する。
本研究では,短距離相関を実験的に評価し,長距離相関を無限次に考慮するために提案手法を適用した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:26:53 GMT)
LLM-Driven APT Detection for 6G Wireless Networks: A Systematic Review and Taxonomy [0.3] 6GネットワークにおけるLPM支援APT検出のための総合的な体系的レビューと分類学的研究について述べる。
説明可能性のギャップ、データ不足、エッジハードウェアの制限、リアルタイムスライシング対応の必要性といったオープンな課題を特定します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:37:53 GMT)
Hardware-efficient quantum phase estimation via local control [0.3] 本稿では,局所的に制御された演算のみを用いる量子位相推定手法を提案する。
我々のアプローチの中心は、時間進化演算子の期待値の複雑な位相を測定する効率的なルーチンである。
提案手法は、現在の量子デバイスを用いた大規模多体量子系のスペクトル特性を測定するための実用的な経路を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:34:58 GMT)
DSAC-C: Constrained Maximum Entropy for Robust Discrete Soft-Actor Critic [0.2] 本稿では,ソフトアクタ・クリティカル(SAC)アルゴリズムのファミリを新たに拡張する。
我々は、最大エントロピー原理に基づいて、サロゲート批判政策から導かれるさらなる統計的制約により、離散SACをさらに改善することができると論じる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:45:04 GMT)
QUEST: Quality-aware Semi-supervised Table Extraction for Business Documents [0.2] QUESTはビジネス文書のための品質対応の半教師付きテーブル抽出フレームワークである。
QUESTは、信頼度基準に頼るのではなく、F1スコアを予測するために訓練された抽出テーブルの構造的特徴と文脈的特徴を評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:53:21 GMT)
Efficient Modular Multiplier over GF (2^m) for ECPM [0.1] 楕円曲線暗号(ECC)が主要な公開鍵プロトコルとして登場している。
本研究では,バイナリフィールドGF(2m)上のモジュラ乗算のためのハイブリッド乗算手法のハードウェア実装を提案する。
従来の乗算(CM)とカラツバ乗算(KM)の組み合わせを最適化して楕円曲線点乗算(ECPM)を強化する設計である。
本手法は,ECC暗号システムの高速化,ハードウェア効率,資源利用を著しく向上させる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:23:12 GMT)
Benchmarking Large Language Models for Handwritten Text Recognition [0.1] MLLM(Multimodal Large Language Models)は、モデル固有のトレーニングを必要とせずに、さまざまな手書きスタイルを認識するための一般的なアプローチを提供する。
この研究は、トランスクリバスモデルに対する様々なプロプライエタリでオープンソースのLCMをベンチマークし、英語、フランス語、ドイツ語、イタリア語で書かれた近代的および歴史的データセットのパフォーマンスを評価した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:48:02 GMT)
First direct search for light dark matter interactions in a transition-edge sensor [0.1] 直接暗黒物質探索のための同時目標とセンサとして,トランジションエッジセンサ(TES)を用いた一光子検出器を提案する。
我々は1064nmの光子の検出に最適化されたTESデバイスで489hの科学計算を行い、質量は0.2ng、エネルギー閾値は0.3eVである。
優れたエネルギー分解能により、TESは超伝導ナノワイヤ単光子検出器と運動インダクタンス検出器の最近の結果と相補的な探索戦略を可能にする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:03 GMT)
Compromising Honesty and Harmlessness in Language Models via Deception Attacks [0.0] 大規模言語モデル(LLM)は、明示的なプロンプトなしでも、偽りの振る舞いを理解し、利用することができる。
これらの特徴を損なう「偽装攻撃」を導入し、悪用されたら現実世界で深刻な結果をもたらす可能性のある脆弱性を明らかにします。
本研究では,高用量ドメインやイデオロギーに荷担した被験者においても,そのような偽装が有効であることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:04:32 GMT)
Working Document -- Formalising Software Requirements with Large Language Models [0.0] [7]はアイルランドのADAPT年次会議への2ページの提出である。
[8]は9ページの参考書と要約表を付加した9ページの論文である。
arXiv.org [8] にアップロードされたバージョンは、論文を改善するための特定の提案に対処した後、提案の1つが改善されたものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:52:25 GMT)
Wireless Home Automation Using Social Networking Websites [0.0] 本研究では,Twitter などのソーシャルネットワーキングウェブサイトのセキュアな認証システムを利用するシステムを提案する。
最後に、提案するWHASの応用を強調し、従来のホームオートメーションシステムと比較して提案システムの利点を比較する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:21:58 GMT)
When Fine-Tuning Fails: Lessons from MS MARCO Passage Ranking [0.0] 微調整事前学習型トランスフォーマーモデルでは,MS MARCOパスランキングタスクの性能が低下することを示す。
解析により, 基礎モデルの広範囲な事前学習において得られた最適埋め込み空間構造が, 微調整によって破壊されることが判明した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:46:05 GMT)
Vulnerability Assessment Combining CVSS Temporal Metrics and Bayesian Networks [0.0] この研究は、時間次元を脆弱性評価に組み込むことによって、革新的なアプローチを示す。
提案手法はTemporal Scoreを動的に計算し,脆弱性データベースからのエクスプロイトや修正に関するデータを処理することでCVSS Base Scoreを更新する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:53:17 GMT)
Utilization of SU(2) Symmetry for Efficient Simulation of Quantum Systems [0.0] 本研究では、内部のSU(2)対称性を持つ量子系をシミュレートするための変分コンパイル法について検討する。
この研究の中心的な構成要素は、トレーニングされた変動回路パラメータを外挿する動的モード分解法(DMD)の適用である。
外挿パラメータを用いて、より多くのトロッターステップを用いて、変動的にコンパイルされた量子状態を予測する手法を提案し、再学習の必要性を排除した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:17:56 GMT)
Universal framework with exponential speedup for the quantum simulation of quantum field theories including QCD [0.0] 本稿では,幅広い種類の量子システムに適用可能な量子シミュレーションフレームワークを提案する。
具体的には、ボゾン理論のために開発された効率的な量子シミュレーションプロトコルを一般化する。
我々のプロトコルはオラクルを前提とせず、厳密な資源推定を伴う明示的な構成を提示する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:00 GMT)
Unilateral determination of causal order in a cyclic process [0.0] 我々は、いかなる党も、彼女自身で、他の党が彼女の将来に嘘をつくような立場に置かれる過程を示す。
我々は、プロセスが最大限に違反することを許容する関連する因果不平等を示すことによって、この振る舞いを認証する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:52:05 GMT)
Turquoise Magic Wavelength of the ${}^{87}$Sr Clock Transition [0.0] 我々は、新しい魔法の波長を497.4363(3)$nmと実験的に測定した。
813nmのマジック波長と比較して、497nmはストロンチウムの強い461nm双極子遷移に近い。
461遷移に近接すると、334Hz/(nm$E_R$)の感度が魔法の波長で向上する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:22:53 GMT)
Trapped ion quantum hardware demonstration of energy calculations using a multireference unitary coupled cluster ansatz: application to the BeH2 insertion problem [0.0] 我々は、BeH2分子の基底状態エネルギーを報告するために、多参照ユニタリ結合クラスタアンサッツを用いた変分量子固有解法アルゴリズムを用いる。
我々は,古典計算機上でパラメータ最適化を行い,量子コンピュータ上で最適化されたパラメータを用いてエネルギーを測定する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:14:54 GMT)
Trans-dimensional Hamiltonian model selection and parameter estimation from sparse, noisy data [0.0] 限られた量と品質の実験データからパラメータとモデル次元を推定する必要がある場合が多い。
この誤った状況は、従来の機械学習と決定論的手法を信頼できない、あるいは難解なものにする可能性がある。
本稿では,マルコフ連鎖モンテカルロサンプリング手法をハイブリダイズして,疎度で雑音の多いデータからパラメータとモデル次元の両方を推定するベイズフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:07:20 GMT)
Thermal Vision: Pioneering Non-Invasive Temperature Tracking in Congested Spaces [0.0] サーマルカメラを用いた非侵襲温度推定に関する既存の研究は、主にスパース設定に焦点を当てている。
本研究では,サーマルカメラとエッジデバイスを組み合わせた非侵襲温度推定システムを提案する。
提案した顔検出モデルは, インデータセットとクロスデータセットの両方において, 84以上の印象的なmAPスコアを達成している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:17:10 GMT)
Theoretical guarantees for neural estimators in parametric statistics [0.0] 本稿では,神経推定器のリスクを複数の用語に分解し,個別に解析する方法について検討する。
我々は、各項が0に収束することを保証し、ニューラル推定器の一般的な応用に対してそれらを検証し易い仮定を定式化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:02:08 GMT)
The Quantified Body: Identity, Empowerment, and Control in Smart Wearables [0.0] 本稿では,自己監視,データ抽出,アルゴリズム制御といったフィードバック駆動システムにユーザを組み込むことで,ウェアラブル技術が身体の自律性をどのように再構成するかを検討する。
スマートウェアラブルは、生産性、効率、自己教育の価値観に沿ったコンプライアンスのモダリティへと、健康のエンパワーメントの言説をシフトしている、と私は主張する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:24:46 GMT)
The Debugging Decay Index: Rethinking Debugging Strategies for Code LLMs [0.0] デバッグが非効率になったときを定量化し,介入点を予測する数学的フレームワークであるDecay Index(DDI)を導入する。
DDIは、現在のAIデバッグにおける基本的な制限を明らかにし、反復的なコード生成戦略を最適化するための最初の定量的フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:40:45 GMT)
TRIZ Agents: A Multi-Agent LLM Approach for TRIZ-Based Innovation [0.0] TRIZ(The Theory of Inventive Problem Solving)は、イノベーションと問題解決のための構造化された知識ベースのフレームワークである。
LLMベースのマルチエージェントシステムであるTRIZエージェントを提案する。
このマルチエージェントシステムは、様々なドメインの専門知識を持つエージェントを活用して、TRIZステップを効率的にナビゲートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:53:14 GMT)
Systematic improvement of the quantum approximate optimisation ansatz for combinatorial optimisation using quantum subspace expansion [0.0] ジェネレータ座標法(GCM)による量子近似最適化アンサッツ(QAOA)の増強に関する研究
Erd"os-R'enyiグラフ上の最大独立集合に対する近似比と忠実度を体系的に改善する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:54:06 GMT)
Steering Conceptual Bias via Transformer Latent-Subspace Activation [0.0] 本研究では,言語モデル(LLM)における潜在部分空間の活性化が,特定のプログラミング言語に対して科学的コード生成を促進できるかどうかを検討する。
C++ または CPP トークンに対して最も活性の高い静的重みを摂動させるニューロンの寄与法は脆く、限定的な一般化を示した。
勾配調整型アダプティブアクティベーションステアリングフレームワーク(G-ACT)を開発した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:56:34 GMT)
State updates and useful qubits in relativistic quantum information [0.0] 相対論的時空における選択的な測定の後、量子状態を継続的に更新するという長年にわたる課題に対処する。
将来の電灯線に沿った標準的な更新は因果関係を保つが、因果関係を切断する一方、過去の電灯線に沿った更新は因果関係を暗示するか、情報の因果伝播を尊重しない。
サブシステム固有のコンテキスト情報をエンコードするために,マルチパート状態の最小拡張を導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:59 GMT)
Stability Analysis of Three Coupled Kerr Oscillators: Implications for Quantum Computing [0.0] 我々は,光非線形Kerrカップラの古典力学について検討し,量子コンピューティングへの応用の可能性に着目した。
システムは外部周期場によって駆動され、散逸過程を含む。
同一のKerr媒体であっても、非線形結合と不整合の基本周波数とポンプ周波数との相互作用がリッチで複雑なダイナミクスをもたらすことを示す。
この研究の重要な貢献は、リアプノフ指数の数値計算に基づく詳細な安定性解析であり、減衰が減少するにつれて、規則的からカオス的なダイナミクスへの遷移が明らかになる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:31:17 GMT)
Spiffy: Efficient Implementation of CoLaNET for Raspberry Pi [0.0] 本稿では、特殊なニューロモーフィックハードウェアやフレームワークに頼ることなく、スパイキングニューラルネットワーク(SNN)を実行するためのソフトウェアベースのアプローチを提案する。
Rustに特定のSNNアーキテクチャ(CoLaNET)を実装し、共通コンピューティングプラットフォーム向けに最適化します。
ケーススタディでは、MNISTデータセットを使用してRaspberry Pi上でSpiffyと呼ばれる実装を実演する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:47:14 GMT)
Single-shot high-resolution spectroscopy of single-photon-level optical pulses using a virtually imaged phased-array and single-photon avalanche diode array [0.0] 単一光子レベルにおける単発高分解能分光は、有望な測定技術として現れている。
本稿では,高分解能周波数-空間モードマッピングを統合した単一ショット高分解能単一光子分光システムを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:08:47 GMT)
Simulation of a closed-loop dc-dc converter using a physics-informed neural network-based model [0.0] 現在、商用の時間領域シミュレーションソフトウェアは、主に電力エレクトロニクスをシミュレートするための物理学に基づく手法に依存している。
近年の研究では、データ駆動型および物理インフォームドラーニング手法により、精度の妥協を限定してシミュレーション速度を向上できることが示されている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:44:56 GMT)
Simple and Critical Iterative Denoising: A Recasting of Discrete Diffusion in Graph Generation [0.0] 中間ノイズ状態間の依存関係は、逆ノイズ化プロセス中にエラーの蓄積と伝播を引き起こす。
本稿では, 離散拡散を単純化し, 問題を回避し, 簡易反復分解という新しい枠組みを提案する。
実験により,提案手法はグラフ生成タスクにおいて既存の離散拡散ベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:03:57 GMT)
Sequential keypoint density estimator: an overlooked baseline of skeleton-based video anomaly detection [0.0] SeeKerはヒト骨格の配列の異常を検出する方法である。
本手法はキーポイントレベルで自己回帰因子化によって骨格配列密度を定式化する。
SeeKerはUBnormalとMSAD-HRデータセットのすべての従来のメソッドを上回ります。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:55:28 GMT)
Sensitivity Analysis of Image Classification Models using Generalized Polynomial Chaos [0.0] 本研究では,画像分類モデルの感度について検討した。
本稿では,確率変数を用いた入力の分布領域シフトをモデル化し,モデル出力への影響を定量化する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:22:31 GMT)
Semantic similarity estimation for domain specific data using BERT and other techniques [0.0] 意味的類似性の推定は、自然言語処理と自然言語理解の両方において重要な研究課題である。
分析には2つの質問ペアデータセットを使用します。1つはドメイン固有の社内データセットで、もう1つはパブリックデータセットです。
BERTモデルは,他の手法に比べて優れた性能を示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:03:59 GMT)
STU-PID: Steering Token Usage via PID Controller for Efficient Large Language Model Reasoning [0.0] 拡張チェーン・オブ・シンクレット(CoT)推論を用いた大規模言語モデルは、しばしば過度に考え抜かれた現象に悩まされる。
推論中の操舵強度を動的に活性化するPIDコントローラを用いた新しいトレーニングフリー手法STUPIDを提案する。
提案手法では,冗長推論パターンを検出するチャンクレベル分類器と,予測冗長性確率に基づいて操舵強度を適応的に調整するPID制御機構を組み合わせる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:47:19 GMT)
SLEEPING-DISCO 9M: A large-scale pre-training dataset for generative music modeling [0.0] 我々の知る限りでは、ジェネレーティブな音楽モデリングタスクに人気がありよく知られた曲を表すオープンソースの高品質なデータセットは存在しない。
我々のデータセットはこの物語を変え、実際のポピュラー音楽と世界有数のアーティストを用いて構築されたデータセットを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:39:59 GMT)
Rényi and Shannon mutual information in critical and decohered critical system [0.0] 我々は,R'enyi一般化相互情報の導入により,臨界多体システムについて検討する。
我々はIsing共形場理論(CFT)によって記述された臨界横フィールドイジングモデル(TFIM)に焦点を当てる。
我々は、R'enyi-$2$の中央電荷が中心電荷に結合しているのがかなり頑丈であることを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:18:53 GMT)
Robust Control of High-dimensional Quantum Systems against Coherent and Incoherent Errors [0.0] 量子システムの制御は、パラメトリック不確実性によって引き起こされるコヒーレントエラーと、環境デコヒーレンスによって引き起こされる非コヒーレントエラーの両方に対して堅牢である必要がある。
これは、制御設計プロセスに関わる計算強度のため、高次元システムにとって大きな課題となる。
設計効率を向上させるための体系的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:50:56 GMT)
Robust Anomaly Detection in Network Traffic: Evaluating Machine Learning Models on CICIDS2017 [0.0] 筆者らはCICIDS 2017データセット上で, 4つの代表モデルの比較を行った。
SupervisedとCNNは、慣れ親しんだ攻撃に対してほぼ完璧な精度を達成したが、新しい攻撃に対して劇的なリコールの損失を被った。
監視されていないLOFは、誤報の高揚を犠牲にして、適度な全体的な精度と未知の脅威に対する高いリコールを達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:31:10 GMT)
Revealing Hidden Non n-Locality In n-Local Star Network [0.0] 非n-局所性は、星型n-局所ネットワークにフィルタリング操作を組み込むことによって利用することができる。
逐次ネットワークの有効性については,ネットワークに分散した各2ビット状態のベル-CHSH非局所性(SLOCC操作まで)は必須ではない。
しかし、ベル局所状態(SLOCC操作まで)のみを含むn-ローカルネットワークに適用された場合、非n-ローカル性を示すような分離可能な局所フィルタは存在しない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:28:51 GMT)
Residual gauge theory for quanta of surface plasmons [0.0] 我々は、表面プラズモンの量子化を研究するためのゲージ理論の枠組みを開発する。
我々は、物理状態に制約方程式を課す残留ゲージ対称性が、ジュール加熱と根本的に関連していることを強調した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:27:12 GMT)
Reply to "Emergent LLM behaviors are observationally equivalent to data leakage" [0.0] データ汚染は、大規模言語モデル(LLM)をシミュレートする際の潜在的懸念である
LLM集団における真に創発的なダイナミクスの研究を妨げるものではない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:59:34 GMT)
Recent Trends in Artificial Intelligence Technology: A Scoping Review [0.0] 本研究は、現在最先端の人工知能技術のスコーピングレビューを行う。
目標は、人工知能技術研究のさまざまな領域で使われている最も高度な技術を見つけることであった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:51:43 GMT)
Reasoning Limitations of Multimodal Large Language Models. A Case Study of Bongard Problems [0.0] ボナード問題(BP)は、視覚的推論において重要な課題である。
マルチモーダル大言語モデル(MLLM)がBPを解くことができるかどうかを検討する。
実世界の画像を用いたBPの合成概念を表すデータセットであるBongard-RWRを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:53:53 GMT)
RWESummary: A Framework and Test for Choosing Large Language Models to Summarize Real-World Evidence (RWE) Studies [0.0] 大言語モデル (LLM) は総合的な要約作業や医学研究支援のために広く評価されている。
本稿では,MedHELMフレームワークへの追加としてRWESummaryを導入し,LLMのベンチマークを可能にする。
RWESummaryには1つのシナリオと3つの評価がある。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:28:03 GMT)
Quantum vs. semiclassical description of in-QGP quarkonia in the quantum Brownian regime [0.0] クォークグルーオンプラズマの力学を記述するために設計された量子マスター方程式の半古典近似の妥当性の範囲について検討する。
熱浴と$cbarc$サブシステムとの接触によって生じる力学の非単位成分が原因で、サブシステムの急激な古典化につながることが示される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:34:47 GMT)
Quantum thermal rectification via state-dependent two-photon dissipation [0.0] 量子レベルでの熱流を制御することは、次世代熱デバイスの開発に不可欠である。
本研究では, 単一光子(非線形)および2光子(非線形)交換プロセスにより, 2つの熱浴に結合した量子調和振動子の熱的整合性について検討した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:46:19 GMT)
Quantum computational speedup and retrocausality [0.0] 量子アルゴリズムの古典的な論理的記述では、問題解決者は問題解決行動を開始する前に事前に知っているように思われる。
これは自然に因果ループであり、後部の性格は量子状態重畳の概念において暗黙であることが判明した。
より一般に、これらの因果ループは量子相関や、量子宇宙論的な仮定の下では、マクロ現実の相関においても暗黙であることが判明した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:17:46 GMT)
Pulsed laser attack at 1061 nm potentially compromises quantum key distribution [0.0] 量子鍵分散システムは、全てのコンポーネントが完全に特徴付けられるように暗号セキュリティを提供する。
特定のコンポーネントは、特に以前に未試験のレーザーパラメータで攻撃された場合、レーザー損傷攻撃に対して脆弱である可能性がある。
ここでは、1550nmの光ファイバーアイオレータを平均出力17mWに照射すると、1061nmのピコ秒攻撃パルスが安全な閾値以下で分離を減少させることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:13:37 GMT)
Programmable photonic quantum walks on lattices with cyclic, toroidal, and cylindrical topology [0.0] 量子ウォークのような格子構造上のユニタリプロセスのフォトニックな実装は、様々なアーキテクチャで実証されている。
本稿では, 1次元および2次元格子上での任意の変換不変なユニタリ演算の実装を可能にするプラットフォームを最近開発した。
我々は,円筒型あるいはトロイダル位相を持つ1次元巡回格子および2次元格子上の量子ウォークを実現するために,我々のプラットフォームをプログラムする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:28:35 GMT)
PlantDeBERTa: An Open Source Language Model for Plant Science [0.0] 植物ストレス応答型文献から構造化知識を抽出する,高性能でオープンソースな言語モデルであるPlantDeBERTaを提案する。
本手法は,トランスフォーマーに基づくモデリングと規則強化された言語後処理とオントロジーに基づく実体正規化を組み合わせた手法である。
計算プラント科学における透明性の促進と学際的イノベーションの促進を目的として,本モデルが公開された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:42:53 GMT)
Phase transition of \emph{descending} phase retrieval algorithms [0.0] 本研究では,位相探索アルゴリズムの理論的限界について検討する。
我々は、エンファラメトリー多様体の概念とそのエンファネリング点を重要な数学的対象として識別する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:10:35 GMT)
Persistent Sampling: Enhancing the Efficiency of Sequential Monte Carlo [0.0] 連続モンテカルロサンプリング(SMC)はベイズ推論の強力なツールであるが、高い計算コストに悩まされている。
我々は、SMCを維持し、全ての先行イテレーションから粒子を構成する永続サンプリング(PS)を導入する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:59:17 GMT)
Page Curve and Entanglement Dynamics in an Interacting Fermionic Chain [0.0] 我々は、強い相関を持つスピンレスフェルミオンのモデルにおいて、フォン・ノイマンエントロピーのそのようなページ様挙動を考察する。
相互作用の存在下では、スケーリング解析は熱力学限界における非解析性の非ゼロ臨界時間を与える。
本報告では,これらの知見を物理画像で説明する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:06:01 GMT)
PCA-Guided Quantile Sampling: Preserving Data Structure in Large-Scale Subsampling [0.0] 主成分分析ガイド量子サンプリング(PCA QS)を導入する。
PCA QSは、大規模データセットの統計的構造と幾何学的構造の両方を保存するために設計された新しいサンプリングフレームワークである。
我々はPCA QSが単純な乱数サンプリングより一貫して優れており、構造が良く、下流モデルの性能が向上していることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 02:37:05 GMT)
Optimizing two-qubit gates for ultracold atoms using Fermi-Hubbard models [0.0] 我々は、Fermi-Hubbard記述に基づく超格子内における高速で衝突に基づく2量子ゲートの設計に量子最適制御を用いる。
その結果、最適化においてより高いエネルギーバンドを許すことで、ゲート長を5倍に短縮する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:42:40 GMT)
Optimal spectral initializers impact on phase retrieval phase transitions -- an RDT view [0.0] 我々はスペクトル初期化器と共振位相探索アルゴリズム(dPR)の理論限界の関係を解析する。
我々は、Emphoverlap optimal spectrum initializers (OptSpins) をdPRの出発点とみなし、それらを統計的に特徴付ける汎用的なEmphRandom duality theory (RDT) ベースのプログラムを開発した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:20:24 GMT)
On the reconstruction map in JT gravity [0.0] 非摂動量子効果を計算するのに十分な半古典的バルク作用素を正確に再構築する。
我々の写像は、JT重力に対する「作用角」変数を正則に定量化することによって得られる。
ワームホール長のダイナミクスを解析的に予測する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:01 GMT)
On the algorithmic construction of deep ReLU networks [0.0] 我々はニューラルネットワークをアルゴリズムとして捉えている。
このアナロジーでは、ニューラルネットワークはデータから訓練されるのではなく、構築的にプログラムされる。
既存の例と新しい例の両方を構築し,分析する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:35:52 GMT)
Nonstabilizerness and Error Resilience in Noisy Quantum Circuits [0.0] 非単体チャネルである振幅減衰は魔法を発生または強化するが、非分極ノイズは確実には生じないことを示す。
我々の結果は、単にノイズを緩和するのではなく、量子情報処理に活用できる可能性を示している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:01 GMT)
Non-Gaussian Noise Magnetometry Using Local Spin Qubits [0.0] 局所的,空間的に解決された方法で高次磁気ノイズ累積量を不明瞭に測定する方法を示す。
次に、相互作用しない2段階系のバスのモデルを考えることにより、これらのプロトコルの有用性を実証する。
どちらの場合も、実際の多体システムにおいて、このテクニックをどのように測定することができるかを強調します。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:10:32 GMT)
Noise2Score3D:Unsupervised Tweedie's Approach for Point Cloud Denoising [0.0] Noise2Score3Dはノイズデータから直接基礎となる点雲分布の勾配を学習する。
提案手法は,既存の教師なし手法における反復処理を回避するため,単一のステップで推論を行う。
本稿では,未知の雑音パラメータを推定できる基準であるTtal Variation for Point Cloudを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:58:26 GMT)
No Training Wheels: Steering Vectors for Bias Correction at Inference Time [0.0] 本研究では,大規模言語モデルにおける振る舞いの編集に使用されるベクトルのステアリングにインスパイアされた,安価でトレーニング不要な手法を提案する。
多数派と少数派の間の平均活性化の差を計算して「バイアスベクトル」を定義する。
これにより分類バイアスが減少し、最悪のグループ精度が向上する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:58:54 GMT)
Neuralized Fermionic Tensor Networks for Quantum Many-Body Systems [0.0] 神経化フェルミオンテンソルネットワーク状態(NN-fTNS)の分類について述べる。
NN-fTNSは、局所テンソルの構成依存型ニューラルネットワーク変換を通じてフェルミオンテンソルネットワークに非線形性を導入する。
既存のフェルミオン性神経量子状態(NQS)と比較して、NN-fTNSは物理的に動機付けられた代替フェルミオン構造を提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:34:38 GMT)
Neural Total Variation Distance Estimators for Changepoint Detection in News Data [0.0] ニューズデータにおける変化点検出にニューラルネットワークを活用し,いわゆる「学習・バイ・コンフュージョン・スキーム」に基づく手法を導入する。
我々は,この手法が,ガーディアン紙の合成データセットと実世界のデータの両方に与える影響を実証した。
我々のアプローチでは、最小限のドメイン知識が必要であり、公開談話における重要な変化を自律的に発見でき、コンテンツの変化の定量的な測定結果が得られる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:33:30 GMT)
Modulator-Assisted Local Control of Quantum Battery via Zeno Effect [0.0] 量子電池 (quantum battery) は、量子力学を用いてエネルギーを貯蔵し、供給するように設計された装置である。
充電器を介するプロトコルでは、エネルギーは充電器から相互作用を介して電池に転送される。
本稿では,ローカル操作のみを用いたエネルギー移動の間接制御が可能な変調器支援方式を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:11:56 GMT)
ModeliHub: A Web-based, Federated Analytics Platform for Modelica-centric, Model-based Systems Engineering [0.0] 本稿では,Modelicaを用いたモデルベースシステムエンジニアリングに特化したWebベースのフェデレーション分析プラットフォームであるModeliHubを紹介する。
ModeliHubの重要なイノベーションは、Modelica中心のハブ&スポークフェデレーションアーキテクチャで、システムエンジニアに異種エンジニアリングアーティファクトを含むレポジトリの統一されたシステムモデルを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:00:32 GMT)
Mirage of Mastery: Memorization Tricks LLMs into Artificially Inflated Self-Knowledge [0.0] 既存の研究は、LLMにおける記憶障害と自己認知障害を別の問題として扱う。
我々は,LLMが学習データから推論パターンを真に学習するかどうかを確認するために,新しいフレームワークを利用する。
LLMは記憶された解から自信を引き出して高い自己知識を推測する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:01:16 GMT)
Measures from conical 2-designs depend only on two constants [0.0] このような演算子から構築された様々な重要な量子測度を完全に特徴づけるためには、正の定数が2つ必要であることが示される。
エントロピーの不確実性関係、ブルークナー・ザイリンガー不変量、量子コヒーレンス、量子コヒーレンス、およびエンタングルメント検出のためのシュミット数基準の例があげられる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:17:35 GMT)
Magnon Nesting in Driven Two-Dimensional Quantum Magnets [0.0] 駆動磁石の動的量子不安定性の新しいクラスを見いだす。
この不安定性は、純粋な強磁性マイクロカップリングであっても反強磁性相関の創発的な増強につながる。
しかしフェルミオンの場合とは対照的に、マグノン駆動の不安定性は本質的に非平衡であり、熱物理学では基本的に到達できない。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:35:19 GMT)
Localization and splitting of a quantum droplet by immersing a heavy impurity [0.0] 一次元に閉じ込められた液滴配置の存在と非平衡応答を明らかにする。
固定負の化学ポテンシャルについては, 液滴の破片が2つに分断され, 反発電位の高さが増大することが示されている。
我々の結果は、現在の超低温原子実験で検出でき、外部電位の助けを借りて、エンジニアリングされた液滴力学を刺激することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:06:07 GMT)
Local classical correlations between physical electrons in the Hubbard model [0.0] 我々は、ハバードモデルにおける局所電子相関が完全に古典的であることを証明した。
我々は、磁気状態と非磁気状態の異なる理論的記述を比較する。
本結果は,オープンシステム内の局所的古典的相関と,その量子環境との非局所的相関の関係を検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:48:21 GMT)
Leveraging Large Language Models for Information Verification -- an Engineering Approach [0.0] ACMMM25の課題に対して,マルチメディアニュースソース検証の実践的手法を提案する。
Googleツールを介して汎用的なクエリを使用してメタデータを生成し、関連するコンテンツやリンクをキャプチャします。
マルチメディアデータはセグメント化され、クリーン化され、フレームに変換される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:08:38 GMT)
Interpreting Global Perturbation Robustness of Image Models using Axiomatic Spectral Importance Decomposition [0.0] 摂動堅牢性は、データ破損や敵攻撃など、さまざまな摂動から生じるモデルの脆弱性を評価する。
本稿では,画像モデルの摂動ロバスト性を理解するために,モデルに依存しない大域的機械論的解釈法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:00:34 GMT)
Interpretation of Deep Learning Model in Embryo Selection for In Vitro Fertilization (IVF) Treatment [0.0] 専門家の胚学者は、通常、胚を選別するためにブラストシストの画像をレビューすることで、胚を格付けする。
本研究では、畳み込みニューラルネットワーク(CNN)と長期記憶アーキテクチャ(LSTM)を融合した、胚を分類するための説明可能な人工知能フレームワークを提案する。
本モデルは,XAIによる解釈性を維持しつつ,胚の分類において高い精度を達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:29:59 GMT)
Integrating Classical and Quantum Software for Enhanced Simulation of Realistic Chemical Systems [0.0] 大規模で現実的な化学システムにおける量子コンピューティングの実現可能性を示す。
量子回路シミュレータと高効率な第一原理計算ソフトウェアCP2Kを用いた新しいインタフェースを開発した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:49:54 GMT)
Improving Generalization in MRI-Based Deep Learning Models for Total Knee Replacement Prediction [0.0] 変形性関節症イニシアチブ(OAI)データベースからMRIデータを用いてモデルを訓練し,評価した。
その結果,両領域の分類精度は統計的に有意に向上した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:49:36 GMT)
How Large Language Models play humans in online conversations: a simulated study of the 2016 US politics on Reddit [0.0] 大規模言語モデル(LLM)は、最近、自然言語生成の強力なツールとして登場した。
我々は,2016年アメリカ合衆国大統領選挙におけるRedditの会話において,実世界におけるユーザ生成コンテンツの複製におけるLLMのパフォーマンスを評価した。
GPT-4は、コミュニティが支持する候補に賛成でも反対でも、現実的なコメントを作成できるが、反感よりもコンセンサスを創り出す傾向にある。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:54:32 GMT)
Heisenberg-scaling sensitivity in the estimation of two parameters in a Mach-Zehnder interferometer [0.0] 我々は,マッハ・ツェンダー干渉計における2つの未知位相パラメータの同時推定において,ハイゼンベルク限界感度に到達するための実験的に実現可能なスキームを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:54:57 GMT)
HausaNLP at SemEval-2025 Task 11: Hausa Text Emotion Detection [0.0] 本稿では,SemEval Track Aのための低リソースアフリカ言語Hausaにおけるマルチラベル感情検出手法を提案する。
アフリカの言語で事前訓練されたトランスフォーマーベースのモデルであるAfriBERTaを微調整して、Hausaテキストを怒り、嫌悪感、恐怖、喜び、悲しみ、驚きの6つの感情に分類しました。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:32:28 GMT)
Hallucination Level of Artificial Intelligence Whisperer: Case Speech Recognizing Pantterinousut Rap Song [0.0] 私たちは、フィンランドのラップ曲をテキストに翻訳する、楽しいが難しい試みにAIを投入しています。
フィンランドのラップ歌詞は、主人公の弟であるマクティモが書いたものである。
歌詞の書き起こしは、シンティカ・ヤンヌ(Syntikka Janne)のシンセサイザー音楽プレーヤーを強姦しているため、難しいだろう。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 04:25:06 GMT)
GradualDiff-Fed: A Federated Learning Specialized Framework for Large Language Model [0.0] 大規模言語モデル(LLM)用に明示的に設計されたFLフレームワークであるGradualDiff-Fedを紹介する。
GradualDiff-Fedは、トレーニングラウンド中のモデル全体ではなく、モデルウェイトの違いだけを送信することで、通信コストを削減する。
評価の結果,GradualDiff-Fedは集中訓練と同等の性能を示し,通信オーバーヘッドを大幅に削減した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:03:21 GMT)
Generation of hyperentangled photon pairs in the time and frequency domain on a silicon photonic chip [0.0] 多次元の絡み合った光子状態は、量子通信ネットワークにおいて重要な資源である。
自然発生4波長混合による時間・周波数ビン領域における超絡み合い光子対の生成を実証した。
我々の知る限り、集積シリコンフォトニックデバイスにおける時間周波数ビンハイパーアンタングルの最初の実演である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:40:29 GMT)
GLIMPSE: Gradient-Layer Importance Mapping for Prompted Visual Saliency Explanation for Generative LVLMs [0.0] オープンエンド視覚質問応答(VQA)においてLVLMが依存する健全な画像領域を可視化するモデルに依存しないフレームワークであるGLIMPSEを紹介する。
GLIMPSEは、勾配重み付けされた注意、適応層伝播、および重み付けされたトークン集合を融合させ、クロスモーダル推論を解釈するための全体的応答レベル属性熱マップを生成する。
我々はGLIMPSEを用いた分析可能なAI(XAI)アプローチを実証し、LVLMのクロスモーダル属性、トークンレベルの推論ダイナミクスの詳細な洞察を明らかにし、体系的な人間の意図的ミスアライメント、幻覚、偏見を分析する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:00:04 GMT)
Future prospect of anisotropic 2D tin sulfide (SnS) for emerging electronic and quantum device applications [0.0] 2Dスズ硫化物(SnS)は独特の結晶対称性を持ち、結果として異常な異方性を持つ。
この視点は、異方性2次元SnSの最近の発展を探求する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:51:40 GMT)
From Few to Many Emitters Cavity QED: Energy Levels and Emission Spectra From Weak to Deep-Strong Coupling [0.0] 単一キャビティモードに結合したN$2レベル量子エミッタからなるシステムの特性について検討した。
また,エミッタ数の増加に伴ってシステムの進化も明らかにした。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:33:20 GMT)
Frequency Control in Microgrids: An Adaptive Fuzzy-Neural-Network Virtual Synchronous Generator [0.0] 本稿では,ファジィニューラルネットワークコントローラを用いて慣性,減衰,ドループパラメータを動的に適用する手法を提案する。
従来のファジィ・ロジック・コントローラ法と比較して,提案手法は周波数偏差を0.03Hz未満に低減し,安定化・回復時間を短縮することを示した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:16:52 GMT)
Free Probability in a Minimal Quantum Circuit Model [0.0] 量子力学の最小回路モデルにおける高次外乱相関器(OTOC)のダイナミクスについて検討する。
我々は、高次OTOCの指数的崩壊を証明し、関連する時間スケールを完全に特徴づける。
このアプローチと関連する影響行列は、より一般的な設定で適用されることが期待される。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:57:29 GMT)
Framework for On the Fly Input Refinement for Deep Learning Models [0.0] ディープラーニングモデルは、最新のデータでトレーニングされた場合でも、現実世界のアプリケーションで顕著な誤予測を示す。
本研究では,入力検証と変換によるモデル性能向上を目的とした適応型オンザフライ入力改善フレームワークを提案する。
スケーラブルでリソース効率のよいソリューションとして、このフレームワークは、ソフトウェア工学、自然言語処理、コンピュータビジョンにおける高度なアプリケーションに対して、大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:32:08 GMT)
Focus Your Attention: Towards Data-Intuitive Lightweight Vision Transformers [0.0] Super-Pixel Based Patch Pooling (SPPP)技術は、アーキテクチャの複雑さを低減し、効率を向上させるために、コンテキスト対応、セマンティックにリッチなパッチ埋め込みを生成する。
我々は、潜在トークンをアテンションメカニズムに統合することで、光遅延注意(LLA)モジュールをパイプラインに導入する。
提案手法は,グローバルな意味構造を維持しつつ,情報的領域に焦点を絞るために,横断的意図過程を適応的に調整する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 16:00:57 GMT)
Finite-size security analysis for quantum protocols: A Python framework using the Entropy Accumulation Theorem with graphical interface [0.0] 本稿では,量子乱数生成(QRNG)と量子鍵分布(QKD)プロトコルの有限サイズセキュリティ解析のための包括的ソフトウェアフレームワークを提案する。
我々のフレームワークにはPython APIと直感的なグラフィカルユーザインタフェース(GUI)の両方が含まれており、ランダム性とキーレートの証明においてプロトコルデザイナと実験者をサポートするように設計されています。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:56:38 GMT)
Federated Learning from Molecules to Processes: A Perspective [0.0] 化学産業における機械学習(ML)開発における協調的な取り組みを構想する。
化学工学のいくつかの分野における連合学習の潜在的な応用について論じる。
これらの結果から,連合学習を併用したMLモデルは,各化学系企業で個別に訓練したモデルよりも有意に精度が高いことがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:27:34 GMT)
Fault Tolerance by Construction [0.0] フォールトトレラント量子コンピューティングの主な課題は、ノイズの多い環境での回路の合成と最適化である。
本稿では,構成によって正しいフォールトトレラント量子回路を設計するための枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:59:00 GMT)
Fast Scrambling in Classically Simulable Quantum Circuits [0.0] スーパークリフォードゲートから構築された量子回路の演算子スクランブルについて検討する。
作用素の絡み合いに加えて、ある時間外順序相関関数 (OTOCs) は古典的に同じ形式でシミュレートできる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:00:27 GMT)
Extracted work as measure of entanglement in optomechanics [0.0] 2つの異なる光学系における量子絡み合いと作業抽出について検討する。
最初のシステムは2つの空間的に分離されたファブリ・ペロト・キャビティからなる。
第2のシステムは、振動ミラーにレーザ電界入射を含む。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:57:12 GMT)
Examples of small-time controllable Schrödinger equations [0.0] 我々は、最小時間でほぼ制御可能な双線型シュル「オーディンガー方程式」の最初の例を示す。
特に、二次ポテンシャルの周波数に対する制御は、空間ディレーションに沿って任意に高速に進化する近似解を構築することができることを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:13:04 GMT)
Establishing validated standards for Home and Work location Detection [0.0] 移動データから自宅や職場の場所を識別する堅牢なアルゴリズムであるHoWDeを提案する。
HoWDeは、2つのユニークな地道データセットを使用して、それぞれ最大97%と88%の家庭および職場検出精度を達成している。
透過的で検証されたパイプラインを通じて、社内での事前処理をサポートすることにより、プライバシー保護のモビリティデータの共有も容易になる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:21:57 GMT)
Entropy from scattering in weakly interacting systems [0.0] サブシステムエントロピーが増加することを保証する初期状態と散乱行列の驚くほど単純な基準を見出す。
これらの基準を満たす状態のクラスは、サブシステムの単純な積状態よりもより相関している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:55:58 GMT)
Entanglement detection via third-order local invariants from randomized measurements [0.0] ランダム化測定によりアクセス可能な3階局所不変量をすべて計算し、分離性基準を導出する。
不変量の再構成により、任意の局所次元を持つ多粒子状態に対する実験的にアクセス可能な絡み合い基準%と実験的にアクセス可能な2階レニーエントロピーが得られる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:41:07 GMT)
Entangled states from sparsely coupled spins for metrology with neutral atoms [0.0] 粒子間結合数の対数のみを特徴とするスパース相互作用グラフを用いて、量子センシングのための最適状態を生成することができることを示す。
結果として得られる疎結合グラフとプロトコルは、光学的ツイーザにおける原子の動的再構成を用いて効率よく実装することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:22:30 GMT)
Entangled Quantum Negative Energy Teleportation as a Probe of Semiclassical Gravity [0.0] 量子エネルギーテレポーテーションによる局所負のエネルギー密度による半古典的時空曲の発生について検討する。
我々は、原子時計、干渉計、オプテメカル歪読み出しによるリッチ曲率検出のための信号対雑音比を計算した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:39:42 GMT)
Embedded FPGA Acceleration of Brain-Like Neural Networks: Online Learning to Scalable Inference [0.0] 高レベル合成を用いた Zynq UltraScale+ システム上で,BCPNN 用の最初の FPGA アクセラレータを提案する。
私たちのアクセラレータは、ARMベースライン上で最大17.5倍のレイテンシと94%の省エネを実現しています。
この作業により、エッジデバイス上での実用的なニューロモーフィックコンピューティングが可能になり、脳に似た学習と現実世界のデプロイメントのギャップを埋める。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:35:20 GMT)
Design high-confidence computers using trusted instructional set architecture and emulators [0.0] 高信頼コンピューティングは、信頼できる命令セットアーキテクチャ、封印されたカーネル、セキュアなオペレーティングシステムに依存している。
現在のソフトウェアパッチは、Meltdownに関する非本質的な問題にのみ対処できる。
本稿では,コンピュータアーキテクチャ設計とエミュレーションにおける総合的なアプローチを紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:49:20 GMT)
Data Classification with Dynamically Growing and Shrinking Neural Networks [0.0] トレーニング中のモデルの動的縮小と成長を可能にするプロシージャを備えたニューラルネットワークの作り方の詳細を示す。
提案手法は,視覚と時系列の両方のデータセットを用いて検証した。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 19:52:01 GMT)
DPG loss functions for learning parameter-to-solution maps by neural networks [0.0] パラメータ・ツー・ソリューション・マップの機械学習のための残差に基づく損失関数を開発し,解析し,実験的に探索する。
我々の主な関心事は、より深いニューラルネットワーク還元モデルの予測能力を高めるための厳密な精度認証である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:40:56 GMT)
Cross-Architecture Knowledge Distillation (KD) for Retinal Fundus Image Anomaly Detection on NVIDIA Jetson Nano [0.0] 我々は、I-JEPA自己教師型学習を用いて事前訓練した高容量視覚変換器(ViT)教師モデルを訓練し、眼底画像を正常、糖尿病網膜症、緑内障、白内障の4つのクラスに分類する。
私たちの研究は、低リソース領域の網膜障害に対するスケーラブルでAI駆動のトリアージソリューションの例です。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:57:43 GMT)
Competing Bosonic Reactions: Insight from Exactly Solvable Time-Dependent Models [0.0] 真に解決可能な多状態ランダウ-ツェナー模型の進歩を, 真空下での粒子生成の競合反応への応用の観点から論じる。
我々は、この効果を定量化し、対応する相転移を明らかにし、その普遍性クラスを特定するために、2つの反応経路に対して、駆動ボソニックTavis-Cummingsモデルの正確な解を用いる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 22:21:34 GMT)
Comparative Evaluation of ChatGPT and DeepSeek Across Key NLP Tasks: Strengths, Weaknesses, and Domain-Specific Performance [0.0] 本研究の目的は,5つの主要なNLPタスクにおけるChatGPTとDeepSeekを評価することである。
これらのタスクには、感情分析、トピック分類、テキスト要約、機械翻訳、テキスト翻訳が含まれる。
その結果、DeepSeekは分類安定性と論理的推論に優れており、ChatGPTは微妙な理解と柔軟性を必要とするタスクにおいてより優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 10:52:54 GMT)
Comparative Analysis of Lion and AdamW Optimizers for Cross-Encoder Reranking with MiniLM, GTE, and ModernBERT [0.0] クロスエンコーダのリランカは、クエリ-ドキュメントペアの深い分析により、リランクに強い効果を示している。
本稿では,AdamWの代替品であるライオンが,クロスエンコーダリランカーの微調整中に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 05:30:09 GMT)
Comment on "Storage properties of a quantum perceptron" [0.0] 本稿では、量子シナリオで実行される導出が、綿密な検査を行う際に問題があるという主張を裏付ける。
本稿では,本論文で提案する量子パーセプトロン則に関係していると考えられる,代替制約満足度問題の臨界能力について検討する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 09:11:57 GMT)
Classical and Quantum Resources in Perfect Teleportation [0.0] テレポーテーションの3つの重要な要素間の関係を解析する。
本稿では,部分的に絡み合った2量子チャネルを用いて,量子ビットの完全伝送を可能にするテレポーテーションプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:29:08 GMT)
Citizenship Challenges in Artificial Intelligence Education [0.0] 我々はまず、AIの認知と教育を促進する方法と、AIトレーニングに対する社会クリティカルなアプローチを促進するための様々な戦略について検討する。
第2部では、ある種のAI支援教育活動において動員できる批判的思考と計算的思考スキルについて論じる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:34:09 GMT)
Certification of high stellar ranks of quantum states of light with a pair of click detectors [0.0] 光の量子状態のステラーランクは、生成に必要な非ガウス的資源の量を定量化する。
恒星ランク認証の一般的な実践的なアプローチは、連星検出器の配列によるクリック統計の測定に基づいている。
ハンベリー・ブラウン・ツイツセットアップで配置された2つのクリック検出器について述べる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 08:27:38 GMT)
Bounded information as a foundation for quantum theory [0.0] 本稿では、量子力学の直観的な理解を最もよく表す概念を定式化する。
2つ目の重要な仮説は、測定が実験精度で理想的なものに近い場合、物理系に関する情報は測定方法とは独立である、というものである。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:57:26 GMT)
Bayesian Evolutionary Swarm Architecture: A Formal Epistemic System Grounded in Truth-Based Competition [0.0] 本稿では,構造化競争と信念修正を通じて進化する確率的エージェントからなる人工知能システムのための数学的に厳密な枠組みを紹介する。
このシステムは、真理を進化的誘引者として確立し、検証可能な知識は計算可能で自己制御可能な群の中で敵の圧力から生じることを証明している。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:27:44 GMT)
Baba is LLM: Reasoning in a Game with Dynamic Rules [0.0] 大規模言語モデル(LLM)は、言語タスクではうまく機能することが知られているが、推論タスクでは苦労している。
本稿では,LLMが2DパズルゲームBaba Is Youをプレイする能力について考察する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 20:16:28 GMT)
Automating Traffic Monitoring with SHM Sensor Networks via Vision-Supervised Deep Learning [0.0] 橋は、土木インフラの重要な要素として、劣化の影響をますます受けている。
ディープラーニングの最近の進歩は、継続的かつ自動化された監視への進歩を可能にしている。
構造的健康モニタリング(SHM)センサネットワークを用いた,継続的交通監視のための完全自動ディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:27:14 GMT)
An information-theoretic proof of the Planckian bound for thermalization [0.0] 量子力学は任意の系の熱化時間$tau$に基礎的な下界を持つことを示す。
低温の状態では、我々の境界は$tau geq hbar / Delta$と$Delta$のスペクトルギャップである。
これらの境界はハミルトン推定に根付いており、ハミルトンの非自明なクラスに対する対応する熱アンサンブルに近い状態を出力する任意の量子過程を保っている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:25:01 GMT)
An Audio-centric Multi-task Learning Framework for Streaming Ads Targeting on Spotify [0.0] Spotifyの月間アクティブユーザー数は6億7500万人を超え、何百万時間もの音楽、ポッドキャスト、オーディオブック、ビデオコンテンツを消費している。
この多様なコンテンツ消費パターンは、計算広告に固有の課題をもたらす。
本稿では,クリックスルーレート(CTR)予測を音声中心とマルチモーダルの両方で最適化する新しいフレームワークであるCross-modal Adaptive Mixture-of-Experts(CAMoE)を紹介する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 15:11:43 GMT)
An Accessible Planar Charged Particle Trap for Experiential Learning in Quantum Technologies [0.0] 本稿では,平面状線形イオントラップによる粒子トラップを探索する,安価でアクセス可能な命令セットについて述べる。
学習者はトラップ電圧を制御し,粒子運動特性を粒子追跡のためのコンピュータビジョンプログラムを用いて,トラップの解析モデルと比較することができる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 21:52:41 GMT)
Alignment Helps Make the Most of Multimodal Data [0.0] 政治学者は一般的に、マルチモーダルなデータを整列しない。
アライメントの選択をガイドする決定ツリーを導入することで、我々のフレームワークはアライメントの未解決の可能性を強調します。
我々は、米国の大統領選挙キャンペーン広告におけるトナリティの予測と、ドイツの議会演説の横断的なクエリという2つの応用を通して、アライメントの分析価値を説明する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:51:06 GMT)
AggTruth: Contextual Hallucination Detection using Aggregated Attention Scores in LLMs [0.0] AggTruthは、提供された文脈における内部の注意点の分布を分析して、文脈の幻覚をオンラインに検出する手法である。
AggTruthは、同じタスクとクロスタスクのセットアップの両方で安定したパフォーマンスを示し、複数のシナリオで現在のSOTAを上回った。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:35:05 GMT)
Advancing Talking Head Generation: A Comprehensive Survey of Multi-Modal Methodologies, Datasets, Evaluation Metrics, and Loss Functions [0.0] トーキングヘッドジェネレーション (THG) はコンピュータビジョンにおけるトランスフォーメーション技術として登場した。
本稿では,音声音声生成のための方法論とフレームワークについて概観する。
この研究は、事前訓練されたモデルへの依存、極端なポーズハンドリング、多言語合成、時間的一貫性といった課題を特定する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:49:42 GMT)
Advanced For-Loop for QML algorithm search [0.0] 本稿では,Large Language Model-based Multi-Agent Systems (LLMMA) を利用した量子機械学習(QML)アルゴリズムの自動探索と最適化のための高度なフレームワークを提案する。
Google DeepMindのFunSearchにインスパイアされたこのシステムは、古典的な機械学習アルゴリズムの量子変換を反復的に生成し、洗練するための抽象レベルに取り組んでいる。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 03:19:36 GMT)
Acoustic evaluation of a neural network dedicated to the detection of animal vocalisations [0.0] 本稿では,検出システムの性能を簡易に解析する手法を提案する。
提案手法は,合成信号の信号対雑音比と検出確率との関係に基づく。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:01:10 GMT)
Achronal localization and representation of the causal logic from a conserved current, application to the massive scalar boson [0.0] 共変時流の定位は、時間面を通過するフラックスを演算する共変時流から得られる。
初歩的な量子力学系に対する因果論理の共変表現が達成された。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 14:02:45 GMT)
Accurate early detection of Parkinson's disease from SPECT imaging through Convolutional Neural Networks [0.0] パーキンソン病(PD)の早期かつ正確な診断は臨床的に重要な課題である。
本研究では、SPECT画像の特徴を用いて機械学習モデルを構築し、早期PDおよびSWEDD被検体を正常から検出する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:59:45 GMT)
Accurate BGV Parameters Selection: Accounting for Secret and Public Key Dependencies in Average-Case Analysis [0.0] Brakerski-Gentry-Vaikuntanathan(BGV)方式は、FHE方式の中でも最も重要なものである。
本研究では,実験結果と密接に一致して,雑音の生長を推定する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 12:56:53 GMT)
Accelerated Portfolio Optimization and Option Pricing with Reinforcement Learning [0.0] 本稿では,ポートフォリオ最適化とオプション価格設定に使用される反復解法において,ブロックプレコンディショナサイズを最適化するための強化学習駆動フレームワークを提案する。
本研究では,プレコンディショニングを調整し,収束を著しく加速し,計算コストを削減できることを示す。
提案した高速化解法は、動的ポートフォリオ割り当てにおける意思決定の高速化とリアルタイムオプションの価格設定をサポートする。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 07:11:56 GMT)
ASCenD-BDS: Adaptable, Stochastic and Context-aware framework for Detection of Bias, Discrimination and Stereotyping [0.0] 本稿では,ASCenD BDS(バイアス・識別・ステレオタイピングのための適応・コンテキスト・コンテキスト認識フレームワーク)というフレームワークを提案する。
この枠組みは, 性別, 年齢, 障害, 社会経済的地位, 言語的バリエーションなど, 様々なカテゴリーにまたがる偏見, 差別, ステレオタイピングを検出するアプローチを示す。
このコンセプトは、製品開発の一環としてSFCLabsでテストされている。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 11:11:32 GMT)
AI Agents-as-Judge: Automated Assessment of Accuracy, Consistency, Completeness and Clarity for Enterprise Documents [0.0] 本研究では,AIエージェントを用いた高度に構造化された企業文書の自動レビューのためのモジュール型マルチエージェントシステムを提案する。
LangChain、CrewAI、TruLens、Guidanceといった現代的なオーケストレーションツールを使用して、文書のセクション単位での評価を可能にする。
99%の情報一貫性(人間の場合は92%)を実現し、エラーとバイアス率を半減させ、1文書あたりの平均レビュー時間を30分から2.5分に短縮する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 17:46:15 GMT)
A ultrabright, two-colour photon pair source based on thin-film lithium niobate for bridging visible and telecom wavelengths [0.0] 薄膜ニオブ酸リチウムにおける誘導波, 輝度, 高周波非縮退パラメトリックダウンコンバージョン源について述べる。
光源は、815$,mathrmnm$と1550$,mathrmnm$の光子対を生成し、可視光と通信波長を結びつける。
我々の研究結果は、オンチップで非退化光子ペア源の新たな標準を設定し、実用的でスケーラブルな量子通信ネットワークとフォトニック量子コンピューティングへの重要なステップを示す。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 13:12:45 GMT)
A Transformer-Based Approach for Diagnosing Fault Cases in Optical Fiber Amplifiers [0.0] コンディションベースのモニタリング時系列データを用いて,光ファイバー増幅器の故障事例の診断を可能にする,トランスフォーマーに基づくディープラーニング手法を提案する。
モデルであるInverse Triple-Aspect Self-Attention Transformer (ITST)は、エンコーダ-デコーダアーキテクチャを使用し、エンコーダの3つの特徴抽出パス、デコーダのフィーチャエンジニアリングデータ、および自己アテンション機構を利用する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 06:06:01 GMT)
A Machine Learning Framework for Breast Cancer Treatment Classification Using a Novel Dataset [0.0] 本研究は,癌ゲノムアトラス(TCGA)乳がん臨床データセットを用いて機械学習モデルを開発した。
モデルは5倍のクロスバリデーションを用いてトレーニングされ、精度、精度、リコール、特異性、感度、F1スコア、レシーバ動作特性曲線(AUROC)以下の領域を含むパフォーマンス指標によって評価される。
試験モデルのうち、GBM(Gradient Boosting Machine)は最高安定性能(精度0.7718、AUROC0.8252)を達成する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 18:33:15 GMT)
A Conceptual Framework for AI Capability Evaluations [0.0] 本稿では,AI能力評価を解析するための概念的枠組みを提案する。
広く使われている手法や用語の分析を体系化する構造化された記述的アプローチを提供する。
また、研究者は方法論的な弱点を特定し、評価を設計する実践者を支援し、政策立案者に複雑な評価の風景を精査し、比較し、ナビゲートするツールを提供する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 00:19:27 GMT)
A Comparative Study and Implementation of Key Derivation Functions Standardized by NIST and IEEE [0.0] 多くのアプリケーションやサービスは擬似乱数(PRN)を必要とする。
キー導出関数(KDF)を使用して、与えられたキー値と入力メッセージに基づいてPRNを生成することが可能である。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 23:56:31 GMT)
A Comparative Analysis of Principal Component Analysis (PCA) and Singular Value Decomposition (SVD) as Dimensionality Reduction Techniques [0.0] 本稿では,2つの線形手法-主成分分析(PCA)と特異値分解(SVD)を純粋に比較した。
各アルゴリズムを第一原理から導出した後、異なる形状の行列に対する解釈可能性、数値安定性、適合性を評価する。
論文参考訳(メタデータ) (Mon, 23 Jun 2025 01:58:54 GMT)