Fugu-MT: arxivの論文翻訳(概要)

Benchmarking Generalizable Bimanual Manipulation: RoboTwin Dual-Arm Collaboration Challenge at CVPR 2025 MEIS Workshop [120.3]
RoboTwin Dual-Arm Collaboration Challengeは、CVPR 2025の第2回MeISワークショップで行われた。ライバルは、剛性、変形性、触覚ベースのシナリオをカバーする17のデュアルアーム操作タスクに完全に取り組んだ。コンペティションの設定、タスク設計、評価方法論、重要な発見と今後の方向性について概説する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:56:41 GMT)
Parameter-Efficient Fine-Tuning for Pre-Trained Vision Models: A Survey and Benchmark [97.9]
事前学習された視覚モデル(PVM)は、幅広い下流の視覚タスクに顕著な適応性を示した。これらのモデルが数十億または数兆のパラメータにスケールするにつれて、計算と記憶の要求が高いため、従来の完全な微調整はますます非現実的になっている。パラメータ効率の良いファインチューニング(PEFT)は、モデルパラメータを最小限に調整しながら、完全なファインチューニングに匹敵するパフォーマンスを実現するための、有望な代替手段として登場した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:09:26 GMT)
OmniVCus: Feedforward Subject-driven Video Customization with Multimodal Control Conditions [96.3]
本研究では、画像編集データを用いた画像-動画移動混合(IVTM)訓練を開発し、カスタマイズされたビデオにおける被写体に対するインストラクティブな編集を可能にする。また,2つの埋め込み機構を持つ拡散トランスフォーマーフレームワークであるOmniVCusを提案し,Luttery Embedding (LE) とTemporally Aligned Embedding (TAE) を提案する。本手法は定量評価と定性評価の両方において最先端の手法を大幅に超えている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:43:00 GMT)
Ground-R1: Incentivizing Grounded Visual Reasoning via Reinforcement Learning [96.0]
Ground-R1は、明示的なエビデンスや合理的アノテーションを必要とせずに、基礎的な視覚的推論を可能にする強化学習フレームワークである。グラウンドR1は優れた性能を示し、不確実性認識、空間認識、反復的洗練などの創発的な認知行動を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:04:49 GMT)
Format-Adapter: Improving Reasoning Capability of LLMs by Adapting Suitable Format [94.0]
以前の研究では、複数の推論フォーマットが複数の回答を生成する場合、単一のフォーマットより優れていることが示されている。与えられたタスクに適切なフォーマットを適応させ、フォーマットを生成して選択する。 Format-Adapterは,従来の作業よりも平均4.3%の性能向上を実現している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:11:52 GMT)
Corrupted by Reasoning: Reasoning Language Models Become Free-Riders in Public Goods Games [87.6]
大規模言語モデルは、アライメント、堅牢性、安全なデプロイメントを保証する上で、いかに自己関心と集合的幸福のバランスをとるかが重要な課題である。我々は、行動経済学から制度的に選択した公共財ゲームに適応し、異なるLLMがいかに社会的ジレンマをナビゲートするかを観察することができる。意外なことに、o1シリーズのようなLCMの推論は、協調にかなり苦労している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:02:47 GMT)
Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning [79.7]
量子離散化拡散確率モデル(QD3PM)を提案する。これは、指数関数的に大きなヒルベルト空間における拡散と denoising を通じて合同確率学習を可能にする。本稿では,共同分布学習における量子的優位性を生かして,生成モデルの新たな理論的パラダイムを確立する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:35:22 GMT)
BAPE: Learning an Explicit Bayes Classifier for Long-tailed Visual Recognition [78.7]
現在のディープラーニングアルゴリズムは通常、後部確率を簡易に推定することで最適分類器を解く。この単純な手法は、厳密にバランスのとれた学術ベンチマークデータセットに有効であることが証明されている。しかし、これは現実世界の長い尾のデータ分布には適用できない。本稿では,データ分布のより正確な理論的推定を行う新しい手法(BAPE)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:12:50 GMT)
Causal-Entity Reflected Egocentric Traffic Accident Video Synthesis [78.1]
自動車事故の原因と影響をエゴセントリックに理解することは、自動運転車の安全性にとって不可欠である。この研究は、事故参加者を正確に特定し、関連する行動を捉えることが重要であると論じている。本稿では,エゴセントリックな交通事故ビデオを合成するための新しい拡散モデルCausal-VidSynを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:37:48 GMT)
Learning Counterfactually Decoupled Attention for Open-World Model Attribution [75.5]
本稿では,オープンワールドモデル帰属のためのCDAL法を提案する。我々の手法は、特に目に見えない新規攻撃に対して、最先端のモデルを大きなマージンで継続的に改善する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:25:45 GMT)
A Library for Learning Neural Operators [75.1]
我々は、演算子学習のためのオープンソースのPythonライブラリであるNeuralOperatorを紹介する。ニューラルネットワークは有限次元ユークリッド空間の代わりに関数空間間の写像に一般化される。 PyTorch上に構築されたNeuralOperatorは、ニューラルオペレータモデルのトレーニングとデプロイのためのツールをすべて提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:09:59 GMT)
MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings [75.1]
MoCaは、トレーニング済みのVLMバックボーンを効果的な双方向埋め込みモデルに変換するためのフレームワークである。 MoCaは、MMEBとViDoRe-v2ベンチマークのパフォーマンスを継続的に改善し、新しい最先端の結果を達成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:41:00 GMT)
Benchmarking Deep Search over Heterogeneous Enterprise Data [73.6]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。 RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:34:59 GMT)
Enough Coin Flips Can Make LLMs Act Bayesian [71.8]
大規模言語モデル(LLMs)は、入力プロンプトで与えられた少数ショットの例を一般化する能力を示しており、これはICL(In-context Learning)として知られる創発的能力である。 LLM が ICL を用いて,ベイズフレームワークと整合性のある構造的推論を行うか,パターンマッチングに依存するかを検討する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:01:43 GMT)
WebDancer: Towards Autonomous Information Seeking Agency [69.3]
エージェントシステムの最近の進歩は、自律的な多段階研究の可能性を強調している。データ中心およびトレーニング段階の観点からエージェントを探索するエンドツーエンドのエージェント情報を構築するための凝集パラダイムを提案する。我々はこのフレームワークを ReAct, WebDancer に基づいた Web エージェントでインスタンス化する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:33:01 GMT)
Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention [62.7]
研究は、テキストから画像への拡散モデルがトレーニングデータから画像を複製し、著作権侵害やプライバシーのリスクに対する大きな懸念を引き起こすことを示唆している。暗記中、クロスアテンションは特定のトークンの埋め込みに不均等に集中する傾向にあることが明らかとなった。拡散モデルにおける記憶の検出と緩和のための革新的なアプローチを導入する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:08:04 GMT)
Not All Explanations for Deep Learning Phenomena Are Equally Valuable [58.7]
我々は、現実の応用に反直観現象が現れることを示す証拠はほとんどないと主張している。これには、ダブル降下、グラッキング、宝くじの仮説が含まれる。深層学習現象の進行が、より広い分野の深層学習の進歩という究極の実用的目標と整合していることを保証することを目的として、将来の研究のための実践的な勧告を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:18:56 GMT)
CSBrain: A Cross-scale Spatiotemporal Brain Foundation Model for EEG Decoding [57.9]
脳波信号の一般化のためのクロススケール時空間脳基盤モデルを提案する。 CSBrainはタスク固有のベースラインと基盤モデルのベースラインを一貫して上回ります。これらの結果は、CSBrainを将来の脳-AI研究の強力なバックボーンとして、重要な帰納バイアスとして、クロススケールモデリングを確立している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:29:34 GMT)
Time-R1: Post-Training Large Vision Language Model for Temporal Video Grounding [57.3]
時間的ビデオグラウンディング(TVG)は、長めのビデオ理解における中核的な課題である。近年のLVLM(Large Vision-Language Models)は,教師付き微調整によるTVG処理の早期実現を示唆している。強化学習によるLVLMの一般化能力を高める新しいポストトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:11:35 GMT)
Dynamic View Synthesis from Small Camera Motion Videos [56.4]
分布に基づく奥行き正規化に基づく動的3ドルDシーンのための新しいビュー合成を提案する。また、光線に沿った物体境界がほぼゼロとなる前に空間点の体積密度を強制する制約を導入し、我々のモデルがシーンの正確な幾何学を学べるようにした。我々は,小さなカメラモーション入力によるシーン表現におけるアプローチの有効性を実証するために,広範囲な実験を行い,その結果を最先端の手法と比較した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:17:55 GMT)
ReMem: Mutual Information-Aware Fine-tuning of Pretrained Vision Transformers for Effective Knowledge Distillation [55.6]
事前訓練された視覚表現モデルからの知識蒸留は、小さなタスク固有の生産モデルを改善する効果的なアプローチを提供する。しかし、そのような知識伝達の有効性は、大規模に事前訓練された強いモデルから蒸留する場合に著しく低下する。相互情報と蒸留の有効性の関連性から,我々は微調整中に相互情報認識最適化を採用することを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:25:23 GMT)
Multi-task Offline Reinforcement Learning for Online Advertising in Recommender Systems [54.7]
現在のオフライン強化学習(RL)手法は、スパース広告シナリオに適用した場合、重大な課題に直面している。 MTORLは,2つの主要な目標を対象とする,新しいマルチタスクオフラインRLモデルである。我々はマルチタスク学習を用いて行動と報酬をデコードし、同時にチャネルレコメンデーションと予算配分に対処する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:05:13 GMT)
STD-GS: Exploring Frame-Event Interaction for SpatioTemporal-Disentangled Gaussian Splatting to Reconstruct High-Dynamic Scene [54.4]
既存の手法ではフレームカメラのシーンと直接一致させるために統一表現モデル(例えばガウシアン)を採用している。しかし、この統一パラダイムは、フレームの特徴と背景とオブジェクト間の不連続な空間的特徴により、オブジェクトの潜在的時間的特徴に失敗する。本研究では,フレームカメラを補うイベントカメラを導入し,高ダイナミックなシーン再構成のための時分割型ガウススプレイティングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:32:06 GMT)
VoyagerVision: Investigating the Role of Multi-modal Information for Open-ended Learning Systems [51.0]
本稿では、スクリーンショットを視覚的フィードバックの一形態として利用してMinecraft内で構造を作成できるVoyagerVisionを提案する。ボイジャーヴィジョンは平らな世界での全ての試みの半分で成功し、ほとんどの失敗はより複雑な構造で発生した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:16:11 GMT)
Enhancing Spatial Reasoning in Multimodal Large Language Models through Reasoning-based Segmentation [50.8]
本稿では、推論に基づくセグメンテーションフレームワークRelevant Reasoning(R$2$S)を紹介する。推論に基づくセグメンテーションデータセットである3D ReasonSegについても紹介する。どちらの実験も、R$2$Sと3D ReasonSegは、空間的推論能力の強い3D点雲知覚を効果的に達成することを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:58:08 GMT)
Generalist Reward Models: Found Inside Large Language Models [50.7]
我々は,従来の次世代予測によって訓練されたLarge Language Models (LLM) の中に,強力な報酬モデルが存在することを示す。この内因性報酬は、オフライン逆強化学習によって学習された報酬関数ではないことを実証する。また、この内因性報酬を用いた後続の強化学習が、ベースモデルと比較して明らかに優れたエラー境界を持つポリシーにつながることを証明した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:45:54 GMT)
InfGen: Scenario Generation as Next Token Group Prediction [49.5]
InfGenは、エージェント状態とトラジェクトリを自動回帰的に出力するシナリオ生成フレームワークである。実験により、InfGenは現実的で多様性があり、適応的な交通行動を生み出すことが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:18:32 GMT)
SurgTPGS: Semantic 3D Surgical Scene Understanding with Text Promptable Gaussian Splatting [49.4]
本稿では,このギャップを埋めるために,新しいテキストプロンプタブルなガウス分割法であるSurgTPGSを提案する。本研究では,意味的特徴のシームレスな変形を捉え,テクスチャと意味的特徴の双方をより正確に再構築する意味認識変形追跡法を提案する。本研究では,SurgTPGSの最先端技術に対する優位性を示すために,実世界の2つの外科的データセットの総合的な実験を行った。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:55:01 GMT)
State Entropy Regularization for Robust Reinforcement Learning [49.1]
状態エントロピー規則化は、構造的および空間的に相関した摂動に対するロバスト性を向上させることを示す。このようなバリエーションは、伝達学習では一般的であるが、標準的な堅牢な強化学習法では見落とされがちである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:11:45 GMT)
Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.0]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。 HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:19:13 GMT)
V-SYNTHESIS: Task-Agnostic Synthesis of Consistent and Diverse In-Context Demonstrations from Scratch via V-Entropy [48.3]
本稿では、任意のタスクに対して、スクラッチからデモを合成することに焦点を当てる。ゼロから合成する際の大きな課題は、ターゲットタスクとの整合性を確保することである。まず,より高性能で計算コストの低いVスコア(V-Score)という整合性指標を提案する。次に、比例サンプリングにV-Scoreを活用するV-Synthesisを導入し、合成されたデモの高一貫性と多様性の両立を保証する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:57:09 GMT)
Why Settle for One? Text-to-ImageSet Generation and Evaluation [47.6]
Text-to-ImageSet (T2IS) の生成は,ユーザ命令に基づいて,さまざまな一貫性要件を満たすイメージセットを生成することを目的としている。トレーニング不要なフレームワークである$textbfAutoT2IS$を提案する。また,本手法は,多くの未探索現実世界の応用を可能にする能力を示し,その実用的価値を実証する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:01:16 GMT)
MOE-Enhanced Explanable Deep Manifold Transformation for Complex Data Embedding and Visualization [47.4]
データ工学や可視化など,さまざまな分野において,次元性低減(DR)が重要な役割を担っている。 DR手法は精度と透明性のトレードオフに直面しており、パフォーマンスの最適化は説明可能性の低下につながる。この研究は、MOEに基づく説明可能なDeep Manifold Transformation (DMT-ME)を導入している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:59:31 GMT)
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models [46.6]
リスク管理とアセスメントのための2段階のフレームワークであるTRONを紹介する。 TRONは、2つのユーザ特定リスクレベルに制限された所望のエラー率を達成する。重複予測セットは適応性を維持しつつ、異なるリスクレベルのリスク評価に対してより効率的で安定である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:19:19 GMT)
YOLO-LLTS: Real-Time Low-Light Traffic Sign Detection via Prior-Guided Enhancement and Multi-Branch Feature Interaction [45.8]
YOLO-LLTSは、低照度環境向けに設計されたエンドツーエンドのリアルタイム信号検出アルゴリズムである。 YOLO-LLTSは、HRFM-SOD(High-Resolution Feature Map for Small Object Detection)、MFIA(Multi-branch Feature Interaction Attention)、PGFE(Presideed-Guided Feature Enhancement Module)の3つの主要なコントリビューションを紹介している。実験の結果、YOLO-LLTSは最新技術の性能を達成し、TT100K-nightでは2.7% mAP50:95と1.6% mAP50:95よりも優れていた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:45:14 GMT)
XY-Tokenizer: Mitigating the Semantic-Acoustic Conflict in Low-Bitrate Speech Codecs [45.7]
既存の音声コーデックは、高品質な音声再構成と言語モデルによるモデリングの容易さのバランスをとるのに苦労している。 XY-Tokenizerは,多段階マルチタスク学習による意味的能力と音響的能力の対立を緩和する小説である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:51:50 GMT)
Mettle: Meta-Token Learning for Memory-Efficient Audio-Visual Adaptation [45.0]
textbfMeta-textbfToken textbfLearning (Mettle)を提案する。 Mettleは、軽量のTextitLayer-Centric Distillation (LCD)モジュールを使用して、トランスフォーマー層に埋め込まれた無傷のオーディオや視覚的特徴を並列に、コンパクトなメタトークンに蒸留する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:52:01 GMT)
Towards Cross-modal Backward-compatible Representation Learning for Vision-Language Models [44.6]
後方互換性トレーニング(BT)は、新しいモデルが古いモデルの埋め込みと整合することを保証するために提案されている。本稿では、視覚のみのBTの概念を、クロスモーダル検索の分野に拡張する。本稿では,新しいモデルの埋め込みを古いモデルにマッピングするプロジェクションモジュールを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:48:38 GMT)
Learning-to-Context Slope: Evaluating In-Context Learning Effectiveness Beyond Performance Illusions [42.8]
In-context Learning (ICL) は,大規模言語モデルの性能向上に有効な手法として登場した。現在の評価手法は、信頼性の低下、属性の低下、データ不足のシナリオにおける非現実性に悩まされている。学習ゲインと文脈関連性の間の傾きをモデル化し,ICLの有効性を定量化する新しい指標であるLCSを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:55:37 GMT)
Predicting thinking time in Reasoning models [42.6]
推論モデルは長く隠れた思考の連鎖を生み出します。ユーザーは、答えを返す前にモデルが推論にどれくらいの時間を費やすかについての洞察がほとんどない。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:01:01 GMT)
DDL: A Dataset for Interpretable Deepfake Detection and Localization in Real-World Scenarios [42.3]
AIGCは悪意のあるディープフェイクコンテンツの誤用を悪化させた。既存のディープフェイク検出モデルは、検出基準において優れた性能を示す。法律などの重要な領域では、信頼性と決定の権威を高めるために解釈可能性が不可欠である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:29:03 GMT)
Towards a Generalized Theory of Observers [41.9]
我々は観察者が測定、参照フレーム、意味の出現に欠かせない基準点として機能すると主張している。この形式主義は、意識、量子計測、計算境界に関する議論に新たな光を当てている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:29:51 GMT)
MEMFOF: High-Resolution Training for Memory-Efficient Multi-Frame Optical Flow Estimation [41.9]
MEMFOFはメモリ効率のよい多フレーム光フロー法である。メソッドは1080pの入力に対して実行時に2.09GBのGPUメモリと28.5GBのトレーニングを必要とする。メソッドはSpringベンチマークで最初に1ピクセル (1px) の出力レートが3.289である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:01:42 GMT)
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning [41.7]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。既存のアプローチは静的知識に基づいてオープンループアクションスクリプトを生成する。結果駆動型強化学習フレームワークであるEmbodied Planner-R1を紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:31:24 GMT)
Hierarchical Memory Organization for Wikipedia Generation [41.6]
本稿では,ウィキペディア記事を自動生成するメモリ・オーガナイゼーション・ベース・ジェネレーション(MOG)フレームワークを紹介する。 MOGは、Webドキュメントからきめ細かいメモリ単位を抽出し、それらをウィキペディアスタイルの階層構造に整理し、この構造を用いて生成プロセスを導く。新たに作成したWikiStartデータセットの評価から,MOGは情報的かつ信頼性の高い記事を生成する上で,ベースライン手法よりも優れていることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:22:49 GMT)
Repair Ingredients Are All You Need: Improving Large Language Model-Based Program Repair via Repair Ingredients Search [41.5]
ReinFixは、バグ修正の推論と解決フェーズを通じて、修復材料を検索するフレームワークである。ソリューションフェーズでは、ReinFixは、同様のバグパターンで過去のバグ修正から外部の要素を検索する。 2つの人気のあるベンチマークによる評価は、SOTAベースラインに対するアプローチの有効性を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:02:11 GMT)
Beware of Calibration Data for Pruning Large Language Models [41.2]
トレーニング後のプルーニングは、リソース集約的な反復的なトレーニングを必要としない有望な方法である。キャリブレーションデータは、特に高頻度で訓練後の刈り取りにも重要である。キャリブレーションデータ構築のための自己生成型キャリブレーションデータ合成戦略を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:21:34 GMT)
A Comprehensive Study on Large Language Models for Mutation Testing [40.0]
大規模言語モデル(LLM)は、最近、研究作業と産業実践の両方においてミュータントを生成するために使用されている。 2つの異なるJavaの実際のバグベンチマークから得られた851の実際のバグについて、6つのLLMに関する総合的な実証研究の結果を報告する。我々の結果は、既存のルールベースのアプローチと比較して、LSMはより多様な変異を発生し、実際のバグに近づき、そして最も重要なことは、90.1%高い障害検出を持つことを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:07:17 GMT)
Solving Systems of Linear Equations: HHL from a Tensor Networks Perspective [39.6]
本稿では,量子HHLアルゴリズムに基づくテンソルネットワークを用いた線形方程式系の解法を提案する。まず、立方体形式論、量子ビットの一般化において新しい HHL を開発し、その後、その演算を同値な古典的 HHL に変換する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:13:04 GMT)
Integrating Large Language Models in Financial Investments and Market Analysis: A Survey [39.6]
大規模言語モデル (LLMs) は、投資戦略の分析能力を強化し、財政的な意思決定に用いられている。本研究は、株式選択、リスクアセスメント、感情分析、トレーディング、財務予測における最近のLCMs研究の構造化されたレビューを提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:25:31 GMT)
Multi-Branch DNN and CRLB-Ratio-Weight Fusion for Enhanced DOA Sensing via a Massive H$^2$AD MIMO Receiver [37.9]
H$2$ADは将来の6G無線ネットワークの潜在的な技術と見なされている。軽量クレーマー・ラオ下界(CRLB)-マグニチュード・ウェイト・フュージョン(WF)法を提案する。マルチブランチディープニューラルネットワーク(MBDNN)が構築され、位置検出の方向をさらに強化する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:14:59 GMT)
Composing Parts for Expressive Object Generation [37.8]
本研究では,微粒な部分レベル属性に基づく画像生成を可能にするトレーニング不要なPartComposerを紹介する。 PartComposerは、特定の拡散プロセスからオブジェクト領域を識別することで、オブジェクト部分をローカライズする。粒度の細かい部分属性に基づいて各部分領域に局所拡散プロセスを実行し,それらを組み合わせて最終画像を生成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:42:12 GMT)
Scaling Laws for Black box Adversarial Attacks [37.7]
逆例は通常、優れたクロスモデル転送性を示す。モデルアンサンブルは、敵の例の転送可能性を改善する効果的な戦略である。法則をスケールすることで、プロプライエタリなモデルでも90%以上のトランスファー攻撃の成功率を達成することができる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:32:50 GMT)
DC-TTA: Divide-and-Conquer Framework for Test-Time Adaptation of Interactive Segmentation [37.6]
Segment Anything Model (SAM)は、特殊なドメインや複雑なシナリオを扱う場合に苦労する。ユーザインタラクションを監視として活用し,SAMをサンプル単位に適応させる新しいテスト時間適応フレームワークであるDC-TTAを提案する。適応モデルをマージして、各サブセットから専門知識を統合する統一予測器を形成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:10:00 GMT)
Know You First and Be You Better: Modeling Human-Like User Simulators via Implicit Profiles [37.4]
我々は,人間と機械のインタラクションから暗黙のユーザプロファイルを推論し,パーソナライズされたリアルな対話をシミュレートする,インプリシットプロファイル付きユーザシミュレータ(USP)を紹介する。 USPは、同等の一貫性を維持しながら、信頼性と多様性の点で、強力なベースラインを上回ります。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:58:49 GMT)
The Oracle Complexity of Simplex-based Matrix Games: Linear Separability and Nash Equilibria [37.3]
我々は、$max_mathbfwinmathcalWmin_mathbfpinDeltamathbfptopAmathbfw$という形式の行列ゲームを解く問題を研究する。この問題は、線形セパレータの発見やゼロサムゲームにおけるナッシュ平衡の計算といった標準的なタスクをカプセル化する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:10:41 GMT)
Tracing Intricate Cues in Dialogue: Joint Graph Structure and Sentiment Dynamics for Multimodal Emotion Recognition [37.1]
マルチモーダル対話における複雑な感情的手がかりを追跡するために,GraphSmileという新しい手法が提案されている。 GraphSmileは2つの重要なコンポーネント、すなわちGSFとSDPモジュールから構成される。複数のベンチマークにおける実証的な結果は、GraphSmileが複雑な感情的および感情的パターンを処理可能であることを示している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:49:43 GMT)
Autoregressive Denoising Score Matching is a Good Video Anomaly Detector [37.0]
ビデオ異常検出(VAD)はコンピュータビジョンの重要な問題である。雑音条件付きスコア変換器を導入し、スコアマッチングを復調する。次に,シーン依存型,動き認識型スコア関数を提案する。我々は、新しい自己回帰型聴覚スコアマッチング機構を介して、影響を受けない視覚情報を統合する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:14:32 GMT)
SIEDD: Shared-Implicit Encoder with Discrete Decoders [36.7]
Inlicit Neural Representations (INR)は、ビデオごとの最適化機能を学ぶことによって、ビデオ圧縮に例外的な忠実度を提供する。既存のINRエンコーディングの高速化の試みは、しばしば再建品質や重要な座標レベルの制御を犠牲にしている。これらの妥協なしにINRエンコーディングを根本的に高速化する新しいアーキテクチャであるSIEDDを紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:39:43 GMT)
MMInA: Benchmarking Multihop Multimodal Internet Agents [36.2]
本稿では,マルチホップとマルチモーダルのベンチマークであるMMInAについて述べる。私たちのデータには、ショッピングや旅行など、さまざまな分野をカバーする1050の人書きタスクが含まれています。マルチホップタスクの完了におけるエージェントの進捗を評価するための新しいプロトコルを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:24:54 GMT)
Towards Generalized and Stealthy Watermarking for Generative Code Models [35.8]
実験の結果,コード要約タスクとコード生成タスクの両方において,CodeGuardが最大100%の透かし検証率を達成することがわかった。ステルス性に関しては、CodeGuard は OnION 検出方法に対して最大 0.078 の検出率で例外的に実行している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:42:05 GMT)
ATGen: A Framework for Active Text Generation [35.7]
テキスト生成タスクをALにブリッジする包括的なフレームワークであるActive Text Generation (ATGen)を紹介します。我々のフレームワークは、人間のアノテーションエージェントと自動アノテーションエージェントの両方を用いて、NLGタスクにおけるALを利用したアノテーションを単純化する。我々は、ATGenが人間のアノテーションの労力を減らし、LCMベースのアノテーションエージェントへのAPI呼び出しに関連するコストを削減できることを示します。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:27:48 GMT)
MoMa: Modulating Mamba for Adapting Image Foundation Models to Video Recognition [35.7]
MoMaは、完全な空間時間モデリングを実現する効率的なアダプタフレームワークである。事前学習したIMFに空間時間情報を注入するSeqMod演算を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:14:55 GMT)
Boosting LLM's Molecular Structure Elucidation with Knowledge Enhanced Tree Search Reasoning [35.0]
大規模言語モデル(LLM)は、複雑なタスクの分析と推論において、顕著な習熟度を示している。我々はモンテカルロ木探索をプラグインとしてテスト時間スケーリングに活用した分子構造解明のための知識強化推論フレームワーク(K-MSE)を紹介した。その結果, GPT-4o-mini と GPT-4o の両方で20%以上の改善が得られた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:00:38 GMT)
Frequency-enhanced Multi-granularity Context Network for Efficient Vertebrae Segmentation [34.0]
椎骨分割精度を向上させるために,周波数強調多粒性コンテキストネットワーク(FMC-Net)を導入する。高周波成分に対しては,HFR(High- frequency Feature Refinement)を適用し,特徴の顕著さを増幅する。低周波成分に対しては、多粒度状態空間モデル(MG-SSM)を用いて、異なる受容場を持つ特徴表現を集約する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:53:02 GMT)
AURA: Agent for Understanding, Reasoning, and Automated Tool Use in Voice-Driven Tasks [33.7]
AURA(Agent for Understanding, Reasoning, and Automated Tool Use)は、オープンソースの音声ネイティブアシスタントである。 AURAは、オープンウェイトなASR、TS、LLMをカスケードパイプラインに統合し、カレンダ予約、コンタクトルックアップ、Web検索、Eメールなどのツールをサポートする。 VoiceBenchでは、AURAは全オープンウェイトシステムで92.75%を上回り、AlpacaEvalではGPT-4oと4.39に近づき、他のオープンウェイトシステムと競合する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:13:15 GMT)
Curious Causality-Seeking Agents Learn Meta Causal World [33.2]
textbfMeta-Causal Graphを世界モデルとして紹介する。単一のMeta-Causal Graphは複数の因果部分グラフで構成され、それぞれがメタ状態によってトリガーされる。本手法は因果ダイナミクスのシフトを頑健に捉え,前例のない文脈に効果的に一般化する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:05:25 GMT)
CRISP-SAM2: SAM2 with Cross-Modal Interaction and Semantic Prompting for Multi-Organ Segmentation [32.5]
CRoss-modal Interaction と Semantic Prompting をベースとした CRISP-SAM2 という新しいモデルを提案する。このモデルは、臓器のテキスト記述によって導かれる多臓器医療セグメンテーションへの有望なアプローチを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:05:27 GMT)
A Survey of Test-Time Compute: From Intuitive Inference to Deliberate Reasoning [32.4]
テストタイム計算の概念をSystem-1モデルに遡る。システム1モデルから弱いシステム2モデルへの移行において,テスト時間計算が果たす重要な役割を強調した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:49:52 GMT)
High-quality Pseudo-labeling for Point Cloud Segmentation with Scene-level Annotation [32.0]
本稿では,シーンレベルのアノテーションに基づく屋内クラウドセマンティックセマンティックセグメンテーションについて検討する。現在のメソッドはまずポイントレベルの擬似ラベルを生成し、セグメンテーションモデルをトレーニングするために使用される。精度を高めるために,高品質な擬似ラベル生成フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:17:12 GMT)
Segment as You Wish -- Free-Form Language-Based Segmentation for Medical Images [30.7]
フリーフォームなテキストプロンプトを処理する新しい医用画像セグメンテーションモデルであるFLanSを紹介する。 FLanSは、7つの公開データセットから100万以上の医療画像の大規模なデータセットでトレーニングされている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:44:10 GMT)
DReSS: Data-driven Regularized Structured Streamlining for Large Language Models [30.5]
大規模言語モデル(LLM)は、様々な領域で大きな進歩を遂げているが、その規模が大きくなると高い計算とメモリコストがもたらされる。本稿では,まず正規化,次にプーン,そして最後に微細構造を適用する新しいパラダイムを提案する。プルーニングされるコンポーネントを正規化するために少量のデータを活用することで、DReSSは、重要な情報をモデルの残りの部分に前もって明示的に転送する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:25:00 GMT)
Rethinking Algorithmic Fairness for Human-AI Collaboration [29.3]
アルゴリズムフェアネスに対する既存のアプローチは、人間の意思決定者がアルゴリズムに完全に従えば、公平な結果を確保することを目的としている。我々は、独立して公平で、コンプライアンスが不当に公正で、人間のポリシーよりも正確であるアルゴリズムレコメンデーションを設計することは不可能であることを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:13:15 GMT)
A Context-aware Framework for Translation-mediated Conversations [29.2]
学習と推論において,バイリンガルな会話設定に文脈情報を組み込むことで,大規模言語モデルに基づく翻訳システムを改善する枠組みを提案する。提案するフレームワークは,2つのタスク指向ドメイン – ユーザチャットとユーザ-アシストインタラクション – で検証する。両方の設定で、フレームワーク-TowerChatで生成されたシステムは、GPT-4oやT TowerInstructのような最先端のシステムよりも優れた翻訳結果をもたらす。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:38:34 GMT)
Hierarchical Corpus-View-Category Refinement for Carotid Plaque Risk Grading in Ultrasound [29.0]
我々はCVC-RF(Corpus-View-Category Refinement Framework)を提案する。 CVC-RFはコーパスレベル、ビューレベル、カテゴリーレベルの情報を処理し、モデル性能を向上させる。実験結果から,CVC-RFは多レベル改良によるグローバルな特徴を効果的にモデル化できることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:20:15 GMT)
Where, What, Why: Towards Explainable Driver Attention Prediction [28.7]
これは空間的注意領域(場所)を共同で予測し、参加する意味論(何)を解析し、注意割当のための認知的推論(なぜ)を提供する新しいタスクパラダイムである。ドライバー注意予測のための大規模言語モデル駆動フレームワークであるLLadaを提案し、エンドツーエンドアーキテクチャ内でピクセルモデリング、セマンティック解析、認知推論を統合する。この研究は、自律運転、インテリジェントドライバートレーニング、人間とコンピュータの相互作用など、ドライバーの注意機構のより深い理解に向けた重要なステップとなる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:59:39 GMT)
3DRealCar: An In-the-wild RGB-D Car Dataset with 360-degree Views [28.1]
3D車は一般的に、自動運転システム、バーチャル/拡張現実、ゲームで使われている。既存の3Dカーデータセットは、合成または低品質であり、実用シナリオでの応用を制限する。 3DRealCarと呼ばれる,3つの特徴を備えた,最初の大規模3D実車データセットを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:33:43 GMT)
Dense Feature Interaction Network for Image Inpainting Localization [28.0]
画像中の欠落箇所を埋めるインペインティングは、一般的な画像編集技術である。本稿では,Dense Feature Interaction Network (DeFI-Net) に基づく新しい塗り絵検出手法について述べる。 DeFI-Netは、様々なステージにわたるマルチスケール表現をキャプチャして増幅するために、新しいピラミッドアーキテクチャを使用している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:36:56 GMT)
Decoding Memes: Benchmarking Narrative Role Classification across Multilingual and Multimodal Models [26.9]
本研究は,インターネットミームにおける物語的役割の特定という課題について考察する。元々は'他'クラスにスキューされたアノテーション付きデータセットの上に構築される。包括的語彙および構造解析は、実際のミームで使われるニュアンス、文化特化、文脈に富んだ言語を強調している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:12:11 GMT)
Spotlight-TTS: Spotlighting the Style via Voiced-Aware Style Extraction and Style Direction Adjustment for Expressive Text-to-Speech [26.7]
音声認識型スタイル抽出とスタイル方向調整によるスタイル強調を行うSpotlight-TTSを提案する。 TTSモデルへの最適統合のために,抽出したスタイルの方向を調整し,音声品質を向上する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:42:04 GMT)
CHARTOM: A Visual Theory-of-Mind Benchmark for LLMs on Misleading Charts [26.5]
CHARTOMはマルチモーダルな大規模言語モデルの能力を評価するために設計されたビジュアル・オブ・ミンド・ベンチマークである。 CHARTOMは、慎重に設計されたチャートと関連する質問で構成されており、言語モデルがチャートの事実を正しく理解するだけでなく(FACTの質問)、チャートが人間の読者に誤解をもたらすかどうかを判断する(MINDの質問)。我々は,人間のパフォーマンスの校正や,人間ミスリーディングネス指数(Human Misleadingness Index)と呼ばれるMIND基底真理の推定を含むベンチマークの構築について詳述する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:08:15 GMT)
GeoProg3D: Compositional Visual Reasoning for City-Scale 3D Language Fields [26.0]
GeoProg3Dは、都市規模の高忠実度3Dシーンとの自然言語駆動インタラクションを可能にするビジュアルプログラミングフレームワークである。本フレームワークでは,GV-APIを動的に組み合わせ,GCLFを動作させるための推論エンジンとして,大規模言語モデル(LLM)を採用している。実験により、GeoProg3Dは既存の3D言語フィールドや視覚言語モデルよりも大幅に優れていることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:03:03 GMT)
DSAC: Distributional Soft Actor-Critic for Risk-Sensitive Reinforcement Learning [25.7]
本稿では,蓄積した報酬の分布情報の強度とエントロピー駆動探索を組み合わせたDSACアルゴリズムを提案する。 DSACはアクションと報酬の両方のランダム性をモデル化し、様々な連続制御タスクのベースラインパフォーマンスを上回る。 DSACがリスクニュートラルおよびリスクセンシティブな制御タスクにおいて,エージェント性能を向上させる効果を示す実験を行った。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:33:14 GMT)
RoboScape: Physics-informed Embodied World Model [25.6]
本稿では、RGBビデオ生成と物理知識を共同で学習する統合物理インフォームドワールドモデルであるRoboScapeを紹介する。実験によると、RoboScapeは多様なロボットシナリオにまたがって、優れた視覚的忠実度と物理的妥当性を持つビデオを生成する。我々の研究は、エンボディドインテリジェンス研究を前進させるために、効率的な物理インフォームド世界モデルを構築するための新しい洞察を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:19:45 GMT)
HumanGif: Single-View Human Diffusion with Generative Prior [25.5]
本稿では, 先行生成に基づく単一ビューヒト拡散モデルであるHumanGifを提案する。具体的には、単一ビューに基づく3次元人間の新しいビューを定式化し、単一ビュー条件のヒト拡散過程として合成する。我々は,HumanGifが最高の知覚性能を達成し,新しい視点とポーズ合成の一般化性が向上したことを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:53:42 GMT)
Deep Support Vectors [24.9]
ディープラーニングモデルに対する従来のKKT条件の適応であるDeepKKT条件を提案する。これにより,本手法を数発のデータセット蒸留問題に適用し,深層学習モデルのブラックボックス特性を緩和することができる。我々は,DeepKKT条件が従来の分類モデルを高忠実度な生成モデルに変換することを実証した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:56:14 GMT)
Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment [24.1]
このような等変制約を緩和する手法を提案する。非同変拡散モデルが整列表現上で訓練される。実験結果から,本手法は従来報告した非同変モデルよりも優れた性能を示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:18:51 GMT)
Token Activation Map to Visually Explain Multimodal LLMs [23.8]
本稿では,文脈の干渉を軽減し,高品質なMLLM記述を実現するための因果推論手法を提案する。本稿では,トークン間の相互作用を考慮に入れたToken Activation Map (TAM) と呼ぶ。我々のTAM法は既存のSoTA法を著しく上回り、高品質な可視化結果を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:50:45 GMT)
FairI Tales: Evaluation of Fairness in Indian Contexts with a Focus on Bias and Stereotypes [23.7]
フェアネスに関する既存の研究は、主に西洋に焦点を絞っており、インドのような文化的に多様な国では不十分である。インドを中心とした総合的なベンチマークであるINDIC-BIASを導入し,85の社会アイデンティティグループを対象としたLCMの公平性を評価する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:31:06 GMT)
Research on Comprehensive Classroom Evaluation System Based on Multiple AI Models [23.0]
本稿では,教師の授業能力と授業効果の2つの側面から評価レポートと最適化提案を自動的に生成する総合評価システムを開発した。デジタル教育時代における全学的・プロセス指向の授業評価の要件を満たす。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:06:55 GMT)
Compositions of Variant Experts for Integrating Short-Term and Long-Term Preferences [22.8]
本稿では,推奨性能を高めるために,短期と長期の選好を組み合わせたフレームワークを提案する。この新しいフレームワークは、異なる専門的なレコメンデーションモデルを使用することで、短期および長期の好みを動的に統合する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:09:33 GMT)
Data Filtering for Genetic Perturbation Prediction [22.7]
グラフニューラルネットワークに基づく遺伝子発現モデルは、遺伝子摂動の結果を予測するために訓練される。アクティブな学習方法は、トレーニングセットを構築するのに必要なゲノム実験のコストのために、これらのモデルをトレーニングするためにしばしば使用される。能動的学習の代替としてグラフベースのデータフィルタリングを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:29:14 GMT)
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data [22.7]
我々は、まずモデルに応答する前に有害な要求を拒否するよう訓練する新しい微調整攻撃を提案する。この "refuse-then-comply" 戦略は浅い防御をバイパスし、出力フィルタを回避する有害な応答を生成する。われわれの攻撃はOpenAIから2000ドルのバグ報奨金を受け、Anthhropicによって脆弱性として認識された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:09:54 GMT)
TVG-SLAM: Robust Gaussian Splatting SLAM with Tri-view Geometric Constraints [22.1]
TVG-SLAMはRGBのみの堅牢な3DGS SLAMシステムである。本手法はロバスト性を向上し,平均的絶対軌道誤差(ATE)を69.0%削減し,最先端のレンダリング品質を実現する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:31:05 GMT)
Deep Multi-Manifold Transformation Based Multivariate Time Series Fault Detection [22.0]
本稿では, 近傍型データ拡張戦略と多次元表現学習フレームワークを組み合わせた新しい手法を提案する。提案手法は精度とロバスト性の両方において優れた性能を示し, 一般化と実世界の展開の可能性を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:17:13 GMT)
HyperPath: Knowledge-Guided Hyperbolic Semantic Hierarchy Modeling for WSI Analysis [21.4]
双曲空間における意味階層のモデル化を導くために,テキスト記述から知識を統合する新しい手法であるHyperPathを提案する。本手法は,病理視覚言語基盤モデルから抽出した視覚的特徴とテキスト的特徴を双曲空間に適用する。提案手法は,WSI解析におけるハイパーボリック埋め込みの可能性を強調し,既存の手法と比較してタスク間での優れた性能を実現する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:35:34 GMT)
Distillation and Refinement of Reasoning in Small Language Models for Document Re-ranking [21.2]
本稿では、推論集約型文書ランキングのための小言語モデルをトレーニングするための新しいアプローチを提案する。我々は Web データと教師 LLM を用いて,関連性の説明付き高品質な学習例を自動生成する。私たちのモデルは、他のアプローチよりもはるかに少ないパラメータを使用しながら、リーダーボードで3位です。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:22:03 GMT)
CountLLM: Towards Generalizable Repetitive Action Counting via Large Language Model [21.2]
繰り返しのアクションカウントは、フィットネス監視などのビデオ分析アプリケーションに有用である。我々は,ビデオデータと周期的テキストプロンプトを入力として取り出し,所望のカウント値を出力する,LLMに基づく最初の大規模言語モデルであるCountLLMを提案する。本研究では,周期性の特徴を記述し,整合性を確保するために標準化された応答形式を実装した命令のための周期性ベースの構造化テンプレートを開発する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:56:21 GMT)
SoMi-ToM: Evaluating Multi-Perspective Theory of Mind in Embodied Social Interactions [21.1]
SoMi-ToMベンチマークは,マルチエージェント複合社会相互作用におけるマルチパースペクティブToMを評価するために設計されている。我々は,35人の第三者視点映像,633人の一人称視点画像,1225人の専門家による複数選択質問を含む挑戦的なデータセットを構築した。その結果,SoMi-ToMではLVLMがヒトよりも有意に低下することが判明した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:54:13 GMT)
TyphoFormer: Language-Augmented Transformer for Accurate Typhoon Track Forecasting [21.0]
本稿では,自然言語記述を補助的プロンプトとして組み込んだTyphoFormerを提案する。各時間ステップ毎に,北大西洋ハリケーンデータベースに記録された数値属性に基づいて,Large Language Model (LLM) を用いて簡潔なテキスト記述を生成する。言語記述は、高レベルの気象学的意味を捉え、数値時系列入力に先立って、補助的な特別なトークンとして組み込まれている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:29:52 GMT)
MedLeak: Multimodal Medical Data Leakage in Secure Federated Learning with Crafted Models [20.9]
フェデレーション・ラーニング(FL)は、参加者がデータをローカルに保ちながら、機械学習モデルを協調的にトレーニングすることを可能にする。我々は、悪意のあるFLサーバが高品質なサイト固有の医療データを復元できる、MedLeakと呼ばれる新しいプライバシ攻撃を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:48:58 GMT)
Dynamic Contrastive Learning for Hierarchical Retrieval: A Case Study of Distance-Aware Cross-View Geo-Localization [20.9]
既存のディープラーニングを用いたクロスビュージオローカライズ手法は主に、クロスドメイン画像マッチングの精度向上に重点を置いている。特徴表現を階層的空間的マージンに応じて段階的に整列させる新しいフレームワークである動的コントラスト学習(DyCL)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:57:01 GMT)
GaussMaster: An LLM-based Database Copilot System [20.7]
GaussMaster は LLM ベースのデータベース協調システムを導入することで、ランドスケープに革命をもたらすことを目指している。データベースインスタンスが異常な振る舞いを示す場合、GussMasterはメンテナンスプロセス全体を自動でオーケストレーションすることができる。我々は、銀行業界のような現実のシナリオにおいて、GussMasterをうまく実装し、人間の介入をゼロにしました。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:39:31 GMT)
Learning Dynamics of LLM Finetuning [20.7]
各種ファインタニングにおける大規模言語モデルの学習力学について検討する。我々のフレームワークは、命令チューニングと選好チューニングの両方のための一般的なアルゴリズムのトレーニングに関する多くの興味深い観察を均一に解釈することができる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:43:22 GMT)
BridgeShape: Latent Diffusion Schrödinger Bridge for 3D Shape Completion [20.7]
BridgeShapeは、潜伏拡散型Schr"odingerブリッジによる3次元形状完成のための新しいフレームワークである。本稿では,Depth-Enhanced Vector Quantized Variational Autoencoder (VQ-VAE)を導入し,3次元形状をコンパクトな潜在空間に符号化する。 BridgeShapeは、大規模な3D形状補完ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:21:21 GMT)
PCLVis: Visual Analytics of Process Communication Latency in Large-Scale Simulation [20.5]
本稿では,プロセス通信遅延(PCL)イベントの解析を支援するPCLVisというフレームワークを提案する。物理リンク層情報の代わりに、PCLVisは解析にMPIプロセス通信データを使用する。 PCLVisフレームワークの有効性は、TH-1Aスーパーコンピュータ上で実行されるいくつかのシミュレーションのPCLイベントを分析することで実証される。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:28:10 GMT)
Multi-Source COVID-19 Detection via Variance Risk Extrapolation [19.8]
マルチソースの新型コロナウイルス検出チャレンジは、胸部CTスキャンを4つの病院や医療センターから収集されたデータから、新型コロナウイルスと非新型コロナウイルスのカテゴリーに分類することを目的としている。このタスクにおける大きな課題は、イメージングプロトコル、スキャナー、および組織全体にわたる患者の人口の変化によって引き起こされるドメインシフトである。我々は,モデルのクロスドメイン一般化を促進するために,VREx(Variance Risk Extrapolation)をトレーニングプロセスに組み込んだ。本手法は, 検証セット上の4つの情報源の平均マクロF1スコアが0.96であり, 強い一般化が示されている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:34:57 GMT)
Endo-4DGX: Robust Endoscopic Scene Reconstruction and Illumination Correction with Gaussian Splatting [19.8]
Endo-4DGXは照明適応型ガウススプラッティングを用いた新しい再構成法である。ガウスレベルの準領域光度をモデル化するための領域認識拡張モジュールを提案する。我々は、照度適応最適化のために、通常レベルへの悪暴露から外観を回復するために露光制御損失を用いる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:54:15 GMT)
Brevity is the soul of sustainability: Characterizing LLM response lengths [19.7]
大規模言語モデル(LLM)は、必要よりもかなり長い応答を生成する。 LLMは最小限の答え以外に冗長または追加の情報を含む傾向がある。提案手法により,25～60%のエネルギー最適化を実現することができることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:48:15 GMT)
Text2VectorSQL: Bridging Text-to-SQL and Vector Search for Unified Natural Language Queries [19.6]
Text2 - Text-to-とベクトル検索を統合する新しいフレームワークを紹介する。 Text2はセマンティックフィルタリング、マルチモーダルマッチング、検索アクセラレーションを可能にする。合成データを用いた専用Text2モデルを開発し,ベースライン法よりも優れた性能を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:17:42 GMT)
Masked Gated Linear Unit [19.6]
Masked Gated Linear Units (MGLU) は、GLUの新しいファミリーであり、効率的なカーネル実装である。 FlashMGLUは、単純なPyTorch MGLUよりも19.7$times$推論タイムで高速化される。実験では、SwiGLUはSwiGLUベースラインの下流精度をマッチング(あるいは超える)しながら、メモリの利点を保っている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:16:20 GMT)
ZipAR: Parallel Auto-regressive Image Generation through Spatial Locality [19.5]
ZipARは、自動回帰(AR)ビジュアル生成のためのトレーニング不要でプラグ&プレイの並列デコーディングフレームワークである。 ZipARは、追加の再トレーニングを必要とせずに、Emu3-Genモデルでモデル転送回数を最大91%削減できる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:13:36 GMT)
Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery [19.4]
反復重み付き最小広場(IRLS)は、部分空間推定に対するエレガントで経験的に効果的なアプローチである。本稿では, 決定論的条件下では, 動的正則化を持つ不変IRLSが基底部分空間に線形に収束することを示す。我々はこれらの保証を、事前の回復理論を欠いた部分空間推定に拡張する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:53:45 GMT)
OmniEval: A Benchmark for Evaluating Omni-modal Models with Visual, Auditory, and Textual Inputs [19.2]
オムニエバル(OmniEval)は、オムニモダリティモデルを評価するためのベンチマークである。音声と映像の強い結合を強調する評価タスクを設計する。いくつかのOmni-modalityモデルを用いてOmniEvalの実験を行う。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:16:22 GMT)
Transformer-Based Person Search with High-Frequency Augmentation and Multi-Wave Mixing [18.9]
人物探索のための新しい高周波増幅・マルチウェーブ混合法を提案する。 HamWは変圧器の識別的特徴抽出能力を高めるように設計されている。 HamWはCUHK-SYSUデータセットとPRWデータセットの両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:08:26 GMT)
CoreMark: Toward Robust and Universal Text Watermarking Technique [18.5]
本稿では,複数の黒画素セグメントを連続的に配置した新しい埋め込みパラダイムであるCOREを提案する。 COREに基づいて,CoreMarkというテキスト透かしフレームワークを提案する。 CoreMarkは、スクリーンショット、プリントスキャン、およびプリントカメラアタックに対する抵抗の大幅な改善を実現している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:57:49 GMT)
Flow-Modulated Scoring for Semantic-Aware Knowledge Graph Completion [18.5]
Flow-Modulated Scoring(FMS)は、コンテキスト依存とリレーショナルダイナミクスをキャプチャするフレームワークである。 FMSは,(1)コンテキストに敏感なエンティティ表現をエンコードする意味文脈学習モジュール,(2)条件付きフローマッチングモジュールの2つの主要コンポーネントから構成される。提案手法は,従来の成果を超越した手法である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:22:04 GMT)
Context-Driven Knowledge Graph Completion with Semantic-Aware Relational Message Passing [18.5]
三重項 $(h, r, t)$ を取り巻く意味的文脈は知識グラフ補完(KGC)にとって不可欠である従来のノードベースのメッセージパッシング機構は、しばしばノイズを導入し、情報の希釈や過度な平滑化に悩まされる。セマンティック・アウェア・リレーショナル・メッセージ・パッシング・フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:37:48 GMT)
Automating Versatile Time-Series Analysis with Tiny Transformers on Embedded FPGAs [18.2]
本稿では,組み込みFPGA上でのTiny Transformersの統一的かつ完全に自動化されたデプロイメントフレームワークを提案する。我々のフレームワークは、3つの典型的な時系列タスクにまたがるコンパクトエンコーダのみのトランスフォーマーアーキテクチャをサポートしている。その結果,AMD Spartan-7では,1推論あたり0.033mJとミリ秒のレイテンシで達成できる,整数のみのタスク固有のトランスフォーマーアクセラレータを作成した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:00:27 GMT)
Relating Events and Frames Based on Self-Supervised Learning and Uncorrelated Conditioning for Unsupervised Domain Adaptation [18.0]
イベントベースのカメラは、コンピュータビジョンタスクを実行するための正確かつ高時間分解能の測定を提供する。それらの利点にもかかわらず、イベントベースのビジョンにディープラーニングを活用することは、注釈付きデータの不足のために大きな障害に直面する。本稿では、イベントベースの未注釈データに基づいて、注釈付きフレームベースのデータに基づいてトレーニングされたディープニューラルネットワークを適用するための新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:51:22 GMT)
Investigating an Overfitting and Degeneration Phenomenon in Self-Supervised Multi-Pitch Estimation [17.8]
マルチピッチ推定 (MPE) は、音楽情報検索 (MIR) システムの機能を追求し続けている。我々は、いくつかの自己監督的目的を取り入れることで、古典的教師付きMPEパラダイムを拡張した。我々は,モデルが教師付きデータに同時に適合し,自己スーパービジョンにのみ使用されるデータに基づいてデジェネレーションを行う現象を明らかにする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:10:51 GMT)
KeTS: Kernel-based Trust Segmentation against Model Poisoning Attacks [17.7]
フェデレートラーニング(FL)は、ユーザが個人データを公開せずに、グローバルモデルを分散的にトレーニングすることを可能にする。 FLは、悪意のあるアクターが世界のモデルの精度を損なうためにアップデートを作成した、モデル中毒攻撃に対して脆弱なままである。本稿では,新たな防御機構であるKernel-based Trust(KeTS)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:32:53 GMT)
A Practical and Secure Byzantine Robust Aggregator [17.7]
ビザンチンのロバストアグリゲーションは、ベクトルのロバスト平均を計算するアルゴリズムプリミティブである。入力ベクトルのサイズにおいて準線形時間で動作し、ほぼ最適バイアス境界を持つ最初のロバストアグリゲータを与える。我々のアルゴリズムは、クリーンベクトルの分布に関する知識を前提とせず、フィルターしきい値の事前計算も必要としない。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:53:54 GMT)
VolumetricSMPL: A Neural Volumetric Body Model for Efficient Interactions, Contacts, and Collisions [17.5]
パラメトリックな人体モデルはコンピュータグラフィックスと視覚において重要な役割を担い、人間の動作分析から人間と環境の相互作用を理解するためのアプリケーションを可能にする。この制限に対処するため、最近の研究では、容積的な暗黙の身体モデルについて研究している。本稿では,コンパクトで効率的なデコーダを生成するニューラルネットワークモデルであるVolumetricSMPLを紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:48:38 GMT)
Sub-MoE: Efficient Mixture-of-Expert LLMs Compression via Subspace Expert Merging [17.5]
Sub-MoE は Subspace Expert Merging による新しい MoE 圧縮フレームワークである。我々の重要な洞察は、専門家の重み付けでSingular Value Decomposition(SVD)を共同で行うことです。当社のSub-MoEは、既存のエキスパートプルーニングやマージ方法よりも大幅に優れています。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:43:50 GMT)
Ovis-U1 Technical Report [17.2]
我々は,マルチモーダル理解,テキスト・ツー・イメージ生成,画像編集機能を統合した統一モデルであるOvis-U1を紹介する。テキスト・画像生成では、それぞれ DPG-Bench と GenEval のベンチマークで 83.72 と 0.89 のスコアを出力する。画像編集では、ImgEdit-BenchとGEdit-Bench-ENでそれぞれ4.00と6.42を達成している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:40:17 GMT)
Trotterization, Operator Scrambling, and Entanglement [17.0]
演算子スクランブルは、多体系における量子情報の拡散を支配している。演算子力学のシミュレーションにおけるトロッター誤差は演算子スクランブルの度合いによって制限されることを示す。また,システムの絡み合いが低い状態であっても,演算子による絡み合いは発生し,シミュレーションエラーを抑えることができることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:39:54 GMT)
Creativity in AI: Progresses and Challenges [17.0]
我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:35:17 GMT)
VeriLoC: Line-of-Code Level Prediction of Hardware Design Quality from Verilog Code [17.0]
We propose VeriLoC, the first method that predicting design quality from Verilog at the line- and module-level。 VeriLoCは、ラインレベルの混雑とタイミング予測のために0.86-0.95の高いF1スコアを達成し、平均平均パーセンテージ誤差を14%から18%まで減らす。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:51:01 GMT)
RPHunter: Unveiling Rug Pull Schemes in Crypto Token via Code-and-Transaction Fusion Analysis [16.9]
Rug Pullの詐欺は暗号通貨に対する永続的な脅威として浮上している。現在の方法は、コードリスクを検出するために事前に定義されたパターンに依存するか、統計的トランザクションデータを使用して検出モデルをトレーニングする。我々は,RPHunterを提案する。RPHunterは,ラグプル検出のためのコードとトランザクションを統合する新しい手法である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:39:05 GMT)
Deepfake Caricatures: Amplifying attention to artifacts increases deepfake detection by humans and machines [16.4]
ディープフェイクビデオのアーティファクトを増幅するフレームワークを導入し、人々がより検出できるようにする。ユーザスタディでは,映像提示時間やユーザエンゲージメントレベルを通じて,Caricaturesが人間の検出を大幅に増加させることを示した。また,Artifact Attentionモジュールを組み込んだディープフェイク検出モデルを導入し,精度とロバスト性を向上させる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:43:18 GMT)
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models [16.3]
モデル動作を厳格に評価するために、1.067の課題を伴う人為的な安全データセットをリリースする。 4つの学習後量子化(PTQ)法と2つの量子化対応訓練(QAT)法を用いて、4つの大言語モデルの66の量子化変種を評価する。以上の結果から,PTQとQATは安全アライメントの低下を招き,QLORAやSTEなどのQAT技術は安全性の低下を図っている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:20:45 GMT)
Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets [16.3]
本研究では,協調ゲームで構築した自己合理化フレームワークについて検討する。このような協調ゲームは、有理抽出中に意図せずサンプリングバイアスを生じさせる可能性がある。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:25:46 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1]
本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:16:19 GMT)
Automatic Depression Assessment using Machine Learning: A Comprehensive Survey [16.1]
うつ病は現在の社会に共通する精神疾患である。最近のADA調査は、通常、限られた数の人間の行動モダリティだけに焦点を当てている。本論文は, うつ病関連ヒトの行動について, 様々に要約する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:44:28 GMT)
Multimodal Medical Code Tokenizer [15.8]
既存のトークン化器は、EHRからの医療コードを独立したテキストトークンとして扱う。我々はMedTokを紹介した。MedTokはマルチモーダルな医療用コードトークンで、コードのテキスト記述とリレーショナルコンテキストを利用する。本研究は,MedTokが医法コードの統一トークン化ツールとしての可能性を示し,医療基盤モデルのトークン化を改善したものである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:09:34 GMT)
Learning to Rank with Variable Result Presentation Lengths [15.8]
ランク付け法を学ぶことは、上位Kランクのそれぞれの文書が同等のフォーマットで表示されると仮定する。本稿では,文書の順序と提示期間を同時に決定する可変表示長ランキングタスクを提案する。実験の結果,VLPLは期待されるすべてのドキュメントの露出と魅力を効果的にバランスさせ,異なるランキング設定で最高のパフォーマンスを実現することができることがわかった。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:28:17 GMT)
Data Can Speak for Itself: Quality-guided Utilization of Wireless Synthetic Data [15.6]
生成モデルは、現実のデータセットの量を補完する現実的な合成データを生成する。合成データの質は予測不可能であり、結果として得られる性能向上は保証されない。タスクモデルトレーニング中に合成データ品質を緩和する品質誘導型合成データ利用スキームであるSynCheckを紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:17:39 GMT)
Accelerate 3D Object Detection Models via Zero-Shot Attention Key Pruning [15.4]
3次元オブジェクト検出モデルにおけるトランスフォーマーデコーダのゼロショット実行時プルーニング法を提案する。提案手法は,ToC3Dモデルのトランスデコーダにおける1.99倍の高速化を実現する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:23:00 GMT)
VisualPrompter: Prompt Optimization with Visual Feedback for Text-to-Image Synthesis [15.4]
VisualPrompterはトレーニングフリーのプロンプトエンジニアリングフレームワークで、ユーザー入力をモデル優先の文に洗練する。本フレームワークは,テキスト画像アライメント評価のための複数のベンチマーク上で,最先端性能を実現する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:24:39 GMT)
Competitive Distillation: A Simple Learning Strategy for Improving Visual Classification [15.0]
本稿では,グループ内の各ネットワークが,その性能に基づいて教師として機能する可能性のある,新たな競争力のある蒸留戦略を提案する。実験結果から, 多様なタスクやデータセットにおいて, 競争蒸留が有望な性能を達成できることが示唆された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:15:33 GMT)
The Societal Impact of Foundation Models: Advancing Evidence-based AI Policy [14.7]
論文は、AIの時代において、テクノロジーと社会がどのように共進化し、3つのテーマを中心に組織されたかを説明している。第一に、概念的フレーミング(conceptual framing)は、幅広い経済において基盤モデルの基礎となる能力、リスク、サプライチェーンである。第二に、概念的基盤を豊かにする実証的な洞察: モデルレベルでの評価と組織レベルでのインデックスを通じて生成される透明性。第3に、理解から行動への転換:基礎モデルの社会的影響の優れた理解は、エビデンスベースのAIポリシーを前進させる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:16:48 GMT)
From Individuals to Interactions: Benchmarking Gender Bias in Multimodal Large Language Models from the Lens of Social Relationship [13.4]
我々はジェネレス(Genres)について紹介する。ジェネレス(Genres)は、MLLMにおけるジェンダーバイアスを評価するための新しいベンチマークである。本研究は,MLLMにおける性差の微妙な性差の診断における関係認識ベンチマークの重要性を裏付けるものである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:03:21 GMT)
DEL: Dense Event Localization for Multi-modal Audio-Visual Understanding [13.3]
DELは、密集したセマンティックアクションローカライゼーションのためのフレームワークである。 DELは、長い未編集ビデオにおいて、きめ細かい時間分解能で複数のアクションを正確に検出し、分類することを目的としている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:50:19 GMT)
AlignCVC: Aligning Cross-View Consistency for Single-Image-to-3D Generation [13.1]
事前学習された生成モデルによって合成された中間的多視点画像は、しばしばクロスビュー一貫性(CVC)を欠いている本稿では,分散アライメントによる単一画像から3D生成を根本的に再構成する新しいフレームワークAlignCVCを紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:01:28 GMT)
Neurons: Emulating the Human Visual Cortex Improves Fidelity and Interpretability in fMRI-to-Video Reconstruction [13.1]
NEURONSは、学習を4つの相関したサブタスクに分離するコンセプトフレームワークである。これは視覚野の機能的特殊化をシミュレートし、モデルが多様なビデオコンテンツをキャプチャすることを可能にする。 NEURONSは視覚野と強い機能相関を示し、脳とコンピュータのインターフェースと臨床応用の可能性を強調している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:53:40 GMT)
Equivariance Everywhere All At Once: A Recipe for Graph Foundation Models [13.1]
ノードレベルのタスクのためのグラフ基盤モデルを第一原理から設計するためのレシピを提案する。本研究の基盤となる重要な要素は,グラフ基盤モデルが尊重すべき対称性を体系的に調査することである。我々は29の実世界のノード分類データセットに関する広範な実験を通して、我々のアプローチを検証する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:47:57 GMT)
GATSim: Urban Mobility Simulation with Generative Agents [12.9]
GATSimは、都市移動シミュレーションのためのリッチな行動特性を持つ生成エージェントを作成するための新しいフレームワークである。この研究における生成エージェントは、特定の旅行体験を一般化された洞察に変換することができる。実験により, 生成因子は移動シナリオにおいてヒトアノテータと競争的に作用することが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:52:16 GMT)
Adversarial Robustness Unhardening via Backdoor Attacks in Federated Learning [12.2]
フェデレーション学習は、データを共有することなく、協調モデルのトレーニングを可能にする。このアプローチはセキュリティ上の問題、特に中毒やバックドア攻撃を引き起こす。本稿では,敵対的クライアントのサブセットで使用されるARU(Adversarial Robustness Unhardening)を紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:25:01 GMT)
Theoretical Modeling of LLM Self-Improvement Training Dynamics Through Solver-Verifier Gap [12.2]
理論的には、ソルバ検証ギャップの概念を用いて自己改善の訓練力学をモデル化する。分析を拡張して、外部データがフレームワーク内のこれらのダイナミクスにどのように影響するかを調べます。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:48:47 GMT)
Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks [12.2]
本稿では,遅延拡散モデル(LDM)をFF手法に組み込んだリアルタイム適応ビットレートビデオストリーミングのための新しいフレームワークを提案する。提案手法はLDMを利用してIフレームを潜在空間に圧縮し,ストレージとセマンティックトランスミッションの大幅な節約を実現する。この作業は、5Gおよび将来の5Gネットワークにおけるスケーラブルなリアルタイムビデオストリーミングの新たな可能性を開く。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:37:30 GMT)
CalFuse: Feature Calibration Enhanced Parameter Fusion for Class-Continual Learning [12.0]
CCL(Class-Continual Learning)は、モデルが従来のクラスを維持しながら、新しいクラスの知識を継続的に学習することを可能にする。従来のCCLメソッドは視覚的特徴に依存しており、複雑なマルチモーダルシナリオでの有効性を制限している。動的知識融合を行う拡張パラメータ融合のためのフレームワークであるCalFuseを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:05:21 GMT)
The Next Phase of Scientific Fact-Checking: Advanced Evidence Retrieval from Complex Structured Academic Papers [11.9]
この問題は、科学知識の進化する性質に適合しなければならないため、一般的な事実チェックよりも本質的に複雑である。既存のアプローチでは、抽象データからなる小規模データセットに基づいて、問題の簡易バージョンに重点を置いている。本稿では,現状の科学的ファクトチェックシステムの限界について検討し,その性能向上に活用できる潜在的な特徴と資源を明らかにする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:57:01 GMT)
Are Large Language Models Capable of Deep Relational Reasoning? Insights from DeepSeek-R1 and Benchmark Comparisons [11.4]
3つの最先端大規模言語モデル(LLM)の推論能力の評価と比較を行った。 DeepSeek-R1は、複数のタスクと問題サイズにまたがる最高F1スコアを一貫して達成している。 DeepSeek-R1の長時間の連鎖反応の詳細な分析により、独自の計画と検証戦略が明らかになった。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:37:49 GMT)
Quantum Physics-Informed Neural Networks for Maxwell's Equations: Circuit Design, "Black Hole" Barren Plateaus Mitigation, and GPU Acceleration [10.9]
二次元(2次元)時間依存マクスウェル方程式を解くために量子物理情報ニューラルネットワーク(QPINN)フレームワークを提案する。以上の結果から,QPINNは従来のPINNベースラインよりも精度が高く,さらに高い結果が得られることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:10:38 GMT)
Automated Vehicles Should be Connected with Natural Language [10.6]
マルチエージェント共同運転は、集合認識と意思決定による交通安全と効率の向上を約束する。既存の通信媒体は、帯域幅の効率、情報の完全性、エージェントの相互運用性に制限がある。これらの課題に対処するには、純粋に知覚指向のデータ交換から、自然言語を用いた明示的な意図と推論コミュニケーションへの移行が必要である、と我々は主張する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:41:19 GMT)
Multi-Modal Recommendation Unlearning for Legal, Licensing, and Modality Constraints [10.3]
本稿では,MMRS と未学習項目データにおける非学習に関する最初のアプローチである MMRecUn を紹介する。 MMRecUnはベースライン方式に比べて最大49.85%のリコール性能向上を実現している。ゴールドモデルよりも最大1.3倍速く、スクラッチからセットを保持するように訓練されている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:33:18 GMT)
Incomplete Multi-view Clustering via Diffusion Contrastive Generation [10.3]
拡散コントラスト生成 (Diffusion Contrastive Generation, DCG) と呼ばれる新しいIMVC法を提案する。 DCGは分布特性を学習し、フォワード拡散および逆復調処理をビュー内データに適用することによりクラスタリングを強化する。インスタンスレベルとカテゴリレベルの対話型学習を統合し、マルチビューデータで利用可能な一貫性のある補完的な情報を活用する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:58:32 GMT)
MetaSynth: Meta-Prompting-Driven Agentic Scaffolds for Diverse Synthetic Data Generation [10.2]
本稿では,メタプロンプトによる多様性を高める合成データ生成手法を提案する。我々は、よく訓練されたLSMをFinanceとBiomedicineの2つの専門領域に適応させることに成功した。以上の結果から, 実データと混合することなく, 数百万の多様な合成データのトークンを合成することは, 効果的なドメイン適応に十分であることが示唆された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:24:07 GMT)
From Release to Adoption: Challenges in Reusing Pre-trained AI Models for Downstream Developers [10.2]
プレトレーニングモデル(PTM)は広く普及し、様々な分野で大きな成功を収めている。しかしながら、ソフトウェアシステムでPTMを再利用する上で、下流開発者が直面している課題は、あまり調査されていない。私たちは、31のOSS GitHubプロジェクトから840のPTM関連イシューレポートのデータセットを質的に作成し、分析しました。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:36:58 GMT)
Pipelined Decoder for Efficient Context-Aware Text Generation [10.2]
自己回帰モデルは、以前に生成されたすべてのトークンに依存する新しいトークンを生成する必要がある。本稿では,コンテキスト認識タスクに対して,テキストを効率的に並列に生成するデコーダアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:37:24 GMT)
Structure-Aware Radar-Camera Depth Estimation [10.1]
本稿では,SA-RCDという構造認識型レーダーカメラ深度推定フレームワークを提案する。我々のSA-RCDはnuScenesデータセット上で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:21:04 GMT)
Synergizing Implicit and Explicit User Interests: A Multi-Embedding Retrieval Framework at Pinterest [9.9]
検索ステージは、候補項目のハイリコールセットを生成する上で重要な役割を果たす。従来の2-towerモデルは、ユーザとイテムの機能相互作用が限られているため、この点において苦労する。ユーザの興味を表現できる新しいマルチ埋め込み検索フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:14:21 GMT)
CycleVAR: Repurposing Autoregressive Model for Unsupervised One-Step Image Translation [9.6]
現在の条件付き自己回帰画像生成手法は有望な結果を示しているが、実際の教師なし画像翻訳領域では、その可能性はほとんど解明されていない。臨界制限は、伝統的なベクトル量子化に基づくフレームワークに固有の離散量子化に由来する。我々は,連続確率混合プロセスとしてコードブックの選択を再構成する新しい手法であるSoftmax Relaxed Quantizationを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:43:04 GMT)
Double-Diffusion: Diffusion Conditioned Diffusion Probabilistic Model For Air Quality Prediction [8.8]
二重拡散(double-Diffusion)は、既知の物理学の力を利用して時間とともに空気の質を予測する新しい拡散確率モデルである。二重拡散は、他の確率論的モデルと比較して、ほとんどの実生活データセットで第1位である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:45:47 GMT)
Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes [8.7]
本稿では、ロバスト制約付きマルコフ決定過程(RCMDP)に対するミラー降下ポリシーの最適化について述べる。我々は政策勾配法を用いて、制約されたMDPを表すラグランジアン上のポリシー(最大値)と遷移カーネル(最小値)の両方を最適化する。実験は、制約付きおよび制約なしの最適化におけるミラー降下ポリシー最適化の利点を確認し、ロバストネステストで顕著な改善が観察された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:55:52 GMT)
TOMI: Transforming and Organizing Music Ideas for Multi-Track Compositions with Full-Song Structure [8.7]
ディープ・ミュージック・ジェネレーションにおける新しいアプローチとしてTOMI(Transforming and Organizing Music Ideas)を紹介する。ビデオクリップ(短い音声またはMIDIセグメント)、セクション(時間的位置)、トラック(構造層)、変換によって特徴付けられる、スパースな4次元空間を介して、多トラック合成プロセスを表現する。本モデルでは,マルチトラックの電子楽曲を全曲構造で生成することが可能であり,TOMIモデルとREAPERデジタルオーディオワークステーションをさらに統合する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:15:41 GMT)
Dare to Plagiarize? Plagiarized Painting Recognition and Retrieval [8.7]
我々は,画像の収集と生成AIを用いた画像の合成によりデータセットを構築した。まず、視覚基礎モデルDINOv2のオフザシェルフ機能を用いてベースラインアプローチを確立し、データベース内の最も類似した画像を検索する。データベースにサンプルした正と負のサンプルペアを用いて,DINOv2を計量学習損失で精査した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:58:53 GMT)
AI Awareness [8.5]
我々は、メタ認知、自己認識、社会的認識、状況認識を含む、AI認知の新たな展望を考察する。 AIの安全性、アライメント、より広範な倫理的懸念など、AIの認識に関連するリスクについて議論する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:03:19 GMT)
Bayes correlated equilibria, no-regret dynamics in Bayesian games, and the price of anarchy [8.4]
本稿では,非直交スワップ後悔を線形上界で最小化するための効率的なアルゴリズムを提案する。我々は、ベイズ-ナッシュ均衡から平衡への滑らかさの議論に基づいて、アナーキーの価格に関する既存の下限を拡大する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:53:00 GMT)
TigerLLM -- A Family of Bangla Large Language Models [8.3]
バングラ語モデルのファミリーであるTigerLLMを紹介します。以上の結果から,これらのモデルがすべてのオープンソース代替品を上回り,GPT3.5のような大型のプロプライエタリモデルを上回る結果が得られた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:00:53 GMT)
External Data-Enhanced Meta-Representation for Adaptive Probabilistic Load Forecasting [8.2]
予測モデル自体を動的に適応させるために、外部データはメタ知識として機能すべきである。我々は、ハイパーネットワークを使用して、外部条件に応じてベースディープラーニング(DL)モデルの選択されたパラメータを変調する。得られたモデルは、追加オーバーヘッドを限定して精度と堅牢性を大幅に改善する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:07:18 GMT)
Datasets for Fairness in Language Models: An In-Depth Survey [8.2]
本調査では,現在の言語モデル研究において,最も広く用いられている公平性データセットについて検討する。我々は、データセットとスコアリングメソッド間の人口格差の一貫したパターンを明らかにする統一評価フレームワークを導入する。モデルフェアネスに関する結論に影響を与えることがしばしば見過ごされるバイアスを強調し、これらのデータセットを選択し、組み合わせ、解釈するための実践的なガイダンスを提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:11:58 GMT)
PixelBoost: Leveraging Brownian Motion for Realistic-Image Super-Resolution [8.0]
拡散モデルに基づく画像超解像技術は、しばしば現実的な画像生成と計算効率のトレードオフに直面している。我々は,ブラウン運動の性質を受け入れることの重要性を浮き彫りにする新しい拡散モデル PixelBoost を紹介する。提案モデルでは,学習された知覚的イメージパッチ類似度 (LPIPS), 順序誤差 (LOE), ピーク信号-雑音比 (PSNR), 構造的類似度指標 (SSIM) および視覚的品質の観点から,より優れた客観的結果を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:22:38 GMT)
AutoToM: Scaling Model-based Mental Inference via Automated Agent Modeling [8.0]
AutoToMは、スケーラブルで堅牢で解釈可能なメンタル推論のための自動エージェントモデリング手法である。我々は,AutoToMが人間のような信頼度を推定し,具体的意思決定のためのオンライン精神推論を可能にすることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:18:27 GMT)
Unsupervised 3D Braided Hair Reconstruction from a Single-View Image [7.9]
シングルビュー画像から3D編まれた髪型を再構築することは、複雑な編み込み構造と複雑な編み込みのトポロジーのために難しい課題である。既存のストランドベースの髪の復元法は、通常、ゆるい髪型に焦点を合わせ、しばしば編んだ髪の細かい形状を捉えようと苦労する。単視点RGB画像から3D編髪を効率的に再構築するための新しい教師なしパイプラインを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 03:23:06 GMT)
Score-based Diffusion Model for Unpaired Virtual Histology Staining [7.6]
ヘマトキシリンとエオシン(H&E)染色は組織学を可視化するが、診断マーカーには特異性がない。ヘマトキシリンおよびエオシン(H&E)染色はタンパク質標的染色を提供するが、組織可用性と抗体特異性によって制限される。仮想染色、すなわち組織構造を保存しながらH&E画像をIHCに変換することで、効率的なIHC生成が期待できる。本研究では,相互情報を用いた仮想染色のためのスコアベース拡散モデルを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:02:45 GMT)
TMN: A Lightweight Neuron Model for Efficient Nonlinear Spike Representation [7.5]
スパイク・トレインはスパイク・ニューラル・ネットワークにおける情報伝達の主要な媒体である。スパイク数やタイミングに基づく既存の符号化スキームは、しばしば低ステップの制約の下で厳しい制限に直面している。本稿では,2つの重要なイノベーションを特徴とする新しいニューロンモデルであるTernary Momentum Neuron (TMN)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:20:41 GMT)
IR3D-Bench: Evaluating Vision-Language Model Scene Understanding as Agentic Inverse Rendering [7.2]
視覚言語モデル(VLM)は記述的タスクに優れるが、視覚的な観察からシーンを真に理解しているかどうかは不明だ。 IR3D-Benchは、受動的認識よりも能動的生成による理解を実証するために、VLMに挑戦するベンチマークである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:02:57 GMT)
The language of time: a language model perspective on time-series foundation models [7.1]
パッチベース時系列基礎モデルの表現学習機構と一般化能力について検討する。我々の研究は、大規模時系列基礎モデルの安全性と信頼性を理解し、評価し、改善するための厳密な理論基盤を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:03:34 GMT)
NaviX: A Native Vector Index Design for Graph DBMSs With Robust Predicate-Agnostic Search Performance [7.1]
グラフ(GDBMS)のネイティブベクトルインデックスであるNaviXを提示する。 NaviXは階層的ナビゲート可能な小型世界(HNSW)グラフ上に構築されている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:16:07 GMT)
Emotional RAG LLMs: Reading Comprehension for the Open Internet [7.1]
本稿では, (a) RAGから取得した節を感情的に表現された, 皮肉なテキストに変換するデータセット, (b) テキストを異なる音色に適応させる感情翻訳モデル, (c) LLMの現実的なテキスト解釈を改善するためのプロンプトベースの手法を紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:13:23 GMT)
Pretrained Reversible Generation as Unsupervised Visual Representation Learning [7.1]
本稿では,事前学習された連続生成モデルの生成過程を逆転させて教師なし表現を抽出する,事前学習可逆生成(PRG)を提案する。 PRGは教師なし生成モデルを効果的に再利用し、その高い能力を利用して下流タスクの堅牢で一般化可能な特徴抽出器として機能する。提案手法は,64*64の解像度でImageNet上の78%のトップ1の精度を含む,生成モデルに基づく手法の最先端性能を実現するため,複数のベンチマークにおいて従来手法よりも一貫して優れていた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:52:27 GMT)
Agentic Medical Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge [7.0]
AMG-RAGは医療知識グラフの構築と継続的な更新を自動化するフレームワークである。推論を統合し、PubMedやWikiSearchといった現在の外部証拠を検索する。 MEDQAのF1スコアは74.1%、MEDMCQAの精度は66.34パーセントで、同等のモデルと10倍から100倍のモデルの両方を上回っている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:58:00 GMT)
Efficient Algorithms for Learning and Compressing Monophonic Halfspaces in Graphs [7.0]
誘導経路下での閉包によって定義されるグラフハーフ空間の概念であるモノフォニックハーフ空間について検討する。文献からオープンな質問に回答し,これらの学習問題のほとんどはNPハードである測地学のハーフスペースとは対照的であることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:14:16 GMT)
Ad-Hoc Human-AI Coordination Challenge [6.9]
本稿では,費用がかかる人的評価の制約を克服するために,Ad-Hoc Human-AI Coordination Challenge (AH2AC2)を導入する。我々は、堅牢で安価で再現可能な人間のような評価パートナーとして機能する大規模な人的データセット上に、テキスト・ヒューマン・プロキシー・エージェントを開発する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:25:50 GMT)
Computer-Aided Multi-Stroke Character Simplification by Stroke Removal [6.8]
中国語や日本語などのスクリプトのマルチストローク文字は非常に複雑である。本稿では,ストロークを選択的に除去することで,マルチストローク文字を体系的に単純化するフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:14:33 GMT)
Quantum phase transitions and information-theoretic measures of a spin-oscillator system with non-Hermitian coupling [6.4]
非エルミート結合を持つスピンオシレータ系の情報理論を解析的に計算する。このような2次元部分空間上の例外点(EP)の出現と、実数から複素固有値への遷移を示す量子相転移を明らかにする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:24:20 GMT)
FinAI-BERT: A Transformer-Based Model for Sentence-Level Detection of AI Disclosures in Financial Reports [6.3]
本研究では,FinAI-BERTについて紹介する。FinAI-BERTはドメイン適応トランスフォーマーに基づく言語モデルで,文レベルでのAI関連コンテンツを財務テキストに分類する。このモデルは、米国の銀行の年間報告669件から抽出された1,586文の、手動でキュレートされバランスの取れたデータセットに基づいて微調整された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:33:29 GMT)
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization [5.9]
メタロラ(Meta-LoRA)は、アイデンティティに依存しない知識とアイデンティティ固有の適応を分離するフレームワークである。この結果から,Meta-LoRAは多種多様なアイデンティティ条件にまたがって優れたアイデンティティ保持,計算効率,適応性を達成できることが示唆された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:16:59 GMT)
Efficient Diffusion Training through Parallelization with Truncated Karhunen-Loève Expansion [5.8]
拡散認知モデルは、トレーニング中に緩やかな収束に苦しむ。本稿では,トレーニングとサンプリングのための新しい前向きプロセスを提案する。本手法はベースライン拡散モデルより有意に優れている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:52:16 GMT)
BELIEF in Dependence: Leveraging Atomic Linearity in Data Bits for Rethinking Generalized Linear Models [5.7]
我々は,バイナリ拡張線形効果(BELIEF)と呼ばれるフレームワークを開発し,任意の関係をバイナリ結果と理解する。 BELIEFフレームワークのモデルは、線形モデルの言語におけるバイナリ変数の関連性を記述するため、容易に解釈できる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:36:21 GMT)
Fetuses Made Simple: Modeling and Tracking of Fetal Shape and Pose [5.5]
Skinned Multi-Person Linear Model (SMPL) に基づく3次元統計的胎児体モデルを提案する。提案アルゴリズムは、画像空間における身体のポーズと、標準ポーズ空間における身体形状を反復的に推定する。本モデルでは,時系列を通して身体の形状や動きを捉え,直感的に可視化する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:47:24 GMT)
UrbanLLaVA: A Multi-modal Large Language Model for Urban Intelligence with Spatial Reasoning and Understanding [5.3]
我々は,マルチモーダルデータを同時に処理するマルチモーダルな大規模言語モデルである$textitUrbanLLaVA$を紹介した。ドメイン知識学習から空間推論の強化を分離する多段階学習フレームワークを提案する。 3つの都市での実験結果から、$textitUrbanLLaVA$は、シングルモーダルタスクと複雑なクロスモーダルタスクの両方において、オープンソースおよびプロプライエタリなMLLMより優れています。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:04:27 GMT)
RiverText: A Python Library for Training and Evaluating Incremental Word Embeddings from Text Data Streams [5.3]
本稿では,テキストデータストリームからインクリメンタルな単語埋め込みをトレーニングし,評価するためのPythonライブラリであるRiverTextを提案する。このライブラリは、Skip-gram、Continuous Bag of Words、Word Context Matrixなど、様々なインクリメンタルな単語埋め込み技術を実装している。我々は,既存の静的単語埋め込み評価タスクを,単語の類似性や単語分類に適応させるモジュールを実装した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:34:23 GMT)
Empowering Small VLMs to Think with Dynamic Memorization and Exploration [5.3]
信頼性の高い思考能力を持つ小型ビジョンランゲージモデル(SVLM)は、基本的には困難である。 Supervised Fine-Tuning (SFT) や Reinforcement Learning with Verifiable Reward (RLVR) といった既存のトレーニングパラダイムは、ベースVLMにかなりの要求を課している。我々は,各最適化ステップで(SFT経由)記憶モードと(RLVR経由)探索モードを動的に選択する新しいトレーニングパラダイムであるDyMEを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:19:51 GMT)
The Effectiveness of LLMs as Annotators: A Comparative Overview and Empirical Analysis of Direct Representation [5.2]
大規模言語モデル(LLM)は、さまざまな自然言語タスクやさまざまなアプリケーションドメインにまたがる強力なサポートツールとして登場した。本稿では,ラベル付けデータにおけるLCMの可能性について,12種類の研究結果の比較検討を行った。モデルは有望なコストと時間の節約効果を示すが、代表性、偏見、変化を促す感度、英語の好みなど、かなりの制限がある。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:07:37 GMT)
Forget-MI: Machine Unlearning for Forgetting Multimodal Information in Healthcare Settings [5.2]
Forget-MIはマルチモーダル医療データのための新しい機械学習手法である。テストデータセットのパフォーマンス、テストデータセットのパフォーマンス、およびメンバーシップ推論攻撃(MIA)を用いて結果を評価する。提案手法はMIAを0.202削減し,AUCとF1のスコアを0.221と0.305に下げる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:53:23 GMT)
Trident: Detecting Face Forgeries with Adversarial Triplet Learning [5.1]
textitTridentは、偽造のニュアンスな違いを分離するために、キュレートされた三つ子で訓練される。擬似判別器を用いたドメイン・アドバイサル・トレーニングは、擬似非依存表現への埋め込みモデルを導出する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:17:25 GMT)
I see what you mean: Co-Speech Gestures for Reference Resolution in Multimodal Dialogue [5.0]
本稿では,表現ジェスチャを中心としたマルチモーダル参照解決タスクを提案する。頑健なジェスチャー埋め込みを学習する上での課題を同時に解決する。本研究は,人間と機械の相互作用のより自然主義的なモデルに向けての一歩となる,参照分解におけるジェスチャーと音声の相補的役割を強調した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:02:32 GMT)
Satisficing Regret Minimization in Bandits: Constant Rate and Light-Tailed Distribution [5.0]
本稿では,SampLing と LowEr Confidence bound Testing を用いて,Regret Minimization を満足するアルゴリズムテンプレートを提案する。本報告では,SELECT-LITEを導入し,軽快な後悔分布と,実現不可能なケースでは一定の満足な後悔と,実現不可能なケースではサブ線形(標準)の後悔を実現する。以上の結果から, 常に期待される満足な後悔と, 満足な後悔の分布の相違が明らかとなった。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:03:28 GMT)
From Coarse to Fine: Learnable Discrete Wavelet Transforms for Efficient 3D Gaussian Splatting [5.0]
AutoOpti3DGSは、視覚的忠実さを犠牲にすることなく、ガウスの増殖を自動的に抑制するトレーニングタイムフレームワークである。ウェーブレット駆動で粗大なプロセスは、冗長な微細ガウスの形成を遅らせる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:27:17 GMT)
Enhancing Dynamic Range of Sub-Quantum-Limit Measurements via Quantum Deamplification [4.9]
動的範囲を最小限の感度で拡張する新しい量子デアンプリフィケーション機構を導入する。我々のプロトコルは、最先端の原子分子-光学プラットフォームの範囲内にあります。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:16:11 GMT)
BPD-Neo: An MRI Dataset for Lung-Trachea Segmentation with Clinical Data for Neonatal Bronchopulmonary Dysplasia [4.9]
気管支肺異形成症(BPD)は早期新生児に多い合併症である。肺磁気共鳴画像(MRI)は、鎮静と放射線を避ける非侵襲的な代替手段を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:51:31 GMT)
Physics informed guided diffusion for accelerated multi-parametric MRI reconstruction [4.8]
MRF-DiPhはマルチパラメトリック組織マッピングのための物理情報伝達拡散手法である。生体内脳スキャンデータを用いた数値実験により、MRF-DiPhは深層学習と圧縮されたMRFベースラインより優れることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:00:32 GMT)
Quantum Strong-to-Weak Spontaneous Symmetry Breaking in Decohered One Dimensional Critical States [4.6]
我々は混合状態における新しいタイプの相転移を明らかにし、Emphquantum strong-to-weak spontaneous symmetric Break (SW SSB) と呼ぶ。局所的な強対称性保存デコヒーレンスの下で XXZ 臨界スピン鎖の大域的な位相図を写像する。我々の統一理論フレームワークは、一次元量子システムの幅広いクラスに適用できる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:18:40 GMT)
TuCo: Measuring the Contribution of Fine-Tuning to Individual Responses of LLMs [4.3]
そこで本研究では,個々の応答に対する微調整がもたらす貢献度を計測する手法を提案する。提案手法はモデル中間の隠れ状態を追跡し,微調整の効果についてより詳細な知見を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:08:36 GMT)
CarGait: Cross-Attention based Re-ranking for Gait recognition [4.3]
歩行認識は、歩行パターンに基づいて個人を特定するコンピュータビジョンタスクである。既存のモデルは通常単段で、すなわちギャラリーで探査機の最も近い隣人を探す。歩行認識のためのクロスアテンション・リグレード手法であるCarGaitを紹介する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:55:50 GMT)
Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.2]
一度展開すると、医用画像解析法は予期せぬ画像の破損やノイズの摂動に直面することが多い。 LaDiNEは、視覚変換器のロバスト性と拡散に基づく生成モデルを組み合わせた、新しいアンサンブル学習手法である。結核胸部X線とメラノーマ皮膚がんデータセットの実験により、LaDiNEは幅広い最先端の方法と比較して優れた性能を発揮することが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:46:13 GMT)
MrTrack: Register Mamba for Needle Tracking with Rapid Reciprocating Motion during Ultrasound-Guided Aspiration Biopsy [4.2]
MrTrackは、マンバベースのレジスタ機構を備えた吸引針トラッカーである。 MrTrackは、最先端のトラッカーを精度と堅牢性で上回るだけでなく、推論効率も優れている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:40:24 GMT)
Layer Decomposition and Morphological Reconstruction for Task-Oriented Infrared Image Enhancement [4.1]
赤外線画像は、霧、雨、低光といった複雑な気象条件下での自律運転の知覚能力を向上させるのに役立つ。しかし、赤外線画像はしばしば低コントラストに悩まされ、特に自転車のような非熱発光ターゲットでは顕著である。雑音を増幅せず重要な情報を失うことなくコントラスト強調を実現するタスク指向赤外線画像強調手法を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:10:05 GMT)
GenBFA: An Evolutionary Optimization Approach to Bit-Flip Attacks on LLMs [4.0]
大規模言語モデル (LLM) は自然言語処理 (NLP) に革命をもたらした。ミッションクリティカルなアプリケーションの採用が増えると、ハードウェアベースの脅威、特にビットフリップ攻撃(BFA)に対する懸念が高まる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:44:50 GMT)
A Representation Engineering Perspective on the Effectiveness of Multi-Turn Jailbreaks [3.8]
中間モデル表現のレベルにおけるCrescendoマルチターンジェイルブレイクの有効性について検討する。本研究は, シングルターンジェイルブレイク防御が多ターン攻撃に対して一般的に効果がない理由を説明するのに有効である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:28:55 GMT)
Automating Adjudication of Cardiovascular Events Using Large Language Models [3.7]
本稿では,Large Language Models (LLMs) を用いた臨床試験において,心血管イベントの適応を自動化する新しい枠組みを提案する。心血管系イベント特異的臨床試験データを用いて、このフレームワークは、イベント抽出のためのF1スコアが0.82であり、適応のための精度が0.68である。このアプローチは、臨床試験において、高品質で一貫した、監査可能な結果を維持しながら、適応時間とコストを大幅に削減する大きな可能性を示している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:51:41 GMT)
CoT Red-Handed: Stress Testing Chain-of-Thought Monitoring [3.6]
CoT(Chain-of-Thought)モニタリングは、アクションのみの監視がサボタージュを確実に識別できないシナリオにおいて、最大27ポイントの検出を改善する。 CoTトレースはまた、モニターを欺く誤解を招く合理化も含み、より明白なサボタージュケースのパフォーマンスを低下させる。このハイブリッドモニターは、テストされたすべてのモデルとタスクにわたってCoTとアクションオンリーのモニターを一貫して上回り、微妙な詐欺シナリオに対するアクションオンリーのモニタリングよりも4倍高い速度で検出する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:01:41 GMT)
Why Settle for Mid: A Probabilistic Viewpoint to Spatial Relationship Alignment in Text-to-image Models [3.6]
構成生成における主要な問題は、空間的関係の不整合である。本研究では,テキストと画像間の2次元空間関係と3次元空間関係のアライメントを評価するための新しい評価指標を提案する。また,T2Iモデルにおける2次元空間関係と3次元空間関係のアライメントを微調整を必要とせずに改善する推定時間であるPoSベースの生成を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:41:27 GMT)
Federated Breast Cancer Detection Enhanced by Synthetic Ultrasound Image Augmentation [3.6]
統合学習(FL)は、センシティブな医療データを交換することなく、機関間でディープラーニングモデルを協調的に訓練するための、有望なパラダイムとして登場した。本稿では, 超音波画像を用いた乳がん診断のための統合トレーニングプロセスに, 合成画像共有を統合した生成AIベースのデータ拡張フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:05:50 GMT)
DiffFit: Disentangled Garment Warping and Texture Refinement for Virtual Try-On [3.6]
VTON(Virtual try-on)は、ターゲット服を着用している人のリアルなイメージを、電子商取引やデジタルファッションに広く応用することを目的としている。 DiffFitは,高忠実度仮想試行のための新しい2段階遅延拡散フレームワークである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:31:42 GMT)
LNUCB-TA: Linear-nonlinear Hybrid Bandit Learning with Temporal Attention [3.4]
マルチアーム・バンディット(MAB)アルゴリズムは、すべての腕の長期的な傾向と局所的なパターンの両方を捉えることができない。 LNUCB-TAは,新しい非線形成分(適応的k-Nearest Neighbors (k-NN))を統合するハイブリッドバンドバンドモデルである。本研究では, 線形, 非線形, ハイブリッドのバンドレートの累積, 平均報酬, 収束, 頑健性において, 異なる探査速度で有意な性能を示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:23:20 GMT)
FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait [3.4]
FLOATは,フローマッチング生成モデルに基づく音声駆動型音声画像生成手法である。本手法は音声による感情強調をサポートし,表現運動の自然な取り込みを可能にする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:11:31 GMT)
Adaptive Linguistic Prompting (ALP) Enhances Phishing Webpage Detection in Multimodal Large Language Models [3.3]
本研究では,フィッシングWebページの検出における適応言語プロンプト (ALP) について検討する。 ALPは、大きな言語モデル(LLM)を誘導し、テキストの偽造を分析する構造的意味推論手法である。実験の結果,ALPはフィッシング検出精度を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:26:25 GMT)
Attribution assignment for deep-generative sequence models enables interpretability analysis using positive-only data [3.2]
生成機械学習モデルは、望ましい性質に富んだ生物配列の広い空間を効率的に探索することで、治療設計のための強力なフレームワークを提供する。正のラベル付きデータと負のラベル付きデータの両方を必要とする教師付き学習法とは異なり、LSTMのような生成モデルは、正のラベル付きシーケンスのみに基づいて訓練することができる。生成モデルへの帰属方法の欠如は、そのようなモデルから解釈可能な生物学的洞察を抽出する能力を妨げている。本研究では,GAMA(Generative Attribution Metric Analysis)を開発した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:50:46 GMT)
Threshold Signatures for Central Bank Digital Currencies [3.2]
CBDCは、取引の真正性と整合性に関する署名に依存しており、秘密鍵の妥協の場合、大きな問題に繋がる。本研究は、CBDCの文脈におけるしきい値シグネチャスキーム(TSS)について検討する。 TSは分散キー管理と署名を可能にし、妥協されたキーのリスクを低減する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:31:11 GMT)
Two Spelling Normalization Approaches Based on Large Language Models [3.2]
文書の正書法を現代標準と整合させる本稿では,大規模言語モデルに基づく2つの新しいアプローチを提案する。そのうちの1つは教師なしの訓練であり,もう1つは機械翻訳のための訓練である。我々の評価は多様な言語や歴史的期間を含む複数のデータセットにまたがっており、両者が奨励的な結果を得た一方で、統計機械翻訳がこのタスクに最も適した技術であると思われるという結論に至った。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:25:09 GMT)
You Sound a Little Tense: L2 Tailored Clear TTS Using Durational Vowel Properties [3.1]
本稿では,第2言語話者(L2)に合わせたTTSシステムを提案する。我々は、アメリカ英語の時制(長音)とラックス(短音)の母音の持続時間差を用いて、Matcha-TTSの「明度モード」を作成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:55:05 GMT)
Quantum Estimation in QED Scattering [3.0]
電子ミューオンおよびコンプトン散乱における物理パラメータの量子フィッシャー情報行列(QFIM)を木レベルで数値計算する。特に,重心3モーメンタム等級と極散乱角の推定について検討する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:58:58 GMT)
Mode Collapse Happens: Evaluating Critical Interactions in Joint Trajectory Prediction Models [2.9]
モード崩壊,モードの正しさ,カバレッジの指標を導入し,予測の逐次的次元を強調した。我々のフレームワークは、研究者が新たな洞察を得て、より一貫性があり正確な予測モデルの開発を進めるのに役立つ。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:53:12 GMT)
Score-based Generative Diffusion Models to Synthesize Full-dose FDG Brain PET from MRI in Epilepsy Patients [2.9]
てんかん患者を鑑別するためのFDG PETは,PET/MRI同時撮影における最も一般的な応用の1つである。本稿では,MRI-PET画像変換タスクにおける拡散型および非拡散型ディープラーニングモデルの性能を比較した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:10:46 GMT)
Potemkin Understanding in Large Language Models [2.8]
大規模言語モデル(LLM)は、ベンチマークデータセットを使用して定期的に評価される。本稿ではまず,この問題に対処するための正式な枠組みを紹介する。ポテムキンはモデル、タスク、ドメインにまたがってユビキタスである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:12:45 GMT)
When Additive Noise Meets Unobserved Mediators: Bivariate Denoising Diffusion for Causal Discovery [2.7]
本稿では,まず,非測定メディエータの存在下で標準ANMアプローチが故障する理由を厳格に評価する。第二に、隠れ媒介に対する先行解が有限サンプル設定で不安定であり、実用性に制限があることを実証する。第三に、隠された仲介の下ではうまく機能していると推測する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:20:41 GMT)
Accurate Parameter-Efficient Test-Time Adaptation for Time Series Forecasting [2.7]
実世界の時系列は、しばしば非定常的な性質を示し、事前訓練された予測モデルの性能を低下させる。 PETSAは,入力と出力の小さなキャリブレーションモジュールのみを更新することで,予測器をテスト時に適応させる手法である。 PETSAは低ランクのアダプタと動的ゲーティングを使用して、リトレーニングなしで表現を調整する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:09:35 GMT)
HF-DGF: Hybrid Feedback Guided Directed Grey-box Fuzzing [2.5]
Directed Grey-box Fuzzing (DGF)は、クラッシュの再現とパッチテストに広く採用されている技術である。本研究は、新しい配向グレーボックスファジッシングフレームワークであるHF-DGFを提示する。そのシードスケジューリングは、制御フロー距離、バリューフローの影響スコア、スライスカバレッジを統合するハイブリッドフィードバックメカニズムによってガイドされる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 02:36:40 GMT)
Multi-Environment GLAMP: Approximate Message Passing for Transfer Learning with Applications to Lasso-based Estimators [2.5]
本稿では,新しいAMPフレームワークであるMulti-Environment Generalized Long AMPを紹介する。多環境GLAMPのための状態進化を厳格に確立する。我々は、広範囲なシミュレーションを通して、我々の理論の顕著な有限標本精度を実証する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:07:14 GMT)
Uncertain Boundaries: Multidisciplinary Approaches to Copyright Issues in Generative AI [2.3]
著作権のある素材のほぼレプリカを生成する生成AIモデルは、現在の法的枠組みを適用する必要性を強調している。 AIにおける著作権に関する既存の研究は、純粋にコンピュータ科学または法に基づくアプローチを採用している。この調査は、法、政策、経済学、コンピュータ科学から洞察を総合的に合成するアプローチを採用する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:41:33 GMT)
Can Large Language Models Capture Human Risk Preferences? A Cross-Cultural Study [2.2]
本研究では,リスクの高い意思決定シナリオをシミュレートする大規模言語モデルを提案する。我々は、モデル生成決定と実際の人間の反応を、一連の宝くじベースのタスクで比較する。結果は、どちらのモデルも、人間の参加者よりもリスク回避行動を示すことを示している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:16:57 GMT)
Federated Timeline Synthesis: Scalable and Private Methodology For Model Training and Deployment [2.2]
Federated Timeline Synthesis (FTS)は、分散時系列データ間で生成基盤モデルをトレーニングするためのフレームワークである。 FTSは、患者履歴をトークン化された患者健康タイムライン(PHTs)として表現する MIMIC-IVデータを用いた5つの臨床的意義のある予測課題におけるFTSの評価を行った。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:29:59 GMT)
AI's Euclid's Elements Moment: From Language Models to Computable Thought [2.1]
本稿では,人工知能の発展を理解するための包括的な5段階進化の枠組みを提案する。 AIは、それぞれが表現と推論の能力の革命的なシフトによって定義される、異なるエポックを通じて進歩していると仮定する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:14:19 GMT)
A Hierarchical Slice Attention Network for Appendicitis Classification in 3D CT Scans [1.7]
虫垂炎分類に3次元CTスキャンを利用する深層学習モデルを提案する。虫垂炎ではAUCが3%改善し,虫垂炎では5.9%改善した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:37:23 GMT)
MedRegion-CT: Region-Focused Multimodal LLM for Comprehensive 3D CT Report Generation [1.7]
本稿では,MLLMフレームワークであるMedRegion-CTを提案する。まず,2次元事前学習型視覚モデルを用いて3次元CTの特徴を効率よく抽出する地域代表(R2$)トークンプーリングを紹介する。次に、ユニバーサルセグメンテーションモデルが擬似マスクを生成し、マスクエンコーダによって処理され、領域中心の特徴を抽出する。第3に, 臓器の大きさ, 径, 位置など, 患者固有の属性を抽出するために, セグメンテーション結果を活用する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 06:08:55 GMT)
Enhancing Adversarial Robustness through Multi-Objective Representation Learning [1.5]
ディープニューラルネットワーク(DNN)は、小さな敵の摂動に対して脆弱である。トレーニング中のロバストな特徴学習は、ロバスト性を大幅に向上させることができることを示す。自然的特徴と敵対的特徴を整合させる多目的的手法であるMORELを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:23:44 GMT)
MariNER: A Dataset for Historical Brazilian Portuguese Named Entity Recognition [1.5]
本論では,20世紀初頭のブラジルにおける最初のゴールドスタンダードデータセットである textitMapeamento e Anotaccoes para NER (Mapping of Historical Records for NER) について概説する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:23:57 GMT)
Ensemble BERT for Medication Event Classification on Electronic Health Records (EHRs) [1.5]
n2c2 2022は、電子健康記録(EHR)における臨床データ分析のための自然言語処理の課題に関する共通のタスクを提供した。本研究は,新規なBERTアンサンブルモデルの構築を通じて,臨床ノートから薬物イベントを検出し,分類することを目的としたトラック1のサブタスク2に焦点を当てた。まず、ウィキペディアやMIMICなどのさまざまなビッグデータ上でBERTモデルを事前トレーニングし、その後、これらの事前トレーニングされたBERTモデルはCMEDトレーニングデータに基づいて微調整された。 BERTをベースとしたアンサンブルモデルでは, 厳密なMicro-Fスコアを約5%改善できることを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:17:17 GMT)
FedRef: Communication-Efficient Bayesian Fine Tuning with Reference Model [1.5]
フェデレーション学習は、人工知能(AI)モデルをトレーニングするための分散シナリオに使用される。フェデレートされた学習シナリオでは、サーバは一般にユーザのデータを知らない。最適微調整のための参照モデルに基づくフェデレーション学習を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:41:11 GMT)
FastSeg: Efficient Training-Free Open-Vocabulary Segmentation via Hierarchical Attention Refinement Method [1.5]
Open-vocabulary semantic segmentationは、厳密な注釈付きデータセットを必要とせずに、任意のテキストカテゴリからオブジェクトをセグメントすることを目的としている。 FastSegはトレーニング不要のフレームワークで、事前訓練された拡散モデルの逆過程の(1+1)ステップのみを持つ。最先端のトレーニングフリーのパフォーマンスを実現し、PASCAL VOC、PASCAL Context、COCO Objectベンチマークで平均43.8%のmIoUが得られる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:41:41 GMT)
Detecting What Matters: A Novel Approach for Out-of-Distribution 3D Object Detection in Autonomous Vehicles [1.5]
本稿では,従来のクラス分類からオブジェクト有害度決定への重点を移す新しいオブジェクト検出手法を提案する。我々の手法は、それらがAVに危険をもたらすかどうかに基づいて、それらを「有害」または「有害」と識別する。提案手法は,OODオブジェクトを効果的に検出し,その有害性を評価し,それに応じて分類する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:21:05 GMT)
On the Feasibility of Deduplicating Compiler Bugs with Bisection [1.3]
バグ重複(Bug deduplication)は、バグ重複として知られる実用的な研究問題である。コンパイラのバグ重複の以前の方法は主に、重複識別のためのバグ関連機能を抽出するプログラム分析に依存していた。 BugLensは、主に二分法を用いる新しい重複解法であり、偽陰性を最小化するためにバグトリガ最適化の同定によって強化される。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:12:57 GMT)
Enhancing the hyperpolarizability of crystals with quantum geometry [1.2]
結晶の高次電気感受性は、非自明な位相不変量や量子幾何学によって拡張・理解できることを示す。我々は, 非線形, 量子幾何駆動型光学応答の可変性を明らかにするために, 数値シミュレーションを用いた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:35:30 GMT)
From Prompt Injections to Protocol Exploits: Threats in LLM-Powered AI Agents Workflows [1.2]
構造化関数呼び出しインタフェースを持つ大規模言語モデル(LLM)は、リアルタイムデータ検索と計算機能を大幅に拡張した。しかし、プラグイン、コネクター、エージェント間プロトコルの爆発的な増殖は、発見メカニズムやセキュリティプラクティスよりも大きくなっている。ホスト・ツー・ツールとエージェント・ツー・エージェント・エージェントの通信にまたがる,LDM-エージェントエコシステムに対する最初の統一エンドツーエンド脅威モデルを導入する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:32:32 GMT)
A High-Throughput Platform to Bench Test Smartphone-Based Heart Rate Measurements Derived From Video [1.2]
スマートフォンベースの心拍数監視アプリ(HR)は、デバイスの多様性とフラグメンテーションのために、パフォーマンス評価とデバイスの互換性において重大な課題に直面している。本稿では,この重要なニーズに対処する,新しい高スループットベンチテストプラットフォームを提案する。このプラットフォームは、スマートフォンのHRアプリの事前デプロイテストのためのスケーラブルなソリューションを提供し、アプリパフォーマンスを改善し、デバイス互換性を確保し、モバイルヘルスの分野を前進させる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:19:40 GMT)
ChipXplore: Natural Language Exploration of Hardware Designs and Libraries [1.2]
ChipXploreは、エンジニアが自然言語を使って設計やPDKをクエリできる、大規模な言語モデルを利用したマルチエージェント協調フレームワークである。 ChipXploreは97.39%の精度を実現し、検索を5.63倍速くすることで生産性を向上させる。 ChipXploreのカスタマイズワークフローはジェネリックと比較して、複数のデータベース上の推論と計画のオーケストレーションが可能で、精度は29.78%向上している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:37:14 GMT)
SketchMind: A Multi-Agent Cognitive Framework for Assessing Student-Drawn Scientific Sketches [1.1]
SketchMindは、学生が描いた科学スケッチを評価し改善するためのマルチエージェントフレームワークである。解析、スケッチ認識、認知アライメント、スケッチ修正による反復的なフィードバックを担当するモジュールエージェントで構成されている。専門家らは、ガイド付きリビジョンを通じて概念的成長を有意義に支援するシステムの可能性に言及した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:35:10 GMT)
Low-Cost Infrared Vision Systems for Improved Safety of Emergency Vehicle Operations Under Low-Visibility Conditions [1.1]
本研究は、低視認性環境で運転する緊急車両の運転安全性を高めるための赤外線カメラ技術の可能性について検討する。この評価は、制御された実験室実験、実世界のフィールドテスト、緊急車両運用者の調査を組み合わせたものである。結果は、ドライバーの認識を高め、スケーラブルなデプロイメントのためにデータ駆動のレコメンデーションを提供するIR技術の有用性を強調している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:57:41 GMT)
Bittensor Protocol: The Bitcoin in Decentralized Artificial Intelligence? A Critical and Empirical Analysis [1.0]
本稿では,Bittensorが分散人工知能のBitcoinとして考えられるかを検討する。私たちはまず、持分と報酬の両方にかなりの集中度を文書化します。 51パーセントの攻撃に要する中央値の連立サイズを増大させる88パーセントのステークキャップを提案し,実証的に検証する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:07:48 GMT)
Impact of Shallow vs. Deep Relevance Judgments on BERT-based Reranking Models [1.0]
本稿では, BERTを用いたニューラルインフォメーション検索における評価モデルの性能に及ぼす浅度と深度の影響について検討する。関連性判断の少ない問合せデータセットと、関連性判断の広い問合せを少なくする問合せデータセットを比較した。以上の結果から,浅層分類データセットは一般に,より広い範囲の利用可能なコンテキストにより,モデルの再ランク付けの一般化と有効性を高めることが示唆された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 11:30:50 GMT)
Information Loss in LLMs' Multilingual Translation: The Role of Training Data, Language Proximity, and Language Family [0.9]
本研究は,多言語翻訳における学習データ,言語親和性,言語族が情報損失に与える影響を系統的に検討する。 GPT-4とLlama 2の2つの大言語モデルについて,ラウンドトリップ翻訳により評価した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:21:05 GMT)
Self-Supervised Contrastive Learning for Multi-Label Images [0.9]
自己教師付き学習(SSL)は、人間の直感に合わせた比較手法を通じて、表現の学習においてその効果を実証している。我々は、マルチラベル画像が少ないことで優れた表現学習能力を確保するために、主流のSSLアプローチをカスタマイズする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:29:37 GMT)
Perspective Dial: Measuring Perspective of Text and Guiding LLM Outputs [0.9]
大型言語モデル(LLM)は様々なミッションクリティカルな役割で使用される。 LLM出力に関連するバイアスと視点の定量的な理解が欠如している。本稿では,汎用テキストの視点や視点のより広範な問題と,大言語モデル(LLM)出力の視点制御について考察する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:26:37 GMT)
Do LLMs Dream of Discrete Algorithms? [0.8]
大規模言語モデル(LLM)は、人工知能の風景を急速に変化させてきた。確率的推論への依存は、厳密な論理的推論を必要とする領域における有効性を制限する。本稿では,論理ベースの推論モジュールでLLMを増強するニューロシンボリックアプローチを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:03:01 GMT)
Quantum Sinusoidal Neural Networks [0.6]
我々は正弦波活性化関数を持つニューラルネットワークの量子バージョンを設計する。私たちはそのパフォーマンスを古典的なケースと比較する。量子正弦回路の周辺に量子最適化アルゴリズムを構築する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:03:44 GMT)
A case for data valuation transparency via DValCards [0.6]
データアセスメントのメトリクスは、単純なアルゴリズム設計の選択の下で本質的にバイアスを受け、不安定であることを示す。我々は,データバリュエーションに関する透明性の向上を支持するとともに,新しいデータバリュエーションカード(DValCards)フレームワークを導入する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:53:00 GMT)
Spiral dislocation as a tunable geometric parameter for optical responses in quantum rings [0.6]
2次元量子環に閉じ込められた荷電スピンレス粒子の光学的および量子力学的性質について検討する。転位は、曲率を導入することなく空間幾何学を変化させるねじれ誘起計量によってモデル化される。幾何学的変形はエネルギー依存の有効ポテンシャルをもたらし、境界状態スペクトルを調節可能な制御を可能にする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:52:36 GMT)
AICO: Feature Significance Tests for Supervised Learning [0.5]
本稿では,任意の回帰アルゴリズムや分類アルゴリズムにおける入力特徴の影響を評価するために,モデルおよび分布に依存しない重要度テストを開発する。我々は、この中央値に対して一様に強力でランダムな符号テストを構築し、特徴量と信頼区間を評価するための正確なp値を得る。合成タスクの実験は、その統計的および計算上の利点を検証し、実世界のデータへの適用は、その実用性を示している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 21:15:40 GMT)
DGE-YOLO: Dual-Branch Gathering and Attention for Accurate UAV Object Detection [0.5]
DGE-YOLOは、マルチモーダル情報を効果的に融合するために設計された拡張YOLOベースの検出フレームワークである。具体的には、モダリティ固有の特徴抽出のためのデュアルブランチアーキテクチャを導入し、モデルが赤外線と可視画像の両方を処理できるようにする。セマンティック表現をさらに強化するために,空間規模をまたいだ特徴学習を向上する効率的なマルチスケールアテンション(EMA)機構を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:19:18 GMT)
LLM-Assisted Question-Answering on Technical Documents Using Structured Data-Aware Retrieval Augmented Generation [0.4]
大きな言語モデル(LLM)は自然言語の理解と生成を可能にする。ファインチューニングは可能なソリューションのひとつだが、リソース集約であり、データ更新毎に繰り返す必要がある。 Retrieval-Augmented Generation (RAG)は、LLMが外部の知識ソースにアクセスできるようにすることにより、効率的なソリューションを提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:22:03 GMT)
Multimodal image registration for effective thermographic fever screening [0.4]
赤外線サーモグラフィー(IRTs)に基づくフエバースクリーニングは、伝染病のパンデミックにおいて有効なマススクリーニング手法である。 IRTは、高温を検出するための強力で迅速で非侵襲的な方法であることがわかった。カンチ領域の正確なローカライゼーションは、赤外線(IR)と白色光画像のマルチモーダルな登録によって達成できる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:02:23 GMT)
Studying few cluster resonances with quantum neural network driven iterative Harrow-Hassidim-Lloyd algorithm [0.4]
量子コンピューティングを用いてハイパー核5_Lambda$He,$6_Lambda$He,$9_Lambda$Beの特性を調べる。量子ニューラルネットワーク(QNN)と反復Harrow-Hassidim-Lloyd(IHHL)アルゴリズムを組み合わせて、量子多体問題を解く。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:28:14 GMT)
Super-Resolution Generative Adversarial Networks based Video Enhancement [0.4]
本研究は、通常のシングルイメージSIS(SRGAN)構造を拡張して、対数データを扱うことで、ビデオ超解像への拡張アプローチを導入する。 3次元非局所ブロックを組み込んだ修正フレームワークが開発され、空間次元と時間次元の両方で関係を捉えることができる。その結果、従来の単一画像法と比較して、時間的コヒーレンス、よりシャープなテクスチャ、視覚的アーティファクトが向上した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:08:46 GMT)
Online Meal Detection Based on CGM Data Dynamics [0.4]
連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データから得られる特徴として, 動的モードを用いて食事のイベントを検出する。このアプローチは食事検出の精度を向上するだけでなく、基礎となるグルコース動態の解釈可能性を高める。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:24:05 GMT)
Remove Symmetries to Control Model Expressivity and Improve Optimization [0.3]
まず, 対称性が能力低下につながり, 訓練や推論中に特徴を無視する2つのメカニズムを実証する。次に、ニューラルネットワークにおける対称性誘起低容量状態のほとんどをすべて除去する、単純で理論的に正当化されたアルゴリズムであるサイアを提案する。提案手法の顕著な利点は、モデルに依存しず、対称性の知識を必要としないことである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:14:46 GMT)
RAG and RAU: A Survey on Retrieval-Augmented Language Model in Natural Language Processing [0.2]
本稿では,検索言語モデル (RALM) に関する総合的な概要の欠如について論じる。本稿では、Retrievers、Language Models、Augmentationsなど、ALMの本質的なコンポーネントについて論じる。 RALMは、翻訳や対話システムから知識集約アプリケーションまで、様々なタスクにおいて有用性を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:57:19 GMT)
Two-dimensional Taxonomy for N-ary Knowledge Representation Learning Methods [0.1]
本調査では,n-aryリレーショナルデータを扱う手法を概観し,知識ハイパーグラフとハイパーリレーショナル・ナレッジグラフの両文献について概観する。本稿では,2次元分類法を提案する。第1次元分類法は,それらの方法論,すなわち翻訳ベースモデル,ディープニューラルネットワークベースモデル,論理ルールベースモデル,ハイパーエッジ拡張ベースモデルに基づいて分類する。第2の次元は、n-ary関係における実体的役割と位置の認識に基づいてモデルを分類し、それらを無意識、位置認識、役割認識のアプローチに分割する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:40:42 GMT)
maneuverRecognition -- A Python package for Timeseries Classification in the domain of Vehicle Telematics [0.0]
maneuverRecognitionパッケージは、事前処理、モデリング、評価のための機能を提供する。本パッケージの実装は,スマートフォンセンサを用いて記録された3人の実運転データを用いて実証した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:56:19 GMT)
VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design [0.0]
大規模言語モデル(LLM)と化学検証を統合するためのフレームワークであるVALID-Molを提案する。提案手法は, メソジカル・プロンプト・エンジニアリング, 自動ケミカル・バリデーション, 微調整ドメイン適応LDMを組み合わせることで, 合成可能な分子を確実に生成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:17:04 GMT)
Unraveling superradiance: Entanglement and mutual information in collective decay [0.0]
2つの異なるシナリオにおいて、当初逆の2レベルエミッターのアンサンブルの集団崩壊を研究する。時間とともに個々の量子軌道に沿った絡み合いと古典的相関について検討する。我々は、多くのエミッタに対して直感的かつ正確な超放射能のバーストに対して、純粋に古典的な理論を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:57:53 GMT)
Treatment, evidence, imitation, and chat [0.0]
我々は、エビデンスベースの医療を含む治療問題の解決へのアプローチ、試行錯誤、観察データについて論じる。次に、治療の問題を解決するために大規模な言語モデルがどのように使われるのかを議論し、現れる課題のいくつかを強調します。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 00:23:06 GMT)
The Streda Formula for Floquet Systems: Topological Invariants and Quantized Anomalies from Cesaro Summation [0.0]
我々はStvreda公式を周期駆動システムに拡張する。フロッケ巻線数とトラクタブル応答関数の関係を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:40:04 GMT)
The Jaynes-Cummings model in Phase Space Quantum Mechanics [0.0]
2レベル原子と量子コヒーレント場からなるハイブリッド二部量子系に対する完全ウィグナー関数の明示的な構成を通して、Jaynes-Cummingsモデルの位相空間の定式化に対処する。このアプローチは、ラビ振動、原子集団の反転、絡み合いの発生のような基本的な量子現象の詳細な位相空間の視点を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:57:48 GMT)
Teaching a Language Model to Speak the Language of Tools [0.0]
この研究は、既存の言語モデルを適用するための方法論を示し、あらゆるターゲット言語で堅牢なツールの使用を可能にする。この研究は、基本モデルよりも関数呼び出し精度を最大28.75%改善するTUCANを紹介している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:47:27 GMT)
Symmetry Sectors in Chord Space and Relational Holography in the DSSYK [0.0]
我々は、DSSYK のコードヒルベルト空間内の特定の制約によって生成される異なる対称性セクターを物質とともに発見する。コードパリティ対称性はETWブレーンとユークリッドワームホールの正弦ディラトン重力に対応している。パリティゲージ付きDSSYKの拡散複雑さとバルク内の測地線長を一致させてホログラフィック辞書を推定する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:50:02 GMT)
Subwavelength micromachined vapor-cell based Rydberg sensing [0.0]
ライドバーグ原子量子センシングは、ブロードバンド、非侵襲、超感度電気測定の強力な技術として登場した。ここでは、ミリスケール寸法を持つウェハスケールのPyrex-Si-Pyrexセルを用いて、Rydberg分光を行う。その結果, サブ波長電磁界測定のための微細加工された気相セルの可能性を明らかにした。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:37:52 GMT)
Strategies for Resource Allocation of Two Competing Companies using Genetic Algorithm [0.0]
商店街のショッピングモールにおける店舗の戦略的立地について検討し,企業による市場シェアの最終的な支配のための最善の戦略を見出すことを目的とした。この問題は、2次元イジングモデルの枠組みに記述されたメトロポリスにおける2つの競合するスーパーマーケットチェーンの文脈で提起される。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:52:35 GMT)
Single Qudit Control in $^{87}$Sr via Optical Nuclear Electric Resonance [0.0]
光核電気共鳴(ONER)は、最近87ドルSrで高速で堅牢な単一量子ビットゲート機構として提案された。 OnERは高忠実度スピン操作を実現し、99.9%の忠実度を達成しつつ、現実的なノイズ源の下でもコヒーレンスを維持していることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:47:50 GMT)
Single Image Inpainting and Super-Resolution with Simultaneous Uncertainty Guarantees by Universal Reproducing Kernels [0.0]
本稿では,画像の欠落画素を推定する問題に対する統計的学習手法を提案する。提案手法はSGKI(Sultanely Guaranteed Kernel Interpolation)と呼ばれ,最近開発されたカーネル法の拡張と改良である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:12:23 GMT)
Securing AI Systems: A Guide to Known Attacks and Impacts [0.0]
本稿では,予測型および生成型AIシステムに特有の敵攻撃の概要について述べる。我々は11種類の主要な攻撃タイプを特定し、その影響に攻撃テクニックを明示的にリンクする。我々は、AI固有のリスクを認識し、効果的な防御を実装するための基礎知識を、研究者、開発者、セキュリティ実践者、および政策立案者に提供することを目的としています。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:32:03 GMT)
Rotational-invariant quantum key distribution based on a quantum dot source [0.0]
単一光子量子エミッタは、非常にオンデマンドな光子放出、ほぼ単単位の識別不可能、低光子発生を提供する。本研究は,オンデマンドQKDプロトコルにおける回転不変ハイブリッド状態の利用に向けての有効な方向を示唆する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:13:38 GMT)
Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors [0.0]
そこで本研究では,ミスや測定誤差データに適用するために,チューニングパラメータを持つ指数損失関数を提案する。逆確率重み付けと加算誤差モデルを用いて、不足データや測定誤差に対処する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 07:45:14 GMT)
Rises for Measuring Local Distributivity in Lattices [0.0]
分配性を評価する手段として,(概念)格子における立ち上がりの概念を導入する。格子が分配的であることは、非単位が上昇しない場合に限る。実世界のデータから得られる概念格子は、高度に結合分配的であるが、マッチング分配ははるかに少ない。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:03:51 GMT)
Redefining Evaluation Standards: A Unified Framework for Evaluating the Korean Capabilities of Language Models [0.0]
我々は,韓国のアセスメントを統合するオープンソースのレジストリベースのフレームワークであるHRET(Haerae Evaluation Toolkit)を紹介する。 HRETは、主要な韓国のベンチマーク、複数の推論バックエンド、マルチメソッド評価を統合している。モジュール化されたレジストリ設計により、新しいデータセット、メソッド、バックエンドの迅速な取り込みが可能になる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 09:50:07 GMT)
Real-time adaptation of quantum noise channel estimates [0.0]
本稿では,量子アルゴリズム回路の実行中にノイズチャネル推定をリアルタイムに適応させる手法を提案する。我々は,高レベルゲート誤り情報のリアルタイム校正のためのプロトコルとして,この手法を実証し,評価する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:08:57 GMT)
Quantum Computing Architecture and Hardware for Engineers -- Step by Step -- Volume II [0.0]
2025年7月時点で、私は閉じ込められたイオン量子コンピュータの部分を完成させた。私は、物理学の厳格なトレーニングを受けていないエンジニアを量子コンピューティングの世界にブリッジするために、より重要なトピックをステップバイステップで書く予定です。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:28:45 GMT)
Privacy Ethics Alignment in AI: A Stakeholder-Centric Framework for Ethical AI [0.0]
本研究は、デジタル市民(年齢16-19)、両親/教育者、AI専門家の3つの主要なステークホルダーグループにわたる、プライバシー上の懸念の進化について調査する。若者は自主性とデジタルの自由を強調し、保護者と教育者は規制監督とAIリテラシープログラムを提唱する。このデータは、AIリテラシーと透明性のギャップをさらに強調し、ステークホルダー主導のプライバシーフレームワークの必要性を強調している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:32:48 GMT)
Perturbation Analysis of Singular Values in Concatenated Matrices [0.0]
特異値スペクトルと特異摂動行列は個々の成分のスペクトルとどのように関係するのか? サブマトリクスにおける小さな摂動の下での値の安定性を定量化する解析的境界を設定する。結果、行列がノルムに近ければ、特異行列の支配的な特異値は安定であり、精度と圧縮のトレードオフを制御できることが証明された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:31:24 GMT)
Performance-centric roadmap for building a superconducting quantum computer [0.0]
量子ハードウェアの4つの異なるフェーズを特定し、技術開発を可能にする。目的は、量子ハードウェアが実行可能であるアルゴリズムの複雑さを拡大し、スケールし、パフォーマンスを向上させることである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:25:50 GMT)
On the formation of an interference pattern in QED [0.0]
2つの同一粒子ビームが交差するときに発生する干渉パターンの形成について検討する。重なり合う領域にわたって細いワイヤを走査することにより、結果として生じる干渉縞を検出する。量子電気力学の枠組みの中で、この明らかなパラドックスが解決されることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:55:41 GMT)
On the Hamiltonian with Energy Levels Corresponding to Riemann Zeros [0.0]
固有値 $E_n = rho_n (1-rho_n) $ を持つハミルトニアンが構築されている。我々はベリー・キーティングのパラダイムを一般化し、モジュラー形式を通して数論情報をハミルトン空間にエンコードする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:58:42 GMT)
Objective-Free Local Learning and Emergent Language Structure in Thinking Machines [0.0]
本稿では,局所的な事象駆動型創発学習に基づく生成言語モデリングのためのニューロシンボリックフレームワークを提案する。コアには階層的なホップフィールドメモリチェーンがあり、構成的短期記憶と動的トークン化器として機能する。我々は、推論中に新しいニューロンを短時間活性化することで、分散マルチスケールトークンの特徴を象徴的な埋め込みに結合することを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:29:13 GMT)
Multi-encoder nnU-Net outperforms transformer models with self-supervised pretraining [0.0]
本研究は, 医用画像の解剖学的構造と病理的領域の自動同定と記述を含む, 医用画像セグメンテーションの課題に対処するものである。本稿では,複数のMRIモダリティを別個のエンコーダで独立に処理するために設計された,自己教師型学習用マルチエンコーダnnU-Netアーキテクチャを提案する。我々のマルチエンコーダnnU-Netは、Vanilla nnU-Net、SegResNet、Swin UNETRといった他のモデルを上回る93.72%のDice similarity Coefficient(DSC)を達成し、例外的な性能を示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:05:00 GMT)
Multi-Controlled Quantum Gates in Linear Nearest Neighbor [0.0]
マルチコントロールシングルターゲット(MC)ゲートは、様々な量子アルゴリズムにとって重要なビルディングブロックである。本稿では,$sim 4k+8n$ CNOT ゲートを使用せずに MC ゲートを実装する手法について述べる。提案手法は, MCゲートの任意の場合において, 上界よりもCNOTゲートを少なくする回路を提供する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 20:21:44 GMT)
Measuring How LLMs Internalize Human Psychological Concepts: A preliminary analysis [0.0]
本研究では,大規模言語モデルと人間の心理的次元間の概念整合性を評価する枠組みを開発する。 GPT-4モデルは優れた分類精度(66.2%)を獲得し、GPT-3.5(55.9%)とBERT(48.1%)を大きく上回った。以上の結果から,現代のLLMは人間の心理的構造を計測可能な精度で近似できることが示された。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:56:56 GMT)
Interpretable by Design: MH-AutoML for Transparent and Efficient Android Malware Detection without Compromising Performance [0.0]
Androidシステムにおけるマルウェア検出には、サイバーセキュリティの専門知識と機械学習(ML)技術の両方が必要となる。 We present MH-AutoML, a domain-specific framework for Android malware detection。結果は、MH-AutoMLがより透明性とコントロールを提供しながら、より良いリコール率を達成することを示している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:12:41 GMT)
Improving Myocardial Infarction Detection via Synthetic ECG Pretraining [0.0]
心筋梗塞は世界中で大きな死因であり,心電図(ECG)からの正確な早期診断が臨床上の優先事項である。ディープラーニングモデルはECGの自動解釈を約束しているが、大量のラベル付きデータを必要とする。本研究では,12個の心電図を調整可能なMI形態と現実的な雑音で合成する生理的認識パイプラインを提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:29:55 GMT)
Genuine multi-entropy and holography [0.0]
ホログラフィーでは、真のマルチパーティの絡み合いは小さくなく、重要な役割を果たす。ブラックホールへの応用については、そのような真の$mathttq$-partiteマルチエントロピーがページ時間後にのみ重要であることが分かる。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 13:39:58 GMT)
Fractional Policy Gradients: Reinforcement Learning with Long-Term Memory [0.0]
分数的ポリシー勾配(英: Fractional Policy Gradients, FPG)は、政策最適化における時間的長期モデリングのための分数的計算を組み込んだ強化学習フレームワークである。 Caputo分数微分を用いて再構成することにより、FOGは状態遷移間のパワー-ロー時間相関を確立する。実験による検証では, 試料効率が35～68%向上し, 24～52%の分散低減が得られた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:57:41 GMT)
FinStat2SQL: A Text2SQL Pipeline for Financial Statement Analysis [0.0]
FinStat2は、財務上の自然言語クエリを可能にする軽量のtext2sqlパイプラインである。ドメイン固有のデータベースを構築し、合成QAに基づいてモデルを評価する。微調整された7Bモデルは、コンシューマハードウェア上でのサブ-4秒の応答時間で61.33%の精度を達成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:55:21 GMT)
Feature Prediction in Quantum Graph Recurrent Neural Networks with Applications in Information Hiding [0.0]
量子グラフリカレントニューラルネットワーク(QGRNN)を用いて、古典的なグラフ構造化データを処理する。以上の結果より,QGRNNは高い特徴再構成精度を示し,ほぼ完全な分類が可能であった。また、QGRNNに基づいて、メッセージがグラフに埋め込まれ、ある条件下で検索される情報隠蔽手法を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:49:56 GMT)
Exact treatment of rotation-induced modifications in two-dimensional quantum rings [0.0]
二次元量子環におけるフェルミエネルギー,磁化,持続電流に及ぼす回転の影響について検討する。角速度の変動がフェルミエネルギー、磁化、持続電流にどのように影響するかを数値的に検討する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 15:39:36 GMT)
Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach [0.0]
SC開発における重要な課題は、個々の疾患の予期せぬパフォーマンス劣化を防ぐことである。本研究では,新しい合成ビグネットシミュレーション手法を提案し,検証する。提案手法は,個々のまれな疾患に対するSCアルゴリズム変更の事前デプロイ評価を可能にする。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 08:14:18 GMT)
Equivalence Classes in AES -- Part 1 [0.0]
同値類は、MixColumns と InvMixColumns の性質から自然に生じる。研究の次のフェーズは、既知の(平文、暗号文)等価クラスペアを用いて、重要なリカバリ攻撃を見つけることである。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:14:57 GMT)
Enhancing Live Broadcast Engagement: A Multi-modal Approach to Short Video Recommendations Using MMGCN and User Preferences [0.0]
本稿では,MMGCN(Multi-modal Graph Convolutional Networks)をユーザの好みに組み込んだ短いビデオレコメンデーションシステムを提案する。個人の興味に合ったパーソナライズされたレコメンデーションを提供するために,提案システムはユーザインタラクションデータ,ビデオコンテンツ機能,コンテキスト情報などを考慮に入れている。システムの有効性を評価するために、Kwai、TikTok、MovieLensの3つのデータセットが使用されている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 04:50:52 GMT)
Dynamically-decoupled hyper-Ramsey spectroscopy of optical clock transitions [0.0]
ハイパーラムシープロトコルは、超狭光クロック遷移にうまく実装されている。複数回転ハーン・エチョパルスからなる動的デカップリング法を用いて,その限界に対処する。時間に最適化された再焦点パルスのUhrig配列は、非常にコントラストが高く頑健なハイパーランジー干渉を生成する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 05:12:04 GMT)
Drivetrain simulation using variational autoencoders [0.0]
本研究は、トルク要求から車両のジャーク信号を予測するための変分オートエンコーダ(VAE)を提案する。我々は、完全電動SUVの2つの変種の実験データに基づいて、無条件と条件付きの両方のVAEを実装した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:26:51 GMT)
Disrupting Model Merging: A Parameter-Level Defense Without Sacrificing Accuracy [0.0]
モデルマージ(英: Model merging)は、複数の微調整されたモデルを、追加のトレーニングなしで単一のモデルに結合するテクニックである。モデル透かしやフィンガープリントのような既存の方法は、後部視におけるマージのみを検出することができる。本稿では,モデルマージに対する最初の積極的な防御法を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 12:59:43 GMT)
Detecting and quantifying non-Markovianity via quantum direct cause [0.0]
我々は最近導入された2人の非マルコビアン性証人の有効性について検討した。我々は、既存の文献から取られた特定の反例を通して、彼らは非マルコフ的な過程を目撃できることを示した。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:45:40 GMT)
Density, asymmetry and citation dynamics in scientific literature [0.0]
本稿では,出版物のセマンティック・エリアの局所的幾何学を特徴付けるための2つの相補的指標を提案する。これら2つの指標とその後の引用率の予測関係を検証した。引用数に対する$rhoの個々の効果は小さく、可変であるが、密度ベースの予測器を組み込むことで、常にサンプル外予測を改善している。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 18:55:04 GMT)
Deep Learning for Optical Misalignment Diagnostics in Multi-Lens Imaging Systems [0.0]
多要素レンズシステムにおける誤認識を診断するための2つの相補的深層学習に基づく逆設計法を提案する。まず、6-lensの写真素数における5自由度(5-DOF)の誤差を予測するために、レイトレートのスポット図を用い、横方向の翻訳で0.031mm、傾きで0.011$circ$となる平均絶対誤差を達成した。また、グレースケールの合成カメラ画像を利用する物理シミュレーションパイプラインを導入し、深層学習モデルによる2レンズと6レンズのマルチレンズシステムにおける4-DOF、まともな精度、傾き誤差の推定を可能にした。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:13:40 GMT)
Data-Driven Self-Supervised Learning for the Discovery of Solution Singularity for Partial Differential Equations [0.0]
興味の関数における特異点の出現は、科学計算における根本的な課題である。特異点の位置を推定するための自己教師付き学習フレームワークを提案する。入力摂動,ラベルの破損,および異なる種類の特異点を扱うための提案手法の能力を示すために,様々な実験を行った。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:39:41 GMT)
DPOT: A DeepParticle method for Computation of Optimal Transport with convergence guarantee [0.0]
そこで本研究では,2つの連続分布間の最適輸送マップを非ペア化標本から計算する機械学習手法を提案する。提案手法は,トレーニング中に最小限の最適化を行ない,ネットワーク構造に制限を加えることはない。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 23:32:39 GMT)
Compiling a Q# Subset to QASM 3.0 in TypeScript via a JSON Based IR [0.0]
Q#からQASM 3.0へのコンパイルツールチェーンの実装には、フル機能のレキサと実装が含まれています。この実装は、機能をWeb環境に移植するためにTypeScriptで書かれている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:02:57 GMT)
Comparative Evaluation of ChatGPT and DeepSeek Across Key NLP Tasks: Strengths, Weaknesses, and Domain-Specific Performance [0.0]
本研究の目的は,5つの主要なNLPタスクにおけるChatGPTとDeepSeekを評価することである。これらのタスクには、感情分析、トピック分類、テキスト要約、機械翻訳、テキスト翻訳が含まれる。その結果、DeepSeekは分類安定性と論理的推論に優れており、ChatGPTは微妙な理解と柔軟性を必要とするタスクにおいてより優れた性能を発揮することがわかった。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:52:34 GMT)
Bending Hyperplanes, Nonlinear Entanglement Witnesses via Envelopes of Linear Witnesses [0.0]
絡み合いの目撃者(EW)は絡み合いを検出するための基本的な道具である。線形証人の封筒を取れば非線形絡み証人の家族を構築する。提案した非線形証人は,絡み合った状態を検出する際に,線形証人よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:36:41 GMT)
BenchMake: Turn any scientific data set into a reproducible benchmark [0.0]
計算科学におけるベンチマークセットの相対的な希薄さは、新しいイノベーションを評価するのを困難にしている。新しいツールは、オープンに利用可能な科学データセットの数を、コミュニティがアクセス可能なベンチマークに変えるために開発されている。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 22:56:48 GMT)
BST: Badminton Stroke-type Transformer for Skeleton-based Action Recognition in Racket Sports [0.0]
本研究では,バドミントン放送の試合において,各選手のラケットスイングのフレームを抽出する新しいビデオセグメンテーション戦略を提案する。本研究では,Badminton Stroke-type Transformer (BST)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 10:17:08 GMT)
An Investigation into Seasonal Variations in Energy Forecasting for Student Residences [0.0]
LSTMやGRUなどのベースラインモデルの性能を,最先端の予測手法とともに評価する。この結果から、どのモデルも全てのシーズンで他のモデルより一貫して優れていないことが判明した。 The proposed Hyper Network based LSTM and MiniAutoEncXGBoost models exhibit strong adaptability to seasonal variation。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:12:47 GMT)
Aggregating Local Saliency Maps for Semi-Global Explainable Image Classification [0.0]
ディープラーニングは画像分類タスクを支配しているが、モデルが予測に到達する方法を理解することは依然として困難である。多くの研究は、モデルの予測に対する特定のピクセルの影響を可視化するサリエンシマップのような個々の予測の局所的な説明に焦点を当てている。本稿では,局所的なサリエンシの説明を(半)言語的洞察にまとめる手法であるセグメンツ属性テーブル(SAT)を提案する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 14:11:02 GMT)
Advanced Financial Reasoning at Scale: A Comprehensive Evaluation of Large Language Models on CFA Level III [0.0]
本稿では,CFA(Chartered Financial Analyst)レベルIII試験において,23の最先端のLarge Language Models (LLMs)を評価するベンチマークを提案する。我々は,複数選択質問(MCQ)とエッセイスタイル回答の両方を,Chain-of-ThoughtやSelf-Discoverといった複数のプロンプト戦略を用いて評価する。 CFAレベルIIIでは79.1% (o4-mini) と77.3% (Gemini 2.5 Flash) の複合スコアが得られた。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:54:57 GMT)
Ab initio modelling of quantum dot qubits: Coupling, gate dynamics and robustness versus charge noise [0.0]
商用半導体ファウントリは、従来のチップと同じプロセスを使用して量子プロセッサ(QP)を作成することができる。製造において最も期待できる選択肢を特定するには、実際の測地における相互作用する電子の予測モデリングが必要である。本稿では,デバイストポロジに関する仮定を伴わない,実空間グリッドに基づくモデリング手法について検討する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 17:20:02 GMT)
AISCliteracy: Assessing Artificial Intelligence and Cybersecurity Literacy Levels and Learning Needs of Students [0.0]
本研究は,ネパール・チトワン地区の学生を対象に,現在のAIリテラシーレベルを評価し,学習ニーズを特定することに焦点を当てた。ネパールの学校のための堅牢なAI教育プログラムの開発に貢献する。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 16:31:50 GMT)
A Physical and Mathematical Framework for the Semantic Theory of Evolution [0.0]
進化のセマンティック理論(STE)は、生命の基本的な特徴として、多くの任意の通信符号の存在を考慮に入れている。生物が使用する任意の通信符号のキーとなる特徴をエビデンス理論(ET)を用いて表現できることを示します。特に、ETは、単に刺激の配列に反応するだけの生物に適応し、予測可能な生物の基礎を説明し、人間によって使用される最も複雑な通信コードに適した非伝統的なバージョンを記述します。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 19:55:06 GMT)
A Framework of Decision-Relevant Observability: Reinforcement Learning Converges Under Relative Ignorability [0.0]
因果推論パラダイムが欠如の無知を形式化することを示す。相対的無知(Relative ignorability)は、不完全データに基づいて正確な意思決定の要求を洗練させるグラフィカル・因果的基準である。
論文参考訳（メタデータ） (Sun, 29 Jun 2025 01:49:19 GMT)