Chirpy3D: Creative Fine-grained 3D Object Fabrication via Part Sampling [128.2] Chirpy3Dは、ゼロショット設定で微細な3Dオブジェクトを生成するための新しいアプローチである。
モデルは、可塑性な3D構造を推測し、きめ細かい細部を捉え、新しい物体に一般化する必要がある。
我々の実験では、Cirpy3Dは、高品質できめ細かな細部を持つ創造的な3Dオブジェクトを生成する既存の手法を超越していることが示されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:45:00 GMT)
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines [118.8] 大規模言語モデル(LLM)は、数学、物理学、計算機科学などの学問分野において顕著な熟練性を示している。
しかしながら、人間の知識は200以上の専門分野を含み、既存のベンチマークの範囲をはるかに超えている。
285分野にわたる大学院レベルの知識と推論能力を評価するベンチマークであるSuperGPQAを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:21:44 GMT)
Self-Rewarding Language Models [100.6] 言語モデル自体がLLM-as-a-Judgeを介して使用される自己回帰言語モデルについて検討し、学習中に独自の報酬を提供する。
反復型DPOトレーニングでは,指導の追従能力が向上するだけでなく,高品質な報酬をそれ自体に提供する能力も向上することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:06:51 GMT)
Learning to Reason for Long-Form Story Generation [98.3] 一般的なストーリー生成タスク(Next-Chapter Prediction)と報酬定式化(Completion Likelihood Improvementによる検証リワード)を提案する。
私たちは、物語の凝縮した情報を推論し、次の章の詳細な計画を作成することを学びます。
私たちの推論は、ストーリージェネレータ作成を支援する章を通じて評価され、トレーニングされていない、教師なしの微調整(SFT)ベースラインと比較されます。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:48:26 GMT)
ActionStudio: A Lightweight Framework for Data and Training of Action Models [88.9] ActionStudioは、アクションモデルのための軽量で標準化されたデータおよびトレーニングフレームワークである。
LoRAやフル微調整,分散セットアップなど,さまざまなトレーニングパラダイムをサポートする。
公的な業界ベンチマークと現実的な業界ベンチマークの両方で有効性を検証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:58:33 GMT)
Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion [88.7] ステレオ変換の詳細な探索を支援するため,高品質なトレーニングデータとベンチマークを提供するMono2Stereoデータセットを紹介した。
1) 左右のビューの違いは微妙であるが、既存のメトリクスでは全体のピクセルを考慮し、ステレオ効果に批判的な領域に集中できない。
本稿では, ステレオ効果に関する人間の判断と高い相関性が得られる新しい評価指標, Stereo Intersection-over-Union を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:25:58 GMT)
SIGHT: Single-Image Conditioned Generation of Hand Trajectories for Hand-Object Interaction [86.5] 本研究では,物体の1つの画像に対して,現実的かつ多様な3次元ハンドトラジェクトリを生成する新しいタスクを提案する。
手動物体の相互作用の軌跡は、ロボット工学、具体化されたAI、拡張現実、および関連分野の応用に大きな恩恵をもたらす。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:53:20 GMT)
DANCE: DAta-Network Co-optimization for Efficient Segmentation Model Training and Inference [86.0] DANCEは、効率的なセグメンテーションモデルのトレーニングと推論のための自動データネットワーク協調最適化である。
入力イメージを適応的にダウンサンプル/ドロップする自動データスライミングを統合し、画像の空間的複雑さによって導かれるトレーニング損失に対するそれに対応するコントリビューションを制御する。
実験と非難研究により、DANCEは効率的なセグメンテーションに向けて「オールウィン」を達成できることを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:40:56 GMT)
SkillMimic: Learning Basketball Interaction Skills from Demonstrations [85.2] 我々は、エージェントがインタラクションスキルを学習する方法を根本的に変える統合データ駆動フレームワークであるSkillMimicを紹介した。
私たちの重要な洞察は、統合されたHOI模倣報酬は、HOIデータセットから多様な相互作用パターンの本質を効果的に捉えることができるということです。
評価のために,約35分間のバスケットボールスキルを含む2つのバスケットボールデータセットを収集,導入した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:56:06 GMT)
Extremely Simple Out-of-distribution Detection for Audio-visual Generalized Zero-shot Learning [84.0] ゼロショット学習は、補助カテゴリー情報を探ることで、見知らぬクラスから見つからないクラスへの知識伝達を可能にする。
本稿では,AV-GZSL法(EZ-AVOOD)を応用し,バイアス問題を緩和する極めて単純なアウト・オブ・ディストリビューション(OOD)検出手法を提案する。
既存の最先端手法と比較して、我々のモデルは3つのオーディオ視覚データセット上でのZSLとGZSLの性能に優れていた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:28:56 GMT)
Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.1] わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:23:07 GMT)
Segment Any Motion in Videos [80.7] 本研究では,長距離軌道運動キューとDINOに基づく意味的特徴を組み合わせた移動物体セグメンテーションを提案する。
本モデルでは,動作を優先し,セマンティックサポートを統合しつつ,時空間軌道注意と動き・セマンティック・デカップリング・エンベディングを用いた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:34:11 GMT)
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis [80.2] 本研究では,新しい次元,すなわち深度次元との相互作用を増大させ,ユーザが軌道上の各点に対して相対的な深度を割り当てることを許す。
本稿では,オブジェクトマスクを数個のクラスタポイントに抽象化することで,画像から映像への3次元トラジェクトリ制御の先駆的手法を提案する。
静的画像から実写映像を生成する際の物体の動きを正確に操作する手法であるLeviTorの有効性を検証する実験を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:08:24 GMT)
Scaling Laws of Scientific Discovery with AI and Robot Scientists [72.3] 我々は、エージェントAIと組込みロボットを融合した自律的なジェネリスト科学者(AGS)システムを構想する。
高度なAIとロボット技術を、仮説の定式化からピアリーな原稿まであらゆる段階に組み込むことで、AGSは科学研究に必要な時間とリソースを削減できる。
我々は、そのようなシステムの増殖と高度化によって、科学的発見が新たなスケーリング法則に従う未来を予見する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:00:27 GMT)
CPPO: Accelerating the Training of Group Relative Policy Optimization-Based Reasoning Models [68.3] 本稿では、推論モデルの学習を高速化するために、CPPO(Completion Pruning Policy Optimization)を提案する。
CPPOはGSM8Kで最大8.32タイム、Mathで3.51タイム、オリジナルのGRPOと比較して精度を保ったり、向上させたりすることができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:30:05 GMT)
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness [68.0] ほとんどの3Dオブジェクトジェネレータは、アプリケーションに必要な物理的制約を無視して、美的品質に重点を置いている。
そのような制約の一つは、3Dオブジェクトが自己支持(つまり、重力下でのバランスが保たれていること)である。
3Dジェネレータが安定な3Dオブジェクトを直接出力する可能性を高めるために、(微分不可能な)シミュレータからのフィードバックを利用するためのフレームワークであるダイレクトシミュレーション最適化(DSO)を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:59:53 GMT)
Sharpe Ratio-Guided Active Learning for Preference Optimization in RLHF [67.5] 本稿では,プロンプトと選好のペアを効率的に選択する能動的学習手法を提案する。
提案手法は,モデル更新に対する影響を評価するために,すべての潜在的選好アノテーションの勾配を評価する。
実験の結果,提案手法は,選択した完了に対する勝利率を最大5%向上させることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:22:53 GMT)
DoubleDiffusion: Combining Heat Diffusion with Denoising Diffusion for Generative Learning on 3D Meshes [67.4] DoubleDiffusionは3次元メッシュ表面の直接生成学習のために、放熱拡散と脱ノイズ拡散を組み合わせたフレームワークである。
本研究は, 3次元表面上での拡散に基づく生成モデルの新しい方向性に寄与し, 3次元アセット生成の分野への応用の可能性を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:57:51 GMT)
GroupMamba: Efficient Group-Based Visual State Space Model [66.4] 状態空間モデル(SSM)は、最近、四次計算の複雑さで長距離依存を捉えることを約束している。
しかし、純粋にSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最先端の性能を達成するために重要な課題に直面している。
本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:38:22 GMT)
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis [65.4] 3Dビジョン言語(3D-VL)ベンチマークは、3D-VLモデルの評価に不足している。
我々は3D-VLグラウンドとQAタスクのベンチマークであるBeacon3Dを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:32:29 GMT)
A Comprehensive Review of Few-shot Action Recognition [64.5] アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。
ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
多くのアプローチが、数発のアクション認識において顕著な進歩を導いている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:09:14 GMT)
Overtrained Language Models Are Harder to Fine-Tune [64.4] 大規模言語モデルは、成長を続けるトークン予算に基づいて事前訓練されている。
事前トレーニングの拡張により、モデルを微調整しにくくなり、最終的なパフォーマンスが低下することを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:10:05 GMT)
Evaluating LLM-based Agents for Multi-Turn Conversations: A Survey [64.1] 本研究では,大規模言語モデル(LLM)に基づくマルチターン対話環境におけるエージェントの評価手法について検討する。
我々は250近い学術資料を体系的にレビューし、様々な出版場所から芸術の状態を捉えた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:08:40 GMT)
DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products [63.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
既存のアーキテクチャは、その状態遷移行列の構造によって規定される、表現性と効率の基本的なトレードオフに直面している。
我々はDeltaProductを紹介し、トークンごとに複数の(n_h$)ステップを踏んで、状態追跡と言語モデリングの優れた機能を実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:16:24 GMT)
A Survey of Deep Graph Learning under Distribution Shifts: from Graph Out-of-Distribution Generalization to Adaptation [59.1] 我々は,分散シフト下での深層グラフ学習について,最新かつ先見的なレビューを行う。
具体的には,グラフ OOD 一般化,トレーニング時グラフ OOD 適応,テスト時グラフ OOD 適応の3つのシナリオについて述べる。
文献をよりよく理解するために,既存の手法をモデル中心およびデータ中心のアプローチに分類する系統分類を導入した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:42:17 GMT)
Synergistic Bleeding Region and Point Detection in Surgical Videos [58.5] 腹腔鏡下手術における術中出血は外科的経過を妨げるために手術野の急激な閉塞を引き起こす。
本研究では,95の手術用ビデオクリップから5,330フレームの出血領域と点アノテーションを備えた実世界の外科用出血検出データセット,SurgBloodを構築した。
手術ビデオにおける出血領域と点の同時検出を実現するために,BlooDetというマルチタスク・シナジスティックオンライン検出器を開発した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:27:55 GMT)
Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding [58.4] CUA-O3Dと呼ばれるオープン語彙3次元シーン理解のためのクロスモーダル・不確実性認識アグリゲーションを提案する。
提案手法は,(1)空間認識型視覚基盤モデルの幾何学的知識とともに,VLMのセマンティックな先入観を取り入れること,(2)モデル固有の不確かさを捉えるために,新しい決定論的不確実性推定を用いること,の2つの課題に対処する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:55:59 GMT)
VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow [58.0] 機能可視化(FV)は、ニューロンが応答している情報をデコードするための強力なツールである。
本稿では,FVを原型画像の特徴の統計値と関連するネットワークフローの測定値を組み合わせることで,画像を生成することを提案する。
我々のアプローチは、最先端のFVに対して質的かつ定量的に改善される人間の理解可能な可視化をもたらす。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:08:18 GMT)
Learning to Instruct for Visual Instruction Tuning [56.2] 視覚インストラクションチューニング(VIT)の進歩であるLITを提案する。
LITは、損失関数を命令シーケンスと応答シーケンスの両方に組み込むことによって、シンプルだが効果的なアプローチを採用する。
驚くべきことに、LITは極めて基本的な視覚能力を備えており、キャプション性能は最大で18%向上している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:04:51 GMT)
Feature4X: Bridging Any Monocular Video to 4D Agentic AI with Versatile Gaussian Feature Fields [56.2] 2次元視覚基礎モデルから4次元領域へ機能を拡張するための普遍的なフレームワークであるFeature4Xを紹介する。
このフレームワークは、まず、ビデオ基礎モデルの機能をSplattingを使って明示的な4D機能フィールドに蒸留し、持ち上げる。
実験では、新しいビューセグメント、幾何学的および外観的シーンの編集、全時間ステップにわたる自由形式VQAについて紹介した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:48:48 GMT)
Challenges and Paths Towards AI for Software Engineering [56.0] ソフトウェア工学におけるAIの進歩を3倍に議論する。
まず、ソフトウェア工学のためのAIにおいて、具体的なタスクを構造化した分類法を提供する。
次に、現在のアプローチを制限するいくつかの重要なボトルネックを概説する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:17:57 GMT)
Quantum entanglement and contextuality with complexifications of $E_8$ root system [55.2] 40個の複素線を持つウィッティング構成は、ドデカヘドロンの幾何学に基づく2つのスピン-3/2系を持つペンローズモデルの再構成の可能性として提案された。
量子状態の設定が提案される性質の分析は、ウィッティング構成の特性を持つ多くのアナログを用いて行われる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:01:54 GMT)
RL-finetuning LLMs from on- and off-policy data with a single algorithm [53.7] 大規模言語モデルを微調整するための新しい強化学習アルゴリズム(AGRO)を提案する。
AGROは生成整合性の概念を利用しており、最適ポリシーはモデルの任意の世代間での整合性の概念を満たすと述べている。
サンプルベースの政策勾配による最適解を求めるアルゴリズムを導出し,その収束に関する理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:02:54 GMT)
RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models [53.3] MLLMのパーソナライズのための検索強化パーソナライズフレームワークについて紹介する。
一般的なMLLMから始まり、3つのステップでパーソナライズされたアシスタントにします。
大規模データセットを事前トレーニングすることにより、RAP-MLLMは、追加の微調整なしで無限の視覚概念に一般化することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:28:44 GMT)
Reasoning of Large Language Models over Knowledge Graphs with Super-Relations [53.1] 本稿では,ReKnoSフレームワークを提案する。
我々のフレームワークの主な利点は、スーパーリレーションを通して複数のリレーションパスを含めることである。
その結果、ReKnoSは既存の最先端ベースラインよりも優れた性能を示し、平均精度は2.92%向上した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:11:04 GMT)
On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [53.1] ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。
DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。
現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:25:06 GMT)
RobuNFR: Evaluating the Robustness of Large Language Models on Non-Functional Requirements Aware Code Generation [52.9] NFR対応コード生成におけるLLMのロバスト性を評価するため,RobuNFRを提案する。
実験の結果,コード生成におけるNFRを考慮した場合,RobuNFRは試験LLMの問題を明らかにすることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:05:33 GMT)
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion Model [52.0] そこで,本研究では,市販ビデオ拡散モデルを利用して,単一入力ビデオから多視点ビデオを生成する4Dビデオ生成手法を提案する。
本手法はトレーニング不要で,市販のビデオ拡散モデルを完全に活用し,マルチビュービデオ生成のための実用的で効果的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:14:48 GMT)
Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints [51.8] Diffusion Transformers (DiT) は、画像およびビデオ生成のための強力なアーキテクチャとして登場し、優れた品質とスケーラビリティを提供している。
DiTの実用アプリケーションは本質的に動的特徴不安定性に悩まされており、キャッシュされた推論中にエラーを増幅する。
本研究では,Long-Skip-Connections (LSC) で拡張された新しい DiT バリアントである Skip-DiT を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:15:19 GMT)
Enhancing Revivals Via Projective Measurements in a Quantum Scarred System [51.3] 量子多体散乱系は非定型的動的挙動を示し、熱化を回避し、周期的状態回復を特徴とする。
パラメタティックPXPモデルのスカー部分空間の力学に及ぼす射影測定の影響について検討する。
我々は、この現象の根底にある重要なメカニズムとして、量子スカーの自然な劣化に対抗して、測定誘起位相再同期を同定する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:03:14 GMT)
An Empirical Study of Validating Synthetic Data for Text-Based Person Retrieval [51.1] 我々は,テキストベース人検索(TBPR)研究における合成データの可能性を探るため,実証的研究を行った。
本稿では,自動プロンプト構築戦略を導入するクラス間画像生成パイプラインを提案する。
我々は、画像のさらなる編集に生成AIモデルを応用した、クラス内画像拡張パイプラインを開発する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:18:15 GMT)
A Dataset for Semantic Segmentation in the Presence of Unknowns [49.8] 既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:31:01 GMT)
GaussianUDF: Inferring Unsigned Distance Functions through 3D Gaussian Splatting [49.6] 本稿では,3次元ガウスとUDFのギャップを埋める新しい手法を提案する。
私たちのキーとなるアイデアは、表面上の細く平坦な2次元ガウス平面を過度に適合させ、それから自己超越と勾配に基づく推論を活用することである。
我々は, 境界を持つ開放面の精度, 効率, 完全性, シャープ性の観点から, 優位性を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:04:54 GMT)
Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning [49.3] 本稿では、事前学習の有効性を大幅に向上させる、新しい周波数ベースの自己監視学習(SSL)手法を提案する。
我々は、知識蒸留によって強化された2ブランチのフレームワークを使用し、モデルがフィルタされた画像と原画像の両方を入力として取り込むことを可能にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:23:10 GMT)
Improving SAM for Camouflaged Object Detection via Dual Stream Adapters [48.1] Segment Any Model (SAM) は自然画像上での汎用的なセグメンテーション性能を示す。
本稿では,RGB-D入力に対して擬似オブジェクト検出を行うSAM-CODを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:12:15 GMT)
Instance-Level Data-Use Auditing of Visual ML Models [47.4] 機械学習(ML)システムにおけるデータの使用に関する法的論争の高まりは、信頼性の高いデータ利用監査機構の必要性を強調している。
本稿では、データ所有者がMLモデルにおける個々のデータインスタンスの使用を監査できるように設計された、最初のプロアクティブなインスタンスレベルのデータ利用監査手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:28:57 GMT)
Masked LoGoNet: Fast and Accurate 3D Image Analysis for Medical Domain [46.4] 我々はLoGoNetと呼ばれる新しいニューラルネットワークアーキテクチャを導入する。
LoGoNetは、LKA(Large Kernel Attention)とデュアルエンコーディング戦略を利用して、U字型アーキテクチャに新しい特徴抽出器を統合する。
大規模ラベル付きデータセットの欠如を補うために,3次元画像に適した新しいSSL方式を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:25:09 GMT)
Style transfer between Microscopy and Magnetic Resonance Imaging via Generative Adversarial Network in small sample size settings [45.6] 磁気共鳴イメージング(MRI)のクロスモーダル増強と、同じ組織サンプルに基づく顕微鏡イメージングが期待できる。
コンディショナル・ジェネレーティブ・逆境ネットワーク (cGAN) アーキテクチャを用いて, コーパス・カロサムのMRI画像から顕微鏡組織像を生成する方法を検討した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:00:28 GMT)
Task Tokens: A Flexible Approach to Adapting Behavior Foundation Models [45.1] 行動基盤モデル(BFM)は、ヒューマノイドエージェントのマルチモーダル、ヒューマンライクな制御を可能にする。
タスクトークン(Task Tokens)は、BFMを柔軟性を維持しつつ、特定のタスクに効果的に調整する方法である。
タスクトークンは,その一般化能力を維持しつつ,特定の制御タスクにBFMを適用する上で有望なアプローチであることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:28:13 GMT)
DeepRetrieval: Hacking Real Search Engines and Retrievers with Large Language Models via Reinforcement Learning [44.8] DeepRetrievalは強化学習(RL)アプローチで、教師付きデータなしで試行錯誤によるクエリ生成のためにLLMをトレーニングする。
検索指標を報奨として,検索性能を最大化するクエリを生成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:01:15 GMT)
Does Your Vision-Language Model Get Lost in the Long Video Sampling Dilemma? [43.3] 低密度サンプリングは重要な情報を欠くリスクを負うが、高密度サンプリングは冗長性をもたらす。
LSDBenchは、LVLM(Large Vision-Language Models)を長時間ビデオ上で評価するための最初のベンチマークである。
本稿では,質問関連キューのグローバルなローカライズと局所的な高密度サンプリングを組み合わせたRHS(Reasoning-Driven Hierarchical Sampling)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:51:10 GMT)
Multi-Task Semantic Communications via Large Models [42.4] 適応型モデル圧縮戦略とフェデレートされた分割微調整アプローチを含む,LAMベースのマルチタスクSemComアーキテクチャを提案する。
近年のローカルおよびグローバルな知識ベースを合成するために,検索拡張生成方式が実装されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:57:34 GMT)
Landscape of Thoughts: Visualizing the Reasoning Process of Large Language Models [42.4] 思考のランドスケープ(英: Landscape of thoughts)は、複数の選択データセットにおいて、思考の連鎖の推論パスを検査するツールである。
強いモデルと弱いモデル、正解と誤解、そして異なる推論タスクを区別する。
また、低い一貫性や高い不確実性など、望ましくない推論パターンを明らかにする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:09:51 GMT)
DRExplainer: Quantifiable Interpretability in Drug Response Prediction with Directed Graph Convolutional Network [42.1] 薬物反応予測のための新しい解釈可能な予測モデルDRExplainerを提案する。
DRExplainerは、細胞株のマルチオミクスプロファイル、薬物の化学構造、既知の薬物応答を統合した有向二部ネットワークを構築する。
計算実験では、DRExplainerは最先端の予測手法と別のグラフベースの説明手法より優れている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:50:29 GMT)
Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users [42.1] 本稿では、視覚障害者のための補助技術として、MLLM(Multimodal Large Language Model)の有効性について検討する。
このようなテクノロジでユーザが直面する採用パターンと,重要な課題を特定するために,ユーザ調査を実施しています。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:54:25 GMT)
Neuroplasticity in Artificial Intelligence -- An Overview and Inspirations on Drop In & Out Learning [42.1] 我々は、神経新生、神経アポトーシス、神経可塑性が将来のAI進歩にどのように影響するかを探求する。
神経新生と再考のためのドロップイン'の概念を導入し,神経アポトーシスのための構造解析を行った。
我々は、この学際領域におけるより大きな研究努力を提唱することで締めくくる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:44:42 GMT)
Theory of the correlated quantum Zeno effect in a monitored qubit dimer [41.9] 2つの測定プロセス間の競合が2つの異なる量子ゼノ(QZ)体制をもたらすことを示す。
我々は、ヒルベルト位相図の構造を捉えることができる波動関数に対するグッツウィラーアンザッツに基づく理論を開発する。
我々は、2つのQZレジームが、非エルミート・ハミルトニアンの非クリック進化を支配下にある流れのトポロジーと密接に関連していることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:44:48 GMT)
Tackling the Accuracy-Interpretability Trade-off in a Hierarchy of Machine Learning Models for the Prediction of Extreme Heatwaves [41.9] ますます複雑な機械学習モデルの階層構造を用いて、フランス上空の極端熱波の確率論的予測を行う。
CNNは高い精度を提供するが、ブラックボックスの性質は解釈可能性を大幅に制限する。
ScatNetは、透明性を高めながら、CNNと同じようなパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:18:27 GMT)
Sell It Before You Make It: Revolutionizing E-Commerce with Personalized AI-Generated Items [41.7] 本稿では,この課題に対処するためにAIGI(AI- generated items)を活用して,e-commercial Product Designのためのパーソナライズされたテキスト・ツー・イメージ生成システムを提案する。
拡散モデルのためのパーソナライズされたグループレベル選好アライメントフレームワーク(PerFusion)を提案し、複数の生成候補画像に対して、ユーザのグループレベルのパーソナライズされた選好をキャプチャする。
AI生成アイテムは、人間によって設計されたアイテムと比較して、クリックスルーレートと変換レートの両方で13%以上の相対的な改善を実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:00:33 GMT)
RELD: Regularization by Latent Diffusion Models for Image Restoration [41.6] 半量子分割を用いた変分フレームワークに遅延拡散モデルを導入する手法を提案する。
提案した戦略はRegularization by Latent Denoising (RELD)と呼ばれ、自然画像のデータセット上でテストされる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:04:21 GMT)
NLS: Natural-Level Synthesis for Hardware Implementation Through GenAI [41.0] 本稿では,システムレベルとコンポーネントレベルの両方で生成人工知能を用いてハードウェアを生成する革新的な手法であるNatural-Level Synthesisを紹介する。
NLSでは、Gen-AIモデルを使用して、自然言語記述を直接ハードウェア記述言語コードに変換することにより、開発、合成、テストステージに深く参加することができる。
我々は,自然言語駆動型HDL合成を容易にするNLSツールを開発し,システムレベルのHDL設計を高速に生成すると同時に,開発複雑性を大幅に低減した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:46:01 GMT)
Foot-In-The-Door: A Multi-turn Jailbreak for LLMs [41.0] 主な課題はjailbreakで、敵はビルトインのセーフガードをバイパスして有害な出力を誘導する。
心理学的フット・イン・ザ・ドアの原則に着想を得て,新しいマルチターンジェイルブレイク法であるFITDを導入する。
提案手法は,中間的なブリッジプロンプトを通じてユーザクエリの悪意ある意図を段階的にエスカレートし,それ自身でモデル応答を調整し,有害な応答を誘導する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:37:10 GMT)
Agent-Centric Personalized Multiple Clustering with Multi-Modal LLMs [40.4] エージェント中心のパーソナライズされたクラスタリングフレームワークを提案する。
エージェントはリレーショナルグラフを横断して、ユーザの関心事に基づいてクラスタを検索する。
その結果,提案手法はカードオーダーとカードサイツのベンチマークで0.9667と0.9481のNMIスコアを得ることができた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:45:15 GMT)
Reconstruction of boosted and resolved multi-Higgs-boson events with symmetry-preserving attention networks [39.8] 我々はSPA-Netアプローチに一般化を導入し、強化と解決された再構築可能性の両方を同時に検討する。
SPA-Net法によりヒッグス粒子再構築の純度は57~62%向上した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:35:46 GMT)
Beyond the Script: Testing LLMs for Authentic Patient Communication Styles in Healthcare [39.7] 本研究は,患者とのコミュニケーションスタイルをシミュレートするためのLarge Language Models (LLMs) を提案する。
感情的・会話的特徴を具現化した仮想患者(VP)を開発した。
医療専門家はこれらのVPを評価し、信頼度(3.8 pm 1.0$;合理化:3.7 pm 0.8$)を評価し、彼らのスタイルを正確に識別した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:04:10 GMT)
Towards shutdownable agents via stochastic choice [39.6] グリッドワールドをナビゲートするための単純なエージェントを訓練するために、DReST報酬関数を使用します。
これらのエージェントは、USEFULとNEUTRALで学ぶことができる。
我々の理論的研究は、これらのエージェントが有用でシャットダウン可能であることを示唆している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:29:42 GMT)
AnyAttack: Towards Large-scale Self-supervised Adversarial Attacks on Vision-language Models [39.3] VLM(Vision-Language Models)は、画像ベースの敵攻撃に対して脆弱である。
我々は、従来の攻撃の制限を超越した自己教師型フレームワークであるAnyAttackを紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:55:23 GMT)
Spectral-factorized Positive-definite Curvature Learning for NN Training [39.3] Adam(W) や Shampoo のような訓練手法は正定値の曲率行列を学習し、プレコンディショニングの前に逆根を適用する。
スペクトル分解正定曲率推定を動的に適用するリーマン最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:49:41 GMT)
High-Fidelity Diffusion Face Swapping with ID-Constrained Facial Conditioning [39.1] Face swappingは、ポーズや表現などのターゲット属性を保持しながら、ソースの顔認証をターゲットにシームレスに転送することを目的としている。
拡散モデルは、その優れた生成能力で知られており、最近、フェイススワッピングの品質を向上する可能性を示している。
本稿では,拡散型顔交換における2つの課題について述べる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:50:17 GMT)
GmNet: Revisiting Gating Mechanisms From A Frequency View [38.8] 本研究では,ゲーティング機構がニューラルネットワークのトレーニング力学に与える影響を周波数の観点から検討した。
本稿では,様々な周波数成分の情報を効率的に活用する軽量モデルを提案する。
GmNetは画像分類タスクの有効性と効率の両面で優れた性能を実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:26:45 GMT)
FusionRF: High-Fidelity Satellite Neural Radiance Fields from Multispectral and Panchromatic Acquisitions [38.6] 衛星マルチスペクトルおよびパンクロマティック画像からのデジタル表面再構成のための新しいフレームワークであるFusionRFを紹介する。
その結果,FusionRFは深度復元精度を平均17%向上し,鋭いトレーニングと新規な視点を呈することがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:01:32 GMT)
How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook [37.5] 時系列分析(TSA)は、データマイニングコミュニティにおいて長年研究されてきたトピックであり、現実世界において大きな意味を持つ。
最近のTSA研究は、新しい研究分野、すなわち、TSAのためのMultiple Modalities(MM4TSA)を形成している。
この調査は、この新興分野の総合的なレビューと詳細な展望を提供する最初のものだ。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:19:22 GMT)
Robust Offline Imitation Learning Through State-level Trajectory Stitching [37.3] イミテーション・ラーニング(IL)は、ロボットが専門家によるデモンストレーションを通じて、視覚運動のスキルを習得できるようにするのに有効であることが証明されている。
オフラインILの最近の進歩は、トレーニングに最適な、ラベルなしデータセットを組み込んでいる。
本稿では,タスク関連トラジェクトリフラグメントとリッチ環境ダイナミクスを活用することで,質の高いオフラインデータセットからのポリシー学習を強化する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:28:36 GMT)
Unicorn: Text-Only Data Synthesis for Vision Language Model Training [36.4] 視覚言語モデル(VLM)のトレーニングは通常、大規模で高品質な画像テキストペアを必要とするが、そのようなデータの収集や合成にはコストがかかる。
我々は,Unicorn-1.2MとUnicorn-471K-Instructionの2つのデータセットを生成する,クロスインテグレーション3段階マルチモーダルデータ合成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:43:00 GMT)
A Progressive Risk Formulation for Enhanced Deep Learning based Total Knee Replacement Prediction in Knee Osteoarthritis [36.1] 変形性膝関節症におけるTKR(Total Knee Replacement)の必要性を予測するための深層学習モデルを開発した。
モデルは、単一のスキャンを使用してTKR予測を実行し、さらに、以前のスキャンが利用可能になった場合、プログレッシブなリスク定式化を活用して予測を改善する。
変形性膝関節症(OAI)と多施設関節症研究(MOST)の膝X線写真とMRIを用いた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:00:51 GMT)
A Survey on Remote Sensing Foundation Models: From Vision to Multimodality [35.5] リモートセンシングのための視覚とマルチモーダル基礎モデルは、インテリジェントな地理空間データ解釈能力を大幅に向上させた。
データタイプの多様性、大規模アノテートデータセットの必要性、マルチモーダル融合技術の複雑さは、これらのモデルの効果的なデプロイに重大な障害をもたらす。
本稿では、リモートセンシングのための最先端のビジョンモデルとマルチモーダル基礎モデルについて、アーキテクチャ、トレーニング方法、データセット、アプリケーションシナリオに焦点をあててレビューする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:57:35 GMT)
Multi-modal Knowledge Distillation-based Human Trajectory Forecasting [35.1] 歩行者の軌道予測は、自律運転や移動ロボットナビゲーションといった様々な用途において重要である。
このようなアプリケーションでは、カメラベースの知覚により、追加のモダリティ(人間のポーズ、テキスト)の抽出が可能になり、予測精度が向上する。
そこで本研究では,多モードの知識蒸留フレームワークを提案する。多モードの知識蒸留を訓練した教師モデルから,限られたモダリティを持つ学生モデルを蒸留する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:32:51 GMT)
Compress Then Test: Powerful Kernel Testing in Near-linear Time [34.5] カーネルの2サンプルテストは、$n$のサンプルポイントに基づいたディストリビューションのペアを識別するための強力なフレームワークを提供する。
我々は,サンプル圧縮に基づく高性能カーネルテストのための新しいフレームワークであるCompress Then Test (CTT)を紹介する。
CTTは、各$n$の点サンプルを小さいが証明可能な高忠実度コアセットに圧縮することで、高価な試験を安価に近似する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:45:17 GMT)
Few-Shot Graph Out-of-Distribution Detection with LLMs [34.4] 本稿では,大規模言語モデル (LLM) とグラフニューラルネットワーク (GNN) の長所を組み合わせたフレームワークを提案する。
LLM-GOODは人間のアノテーションのコストを大幅に削減し、ID分類精度とOOD検出性能の両方において最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:37:18 GMT)
Congenital Heart Disease Classification Using Phonocardiograms: A Scalable Screening Tool for Diverse Environments [34.1] 先天性心疾患(CHD)は早期発見を必要とする重要な疾患である。
本研究では, 心電図(PCG)信号を用いたCHD検出のための深層学習モデルを提案する。
バングラデシュの一次データセットを含むいくつかのデータセットで、我々のモデルを評価した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:47:44 GMT)
Supposedly Equivalent Facts That Aren't? Entity Frequency in Pre-training Induces Asymmetry in LLMs [34.1] 非対称性が論理的に等価な事実の認識に存在し、それは対象と対象とに出現する実体の周波数の相違に起因する。
実験の結果,高頻度の被写体と低周波の被写体は,その論理的等価性にもかかわらず,逆の被写体よりもよく認識されていることが明らかとなった。
これらの知見は, 模擬モデル予測における事前学習データの影響を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:12:38 GMT)
Correlation-Attention Masked Temporal Transformer for User Identity Linkage Using Heterogeneous Mobility Data [34.1] クロスプラットフォームのIDリンクは、データ品質の低さ、高空間性、ノイズ干渉といった課題に直面している。
ユーザの時間的パターンを学習することでモデル学習を向上させるためのトランスフォーマーベースのフレームワークを提案する。
我々のモデルは最先端のベースラインを12.92%17.6%、そして5.80%8.8%で大幅に上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:18:16 GMT)
RUNA: Object-level Out-of-Distribution Detection via Regional Uncertainty Alignment of Multimodal Representations [34.0] RUNAは、アウト・オブ・ディストリビューション(OOD)オブジェクトを検出するための新しいフレームワークである。
これは、OODオブジェクトとIDを効果的に区別するために、地域不確実性アライメント機構を使用する。
実験の結果,RUNAはオブジェクトレベルのOOD検出において最先端の手法を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:01:55 GMT)
Semantix: An Energy Guided Sampler for Semantic Style Transfer [33.9] 本稿では,セマンティック・スタイル・トランスファー(Semantic Style Transfer)という,セマンティック・スタイル・トランスファー(Semantic Style Transfer)という,セマンティック・スタイル・トランスファー(Semantic Style Transfer)という,セマンティック・スタイル・トランスファー(Semantic Style Transfer)というタスクを導入する。
そこで我々は,セマンティックスタイル転送用に設計されたエネルギー誘導型サンプル装置Semantixを提案する。
サンプルとして、Semantixは画像モデルとビデオモデルの両方にシームレスに適用でき、セマンティックスタイルの転送を様々なビジュアルメディア間で汎用化することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:34:30 GMT)
Frame-Voyager: Learning to Query Frames for Video Large Language Models [33.8] ビデオ大言語モデル (Video-LLMs) はビデオ理解タスクにおいて顕著な進歩を遂げている。
フレームの一様サンプリングやテキストフレーム検索のような既存のフレーム選択アプローチでは、ビデオ内の情報密度の変動を考慮できない。
タスクの与えられたテキストクエリに基づいて,情報フレームの組み合わせを問合せする Frame-Voyager を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:19:52 GMT)
Experimental realization of deterministic and selective photon addition in a bosonic mode assisted by an ancillary qubit [33.7] ボソニック量子誤り訂正符号は、主に単一光子損失を防ぐために設計されている。
エラー修正には、エラー状態 -- 逆のパリティを持つ -- をコード状態にマッピングするリカバリ操作が必要です。
ここでは、ボソニックモード上での光子数選択同時光子加算演算のコレクションを実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:55:01 GMT)
Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance [32.5] 大規模言語モデル(LLM)は、強力な一般的な推論能力を示しているが、財務的推論におけるその効果はいまだに解明されていない。
我々は,4つの複雑な財務推論タスクにおいて,24の最先端の一般および推論に焦点を当てたLCMを評価した。
本稿では,Fino1-8BとFinoBの2つのドメイン適応モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:33:36 GMT)
Diagnosis of Pulmonary Hypertension by Integrating Multimodal Data with a Hybrid Graph Convolutional and Transformer Network [32.5] 本研究は,深層学習に基づく肺高血圧症(PH)診断モデルの開発と評価である。
患者を非PH、毛細管前PH、または毛細管後PHに分類するように設計されている。
マルチモーダルデータを効果的に統合することで、臨床的な意思決定を支援することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:14:17 GMT)
MedCL: Learning Consistent Anatomy Distribution for Scribble-supervised Medical Image Segmentation [32.2] 医用ラベルの固有の解剖学的分布を学習するために, MedCL と呼ばれるスクリブル制御クラスタリングに基づくフレームワークを提案する。
SAM と UNet のバックボーンをベースとした MedCL を実装し,正規構造(MSCMRseg),多臓器(BTCV),不整形(MyoPS)の3つのオープンデータセットの性能評価を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:41:44 GMT)
Data-driven Seasonal Climate Predictions via Variational Inference and Transformers [32.0] 我々は季節予測のための気候モデル出力の生成モデルを訓練する。
気候変動に伴う傾向を超えた年次異常予測における手法の性能分析を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:41:47 GMT)
Modeling Multiple Normal Action Representations for Error Detection in Procedural Tasks [31.7] 本稿では,手続き的活動における誤り検出のための適応多重正規表現(AMNAR)フレームワークを提案する。
AMNARはすべての有効な次のアクションを予測し、対応する正常なアクション表現を再構築する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:16:02 GMT)
ArchCAD-400K: An Open Large-Scale Architectural CAD Dataset and New Baseline for Panoptic Symbol Spotting [31.4] ArchCAD-400Kは5538の高度に標準化された図面から413,062個のチャンクからなる大規模CADデータセットである。
我々は、Dual-Pathway Symbol Spotter (DPSS)と呼ばれる、汎視的シンボルスポッティングのための新しいベースラインモデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:40:53 GMT)
Mesh Compression with Quantized Neural Displacement Fields [31.3] 入射神経表現(INR)は様々な3次元表面表現の圧縮に成功している。
本研究は,INRを用いて3次元トライアングルメッシュを圧縮する簡易かつ効果的な手法を提案する。
本研究では, 複雑なテクスチャの保存が可能であり, 圧縮比が4倍から380倍であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:35:32 GMT)
L0-Reasoning Bench: Evaluating Procedural Correctness in Language Models via Simple Program Execution [31.2] 複雑な推論タスクは、インクリメンタルなステップで単純なルールを一貫して正確に適用する能力に依存していることが多い。
手続き的正確性をテストするための言語モデルベンチマークであるL0-Benchを紹介する。
L0-Benchはステップバイステップでエラーのない実行トレースを生成する能力に基づいてモデルをグレードする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:54:56 GMT)
Can video generation replace cinematographers? Research on the cinematic language of generated video [31.0] 本稿では,テキスト・ツー・ビデオ(T2V)モデルにおける撮影制御を改善するための3つのアプローチを提案する。
まず,20のサブカテゴリ,ショットフレーミング,ショットアングル,カメラの動きを網羅した,微妙な注釈付き映画言語データセットを紹介する。
第二に、カメラディフ(CameraDiff)は、ロラを精度よく安定した撮影制御に利用し、フレキシブルショット生成を確実にする。
第3に,撮影アライメントの評価とマルチショット合成のガイドを目的としたCameraCLIPを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:50:25 GMT)
FBNetV5: Neural Architecture Search for Multiple Tasks in One Run [31.0] FBNetV5は、計算コストと人的労力を大幅に削減して、様々な視覚タスクのためのニューラルネットワークを探索できるフレームワークである。
具体的には,1)単純で包括的かつ移動可能な検索空間,2)目標タスクのトレーニングパイプラインと切り離されたマルチタスク探索プロセス,3)タスク数に依存しない計算コストで複数のタスクのアーキテクチャを同時に探索するアルゴリズムを設計する。
我々は、画像分類、オブジェクト検出、セマンティックセグメンテーションという3つの基本的なビジョンタスクをターゲットに、提案したFBNetV5を評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:59:26 GMT)
GCRayDiffusion: Pose-Free Surface Reconstruction via Geometric Consistent Ray Diffusion [30.8] 従来のアプローチでは、高密度ビュー設定において、ポーズのない表面再構成結果が顕著に達成されている。
カメラポーズ推定の線量拡散から抽出した明示的な点による学習を規則化する,ポーズレス表面再構成のための新しい手法を提案する。
我々のGCRayDiffusionは、幾何的に一貫した表面再構成結果により、従来のアプローチよりも正確なカメラポーズ推定を実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:45:09 GMT)
TIMotion: Temporal and Interactive Framework for Efficient Human-Human Motion Generation [30.7] 現在の手法は2つの主要なカテゴリに分類される。
本稿では,人間の動作生成のための効率的かつ効果的なフレームワークであるTIMotion(Temporal and Interactive Modeling)を紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:47:30 GMT)
Mitigating Knowledge Discrepancies among Multiple Datasets for Task-agnostic Unified Face Alignment [30.5] 人間の顔の構造は似ているが、既存の顔アライメント手法では複数のデータセットから統一的な知識を学習することはできない。
本稿では,複数のデータセットから知識を統一する戦略を提案する。
相違の緩和が成功すれば、新しいデータセットへの知識伝達の効率も向上する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:59:27 GMT)
INGeo: Accelerating Instant Neural Scene Reconstruction with Noisy Geometry Priors [30.4] 携帯電話やAR/VRヘッドセットなどのエッジデバイス上での即時再構築を実現することを目的とした,3Dシーンやオブジェクトの再構築を高速化する手法を提案する。
我々は,高度に最適化されたInstant-NGP上でのトレーニング速度を高速化するために,不完全形状のノイズを緩和する戦略を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:11:34 GMT)
Can Large Language Models Play Text Games Well? Current State-of-the-Art and Open Questions [30.4] ChatGPT や GPT-4 のような大規模言語モデル (LLM) は、最近、人間のユーザと通信する顕著な能力を示した。
我々は,ゲームの世界と対話することで,プレイヤが環境を理解し,状況に対処しなければならないような,テキストゲームをプレイする能力について調査する。
実験の結果,ChatGPTは既存のシステムと比較して競争力があるものの,知能のレベルは低いことがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:28:31 GMT)
ProTrix: Building Models for Planning and Reasoning over Tables with Sentence Context [30.3] 本稿では,テーブル上のクエリに文コンテキストで応答するPlan-then-Reasonフレームワークを提案する。
フレームワークはまず、コンテキスト上の推論パスを計画し、次に各ステップをプログラムベースまたはテキスト推論に割り当てて最終回答に到達する。
このフレームワークは、コンテキスト内学習と微調整の両方におけるテーブル推論能力を向上させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:03:38 GMT)
SocialGen: Modeling Multi-Human Social Interaction with Language Models [30.1] 多様な個人間での対話行動のモデル化が可能な,最初の統合運動言語モデルであるSocialGenを紹介する。
対人インタラクションに限られる従来の方法とは異なり、任意の数の個人の動きのトークン化を支援する新しい社会運動表現を提案する。
このアライメントにより、モデルは豊かで訓練済みの言語知識を活用して、人間の社会的行動をよりよく理解し、推論することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:57:25 GMT)
Enhancing LLM Reasoning with Iterative DPO: A Comprehensive Empirical Investigation [29.6] DPO(Direct Preference Optimization)は、大規模言語モデル(LLM)のための強化学習(RL)に代わる費用効率の良い代替手段である。
粗いフィルタ付き1ラウンドのDPOが数学的推論性能を大幅に向上させることを示す。
単純な検証可能な報奨により,計算オーバーヘッドを大幅に低減したRLレベルの性能を実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:00:25 GMT)
Find Any Part in 3D [29.2] 2Dファウンデーションモデルを利用したデータエンジンを構築することで,このデータバリアを壊すことが可能であることを示す。
私たちのデータエンジンは、任意の数のオブジェクト部品に自動的に注釈を付けます。
我々はmIoUの260%の改善を実現し、速度を6倍から300倍に向上させた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:36:55 GMT)
Population Transformer: Learning Population-level Representations of Neural Activity [29.2] 本稿では,大規模なニューラル記録の任意のアンサンブルのための集団レベルの符号を学習する自己教師型フレームワークを提案する。
我々は、ニューラルネットワークの時系列データ、すなわち、被験者とデータセット間のスパースと可変電極分布でモデルをスケーリングする際の重要な課題に対処する。
マルチチャネルの頭蓋内データの復号化と解釈性を改善するために,事前訓練したPopTもリリースしています。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:43:28 GMT)
VinaBench: Benchmark for Faithful and Consistent Visual Narratives [29.1] 忠実なビジュアルな物語を生み出すという課題に対処する新しいベンチマークであるVinaBenchを提案する。
以上の結果から,VinaBenchの知識制約による学習は,生成した視覚的物語の忠実性と結束性を効果的に向上させることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:18:26 GMT)
Knowledge Bridger: Towards Training-free Missing Multi-modality Completion [29.1] 「知識ブリッジ」はモダリティに依存しないものであり、欠落したモダリティの生成とランキングを統合している。
一般領域と医療領域をまたいだ実験結果から,本手法は競合する手法よりも一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:38:14 GMT)
Who is Responsible When AI Fails? Mapping Causes, Entities, and Consequences of AI Privacy and Ethical Incidents [29.1] 私たちは202の現実世界のAIプライバシと倫理的インシデントを分析しました。
これにより、AIライフサイクルステージにまたがるインシデントタイプを分類する分類が作成される。
原因、責任ある実体、開示源、影響などの文脈的要因を考慮に入れている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:57:38 GMT)
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering [28.5] 誤解を招くチャートの視覚化は、知覚を歪め、誤った結論につながる可能性がある。
大規模言語モデル(MLLM)の最近の進歩は、強力なチャート理解能力を示している。
本稿では,ミスリーディングチャート質問回答ベンチマーク(Misleading Chart Question Answering (Misleading ChartQA)ベンチマーク)を紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:24:41 GMT)
DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models [28.4] トークン表現の最適化とビデオ大言語モデルの高速化を目的とした,トレーニング不要なトークン圧縮手法であるDyCokeを提案する。
DyCokeは、フレーム間で冗長トークンをマージすることによって、時間的冗長性を最小化するために、プラグインとプレイの時間的圧縮モジュールを組み込んでいる。
各デコードステップでクリティカルトークンを動的に保持することで、高品質な推論を保証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:11:37 GMT)
Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.1] 因果発見は、生物学的実験から機械的な洞察を明らかにする可能性がある。
因果グラフを予測するために,大規模合成データに基づいて学習した教師付きモデルを提案する。
我々のアプローチは、発見アルゴリズムの出力の典型的なエラーがデータセット間で比較できるという観察によって実現されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:27:51 GMT)
RoomPainter: View-Integrated Diffusion for Consistent Indoor Scene Texturing [27.5] 室内シーン合成において,効率と一貫性をシームレスに統合し,優れた性能を実現するためのフレームワークであるRoomPainterを提案する。
視覚的品質の個々のテクスチャを高めるために,MVRS(Attention-Guided MultiView Integrated Repaint Smpling)を導入する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:52:16 GMT)
FTS: A Framework to Find a Faithful TimeSieve [27.5] 本稿では,TimeSieveにおける不信の識別と修正を目的とした新しいフレームワークを提案する。
我々のフレームワークはモデルの安定性とレジリエンスを高めるために設計されており、その出力が上記の要因の影響を受けないようにしている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:18:10 GMT)
Probabilistic Uncertain Reward Model: A Natural Generalization of Bradley-Terry Reward Model [27.4] Probabilistic Uncertain Reward Model (PURM) は古典的なブラッドリー・テリー報酬モデルの一般化である。
PURMは最終的な報奨性能を向上しつつ、報奨ハッキングの開始を著しく遅らせることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:39:52 GMT)
Q-Insight: Understanding Image Quality via Visual Reinforcement Learning [27.3] 画像品質評価(IQA)は、画像の知覚的視覚的品質に焦点を当て、画像再構成、圧縮、生成などの下流タスクにおいて重要な役割を果たす。
グループ相対ポリシー最適化(GRPO)に基づく強化学習に基づくモデルQ-Insightを提案する。
評価結果から,Q-Insightは,評価結果の回帰と劣化知覚の両面において,既存の最先端手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:59:54 GMT)
T-CIL: Temperature Scaling using Adversarial Perturbation for Calibration in Class-Incremental Learning [27.2] 本研究では,クラス増分学習におけるモデルの信頼性校正について検討する。
ポストホック校正技術の多くは、クラス増分学習に典型的な古いタスクデータの限られた記憶を扱うように設計されていない。
本稿では,T-CILを提案する。T-CILは,従来のタスクに対する検証セットを使わずに,クラス増分学習のための新しい温度スケーリング手法である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:02:34 GMT)
Follow Your Motion: A Generic Temporal Consistency Portrait Editing Framework with Trajectory Guidance [27.2] Follow Your Motionは、肖像画編集における時間的一貫性を維持するための一般的なフレームワークである。
音声頭部編集における微粒化表現の時間的整合性を維持するため,動的再重み付き注意機構を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:18:05 GMT)
EgoToM: Benchmarking Theory of Mind Reasoning from Egocentric Videos [26.9] 我々は、EgoToMというビデオ質問応答ベンチマークを導入し、エゴセントリックなドメインに対する理論・オブ・ミンドの評価を拡張した。
因果ToMモデルを用いて、Ego4Dデータセットのマルチ選択ビデオQAインスタンスを生成し、カメラ装着者の目標、信念、次のアクションを予測する能力をベンチマークする。
これら3つの相互接続型推論問題に対して,人間と芸術マルチモーダル大言語モデル(MLLM)の性能について検討した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:10:59 GMT)
Auditing language models for hidden objectives [26.9] 本研究では,アライメント監査の実施可能性について検討する。
テストベッドとして、私たちは、隠れた目的を持った言語モデルをトレーニングします。トレーニングパイプラインはまず、RLHF報酬モデル(RM)の悪用可能なエラーについてモデルを教えます。
まず、4つのチームがモデルの隠れた目的やトレーニングを知らず、行動やその原因について調査する、盲目な監査ゲームを実施します。
3つのチームが、テクニックを含むテクニックを使って、モデルの隠れた目的を明らかにすることに成功した
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:48:40 GMT)
Visual Agentic AI for Spatial Reasoning with a Dynamic API [26.8] 本稿では,3次元空間推論問題を解くためのエージェントプログラム合成手法を提案する。
我々の手法は、静的なヒューマン定義APIに依存する従来のアプローチの限界を克服する。
本手法は3次元の視覚的推論において,従来のゼロショットモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:27:02 GMT)
LIM: Large Interpolator Model for Dynamic Reconstruction [26.7] 既存の4D再構成手法は、カテゴリー特化モデルや遅い最適化手法によって制限されている。
本稿では,暗黙的な3次元表現を時間をかけて補間するトランスフォーマー・ベースのフィードフォワード・ソリューションであるLarge Interpolation Model(LIM)を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:36:53 GMT)
Identifying and Mitigating API Misuse in Large Language Models [26.4] 大規模言語モデル(LLM)が生成するコードのAPI誤用は、ソフトウェア開発において深刻な課題となっている。
本稿では LLM 生成コードにおける API の誤用パターンについて,Python および Java 間でのメソッド選択とパラメータ使用法の両方を解析し,総合的研究を行った。
上記の分類に基づくAPI誤用に対する新しいLCMベースの自動プログラム修復手法であるDr.Fixを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:43:12 GMT)
UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models [26.1] UniConは、大規模な拡散モデルのためのトレーニングアダプタの制御と効率を向上させるために設計された新しいアーキテクチャである。
拡散モデルと制御アダプタの双方向相互作用に依存する既存の方法とは異なり、UniConは拡散ネットワークからアダプタへの一方向フローを実装している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:13:41 GMT)
One Look is Enough: A Novel Seamless Patchwise Refinement for Zero-Shot Monocular Depth Estimation Models on High-Resolution Images [25.5] 我々は、効率的で一般化可能なタイルベースのフレームワークであるPatch Refine Once (PRO)を提案する。
提案手法は, (i) 深度不連続性問題を緩和しつつ, テスト時間効率を向上させるグループパッチ整合性トレーニングという2つの重要な要素から構成される。
我々のPROはよく調和でき、グリッド境界における深度不連続性の少ない高解像度画像のグリッド入力に対して、そのDEC機能を依然として有効にすることができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:46:50 GMT)
CoGen: 3D Consistent Video Generation via Adaptive Conditioning for Autonomous Driving [25.2] 本研究では,空間適応型生成フレームワークCoGenを導入し,高3次元一貫性で制御可能なマルチビュービデオを実現する。
粗い2次元条件を微細な3次元表現に置き換えることで,生成した映像の空間的整合性を大幅に向上させる。
以上の結果から, この手法は, 自律運転のための信頼性の高い映像生成ソリューションとして, 幾何学的忠実度と視覚的リアリズムの保存に優れることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:27:05 GMT)
Efficient Continual Learning through Frequency Decomposition and Integration [25.0] 本稿では周波数分割統合ネットワーク(FDINet)を提案する。
実験では、FDINetはバックボーンパラメータを78%削減し、最先端(SOTA)メソッドよりも7.49%精度を向上し、ピークメモリ使用量を80%削減している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:36:33 GMT)
Contrasting Low and High-Resolution Features for HER2 Scoring using Deep Learning [25.0] 本研究は、1,272個のIHCスライド(HER2, ER, PR)からなるインド病理乳がんデータセット(IPD-Breast)を紹介する。
HER2の3方向分類(0, Low, High)の予測モデルの開発に重点を置いている。
複数のディープラーニングモデルの評価により、低解像度のIHC画像を用いたエンドツーエンドのConvNeXtネットワークがAUC、F1を達成し、それぞれ91.79%、83.52%、83.56%の精度が得られた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:24:08 GMT)
Resona: Improving Context Copying in Linear Recurrence Models with Retrieval [24.8] 本稿では,リニアリカレントモデルとリカレントモデルを組み合わせたシンプルでスケーラブルなフレームワークである__Resona__を紹介する。
様々な線形リカレントモデルの実験は、様々な合成および実世界の自然言語タスクにおいて顕著な性能向上を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:43:33 GMT)
VidTwin: Video VAE with Decoupled Structure and Dynamics [24.5] VidTwinはコンパクトなビデオオートエンコーダで、ビデオを2つの異なる遅延空間に分離する。
構造潜時ベクトルは全体内容とグローバルな動きを捉え、ダイナミクス潜時ベクトルは微細な詳細と高速な動きを表す。
実験により、VidTwinは高い圧縮率で高い復元品質で0.20%を達成することが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:32:31 GMT)
FLAM: Foundation Model-Based Body Stabilization for Humanoid Locomotion and Manipulation [24.5] 強化学習(Reinforcement Learning, RL)は、ヒューマノイドロボットの体全体を制御するための主要な方法の1つである。
ヒューマノイド・ロコモーション・アンド・マニピュレーション(FLAM)のための基礎モデルに基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:02:32 GMT)
Optimizing Large Model Training through Overlapped Activation Recomputation [24.3] 我々は、トレーニングパイプラインにおける通信と重複する再計算によってオーバーヘッドを削減する新しい再計算フレームワークであるLynxを紹介する。
1.3B-23Bパラメータを持つGPTモデルによる包括的評価の結果,Lynxは既存の再計算手法よりも1.37倍高い性能を示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:43:40 GMT)
MazeNet: An Accurate, Fast, and Scalable Deep Learning Solution for Steiner Minimum Trees [24.2] 我々は,OARSMT(Obstacle Avoiding Rectilinear Steiner Minimum Tree)をデータから解くためのディープラーニングベースの手法であるMazeNetを提案する。
MazeNetの重要な特徴はスケーラビリティです – 少数の端末を持つ迷路上でRCNNブロックをトレーニングするだけでよいのです。
幅広い実験において、MazeNetはOARSMT解決の精度を完璧に達成し、従来の正確なアルゴリズムと比較してランタイムを大幅に削減し、最先端の近似アルゴリズムよりも多くの端末を処理することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:06:51 GMT)
Quantum error correction for long chains of trapped ions [23.9] トラップイオンの長い鎖を持つ量子コンピューティングのモデルを提案する。
量子エラー補正スキームの主な構成要素は、量子コードと量子回路である。
約50ドルの量子ビットのチェーンでは、最先端の量子コードよりも優れた新しい量子コードを構築します。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:28:24 GMT)
MFH: A Multi-faceted Heuristic Algorithm Selection Approach for Software Verification [23.8] ソフトウェア検証のための自動アルゴリズム選択手法 MFH を提案する。
MFHは意味保存変換プログラムのコードプロパティグラフ(CPG)を埋め込み、予測モデルの堅牢性を高める。
20個の検証器と15,000以上の検証タスクでMFHを評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:21:00 GMT)
Improving Low-Resource Retrieval Effectiveness using Zero-Shot Linguistic Similarity Transfer [23.6] グローバリゼーションと植民地化により、世界中の大多数が英語やフランス語などのごく一部の言語を使用するようになった。
このことは、オクシタンやシチリア語など、現在絶滅危惧されている多くの言語が生き残る可能性に大きな影響を与えている。
現状の検索システムは言語の種類によっては堅牢ではなく,検索効率に大きな影響を与えている。
そこで本研究では,2種類の言語品種に対する微調整型ニューラルローダを提案し,それらの言語的類似点にそれらを公開する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:10:19 GMT)
Exploring the Effectiveness of Multi-stage Fine-tuning for Cross-encoder Re-rankers [23.0] 最先端のクロスエンコーダは、パスの再ランク付けに非常に効果的であるように微調整することができる。
微調整の別のアプローチは、非常に効果的な大規模言語モデルのランキングを模倣するようにモデルに教えることである。
コントラスト学習を用いて微調整されたポイントワイドクロスエンコーダの有効性は、多段階アプローチで微調整されたモデルと実際に同等であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:58:31 GMT)
Efficient Data Selection for Training Genomic Perturbation Models [22.7] グラフニューラルネットワークに基づく遺伝子発現モデルは、遺伝子摂動の結果を予測するために訓練される。
アクティブな学習方法は、トレーニングセットを構築するのに必要な実験のコストのために、これらのモデルをトレーニングするためにしばしば使用される。
本稿では,遺伝子発現モデルを訓練するためのグラフベースのワンショットデータ選択法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:45:21 GMT)
Tightening Robustness Verification of MaxPool-based Neural Networks via Minimizing the Over-Approximation Zone [22.6] Ti-Linは、Tight Linear Approximationを用いたMaxPoolベースのCNNの堅牢性検証器である。
オープンソースのベンチマークを用いて,Ti-Linの検証フレームワークに対する有効性を評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:45:35 GMT)
VisTa: Visual-contextual and Text-augmented Zero-shot Object-level OOD Detection [22.2] ゼロショットオブジェクトレベルのOOD検出にCLIPを適用する新しい手法を提案する。
本手法は,重要な文脈情報を保存し,IDとOODオブジェクトを区別する能力を向上させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:08:17 GMT)
Measuring the Influence of Incorrect Code on Test Generation [22.2] 間違ったコードエクスペリエンスのために生成されたテストは、バグ検出率を47%上回っている。
+18%の精度、+4%のカバレッジ、+34%のバグ検出の改善は、自然言語によるコード記述を提供することで達成できる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:00:37 GMT)
Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis [22.0] 本稿では,Audio-Plane(Audio-Plane)をベースとしたガウススプラッティング(Gaussian Splatting)を用いた音声合成手法を提案する。
提案手法は,高精度な音声-リップ同期を確保しつつ,リアルタイムに高度にリアルな音声ビデオを合成することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:50:27 GMT)
MixRT: Mixed Neural Representations For Real-Time NeRF Rendering [22.0] 我々は、低品質メッシュ、ビュー依存変位マップ、圧縮されたNeRFモデルを含む新しいNeRF表現であるMixRTを提案する。
この設計は、既存のグラフィックスハードウェアの能力を効果的に活用し、エッジデバイス上でリアルタイムのNeRFレンダリングを可能にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:07:01 GMT)
Dynamics-Guided Diffusion Model for Sensor-less Robot Manipulator Design [22.0] 本稿では,DGDM(Dynamics-Guided Diffusion Model)を提案する。
オブジェクトの形状とタスク仕様が与えられた後、DGDMはセンサレスマニピュレータの設計を生成する。
生成した設計は、平均成功率で最適化ベースと非誘導拡散ベースラインを相対的に31.5%、45.3%上回った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:09:38 GMT)
Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion Models [21.5] Diffusion-4Kはテキストと画像の拡散モデルを用いた直接超高解像度画像合成のための新しいフレームワークである。
超高解像度画像生成のための総合ベンチマークであるAesthetic-4Kを構築した。
様々な潜伏拡散モデルに適用可能な4K画像を用いた直接訓練のためのウェーブレットに基づく微調整手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:51:44 GMT)
Leveraging LLMs for Predicting Unknown Diagnoses from Clinical Notes [21.4] 放電サマリーはより完全な情報を提供する傾向があり、正確な診断を推測するのに役立ちます。
本研究は,大言語モデル(LLM)が臨床ノートから暗黙的に言及された診断を予測し,それに対応する薬剤にリンクできるかどうかを検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:15:57 GMT)
ORIGEN: Zero-Shot 3D Orientation Grounding in Text-to-Image Generation [21.3] 我々は,テキスト・ツー・イメージ生成における3次元配向グラウンドディングのための最初のゼロショット手法であるORIGENを紹介する。
本稿では,事前学習による3次元方向推定モデルを用いた報酬誘導サンプリング手法を提案する。
実験の結果,ORIGENはトレーニングベースとテストタイムの指導方法の両方で,定量的な測定値やユーザスタディよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:23:12 GMT)
Imperceptible but Forgeable: Practical Invisible Watermark Forgery via Diffusion Models [21.2] 本論文は,非ボックス環境下では認識不能な透かしを鍛造できる最初の透かしフォージェリーフレームワークであるDiffForgeを提案する。
非条件拡散モデルを用いて透かし分布を推定し、透かしを非透かし画像にシームレスに注入する浅瀬逆転を導入する。
総合的な評価では、DiffForgeは96.38%の成功率を持つオープンソースの透かし検出器を騙し、97%の成功率を持つ商用透かしシステムを誤解している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:11:19 GMT)
Preference-based Learning with Retrieval Augmented Generation for Conversational Question Answering [21.0] PRAISEは、ConvQAのパイプラインベースのアプローチで、3つのサブタスクごとにアダプタをトレーニングする。
PRAISEはサブタスク毎の改善を示し、人気の高いConvQAベンチマークで新しい最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:26:49 GMT)
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation [21.0] 提案するTextbfReaRecは,レコメンデータシステムのための最初の推論時間計算フレームワークである。
ReaRecはシーケンスの最後の隠された状態をシーケンシャルレコメンデータに自動的にフィードする。
本稿では2つの軽量推論に基づく学習手法,ERL(Ensemble Reasoning Learning)とPRL(Progressive Reasoning Learning)を紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:59:03 GMT)
TranSplat: Lighting-Consistent Cross-Scene Object Transfer with 3D Gaussian Splatting [20.0] TranSplatはリアルなクロスシーンオブジェクト転送を可能にする3Dシーンレンダリングアルゴリズムである。
提案手法は,(1)ソースシーンからの正確な3次元オブジェクト抽出,(2)ターゲットシーンにおける移動物体の忠実なリライティングという2つの重要な課題に対処する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:59:43 GMT)
PharmAgents: Building a Virtual Pharma with Large Language Model Agents [19.6] マルチエージェントコラボレーションによる仮想医薬エコシステムであるPharmAgentsを紹介する。
このシステムは、特殊な機械学習モデルと計算ツールを備えた、説明可能なLCM駆動エージェントを統合している。
潜在的な治療標的を特定し、有望な鉛化合物を発見し、結合親和性と重要な分子特性を高め、毒性と合成可能性のシリコ分析を行う。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:02:53 GMT)
StreamMind: Unlocking Full Frame Rate Streaming Video Dialogue through Event-Gated Cognition [19.5] 超FPSストリーミングビデオ処理を実現するビデオLLMフレームワークStreamMind(A100では100fps)を紹介する。
我々は「イベント付きLLM呼び出し」という新たな認知認知時間間パラダイムを提案する。
Ego4D と SoccerNet ストリーミングタスクの実験は、標準的なオフラインベンチマークと同様に、モデル能力とリアルタイム効率の両方における最先端のパフォーマンスを実証している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:08:03 GMT)
CRAFT: Designing Creative and Functional 3D Objects [19.5] 本稿では,ベースメッシュから身体を意識した3Dオブジェクトを合成する手法を提案する。
生成されたオブジェクトは、仮想文字でシミュレートしたり、現実世界での使用のために製造することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:40:38 GMT)
Make Some Noise: Towards LLM audio reasoning and generation using sound tokens [19.5] 本稿では,変分量子化とフローマッチングを組み合わせることで,音声を0.23kpbの超低離散トークンに変換する手法を提案する。
我々のトークン化器は、様々な音響イベントを持つ様々なデータセットで従来のVQ-VAEより優れています。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:43:47 GMT)
Empirical Analysis of Sim-and-Real Cotraining Of Diffusion Policies For Planar Pushing from Pixels [18.9] シミュレーションと実際のハードウェアの両方で生成されたデモデータとのコトレーニングは、sim2realギャップを克服するための強力なレシピとして現れている。
シミュレーションデータによってパフォーマンスは向上するが、最終的には高調になる。
意外なことに、視覚的なドメインギャップがあることは、実際にコトレインされたポリシーに役立つ。バイナリプローブは、ハイパフォーマンスなポリシーがシミュレーションされたドメインと実際のドメインを区別することを学習していることを明らかにする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:25:57 GMT)
FLIP: Towards Comprehensive and Reliable Evaluation of Federated Prompt Learning [18.8] 我々は、フェデレートされた素早い学習アルゴリズムを評価するための包括的フレームワークFLIPを紹介した。
FLIPは、4つのフェデレーション学習プロトコルと12のオープンデータセットにまたがる8つの最先端のフェデレーション学習手法の性能を評価する。
本研究は, 資源消費を最小に抑えつつ, 配当と配当の双方において, 迅速な学習が強力な一般化性能を維持することを示すものである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:27:20 GMT)
Hyperspectral Adapter for Object Tracking based on Hyperspectral Video [18.8] 本研究では,新しいハイパースペクトル物体追跡手法であるハイパースペクトル追跡用アダプタ(HyA-T)を提案する。
提案手法は、スペクトル情報の損失を防止するため、ハイパースペクトル画像から直接スペクトル情報を抽出する。
HyA-Tはすべてのデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:31:48 GMT)
Learning Library Cell Representations in Vector Space [18.7] ライブラリーセルの有意義なベクトル表現を効率的に学習する,新たな自己教師型フレームワークであるLib2Vecを提案する。
本フレームワークは,1) セル間の関係をいかによく反映するかを定量的に評価する正則性テストの自動生成方法,2) リバティファイルからトレーニングデータを体系的に抽出し,コストのかかるラベル付けの必要性を除去する自己教師付き学習方式,3) 各種ピン数に対応し,プロパティ固有のセルやアーク埋め込みの作成を可能にする注目モデルアーキテクチャ,の3つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:04:57 GMT)
Stacking Brick by Brick: Aligned Feature Isolation for Incremental Face Forgery Detection [18.5] 鼻訓練IFFDモデルは、新しい偽造物が統合されると破滅的な忘れがちである。
本稿では、SURデータを利用して分布を分離・調整するLatent-space Incremental Detector(LID)を提案する。
評価のために、IFFDに適したより高度で包括的なベンチマークを構築した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:14:46 GMT)
Light Transport-aware Diffusion Posterior Sampling for Single-View Reconstruction of 3D Volumes [18.1] 本稿では,雲など複数の光散乱効果が一様であるフィールドの単一ビュー再構成手法を提案する。
我々は、新しいベンチマークデータセットに基づいて訓練された無条件拡散モデルを用いて、体積場の未知分布をモデル化する。
物理的に基づく微分可能な体積は、潜在空間における光輸送に関して体積勾配を与えるために用いられる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:28:16 GMT)
QuestBench: Can LLMs ask the right question to acquire information in reasoning tasks? [17.9] 現実世界では、大きな言語モデルに対するクエリは、しばしば不特定であり、不足した情報を取得することでのみ解決可能である。
クエストベンチ(QuestBench)は、少なくとも1つの質問で解ける未特定な推論タスクの集合である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:58:40 GMT)
Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization [17.7] シャープネス認識最小化(AUSAM)を加速する漸近的アンバイアスサンプリングを提案する。
AUSAMはモデルの一般化能力を維持しながら、計算効率を大幅に向上させる。
プラグアンドプレイでアーキテクチャに依存しない手法として、我々のアプローチはSAMを様々なタスクやネットワークで継続的に加速させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:00:18 GMT)
Composite Indicator-Guided Infilling Sampling for Expensive Multi-Objective Optimization [17.3] 高価な多目的最適化のための複合指標ベース進化アルゴリズム(CI-EMO)を提案する。
我々は,適合度評価のための候補の選択を誘導する新しい複合性能指標を設計する。
提案アルゴリズムは5つの最先端の高コスト多目的最適化アルゴリズムより優れている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:15:58 GMT)
PromptLA: Towards Integrity Verification of Black-box Text-to-Image Diffusion Models [17.1] 悪意のあるアクターは、不正なコンテンツを生成するためにT2I拡散モデルを微調整することができる。
本稿では,学習オートマトン(PromptLA)に基づく新しいプロンプト選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:39:46 GMT)
Generalizable Prompt Learning of CLIP: A Brief Overview [17.1] この記事では、数発のプロンプト学習に基づくCLIPの概要を紹介する。
このレビューの目的は、CLIPの一般化可能なプロンプトで研究を開始したばかりの研究者への参照を提供することである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:51:32 GMT)
Generating Synthetic Oracle Datasets to Analyze Noise Impact: A Study on Building Function Classification Using Tweets [16.9] ビルディング関数(BFC)では、ツイートはジオグラフィックを使用して収集され、外部データベースを通じてラベル付けされる。
文レベルの特徴雑音の影響は、主に制御分析のためのクリーンなベンチマークデータセットが欠如していることから、まだ探索されていない。
本研究では,LLMを用いた合成データセット生成手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:18:28 GMT)
Single Image Unlearning: Efficient Machine Unlearning in Multimodal Large Language Models [16.9] 本稿では,概念の視覚的認識を数ステップで微調整することで,概念の視覚的認識を解き放つための効率的な手法であるSingle Image Unlearning(SIU)を提案する。
MMUBench の実験結果から,SIU は既存手法の性能を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:13:29 GMT)
Merging Feed-Forward Sublayers for Compressed Transformers [16.7] モデル内の類似パラメータ群をマージすることで,モデル圧縮に対する新しいアプローチを提案する。
具体的には、Transformerモデルでフィードフォワードサブレイヤを分離し、アライメントし、マージする。
モデルフィードフォワードサブレイヤの3分の1以上を組み合わせながら、元のモデルに匹敵する性能を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:40:47 GMT)
EndoLRMGS: Complete Endoscopic Scene Reconstruction combining Large Reconstruction Modelling and Gaussian Splatting [16.5] 本研究では, 手術シーンの完全再構築にLRM(Large Restruction Modelling)とGS(Gaussian Splatting)を併用したEndoLRMGSを提案する。
GSは変形可能な組織を再構築し、LRMは手術器具の3Dモデルを生成し、位置とスケールはその後最適化される。
3つの公開データセットから得られた4つの手術ビデオの実験では、ツール3DモデルのIoU(Intersection-over-union)を2Dプロジェクションで40%改善する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:57:12 GMT)
Self-Evolving Multi-Agent Simulations for Realistic Clinical Interactions [16.5] MedAgentSimは、医師、患者、測定エージェントによる、オープンソースのシミュレートされた臨床環境である。
従来のアプローチとは違って,本フレームワークでは,マルチターン会話を通じて医師が患者と活発に交流する必要がある。
我々は、モデルが診断戦略を反復的に洗練できる自己改善メカニズムを組み込んだ。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:59:53 GMT)
Improving Neural Optimal Transport via Displacement Interpolation [16.5] 最適輸送(OT)理論は、ソース分布をターゲット分布に移動させるコスト最小化輸送マップを考察する。
本稿では, 安定度を向上し, 変位を利用した OT Map の近似性を向上する手法を提案する。
画像から画像への変換タスクにおいて,DIOTMが既存のOTベースモデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:49:34 GMT)
LoRD: Adapting Differentiable Driving Policies to Distribution Shifts [16.3] 運用領域間の分散シフトは、自動運転車における学習モデルの性能に重大な影響を与える可能性がある。
低ランク残差復号器 (LoRD) とマルチタスクファインチューニング (Multi-task fine-tuning) である。
提案手法は, 通常の微調整に比べて最大23.33%, 閉ループOOD駆動スコア9.93%の誤差を補正する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:35:43 GMT)
Non-Monotonic Attention-based Read/Write Policy Learning for Simultaneous Translation [16.3] 同時またはストリーミング機械翻訳は、入力ストリームを読みながら翻訳を生成する。
これらのシステムは品質/レイテンシのトレードオフに直面しており、最小レイテンシの非ストリーミングモデルと同様、高い翻訳品質を達成することを目指している。
このトレードオフを効率的に管理するアプローチを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:00:33 GMT)
LaMOuR: Leveraging Language Models for Out-of-Distribution Recovery in Reinforcement Learning [16.1] 本稿では,不確実性推定に頼らずに回復学習を可能にするLaMOuR(Language Models for Out-of-Distriion Recovery)を提案する。
LaMOuRは、エージェントを元のタスクを成功させる状態に誘導する高密度な報酬コードを生成する。
実験の結果,LaMOuRは様々な移動課題における回復効率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:34:23 GMT)
EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues [16.1] 本稿では,事前学習した言語モデルからの感情知覚とゲーム理論と隠れマルコフモデルに基づく感情推論を組み合わせたEQ-negotiatorを提案する。
クライアントの現在の感情と過去の感情の両方を考慮して、インタラクション中の否定的な感情を管理し、対処する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:57:38 GMT)
DomainCQA: Crafting Expert-Level QA from Domain-Specific Charts [15.4] ドメイン固有のCQAベンチマークを構築するための体系的な方法論であるDomainCQAを紹介する。
天文学分野におけるCQAベンチマークであるAstroChartを開発した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:24:18 GMT)
Zero-shot Domain Generalization of Foundational Models for 3D Medical Image Segmentation: An Experimental Study [15.4] 様々な大規模データに基づいて訓練されたファンデーションモデル(FM)はゼロショットの一般化を約束する。
本研究では,ドメイン・ジェネリゼーション(DG)に対するその能力について,包括的実験により検討する。
本研究は, スマートプロンプト技術により, 領域ギャップを埋める際に, 即効性FMの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:33:41 GMT)
AdaRank: Adaptive Rank Pruning for Enhanced Model Merging [15.4] モデルマージは、独立して微調整されたモデルを統合されたフレームワークに統合するための有望なアプローチとして現れている。
AdaRankは、タスクベクトルの最も有用な特異な方向を適応的に選択し、複数のモデルをマージする新しいモデルマージフレームワークである。
AdaRankは、さまざまなバックボーンとタスク数で一貫して最先端のパフォーマンスを実現し、微調整されたモデル間のパフォーマンスギャップを1%近く削減している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:49:06 GMT)
A Proposal for Networks Capable of Continual Learning [15.4] システム全体の連続学習において重要な特性であるパラメータ更新後の過去の応答を計算ユニットが保持する能力について分析する。
そこで本研究では,本質的な応答保存のための代替手法であるModelleyenを提案する。
我々は、単純な環境の力学をモデル化する実験と、MNISTを用いて、計算複雑性が増大し、その現段階では表現の制限がいくつかあるにもかかわらず、サンプルのリプレイや予め定義されたタスク境界に頼ることなく連続的な学習を実現することを実証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:23:18 GMT)
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging [15.4] Hi3DGenは、画像から通常のブリッジを通して高忠実度3D幾何を生成するための新しいフレームワークである。
本研究は,中間表現として正規写像を利用することにより,画像から高忠実度3次元幾何を生成するための新たな方向を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:39:20 GMT)
3D Acetabular Surface Reconstruction from 2D Pre-operative X-ray Images using SRVF Elastic Registration and Deformation Graph [15.3] 本稿では,2乗根速度関数(SRVF)に基づく弾性形状登録技術を統合する新しいフレームワークを提案する。
術前の骨盤X線像と半球面モデルとを複数視野で観察し, 骨盤の3次元関節面を再構築した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:47:32 GMT)
RLDBF: Enhancing LLMs Via Reinforcement Learning With DataBase FeedBack [15.2] 本研究は,構造化された科学データを用いた大規模言語モデルの強化に関する体系的な研究の先駆者である。
大規模モデルにおける数値的不感度の固有の限界に対処するために,データベースフィードバックを用いた強化学習という,革新的な方法論を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:18:29 GMT)
MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU [15.2] 本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。
4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:40:45 GMT)
DIFFER: Disentangling Identity Features via Semantic Cues for Clothes-Changing Person Re-ID [15.2] 衣服交換者再識別(CC-ReID)は、異なる衣服シナリオの下で個人を認識することを目的としている。
現在のCC-ReIDアプローチは、シルエット、ポーズ、ボディメッシュといった追加のモダリティを使用して、体形をモデル化することに集中している。
DIFFER: Disentangle Identity Features From Entangled Representations, a novel adversarial learning method that leverages textual descriptions to disentangle Identity Features。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:40:59 GMT)
Grasping a Handful: Sequential Multi-Object Dexterous Grasp Generation [15.2] 本稿では,多目的ロボットグリップサンプリングアルゴリズムSeqGraspについて紹介する。
本研究では,SeqGraspとSeqDiffuserをシミュレーションおよび実ロボット上で,最先端の非逐次的マルチオブジェクトグリップ生成法であるMultiGraspに対して実験的に評価した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:24:26 GMT)
Celler:A Genomic Language Model for Long-Tailed Single-Cell Annotation [15.0] 本稿では,単一セルデータのアノテーションに特化して開発されたCellerについて紹介する。
サンプル重量を動的に調整することで、GInf Lossは稀なカテゴリーから学習するモデルの能力を大幅に向上させる。
我々は、80のヒト組織と75の特定疾患にまたがる4000万の細胞を含む大規模な単一細胞データセットCeller-75を構築した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:04:26 GMT)
Omni-AD: Learning to Reconstruct Global and Local Features for Multi-class Anomaly Detection [14.7] 私たちはOmni-ADというフレームワークを構築し、異なる粒度の通常のパターンを学び、徐々に再構築します。
公開異常検出ベンチマーク実験により,本手法はMUADの最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:51:27 GMT)
Beyond Single-Sentence Prompts: Upgrading Value Alignment Benchmarks with Dialogues and Stories [14.6] 大規模言語モデル(LLM)の価値アライメントを評価することは、伝統的に単一文の逆のプロンプトに依存してきた。
マルチターン対話と物語に基づくシナリオを組み込むことで,単一文プロンプトを超越した値アライメントベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:31:37 GMT)
JoyType: A Robust Design for Multilingual Visual Text Creation [14.4] 複数言語によるビジュアルテキスト作成のための新しい手法JoyTypeを紹介した。
JoyTypeは、画像生成プロセス中にテキストのフォントスタイルを維持するように設計されている。
実測値と精度の両面から評価した結果,JoyTypeが既存の最先端手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:27:40 GMT)
Solving Instance Detection from an Open-World Perspective [14.4] インスタンス検出(InsDet)は、与えられた視覚的参照に基づいて、新しいシーンイメージ内の特定のオブジェクトインスタンスをローカライズすることを目的としている。
そのオープンワールドの性質は、ロボット工学からAR/VRまで幅広い応用をサポートしているが、同時に大きな課題も生んでいる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:26:47 GMT)
ERSAM: Neural Architecture Search For Energy-Efficient and Real-Time Social Ambiance Measurement [14.1] エネルギー効率とリアルタイムSAM(ERSAM)のための専用ニューラルネットワーク探索フレームワークを提案する。
具体的には、当社のERSAMフレームワークは、モバイルSAMソリューションのハードウェア効率フロンティアに対して達成可能な精度を推し進めるDNNを自動的に検索することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:03:48 GMT)
LVMark: Robust Watermark for Latent Video Diffusion Models [13.9] ビデオ拡散モデルのための新しい透かし手法であるLVMarkを紹介する。
本稿では,隣接するフレーム間の一貫性を学習し,生成ビデオに適した新しい透かしデコーダを提案する。
拡散モデルの透かしデコーダと潜時デコーダの両方を最適化し、視覚的品質とビット精度のトレードオフを効果的にバランスさせる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:23:37 GMT)
Enhancing Dance-to-Music Generation via Negative Conditioning Latent Diffusion Model [13.7] 条件拡散モデルは、クロスモーダル合成の印象的な結果から注目されている。
本稿では,ダンスビデオのリズミカル・ヴィジュアル・キューと同期した音楽生成の問題に焦点をあてる。
本稿では,正のリズミカル情報と負のリズミカル情報の両方を採用することで,生成された音楽の質とダンスビデオとの同期性を高めることを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:23:03 GMT)
ReLU Networks as Random Functions: Their Distribution in Probability Space [13.4] 本稿では,訓練されたReLUネットワークをランダムなアフィン関数として理解するための新しいフレームワークを提案する。
ネットワークによって実現可能なアフィン関数上の離散確率分布を導出する。
我々の研究は、ReLUネットワークの動作と性能を理解するためのフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:58:40 GMT)
Why Stop at One Error? Benchmarking LLMs as Data Science Code Debuggers for Multi-Hop and Multi-Bug Errors [13.3] DSDBench: Data Science Benchmarkを紹介します。
マルチホップエラートレースとマルチバグ検出におけるLCMの体系的評価のための最初のベンチマークである。
これには、711の因果エラーペアとランタイムエラーメッセージを備えた1,117の注釈付きサンプルが含まれている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:46:54 GMT)
FedLWS: Federated Learning with Adaptive Layer-wise Weight Shrinking [13.3] フェデレートラーニング(FL)では,新たなグローバルモデルを生成するために,局所モデルの重み付けアグリゲーションを行う。
我々は,適応層ワイトシンキング(FedLWS)を用いた新しいモデル集約戦略,フェデレートラーニングを提案する。
FedLWSは、レイヤワイズで縮小係数を適応的に設計し、プロキシデータセット上の縮小係数の最適化を避ける。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:37:16 GMT)
Breach in the Shield: Unveiling the Vulnerabilities of Large Language Models [13.2] 大言語モデル(LLM)と視覚言語モデル(VLM)は、汎用人工知能にとって欠かせないものとなっている。
本稿では,情報幾何学に根ざした統計的手法に着想を得たLSMの新しい安定性尺度を提案する。
提案手法は,入力画像中の有害領域やトークン埋め込みにおける臨界次元の検出に有効であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:23:59 GMT)
Tokenization of Gaze Data [13.2] その性質から、視線データのトークン化戦略に関する研究は行われていない。
我々は,3つの異なるデータセットの視線データに対する5つの異なるトークン化器を解析した。
我々は、量子化トークンーザが、視線位置の予測において他よりも優れており、視線速度の予測では、k平均が最適であることを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:41:09 GMT)
A Survey of Circuit Foundation Model: Foundation AI Models for VLSI Circuit Design and EDA [13.0] サーキットのためのファンデーションAIモデルは、新しい技術トレンドとして登場した。
新たなAIモデルは,1) 固有回路特性を学習するために,大量のラベル付きデータを用いた自己教師付き事前学習,2) 特定の下流アプリケーションのための効率的な微調整,の2段階を通じて開発されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:27:27 GMT)
Predicting human decisions with behavioral theories and machine learning [13.0] 本稿では,行動理論(BEAST)と機械学習を統合したハイブリッドモデルであるBEAST Gradient Boosting(BEAST-GB)を紹介する。
BEAST-GBは、膨大なデータと数十の既存の行動モデルに基づいてトレーニングされたニューラルネットワークよりも正確に予測する。
我々の結果は、機械学習を理論的フレームワーク、特に予測のために設計されたBEASTと統合することで、人間の振る舞いを予測し理解する能力が向上することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:01:41 GMT)
A RAG-Based Multi-Agent LLM System for Natural Hazard Resilience and Adaptation [12.9] 大規模言語モデル(LLM)は、人工知能と機械学習のフロンティアにおける変換能力である。
本稿では,自然災害や極端気象イベントの文脈における分析と意思決定を支援するために,RAGに基づくマルチエージェントLLMシステムを提案する。
本稿では,山火事のシナリオに着目した専門システムWildfireGPTを紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:14:39 GMT)
Dist Loss: Enhancing Regression in Few-Shot Region through Distribution Distance Constraint [12.8] Dist Lossは、モデルとターゲットラベルの間の分布距離を最小限に抑えるために設計された損失関数である。
コンピュータビジョンとヘルスケアにまたがる3つのデータセットを対象に実験を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:57:57 GMT)
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback [12.7] 本稿では、推論タスク検証器(RTV)と生成報酬モデル(GenRM)を組み合わせたハイブリッド報酬システムを導入し、報酬ハッキングを緩和する。
また,応答の多様性を維持し,学習効率を高めるために,新しいプロンプト選択手法であるPre-PPOを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:26:41 GMT)
Adaptive Weighted Parameter Fusion with CLIP for Class-Incremental Learning [12.7] クラス増分学習により、モデルは新しいクラスからの知識を漸進的に吸収することができる。
モデルが新しいクラスで最適化されると、前のクラスの知識は必然的に消去され、破滅的な忘れ去られる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:38:57 GMT)
Multi-modal Speech Transformer Decoders: When Do Multiple Modalities Improve Accuracy? [12.7] 合成および実世界の両方のデータセットにおける認識精度に対する多重モーダル性の影響について検討する。
音声認識のための補足的モダリティとしてのイメージは、中等度雑音レベルにおいて最大の利益をもたらす。
最も関連性の高い視覚情報が前処理ステップとしてフィルタリングされる場合、合成データセットと実世界のデータセットの両方のパフォーマンスが向上する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:48:26 GMT)
SafeCast: Risk-Responsive Motion Forecasting for Autonomous Vehicles [12.6] リスク応答型モーション予測モデルであるSafeCastを提案する。
安全を意識した意思決定と不確実性を意識した適応性を統合する。
我々のモデルは、軽量なアーキテクチャと低推論レイテンシを維持しながら、最先端(SOTA)の精度を実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:38:21 GMT)
Data-driven modeling of fluid flow around rotating structures with graph neural networks [12.3] 本稿では, メッシュが構造と共回転する流体流れに対する, グラフニューラルネットワークに基づく代理モデルの適用について述べる。
構造化されたCartesianメッシュに依存する従来のデータ駆動アプローチとは異なり、当社のフレームワークは非構造化されたコローテーションメッシュで動作する。
以上の結果から,2000年以上の周期的状態において,モデルが安定かつ正確なロールアウトを達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:06:19 GMT)
Disentangled 4D Gaussian Splatting: Towards Faster and More Efficient Dynamic Scene Rendering [12.3] 2次元画像から動的シーンを合成する新アンタングルビュー合成(NVS)は重要な課題である。
時間的および空間的変形を両立させる新しい表現・レンダリング手法であるDisentangled 4D Gaussianting(Disentangled4DGS)を導入する。
提案手法は,3090 GPU上での1352times1014$の解像度で,343FPSの平均レンダリング速度を実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:46:02 GMT)
Knowledge Rectification for Camouflaged Object Detection: Unlocking Insights from Low-Quality Data [12.3] KRNetは、低品質データの偽造オブジェクト検出のために明示的に設計された最初のフレームワークである。
KRNetは最先端のCOD法と超高分解能COD法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:53:21 GMT)
Leveraging ASIC AI Chips for Homomorphic Encryption [12.2] ホモモルフィック暗号化(HE)は強力なプライバシー保証を提供するが、平文での計算よりもはるかに多くのリソースを必要とする。
このレイテンシ問題を緩和するためにアクセラレータが登場したが、ASICのコストが高い。
HEプリミティブは、すでにクラウドに広くデプロイされているTPUのような既存のASIC AIアクセラレータ上で、AIオペレータに変換され、アクセラレーションされることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:24:35 GMT)
Mitigating Trade-off: Stream and Query-guided Aggregation for Efficient and Effective 3D Occupancy Prediction [12.1] 3Dの占有率予測は、自動運転の重要な認識課題として浮上している。
近年の研究では、過去の観測から得られた情報の統合に焦点が当てられ、予測精度が向上している。
本稿では,過去の情報をストリームベースで集約するフレームワークStreamOccを提案する。
Occ3D-nusデータセットの実験によると、StreamOccはリアルタイム設定で最先端のパフォーマンスを実現し、メモリ使用量を従来の方法に比べて50%以上削減している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:05:53 GMT)
Patch-Depth Fusion: Dichotomous Image Segmentation via Fine-Grained Patch Strategy and Depth Integrity-Prior [12.0] Dichotomous Image (DIS)は、高解像度の自然画像のための高精度な物体分割タスクである。
我々は,高精度2コトマ画像分割のための新しいPatch-Depth Fusion Network (PDFNet) を設計した。
PDFNetは最先端の非拡散法を大きく上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:47:24 GMT)
AutoComPose: Automatic Generation of Pose Transition Descriptions for Composed Pose Retrieval Using Multimodal LLMs [11.9] 合成ポーズ検索(CPR)により、ユーザーは参照ポーズと遷移記述を指定して人間のポーズを検索できる。
既存のCPRデータセットは、コストのかかる人的アノテーションやアノテーションベースのルール生成に依存している。
マルチモーダルな大規模言語モデル(MLLM)を利用する最初のフレームワークであるAutoComPoseを導入し、リッチで構造化されたポーズ遷移記述を自動的に生成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:21:35 GMT)
Tomography of Quantum States from Structured Measurements via quantum-aware transformer [11.7] 量子状態のキャラクタリゼーションのための量子計測の構造について検討する。
我々は、測定周波数と密度行列の複雑な関係を捉えるために、量子認識変換器(QAT)モデルを設計する。
特に、アーキテクチャにおける量子演算子をクエリして、量子データの情報表現を容易にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:22:48 GMT)
Enhance Generation Quality of Flow Matching V2A Model via Multi-Step CoT-Like Guidance and Combined Preference Optimization [11.6] 本稿では,Chain-of-Perform(CoP)誘導学習を用いたマルチステージ・マルチモーダル・エンドツーエンド生成フレームワークを提案する。
我々は、高品質な音響効果の発生を保証するために、ステップバイステップのガイダンスに従う多段階トレーニングフレームワークを実装した。
第3に、ステップバイステップの音響効果生成を支援するために、ビデオでガイドされたマルチモーダルデータセットを開発する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:32:14 GMT)
MO-CTranS: A unified multi-organ segmentation model learning from multiple heterogeneously labelled datasets [11.6] 多臓器セグメンテーションは多くの臨床業務において重要な役割を担っている。
部分的にラベル付けされたデータセットから堅牢に学習できる単一のモデルをトレーニングすることは依然として難しい。
このような問題を克服できる単一のモデルMO-CTranSを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:00:59 GMT)
Quamba2: A Robust and Scalable Post-training Quantization Framework for Selective State Space Models [11.5] ステートスペースモデル(SSM)は、一貫したメモリ使用量と高性能のため、トランスフォーマーの魅力的な代替品として浮上している。
これを解決するために、ビット幅の少ないデータフォーマットでSSMを定量化することで、モデルのサイズを減らし、ハードウェアアクセラレーションの恩恵を受けることができる。
We present Quamba2, compatible with W8A8, W4A8, W4A16 for both Mamba1 and Mamba2 backbones。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:10:39 GMT)
Evil twins are not that evil: Qualitative insights into machine-generated prompts [11.4] 我々は不透明な機械生成プロンプト(オートプロンプト)を初めて網羅的に分析した。
機械生成プロンプトは、しばしば理解不能で、生成に強く影響を及ぼす最後のトークンによって特徴づけられる。
人間の専門家は、後部のオートプロンプトの中で最も影響力のあるトークンを確実に特定することができ、これらのプロンプトが完全に不透明ではないことを示唆している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:07:39 GMT)
Vocabulary-Free 3D Instance Segmentation with Vision and Language Assistant [11.4] 語彙自由な設定で3Dインスタンスのセグメンテーションに対処する最初の手法を提案する。
我々は、大きな視覚言語アシスタントとオープン語彙の2Dインスタンスセグメンタを活用して、セマンティックなカテゴリを発見し、グラウンド化する。
ScanNet200 と Replica を用いて提案手法の評価を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:00:39 GMT)
Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba [11.4] イベントカメラは生物学的システムからインスピレーションを受け、低レイテンシと高ダイナミックレンジを持ち、最小限の電力を消費する。
Event Cloudの処理に対する現在のアプローチは、フレームベースの表現に変換することが多い。
我々はPoint Cloud表現に基づく効率的かつ効果的なフレームワークであるEventMambaを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:25:05 GMT)
SCHNet: SAM Marries CLIP for Human Parsing [11.3] Segment Anything Model (SAM) と Contrastive Language-Image Pre-Training Model (CLIP) は,セグメンテーションおよび検出タスクにおいて有望な性能を示した。
我々は、SAMとCLIPの機能を効果的に統合し、人間の解析に役立てるために、高効率なモジュールを定式化する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:40:06 GMT)
Drop the Golden Apples: Identifying Third-Party Reuse by DB-Less Software Composition Analysis [11.2] 現代のソフトウェア開発におけるサードパーティのライブラリ(TPL)は、重大なセキュリティとコンプライアンスのリスクをもたらす。
本稿では,DB-Lessソフトウェア構成分析(SCA)の最初のフレームワークを提案する。
Androidのネイティブライブラリ識別とC/C++のコピーベースのTPL再利用という2つの典型的なシナリオに関する実験は、SCAでデータベースレス戦略を実装する上で好都合な未来を実証した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:25:24 GMT)
Segment then Splat: A Unified Approach for 3D Open-Vocabulary Segmentation based on Gaussian Splatting [11.2] 3D空間でのオープンボキャブラリクエリは、ロボット工学、自律システム、拡張現実といったアプリケーションにおいて、よりインテリジェントな認識を可能にするために不可欠である。
既存のほとんどの手法は2Dピクセルレベルの解析に依存しており、多視点の不整合と3Dオブジェクトの検索が貧弱になる。
そこで,静的シーンと動的シーンの両方に対して,3D対応のオープン語彙セグメンテーション手法であるセグメンテーションを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:36:51 GMT)
Outlier dimensions favor frequent tokens in language models [11.1] 我々は,多くの現代言語モデルにおいて,不規則な次元が出現することを示し,その関数を常に頻繁な単語の予測に遡ることを示す。
我々は,多くの異なるモデルによって有用なトークン予測を実装するための特別なメカニズムである,と結論付けている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:55:05 GMT)
The Marine Debris Forward-Looking Sonar Datasets [10.9] 本論文では,3つの異なるセッティングを持つマリンデブリフォワード・ルック・ソナーデータセットについて述べる。
いくつかのタスクに対して、完全なデータセット記述、基本的な分析、初期結果を提供します。
研究コミュニティがこのデータセットの恩恵を受けることを期待しています。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:12:03 GMT)
Post-Incorporating Code Structural Knowledge into LLMs via In-Context Learning for Code Translation [10.8] 大規模言語モデル(LLM)はソフトウェアマイニングにおいて大きな進歩を遂げた。
ソースコードの構文構造を扱うことは 依然として課題です
本稿では、コード構造知識を事前学習したLLMに組み込むために、インコンテキスト学習(ICL)を用いる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:59:42 GMT)
Dynamically Allocated Interval-Based Generative Linguistic Steganography with Roulette Wheel [10.7] 既存の言語ステガノグラフィースキームは、しばしば候補プール内のトークンの条件付き確率(CP)を見落としている。
本稿では, DAIRstegaと呼ばれる, 割り当てられた間隔に基づくスキームを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:24:55 GMT)
DREMnet: An Interpretable Denoising Framework for Semi-Airborne Transient Electromagnetic Signal [10.7] SATEM法は大規模で難解な地域を迅速調査することができる。
従来の denoising 技術は、ノイズの多い環境でフィールドデータを処理するのに不十分なパラメータ選択戦略に依存している。
本稿では、DREMnetと呼ばれる解釈可能な非結合表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:13:23 GMT)
ShadowHack: Hacking Shadows via Luminance-Color Divide and Conquer [10.6] シャドーは、画像の明るさの低減、テクスチャ劣化、色歪みなどの課題を導入する。
本研究は,従来のタスクを輝度回復と色修復に分解することで,これらの複雑さに対処する分割型戦略である textbfShadowHack を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:23:12 GMT)
Intrinsic Image Decomposition for Robust Self-supervised Monocular Depth Estimation on Reflective Surfaces [10.6] 自己教師付き単分子深度推定(SSMDE)は深層学習の分野で注目を集めている。
固有画像分解をSSMDEに組み込んだ新しいフレームワークを提案する。
本手法は単眼深度推定と内在画像分解の両方を相乗的に訓練する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:56:59 GMT)
EllieSQL: Cost-Efficient Text-to-SQL with Complexity-Aware Routing [10.4] Text-to-sqlでは、専門知識のない非技術者がデータベースからデータを取得することができる。
リーダーボードにおける先進的なText-to-sqlアプローチの成功にもかかわらず、持続不可能な計算コストは見落とされがちである。
推定複雑性に基づいてクエリを適切なパイプラインに割り当てる,複雑性を意識したルーティングフレームワークであるEllieを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:11:27 GMT)
A Causal Framework to Measure and Mitigate Non-binary Treatment Discrimination [10.3] 非バイナリな処理決定は意思決定プロセスに不可欠なものであり、意思決定者によって制御されている、と我々は主張する。
公平性分析を拡張する因果的枠組みを提案する。
この枠組みは歴史的データから治療の差別を効果的に緩和することを示します。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:06:35 GMT)
Permutation-Invariant and Orientation-Aware Dataset Distillation for 3D Point Clouds [10.3] 本稿では,3次元点雲に対する分布マッチングに基づく新しいデータセット蒸留法を提案する。
学習可能な回転角を用いて各合成モデルを元の特徴分布を表す最適方向に応じて変換する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:15:22 GMT)
Towards robust variational quantum simulation of Lindblad dynamics via stochastic Magnus expansion [10.1] 我々はリンドブラッド方程式の変分量子シミュレーションのための新しい一般的な枠組みを紹介する。
数値的な例を通して,本アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:37:56 GMT)
SemAlign3D: Semantic Correspondence between RGB-Images through Aligning 3D Object-Class Representations [9.8] 単分子深度推定とLVM特徴量から3次元オブジェクトクラス表現を構築するための,単純だが効果的な手法を提案する。
入力RGB画像における3次元オブジェクトクラス表現とオブジェクトクラスインスタンスとのアライメントを得るために、勾配降下を用いて最小化できるアライメントエネルギーを定式化する。
提案手法は,SPair-71kデータセットに挑戦する複数のカテゴリにおいて,最先端のマッチング精度を実現する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:14:19 GMT)
Integrating Artificial Intelligence with Human Expertise: An In-depth Analysis of ChatGPT's Capabilities in Generating Metamorphic Relations [9.8] 本稿では OpenAI が開発した GPT モデルを用いて, メタモルフィック関係(MR)の生成と評価について詳細に検討する。
本研究の目的は,システムアンダーテスト(SUT)におけるGPT-3.5とGPT-4のMRの品質を評価することである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:31:32 GMT)
MM-GTUNets: Unified Multi-Modal Graph Deep Learning for Brain Disorders Prediction [9.8] 脳障害予測のためのマルチモーダルグラフ深層学習フレームワークMM-GTUNetsを提案する。
本稿では,報酬システムを用いて集団グラフを適応的に構築するMRRL(Modality Reward Representation Learning)を提案する。
また,ACMGL(Adaptive Cross-Modal Graph Learning)を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:27:15 GMT)
A Deep Learning Framework for Boundary-Aware Semantic Segmentation [9.7] 本研究では境界拡張機能ブリッジングモジュール(BEFBM)を用いたMask2Formerに基づくセマンティックセマンティックセマンティクスアルゴリズムを提案する。
提案手法は,mIOU,mDICE,mRecallなどのメトリクスを大幅に改善する。
ビジュアル分析は、きめ細かい領域におけるモデルの利点を裏付ける。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:00:08 GMT)
Estimating City-wide operating mode Distribution of Light-Duty Vehicles: A Neural Network-based Approach [9.4] 本稿では,動作モード分布を推定するモジュール型ニューラルネットワーク(NN)に基づくフレームワークを提案する。
アメリカ合衆国ブルックラインMAのよく校正されたマイクロシミュレーションモデルを用いて検証した。
提案手法は, 迅速かつ正確な排出推定を行うことにより, リアルタイムの排出監視に利用することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:43:04 GMT)
Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving [9.4] 強化学習(Reinforcement Learning, RL)は, 自律運転における意思決定と制御の問題を解く上で, 優れた性能を示した。
ドライビングは多属性問題であり、現在のRL法における多目的互換性を実現する上での課題となっている。
マルチオブジェクト対応自律運転のためのハイブリッドパラメタライズアクションを用いた多目的アンサンブル・クリティカル強化学習法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:49:25 GMT)
Niyama : Breaking the Silos of LLM Inference Serving [9.4] 共有インフラストラクチャ上での多様なワークロードの効率的なスケジューリングを可能にする,新規な推論サービスシステムであるNiyamaについて紹介する。
Niyamaは詳細な分類アプリケーションを導入し、正確なレイテンシ要件を指定し、リアルタイムシステム状態に基づいてスケジューリング決定を動的に適用する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:04:20 GMT)
Breaking Language Barriers in Visual Language Models via Multilingual Textual Regularization [9.3] 本稿では,視覚的インストラクションチューニング中にテキストのみの多言語データを注入する連続多言語統合戦略を提案する。
本手法は,視覚能力の低下を伴わない言語間の言語忠実度を著しく向上させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:26:52 GMT)
Do LLMs estimate uncertainty well in instruction-following? [9.1] 大規模言語モデル(LLM)は、ユーザ指示に従うことができるため、さまざまなドメインにわたるパーソナルAIエージェントとして価値のあるものになり得る。
命令追従の文脈におけるLCMの不確実性推定能力の最初の体系的評価について述べる。
以上の結果から,既存の不確実性手法は,特にモデルが後続の命令で微妙な誤りを犯した場合に困難であることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:50:55 GMT)
Process Reward Modeling with Entropy-Driven Uncertainty [8.9] Entropy-Driven Unified Process Reward Model (EDU-PRM)は、プロセス監視における最先端のパフォーマンスを近似する新しいフレームワークである。
EDU-PRMは、ロジット分布エントロピーを用いて、高不確かさ領域をピンポイントするエントロピー誘導動的パーティショニングステップ機構を導入する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:33:37 GMT)
Interpretable Deep Learning Paradigm for Airborne Transient Electromagnetic Inversion [8.9] 本稿では,不整合表現学習に基づく統合的・解釈可能な深層学習逆変換パラダイムを提案する。
提案手法は, 直接ノイズデータを用いて地下電気構造を正確に再構築できることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:01:20 GMT)
DiTFastAttnV2: Head-wise Attention Compression for Multi-Modality Diffusion Transformers [8.7] そこで本研究では,テキスト・画像生成モデルにおける注目度向上を目的としたポストトレーニング圧縮手法であるDiTFastAttnV2を紹介する。
MMDiTの注意パターンの詳細な分析を通じて,頭部矢印の注意とキャッシング機構を提案する。
カスタマイズされたカーネルでは、DiTFastAttnV2は注目のFLOPを68%削減し、2K画像生成におけるエンドツーエンドのスピードアップを1.5倍に向上させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:00:12 GMT)
Enhancing Small Language Models for Cross-Lingual Generalized Zero-Shot Classification with Soft Prompt Tuning [8.4] ゼロショット分類(ZSC)は、モデルがトレーニング中に見えないカテゴリに分類できるようにするために欠かせないものとなっている。
我々は,言語間ZSCを強化するソフトプロンプトを訓練するための軽量でデータ効率のよいアプローチであるRoSPromptを紹介する。
我々は,106言語をカバーする多言語 PLM に対するアプローチを評価し,強い言語間転送性能と堅牢な一般化能力を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:23:44 GMT)
Generative Latent Neural PDE Solver using Flow Matching [8.4] 低次元の潜伏空間にPDE状態を埋め込んだPDEシミュレーションのための潜伏拡散モデルを提案する。
我々のフレームワークは、オートエンコーダを使用して、異なるタイプのメッシュを統一された構造化潜在グリッドにマッピングし、複雑なジオメトリをキャプチャします。
数値実験により,提案モデルは,精度と長期安定性の両方において,決定論的ベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:44:28 GMT)
Camera Model Identification with SPAIR-Swin and Entropy based Non-Homogeneous Patches [8.3] ソースカメラモデル識別(SCMI)は、画像鑑定において、認証と著作権保護を含む応用において重要な役割を担っている。
空間的注意機構と逆残差ブロック(SPAIR)とスウィントランスフォーマーを組み合わせた新しいモデルであるSPAIR-Swinを提案する。
SPAIR-Swinは、グローバル機能とローカル機能の両方を効果的にキャプチャし、SCMIに特に有効であるノイズパターンなどのアーティファクトの堅牢な識別を可能にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:47:28 GMT)
Sun-Shine: A Large Language Model for Tibetan Culture [8.3] チベット文化の最初の大規模言語モデルであるLlama-Sunshine(Sun-Shine)を紹介する。
Sun-Shineはチベット語の言語的特徴のために最先端のモデル最適化アーキテクチャを取り入れている。
また,チベット語テキストを多用した総合データセットであるTIB-STCを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:35:17 GMT)
Multimodal Machine Learning for Real Estate Appraisal: A Comprehensive Survey [8.3] 自動評価、マルチモーダル機械学習に対する新しいアプローチが形になった。
マルチモーダル機械学習は、予測精度の観点から、単一モダリティまたはより少ないモダリティアプローチを著しく上回る。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:47:06 GMT)
Firm or Fickle? Evaluating Large Language Models Consistency in Sequential Interactions [8.1] 大きな言語モデル(LLM)は、様々なタスクにまたがって顕著な能力を示していますが、高い領域への展開には、複数のインタラクションラウンドで一貫したパフォーマンスが必要です。
本稿では,LLM応答整合性の評価と改善のための総合的なフレームワークを紹介し,その3つの重要な貢献について述べる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:49:56 GMT)
Data-Free Universal Attack by Exploiting the Intrinsic Vulnerability of Deep Models [8.1] ディープニューラルネットワーク(DNN)は、ユニバーサル・ディバイサル摂動(UAP)に影響を受けやすい
Intrinsic UAP(IntriUAP)と呼ばれる新しいデータフリー手法を提案する。
本手法は,画像サンプルを使わずに,一般的な画像分類深度モデルを攻撃する上で,高い競争力を発揮する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:48:50 GMT)
ViSketch-GPT: Collaborative Multi-Scale Feature Extraction for Sketch Recognition and Generation [8.0] ViSketch-GPTは、マルチスケールコンテキスト抽出アプローチによって課題に対処するために設計された新しいアルゴリズムである。
このモデルは複雑な詳細を複数のスケールで捉え、アンサンブルのようなメカニズムで組み合わせる。
ViSketch-GPTの有効性は、QuickDrawデータセットの広範な実験を通じて検証される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:28:30 GMT)
Do LLMs "know" internally when they follow instructions? [7.9] 大規模言語モデル (LLM) が命令追従の成功と相関する表現に情報をエンコードするかどうかを検討する。
本分析では,入力埋め込み空間の方向を指示追従次元と呼び,応答が与えられた命令に適合するかどうかを予測する。
この次元に沿った表現の修正は、ランダムな変化に比べて、命令追従の成功率を改善することを実証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:40:49 GMT)
Characterizing dynamical criticality of many-body localization transitions from the Fock-space perspective [7.8] 多体局在遷移(MBLT)を持つ3つの系に対する、変位のダイナミクス、フォック空間における半径分布分布の拡散について検討する。
BKT型スケーリングは, ランダムモデルとフロケモデルにおけるMBLTのより正確な記述を提供し, パワー・ロー・スケーリングから得られたものよりも大きい(有限サイズ)臨界点が得られることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:05:53 GMT)
Optimal Locality and Parameter Tradeoffs for Subsystem Codes [7.8] サブシステムコードの$D$次元埋め込みにおいて、相互作用の数と長さの両方の低い境界を証明します。
具体的には、パラメータ $[n,k,d] のサブシステムコードの $[n,k,d] を $mathbbRD$ に埋め込むには、少なくとも$M*$ の長さの相互作用が少なくとも$ell*$ でなければならないことを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:38:54 GMT)
Feature Responsiveness Scores: Model-Agnostic Explanations for Recourse [7.7] 消費者保護規則では、企業は意思決定対象に予測を説明する必要がある。
これらのプラクティスが、改善に繋がらない機能を強調して、消費者を弱める方法を示します。
応答性スコアに基づいて特徴を強調することにより,これらの課題に対処することを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:09:11 GMT)
Understanding Inequality of LLM Fact-Checking over Geographic Regions with Agent and Retrieval models [7.6] オープンモデルとプライベートモデルの実際の精度を、さまざまな領域やシナリオで評価する。
以上の結果から,グローバル・ノースの発言は,シナリオやLLMによらず,グローバル・サウスの発言よりも格段に優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:07:43 GMT)
Quantum Doeblin Coefficients: Interpretations and Applications [7.4] 古典情報理論において、古典的チャネルのドエブリン係数は、チャネルの総偏差収縮係数に効率よく計算可能な上限を与える。
ここでは、古典的概念の一般化としての量子ドエブリン係数について検討する。
量子機械学習アルゴリズムの制限からエラー軽減プロトコルまで、量子Doeblin係数の様々な応用を概説する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:45:44 GMT)
Pairwise Matching of Intermediate Representations for Fine-grained Explainability [7.4] そこで本研究では,細粒度で高度に局所化された視覚的説明を生成するための新しい説明可能性法(PAIR-X)を提案する。
解釈性を改善することで、PAIR-Xは人間が正しいマッチと間違ったマッチを区別するのに役立つ。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:13:43 GMT)
USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving [7.4] 自律運転における3次元物体検出器の安全性指向性能について考察する。
本稿では,単純だが重要な局所化要件を特徴付ける空間的制約 (USC) について述べる。
既存のモデルに対する安全性指向の微調整を可能にするために,定量的な測定値を共通損失関数に組み込む。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:42:03 GMT)
Using AI to Summarize US Presidential Campaign TV Advertisement Videos, 1952-2012 [7.4] 本稿では、デジタル形式で利用可能な、米国大統領選挙のテレビCMの最大かつ最も包括的なデータセットを紹介する。
データセットには、さまざまな学術研究を促進するために設計された、マシン検索可能な書き起こしと高品質な要約も含まれている。
我々は、ビデオの作成、翻訳、要約の面倒なプロセスを自動化する、大規模に並列化されたAIベースの分析パイプラインを設計する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:36:23 GMT)
Benchmarking the Robustness of Instance Segmentation Models [7.2] 本稿では,実世界の画像の破損や領域外画像の収集に関して,インスタンス分割モデルの包括的評価を行う。
グループ正規化は、画像の内容が同じだが、上に汚職が加えられている汚職間のネットワークの堅牢性を高める。
また、単段検出器はトレーニングサイズよりも画像解像度が大きくなるほど一般化しないことがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:46:44 GMT)
Penrose Tiled Low-Rank Compression and Section-Wise Q&A Fine-Tuning: A General Framework for Domain-Specific Large Language Model Adaptation [7.2] 大規模言語モデル(LLM)は、材料科学のような専門的な科学分野に対して大きな約束を持っている。
本稿では,この課題に対処するために,構造化モデル圧縮と科学的微調整システムを組み合わせた2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:33:05 GMT)
One-Shot Imitation under Mismatched Execution [7.1] 人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。
これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。
シーケンスレベルの最適輸送コスト関数を用いて,人間とロボットの軌道を自動的にペアリングする新しいフレームワークRHyMEを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:16:37 GMT)
LLM Stability: A detailed analysis with some surprises [7.0] 本研究では,10ランにまたがる8つの共通タスクに適用した場合に決定論的に設定された5つのLSMにおける非決定性について検討する。
自然に発生する実行に最大15%の精度のばらつきがあり、最高のパフォーマンスと最悪のパフォーマンスのギャップがある。
我々は,決定論の定量化に重点を置いた指標,Nでの合意率の総和はNで,TARa@Nで解析された回答の総和率はTARa@Nで紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:44:43 GMT)
NuGrounding: A Multi-View 3D Visual Grounding Framework in Autonomous Driving [7.0] 我々はNuGroundingを紹介した。NuGroundingは、自動運転におけるマルチビュー3次元視覚グラウンドのための最初の大規模ベンチマークである。
本稿では,マルチモーダルLLMの命令理解能力と専門的検出モデルの正確な位置推定能力とをシームレスに組み合わせた新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:55:16 GMT)
Dirac-isotonic oscillators in (1 + 1) and (2 + 1) dimensions [7.0] 2+1)$次元のディラック発振器は反ジャイネス・カミングス様ハミルトニアンに写像できることを示す。
一般化されたシステムの正確な解を記述し、それらの非相対論的極限を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:01:18 GMT)
EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation [6.8] 本稿では,高画質でプライバシー保護された人工心エコー画像とビデオを生成するための新しいフレームワークであるEchoFlowを紹介する。
本研究は,EchoFlowを用いた合成データセットのみにトレーニングされた下流モデルが,実際のデータセットでトレーニングされたモデルと性能的に同等であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:51:59 GMT)
SensorBench: Benchmarking LLMs in Coding-Based Sensor Processing [6.8] 大規模言語モデル(LLM)は、知覚データを処理する上で有望な能力を持ち、センサーシステムを開発するための副操縦士としての可能性を示している。
我々は,定量化のための総合的なベンチマークであるSensorBenchを構築した。
以上の結果から,LLMは単純なタスクでかなりの習熟度を示す一方で,構成タスクの処理において固有の課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:42:25 GMT)
WorkTeam: Constructing Workflows from Natural Language with Multi-Agents [6.7] 手作りのワークフロー構築には専門家の知識が必要です。
スーパーバイザ,オーケストレータ,フィラーエージェントで構成されるマルチエージェントNL2WorkflowフレームワークであるWorkTeamを提案する。
当社のアプローチはワークフロー構築の成功率を大幅に向上させ,エンタープライズNL2Workflowサービスの新規かつ効果的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:33:29 GMT)
Free fermions under adaptive quantum dynamics [6.6] 我々は、一意ゲートと射影測定からなる適応量子力学の下で自由フェルミオン系を研究する。
補正ユニタリ演算は、電荷密度波の順序を特徴とする状態に制御できる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:54:01 GMT)
MultiClaimNet: A Massively Multilingual Dataset of Fact-Checked Claim Clusters [6.4] textitMultiClaimNetは3つの多言語クレームクラスタデータセットの集合である。
クレームクラスタは、手動の介入が限定されたクレームマッチングペアから自動的に形成される。
この大きなデータセットには、78言語で書かれた85.3Kのファクトチェッククレームが含まれている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:49:45 GMT)
DeepOFormer: Deep Operator Learning with Domain-informed Features for Fatigue Life Prediction [6.4] 機械学習とディープラーニングは、疲労寿命予測に有望な結果を提供する。
演算子学習問題としてS-N曲線予測を定式化してDeepOFormerを提案する。
DeepOFormerは0.9515のR2、平均絶対誤差0.2080、平均相対誤差0.5077を達成し、最先端の深層/機械的学習法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:34:35 GMT)
AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control [6.4] Action Learner (AcL) は、教師による新しい強化学習フレームワークである。
AcLにより、四足歩行者は、複数の関節断層の下での安定した歩行に自律的に歩行を適応することができる。
我々は,単関節および二重関節の故障下で,実際のGo2四足歩行ロボット上でAcLを検証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:15:56 GMT)
OmniVox: Zero-Shot Emotion Recognition with Omni-LLMs [6.4] ゼロショット感情認識タスクにおける4つのオムニ-LLMの最初の体系的評価であるOmniVoxを提案する。
我々は、IEMOCAPとMELDの2つの広く使われているマルチモーダル感情ベンチマークを評価し、ゼロショットのOmni-LLMが優れているか、微調整されたオーディオモデルと競合するかを見出した。
本稿では、音響特徴分析、会話コンテキスト分析、ステップバイステップ推論に焦点を当てた、オムニ-LLMの音声特異的プロンプト戦略である音響プロンプトについて述べる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:34:25 GMT)
Efficient Verified Machine Unlearning For Distillation [6.4] PURGE(Partitioned Unlearning with Retraining Guarantee for Ensembles)は、未学習と蒸留を統合した新しいフレームワークである。
理論的解析,未学習プロセスにおける重要なスピードアップの定量化,および複数のデータセットに対する実証的検証を行う。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:38:07 GMT)
Promoting the Culture of Qinhuai River Lantern Shadow Puppetry with a Digital Archive and Immersive Experience [6.3] 本研究は,漢詩や絵画の場面を再現するデジタル技術を活用した,清海川ランタン祭の影人形のデジタルアーカイブを作成する。
その結果、使いやすさと文化体験の向上は、観客の魅力と理解を向上させる一方で、感情体験の強化は観客の参加意欲を高めることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:30:27 GMT)
DeepAudio-V1:Towards Multi-Modal Multi-Stage End-to-End Video to Speech and Audio Generation [6.3] 本稿では,ビデオとテキストの条件に基づいて音声と音声を同時に生成する,エンドツーエンドのマルチモーダル生成フレームワークを提案する。
提案するフレームワークであるDeepAudioは、ビデオ音声(V2A)モジュール、テキスト音声(TTS)モジュール、モダリティ融合(MoF)モジュールの動的混合からなる。
評価において,本フレームワークは,ビデオオーディオおよびテキスト音声ベンチマークの最先端モデルとの比較において,同等の結果を得る。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:29:08 GMT)
KG4Diagnosis: A Hierarchical Multi-Agent LLM Framework with Knowledge Graph Enhancement for Medical Diagnosis [6.0] KG4Diagnosisは、大規模言語モデルと知識グラフの自動構築を組み合わせた、新しい階層型マルチエージェントフレームワークである。
本フレームワークは,2層構造を用いて実世界の医療システムをミラーリングする。初期評価とトリアージのためのGPエージェントであり,特定のドメインにおける深度診断のための特殊なエージェントと協調する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:31:57 GMT)
Deep Depth Estimation from Thermal Image: Dataset, Benchmark, and Challenges [5.9] この原稿は、ステレオRGB、ステレオNIR、ステレオサーマル、ステレオLiDARデータ、半密度深度基底真理からなる大規模なマルチスペクトルステレオ(MS$2$)データセットを提供する。
MS$2$データセットには、さまざまな場所でキャプチャされた162Kの同期マルチモーダルデータペアが含まれている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:46:55 GMT)
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization [5.9] メタロラ(Meta-LoRA)は、アイデンティティに依存しない知識とアイデンティティ固有の適応を分離するフレームワークである。
この結果から,Meta-LoRAは多種多様なアイデンティティ条件にまたがって優れたアイデンティティ保持,計算効率,適応性を達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:47:33 GMT)
Spatial Transport Optimization by Repositioning Attention Map for Training-Free Text-to-Image Synthesis [5.9] 拡散ベースのテキスト・ツー・イメージ(T2I)モデルは高品質な画像生成に優れています。
空間コヒーレントなT2I合成のための新しいトレーニング不要なアプローチSTORMを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:12:25 GMT)
COBRA: COmBinatorial Retrieval Augmentation for Few-Shot Adaptation [5.8] 我々は,COBRA(COmBinatorial Retrieval Augmentation,COBRA)を提案する。
COBRAは、ダウンストリームモデルの性能を大幅に向上させながら、検索コストに無視可能な計算オーバーヘッドを導入している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:53:36 GMT)
Nonhuman Primate Brain Tissue Segmentation Using a Transfer Learning Approach [5.8] 非ヒト霊長類(NHP)は、人間の脳機能や神経疾患を理解するための重要なモデルである。
NHPの脳組織セグメンテーションは神経疾患を理解するために重要であるが、注釈付きNHP脳MRIデータセットが不足しているため困難である。
本稿では,人間の脳MRIデータから伝達される知識を活用するために,STU-Netとトランスファーラーニングを用いた新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:51:22 GMT)
AH-GS: Augmented 3D Gaussian Splatting for High-Frequency Detail Representation [5.8] AH-GSは、構造的に複雑な領域の3次元ガウスアンが高周波符号化を得ることを可能にする。
本手法は,Scaffold-GSのレンダリング品質をわずか15Kイテレーションで上回る。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:57:33 GMT)
RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracy [5.8] 低ランク適応(LoRA)がパラメータ効率のLLM微調整の主流となっている。
LoRAベースの量子化誤差補償(LQEC)は圧縮LDMの精度を回復するための強力なツールである。
RILQ(Rank-Insensitive LoRA-based Quantization Error Compensation)を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:40:20 GMT)
Analysis of On-policy Policy Gradient Methods under the Distribution Mismatch [5.7] 配当ミスマッチが政策勾配法に与える影響を解析する。
本研究は, 政策勾配法の堅牢性に関する新たな知見と, 理論的基礎と実践的実装のギャップについて考察した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:52:41 GMT)
VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots [5.7] textitVizFlytはオープンソースの知覚中心型ハードウェア・イン・ザ・ループ(HITL)フォトリアリスティック・テスト・フレームワークである。
我々は,3Dガウススプラッティングを用いたリアルタイム・光実写型視覚センサの幻覚化のために,外部位置決めシステムからのポーズを利用する。
これにより、障害物に衝突するリスクを伴わずに、自律的なアルゴリズムを空中ロボット上で無ストレスでテストすることができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:03:30 GMT)
Generating Structured Plan Representation of Procedures with LLMs [5.6] 本稿では,SOPを構造化表現に変換する新しい手法であるSOPStructuringを紹介する。
SOPStructは、異なるドメインにわたるSOPの標準化された表現を生成し、認知負荷を低減し、ユーザの理解を改善する。
我々の研究は、プロセスモデリングを合理化するために、大規模言語モデルの変換可能性を強調します。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:38:24 GMT)
Effective Automation to Support the Human Infrastructure in AI Red Teaming [5.5] 私たちは、AIリスクアセスメントを強化するために、人間の専門知識と自動化ツールを組み合わせるバランスのとれたアプローチを議論しています。
私たちは、労働者の熟練度、エージェンシー、コンテキスト認識に関する考慮を含む、自動化された赤いチーム編成のスケーリングにおける重要な課題を強調します。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:36:15 GMT)
The Mind in the Machine: A Survey of Incorporating Psychological Theories in LLMs [5.4] 本稿では,心理学理論がLarge Language Models (LLMs) の発達過程にどう影響するかを考察する。
本調査は,認知,発達,行動,社会的,人格心理学,心理言語学の知見を統合した。
クロスドメイン接続と緊張点の両方を調べることで、ディシプリナ分割を橋渡しし、将来のNLP研究への心理学のより思慮深い統合を促進することを目指している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:55:24 GMT)
Multi-Objective Quality-Diversity in Unstructured and Unbounded Spaces [5.4] 品質多様性のための多目的非構造レパートリー(MOUR-QD)を紹介する。
MOUR-QDは、非構造的かつ非有界な特徴空間のために設計されたMOQDアルゴリズムである。
提案手法は,MOQDを教師なしドメインに適用する方法を編み出し,特徴を学習しなければならないタスクにおいて優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:55:39 GMT)
Level-anticrossing in B(E2) anomaly (I) [5.3] Pan emphet al. (PRC, 110, 054324, 2024)によりB(E2)異常を説明する新しいメカニズムが与えられた
新しいメカニズムは、SU(3)対称性の極限におけるレベル交差現象と関連しているレベル交差現象と関連している。
B(E2) Anomaly in $170$Os この一般的なフレームワークでも議論されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:40:16 GMT)
Comparing Methods for Bias Mitigation in Graph Neural Networks [5.3] 本稿では,生成人工知能(GenAI)のためのデータ準備において,グラフニューラルネットワーク(GNN)が果たす重要な役割について考察する。
本稿では,データスペーシフィケーション,特徴修正,合成データ拡張という,3つの異なるバイアス緩和手法の比較分析を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:18:48 GMT)
DynaGraph: Interpretable Multi-Label Prediction from EHRs via Dynamic Graph Learning and Contrastive Augmentation [5.2] DynaGraphは、エンドツーエンドの解釈可能なコントラストグラフモデルである。
実世界の4つの臨床データセットでモデルを検証した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:13:30 GMT)
I Know Therefore I Score: Label-Free Crafting of Scoring Functions using Constraints Based on Domain Expertise [5.2] 多次元数値データからスコアリング関数を学習するためのラベルなし実践的手法を提案する。
このアプローチでは、ドメインエキスパートの洞察とビジネスルールを、容易に観察可能で特定可能な制約という形で取り入れています。
このような制約を、スコアリング関数を学習しながら同時に最適化された損失関数に変換する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:34:43 GMT)
Unified ODE Analysis of Smooth Q-Learning Algorithms [5.2] 近年,Q-ラーニングのためのコンバージェンス解析をスイッチングシステムフレームワークを用いて導入している。
スイッチングシステムアプローチを改善するために,より汎用的で統一的な収束解析を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:38:47 GMT)
PromptMono: Cross Prompting Attention for Self-Supervised Monocular Depth Estimation in Challenging Environments [5.1] 本稿では,統合モデル内の異なる環境における深度予測のための視覚的プロンプト学習を紹介し,PromptMonoと呼ばれる自己教師型学習フレームワークを提案する。
学習可能なパラメータのセットを視覚的なプロンプトとして使用して、ドメイン固有の知識をキャプチャする。
提案したPromptMonoを,Oxford RobotcarデータセットとnuScenesデータセットで評価した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:53:05 GMT)
A multi-locus predictiveness curve and its summary assessment for genetic risk prediction [5.1] 本稿では,ケースコントロール研究のためのマルチマーカー予測曲線と非パラメトリック手法を提案する。
また、予測性曲線とROC曲線とローレンツ曲線との接続を実証する。
我々は,ニコチン依存のリスク予測モデルを評価するために,予測性曲線と予測性Uを用いて実データ解析を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:49:39 GMT)
STADE: Standard Deviation as a Pruning Metric [5.0] ワンダのような最先端のプルーニング手法は、再訓練せずにモデルを熟成し、プルーニングプロセスをより速く、より効率的にする。
プルーニング問題の理論的解析は、Wandaが最適プルーニング法である機械学習において一般的なシナリオを明らかにする。
Llama と Open Pre-trained Transformer (OPT) モデルの実験は、これらの理論的な結果を検証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:03:14 GMT)
SimBank: from Simulation to Solution in Prescriptive Process Monitoring [4.9] SimBankはPresPMメソッドの正確なベンチマークのために設計されたシミュレータである。
様々なレベルの複雑さを伴う様々な介入最適化問題を取り入れている。
SimBankは総合的な評価機能も提供している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:12:09 GMT)
Medical Misinformation in AI-Assisted Self-Diagnosis: Development of a Method (EvalPrompt) for Analyzing Large Language Models [4.9] 本研究は、自己診断ツールとしての大規模言語モデル(LLM)の有効性と、医療情報の拡散における役割を評価することを目的とする。
我々は,実世界の自己診断を模倣するオープンエンド質問を用いて,現実的な自己診断を模倣する文のドロップアウトを行い,情報不足を伴う現実的な自己診断を模倣する。
その結果, LLMの応答が不明確で不正確な場合が多いため, LLMの質素な機能を強調した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:34:35 GMT)
Trade-off between Information Gain and Disturbance in Local Discrimination of Entangled Quantum States [4.8] 我々は、地域国家の差別において情報ゲイン・ディストゥルバンス・トレードオフ関係を確立する。
局所的な運用が事前に共有された絡み合いによって支援される場合、トレードオフを回避できることが示される。
本稿では,ノイズの非分極に対して頑健な絡み合い認証プロトコルを提案し,これを量子ネットワークのマルチパーティイトシナリオに一般化する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:33:24 GMT)
Risk-based Calibration for Generative Classifiers [4.8] リスクベースキャリブレーション(RC)と呼ばれる学習手法を提案する。
RCは、トレーニングサンプルの0-1損失に応じて関節確率分布を調整することにより、生成分類器を反復的に洗練する。
RCは、訓練誤差と一般化誤差の両方の観点から、クローズドフォームの学習手順を著しく上回っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:04:24 GMT)
Patronus: Bringing Transparency to Diffusion Models with Prototypes [4.8] 本稿ではProtoPNetにインスパイアされた解釈可能な拡散モデルであるemphPatronusを紹介する。
PatronusはプロトタイプネットワークをDDPMに統合し、プロトタイプの抽出と生成プロセスの条件付けを可能にする。
このモデルは、イメージ操作のような下流タスクをサポートし、より透明で制御された修正を可能にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:31:40 GMT)
ABC-GS: Alignment-Based Controllable Style Transfer for 3D Gaussian Splatting [4.7] ABC-GSは,高品質な3Dスタイル転送を実現するために,3Dガウス平滑化に基づく新しいフレームワークである。
制御可能なマッチングステージは、シーン内容とスタイル特徴の正確なアライメントを実現するように設計されている。
特徴アライメントに基づくスタイル転送損失関数を提案し、スタイル転送の結果が参照画像のグローバルなスタイルを正確に反映することを保証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:07:57 GMT)
SAIF: A Comprehensive Framework for Evaluating the Risks of Generative AI in the Public Sector [4.7] 生成AI(SAIF)のリスクを評価するためのシステムdAta generatIon Frameworkを提案する。
SAIFには、リスクのブレークダウン、シナリオの設計、Jailbreakメソッドの適用、プロンプト型探索の4つの重要なステージがある。
我々は、この研究が、生成AIの公共部門への安全かつ責任ある統合を促進する上で重要な役割を担っていると信じている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:46:04 GMT)
MambaBEV: An efficient 3D detection model with Mamba2 [4.7] MambaBEVは、長いシーケンス処理に最適化された高度な状態空間モデル(SSM)であるMamba2を利用する、BEVベースの3Dオブジェクト検出モデルである。
マンバBEVベースのNDSは51.7%、mAPは42.7%である。
本研究は, 自律運転知覚におけるSSMの可能性, 特に大域的文脈理解と大規模物体検出の強化について明らかにした。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:22:25 GMT)
MASCOTS: Model-Agnostic Symbolic COunterfactual explanations for Time Series [4.7] モデルに依存しない方法で有意義で多様な対実観測を生成するMASCOTSを導入する。
シンボリックな特徴空間で操作することで、MASCOTSは元のデータとモデルへの忠実さを維持しながら解釈可能性を高める。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:48:12 GMT)
Opioid Named Entity Recognition (ONER-2025) from Reddit [4.6] Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。
本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。
まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。
次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。
第三に、スラング、曖昧さ、断片化を含む重要な言語課題を分析する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:51:06 GMT)
LLM-enabled Instance Model Generation [4.5] 本研究では,大規模言語モデル(LLM)を用いたインスタンスモデルの生成について検討する。
まず、LLMを用いて、必要なすべてのインスタンスモデル情報を含む簡易な構造化出力を生成し、その中間表現を有効なXMIファイルにコンパイルする。
提案手法は, 実例モデル生成タスクにおけるLCMのユーザビリティを著しく向上することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:34:29 GMT)
VoteFlow: Enforcing Local Rigidity in Self-Supervised Scene Flow [4.5] シーンフロー推定は、2つの隣接するLiDARスキャンから点当たりの動きを復元することを目的としている。
自律運転のような現実世界のアプリケーションでは、ポイントが他と独立して動くことは滅多にない。
ニューラルネットワーク設計に軽量なアドオンモジュールを導入し、エンドツーエンドの学習を可能にした。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:06:27 GMT)
DeepSound-V1: Start to Think Step-by-Step in the Audio Generation from Videos [4.5] マルチモーダル大言語モデル(MLLM)の内部連鎖(CoT)を利用したビデオから音声を生成するフレームワークを提案する。
対応するマルチモーダル推論データセットを構築し、音声生成における初期推論の学習を容易にする。
実験では,提案手法が生成した音声の不一致(発声)の低減に有効であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:56:19 GMT)
Detecting Localized Deepfake Manipulations Using Action Unit-Guided Video Representations [4.4] ディープフェイク技術は、実際のビデオと合成ビデオのギャップを狭め、プライバシーとセキュリティの深刻な懸念を生じさせている。
この研究は、ディープフェイクビデオにおける局所的な編集を一般化するために明示的に設計された最初の検出手法を示す。
提案手法は,現在の最先端検出法よりも精度が20%向上する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:49:00 GMT)
Can Language Models Follow Multiple Turns of Entangled Instructions? [4.4] 現実世界のシナリオは、秘密のプライバシ、個人の好み、優先順位付けなど、時間とともに複数の命令をまたいだ一貫性を必要とする。
本研究は,多方向命令処理における大規模言語モデルの能力について,系統的研究を行った。
我々は,Human-in-the-loopアプローチを用いて,約1.1Kの高品質なマルチターン会話を用いたMultiTurnInstructを構築した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:17:40 GMT)
Exploration of Design Alternatives for Reducing Idle Time in Shor's Algorithm: A Study on Monolithic and Distributed Quantum Systems [4.4] Shorのアルゴリズムでは、量子ビット効率を保ちながら、アイドル時間を最小限に抑えるための交互設計手法を導入する。
また,複数チャネルが存在する場合のタスク再構成によって実行効率が向上することを示す。
本研究は,Shorのアルゴリズムに対して,コンパイルされた量子回路を最適化するための構造化された枠組みを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:07:52 GMT)
The Procedural Content Generation Benchmark: An Open-source Testbed for Generative Challenges in Games [4.4] ベンチマークには12のゲーム関連の問題があり、それぞれに複数のバリエーションがある。
各問題には、コンテンツ表現、制御パラメータ、品質、多様性、制御性の評価指標がそれぞれ備わっている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:19:26 GMT)
GAITGen: Disentangled Motion-Pathology Impaired Gait Generative Model -- Bringing Motion Generation to the Clinical Domain [4.3] GAITGenは、特定の病理重症度レベルに基づいて、現実的な歩行シーケンスを生成する新しいフレームワークである。
新たなPD-GaMデータセットの実験により、GAITGenは、再構成の忠実度と生成品質の両方において、適応された最先端モデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:06:45 GMT)
Empirical Asset Pricing with Large Language Model Agents [4.3] 本稿では,Large Language Model (LLM) エージェントを活用した新たな資産価格モデルを提案する。
本手法は,ポートフォリオ最適化と資産価格の誤差の両方において,従来の機械学習ベースのベースラインを超えていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:02:11 GMT)
Image Decomposition with G-norm Weighted by Total Symmetric Variation [4.3] 我々は、その全対称性変化(TSV)により、任意の境界変動(BV)画像の特定の非局所的特徴を特徴づける。
TSVが有界なBV画像に対して,提案モデルでは輪郭縁のない解が認められていることを示す。
我々のアルゴリズムは一連の数値実験によって検証される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:02:46 GMT)
Retrieval Backward Attention without Additional Training: Enhance Embeddings of Large Language Models via Repetition [4.2] 本稿では,ゼロショット設定における事前学習言語モデルの性能向上に焦点をあてる。
本稿では,コンテキスト情報エンコーディングを強化するための新しい下位アテンション機構を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:17:43 GMT)
Combating Semantic Contamination in Learning with Label Noise [4.2] ノイズラベルはディープニューラルネットワークの性能に悪影響を及ぼす可能性がある。
1つの一般的な解決策はラベル修復であり、予測と分布を通してノイズラベルを再構成する。
これらの手法は、セマンティック汚染(Semantic Contamination)と同一視される現象である問題的セマンティックアソシエーションを導入する可能性がある。
本研究では,再生ラベルに対する半教師付き学習を利用して,ビューやモデルにまたがる埋め込みから適切な意味的関連を抽出する,協調的クロスラーニング(Collaborative Cross Learning)という新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:47:41 GMT)
Accelerated VQE: Parameter Recycling for Similar Recurring Problem Instances [4.1] 変分量子固有解法(VQE)の訓練は、かなりの計算を必要とするタスクである。
同様の問題を解く際の学習時間を大幅に短縮するために,移動学習の概念の利用を提案する。
そこで本研究では, MaxCut問題に対して, 2つの異なる回路を用いて12ノードの問題を解いた高速化VQE手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:38:15 GMT)
An Advanced Ensemble Deep Learning Framework for Stock Price Prediction Using VAE, Transformer, and LSTM Model [4.1] 本研究では,3つの先進ニューラルネットワークアーキテクチャを組み合わせることで,株価予測のための最先端の深層学習フレームワークを提案する。
このフレームワークは豊富な技術的指標を使用し、現在の市場状況に基づいて予測器をスケールする。
金融専門家や学者にとって、アルゴリズム取引、リスク分析、制御と意思決定に非常に重要な応用がある。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:20:40 GMT)
Divide to Conquer: A Field Decomposition Approach for Multi-Organ Whole-Body CT Image Registration [4.1] 本研究では,多臓器全体CT画像登録における変形の複雑さに対処する新しいフィールド分解手法を提案する。
本研究では,最適化手法と深層学習に基づく2つのベースライン登録手法が選択された。
実験により, 提案手法は, 多臓器全体CT画像登録における複雑な変形の処理において, ベースライン法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:51:13 GMT)
Digital Simulation of Non-Abelian Parafermions in Superconducting Circuits [4.0] パラフェルミオンは深い非アベリア統計を示し、トポロジカルに順序づけられたシステムで現れる。
超伝導(SC)回路におけるパラフェミオンのディジタルシミュレーションとその非アベリアブレイディング統計に関する実験手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:16:39 GMT)
Enhanced Charging in Multi-Battery Systems by Nonreciprocity [4.0] 非相反性に乗じて、多電池システムの充電を改善するための効率的な手法を提案する。
また,非相反性はQBの充電能力の向上にも寄与することを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:13:13 GMT)
Scalable heliostat surface predictions from focal spots: Sim-to-Real transfer of inverse Deep Learning Raytracing [4.0] Inverse Deep Learning Raytracing (iDLR) は、標準校正手順中に記録されたターゲット画像からヘリオスタット表面のプロファイルを推測する新しい手法として導入された。
実世界のターゲット画像から直接正確な表面予測が可能となるiDLRのSim-to-Real転送に成功した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:15:05 GMT)
Qunity: A Unified Language for Quantum and Classical Computing (Extended Version) [3.9] 量子プログラミング言語Quinityを紹介します。
Qunityは量子コンピューティングを古典コンピューティングの自然な一般化として扱う。
我々はQunityがいくつかの量子アルゴリズムをきれいに表現する方法を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:38:13 GMT)
CRLLK: Constrained Reinforcement Learning for Lane Keeping in Autonomous Driving [3.8] 自律走行システムのレーン維持には、異なる目的のためにシナリオ固有の重量調整が必要である。
そこで我々は,車線維持を制約付き強化学習問題として定式化し,重み係数をポリシーに従って自動的に学習し,シナリオ固有のチューニングの必要性を排除した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:59:02 GMT)
EdgeInfinite: A Memory-Efficient Infinite-Context Transformer for Edge Devices [3.7] トランスフォーマーベースの大規模言語モデル(LLM)は、エッジデバイスで長いシーケンスを処理する際の課題に直面する。
We present EdgeInfinite, a memory- efficient solution for infinite contexts that integrateds compressed memory into Transformer-based LLMs。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:26:37 GMT)
Gradient entropy (GradEn): The two dimensional version of slope entropy for image analysis [3.7] 本稿では,2次元への傾斜エントロピーの拡張である勾配エントロピー(GradEn)について述べる。
計算コストを低く抑えつつ,様々な特徴を持つ画像を識別できるGradEnの能力を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:09:37 GMT)
Multimodal Learning with Uncertainty Quantification based on Discounted Belief Fusion [3.7] 医療、金融、自動運転といった分野では、マルチモーダルAIモデルがますます使われています。
騒音、不十分な証拠、モダリティ間の紛争に起因する不確実性は、信頼できる意思決定に不可欠である。
本稿では,命令不変なエビデンス融合を用いた新しいマルチモーダル学習手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:12:27 GMT)
A Semantic-Enhanced Heterogeneous Graph Learning Method for Flexible Objects Recognition [3.6] フレキシブルオブジェクト認識のための意味強化ヘテロジニアスグラフ学習法を提案する。
適応走査モジュールを用いて意味的コンテキストを抽出し、様々な形状と大きさの柔軟なオブジェクトのマッチングを容易にする。
グラフ生成モジュールは、グローバルなビジュアルおよびローカルなセマンティックノードの特徴を集約し、柔軟なオブジェクトの認識を改善する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:55:43 GMT)
A City of Millions: Mapping Literary Social Networks At Scale [3.5] 我々は,多言語フィクションやノンフィクションから抽出した高品質なソーシャルネットワークを70,509件リリースする。
このデータセットは、前例のない規模で歴史的な社会世界に関する情報を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:51:13 GMT)
AI Literacy in K-12 and Higher Education in the Wake of Generative AI: An Integrative Review [3.5] AIリテラシーの介入について議論し、設計する方法については、研究者や実践者の間ではほとんど合意がない。
本稿では,2020年以降に出版された実証的および理論的AIリテラシー研究の検証に,統合的レビュー手法を適用した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:54:27 GMT)
Enhancing DeepLabV3+ to Fuse Aerial and Satellite Images for Semantic Segmentation [3.5] 我々は,第2のエントリをアップサンプリングして高レベルな特徴を融合するための,新しいトランスポーズされた従来のレイヤブロックを導入する。
このブロックは衛星画像からの情報を増幅して統合し、セグメンテーションプロセスを強化するように設計されている。
実験では、Sentinel 2データから得られた対応するデータセットと並行して、LandCover.aiデータセットを空中画像に使用した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:07:39 GMT)
Circumventing shortcuts in audio-visual deepfake detection datasets with unsupervised learning [3.5] 私たちは、最も広く使われているオーディオビデオのディープフェイクデータセットの2つが、これまで特定されていなかった突発的な特徴である、主要な沈黙に悩まされていることを示しています。
フェイクビデオは、ごく短い沈黙の瞬間から始まり、この機能だけで、本物と偽のサンプルをほぼ完全に分離することができる。
本研究では,実データのみに基づく学習モデルによる教師なし学習から教師なし学習へのシフトを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:59:45 GMT)
Hybrid Time-Domain Behavior Model Based on Neural Differential Equations and RNNs [3.4] 本稿では,新しい連続時間ドメインハイブリッドモデリングパラダイムを提案する。
ニューラルネットワーク差分モデルとリカレントニューラルネットワーク(RNN)を統合し、NODE-RNNとNCDE-RNNモデルを作成する。
理論的解析により、このハイブリッドモデルは事象駆動型動的突然変異応答と伝播安定性において数学的に有利であることが示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:42:52 GMT)
Quantum Simulation with Gauge Fixing: from Ising Lattice Gauge Theory to Dynamical Flux Model [3.4] ゲージ理論をシミュレートする伝統的な方法が2つある。1つは、ゲージ理論のフルハミルトニアンを局所ゲージ対称性で直接シミュレートすることである。
もう1つは、射影ハミルトニアンを1つのゲージ部分セクターで設計することである。
この研究は、凝縮物質と高エネルギー物理学の両方に関連するゲージ固定の概念を用いて、格子ゲージ理論を量子的にシミュレートする方法を舗装する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:17:32 GMT)
Fast Quantum Amplitude Encoding of Typical Classical Data [3.3] 単位古典ベクトルの$N$エントリを符号化する量子振幅符号化方式の改良版を提案する。
平均ランタイムが一様ランダムな入力に対して$mathcalO(sqrtNlog N)$であることを証明する。
本稿では,レーダ衛星画像などの実世界のデータにも,この実行時挙動が有効であるという数値的証拠を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:50:05 GMT)
Endo-TTAP: Robust Endoscopic Tissue Tracking via Multi-Facet Guided Attention and Hybrid Flow-point Supervision [3.3] Endo-TTAPは内視鏡的ビデオにおける組織点追跡のための新しいフレームワークである。
MFGAモジュールは、多スケールフローダイナミクス、DINOv2セマンティック埋め込み、および明示的な動きパターンを相乗して、ポイント位置を共同で予測する。
ステージIは、光学フローグラウンド真理を用いた合成データを用いて不確定閉塞正則化を行う。
ステージIIは、教師なしのフロー一貫性と半教師付き学習と、市販のトラッカーからの洗練された擬似ラベルを組み合わせる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:00:07 GMT)
Whispering in Amharic: Fine-tuning Whisper for Low-resource Language [3.3] 本研究は,AmharicにおけるOpenAIのWhisper自動音声認識モデルについて検討する。
Mozilla Common Voice、FLEURS、BDU-speechデータセットといったデータセットを使って微調整します。
最高のパフォーマンスモデルであるWhispersmall-amは、既存のFLEURSデータと新しい、目に見えないAmharicデータセットの混合を微調整することで、大幅に改善される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:26:11 GMT)
The epistemic dimension of algorithmic fairness: assessing its impact in innovation diffusion and fair policy making [3.3] 我々は,社会規模でのイノベーションの拡散に対する信頼性欠陥や過剰な影響を特徴づけ,分析することに注力する。
確立された線形閾値モデルを拡張し、イノベーション拡散におけるてんかんバイアスの影響を示す。
我々の結果は、意思決定におけるアルゴリズム的公正性の議論において、疫学的な次元が持つ重要な役割を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:48:34 GMT)
Quantum autoencoders using mixed reference states [3.2] 符号化の忠実度と量子相互情報を組み合わせたコスト関数を提案する。
参照状態は、最大混合状態と純粋状態の混合であると考える。
異なる状態の数値シミュレーションとIBM量子デバイスへの実験的実装は、我々のアプローチの有効性を示している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:55:12 GMT)
Neural networks for quantum state tomography with constrained measurements [3.2] 量子状態トモグラフィ(QST)は、量子状態の密度行列を再構成することを目的としている。
我々は,制約測定シナリオ下でのQSTのための統合ニューラルネットワーク(NN)ベースのアプローチを開発する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:14:13 GMT)
The moment polytope of matrix multiplication is not maximal [3.2] 行列乗算テンソルのモーメントポリトープと単位テンソルの分離を証明した。
その結果,行列乗法モーメントポリトープは最大値ではないことがわかった。
我々はこれらの手法を拡張し、行列乗法のための最適境界部分ランク境界の新たな証明を得る。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:25:06 GMT)
Personalized Privacy Amplification via Importance Sampling [3.1] 本稿では,個別化されたプライバシ分析に着目し,重要サンプリングのプライバシ特性について検討する。
重要なサンプリングでは、プライバシはユーティリティとよく一致しているが、サンプルサイズとは相容れないことが分かっています。
本稿では,プライバシと効率のトレードオフを最適化する手法と,コアセット形式の実用性保証に基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:48:49 GMT)
Information Gain Is Not All You Need [3.1] 未知の事を知ることなく最善策を評価することは困難である。
これまでの研究では、情報獲得の見積もりを改善することで、欲張りの行動につながることが示されている。
本稿では,ロボットに近いが,他の候補状態から遠く離れた候補状態を優先して,バックトラッキングを低減する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:03:52 GMT)
Spend Your Budget Wisely: Towards an Intelligent Distribution of the Privacy Budget in Differentially Private Text Rewriting [3.0] テキスト文書中のトークンの構成にプライバシー予算を割り当てるのに使用される言語学およびNLPに基づく手法のツールキットを構築し,評価する。
我々の研究は、DPによるテキストの民営化の複雑さを強調し、さらに、DPによるテキストの書き直しにおける民営化のメリットを最大化するための、より効率的な方法を見つけることを求めている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:33:46 GMT)
Arch-LLM: Taming LLMs for Neural Architecture Generation via Unsupervised Discrete Representation Learning [3.0] 共通のアプローチは、分散アーキテクチャを連続的な表現空間にマッピングするために、変分オートエンコーダ(VAE)を使用することである。
本稿では,ベクトル量子化変分オートエンコーダ(VQ-VAE)を導入し,離散型ニューラルアーキテクチャとより自然に一致した離散潜在空間を学習する。
VAE法と比較して,本手法はNASBench-101では80%以上,NASBench-201では8%以上向上する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:56:56 GMT)
Low Rank and Sparse Fourier Structure in Recurrent Networks Trained on Modular Addition [3.0] モジュール追加タスクを訓練したリカレントニューラルネットワーク(RNN)もフーリエ乗算戦略を採用していることを示す。
また、RNNは個々の周波数の除去に頑健であり、性能が大幅に低下し、より多くの周波数がモデルから減少することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:40:03 GMT)
Policy Learning with Competing Agents [3.0] 意思決定者は、しばしば、治療できるエージェントの数に制限された能力の下で、治療の割り当てポリシーを学ぶことを目指している。
本稿では,そのような干渉が存在する場合のキャパシティ制約された処理課題について検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:55:53 GMT)
Manifold learning in Wasserstein space [3.0] 本論文は,絶対連続確率測度空間における多様体学習アルゴリズムの理論基盤の構築を目的とする。
計量 $mathbbW_Lambda$ を備えた部分多様体 $da$ in $mathcalP_mathrma.c.(Omega)$ の構成を導入する。
我々は、$(da,mathbbW_Lambda)$の潜在多様体構造がサンプル$lambda_i_i=1N$ of $Lambからどのように学習できるかを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:39:38 GMT)
DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents [2.8] DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。
DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:22:52 GMT)
Negation: A Pink Elephant in the Large Language Models' Room? [2.8] 否定は文の意味を決定する鍵であり、論理的推論には不可欠である。
一般的な言語モデルを評価することにより,モデルのサイズと言語が否定を正しく処理する能力にどのように影響するかを検討する。
我々のデータセットは、多言語設定における言語モデル推論のさらなる研究と改善を促進することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:04:41 GMT)
Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction [2.7] アニメーションデータは、複数のカメラを用いて光学マーカーの位置を確立する光学的モーションキャプチャシステムを通して取得されることが多い。
これは、マーカー再構成の欠如に対する機械学習ベースのソリューションへの関心を喚起した。
この分野の進展を推し進める、より相関性の高い指標のセットを導入し、評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:29:49 GMT)
Bridging the Dimensional Chasm: Uncover Layer-wise Dimensional Reduction in Transformers through Token Correlation [2.6] トランスフォーマー層間のトークンダイナミクスを追跡するフレームワークを開発した。
この研究はトランスフォーマー層を高次元と低次元のセマンティクスの間のプロジェクタとして再フレーミングすることで解釈可能性を向上させる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:47:30 GMT)
Entropic Order [2.6] 固体、強磁性体、超流動体、量子トポロジカル秩序のような秩序のある物質の相は、通常は低温でしか存在しない。
これらすべての位相が任意に高温に持続する明示的な局所モデルを示す。
これは、ある自由度における順序が他の自由度を強く変動させることで「エントロピー秩序」につながるためである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:00:01 GMT)
FRASE: Structured Representations for Generalizable SPARQL Query Generation [2.6] 本稿では,FSRL(Frame Semantic Role Labeling)を利用したFRASE(FRAme-based Semantic Enhancement)を提案する。
また、LC-QuAD 2.0から派生した新しいデータセットであるLC-QuAD 3.0について、フレーム検出とフレーム要素の議論へのマッピングを通じて、FRASEを用いて各質問を豊かにする。
フレームベースの構造化表現の統合は、SPARQL生成性能を一貫して改善することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:39:52 GMT)
Streaming quantum state purification for general mixed states [2.4] 我々は、同じアルゴリズムがより広く適用され、非退化主固有値を持つ任意の混合状態の浄化が可能となることを示す。
第1のアプローチでは、最大2つの固有値を考えると、脱分極ノイズが浄化する最も難しいノイズであることを示す。
第2のアプローチでは、精製性能を新しく直接解析する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:31:13 GMT)
Leveraging Expert Input for Robust and Explainable AI-Assisted Lung Cancer Detection in Chest X-rays [2.4] 本研究では,InceptionV3に基づく高機能肺癌検出モデルの解釈可能性とロバスト性について検討した。
我々は,概念ボトルネック手法を活用した専門家主導のアプローチであるClinicXAIを開発する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:32:18 GMT)
CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models [2.4] 医用画像分類タスクのためのディープラーニングモデルは、AI支援診断ツールで広く実装されている。
敵の攻撃に対する脆弱性は、患者の安全に重大なリスクをもたらす。
臨床に焦点を当てたブラックボックス攻撃フレームワークであるConcept-based Report Perturbation Attack (CoRPA)を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:34:58 GMT)
FUSE : A Ridge and Random Forest-Based Metric for Evaluating MT in Indigenous Languages [2.4] 本稿では,RaaVaチームのAmerices 2025 Shared Task 3における自動機械翻訳のための評価基準の獲得について述べる。
評価のためのFUSE (Feature-Union Scorer) を導入し,FUSEはリッジ回帰とグラディエントブースティングを統合して翻訳品質をモデル化する。
その結果,FUSE はPearson と Spearman の相関関係を人間の判断と連続的に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:58:55 GMT)
Deterministic Medical Image Translation via High-fidelity Brownian Bridges [2.4] 医用画像翻訳のための新しい高忠実ブラウン橋モデル(HiFi-BBrg)を提案する。
複数のデータセットに対する実験により,HiFi-BBrgはマルチモーダル画像変換やマルチイメージ超解像において最先端の手法より優れていた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:33:28 GMT)
Efficient Building Roof Type Classification: A Domain-Specific Self-Supervised Approach [2.3] 本稿では,建築屋根型分類における自己教師型学習の有効性について検討する。
本稿では,CBAM(Convolutional Block Attention Module)を組み込んだ新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:04:11 GMT)
Assessing Foundation Models for Sea Ice Type Segmentation in Sentinel-1 SAR Imagery [2.3] 本研究では,Sentinel-1画像を用いた海氷型セグメンテーションの基礎モデル10点について検討した。
選択されたモデルの中で、Prithvi-600Mはベースラインモデルより優れており、CROMAはF1スコアで非常によく似たパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:21:08 GMT)
Exploring Saliency Bias in Manipulation Detection [2.2] ソーシャルメディアによる偽ニュースの爆発と改ざん画像による誤報は、画像検出のためのモデルとデータセットの開発に発展をもたらした。
既存の検出手法は、特定の操作が視聴者の知覚に与える影響を考慮せずに、主にメディアオブジェクトを分離して扱う。
本稿では,一般的な画像操作データセットにおける視覚的・意味的サリエンシの傾向とその検出への影響を解析する枠組みを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:53:29 GMT)
SKDU at De-Factify 4.0: Natural Language Features for AI-Generated Text-Detection [2.0] NELAは、人書きテキストとAI生成テキストの区別において、RAIDARの機能を著しく上回っている。
XGBoostは最も効果的で、リッチな機能セットを活用して高い精度と一般化を実現した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:25:05 GMT)
Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation [2.0] 本稿では,大規模言語モデル(msLLM)の適応のための2つのアプローチを提案することによって,人工知能に寄与する。
工学的な応用として、これらの手法は、ドメイン固有の極低リソース設定において、シンハラ、タミル、英語(6つの言語対)のNTTシステムで実装される。
実験の結果,これらの手法は,標準の単一段階微調整ベースラインに比べて平均+1.47バイリンガル評価アンダースタディ(BLEU)スコアで翻訳性能を向上させることがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:30:28 GMT)
Knowledge graph enhanced retrieval-augmented generation for failure mode and effects analysis [1.9] 本稿では,FMEAデータに対する集合理論の標準化とスキーマ,FMEA-KGからベクトル埋め込みを生成するアルゴリズム,KG拡張RAGフレームワークを提案する。
提案手法は,ユーザエクスペリエンス設計研究を通じて検証され,コンテキストリコールの精度と性能を計測する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:04:14 GMT)
Complex Frequency Detection in a Subsystem [1.9] 複素周波数励起と合成は非エルミート近似と相容れないことを示す。
我々の研究は、近似に頼らずに、非エルミート物理学を厳格に研究するためのプラットフォームを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:49:28 GMT)
Diffusion models applied to skin and oral cancer classification [1.8] 医用画像分類(DiffMIC)における拡散モデルの適用について検討する。
このモデルは、CNNやTransformersのような最先端のディープラーニングモデルと比較して、競争力のある性能を示した。
以上の結果から,拡散モデルが皮膚および口腔病変の医用画像の分類に有効なモデルであることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:29:35 GMT)
Husimi phase distribution in non-Gaussian operations [1.8] フシミ相分布は, 単一モードおよび2モード圧縮真空状態に対して検討した。
非ガウス演算は、位相分布の局在化とノイズの存在下での位相ロバスト性の向上に有効なツールである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:22:41 GMT)
ML Mule: Mobile-Driven Context-Aware Collaborative Learning [1.8] 我々は、より堅牢で分散し、パーソナライズされた新しい機械学習手法を提案する。
ML Muleは、個々のモバイルデバイスを'mules'として利用してモデルのスナップショットをトレーニングし、転送するアプローチである。
これらの結果から,ML Muleは既存の手法と比較して,より高速かつ高精度に収束することがわかった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:19:35 GMT)
Fault tolerance against amplitude-damping noise using Bacon-Shor codes [1.8] 本研究では,Bacon-Shor符号に基づく耐故障性設計手法を設計する。
そこで本研究は,雑音適応量子符号を用いた振幅減衰ノイズに対する耐故障性の実現の可能性を確立する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:59:30 GMT)
Output Scouting: Auditing Large Language Models for Catastrophic Responses [1.6] 近年、Large Language Models(LLMs)の使用が個人に重大な害を与え、AI安全性への関心が高まっている。
LLMの安全性が問題となる理由の1つは、モデルが有害な出力を発生させる確率が少なくともゼロでない場合が多いことである。
本稿では,任意の確率分布に適合する任意のプロンプトに対して,意味論的に流動的なアウトプットを生成することを目的としたアウトプット・スカウトを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:45:58 GMT)
Understanding Software Vulnerabilities in the Maven Ecosystem: Patterns, Timelines, and Risks [1.5] 本稿では,Goblinフレームワークを用いて,Mavenエコシステムの脆弱性を大規模に解析する。
226個のCWEを持つ77,393個の脆弱性のあるリリースを特定します。
脆弱性の文書化には平均して50年近くかかり、解決には4.4年かかる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:52:07 GMT)
Decoding Dependency Risks: A Quantitative Study of Vulnerabilities in the Maven Ecosystem [1.5] 本研究では,Mavenエコシステム内の脆弱性を調査し,14,459,139リリースの包括的なデータセットを分析した。
Maven特有のリスクのある弱点を示し、時間が経つにつれてますます危険なものになっていることを強調します。
以上の結果から,入力の不適切な処理や資源の不正管理が最もリスクが高いことが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:16:46 GMT)
Chasing the Clock: How Fast Are Vulnerabilities Fixed in the Maven Ecosystem? [1.5] 本研究は, CVEの重症度, 依存者数による図書館人気度, バージョンリリース頻度の影響に焦点を当てた。
その結果、致命的な脆弱性は、重度の低い脆弱性に比べてわずかに速く対処されていることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:48:22 GMT)
Machine Learning Models for Soil Parameter Prediction Based on Satellite, Weather, Clay and Yield Data [1.5] AgroLensプロジェクトは、研究室のテストに頼らずに土壌の栄養レベルを予測する機械学習ベースの方法論の開発に取り組んでいる。
このアプローチは、LUCAS土壌データセットとSentinel-2衛星画像を用いた堅牢なヨーロッパモデルの開発から始まる。
Random Forests、Extreme Gradient Boosting (XGBoost)、Fully Connected Neural Networks (FCNN)といった高度なアルゴリズムが実装され、正確な栄養予測のために微調整された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:44:32 GMT)
Unlocking LLM Repair Capabilities in Low-Resource Programming Languages Through Cross-Language Translation and Multi-Agent Refinement [1.5] 本稿では,新しい言語間プログラム修復手法 LANTERN を提案する。
提案手法は,LLMが弱い補修能力を示す言語から,より強力な性能を示す言語へ,欠陥コードを戦略的に翻訳する。
我々は,11言語にまたがる5,068のバグを含む総合的な多言語ベンチマークであるxCodeEvalについて評価を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:15:56 GMT)
Envisioning an AI-Enhanced Mental Health Ecosystem [1.5] ピアサポート、セルフヘルプ介入、プロアクティブモニタリング、データ駆動インサイトなど、さまざまなAIアプリケーションについて検討する。
我々は、AIが人間のプロバイダを置き換えず、責任あるデプロイメントと評価を強調するハイブリッドエコシステムを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:56:04 GMT)
Variational preparation of normal matrix product states on quantum computers [1.5] 行列積状態(MPS)は、多体物理学のシミュレーションを含む幅広い種類の量子アルゴリズムにおいて重要である。
本研究では、短距離相関を持つ通常のMPSを浅い回路で調製する方法を実証する。
我々は、これまで量子ハードウェア上でアクセスできなかったパラメータ構造に対して、磁気秩序のシグネチャ緩和を求める。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:29:18 GMT)
Fuzzy Cluster-Aware Contrastive Clustering for Time Series [1.4] 従来の教師なしクラスタリング手法は、しばしば時系列データの複雑な性質を捉えるのに失敗する。
本稿では,表現学習とクラスタリングを協調的に最適化するファジィクラスタ対応コントラストクラスタリングフレームワーク(FCACC)を提案する。
本稿では,時系列データの様々な特徴を活用して特徴抽出を強化するために,新しい3視点データ拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:59:23 GMT)
Convergence analysis of controlled particle systems arising in deep learning: from finite to infinite sample size [1.4] サンプルサイズが無限に大きくなるにつれて, 関連する最適制御問題の制限挙動について検討した。
目的関数の最小値とニューラルSDEの最適パラメータの収束は,サンプルサイズNが無限大になる傾向にあることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:47:57 GMT)
Policy Optimization and Multi-agent Reinforcement Learning for Mean-variance Team Stochastic Games [1.4] 長期平均分散チームゲーム(MV-TSG)について検討する。
MV-TSGの主な課題は2つある。第一に、分散計量は動的条件下では加法的でもマルコフ的でもない。
逐次更新方式を用いた平均分散マルチエージェントポリシー反復 (MV-MAPI) アルゴリズムを提案する。
定常点の特定の条件をナッシュ平衡とし、さらに厳密な局所最適条件を導出する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:21:05 GMT)
Efficient Epistemic Uncertainty Estimation in Cerebrovascular Segmentation [1.4] ベイズ近似とディープアンサンブルの利点を組み合わせた効率的なアンサンブルモデルを提案する。
高モデル不確実性と誤予測の領域は一致しており、このアプローチの有効性と信頼性を示している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:39:37 GMT)
A formula for the area of a triangle: Useless, but explicitly in Deep Sets form [1.4] データポイントの置換不変関数は、$rho(sum_iphi(vecr_i))$で書ける。
この形式は、Deep Setsとして知られる機械学習の文献でも知られており、map-reduceを生成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:00:00 GMT)
Circuit cutting with classical side information [1.4] 本稿では,量子機器によるサイド情報を利用した汎用回路切断手法の定式化について述べる。
あるシナリオでは、サイド情報はサンプリングオーバーヘッドを減らさないが、他のシナリオでは、回路切断は不可能である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:43:34 GMT)
Large Engagement Networks for Classifying Coordinated Campaigns and Organic Twitter Trends [1.4] ソーシャルメディアのユーザーと不正なアカウントは、トピックの宣伝に協力することができる。
トピックがオーガニックなのか、あるいは信頼できる地上の真実が欠如しているため、協調したキャンペーンなのかを予測するのは難しい。
本稿では,短絡攻撃によるキャンペーンを検知することで,そのような真実を創出する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:54:05 GMT)
Many-body Localization in a Slowly Varying Potential [1.3] 近縁ホッピング1D格子における多体局所化(MBL)について検討し, ゆるやかに変化する(SV)オンサイト電位について検討した。
このモデルのMBLは、広範に研究されたランダムまたは準周期モデル(QP)の従来のMBLと類似した特徴を持つ。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:34:13 GMT)
Integrating LLMs in Software Engineering Education: Motivators, Demotivators, and a Roadmap Towards a Framework for Finnish Higher Education Institutes [1.3] ソフトウェア工学教育におけるLarge Language Models(LLM)の採用の増加は、機会と課題の両方を提示している。
LLMは、学習経験の向上、自動評価、パーソナライズド・チュータリングなどのメリットを提供する。
これらの統合は、学術的完全性、学生の過度な信頼、倫理的配慮に関する懸念も引き起こす。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:41:43 GMT)
Performance of the spin qubit shuttling architecture for a surface code implementation [1.3] Qubit shuttlingは、いくつかの量子コンピューティングプラットフォームを、効果的な量子誤り訂正(QEC)に必要なqubitレジスタサイズに進化させることを約束する。
本稿では,エラーのシャットリング,一方の非偏極化,もう一方の非偏極化の2つのシナリオについて検討する。
論理誤差率10-12$に達するために必要なキュービットオーバーヘッドは、シャットリング操作あたりのエラー率を1パーセント程度まで適度に増加させるだけである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:53:37 GMT)
Quantum Approximate Multi-Objective Optimization [1.3] 多目的最適化は、量子コンピュータで解析するための魅力的な問題クラスである。
本研究では,多目的重み付き最大カット問題の最適パレートフロントを近似するために,低深さ量子近似最適化アルゴリズムを用いる。
我々は,IBM の量子コンピュータと Matrix Product State の数値シミュレーションでその性能を実証し,古典的アプローチよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:00:25 GMT)
Image-to-Image Translation with Disentangled Latent Vectors for Face Editing [1.2] 顔属性編集のための画像から画像への変換フレームワークを提案する。
固定事前学習されたGANの潜在空間因子化作業にインスパイアされ、潜在空間因子化による属性編集を設計する。
意味的に整理された潜在空間に画像を投影するために,注意に基づくスキップ接続を備えたエンコーダデコーダアーキテクチャを構築した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:28:32 GMT)
Concise One-Layer Transformers Can Do Function Evaluation (Sometimes) [1.2] 本稿では,変圧器の表現能力に関する研究に寄与する。
任意の関数を与えられた引数で$[n]$から$[n]$に評価する基本的な計算タスクを実行する能力に焦点を当てる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:40:23 GMT)
Non-resonant inter-species interaction and its effect on the position response function of cold atoms [1.2] 磁気光学トラップにおける冷間原子アンサンブルの位置応答関数 (PRF) の修飾に関する実験的証拠を報告する。
その結果, 低温原子の振動周波数は, 有効種間相互作用強度によって最大30ドル程度変化することが判明した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:06:49 GMT)
Observables in non-Hermitian systems: A methodological comparison [1.1] 非エルミート量子力学の数学的定式化にはコンセンサスがない。
異なる方法論は非エルミート力学の研究に用いられる。
この研究は、非エルミート・ハミルトニアンのさらなる探索の基礎となる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:20:14 GMT)
Evaluation of Machine-generated Biomedical Images via A Tally-based Similarity Measure [1.1] 合成画像の品質を定量的かつ権威的に評価することは困難である。
生成された画質の有意義な評価は、Tversky Indexを使って達成できる。
主な結果は、主観性と本質的な特徴符号化選択の欠陥が先行すると、トヴェルスキーの手法は直感的な結果をもたらすということである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:44:01 GMT)
e-person Architecture and Framework for Human-AI Co-adventure Relationship [1.1] e-person アーキテクチャは、倫理の統一基盤として、協調的な認知と行動を通じて不確実性を減少させる。
本稿では,不確実性の低減を脳機能の統一原理とする自由エネルギー原理に基づくe-personフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:54:44 GMT)
Traffic Modeling for Network Security and Privacy: Challenges Ahead [1.0] 機械学習とディープラーニングモデルを用いた交通分析は、過去数十年で大きな進歩を遂げた。
最近のモデルは、異常や攻撃の検出、検閲の対抗など、ネットワークセキュリティとプライバシのさまざまなタスクに対処している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:54:17 GMT)
KEVS: Enhancing Segmentation of Visceral Adipose Tissue in Pre-Cystectomy CT with Gaussian Kernel Density Estimation [1.0] 嚢胞摘出患者の内臓脂肪組織(VAT)の分布は術後合併症の徴候である。
コンピュートトトモグラフィー(CT)の既存のVATセグメンテーション法は、サーブレット間の変動に制限がある。
本報告では, 術前CTにおけるVAT予測のための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:41:09 GMT)
SoK: Security Analysis of Blockchain-based Cryptocurrency [0.9] 本稿では,既存の暗号通貨のセキュリティ脅威と攻撃を,ブロックチェーンインフラストラクチャに基づく5つの基本的なカテゴリに分類する。
各種類の脅威と攻撃によって悪用される脆弱性の原則を詳細に分析する。
筆者らは、既存の検知および防御ソリューションを要約し、評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:21:30 GMT)
Highly entangled stationary states from strong symmetries [0.9] 強い非アベリア保存量は、ユニタリ量子チャネルにおいても高い絡み合った定常状態をもたらす可能性がある。
これらは、すべての強保存量を特徴づける可換体がリー代数の普遍包絡代数またはリード=セール可換環に対応するような開量子進化に適用されることを証明している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:23:20 GMT)
Service-the-Longest-Queue Among d Choices Policy for Quantum Entanglement Switching [0.9] Entanglement Generation Switch (EGS) は、一連の接続ノードに絡み合った状態を提供する量子ネットワークハブである。
本稿では,すべての要求キューのdをランダムにサンプリングすることで,EGSクエリノードの絡み合い要求に対するロードバランシングポリシを提案する。
我々は、選択数dが増加すると、平均要求処理時間が大幅に減少するのを観察する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:10:12 GMT)
Skeleton-Based Transformer for Classification of Errors and Better Feedback in Low Back Pain Physical Rehabilitation Exercises [0.9] 近年,身体リハビリテーション運動の質評価が著しく進歩している。
それらのほとんどは、パフォーマンスが正しいか間違っている場合にのみバイナリ分類を提供し、いくつかは連続的なスコアを提供する。
本研究では,リハビリテーション演習の誤り分類アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:30:39 GMT)
How Well Can Vison-Language Models Understand Humans' Intention? An Open-ended Theory of Mind Question Evaluation Benchmark [0.9] 視覚言語モデル(VLM)は、視覚質問応答(VQA)タスクにおいて強力な推論能力を示している。
しかし、人間の意図、信念、その他の精神状態を正確に推測するなど、心の理論(ToM)を遂行する能力は未熟である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:26:32 GMT)
Light Storage in Light Cages: A Scalable Platform for Multiplexed Quantum Memories [0.9] 3Dプリント中空コア導波路に基づくセシウム(Cs)量子メモリにおけるコヒーレント光パルスの減衰を実証する。
我々は,Cs蒸気セル内の1つのチップに複数のLCメモリを組み込むことに成功し,全デバイスで一貫した性能を実現した。
これらの結果は、空間的に多重化された量子メモリへの顕著な進歩を示し、前例のないレベルまでメモリ統合を増大させる可能性があることを示している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:35:12 GMT)
Generative Reliability-Based Design Optimization Using In-Context Learning Capabilities of Large Language Models [0.8] LLM(Large Language Models)は、コンテキスト内学習機能を示す。
本稿では,LLMの文脈内学習機能を活用した生成設計手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:10:04 GMT)
Convolutional optimization with convex kernel and power lift [0.8] 本稿では,凸カーネルとの畳み込みに基づく新しい最適化理論の基礎パラダイムの確立に焦点をあてる。
我々のゴールは、任意の関数の大域的最適点を求める道徳的決定論的モデルを考案することである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:19:16 GMT)
A Framework for Cryptographic Verifiability of End-to-End AI Pipelines [0.8] 本稿では,AIパイプラインの完全検証,鍵コンポーネントの同定,既存の暗号手法の解析を行うフレームワークを提案する。
このフレームワークは、AI生成資産と共に暗号証明を提供することで、誤情報に対処するために使用することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:20:57 GMT)
A Novel Distance-Based Metric for Quality Assessment in Image Segmentation [0.8] 本稿では,新しい距離ベース品質指標であるSurface Consistency Coefficient (SCC)を紹介する。
SCCは、その構造表面への近接に基づいて誤差の空間分布を定量化する。
本研究では,表面近傍の誤差と遠方での誤差を区別する上で,SCCの堅牢性と有効性を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:02:09 GMT)
GroundHog: Revolutionizing GLDAS Groundwater Storage Downscaling for Enhanced Recharge Estimation in Bangladesh [0.8] 現在の手法は短期予測を優先し、多年適用性に欠け、実用性を制限している。
データギャップを軽減するMLモデルを開発し、最大および最小GWL予測に対して0.855および0.963のR2$スコアを達成した。
低分解能(25km) GLDASデータを入力として使用し、高分解能(2km) GWLを生成し、優れたR2$スコア0.96を達成するアップサンプリングモデルを訓練する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:56:01 GMT)
QCPINN: Quantum Classical Physics-Informed Neural Networks for Solving PDEs [0.7] 物理インフォームドニューラルネットワーク(PINN)は、物理法則をニューラルネットワークに埋め込むことで偏微分方程式(PDE)を解くための有望な方法として登場した。
本稿では、量子および古典的成分を組み合わせた量子古典物理学情報ニューラルネットワーク(CPIQNN)を提案し、PDEを少ないパラメータで解くとともに、同等の精度とトレーニング収束性を維持している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:49:30 GMT)
Federated Intrusion Detection System Based on Unsupervised Machine Learning [0.7] 侵入検知システム(IDS)の研究は、機械学習手法の採用に向けてますます進んでいる。
ほとんどのIDSシステムは、完全にラベル付けされたトレーニングセットを必要とする、教師付き学習アプローチに依存している。
本稿では,教師なし学習を利用したIDSアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:01:58 GMT)
Metric Entropy-Free Sample Complexity Bounds for Sample Average Approximation in Convex Stochastic Programming [0.7] エントロピーのない複雑性速度は、一様リプシッツ条件下で達成可能であることが示されている。
本稿では、標準SP仮定の下でのSAAの計量エントロピーフリーサンプル複雑性境界の最初の集合を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:39:14 GMT)
Post-Quantum Homomorphic Encryption: A Case for Code-Based Alternatives [0.7] ホモモルフィック暗号化(HE)は、暗号化されたデータに対するセキュアでプライバシ保護された計算を可能にする。
現在のPQHEアルゴリズムのほとんどは格子ベースの問題によって保護されている。
コードベースの暗号化は、量子後アルゴリズムを多様化する新しい方法である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:49:22 GMT)
SPDNet: Seasonal-Periodic Decomposition Network for Advanced Residential Demand Forecasting [0.7] 季節周期分解ネットワーク(SPDNet)は、2つの主要なモジュールからなる新しいディープラーニングフレームワークである。
SPDNetは、予測精度と計算効率の両方において、従来のモデルと高度なモデルより優れている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:51:38 GMT)
Differential equation quantum solvers: engineering measurements to reduce cost [0.7] 非線型微分方程式を解くために、2つのサンプル効率のプロトコルを試験する。
回路評価において最大100倍のコスト削減を報告した。
したがって、我々のプロトコルはより大きく、より困難な非線形微分方程式のデモンストレーションを解き放つという約束を保っている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:43:35 GMT)
AI Family Integration Index (AFII): Benchmarking a New Global Readiness for AI as Family [0.6] スタンフォードAIインデックス(2024年)のような既存の指標は、人間中心のAI統合に不可欠なリレーショナル、倫理、文化的側面を見落としている。
本研究では、感情的知能AIを家族と介護システムに統合するための国家的準備性を評価する10次元ベンチマークフレームワークであるAI Family Integration Index (AFII)を紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:08:03 GMT)
The quantum nature of color perception: Uncertainty relations for chromatic opposition [0.6] 色知覚の量子論の基礎と最初の成果について概説する。
我々は、Resnikoffの構成が幾何学的にリッチな量子フレームワークにどのように拡張できるかを示す。
純粋で混合的な量子色相の解析は、色相の対立を深く理解する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:02:56 GMT)
Evaluating the Effectiveness of Small Language Models in Detecting Refactoring Bugs [0.6] 本研究では,Java と Python の2種類のバグ検出における小言語モデル (SLM) の有効性を評価する。
この研究は16種類のタイプをカバーし、コンシューマグレードのハードウェアにゼロショットプロンプトを用いて、事前トレーニングを明示することなくモデルの正確性を推論する能力を評価する。
プロプライエタリなo3-mini-highモデルは、タイプIの84.3%のバグを識別し、最も高い検出率を達成した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:43:30 GMT)
QuCheck: A Property-based Testing Framework for Quantum Programs in Qiskit [0.6] プロパティベースのテストはQSharpCheckを使ってQ#の量子プログラムに提案されている。
我々はQiskitにおける拡張プロパティベースのテストフレームワークQuCheckを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:30:09 GMT)
Towards a Quantum Information Theory of Hadronization: Dihadron Fragmentation and Neutral Polarization in Heavy Baryons [0.6] 我々はCHSHの不等式をハドロン対への単一粒子の断片化に適用する。
我々は、量子文脈性と局所量子系の理論を、1つのスピン-1ハドロン系の中性偏極に拡張する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:52:28 GMT)
CAT: A GPU-Accelerated FHE Framework with Its Application to High-Precision Private Dataset Query [0.5] 本稿では,オープンソースGPUアクセラレーションによる完全同型暗号(FHE)フレームワークCATを紹介する。
emphCATは、コア数学の基礎、事前計算された要素と複合操作のブリッジ、FHE演算子のAPIアクセス可能なレイヤという3層アーキテクチャを備えている。
本フレームワークでは,CKKS,BFV,BGVの3種類のFHEスキームを実装した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:20:18 GMT)
Cavity enhancement of V2 centers in 4H-SiC with a fiber-based Fabry-Pérot microcavity [0.4] 4H-ケイ素炭化ケイ素(SiC)のシリコン空孔中心は長寿命の電子スピンを持ち、同時にスピン分解光遷移を持つ。
これらのインターフェースは量子ネットワークの重要な構成要素であり、セキュアな通信と分散量子コンピューティングを可能にすることを約束する。
本研究では, SiC膜内にV2中心をファイバベースのFabry-P'ero'tマイクロキャビティに統合する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:24:58 GMT)
DF2023: The Digital Forensics 2023 Dataset for Image Forgery Detection [0.4] 世論の故意な操作、特に変化したイメージによって、社会に重大な危険をもたらす。
技術的レベルでこの問題に対処するために、Digital Forensics 2023(DF2023)トレーニングと検証データセットをリリースして、研究コミュニティを支援します。
このデータセットは、ネットワークアーキテクチャの客観的比較を可能にし、研究者によるデータセット作成の時間と労力を大幅に削減することができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:31:19 GMT)
DF-Net: The Digital Forensics Network for Image Forgery Detection [0.4] 本稿では,ピクセルワイド画像偽造検出のためのディープニューラルネットワークであるDigital Forensics Net(DF-Net)を紹介する。
DF-Netの検出は、ソーシャルネットワークによって自動的に実行されるため、失われた画像操作に対して堅牢である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:06:59 GMT)
Lindblad engineering for quantum Gibbs state preparation under the eigenstate thermalization hypothesis [0.4] 我々は、固有状態熱化仮説(ETH)の下で量子ギブス状態生成アルゴリズムの簡易プロトコルが効率的であることを示す。
実現されたリンドブラッドアルゴリズムは、ノイズに対して固有のレジリエンスを示し、量子コンピュータ上での最初のデモンストレーションへの道を開く。
この研究は、ギブズ状態生成アルゴリズムの最近の理論的進歩と、その最終的な量子ハードウェア実装とのギャップを埋めるものである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:57:30 GMT)
Using Machine Learning for Lunar Mineralogy-I: Hyperspectral Imaging of Volcanic Samples [0.4] 本研究は,オリービンとピロキセンに着目して,月の物質と類似した火山試料の鉱物組成について検討した。
400 nmから1000 nmの超スペクトルイメージングを用いて,イタリア・シチリア北部,エオリア諸島の火山活動型島バルカノの試料の反射特性を解析するデータ立方体を作成した。
我々は、スペクトルプロファイルを分類するために、K平均、階層クラスタリング、GMM、スペクトルクラスタリングなどの教師なしクラスタリングアルゴリズムを適用した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:01:57 GMT)
Extracting Universal Corner Entanglement Entropy during the Quantum Monte Carlo Simulation [0.4] 量子臨界点(QCP)の普遍的特性を明らかにするために、エンタングルメントエントロピー(EE)における下降角対数補正が不可欠である
我々は計算コストを抑えてEEのコーナーコントリビューションを直接測定する新しい手法を開発した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:48:02 GMT)
A Refined Analysis of Massive Activations in LLMs [0.4] 幅広い大言語モデル(LLM)における大規模アクティベーションの分析を行う。
以上の結果から,(1) 大規模活性化がすべて有害である訳ではなく,(2) 意識的KVバイアスなどの緩和策がモデル固有かつ有効でない事例が示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:08:34 GMT)
Improving the generalization of deep learning models in the segmentation of mammography images [0.3] マンモグラフィー画像におけるランドマーク構造のセグメンテーションは、がんリスクの評価における医療評価に役立つ。
深層学習に基づくセグメンテーションのためのトレーニングデータ強化を目的とした,データ中心型戦略のシリーズを紹介する。
提案手法では,アノテーションによる画像強度操作とスタイル転送によりトレーニングサンプルを増強する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:11:00 GMT)
Next-Best-Trajectory Planning of Robot Manipulators for Effective Observation and Exploration [0.3] Next-Best-Trajectory原則は、動的環境で動作するロボットマニピュレータ向けに開発された。
本稿では,環境モデリングにボクセルマップを用い,関心点を中心とした視点からレイキャストを行い,情報ゲインを推定する。
グローバル・エルゴード・トラジェクトリ・プランナーは、ローカル・プランナーにオプションの参照・トラジェクトリを提供し、探索を改善し、ローカル・ミニマを避けるのに役立つ。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:34:29 GMT)
A Self-Supervised Learning of a Foundation Model for Analog Layout Design Automation [0.3] 2つの課題に対処するために,UNetベースの基礎モデルとその自己教師型学習手法を提案する。
自己教師付き学習において,十分なトレーニングデータを得るために,ランダムパッチサンプリングとランダムマスキングを自動的に行う手法を提案する。
ファインチューニングは、様々な下流タスクのための効率的で統合された方法論を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:37:33 GMT)
Transfer-learning for video classification: Video Swin Transformer on multiple domains [0.2] Video Swin Transformer (VST) は、ビデオ分類用に開発された純粋なトランスフォーマーモデルである。
2つの大規模データセット上でのVSTの性能について検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:54:34 GMT)
A Hermitian bypass to the non-Hermitian quantum theory [0.2] 非エルミート作用素を持つ記述系は、量子論の課題である。
本稿では, NHハミルトニアンのエネルギー状態を表現するための枠組みを提案する。
このことは、例外点、双対空間、より弱い対称性で強化された実固有値のような重要な特徴のより明確な理解と新しい解釈をもたらす。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:03:36 GMT)
Glued tree lattices with only compact localized states [0.2] 我々は、1つ以上のバンドで運動量分散を消失させる密結合単一粒子系を構築する。
量子超越性(英語版)の数少ない既知の例の1つで最初に生じた粘着木に着想を得て、強結合単一粒子Bose-Hubbardモデルの2つの無限族を定義し、解析する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:37:08 GMT)
RelDenClu: A Relative Density based Biclustering Method for identifying non-linear feature relations [0.2] 提案手法であるRelDenCluは,各特徴量の辺密度と接合密度の局所的変動を利用して観測のサブセットを求める。
その後、共通の観測によって繋がった一連の特徴を発見し、結果として双クラスターとなる。
15種類のシミュレーションデータセットと6つの実生活データセットで実験が行われた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:02:28 GMT)
Insights into Dependency Maintenance Trends in the Maven Ecosystem [0.1] Goblinフレームワークを用いてNeo4jデータセットの定量的解析を行う。
私たちの分析によると、依存関係が少ないリリースでは、より多くのリリースが欠落していることがわかった。
本研究は,最新リリースの依存関係には肯定的な新鮮度スコアがあり,ソフトウェア管理の有効性が向上していることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:20:24 GMT)
Robustness quantification and how it allows for reliable classification, even in the presence of distribution shift and for small training sets [0.1] 本研究では、不正確な確率の分野における既存の考え方に基づいて、生成確率分類器の個人予測の信頼性を評価するための新しいアプローチを提案する。
我々は、このアプローチをロバストネス定量化と呼び、不確実性定量化と比較し、シフト分布からサンプリングされた小さなトレーニングセットから学習した分類器でさえもうまく機能し続けていることを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:32:10 GMT)
Data Quality Matters: Quantifying Image Quality Impact on Machine Learning Performance [0.1] 本稿では,画像修正が機械学習タスクに与える影響を評価する枠組みを提案する。
LPIPSメトリックは、画像偏差と機械学習性能の相関が最も高い。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:28:44 GMT)
ShaNQar: Simulator of Network Quantique [0.1] ShaNQar (Simulator of Network Quantique) は、モジュール式でカスタマイズ可能なフォトニック量子ネットワークシミュレータである。
適応的なタイミング制御と同期が可能で、シミュレーション時間解決の限界はほとんどない。
従来のQKD(Quantum Key Distribution)と量子テレポーテーション(Quantum Teleportation)のシミュレーションに成功している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:38:52 GMT)
Borsuk-Ulam and Replicable Learning of Large-Margin Halfspaces [0.1] 我々は、$d$-dimensional $gamma$-margin half-spaces のリスト複製数が[ fracd2+1 le MathrmLR(Hd_gamma) le d, ] を満たすことを証明した。
部分類に対して、リストの複製性と大域的安定性は必ずしも有界リトルストーン次元から従わない。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:21:09 GMT)
CFiCS: Graph-Based Classification of Common Factors and Microcounseling Skills [0.1] 本稿では,グラフ機械学習とコンテキスト埋め込みを統合した階層型分類フレームワークであるCFiCSを紹介する。
我々は、共通の要因、介入概念、マイクロカウンセリングのスキルを異種グラフとして表現し、クリニカルBERTからのテキスト情報が各ノードを豊かにする。
グラフニューラルネットワークを活用することで、CFiCSは明示的な接続を欠く未確認のテキストサンプルに一般化する帰納的ノード埋め込みを学習する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:46:08 GMT)
Large Language Models Are Democracy Coders with Attitudes [0.1] V-Demプロジェクトの民主主義指標のコーディングには,最先端の2つのLarge Language Modelを使用します。
膨大な量の情報にアクセスすることで、これらのモデルは、人間が持つ可能性のある認知バイアスなしに、レジームの多くの「ソフト」特性を評価することができるかもしれない。
これらのモデルが人間の評価から逸脱した場合、それらは異なるが一貫した方法で実施されることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:43:41 GMT)
Historical Ink: Exploring Large Language Models for Irony Detection in 19th-Century Spanish [0.1] 本研究では,19世紀のラテンアメリカの新聞において,大規模言語モデル(LLM)を用いたデータセットの強化と皮肉検出の改善について検討した。
鉄の微妙なニュアンス特性を捉えるために,BERTモデルとGPT-4oモデルの有効性を評価するために2つの戦略が採用された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:33:24 GMT)
Mechanical characterization of a membrane with an on-chip loss shield in a cryogenic environment [0.0] この研究は、この目的のために設計された金属薄膜のT=18mKまでの光学干渉計プローブによる機械的特性評価に焦点を当てている。
最低温度で最大6600万の機械的品質因子を明らかにするために、ストロボスコープ技術が利用されてきた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:45:02 GMT)
Single-shot and two-shot decoding with generalized bicycle codes [0.0] 一般化自転車(GB)量子誤り訂正符号は、自然に最小限の安定化器発生器を持つ。
比較的大きな寸法, 距離, シンドロームを持つ短いGB符号を複数構築し, 耐故障性近時シンドローム測定のスケジュールを認めた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:34:15 GMT)
tempdisagg: A Python Framework for Temporal Disaggregation of Time Series Data [0.0] tempdisaggは時系列データの時間分解のためのPythonフレームワークである。
低周波集約を一貫した高周波推定に変換する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:15:52 GMT)
When Autonomy Breaks: The Hidden Existential Risk of AI [0.0] 私は、人間の自律性の遅さと不可解な低下には過小評価されるリスクがある、と論じます。
従うべきは、段階的な非スキル化のプロセスです。
人類にとって最大の脅威は、機械が人間らしくなるだけでなく、人間が機械のようになることです。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:10:32 GMT)
WeatherMesh-3: Fast and accurate operational global weather forecasting [0.0] 本稿では,気象予報システムであるWeatherMesh-3(WM-3)を紹介する。
WM-3は、1つのGTX 4090で12秒で0.25度で14日間の世界予測を生成する。
これは従来のNWPアプローチよりも100,000倍のスピードアップを示している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:37:59 GMT)
Variational quantum-neural hybrid imaginary time evolution [0.0] 変分量子ニューラルハイブリッドITT法(VQNHITE)を提案する。
本稿では,ニューラルネットワークとパラメタライズド量子回路を組み合わせることで,ITEを正確に推定する。
我々は,VQNHITEの性能をVITEと比較して数値シミュレーションにより評価した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:19:12 GMT)
Unknown measurement statistics cannot be redundantly copied using finite resources [0.0] 測定は、測定されたシステムと、そのシステムに関する情報をポインタにインプリントするポインタシステムとの間の相互作用と見なすことができる。
結果統計を複数のポインタや量子メモリに一元的に分散する問題を考える。
このプロセスの精度は、純粋な状態の記憶を準備するための熱力学的制限によって制限されていることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:54:23 GMT)
Universal Defect Statistics in Counterdiabatic Quantum Critical Dynamics [0.0] 反断熱駆動(CD)は、非断熱過程における励起を減らすための枠組みを提供する。
厳密なCDプロトコルは非局所的な制御フィールドを必要とし、その実装には適切な局所性を持つCD近似が必要である。
量子相転移における局所CDを任意の速度で検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:59:57 GMT)
Two fundamental solutions to the rigid Kochen-Specker set problem and the solution to the minimal Kochen-Specker set problem under one assumption [0.0] 量子論の2つの基本構造が2つの剛KS集合を定義することを示す。
2つ目の構成は最小のKS問題を解く手がかりを提供する。
我々は、31が最小のKS集合問題の解であると予想する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:41:15 GMT)
Tunable two-species spin models with Rydberg atoms in circular and elliptical states [0.0] 超低温リドバーグ原子を用いた多用途量子シミュレータの構築手法を提案する。
内部原子状態の励起的な異なる部分空間により、原子は2つの有効なスピン種をシミュレートすることができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:47:09 GMT)
Tropical Bisectors and Carlini-Wagner Attacks [0.0] 最後の層における活性化関数として熱帯対称メートル法を用いることで、畳み込みニューラルネットワークの堅牢性を向上させることができることを示す。
この改善は、攻撃が熱帯層の非分化性に特に適応していない場合に起こる。
我々は、特に熱帯建築に適したCarini-Wagner攻撃の洗練されたバージョンを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:41:17 GMT)
Training Large Language Models for Advanced Typosquatting Detection [0.0] Typosquattingは、ユーザーを騙し、マルウェアを配布し、フィッシング攻撃を行うためにURLをタイプする際のヒューマンエラーを利用するサイバー脅威である。
本研究では,大型言語モデル (LLM) を利用したタイポスクワット検出手法を提案する。
実験結果から, Phi-4 14Bモデルは他の試験モデルよりも優れており, 精度は98%, トレーニングサンプルは数千点であった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:16:27 GMT)
The i.i.d. State Convertibility in the Resource Theory of Asymmetry for Finite Groups [0.0] 我々は、i.d.状態間の正確な変換率と近似変換率の両方を導出する。
近似変換速度が 0 に発散するか等しいかを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:49:27 GMT)
Teaching LLMs Music Theory with In-Context Learning and Chain-of-Thought Prompting: Pedagogical Strategies for Machines [0.0] 本研究では,ChatGPTやClaude,Geminiといった大規模言語モデル(LLM)のベースライン機能を評価し,音楽理論の概念を学習する。
公式のカナダ王立音楽院(RCM)レベル6試験の質問により、パフォーマンスを評価する。
その結果,Claude with MEIが75%,ChatGPT with MEIが52%,Claude with MEIが75%であった。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:15:24 GMT)
Subsystem Symmetry Fractionalization and Foliated Field Theory [0.0] トポロジカル量子物質は、亜次元対称性によって富むと、様々なエキゾチックな現象を示す。
最近発見された例は、大域対称性分数化の異なるメカニズムを通して起こるサブシステム対称性分数化の一種である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:39:01 GMT)
Spatial-Mode Quantum Cryptography in a 545-Dimensional Hilbert Space [0.0] 空間モードを持つ量子鍵分布(QKD)における大きな課題は、高次元量子状態の効率的な生成、操作、検出である。
本稿では,絡み合いに基づくハイブリッドQKDプロトコルについて述べる。
この研究は、高次元、空間的に符号化された量子通信へのスケーラブルな経路を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:37:47 GMT)
Sparklen: A Statistical Learning Toolkit for High-Dimensional Hawkes Processes in Python [0.0] SparklenはPythonのHawkesプロセスのための統計学習ツールキットである。
これには、正規化技術を組み込むためのビルトインサポートを備えた最先端の見積もりツールと、新しい分類方法が含まれている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:25:46 GMT)
Sherlock Holmes Doesn't Play Dice: The mathematics of uncertain reasoning when something may happen, that one is not even able to figure out [0.0] 私は、エビデンス理論の拡張版が、事象が成立する恐れから生じる不確実性を表現することができることを強調します。
確率論は、意思決定者が現在検討している可能性に制限されなければならない。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:11:28 GMT)
Sentiment Classification of Thai Central Bank Press Releases Using Supervised Learning [0.0] 本研究では,タイ銀行からのプレスリリースの感情を分類するために,教師付き機械学習技術を適用した。
私の研究結果によると、教師あり学習はより小さなデータセットであっても効果的な手法であり、さらなる自動化の出発点となる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:20:41 GMT)
Semantic segmentation for building houses from wooden cubes [0.0] 実験のために木造立方体で構築された家屋の画像を含む2つの特殊なデータセットが作成された。
U-Net(light)は、第1データセットでは78%のMeanIoU、第2データセットでは87%のF1スコア、第2データセットでは17%と25%で最高のパフォーマンスを示した。
本研究は,段階的な建築計画の自動生成のためのアルゴリズム開発の基礎となる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:58:12 GMT)
Says Who? Effective Zero-Shot Annotation of Focalization [0.0] 物語が提示される視点であるフォカライゼーションは、幅広い語彙文法的特徴を通じて符号化される。
訓練されたアノテータでさえしばしば正しいラベルについて意見が一致せず、このタスクは質的にも計算的にも難しいことを示唆している。
課題の難しさにもかかわらず、LPMは訓練された人間のアノテーションと同等の性能を示し、GPT-4oは平均84.79%のF1を達成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:00:38 GMT)
Robust microwave cavity control for NV ensemble manipulation [0.0] 窒素空孔アンサンブルはマイクロ波キャビティでコヒーレントに操作できる。
マイクロ波キャビティのためのパルス整形は、外部制御とキャビティ内磁場振幅が同一でないという追加の課題を示す。
本稿では,GRAPE(Gradient Ascent Pulse Engineering)に基づく外部制御の最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:43:50 GMT)
Resolving space-time structures of quantum impurities with a numerically-exact algorithm using few-body revealing [0.0] 大規模浴槽における量子不純物に対する数値的に正確なリアルタイム進化法を提案する。
このアルゴリズムは、時間依存の軌道回転によって(自明な生成状態において)不活性にできる電子軌道を識別する、ほとんど身体的でない。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:33:11 GMT)
Reinforcement Learning for Machine Learning Model Deployment: Evaluating Multi-Armed Bandits in ML Ops Environments [0.0] 本稿では,強化学習(RL)に基づくモデル管理が,展開決定をより効果的に管理できるかどうかを検討する。
当社のアプローチは、デプロイされたモデルを継続的に評価し、パフォーマンスの低いモデルをリアルタイムでロールバックすることで、より適応的な運用環境を実現する。
この結果から,RLベースのモデル管理は,自動化を向上し,手作業による介入への依存を軽減し,デプロイ後のモデル障害に伴うリスクを軽減することが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:42:21 GMT)
Reflection on Code Contributor Demographics and Collaboration Patterns in the Rust Communit [0.0] 本研究では、Rustプログラミング言語エコシステムを調査し、コントリビュータの人口構成とインタラクションパターンを理解する。
私たちは、2023年の最新のRustコミュニティ年次調査のリリースまで、GitHubのプルリクエストデータを調査しました。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 01:12:24 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0] 本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。
我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:33:08 GMT)
Quantum Neural Network Restatement of Markov Jump Process [0.0] 論文は、量子力学系における難しい問題の設計、適応、定式化に関する問題に特化している。
機械知能システムの理論的および数値的研究への障害の1つは、次元の呪いと高次元確率分布からのサンプリングである。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:24:37 GMT)
Quantum Memory Enhanced Multipoint Correlation Spectroscopy for Statistically Polarized NMR [0.0] スピンアンサンブルを用いたナノスケールにおける統計的偏光試料の時間的測定を可能にするため,多点相関分光法を提案する。
推定信号周波数における単一ヘルツの不確実性を実現し,ナノスケール核磁気共鳴技術の可能性を強調した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:25:35 GMT)
Quantum Many-Body Linear Algebra, Hamiltonian Moments, and a Coupled Cluster Inspired Framework [0.0] 近似ハミルトンモーメントを生成するために、結合クラスタインスパイアされたフレームワークを導入する。
基底状態推定のための様々な線形代数アルゴリズムにその応用を実証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:04:33 GMT)
Quantum Entropy-Driven Modifications to Holographic Dark Energy in $f(G,T)$ Gravity [0.0] 我々は、バローホログラフィックダークエネルギー(BHDE)の重力による再構成を$f(G,T)で提示する。
このアプローチは、ベーケンシュタイン-ホーキングエントロピーをバローエントロピーに置き換えることで、従来のHDEモデルを拡張する。
我々は、無圧力塵流体で満たされた平坦なFRW背景の宇宙力学を探求する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:53:54 GMT)
Quantum Computing for Energy Correlators [0.0] ハミルトニアン格子法を用いてエネルギー相関器を計算するための最初の数値戦略を導入する。
また、量子場理論におけるエネルギー相関子を計算するための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:47:07 GMT)
Privacy-Preserving Secure Neighbor Discovery for Wireless Networks [0.0] 従来のND(Neighbor Discovery)とSND(Secure Neighbor Discovery)は、ネットワーク機能の主要な要素である。
本稿では、デバイスが実際の身元や位置を明らかにすることなくSNDを実行することのできる、新しいプライバシー保護型セキュリティ近傍発見(PP-SND)プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:27:47 GMT)
Phases with non-invertible symmetries in 1+1D $\unicode{x2013}$ symmetry protected topological orders as duality automorphisms [0.0] 非可逆対称性を持つ系の1+1次元(1+1D)ギャップ位相を探索する。
群状対称性では、異なるSPT相は同じバルク励起を共有し、常にSPT順序によって異なる。
ある種の非可逆対称性に対して、バルク励起が異なる新しいSPT位相を発見する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:28:20 GMT)
Patience is all you need! An agentic system for performing scientific literature review [0.0] 大規模言語モデル(LLM)は、様々な分野にわたる質問応答のサポートを提供するために、その利用が増加している。
我々は、科学文献にカプセル化された情報の検索と蒸留を行うLLMベースのシステムを構築した。
提案するキーワードに基づく検索・情報蒸留システムについて, 生物関連質問の集合に対して, 先行する文献ベンチマークを用いて評価を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:08:46 GMT)
Parametric approximation as open quantum systems problem [0.0] 散逸を伴うJaynes-Cummingsモデルを考えると、この場は減少を伴うパラメトリック近似に近い状態にあると仮定する。
パラメトリック近似に対する非単項補正とそれに対する動的ラムシフトの寄与を得る。
また, 劣化後の初期マルコフ的非マルコフ的挙動は, レーザー誘起密度行列の研磨により動的に寄与することを示した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:24:44 GMT)
Order-of-magnitude extension of qubit lifetimes with a decoherence-free subspace quantum error correction code [0.0] 我々はデコヒーレンスフリーのサブスペース量子誤り訂正符号を用いた堅牢な量子メモリ設計について報告する。
得られた符号化方式は、長いプローブ時間で特徴付けられ、物理量子ビットに比べて1桁以上メモリ時間を拡張することが示されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:58:34 GMT)
On-site estimation of battery electrochemical parameters via transfer learning based physics-informed neural network approach [0.0] 提案手法は,バッテリ管理システムにおけるリアルタイム実装に適した計算コストを大幅に削減する。
動作データと関連する電気化学的パラメータを効果的に推定することができた。
この手法は、標準電荷プロファイルのデータを用いて、Raspberry Piデバイスで実験的に検証される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:06:41 GMT)
Non-perturbative formulation of resonances in quantum mechanics based on exact WKB method [0.0] 量子力学における準定常状態は、正確な WKB 解析を非摂動的枠組みとして用いた。
バリア共鳴を呈する逆ローゼン電位を解析する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:57:52 GMT)
Neural Network Approach to Stochastic Dynamics for Smooth Multimodal Density Estimation [0.0] 我々は、事前条件行列の固有性をランダム行列としてモデル化することで、メトロポリス調整ランゲヴィン拡散アルゴリズムを適用できる。
提案手法は, 統計モデルの局所構造の幾何を活用・適応するために, 提案密度を調整するための完全適応機構を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:22:34 GMT)
Network Density Analysis of Health Seeking Behavior in Metro Manila: A Retrospective Analysis on COVID-19 Google Trends Data [0.0] 本研究では,フィリピン首都圏のマニラ都市圏におけるCOVID-19関連健康診察行動の時間的側面について検討した。
2020年3月から2021年3月までの15日間および30日間の転がり窓を用いて,5つのカテゴリーにまたがる15のキーワードを調査した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:36:21 GMT)
Multiparticle quantum plasmonics: fundamentals and applications [0.0] この論文は、光が金属-誘電体界面での集合電荷振動とどのように相互作用するかを探求し、ナノスケールでの強い閉じ込めと量子効果の強化を可能にした。
理論と応用によって、この論文は量子プラズモニクスを前進させ、イメージング、センシング、情報処理における多光子法の可能性を強調している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 05:45:37 GMT)
MixFunn: A Neural Network for Differential Equations with Improved Generalization and Interpretability [0.0] MixFunnは、精度、解釈可能性、一般化能力を高めた微分方程式を解くために設計された、新しいニューラルネットワークアーキテクチャである。
このアーキテクチャは、複数のパラメータ化非線形関数を統合する混合関数ニューロンと、入力の線形変換と2次項を結合して入力変数のクロスコンビネーションをキャプチャする2次ニューロンの2つの重要な構成要素から構成される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:31:15 GMT)
MediTools -- Medical Education Powered by LLMs [0.0] この研究プロジェクトは、医学教育の強化とワークフローの課題に対処するために、大きな言語モデルを活用する。
最初のツールは皮膚科学のケースシミュレーションツールであり、様々な皮膚疾患を描写した実際の患者画像を使用する。
このアプリケーションには、研究論文のより深い洞察を得るためにLLMと対話するためのAI強化ツールと、さまざまな医療専門分野向けのLLM生成された記事の要約を提供するGoogle Newsツールの2つの追加ツールが含まれている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:57:32 GMT)
MedHallBench: A New Benchmark for Assessing Hallucination in Medical Large Language Models [0.0] 医療大言語モデル(MLLM)は医療応用の可能性を示している。
幻覚に対する寛容性は、患者医療に重大なリスクをもたらす。
本稿では,MLLMにおける幻覚の評価と緩和のためのベンチマークフレームワークであるMedHallBenchを紹介する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 23:37:45 GMT)
Masked Self-Supervised Pre-Training for Text Recognition Transformers on Large-Scale Datasets [0.0] 自己教師付き学習は、大規模未ラベルデータを活用する強力なアプローチとして登場し、モデルパフォーマンスを改善している。
本研究では,マスクの確率を徐々に増加させ,マスク付きパッチと非マスク型パッチの両方を組み込むために損失関数を改良する2つの事前学習フェーズを提案する。
我々は,50万行のラベル付きテキスト行のデータセットを事前学習用として,さらに4つの異なる大きさの注釈付きデータセットを微調整用として,広範囲な実験を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:16:48 GMT)
Long-Term Electricity Demand Prediction Using Non-negative Tensor Factorization and Genetic Algorithm-Driven Temporal Modeling [0.0] 本研究では,歴史的消費データのみに基づく長期電力需要予測のための新しい枠組みを提案する。
本手法は,Non- negative Factorization (NTF) と組み合わせて,多方向電気利用データから低次元時間特性を抽出する。
提案手法は,長期電力需要予測に対する解釈可能でフレキシブルでスケーラブルなアプローチを提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:05:00 GMT)
Local Thermal Operations and Classical Communication [0.0] ローカル・サーマル・オペレーション・アンド・クラシック・コミュニケーション(Local Thermal Operations and Classical Communication, LTOCC)は、遠隔実験のパラダイムと熱力学の制約を統一する新しい運用フレームワークである。
我々はLTOCCプロトコルの階層を確立し、異なるレベルの包摂関係を示し、半局所的な熱操作との深い関係を明らかにする。
我々は,CNOT や SWAP などの論理ゲートの近似における LTOCC の役割について検討し,その可能性を検討した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:25:21 GMT)
LLPut: Investigating Large Language Models for Bug Report-Based Input Generation [0.0] エラーを引き起こすインプットは、ソフトウェアバグの診断と分析において重要な役割を担います。
従来の研究では、様々な自然言語処理(NLP)技術を利用して自動入力抽出を行っている。
大規模言語モデル (LLMs) の出現により、重要な研究課題が生じる: ジェネレーティブLLMは、バグレポートから障害誘発インプットを効果的に抽出できるのか?
論文参考訳(メタデータ) (Fri, 28 Mar 2025 02:53:43 GMT)
Is Training Data Quality or Quantity More Impactful to Small Language Model Performance? [0.0] 本研究では,学習データ品質と量の違いが小言語モデル(SLM)の性能に及ぼす影響について検討する。
大規模モデルのトレーニングは、組織、個人、一般の人々に対して禁止される、重大な財政的および計算的負担を課す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 22:38:02 GMT)
Invariant Control Strategies for Active Flow Control using Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)を,強化学習(RL)に基づくフロー制御のための有望なアーキテクチャとして導入する。
GNNは非構造三次元フローデータを処理し、カルト格子の制約なしに空間的関係を保存する。
我々は,GNNに基づく制御ポリシが,改良された一般化特性の恩恵を受けながら,既存の手法に匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:33:40 GMT)
Interpretability of Graph Neural Networks to Assess Effects of Global Change Drivers on Ecological Networks [0.0] ポリニネーターは、自然の生態系や人為的な景観において、植物の繁殖において重要な役割を担っている。
地球規模の変化要因が受粉に与える影響を評価するには、大規模な相互作用、気候、土地利用データが必要である。
グラフニューラルネットワーク(GNN)のような最近の機械学習手法は、そのようなデータセットの分析を可能にするが、それらの結果を解釈することは困難である。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 20:08:35 GMT)
Intermediate Excited State Relaxation Dynamics of Boron-Vacancy Spin Defects in Hexagonal Boron Nitride [0.0] 広い温度範囲におけるパルスレーザー励起下での光サイクルにおける励起状態と中間状態のダイナミクスについて検討した。
実験では、準安定状態から室温で基底状態に戻ると24 nsの緩和時間を示す。
我々は、中間状態の緩和を考慮したパルス光検出磁気共鳴シーケンスを最適化した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:23:07 GMT)
Integrating Energy-Efficient Computing Research to Accelerate Energy Technology [0.0] NRELの計算科学センターはエネルギー研究に特化した最大の高性能コンピューティング能力を持っている。
10年間の運用期間において,EEREによる研究におけるHPCの使用率は30。
本稿では,データセンターの効率向上に資するユニークな機会について検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 21:59:08 GMT)
Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0] 閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。
極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:38:43 GMT)
Improving Applicability of Deep Learning based Token Classification models during Training [0.0] F1-Scoreで表される分類基準は、実際に機械学習モデルの適用性を評価するには不十分であることを示す。
本稿では,視覚的文書理解とトークン分類タスクのソリューションとして,文書統合精度(Document Integrity Precision, DIP)を導入した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:01:19 GMT)
Implementation and verification of coherent error suppression using randomized compiling for Grover's algorithm on a trapped-ion device [0.0] 量子コンピュータにおけるコヒーレントエラーとその緩和効果について検討する。
最大10キュービットと26の2キュービットゲートを含むGroverのアルゴリズム回路を実装した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 07:18:29 GMT)
High-dimensional Asymptotics of VAEs: Threshold of Posterior Collapse and Dataset-Size Dependence of Rate-Distortion Curve [0.0] 変分オートエンコーダ(VAEs)では、変分後部はしばしば、後部崩壊と呼ばれる前部に崩壊する。
本研究は,ベータおよびデータセットサイズに関して,後方崩壊の発生条件を厳しく評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:12:46 GMT)
Hierarchical generation and design of quantum codes for resource-efficient loss-tolerant quantum communications [0.0] 我々は損失耐性量子コードを生成するための新しいプロトコルを開発した。
これらのコードは、クォービット損失に対する情報保護の中心である。
静的フィードバック機構を備えた単一量子エミッタでこれを実現する方法を示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:50:34 GMT)
Harnessing uncertainty when learning through Equilibrium Propagation in neural networks [0.0] 平衡伝播(Equilibrium Propagation)は、局所的な神経活動を用いてネットワークパラメータを訓練する教師付き学習アルゴリズムである。
本研究では,物理的不確実性を含むハードウェア上でEPが学習できることを評価する。
この結果から, 深層ニューラルネットワークアーキテクチャは, 有限不確実性が存在する場合, EPを用いて順調に学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:16:39 GMT)
Hardware-efficient quantum annealing with error mitigation via classical shadow [0.0] 雑音量子デバイスにおけるデコヒーレンスを抑制するために, 局所化仮想浄化法 (LVP) が提案された。
本稿では,LVPを用いたQAにおけるデコヒーレンスエラーを軽減する手法を提案する。
QAのデコヒーレンス誤差を軽減する以前のスキームとは異なり、2キュービットゲートも中間回路の測定も必要ない。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:34:42 GMT)
Generalization Bias in Large Language Model Summarization of Scientific Research [0.0] 科学的テキストを要約する場合、大きな言語モデル(LLM)は研究の結論の範囲を制限する詳細を省略することができる。
また,ChatGPT-4o,ChatGPT-4.5,DeepSeek,LLaMA 3.370B,Claude 3.7 Sonnetの10種類のLLMを試験した。
LLMは、DeepSeek、ChatGPT-4o、LLaMA 3.3 70Bが26から73%のケースで過剰に一般化した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:23:41 GMT)
Function Alignment: A New Theory of Mind and Intelligence, Part I: Foundations [0.0] 本稿では,心と知性の新たな理論である機能アライメントを紹介する。
意味、解釈、類推が階層表現間の相互作用からどのように現れるかを明確にモデル化する。
それはしばしば、計算アーキテクチャ、心理学理論、さらには禅のような観念的伝統を結びつけて、規律を分割する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:59:09 GMT)
Frustration graph formalism for qudit observables [0.0] 非エルミートユニタリ作用素で表される素数 d を持つ d-アウトカム量子可観測体の群を考える。
我々は、クディット安定化部分空間に対するエンタングルメントの一般化幾何測度を計算する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:09:13 GMT)
ForcePose: A Deep Learning Approach for Force Calculation Based on Action Recognition Using MediaPipe Pose Estimation Combined with Object Detection [0.0] ForcePoseは、人間のポーズ推定とオブジェクト検出を組み合わせることで、応用力を推定する新しいディープラーニングフレームワークである。
我々は、物理的センサーを必要とせず、力の大きさと方向を予測するために、空間的特徴と時間的特徴の両方を処理する専門的なニューラルネットワークを開発した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:13:56 GMT)
Feedback Connections in Quantum Reservoir Computing with Mid-Circuit Measurements [0.0] フィードバック接続を統合する新しい量子貯水池計算方式について検討する。
モデルが過去の入力を記憶できるように,連続処理中にフィードバック接続が効果的に動作可能であることを示す。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:34:06 GMT)
Experimental simulation of daemonic work extraction in open quantum batteries on a digital quantum computer [0.0] 我々は、量子回路として対応するダイナミクスの実装方法を示し、最終条件フィードバックのユニタリ進化を含む。
本研究では, 得られたデーモン抽出作業の実験値が, いわゆるデイモンエルゴトロピーによって定量化された理論上界にどのように近いかを示す作業抽出プロトコルを実験的にシミュレートした。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:42:09 GMT)
Errors in quantum state identification with ultrashort pulses [0.0] 非定常場が、場の統計だけでなく、場の形状にも依存するコヒーレンス関数をもたらすことを示す。
超高速ソースによる束縛と超膨らみの観測は、場の量子状態を示すものではない。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:30:43 GMT)
Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning [0.0] Entropy-Guided Sequence Weighting (EGSW) は、探査・探査のトレードオフを強化する新しいアプローチである。
EGSWは、ポリシー更新のバランスをとるために、エントロピー正規化とアドバンテージベースの重み付けを統合する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:07:51 GMT)
Entanglement scaling and charge fluctuations in a Fermi liquid of composite fermions [0.0] ランダウ準位が$nu=1/2$の合成フェルミ液体(CFL)は、クーロン相互作用によって純粋に放出されるパラダイム的非フェルミ液体である。
エンタングルメントエンハンスメントは$nu=1/2$だけでなく、$nu=1/4$、および$nu=1$および$nu=1/3$のボソニックCFL状態に存在することを示す。
その結果, CFL状態における非Fermi-液性相関の指紋として, 絡み合いの増大と電荷変動の抑制が確認された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:54:29 GMT)
Enhancing Accuracy of Quantum-Selected Configuration Interaction Calculations using Multireference Perturbation Theory: Application to Aromatic Molecules [0.0] 量子選択構成相互作用(QSCI)は、量子化学計算のための新しい量子-古典的ハイブリッドアルゴリズムである。
摂動療法を取り入れたことにより,精度が向上した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:12:39 GMT)
Energy-Efficient Green AI Architectures for Circular Economies Through Multi-Layered Sustainable Resource Optimization Framework [0.0] 我々は、最先端の機械学習アルゴリズム、エネルギーを意識した計算モデル、最適化技術を統合する多層フレームワークとメタアーキテクチャを導入する。
リチウムイオン電池のリサイクルと都市ごみ管理システムによる実世界のデータセットを用いて,本フレームワークを検証した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:09:43 GMT)
Elite Political Discourse has Become More Toxic in Western Countries [0.0] 有害で非公的な政治は、民主的価値観と統治に対する脅威の増大と見なされている。
本稿は,国際的に政治がより非公然化しつつあるか,政治公民権の決定要因は何か,を体系的に検討する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:21:49 GMT)
Effective Description of Ajar Systems with a $U(1)$ Symmetry [0.0] アジャル系」は閉系と開系の間の中間体である。
環境との電荷交換の時間スケールは、他の全ての特徴的な時間スケールよりもパラメトリックに大きい。
拡散的位相と自然破壊的位相の相関関数に対する序列補正を計算する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 19:21:14 GMT)
Driving electrons at needle tips strongly with quantum light [0.0] アト秒科学は、レーザーパルスの強い光学場を持つ光電子放出後の電子の駆動に依存している。
ブライト圧縮真空(BSV)は、強磁場物理学を駆動するのに十分な強度の光の量子状態である。
我々の発見は強磁場物理学と量子光学を橋渡し、BSVや他の量子光状態に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:22:38 GMT)
Domain Specific Question to SQL Conversion with Embedded Data Balancing Technique [0.0] 本稿では,構造化クエリ言語モデルの精度向上のための2つの補間手法を提案する。
提案手法は、Wikiデータセットでテストされたアートモデルの状態と比較して、モデル性能の精度が10.98パーセント向上した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 08:58:14 GMT)
Discrete Time Crystal Phase as a Resource for Quantum Enhanced Sensing [0.0] 障害のない多体系において,安定な離散時間結晶相を生成するための効果的な機構を提案し,特徴付ける。
その結果,時間結晶相を通じて強い量子増強感度が得られた。
単純な射影測定のセットは、量子的に増強された感度を捉えることができる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:00:04 GMT)
Direct measurement of darkness using a standard single-photon avalanche photodiode [0.0] 人間の視覚実験に適した専用暗室における暗黒を直接測定する実験と詳細な統計分析を報告する。
サベージ・ディッキー比と光度0.039$ cnt/sに基づいて絶対暗黒を決定的に証明する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:16:41 GMT)
Direct comparison of stochastic driven nonlinear dynamical systems for combinatorial optimization [0.0] 組合せ最適化問題は、産業応用において至るところに存在している。
過去数十年間、Isingタイプの問題解決ツールの開発に精力的に取り組んできた。
量子システムと古典システムの制御と操作の最近の進歩は、新しい計算パラダイムを可能にしている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:58:28 GMT)
Definitive Proof of the Classical Multiverse! [0.0] 本稿では,デジタルコンピュータ上での類似計算が,古典的多元数の存在を実証できるかどうかを考察する。
本稿では,$dn$次元離散確率分布から効率よくサンプリングする古典的アルゴリズムについて述べる。
古典的、および量子的計算は、多くの平行宇宙で起こると結論付けている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 03:13:31 GMT)
Data-driven worker activity recognition and picking efficiency estimation in manual strawberry harvesting [0.0] ピッカー効率を推定するためには、ピッカーと非ピッカー活動の正確な識別が不可欠である。
本研究では, 商業用イチゴ収穫におけるピッカーの効率を評価するための実用的システムを開発した。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:16:28 GMT)
Cross-Technology Generalization in Synthesized Speech Detection: Evaluating AST Models with Modern Voice Generators [0.0] 本稿では,合成音声検出のためのAudio Spectrogram Transformer (AST)アーキテクチャについて述べる。
差別化された拡張戦略を使用することで、ElevenLabs、NotebookLM、Minimax AI音声ジェネレータに対してテストすると、全体の0.91%のEERを達成する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:07:26 GMT)
Comparison between neural network clustering, hierarchical clustering and k-means clustering: Applications using fluidic lenses [0.0] ニューラルネットワーククラスタリング(NNC)、階層クラスタリング(HC)、K平均クラスタリング(KMC)の比較を行う。
NNCでは、波面センサ再構成の収集に自己組織化マップ(SOM)トレーニングを適用した。
HCの場合、データは相似性連鎖行列の組み合わせで分割された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:01:12 GMT)
Collective vacuum-Rabi splitting with an atomic spin wave coupled to a cavity mode [0.0] 冷間87mathrmRb=原子アンサンブルにおけるラマン散乱による非古典的集団スピン励起の強い結合について検討した。
我々は、量子領域において、キャビティ内スピン波と1光子変換効率を最大$chi=0.75 pm 0.02$と報告する。
この研究により、空洞強化されたスピン波の読み出しの理解が深まり、その可能性も深まる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:50:20 GMT)
Characterizing Non-Markovian Dynamics of Open Quantum Systems [0.0] 我々はTCLマスター方程式を用いて非マルコフ進化を特徴付ける構造保存手法を開発した。
本稿では,ローレンス・リバモア国立研究所のQuantum Device Integration Testbed (QuDIT) における超伝導量子ビットの実験データを用いた手法について述べる。
これらの知見は、短期量子プロセッサにおける量子制御とエラー軽減に寄与する、オープン量子システムの効率的なモデリング戦略に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 04:43:24 GMT)
Certifying quantum enhancements in thermal machines beyond the Thermodynamic Uncertainty Relation [0.0] 定常量子熱機械と,同じ熱力学資源を用いた古典機械を比較した。
機械の摂動によって引き起こされるコヒーレンスの存在は、穏やかな条件下で真の熱力学的優位性を保証する。
一方、ノイズによるコヒーレンスを受けるエンジンは、全く同じ(非コヒーレントな)リソースセットを使用して古典的なエンジンよりも性能が高い。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 09:39:39 GMT)
Cavity QED with degenerate atomic levels and polarization-degenerate field mode [0.0] 励起原子によりキャビティに放出される光子の偏光特性は、原子レベルの任意の角モータに対する緩和過程を考慮に入れて研究される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:01:15 GMT)
Casimir pressure with dissipation and quantum corrections from axion dark matter [0.0] 2つの金属板間のカシミール圧力に及ぼす振動軸場の影響について検討した。
境界板の有限導電率を考慮して、シュウィンガー・ケルディシュ形式論における物質と光子の相互作用をモデル化する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:24:06 GMT)
CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes [0.0] 既存の方法では、観察された異常に明示的に焦点をあてることなく、3D CT画像から直接レポートを生成するのが一般的である。
本稿では,まず異常を予測し,それぞれが対象とする記述を生成する,新たな異常誘導型レポート生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:14:10 GMT)
Avoiding convergence stagnation in a quantum circuit evolutionary framework through an adaptive cost function [0.0] 本稿では,最近導入された量子回路進化法(QCE)が二項最適化問題に適用可能であることを示す。
本稿では,回路の進化に伴って動的に変化する適応コスト関数(ACF)を用いたフレームワークを提案する。
実験の結果,QCE-ACFはQAOAと同一の収束性能を示すが,実行時間が短い。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:14:50 GMT)
Autonomous AI imitators increase diversity in homogeneous information ecosystems [0.0] 大規模言語モデル(LLM)の最近のブレークスルーは、人間が生成したコンテンツを模倣できる自律型AIエージェントを促進している。
本稿では,ニュースにおけるAIによる模倣を検証するための大規模シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 13:23:05 GMT)
AppQSim: Application-oriented benchmarks for Hamiltonian simulation on a quantum computer [0.0] AppQSimは量子コンピュータのベンチマークスイートである。
正確なタスクとスコアを定義する5つの異なる設定を検討します。
テストされた量子ハードウェアの出力の質を評価するためのメトリクスを導入する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 17:12:06 GMT)
AnnoPage Dataset: Dataset of Non-Textual Elements in Documents with Fine-Grained Categorization [0.0] AnnoPageデータセット(AnnoPage data)は、チェコ語とドイツ語の歴史的文書から収集された7550ページの集合体で、1485年から現在までさかのぼる。
このデータセットは、ドキュメントレイアウト分析とオブジェクト検出の研究をサポートするように設計されている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 15:30:42 GMT)
Alternating Wentzel-Kramers-Brillouin Approximation to the Schrödinger Equation: Rediscover the Bremmers series and beyond [0.0] Wenzel-Kramers-Brillouin (WKB) 近似の拡張を提案し、シュリンガー方程式を解く。
幾何学的光学的物理を符号化した一般量子化公式が見つかる。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:58:46 GMT)
Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent [0.0] 本研究では, フラクタル次元を純粋にベイズ的手法で説明できるフラクタルランドスケープにおいて, 勾配降下が効果的に拡散していることを示す。
トレーニング中の重量の拡散を調べることにより,実験結果の検証を行った。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 14:38:39 GMT)
Advancing the Biological Plausibility and Efficacy of Hebbian Convolutional Neural Networks [0.0] 本稿では,画像処理のための畳み込みニューラルネットワーク(CNN)へのヘビアン学習の統合について述べる。
ヘビアン学習は、局所的な教師なしの神経情報に基づいて特徴表現を形成する。
その結果, より複雑で受容的な領域を通じて, まばらな階層的学習の徴候がみられた。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:11:52 GMT)
Advancing DevSecOps in SMEs: Challenges and Best Practices for Secure CI/CD Pipelines [0.0] 本研究では中小企業におけるDevSecOpsの導入状況について検討する。
68%がDevSecOpsを実装しているが、採用は技術的複雑さ(41%)、リソース制約(35%)、文化的抵抗(38%)によって妨げられている。
今後、中小企業はAIと機械学習がDevSecOpsに大きな影響を与えることを期待している。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 16:55:41 GMT)
Advancing Chronic Tuberculosis Diagnostics Using Vision-Language Models: A Multi modal Framework for Precision Analysis [0.0] 本研究では,自動結核検診(TB)を強化するビジョン・ランゲージ・モデル(VLM)を提案する。
胸部X線画像と臨床データを統合することにより,手動による解釈の課題に対処する。
このモデルでは、重要な慢性TBの病態を検出するための高精度(44%)とリコール(44%)が示された。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:00:46 GMT)
AI-Driven MRI Spine Pathology Detection: A Comprehensive Deep Learning Approach for Automated Diagnosis in Diverse Clinical Settings [0.0] 本研究では,MRI脊椎病理診断のための自律型AIシステムの開発について述べる。
データセットは年齢層、性別、スキャナーメーカー間でバランスを取り、堅牢性と適応性を保証する。
このシステムは、インドの主要医療機関13社に展開され、診断センター、大病院、政府施設を含む。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 11:08:02 GMT)
A quantum search method for quadratic and multidimensional knapsack problems [0.0] 量子ツリージェネレータ(QTG)を0-1クナップサック問題、0-1クナップサック問題(QKP)、多次元クナップサック問題(MDKP)に拡張する。
QTGは与えられたインスタンスに対するすべての実現可能な解の重ね合わせを構築するので、有望な状態準備ルーチンとして利用することができる。
古典的解法であるグロビに対して,QKPとMDKPにおけるアルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:58:26 GMT)
A deep implicit-explicit minimizing movement method for option pricing in jump-diffusion models [0.0] 我々は、ジャンプ拡散力学に従う資産に書かれた欧州のバスケットオプションの価格設定のための新しいディープラーニングアプローチを開発する。
オプション価格問題は部分積分微分方程式として定式化され、これは新しい暗黙的な最小化運動タイムステッピング手法によって近似される。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 18:25:23 GMT)
A Parameter-Efficient Quantum Anomaly Detection Method on a Superconducting Quantum Processor [0.0] 本稿では,新しい量子機械学習手法を提案する。
実用的な画像異常検出のための効率的な量子異常検出(PEQAD)。
PEQADは従来のモデルと比較してパラメータ効率と精度の両方を達成することを目的としている。
超伝導量子プロセッサ上での一般画像データセットに対する量子異常検出法の最初の実装を実証する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 10:57:32 GMT)
A Multi-Site Study on AI-Driven Pathology Detection and Osteoarthritis Grading from Knee X-Ray [0.0] 変形性関節症や変形性膝関節症のような骨の健康障害は、世界的な健康問題を引き起こす。
本研究では, 膝X線を解析し, 重要な病態を検出するAIシステムを提案する。
また、変形性関節症の重症度も評価し、タイムリーにパーソナライズされた治療を可能にしている。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 06:41:22 GMT)
$Λ$CDM and early dark energy in latent space: a data-driven parametrization of the CMB temperature power spectrum [0.0] 変分オートエンコーダ(VAE)の非絡み合った「ラテント」表現によって与えられる宇宙モデルのデータ駆動パラメトリゼーションを提案する。
我々は、早期ダークエネルギー (EDE) 成分を付加した幅広い$Lambda$CDMと$Lambda$CDMの宇宙論を考える。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 12:50:30 GMT)
$\texttt{Symdyn}$: an automated algebraic solution for high-order quantum systems [0.0] この研究は、高階量子システムに対するWei-Normanメソッドの応用を自動化するPythonライブラリであるtextttsymdyn$を紹介した。
このライブラリはBaker-Campbell-Hausdorff-like関係の導出に固有の類似性変換と非線形微分方程式を効率的に計算する。
論文参考訳(メタデータ) (Fri, 28 Mar 2025 00:47:49 GMT)