Attention Hijackers: Detect and Disentangle Attention Hijacking in LVLMs for Hallucination Mitigation [123.5] LVLM(Large Vision-Language Models)は幻覚に弱い。
AID(Attention HIjackers Detection and Disentanglement)と呼ばれる新しい非トレーニング型戦略を提案する。
AIDは、命令駆動の視覚的サリエンスを計算することによって、意図的ヒジャッカーを特定する。
次に、これらの特定されたヒジャッカーの視覚的注意を隠蔽するために注意散らし機構を提案する。
Re-Disentanglementは、過剰なマスキング効果を避けるために、命令駆動と画像駆動の視覚的サリエンスの間のバランスを再計算する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:03:16 GMT)
Skip Tuning: Pre-trained Vision-Language Models are Effective and Efficient Adapters Themselves [123.1] 下流タスクに視覚言語モデルを適用するための新しいパラダイムとして,Skip Tuningを提案する。
既存のPTやアダプタベースの方法とは異なり、Skip Tuningは追加のコンテキストベクトルやアダプタモジュールを導入することなく、FTベースラインにLayer-wise Skipping(LSkip)とClass-wise Skipping(CSkip)を適用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:12:38 GMT)
EgoSplat: Open-Vocabulary Egocentric Scene Understanding with Language Embedded 3D Gaussian Splatting [108.2] EgoSplatは、オープン・ボキャブラリ・エゴセントリック・シーン理解のための3Dガウス・スプレイティング・フレームワークである。
EgoSplatは2つのデータセット上のローカライゼーションタスクとセグメンテーションタスクの両方において、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:21:26 GMT)
Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.2] 時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:53:46 GMT)
Aerial Vision-and-Language Navigation with Grid-based View Selection and Map Construction [102.7] Aerial Vision-and-Language Navigation (Aerial VLN)は、人間の指示に従って空中3D環境をナビゲートする無人航空機エージェントの取得を目的としている。
より長い航法、より複雑な3Dシーン、垂直アクションと水平アクションの相互作用の無視により、従来の手法はうまく機能しない。
グリッドベースのビュー選択タスクとして空のVLN動作予測を定式化する,グリッドベースのビュー選択フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:20:43 GMT)
DICE: End-to-end Deformation Capture of Hand-Face Interactions from a Single Image [98.3] DICEは1枚の画像から変形認識による手と顔のインタラクションを再現する最初のエンドツーエンド手法である。
ローカルな変形場とグローバルなメッシュ位置の回帰を2つのネットワークブランチに切り離すことが特徴である。
標準的なベンチマークと、精度と物理的妥当性の点から見れば、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:21:02 GMT)
Step-Video-TI2V Technical Report: A State-of-the-Art Text-Driven Image-to-Video Generation Model [97.4] 我々は、テキスト駆動型画像-ビデオタスクの新しいベンチマークとして、Step-Video-TI2Vを構築した。
このデータセットを用いて,Step-Video-TI2Vとオープンソースおよび商用TI2Vエンジンを比較した。
画像対映像生成タスクにおけるステップビデオ-TI2Vの最先端性能を示す実験結果が得られた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:01:55 GMT)
Impact of Noisy Supervision in Foundation Model Learning [91.6] 本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:46:43 GMT)
Tit-for-Tat: Safeguarding Large Vision-Language Models Against Jailbreak Attacks via Adversarial Defense [90.7] 大きな視覚言語モデル(LVLM)は、視覚入力による悪意のある攻撃に対する感受性という、ユニークな脆弱性を導入している。
本稿では,脆弱性発生源からアクティブ防衛機構へ視覚空間を変換するための新しい手法であるESIIIを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:39:45 GMT)
ClassDiffusion: More Aligned Personalization Tuning with Explicit Class Guidance [90.6] 新しい概念を学ぶ際に, 概念空間を明示的に規制するために, ** 連続保存損失** を利用するテクニックである **ClassDiffusion** を提示する。
このアプローチは単純ではあるが、ターゲット概念の微調整過程における意味的ドリフトを効果的に防止する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:23:42 GMT)
Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering [87.8] Embodied Question Answeringでは、エージェントが動的に3D環境を探索し、視覚情報を積極的に収集し、質問に答えるために多段階の推論を行う必要がある。
既存のデータセットはしばしばバイアスや事前の知識を導入し、非身体的推論につながる。
探索能力と推論能力の両方を評価するために特別に設計された最大のデータセットを構築します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:29:47 GMT)
LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection [87.4] テキストが人間の書いたものなのか、機械で作られたものなのかを判断するのは、しばしば困難である。
細粒度検出のためのLLM-DetectAIveを提案する。
i) 人書き、ii) 機械生成、(iii) 機械書、次いで機械書、(iv) 人書き、そして機械ポリッシュの4つのカテゴリをサポートする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:52:30 GMT)
DetectiveQA: Evaluating Long-Context Reasoning on Detective Novels [86.9] 長い文脈内での物語的推論に特化したデータセットである textbfDetectiveQA を提案する。
100万以上のトークンを平均化する探偵小説を活用して、中国語と英語の両方で1200人の注釈付き質問を含むデータセットを作成します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:44:06 GMT)
Street Gaussians without 3D Object Tracker [86.6] 既存の方法は、標準空間における動的オブジェクトを再構築するために、オブジェクトポーズの労働集約的な手動ラベリングに依存している。
本研究では,3次元オブジェクト融合戦略における2次元ディープトラッカーの関連性を利用して,安定なオブジェクト追跡モジュールを提案する。
我々は、軌道誤差を自律的に補正し、見逃した検出を回復する暗黙の特徴空間に、モーションラーニング戦略を導入することで、避けられないトラッキングエラーに対処する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:40:41 GMT)
Centaur: Robust End-to-End Autonomous Driving with Test-Time Training [84.8] 我々は,手作業によるルールやコスト関数に頼ることなく,テストタイムトレーニングを通じてプランナーの行動を更新するCentaurを提案する。
本稿では,クラスタ・エントロピー(Cluster Entropy,クラスタ・エントロピー)と呼ばれる新しい不確実性尺度を開発した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:41 GMT)
RASA: Replace Anyone, Say Anything -- A Training-Free Framework for Audio-Driven and Universal Portrait Video Editing [82.1] 本稿では,多目的かつ適応可能な編集戦略を提供する,トレーニングフリーのユニバーサル・ポートレート・ビデオ編集フレームワークを提案する。
変更された第1参照フレームに設定されたポートレートの外観編集と、さまざまな音声に設定されたリップ編集をサポートする。
本モデルでは, 口唇編集作業において, より正確かつ同期的な唇運動を実現するとともに, 外観編集作業においてより柔軟な動き伝達を実現することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:39:15 GMT)
From Pixels to Histopathology: A Graph-Based Framework for Interpretable Whole Slide Image Analysis [81.2] 我々はWSIグラフ表現を構成するグラフベースのフレームワークを開発する。
任意のパッチではなく生物学的境界に従う組織表現(ノード)を構築します。
本手法の最終段階として,グラフアテンションネットワークを用いて診断課題を解決する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:15:04 GMT)
Make Optimization Once and for All with Fine-grained Guidance [78.1] Learning to Optimize (L2O)は、統合ニューラルネットワークによる最適化効率を向上させる。
L2Oパラダイムは、例えば、リフィット、目に見えない解決策を反復的または直接的に生成するなど、大きな成果を達成する。
そこで本研究では,Diff-L2Oと呼ばれる学習最適化のための一般的なフレームワークについて検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:48:12 GMT)
Making Every Step Effective: Jailbreaking Large Vision-Language Models Through Hierarchical KV Equalization [74.8] HKVE (Hierarchical Key-Value Equalization) は、勾配最適化結果を選択的に受け入れる革新的なジェイルブレイクフレームワークである。
HKVEは既存の手法を20.43%,21.01%,26.43%のマージンで大幅に上回った。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:57:42 GMT)
Large Reasoning Models in Agent Scenarios: Exploring the Necessity of Reasoning Capabilities [74.4] ツール利用,計画設計,問題解決の9つのタスクを含むLaRMAフレームワークを提案する。
LRMは計画設計のような推論集約的なタスクにおいてLLMを超越し、反復反射を優れた結果に活用する、という4つの研究課題に対処する。
LRMの強化された推論は、過剰思考や事実を無視した傾向を含む高い計算コスト、長い処理、行動上の問題を引き起こす。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:34:31 GMT)
Tensor Convolutional Network for Higher-Order Interaction Prediction in Sparse Tensors [74.3] 我々は,トップk相互作用を予測するTF法とシームレスに統合する,正確で互換性のあるテンソル畳み込みネットワークTCNを提案する。
TF法と統合されたTNは,TF法やハイパーエッジ予測法などの競合よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:22:20 GMT)
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video [72.4] ReCamMasterは、カメラ制御された生成ビデオの再レンダリングフレームワークである。
これは、新しいカメラ軌道における入力ビデオのダイナミックなシーンを再現する。
また,ビデオの安定化,超高解像度化,画質向上に有望な応用を見出した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:31 GMT)
Poisoned-MRAG: Knowledge Poisoning Attacks to Multimodal Retrieval Augmented Generation [71.3] マルチモーダル検索強化世代(RAG)は視覚言語モデル(VLM)の視覚的推論能力を向上させる
本研究では,マルチモーダルRAGシステムに対する最初の知識中毒攻撃であるtextitPoisoned-MRAGを紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:16:23 GMT)
Switch-a-View: Few-Shot View Selection Learned from Edited Videos [71.0] ハウツービデオを作成する際に,各時点に表示すべき視点を自動的に選択するモデルであるSWITCH-A-VIEWを紹介する。
トレーニングビデオに擬似ラベルのセグメントを第一の視点に配置する作業を行う。
一方のハウツービデオにおける視覚的コンテンツと音声的コンテンツの間のパターンと,他方のビュー・スウィッチ・モーメントを見出す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:38:33 GMT)
GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting [70.8] GuardSplatは、3DGS資産をウォーターマークするための革新的で効率的なフレームワークである。
Message Embeddingモジュールは、元の3D構造を保持しながら、各3DガウスのSH機能にメッセージをシームレスに埋め込む。
反歪メッセージ抽出モジュールは、様々な歪みに対する堅牢性を改善する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:13:01 GMT)
Culturally Aware and Adapted NLP: A Taxonomy and a Survey of the State of the Art [70.1] NLPにおける「文化」への関心の高まりは、近年の研究に影響を与えたが、「文化」に関する共通理解はいまだに不明である。
本研究では,研究の進展を分析し,理解するための体系的な枠組みを提供する,文化における要素のきめ細かい分類法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:44:42 GMT)
Deep Incomplete Multi-view Clustering with Distribution Dual-Consistency Recovery Guidance [69.6] 本稿では,distriBution dUal-Consistency Recovery Guidanceを用いた不完全なマルチビュークラスタリング手法であるBURGを提案する。
我々は,各サンプルを別カテゴリとして扱い,欠落したビューの分布空間を予測するために,クロスビュー配信を行う。
信頼性の高いカテゴリ情報の欠如を補うために,隣り合った整合性によって案内されるビュー内アライメントと,プロトタイプ的な整合性によって案内されるクロスビューアライメントを含む二重整合性ガイド付きリカバリ戦略を設計する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:27:45 GMT)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.6] 戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
EPOはオープンなアクション空間で戦略を提供し、任意のLLMエージェントにプラグインすることで、ゴール指向の振る舞いを動機付けることができる。
社会的および物理的領域にわたる実験は、EPOの長期的なゴールアライメント能力を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:13:13 GMT)
Bring Your Rear Cameras for Egocentric 3D Human Pose Estimation [68.0] 本稿では,フルボディトラッキングのためのヘッドマウントデバイス(HMD)設計におけるリアカメラの有用性について検討する。
マルチビュー情報と熱マップの不確実性を用いて2次元関節熱マップ推定を改良するトランスフォーマーに基づく新しい手法を提案する。
実験の結果,バックビューを備えた新しいカメラ構成は,3次元ポーズトラッキングの優れたサポートを提供することがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:54 GMT)
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos [67.8] 長文理解は,ビデオデータの冗長度が高く,クエリ非関連情報の豊富さによって複雑になる。
我々は,LLM推論のためのクエリ適応的かつ階層的なビデオ表現を構築する,トレーニング不要なフレームワークであるVideoTreeを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:57:16 GMT)
EmoDiffusion: Enhancing Emotional 3D Facial Animation with Latent Diffusion Models [66.7] エモディフュージョン(EmoDiffusion)は、音声中の様々な感情をアンタングルしてリッチな3次元の表情を生成する新しいアプローチである。
iPhone上のLiveLinkFaceを使ってアニメーション専門家の指導の下で表情をキャプチャする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:54:22 GMT)
High-Dimensional Interlingual Representations of Large Language Models [65.8] 大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:39:27 GMT)
SAFREE: Training-Free and Adaptive Guard for Safe Text-to-Image And Video Generation [65.3] 安全な生成のための学習/編集に基づく手法は、モデルから有害な概念を取り除くが、いくつかの課題に直面している。
安全なT2IとT2VのためのトレーニングフリーアプローチであるSAFREEを提案する。
テキスト埋め込み空間における有毒な概念の集合に対応する部分空間を検出し、この部分空間から直ちに埋め込みを行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:47:39 GMT)
reWordBench: Benchmarking and Improving the Robustness of Reward Models with Transformed Inputs [64.3] 現状の報奨モデルでは, 入力変換が小さい場合でも, 大幅な性能劣化に悩まされていることを示す。
同様のスコアをパラフレーズに割り当てるように明示的にトレーニングすることを提案するが、この手法は他の異なる種類の変換に対する堅牢性も向上する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:41 GMT)
HiTVideo: Hierarchical Tokenizers for Enhancing Text-to-Video Generation with Autoregressive Large Language Models [63.7] HiTVideoは、テキストからビデオ生成タスクにおける既存のビデオトークンの潜在的な制限を解決することを目的としている。
マルチレイヤの離散トークンフレームワークを備えた3D因果VAEを使用し、ビデオコンテンツを階層的に構造化されたコードブックにエンコードする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:36:39 GMT)
Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation [63.0] RMBoostは、新しい合成選好データ生成パラダイムである。
優先ペアが意図的に構築されているため、ラベリングノイズを低減する。
これは4つの異なる報酬モデルのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:08:08 GMT)
FlashVideo: Flowing Fidelity to Detail for Efficient High-Resolution Video Generation [61.6] DiT拡散モデルは、モデルキャパシティとデータスケールのスケーラビリティを活用して、テキスト・ビデオ生成において大きな成功を収めた。
しかし、テキストプロンプトに一致した高い内容と動きの忠実度は、しばしば大きなモデルパラメータとかなりの数の関数評価(NFE)を必要とする。
本稿では,モデルキャパシティとNFEを戦略的に割り当て,生成精度と品質のバランスをとる新しい2つのステージフレームワークであるFlashVideoを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:41:07 GMT)
Unifying Perplexing Behaviors in Modified BP Attributions through Alignment Perspective [61.6] GBP, RectGrad, LRP, DTD などの手法の統一理論フレームワークを提案する。
活性化ニューロンの重みを結合して入力アライメントを実現することを実証した。
このアライメントにより、可視化品質が向上し、重量ランダム化に対する感度が低下する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:58:26 GMT)
Unlocking General Long Chain-of-Thought Reasoning Capabilities of Large Language Models via Representation Engineering [59.3] 既存の作業では、いくつかの例だけをチューニングすることで、長いCoT推論の能力を効率的に引き出すことができる。
このことは、LLMの一般的な能力であるCoT推論の長さを調査する動機となっている。
LLMの一般的な長大CoT推論能力を解き放つ新しい表現工学手法であるGLoREを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:30:37 GMT)
EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.3] イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。
本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。
動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。
最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:15:54 GMT)
Classifying Long-tailed and Label-noise Data via Disentangling and Unlearning [58.1] 実世界のデータセットでは、長い尾の分布とノイズラベルの課題はしばしば共存する。
本稿では,長い尾とラベルノイズデータに対するディスタングルとアンラーニングという新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:58:27 GMT)
Towards Sample-specific Backdoor Attack with Clean Labels via Attribute Trigger [57.5] サンプル特異的バックドアアタック (SSBA) は, 有毒なラベルの性質のため, 十分にステルス性がないことを示す。
クリーンラベルのSSBAを設計するためのトリガパターンとして,コンテンツ関連機能である$a.k.a.$(ヒューマン信頼性)属性を活用することを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:36:51 GMT)
Fourier Neural Operator based surrogates for $CO_2$ storage in realistic geologies [57.2] 我々は,$CO$ plume マイグレーションのリアルタイム・高分解能シミュレーションのためのニューラル演算子(FNO)モデルを開発した。
このモデルは、現実的な地下パラメータから生成された包括的なデータセットに基づいて訓練される。
本稿では,実際の地質学的位置を評価する上で重要なモデルから予測の信頼性を向上させるための様々な戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:58:24 GMT)
Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [56.4] 本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:30:07 GMT)
TikZero: Zero-Shot Text-Guided Graphics Program Synthesis [56.4] 本稿では、画像表現を中間ブリッジとして利用して、テキスト理解からグラフィックプログラムを生成するTikZeroを提案する。
グラフィックプログラムとキャプション付き画像の独立したトレーニングを可能にし、ゼロショットテキスト誘導グラフィックプログラムの合成を可能にする。
本手法は,キャプション対応グラフィックスプログラムでのみ動作可能なベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:29:58 GMT)
The Curse of Conditions: Analyzing and Improving Optimal Transport for Conditional Flow-Based Generation [56.3] 本稿では,最適輸送代入を計算する際に,コスト行列に条件付き重み付け項を追加する条件付き最適輸送C2OTを提案する。
実験では、この単純な修正は8gaussian-to-moons、CIFAR-10、ImageNet-32x32、ImageNet-256x256の離散的条件と連続的条件の両方で動作することを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:35:23 GMT)
Monitoring Reasoning Models for Misbehavior and the Risks of Promoting Obfuscation [56.1] エージェントコーディング環境における報酬ハッキングのために,OpenAI o3-miniのようなフロンティア推論モデルを監視することができることを示す。
最適化が多すぎると、エージェントは難解な報酬のハッキングを学び、その意図を思考の連鎖の中に隠してしまう。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:50:34 GMT)
Agents' Room: Narrative Generation through Multi-step Collaboration [55.0] 本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。
エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:09:03 GMT)
ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [54.8] Reinforced Meta-thinking Agents(ReMA)は,MARL(Multi-Agent Reinforcement Learning)を利用したメタ思考行動の抽出手法である。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
実験の結果、ReMAは複雑な推論タスクにおいて単一エージェントRLベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:33:47 GMT)
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.1] PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:03:20 GMT)
Towards Better Alignment: Training Diffusion Models with Reinforcement Learning Against Sparse Rewards [52.9] 拡散モデル微調整では強化学習(RL)が検討されている。
RLの有効性はスパース報酬の挑戦によって制限される。
$textB2text-DiffuRL$は既存の最適化アルゴリズムと互換性がある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:45:19 GMT)
Scalable Mechanistic Neural Networks for Differential Equations and Machine Learning [52.3] 長い時間的シーケンスを含む科学機械学習応用のための拡張ニューラルネットワークフレームワークを提案する。
計算時間と空間複雑度はそれぞれ、列長に関して立方体と二次体から線形へと減少する。
大規模な実験により、S-MNNは元のMNNと精度で一致し、計算資源を大幅に削減した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:00:28 GMT)
Pathology Image Compression with Pre-trained Autoencoders [52.2] デジタル病理学における全スライド画像は、記憶、伝達、計算効率の面で大きな課題をもたらす。
JPEGのような標準的な圧縮手法はファイルサイズを小さくするが、下流のタスクに不可欠な微細な表現型の詳細を保存できない。
本研究では,遅延拡散モデル用に設計されたオートエンコーダ(AE)を,病理画像の効率的な学習圧縮フレームワークとして再利用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:01:17 GMT)
BriLLM: Brain-inspired Large Language Model [51.8] BriLLMは非トランスフォーマー、非GPT、非伝統的な機械学習入出力制御型生成言語モデルである。
4000トークン,32次元ノード幅,16token長列予測機能,GPT-1に匹敵する言語モデル予測性能を備えた,中国語の最初の BriLLM バージョンをリリースする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:08:30 GMT)
Multiple Heads are Better than One: Mixture of Modality Knowledge Experts for Entity Representation Learning [51.8] 高品質なマルチモーダル実体表現を学習することは、マルチモーダル知識グラフ(MMKG)表現学習の重要な目標である。
既存の手法は、エレガントなエンティティワイドマルチモーダル融合戦略の構築に重点を置いている。
適応型マルチモーダルな実体表現を学習するために,Mixture of Modality Knowledge Expert (MoMoK) を用いた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:37:57 GMT)
LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [50.8] 都市景観におけるLiDARスキャンをリアルタイムかつ高忠実に再現するLiDAR-GSを提案する。
この手法は,公開可能な大規模シーンデータセットのレンダリングフレームレートと品質の両面において,最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:52:11 GMT)
Compute Optimal Scaling of Skills: Knowledge vs Reasoning [50.8] 計算-最適スケーリングの振る舞いがスキルに依存しているかどうかを問う。
特に,知識に基づくQAやコード生成といった知識と推論に基づくスキルについて検討する。
本研究は,検証セットを用いた標準的な計算-最適スケーリングとの関連性について分析した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:39:39 GMT)
Online Context Learning for Socially Compliant Navigation [49.6] 本文では,ロボットが新たな社会環境に適応できるようにするための,オンラインコンテキスト学習手法を紹介する。
コミュニティワイドシミュレータを用いた実験により,本手法は最先端のシミュレータよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:41:06 GMT)
LLM Agents for Education: Advances and Applications [49.4] 大規模言語モデル(LLM)エージェントは、タスクの自動化と多様な教育アプリケーションにおけるイノベーションの推進において、顕著な能力を示した。
本調査は、LLMエージェントの総合的技術概要を提供することを目的としており、学習者や教育者のより大きな利益に対する影響を高めるために、さらなる研究と協力を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:53:44 GMT)
Bridging Language Models and Financial Analysis [49.4] 大規模言語モデル(LLM)の急速な進歩は、自然言語処理における変換可能性の解放をもたらした。
財務データは、しばしばテキストコンテンツ、数値表、および視覚チャートの複雑な関係に埋め込まれる。
LLM研究における急速なイノベーションのペースにもかかわらず、金融業界における彼らの実践的採用には大きなギャップが残っている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:35:20 GMT)
DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation [49.3] DriveGENは、トレーニング不要のテキストから画像への拡散生成である。
様々なアウト・オブ・ディストリビューション世代にまたがる正確な3D形状のオブジェクトを一貫して保存する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:35:38 GMT)
Test-Time Training Provably Improves Transformers as In-context Learners [49.1] テキスト内学習のための勾配に基づくTTTアルゴリズムについて検討する。
テストプロンプトで提供されるコンテキスト内デモに対して,トランスフォーマーモデルをトレーニングする。
経験的貢献として,TabPFNに対するTTTの有用性について検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:06:37 GMT)
Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention [49.0] LVLM(Large Vision-Language Models)は、しばしば物体の幻覚に遭遇する。
物体幻覚の根本原因の1つは、識別的画像の特徴に対する注意不足にある。
幻覚を緩和するためのグローバル・ローカル・アテンション・アセンブリー(AGLA)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:38:44 GMT)
Residual Policy Gradient: A Reward View of KL-regularized Objective [48.4] 強化学習と模倣学習は多くの領域で広く成功しているが、実世界の展開には制約が残っている。
ポリシーのカスタマイズは、その固有の特性を維持しつつ、新しいタスク固有の要件を満たしながら、事前のポリシーに適応することを目的として導入された。
ポリシーのカスタマイズに対する原則的なアプローチはResidual Q-Learning (RQL)であり、マルコフ決定プロセス(MDP)として問題を定式化し、価値に基づく学習アルゴリズムのファミリを導出する。
RQLをポリシーグラデーションメソッドに拡張し、グラデーションベースのRL設定でのポリシーカスタマイズを可能にするResidual Policy Gradient(RPG)を導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:30:13 GMT)
GNNs as Predictors of Agentic Workflow Performances [48.3] LLM(Large Language Models)によって起動されるエージェントは、複雑なタスクの処理において顕著な成功を収めた。
本稿では、エージェントを計算グラフとして定式化し、エージェント性能の効率的な予測因子としてグラフニューラルネットワーク(GNN)を提唱する。
エージェントワークフローのパフォーマンスを予測するため,GNNをベンチマークする統合プラットフォームであるFLORA-Benchを構築した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:11:00 GMT)
TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing [47.9] TreeMeshGPTは、入力ポイントクラウドに整列した芸術的メッシュを生成するように設計された自動回帰変換器である。
提案手法は,2つのトークンを持つ三角形の面をそれぞれ表現し,圧縮率を約22%とする。
提案手法は,従来手法でよく見られたフリップ正規化を最小化しながら,強い正規配向制約を持つメッシュを生成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:48:06 GMT)
Combinatorial Optimization via LLM-driven Iterated Fine-tuning [47.7] 我々は,Large Language Models (LLMs) を利用して,柔軟で文脈に依存しない制約を最適化に統合する新しい方法を提案する。
本フレームワークは, 局所的制約と厳密なグローバル最適化とのバランスを, ベースラインサンプリング法よりも効率的に行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:16:29 GMT)
RePanda: Pandas-powered Tabular Verification and Reasoning [47.4] RePandaは、クレームを実行可能なパンダクエリに変換する構造化された事実検証手法である。
RePandaをトレーニングするために、TabFactから派生した構造化データセットであるPanTabFactを構築した。
そこで我々はPanWikiを紹介した。PanWikiはWikiTableQuestionsをパンダのクエリにマッピングするデータセットである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:12:36 GMT)
Homogeneous Dynamics Space for Heterogeneous Humans [47.3] ホモジニアス・ダイナミクス・スペース(HDyS)は、異種データを集約し、逆フォワード・ダイナミックス法からインスピレーションを得て、均質な潜在空間を訓練することにより、人間のダイナミクスの基本空間である。
広汎な実験と応用によるHDySの実現可能性を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:10:18 GMT)
Masked LoGoNet: Fast and Accurate 3D Image Analysis for Medical Domain [46.4] 我々はLoGoNetと呼ばれる新しいニューラルネットワークアーキテクチャを導入する。
LoGoNetは、LKA(Large Kernel Attention)とデュアルエンコーディング戦略を利用して、U字型アーキテクチャに新しい特徴抽出器を統合する。
大規模ラベル付きデータセットの欠如を補うために,3次元画像に適した新しいSSL方式を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:59:35 GMT)
MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation [46.3] MoMa-Kitchenは、最適な最終ナビゲーション位置を学習するためのトレーニングモデルのためのベンチマークデータセットである。
視覚データは、ロボットアームに取り付けられた1人称ビューカメラによってキャプチャされたRGB-D入力から収集される。
提案手法は,異なるアームタイプとプラットフォームの高さに対応する,アベイランスに基づく最終的な位置決めの学習を可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:47:38 GMT)
dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis [45.9] 本稿では,dFLMoE という分散化フェデレーション学習フレームワークを提案する。
私たちのフレームワークでは、クライアントはお互いに軽量なヘッドモデルを直接交換します。
我々は,複数の医療課題に関する枠組みを検証し,その手法が明らかに最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:16:16 GMT)
Decouple-Then-Merge: Finetune Diffusion Models as Multi-Task Learning [45.9] 拡散モデルは、ノイズ破損の各ステップを反転させる一連のモデルを学ぶことで訓練される。
パラメータはトレーニング効率を高めるために、複数のタイムステップで完全に共有されます。
しかし、デノナイジングタスクは各タイミングで異なるため、異なるタイミングで計算された勾配は相反する可能性があり、画像生成の全体的な性能を低下させる可能性がある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:54:17 GMT)
Do Not Trust Licenses You See: Dataset Compliance Requires Massive-Scale AI-Powered Lifecycle Tracing [45.7] 本稿では,データセットの法的リスクは,ライセンス条項だけでは正確に評価できないことを論じる。
データセットの再配布と完全なライフサイクルの追跡が不可欠である、と同社は主張する。
我々は、AIが人間の専門家よりも高い精度、効率、コスト効率でこれらのタスクを実行できることを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:58:30 GMT)
Bridging wire and gate cutting with ZX-calculus [45.2] 理想的大域的ユニタリの分解は、ZX-計算を拡大して図式的に得られることを示す。
我々は、マルチキュービット制御Z(MCZ)ゲートの分解を、任意の数のキュービットとパーティションに対して$3$に等しい1$ノルムで改善した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:20:47 GMT)
Color Matching Using Hypernetwork-Based Kolmogorov-Arnold Networks [45.0] cmKANはカラーマッチングのための多用途フレームワークである。
我々は、KAN(Kolmogorov-Arnold Networks)を用いて、ソースとターゲットの分布間の色マッチングをモデル化する。
2つの異なるカメラで撮影されたペア画像の大規模なデータセットを初めて紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:17:19 GMT)
Generative AI in Transportation Planning: A Survey [44.6] 我々は、交通計画においてGenAIを活用するための最初の包括的枠組みを提示する。
交通計画の観点から, 記述的, 予測的, 生成的, シミュレーション, 説明可能なタスクの自動化におけるGenAIの役割を検討する。
データ不足、説明可能性、バイアス軽減、ドメイン固有の評価フレームワークの開発など、重要な課題に対処する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:56:22 GMT)
Taming Knowledge Conflicts in Language Models [44.4] 言語モデル(LM)は、パラメトリックメモリが文脈的知識と矛盾する場合、しばしば知識の衝突に遭遇する。
我々は「文脈情報とパラメトリックメモリの重畳」と表現し、高い影響力を持つアテンションヘッドは、記憶とコンテキストの両方に同時に寄与することができる。
実験時の注意介入手法であるJust Run Twice(JUICE)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:45:00 GMT)
V$^2$Dial: Unification of Video and Visual Dialog via Multimodal Experts [44.3] V$2$Dialは、マルチモーダルな会話タスクのための画像とビデオの入力データを同時に扱うための、エキスパートベースの新しいモデルである。
本稿では,画像とビデオの空間的特徴と時間的特徴を共同で学習する単一モデルを用いて,両方のタスクを統合することを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:29:29 GMT)
Compositional Generative Model of Unbounded 4D Cities [44.2] 本研究では,4次元都市を創出するのに適した構成生成モデルを提案する。
CityDreamer4Dは、インスタンス編集、都市スタイル化、都市シミュレーションなど、さまざまなダウンストリームアプリケーションをサポートしている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:54:19 GMT)
Industrial-Grade Sensor Simulation via Gaussian Splatting: A Modular Framework for Scalable Editing and Full-Stack Validation [43.9] センサシミュレーションは、自律運転システムのスケーラブルな検証に重要である。
既存のNeural Radiance Fields (NeRF)ベースの手法は、産業における適用性と効率性の課題に直面している。
本稿では,これらの課題に対処するため,ガウススプラッティング(GS)に基づくシステムを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:10:22 GMT)
Hierarchical Mixture of Experts: Generalizable Learning for High-Level Synthesis [43.6] 高レベル合成(HLS)は、FPGA(Field Programmable Gate Array)の設計において広く使われているツールである。
よりドメイン一般化可能なモデル構造として, 2段階の階層的エキスパート混合(MoE)を提案する。
低レベルのMoEでは、ノード、基本ブロック、グラフの3つの自然な粒度にMoEを適用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:31:59 GMT)
Joint Training And Decoding for Multilingual End-to-End Simultaneous Speech Translation [43.5] エンドツーエンド音声翻訳(ST)に関する最近の研究は,複数言語間STとエンドツーエンド同時STの探索を円滑に進めている。
実シナリオにおけるアプリケーションに近い一対多の多言語設定におけるエンドツーエンドの同時音声翻訳について検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:45:46 GMT)
PREAMBLE: Private and Efficient Aggregation of Block Sparse Vectors and Applications [43.0] プリオのような2サーバシステムにおける高次元ベクトルの安全なアグリゲーションの問題を再考する。
PreAMBLEは分散ポイント関数の新たな拡張であり、通信効率と計算効率のよいアグリゲーションを可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:58:15 GMT)
On the Impact of Uncertainty and Calibration on Likelihood-Ratio Membership Inference Attacks [42.2] 我々は,情報理論の枠組みにおける可能性比攻撃(LiRA)の性能を解析する。
我々は、MIAの有効性に対する不確実性と校正の影響についての洞察を提供することを目的として、MIA敵の利点に基づいて境界を導出する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:13:46 GMT)
Linear response theory for cavity QED materials at arbitrary light-matter coupling strengths [41.9] 我々は,光物質結合のすべての条件において有効であるキャビティに結合した材料に対する線形応答理論を開発した。
熱グリーン関数を得るための2つの異なるアプローチを比較する。
我々は、閉可解方程式系を得るために、高階グリーン関数の平均場分離を用いる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:16:25 GMT)
Bound polariton states in the Dicke-Ising model [41.9] キャビティQED材料におけるハイブリッド光物質励起の研究について述べる。
熱力学限界における系の正確な励起を導出する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:57:33 GMT)
Open3DVQA: A Benchmark for Comprehensive Spatial Reasoning with Multimodal Large Language Model in Open Space [41.2] オープンな3次元空間における最先端基礎モデル(SOTA)の空間的推論能力を包括的に評価する新しいベンチマークOpen3DVQAを提案する。
Open3DVQAは9kのVQAサンプルで構成され、高忠実度都市シミュレーターにおける効率的な半自動ツールを用いて収集される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:35:38 GMT)
Broaden your SCOPE! Efficient Multi-turn Conversation Planning for LLMs using Semantic Space [40.9] 本稿では,効率を向上したセマンティック空間会話計画(SCOPE)という新しい手法を提案する。
SCOPEは会話の密接なセマンティック表現を利用して効率的に会話計画を行う。
その結果、SCOPEは従来のシミュレーションベースの計画アルゴリズムの70倍の速さで会話計画を行うことができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:55:46 GMT)
High-fidelity entanglement between a telecom photon and a room-temperature quantum memory [40.7] 既存の通信インフラによる絡み合い分布は、大規模量子ネットワークの実現に不可欠である。
我々は、テレコム波長(1324nm)の光子と、90.2%の忠実度を持つ室温量子メモリとの絡み合いを示すことで、量子リピータアーキテクチャにおける重要なマイルストーンを報告した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:32:59 GMT)
VXP: Voxel-Cross-Pixel Large-scale Image-LiDAR Place Recognition [40.6] クロスモーダル位置認識法は、様々な環境条件とセンサー設定下での柔軟なGPS代替品である。
本稿では,新しいカメラ対LiDAR位置認識フレームワークであるVoxel-Cross-Pixel(VXP)を提案する。
VXPは、自制的なローカル類似性を強制し、画像からグローバルなコンテキストとLiDARスキャンを共有機能空間に効果的に導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:46:18 GMT)
Online Test-time Adaptation for 3D Human Pose Estimation: A Practical Perspective with Estimated 2D Poses [40.2] 3次元人間のポーズ推定のためのオンラインテスト時間適応は、トレーニングデータとは異なるビデオストリームに使用される。
地上の真理2Dポーズは適応に使用されるが、実際に利用できるのは推定2Dポーズのみである。
本稿では、推定2次元ポーズによるストリーミングビデオへの適応モデルについて述べる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:41:55 GMT)
V-STaR: Benchmarking Video-LLMs on Video Spatio-Temporal Reasoning [40.2] これらの問題点に対処するために,ビデオS-テンポラル推論(V-STa)ベンチマークを導入する。
我々は,ビデオLLMの時空間推論プロセスを実現するためのデータセットを構築した。
14のビデオ-LLMによる実験では、現在のビデオ-LLMと、堅牢で一貫性のある推論の必要性の間に大きなギャップが示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:21:44 GMT)
Prof. Robot: Differentiable Robot Rendering Without Static and Self-Collisions [40.2] 本稿では, ロボット衝突分類器の学習を通じて, 衝突に対する身体的意識を組み込むことにより, これまでの取り組みに新たな改善を加える。
これにより、ロボット自体と同様に、静的で非操作可能な環境との衝突を避けるアクションの最適化が可能になる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:25:54 GMT)
Local Pan-Privacy for Federated Analytics [40.1] 我々は、地方国家に対する未発表の侵入を繰り返してプライバシーを保持すべき地域の汎民権について研究する。
合理的な制約の下では、侵入下での情報理論上の差分プライバシーを提供することはテレメトリ情報の収集と相容れないことを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:18:33 GMT)
Towards a Unified Copernicus Foundation Model for Earth Vision [39.5] 我々は3つの重要な構成要素を持つ次世代地球観測基盤モデルに向けて一歩前進する。
コペルニクス・プレトレイン(Copernicus-Pretrain)は、コペルニクス・センチネルの全ミッションの18.7Mのアライメント画像を統合する大規模な事前トレーニングデータセットである。
コペルニクスFM(Copernicus-FM)は、スペクトルまたは非スペクトルセンサーのモダリティを処理できる統一基盤モデルである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:16:48 GMT)
LLaVA-MLB: Mitigating and Leveraging Attention Bias for Training-Free Video LLMs [38.7] トレーニングフリー言語モデル(LLM)は、事前訓練されたイメージLLMを活用して、さらなるトレーニングを必要とせずにコンテンツを処理する。
このようなアプローチにおける鍵となる課題は、画像LLMのトークン制限によって制約される重要な視覚的・時間的情報を維持することの難しさである。
画像LLMアテンションスコアに基づいて,クエリ関連トークンを選択するための2段階の手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:49:52 GMT)
Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers [38.6] State-of-the-the-art transformer-based large multimodal model (LMM)は、1時間のビデオ入力を扱うのに苦労する。
我々は,ビデオトークンを線形複雑にエンコードするために,Mamba-2ブロックを用いたハイブリッドMamba-Transformerモデル(VAMBA)を構築した。
VAMBAは、トレーニングと推論中のGPUメモリ使用量の少なくとも50%削減を実現し、トレーニングステップあたりの速度をほぼ2倍にします。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:45:23 GMT)
A transfer learning framework for weak-to-strong generalization [38.6] LLMを超人的能力と整合させることが、その能力を劣化させることなく可能であるかどうかは不明である。
これは弱強一般化問題の例である。
我々は、事前学習されたLLMから潜在知識を引き出すことにより、弱強一般化が可能であることを証明した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:08:22 GMT)
FastVID: Dynamic Density Pruning for Fast Video Large Language Models [38.3] 我々は,FastVIDと呼ばれる高速ビデオLLMのための動的密度計算法を提案する。
FastVIDは、ビデオを時間的に順序付けられたセグメントに分割して、時間構造を保存し、重要な視覚情報を維持するために密度ベースのトークンプルーニング戦略を適用する。
本手法は時間的・視覚的整合性を維持しながら計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:33:08 GMT)
New Trends for Modern Machine Translation with Large Reasoning Models [37.8] 大規模推論モデル(LRM)の最近の進歩は,機械翻訳(MT)の新たな可能性を開いた。
このポジションペーパーは、LRMが従来のニューラルMTとLLMベースのMTパラダイムを実質的に変換したと主張している。
我々は、LRMの翻訳システムはテキストコンバータだけでなく、テキストを超えて意味を推論できる多言語認知エージェントであると考えている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:09:34 GMT)
MEET: A Million-Scale Dataset for Fine-Grained Geospatial Scene Classification with Zoom-Free Remote Sensing Imagery [37.6] ミリスケールフィンエグルーフ地理空間分類データ(MEET)について紹介する。
MEETには1030万以上のズームなしリモートセンシングシーンサンプルが含まれており、手動で80の細かいカテゴリに注釈付けされている。
シーン・イン・シーン分類の課題に挑戦するために、コンテキスト・アウェア・トランスフォーマー(CAT)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:10:45 GMT)
How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook [37.5] 時系列分析(TSA)は、データマイニングコミュニティにおいて長年研究されてきたトピックであり、現実世界において大きな意味を持つ。
最近のTSA研究は、新しい研究分野、すなわち、TSAのためのMultiple Modalities(MM4TSA)を形成している。
この調査は、この新興分野の総合的なレビューと詳細な展望を提供する最初のものだ。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:56:57 GMT)
BACE-RUL: A Bi-directional Adversarial Network with Covariate Encoding for Machine Remaining Useful Life Prediction [35.8] 本稿では,RUL予測のための双方向適応・健康管理(PHM)フレームワークを提案する。
提案モデルは一般的なフレームワークであり、最先端の手法より優れている。
ターボファン航空機エンジンのデータセットを含む実世界のいくつかのデータセットの実験は、提案モデルが一般的なフレームワークであり、最先端の手法よりも優れていることを示している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:56:40 GMT)
Dynamic-Width Speculative Beam Decoding for Efficient LLM Inference [35.7] 大規模言語モデル(LLM)は多くの実世界のタスクで優れたパフォーマンスを示している。
投機的復号化は有望な解決策として現れ、より小さな補助モデルを利用して将来のトークンをドラフトしている。
本稿では,ビームサンプリングによる投機的復号化の新たな統合について検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:18:50 GMT)
Are formal and functional linguistic mechanisms dissociated? [35.5] 大きな言語モデル(LLM)は、流動的で文法的なテキストを生成するのに優れるが、機能的な言語的タスクには耐え難い。
最近の研究は、形式的および機能的な言語的タスクを成功させるために、LLMはそれぞれ異なるメカニズムを使うべきであることを示唆している。
形式的タスクと機能的タスクの回路間の重なりは実際にほとんどないが、形式的言語的タスク間の重なりもほとんどない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:11:03 GMT)
Implicit Word Reordering with Knowledge Distillation for Cross-Lingual Dependency Parsing [35.4] 知識蒸留(IWR-KD)を用いた暗黙の単語並べ替えフレームワークを提案する。
このフレームワークは、深いネットワークが意味のあるデータ変換に対応する特徴線形化を学習するのに長けている。
本稿では,31言語にまたがるUniversal Dependency Treebankの手法を検証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:32:01 GMT)
API Agents vs. GUI Agents: Divergence and Convergence [35.3] APIとGUIベースの大規模言語モデル(LLM)は、グラフィカルなユーザインターフェースを人間的な方法で操作する。
本稿では,それらの分散と潜在的収束を系統的に解析する。
LLMベースの自動化における継続的なイノベーションは、APIとGUI駆動エージェントの境界線を曖昧にする可能性があることを示唆している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:26:21 GMT)
Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity [35.1] HIVAU-70kは、あらゆる粒度の階層的ビデオ異常理解のためのベンチマークである。
高品質なアノテーションを効率よくスケールする半自動アノテーションエンジンを開発した。
長ビデオにおける効率的な異常検出のために,Anomaly- Focus Temporal Samplerを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:23:06 GMT)
Leveraging Angle of Arrival Estimation against Impersonation Attacks in Physical Layer Authentication [35.1] 我々は、ロバスト物理層認証(PLA)の特徴として、到着角(AoA)の利用について検討する。
AoAをベースとしたPLAを標的とした偽装攻撃は、攻撃者の位置情報とハードウェア能力に関する厳密な条件下でのみ実現可能であることを実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:29:55 GMT)
Generation of Coherent Quantum Light from a Single Impurity-Bound Exciton [35.1] II-VI直接バンドギャップ半導体における不純物結合励起子は、光学活性な固体スピン量子ビットを約束する。
共振駆動された単一不純物結合エキシトンからの量子光のコヒーレント光放射をSeSeで実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:29:34 GMT)
Realizing a Continuous Set of Two-Qubit Gates Parameterized by an Idle Time [35.0] 連続ゲートセットは、短期量子アルゴリズムの鍵となる要素である。
トランスモン量子ビットに作用する制御された任意の位相ゲートのハードウェア効率,連続的な集合を実証する。
このネイティブゲートセットは、深さを減らし、短期量子アルゴリズムの性能を向上させる可能性がある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:49:47 GMT)
FLASHμ: Fast Localizing And Sizing of Holographic Microparticles [34.8] 我々は,2段階のニューラルネットワークアーキテクチャFLASH$mu$を提案し,最大20cmの試料深度を持つホログラムから微小粒子を検出する。
本手法は, 実ホログラムの少なくとも9$mu$mの粒子を確実に検出する。
非局所物体検出や信号デミキシング問題への新しいアプローチの導入に加えて、低コストでリアルタイムなホログラフィー画像設定を可能にした。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:04:10 GMT)
ChartMoE: Mixture of Diversely Aligned Expert Connector for Chart Understanding [34.8] 本稿では,従来の線形プロジェクタを置き換えるためにMixture of Expert (MoE)アーキテクチャを利用するChartMoEを提案する。
具体的には、異なるアライメントタスクを通じて複数の線形コネクタをトレーニングする。
また、3つのアライメントタスクを実行するために、100万近いチャートテーブル-JSON-コードの四倍数を持つデータセットであるChartMoE-Alignも導入しました。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:19:00 GMT)
VERIFY: A Benchmark of Visual Explanation and Reasoning for Investigating Multimodal Reasoning Fidelity [34.3] VERIFYは最先端MLLMの視覚的推論能力を分離し、厳格に評価するために設計されたベンチマークである。
それぞれの問題には人手による推論パスが伴い、モデル決定プロセスの詳細な評価を初めて提供する。
本稿では,従来のモデル推論パターンにおける重要な不均衡を浮き彫りにして,単なる精度を超える視覚的推論の忠実さを評価する新しい指標を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:26:11 GMT)
ParGo: Bridging Vision-Language with Partial and Global Views [34.2] マルチモーダル大言語モデル(MLLM)のビジョンと言語モダリティを接続する新しい部分言語プロジェクタであるParGoを紹介する。
グローバルアテンションベースのプロジェクタに依存する従来の作業とは異なり、ParGoは個別に訓練された視覚エンコーダとLLMの間の表現ギャップを橋渡しします。
実験の結果,ParGoは他のプロジェクタよりも優れており,特に知覚能力の細部を重視したタスクでは顕著に優れていた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:48:51 GMT)
Cerebrum (AIOS SDK): A Platform for Agent Development, Deployment, Distribution, and Discovery [33.9] CerebrumはAIOS用のエージェントSDKで、3つの重要なコンポーネント間のギャップに対処します。
エージェント開発のためのモジュール型の4層アーキテクチャを備えた包括的なSDK,(2)エージェントの共有と発見のためのコミュニティ主導のエージェントハブ,(3)エージェントのテストと評価のためのインタラクティブなWebインターフェース。
Cerebrumは、エージェント開発を標準化する統一されたフレームワークを提供しながら、研究者や開発者がエージェントを革新し、配布する柔軟性を維持しながら、この分野を前進させる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:29:17 GMT)
Perceive, Understand and Restore: Real-World Image Super-Resolution with Autoregressive Multimodal Generative Models [33.8] 我々は、自己回帰型マルチモーダルモデルLumina-mGPTを堅牢なReal-ISRモデル、すなわちPUREに適応する。
PUREは入力された低画質の画像を認識して理解し、高品質の画像を復元する。
実験により、PUREはリアルな細部を生成しながら、画像の内容を保存していることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:33:59 GMT)
Foundation Cures Personalization: Improving Personalized Models' Prompt Consistency via Hidden Foundation Knowledge [33.4] textbfFreeCureはパーソナライゼーションモデルの迅速な一貫性を改善するフレームワークである。
本稿では, 個人化プロセスに適切な属性情報をもたらすための, インバージョンベースのプロセスと合わせて, ファンデーションを意識した新たな自己意識モジュールを提案する。
FreeCureは、さまざまな最先端の顔のパーソナライゼーションモデルに対して、迅速な一貫性を顕著に向上させた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:22:49 GMT)
Rethinking Epistemic and Aleatoric Uncertainty for Active Open-Set Annotation: An Energy-Based Approach [32.8] アクティブラーニングは、オープンセットクラスの存在において重大な課題に直面している。
既存のメソッドは、既知のクラスに属する可能性のあるクエリ例を優先順位付けするか、あるいは、非常に不確実な予測を持つクラスのクエリに焦点を当てる。
本研究では,EUとAUを効果的に統合し,優れた性能を実現するための,エネルギーベースのアクティブオープンセットフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:32:24 GMT)
Don't Take Things Out of Context: Attention Intervention for Enhancing Chain-of-Thought Reasoning in Large Language Models [32.7] CoT (Few-shot Chain-of-Thought) は大規模言語モデル (LLM) の推論能力を著しく向上させる
我々は、COTのデモで分離されたセグメント、単語、トークンが、予期せずLCMの生成過程を乱す可能性があることを観察する。
デモの注意パターンを動的に解析し,これらのトークンを正確に識別するFew-shot Attention Intervention法(FAI)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:46:33 GMT)
Towards Extreme Pruning of LLMs with Plug-and-Play Mixed Sparsity [32.7] 既存のプルーニング手法は主に、プルーニングをガイドするネットワークコンポーネントの重要性を測定するためにメトリクスを設計することに焦点を当てている。
本稿では,FIM(Fiher Information Matrix)のトレースに基づく効率的な手法を提案する。
そこで本研究では,異なる層に対する最適スパシティレベルを決定するために,プルーニング指向の進化的アルゴリズム(EA)を用いたMixed Sparsity Pruning (MSP)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:05:49 GMT)
Closed-Loop Supervised Fine-Tuning of Tokenized Traffic Models [32.5] トークン化されたマルチエージェントポリシーは、最近、交通シミュレーションの最先端となっている。
それらは通常、オープンループのビヘイビアクローンによって訓練される。
簡単なクローズドループ微調整戦略であるTop-K(CAT-K)のロールアウトについて述べる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:11:40 GMT)
Concise and Organized Perception Facilitates Reasoning in Large Language Models [31.2] 推論に取り組むために大規模な言語モデル(LLM)をエクスプロイトすることは、注目を集めている。
複雑な論理的問題において満足な結果を達成することは依然として非常に困難であり、コンテキスト内の多くの前提とマルチホップ推論が特徴である。
本研究は,まず情報フローの観点からそのメカニズムを考察し,不規則な内容や無関係な内容を扱う際に,人間のような認知バイアスに類似した困難に直面することを明らかにする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:33:02 GMT)
MTV-Inpaint: Multi-Task Long Video Inpainting [31.0] ビデオの塗装は、ビデオ内の局所領域を変更し、空間的および時間的一貫性を確保する。
テキスト・ツー・ビデオ拡散モデル(T2V)の最近の進歩は、テキスト・ガイド・ビデオ・インペイントの道を開いた。
MTV-Inpaintは、従来のシーン補完と新しいオブジェクト挿入タスクの両方を扱えるマルチタスク・マルチタスク・インペインティング・フレームワークである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:54:10 GMT)
Limits of KV Cache Compression for Tensor Attention based Autoregressive Transformers [30.8] 自己回帰変換器におけるキー値キャッシュは、推論中に重大なボトルネックを示す。
我々の研究は、テンソルアテンションバージョンによる空間複雑性障壁を一般化する。
全体として、我々の研究はテンソルアテンション機構における圧縮-表現性トレードオフを理解するための理論的基盤を提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:01:42 GMT)
RectifiedHR: Enable Efficient High-Resolution Image Generation via Energy Rectification [30.7] 拡散モデルの性能は、トレーニング期間中に使用した画像よりも解像度の高い画像を生成するときに低下する。
我々は、トレーニング不要な高解像度画像生成のための効率的なソリューションであるRectifiedHRを提案する。
本手法は完全にトレーニング不要で,シンプルな実装ロジックと効率的な性能を備えている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:40:17 GMT)
Active Learning from Scene Embeddings for End-to-End Autonomous Driving [30.7] エンドツーエンドのディープラーニングモデルのトレーニングには、大量のラベル付きデータが必要です。
本稿では,SEADと呼ばれるベクトル化シーンレベルの特徴に依存する能動的学習フレームワークを提案する。
実験によると、完全なデータセットで達成できることに近いパフォーマンスを達成するには、nuScenesトレーニングデータの30%しか必要ありません。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:56:22 GMT)
Lifelong Knowledge Editing for LLMs with Retrieval-Augmented Continuous Prompt Learning [30.6] 本稿では,生涯学習における編集効率と推論効率を向上させるために,ContInuous Prompt lEarning法であるRECIPEを紹介する。
RECIPEはまず、知識文をLLMの入力クエリの埋め込みにプレフィックスした、短くて情報的な連続的なプロンプトに変換する。
さらに、動的しきい値を計算するために仲介役として機能する知識センチネル(KS)を統合する。
我々のレトリバーとプロンプトエンコーダは、信頼性、一般性、局所性といった編集特性を達成するために共同で訓練されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:56:58 GMT)
DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation [30.5] テキスト・画像生成のための拡散変換器(DiT)について検討する。
PixArt や MMDiT などの DiT ベースのアーキテクチャを評価し,標準的な DiT アーキテクチャと比較する。
監督と報酬の微調整により、DiT-AirはGenEvalとT2I CompBenchで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:01:10 GMT)
V2Edit: Versatile Video Diffusion Editor for Videos and 3D Scenes [29.8] V$2$Editは、インストラクション誘導ビデオと3Dシーン編集のためのトレーニング不要のフレームワークである。
複雑な編集タスクを単純なサブタスクに分解するプログレッシブ戦略を導入する。
V$2$Edit を "render-edit-reconstruct" プロセスで 3D シーン編集に拡張し,高品質な 3D 一貫性のある編集を可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:26:06 GMT)
Technologies on Effectiveness and Efficiency: A Survey of State Spaces Models [29.8] ステートスペースモデル(SSM)は、人気のあるトランスフォーマーベースのモデルに代わる有望な代替品として登場した。
SSMはシーケンシャルなデータやより長いコンテキストを持つタスクに優れ、高い効率で同等のパフォーマンスを誇示する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:20:31 GMT)
D3: Diversity, Difficulty, and Dependability-Aware Data Selection for Sample-Efficient LLM Instruction Tuning [29.0] 小型で高品質なデータセットは、命令追従機能を備えた大きな言語モデルを提供することができる。
スコアリングと選択の2つの重要なステップからなるD3法を提案する。
3つのデータセットの実験では、競争力のある、あるいは優れた命令追従能力を持つLLMを実現する上で、D3の有効性が示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:28:19 GMT)
Rethinking Few-Shot Adaptation of Vision-Language Models in Two Stages [28.8] FSA(Few-Shot Adaptation)では、データは大量のパラメータに適合するには不十分であり、上記の非現実的である。
このスキームを2段階Few-Shot Adaptation (2SFS)と呼ぶ。
2SFS は最先端の手法と一致しているか,あるいは超越しているかを示す一方で,確立された手法は設定によって著しく劣化することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:24:01 GMT)
Image-Goal Navigation Using Refined Feature Guidance and Scene Graph Enhancement [28.7] 本稿では, RFSG という新しい画像ゴールナビゲーション手法を提案する。
私たちの焦点は、限られた画像データ内の目標、観測、環境の間のきめ細かいつながりを活用することにあります。
本研究では,ネットワークが多次元特徴の重要性を学習し,目標と観測特徴を融合させる空間チャネルアテンション機構を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:15:24 GMT)
Advanced Deep Learning Methods for Protein Structure Prediction and Design [28.6] タンパク質構造予測と設計に応用した高度な深層学習手法を包括的に検討する。
テキストは、構造生成、評価指標、多重シーケンスアライメント処理、ネットワークアーキテクチャを含む重要なコンポーネントを分析する。
予測精度を向上し、深層学習技術と実験的検証を統合するための戦略を徹底的に検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:28:29 GMT)
TransiT: Transient Transformer for Non-line-of-sight Videography [28.6] 高速スキャンによるリアルタイムNLOS回復を実現するために,TransiTと呼ばれる新しいトランスフォーマーアーキテクチャを提案する。
TransiTは入力トランジェントの時間次元を直接圧縮して特徴を抽出し、計算コストを削減し、高いフレームレート要求を満たす。
実際の実験では、TransiTは1点当たり0.4msの露光時間で測定された16倍16$の粗いトランジェントからNLOSビデオの6.4倍64$の解像度で毎秒10フレームの解像度で再構成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:56:37 GMT)
SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training [28.6] In-the-wild hand image を用いた3次元手ポーズ推定の事前学習のためのフレームワークを提案する。
特徴空間に類似したペアを埋め込む新しいコントラスト学習法を提案する。
実験により,本手法が従来のコントラスト学習手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:54:56 GMT)
Towards Few-Call Model Stealing via Active Self-Paced Knowledge Distillation and Diffusion-Based Image Generation [28.4] そこで本研究では,ブラックボックスの分類モデルを,トレーニングデータやアーキテクチャ,重みなどにアクセスせずにコピーすることを提案する。
蒸留時にプロキシデータを最大限に活用するために,新たなアクティブなセルフペース学習フレームワークを採用している。
3つのデータセットに対する実験結果から, ファスコールモデル抽出シナリオにおける4つの最先端手法よりも, フレームワークの優位性が確認された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:52:55 GMT)
Beyond Tree Models: A Hybrid Model of KAN and gMLP for Large-Scale Financial Tabular Data [28.3] TKGMLPは、浅いコルモゴロフ・アーノルドネットワークとGated Multilayer Perceptronを組み合わせた表型データのためのハイブリッドネットワークである。
我々は、TKGMLPを現実の信用スコアデータセットで検証し、最先端の結果を達成し、現在のベンチマークより優れています。
本稿では,財務データセットにおける数値的特徴の優位性に対処するために,数値的データのための新しい特徴符号化手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:13:20 GMT)
Cognitive Disentanglement for Referring Multi-Object Tracking [28.3] Referring Multi-Object Tracking (RMOT)は、言語参照に基づくビデオシーケンス内の特定のオブジェクトのローカライズと追跡を含む。
既存のRMOTアプローチは、言語記述を総体的な埋め込みとして扱うことが多く、言語表現に含まれるリッチな意味情報を視覚的特徴と効果的に統合するのに苦労する。
本稿では,人間の視覚処理システムからRMOTタスクへの"What"と"where"経路を適応させるマルチオブジェクト追跡のための認知的遠方性フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:21:54 GMT)
MoVE-KD: Knowledge Distillation for VLMs with Mixture of Visual Encoders [28.2] 視覚エンコーダは視覚言語モデル(VLM)の基本コンポーネントである
近年の研究では、複数のエンコーダを単一のVLMに組み込んでおり、計算コストが大幅に増大している。
本稿では、複数の視覚エンコーダのユニークな習熟度を1つの効率的なエンコーダモデルに抽出する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:52:36 GMT)
Brain Effective Connectivity Estimation via Fourier Spatiotemporal Attention [28.2] 時間的・空間的注意(FSTA-EC)に基づく脳能動接続推定法を提案する。
FSTA-ECは、フーリエの注意と注意を組み合わせて、fMRIデータからシリーズ間(時間的)のダイナミックスとシリーズ内(時間的)の依存関係を同時にキャプチャする。
シミュレーションおよびリアルタイムfMRIデータセットの実験結果から,提案手法は最先端の手法と比較して優れた性能を示すことが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:41:27 GMT)
Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization [28.1] FlowMoは、複数の圧縮速度で画像トークン化のための新しい最先端技術を実現するトランスフォーマーベースの拡散オートエンコーダである。
重要な洞察は、FlowMoトレーニングは、トレーニング前段階とトレーニング後段階に分割されるべきであるということです。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:49:17 GMT)
Diorama: Unleashing Zero-shot Single-view 3D Indoor Scene Modeling [27.6] ダイオラマ(Diorama)は、単視点のRGB観測から3Dシーンをモデル化する世界初のゼロショットオープンワールドシステムである。
この問題をサブタスクに分解し、それぞれに堅牢で一般化可能な解を導入することで、我々のアプローチの実現可能性を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:54:30 GMT)
Distilling Diversity and Control in Diffusion Models [27.4] 蒸留拡散モデルには限界があり、サンプルの多様性は基本モデルと比べて減少する。
この多様性の喪失にもかかわらず、蒸留されたモデルは基本モデルの基本的な概念表現を維持していることを示す。
多様性蒸留は, 基本モデルを, 効率の良い蒸留モデルに移行する前に, 第一臨界段階のみに戦略的に活用するハイブリッド推論手法である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:11:59 GMT)
Remote Photoplethysmography in Real-World and Extreme Lighting Scenarios [26.9] リモート光ポモグラフィーのためのエンド・ツー・エンドの教師付きモデルを提案する。
複雑で未知の外部の時間変化の干渉を排除しようとする。
これは、実際の屋外の自然顔ビデオのための最初の堅牢なrモデルである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:50:58 GMT)
Auditing language models for hidden objectives [26.9] 本研究では,アライメント監査の実施可能性について検討する。
テストベッドとして、私たちは、隠れた目的を持った言語モデルをトレーニングします。トレーニングパイプラインはまず、RLHF報酬モデル(RM)の悪用可能なエラーについてモデルを教えます。
まず、4つのチームがモデルの隠れた目的やトレーニングを知らず、行動やその原因について調査する、盲目な監査ゲームを実施します。
3つのチームが、テクニックを含むテクニックを使って、モデルの隠れた目的を明らかにすることに成功した
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:21:15 GMT)
Harnessing Frequency Spectrum Insights for Image Copyright Protection Against Diffusion Models [26.8] 本稿では,拡散生成画像がトレーニングデータの統計的特性を忠実に保存していることを示す。
emphCoprGuardは、許可されていない画像の使用を防ぐための堅牢な周波数領域透かしフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:27:50 GMT)
LLaVA-Octopus: Unlocking Instruction-Driven Adaptive Projector Fusion for Video Understanding [26.5] LLaVA-Octopusは、ユーザ指示に基づいて異なる視覚プロジェクタの機能を適応的に重み付けする。
LLaVA-Octopusは複数のベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:29:54 GMT)
Unlocking Open-Set Language Accessibility in Vision Models [26.3] オープンセットのテキストクエリでアクセスできるように,任意の視覚分類器を書き換える,シンプルかつ強力な手法を提案する。
我々のアプローチはラベルフリーで効率的であり、基礎となる分類器の分布と推論プロセスを保存する。
1)ラベルのない概念ボトルネックモデルとゼロショットの概念ボトルネックモデルの両方を構築し、従って任意の分類器を本質的に解釈可能なものにし、2)視覚的特徴のゼロショットデコーディングを自然言語に変換する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:04:38 GMT)
InverseBench: Benchmarking Plug-and-Play Diffusion Priors for Inverse Problems in Physical Sciences [25.8] 我々は,5つの科学的逆問題にまたがる拡散モデルを評価するフレームワークであるtextscInverseBenchを紹介する。
これらの問題には、既存のベンチマークとは異なるユニークな構造上の課題が存在する。
我々は、強力なドメイン固有のベースラインに対して、プラグ・アンド・プレイ拡散プリミティブを使用する14の逆問題アルゴリズムをベンチマークする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:13:55 GMT)
GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior [25.7] テキストと画像のプロンプトから現実的な3D人物を識別する2段階のフレームワークを提案する。
私たちの中核となる洞察は、人中心の知識を活用して生成プロセスを促進することです。
実験により、ガウシアンIPは視覚的品質とトレーニング効率の両方で既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:16:43 GMT)
From Denoising Score Matching to Langevin Sampling: A Fine-Grained Error Analysis in the Gaussian Setting [25.2] 本稿では,Langevin 拡散サンプリング装置を用いて,単純だが代表的な設定でサンプリング過程を解析する。
We show that the Wasserstein sample error can be expressed as a kernel-type norm of the data power spectrum。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:35:00 GMT)
Exploring the Potential of Large Multimodal Models as Effective Alternatives for Pronunciation Assessment [25.1] 大規模マルチモーダルモデル(LMM)は、幅広い領域で例外的な性能を示している。
本稿では、発音評価タスクにおけるその可能性について検討し、特に生成事前学習変換器(GPT)モデルの性能評価に焦点をあてる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:26:07 GMT)
The time scale of redundancy between prosody and linguistic context [25.1] 従来の研究では、韻律的特徴は過去と将来の両方の単語と大きな冗長性を示すことが示されている。
このスケールは過去と将来の言葉で異なります。
本研究は,効率的なコミュニケーションを形成する上での韻律の役割を強調した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:48:23 GMT)
Addressing Information Loss and Interaction Collapse: A Dual Enhanced Attention Framework for Feature Interaction [24.9] TransformerはCTR予測のための機能相互作用において重要なアプローチであることが証明され、以前の研究でかなりの成功を収めた。
本稿では,デュアル・エンハンスメント・アテンション(Dual Enhanced Attention)と呼ばれる機能インタラクションのためのデュアル・アテンション・フレームワークを提案する。
このフレームワークは、Combo-IDアテンション機構と崩壊回避アテンション機構という2つのアテンションメカニズムを統合している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:31:03 GMT)
Challenging Assumptions in Learning Generic Text Style Embeddings [24.6] 本研究は,スタイル中心のタスクに不可欠な汎用的な文レベルスタイルの埋め込みを作成することで,そのギャップを解消する。
我々のアプローチは、低レベルのテキストスタイルの変更が高レベルのスタイルを構成することができるという前提に基づいています。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:21:37 GMT)
Falcon: A Remote Sensing Vision-Language Foundation Model [24.6] 本稿では,リモートセンシングに適した総合的視覚言語基盤モデルであるFalconを紹介する。
Falconは、包括的で複雑なリモートセンシングタスクを効果的に実行する、統一的でプロンプトベースのパラダイムを提供する。
Falconは、画像分類、オブジェクト検出、セグメンテーション、画像キャプションなど、14の異なるタスクにわたるテキスト形式で印象的な結果を生成することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:27:01 GMT)
Navigable Graphs for High-Dimensional Nearest Neighbor Search: Constructions and Limits [24.6] グラフが任意の開始ノードから任意のターゲットノードへの移動に成功すれば、グラフはナビゲート可能である。
アプリケーションにとって重要な問題は、スペーサーグラフを構築することができるかどうかである。
任意の次元において、任意の距離関数に対して、平均次数$O(sqrtn log n )$の任意の$n$点に対してナビゲート可能なグラフを構築するための単純かつ効率的な方法を与える。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:01:23 GMT)
EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks [24.4] EmbodiedVSR (Embodied Visual Space Reasoning) は動的シーングラフ誘導型Chain-of-Thought (CoT)推論を統合する新しいフレームワークである。
本手法はタスク固有の微調整なしでゼロショット空間推論を可能にする。
実験により,我々のフレームワークは,既存のMLLM法よりも精度と推論コヒーレンスにおいて優れていることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:06:07 GMT)
LLMs are Bug Replicators: An Empirical Study on LLMs' Capability in Completing Bug-prone Code [24.0] 大規模言語モデル(LLM)は、コード補完において顕著なパフォーマンスを示している。
本稿では,LLMがバグ発生コードを完成させる際の性能を評価するための,最初の実証的研究について述べる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:48:38 GMT)
MAVFlow: Preserving Paralinguistic Elements with Conditional Flow Matching for Zero-Shot AV2AV Multilingual Translation [23.9] ゼロショット音声・視覚翻訳のための条件付きフローマッチング(CFM)モデルを提案する。
マルチモーダルガイダンスをCFMで活用することにより,話者固有の特徴を頑健に保存する。
顔情報に基づく高品質なメル-スペクトログラムの含有を実証的に示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:48:43 GMT)
Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-tuning [23.7] 視覚言語モデル(VLM)は多モード入力を用いた生成モデルにおいて顕著な進歩を遂げている。
現在のアライメント戦略は、キュレートされたデータセットによる監視された安全性の微調整に依存している。
教師付き微調整は,表面テクスチャパターンと安全応答の急激な相関を必然的に強化することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:52:08 GMT)
PTDiffusion: Free Lunch for Generating Optical Illusion Hidden Pictures with Phase-Transferred Diffusion Model [23.5] 隠れアート合成のための新しいトレーニングフリーなテキスト誘導画像変換フレームワークである textbfPhase-textbfTransferred textbfDiffusion Model (PTDiffusion) を提案する。
PTDiffusionは、入力参照画像をテキストプロンプトによって記述された任意のシーンに埋め込み、参照画像の隠れビジュアルキューを表示する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:09:38 GMT)
LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving [23.2] データ融合教師ネットワークへの幾何学的事前知識の注入は、実践的で、調査の少ない研究の道である。
本稿では,ロジット蒸留と特徴蒸留の両面での新たな貢献により,Learning to Infuse 'X' (LIX) フレームワークを紹介した。
本研究では,2つの新しい手法を含む適応型特徴蒸留法を開発した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:24:22 GMT)
Statistical Impossibility and Possibility of Aligning LLMs with Human Preferences: From Condorcet Paradox to Nash Equilibrium [23.0] 確率論的選好モデルの下では、コンドルセットサイクルは確率が指数関数的に高速に収束して存在することを示す。
我々は、混合戦略に必要かつ十分な条件、すなわち、他のすべての人たちよりも好まれる応答が欠如していることを特定します。
統計的結果から得られた知見を利用して,NLHF と LLM を整合する Nash 平衡を求める新しい計算効率の高いアルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:29:21 GMT)
X-EcoMLA: Upcycling Pre-Trained Attention into MLA for Efficient and Extreme KV Compression [23.0] MLA(Multi-head Latent attention)は、KVキャッシュメモリを低ランクキー値のジョイント圧縮により最適化するように設計されている。
モデル性能を損なうことなく、訓練精度を高め、MLAにおける極端なKVキャッシュ圧縮を可能にすることを実証した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:49:37 GMT)
Noise Synthesis for Low-Light Image Denoising with Diffusion Models [22.9] 低照度写真は、限られた光子による信号対雑音比の低い画像を生成する。
ディープラーニングの手法はうまく機能するが、取得には実用的でないペア画像の大規模なデータセットが必要である。
本稿では,低照度雑音の複雑な分布を捉える拡散モデルについて検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:16:54 GMT)
Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering [22.9] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を大幅に向上させることが示されている。
我々は、音声理解と推論において、特に音声質問応答(AQA)タスクに焦点を当てた一連のRL探索を行う。
実験ではMMAU Test-miniベンチマークで最先端の性能を示し,64.5%の精度を実現した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:43:53 GMT)
When Do Transformers Outperform Feedforward and Recurrent Networks? A Statistical Perspective [22.8] フィードフォワードとリカレントニューラルネットワークはトランスフォーマーに比べてサンプルの複雑さが大きいことが証明された。
提案したスパース検索モデルは,これらのアーキテクチャにおけるサンプルの複雑さの自然な階層構造を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:30:42 GMT)
Measuring Bias of Web-filtered Text Datasets and Bias Propagation Through Training [22.5] 大規模言語モデル(LLM)の事前学習データセットのバイアスについて,データセット分類実験により検討した。
ニューラルネットワークは、単一のテキストシーケンスが属するデータセットを驚くほどよく分類することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:07:45 GMT)
PromAssistant: Leveraging Large Language Models for Text-to-PromQL [22.4] 本稿では,広く使用されているメトリクス監視システムであるPrometheusが提供するメトリッククエリDSLであるPromQLに注目した。
本稿では,PromQLフレームワークであるPromAssistantを提案する。
PromAssistantは、メトリッククエリと分析のためのDSL生成フレームワークを開拓しました。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:57:16 GMT)
An Expanded Massive Multilingual Dataset for High-Performance Language Technologies [22.4] 高品質な多言語単言語コーパスと並列コーパスのコレクションであるHPLT v2を提案する。
データのモノリンガル部分は193言語をカバーする8Tトークンを含み、並列データは51言語をカバーする380万の文ペアを含む。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:48:23 GMT)
TxAgent: An AI Agent for Therapeutic Reasoning Across a Universe of Tools [22.3] TxAgentは、薬物相互作用、禁忌、患者固有の治療戦略を分析するAIエージェントである。
ToolUniverseは、1939年以降、FDAが承認したすべての薬物を含む信頼できる情報源から211のツールを統合する。
オープンエンドドラッグ推論タスクでは92.1%の精度で、GPT-4oを超え、構造化多段階推論ではDeepSeek-R1(671B)を上回っている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:28:15 GMT)
Cross-Modal Learning for Music-to-Music-Video Description Generation [22.3] 音楽-音楽-ビデオ(MV)生成は、音楽とビデオのモダリティに固有の違いがあるため、難しい課題である。
本研究では,MV記述生成タスクに着目し,包括的パイプラインを提案する。
新たに構築した音楽-MV記述データセット上で,既存の学習済みマルチモーダルモデルを微調整する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:34:28 GMT)
X-ray Made Simple: Lay Radiology Report Generation and Robust Evaluation [22.1] ラジオロジーレポート生成(RRG)はマルチモーダル生成モデルの開発で大きく進歩している。
既存の語彙ベースのメトリクスで高いパフォーマンスを持つRRGは、単なるミラージュです - モデルはレポートのテンプレートを学習することでのみ、高いBLEUを得ることができます。
本稿では,BLEUの膨らませた数を軽減し,より堅牢な評価を行うセマンティクスに基づく評価手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:44:32 GMT)
Text Compression for Efficient Language Generation [21.7] 本稿では,テキストを文埋め込みに圧縮することでテキスト生成が可能な階層型トランスフォーマー言語モデルを提案する。
実験の結果,GPTHFはFLOPの効率が最大で向上し,実行速度が3倍に向上することがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:14:05 GMT)
Quantum ensemble learning with a programmable superconducting processor [21.7] AdaBoost.Qは、古典的適応ブースティング(AdaBoost)アルゴリズムの量子適応である。
我々は,プログラム可能な超伝導プロセッサに対するアプローチの汎用性を実験的に実証した。
1万以上のテストサンプルに対して,10クラス分類タスクに対して86%以上の精度を達成し,1,564以上の量子特徴認識タスクに対して100%の精度を達成した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:30:34 GMT)
Evaluating System 1 vs. 2 Reasoning Approaches for Zero-Shot Time Series Forecasting: A Benchmark and Insights [21.7] 自己整合性は、最も効果的なテスト時の推論戦略として現れます。
グループ相対的な政策最適化は、訓練後の推論能力を高めるためにより適切なアプローチとして現れる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:16:53 GMT)
RTD-Lite: Scalable Topological Analysis for Comparing Weighted Graphs in Learning Tasks [21.5] 重み付きグラフの比較のためのトポロジ的手法は、大きなデータセット上での計算の非効率性に悩まされることが多い。
本稿では,トポロジ的特徴を効率的に比較するスケーラブルなアルゴリズムRTD-Liteを紹介する。
この効率性により、次元削減やニューラルネットワークトレーニングといったタスクに応用できる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:42:13 GMT)
Enhanced Multi-View Pedestrian Detection Using Probabilistic Occupancy Volume [21.4] 閉塞は、単一視点からの歩行者検出において重要な課題となる。
マルチビュー検出の最近の進歩は、地上面に特徴を戦略的に投影する早期融合戦略を利用した。
本稿では,従来の3次元再構築手法を有効活用し,より深い多視点歩行者検出を実現する新しいモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:05:44 GMT)
Constraint-Generation Policy Optimization (CGPO): Nonlinear Programming for Policy Optimization in Mixed Discrete-Continuous MDPs [21.2] CGPOは、表現力のある非線形力学を持つ多くのDC-MDPに対して、無限の範囲の初期状態に対する有界なポリシーエラーを保証する。
CGPOは、最悪の状態軌跡を生成して、政策上の欠陥を診断し、最適な行動の反実的な説明を提供する。
在庫管理,貯水池管理,物理制御など,各種分野におけるCGPOの適用性について実験的に検証した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:23:32 GMT)
PEMF-VTO: Point-Enhanced Video Virtual Try-on via Mask-free Paradigm [21.1] Video Virtual Try-onは、ビデオ内の対象人物に参照服をシームレスに転送することを目的としている。
既存の手法は通常、試着領域を定義するために塗装マスクに依存している。
そこで我々は,PEMF-VTO(Point-Enhanced Mask-Free Video Virtual Try-On)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:07:40 GMT)
Uncertainty-Aware Normal-Guided Gaussian Splatting for Surface Reconstruction from Sparse Image Sequences [21.1] 3D Gaussian Splatting (3DGS)は、新規なビュー合成において印象的なレンダリング性能を達成した。
3DGSパイプライン内の幾何的不確かさを定量化するために,不確かさを意識した正規誘導型ガウス格子(UNG-GS)を提案する。
UNG-GSはスパース配列と高密度シーケンスの両方で最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:18:12 GMT)
NF-SLAM: Effective, Normalizing Flow-supported Neural Field representations for object-level visual SLAM in automotive applications [21.0] 暗黙的な符号付き距離関数による3次元形状を表現する自動車アプリケーションのための視覚のみのオブジェクトレベルSLAMフレームワークを提案する。
私たちの重要なイノベーションは、正規化フローネットワークによる標準神経表現の増強です。
新たに提案されたアーキテクチャは、スパースデータとノイズデータのみの存在下での大幅な性能向上を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:46:56 GMT)
BOWL: A Deceptively Simple Open World Learner [20.9] 従来の機械学習は静的なベンチマークに優れていますが、現実の世界は動的であり、テストセットと同じくらい慎重にキュレートされることはめったにありません。
本稿では,ニューラルネットワークにはすでに,オープンワールド学習者になるための強力な触媒が備わっていると仮定する。
本手法は,分布内および分布外サンプルを検出し,情報的データポイントを選択し,モデルを継続的に更新するための効果的な戦略を導出する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:41:59 GMT)
Palette of Language Models: A Solver for Controlled Text Generation [20.8] 大規模な言語モデルは、適切に指示されたときに特定の要求に忠実に準拠する制御されたテキストを生成することができる。
一般的なアプローチは、単一属性モデルを線形に組み合わせることであるが、この戦略は、しばしば属性の重複を見落とし、矛盾につながる可能性がある。
本稿では,生成言語モデルに基づく総確率法と条件付き相互情報最小化に着想を得た新しい組み合わせ戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:30:09 GMT)
Can Large Reasoning Models do Analogical Reasoning under Perceptual Uncertainty? [20.7] 我々はOpenAIのo3-miniとDeepSeek R1をアナログ推論で評価した。
我々は、I-RAVENデータセットと、そのより難しい拡張I-RAVEN-Xをベンチマークする。
OpenAIのo3-miniタスクの精度は大幅に低下し、オリジナルのI-RAVENでは86.6%から17.0%に低下した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:52:25 GMT)
Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions [20.4] テキスト・ツー・イメージ(T2I)拡散モデルの最近の進歩は、生成画像の品質を大幅に向上させた。
個々の被写体、特にそれらの特徴の効率的な制御を提供することは、依然として重要な課題である。
現在のアプローチでは、両方を同時に提供しないため、正確な連続性および主題固有の属性変調を達成しようとすると、ギャップが生じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:33:08 GMT)
SPES: Spectrogram Perturbation for Explainable Speech-to-Text Generation [19.8] 説明可能な音声・テキスト生成のためのスペクトログラム摂動法(SPES)を提案する。
SPESは、入力スペクトログラムと以前に生成されたトークンの両方に基づいて、予測されたトークンについて説明を提供する。
音声認識と翻訳に関する広範囲な評価は、SPESが人間に忠実で妥当な説明を生成することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:20:26 GMT)
AIstorian lets AI be a historian: A KG-powered multi-agent system for accurate biography generation [19.7] 本稿では,知識グラフ(KG)を利用した検索強化世代(RAG)とアンチハロシン化マルチエージェントを特徴とする,新しいエンドツーエンドエージェントシステムであるAIstorianを紹介する。
具体的には、AIstorianは、コンテキスト内学習に基づくチャンキング戦略と、正確で効率的な参照検索のためのKGベースのインデックスを導入している。
実生活の歴史的神史データセットの実験では、アリストリア語は実際の精度が3.8倍向上し、幻覚率も47.6%低下した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:23:45 GMT)
Learnable Cross-modal Knowledge Distillation for Multi-modal Learning with Missing Modality [19.5] 特定のモダリティが他のモダリティよりも寄与するマルチモーダルタスクでは一般的であり、これらの重要なモダリティが欠如している場合、モデルの性能は大幅に低下する。
本稿では,重要なモダリティを適応的に同定し,それらのモダリティから他のモダリティを支援するための学習可能なクロスモーダル知識蒸留モデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:53:09 GMT)
Cafe-Talk: Generating 3D Talking Face Animation with Multimodal Coarse- and Fine-grained Control [19.4] 3Dトーキングフェイス法は, 正確な唇同期と制御可能な表情を提供する必要がある。
粗い時間的・きめ細かい制御条件を同時に組み込んだ拡散変換器を用いた3次元音声合成モデルCafe-Talkを提案する。
実験により, Cafe-Talkは最先端の唇同期と表現性を達成し, ユーザスタディにおけるきめ細かい制御において広く受け入れられていることが証明された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:52:41 GMT)
Reinforcement Learning with Verifiable Rewards: GRPO's Effective Loss, Dynamics, and Success Amplification [19.3] グループ相対政策最適化が導入され、DeepSeek R1モデルのトレーニングに成功しました。
この論文では、検証可能な報酬を持つGRPOが、正規化された対照的な損失(mathsfKL$)として書けることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:25:46 GMT)
Towards General Multimodal Visual Tracking [19.0] RGB, 熱赤外, イベント, 言語など4つのモードの利点を利用して, 困難な状況下でのロバストなトラッキングを実現する。
我々は600の動画シーケンスからなる大規模で高品質なベンチマークであるQuadTrack600(384.7K高解像度(640x480))を構築した。
各フレーム群では、すべての4つのモードが空間的にアライメントされ、密接なアノテートされ、21のシーケンスレベルのチャレンジ属性が詳細な性能解析のために提供される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:09:43 GMT)
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation [18.9] LayeredDepthは、実世界のベンチマークと合成データジェネレータを含む、多層深度アノテーションを備えた最初のデータセットである。
我々のベンチマークは、様々なシーンから1,500枚の画像で構成され、その上で最先端の深度推定手法を評価することで、透明な物体に苦しむことを明らかにした。
この合成データセットのみをトレーニングしたベースラインモデルは、優れたクロスドメイン多層深さ推定を生成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:52:06 GMT)
DGNN: A Neural PDE Solver Induced by Discontinuous Galerkin Methods [18.6] 本稿では,不連続ガレルキン誘発ニューラルネット(DGNN)の枠組みを提案する。
DGNNは、高い摂動、不連続解、複雑な領域を容易に扱う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:18:48 GMT)
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning [18.4] コンピュータビジョンが人間の視覚システムを再現しようとすると、幼児の視覚発達を理解することは貴重な洞察を与えるかもしれない。
モデルの内部表現に隠れた視覚概念ニューロンを発見できる学習自由フレームワークを提案する。
我々の研究は、幼児の視覚的および言語的入力に基づいて訓練された計算モデルの内部表現を分析することによって、認知科学とコンピュータビジョンを橋渡しする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:05:12 GMT)
Enabling Weak Client Participation via On-device Knowledge Distillation in Heterogenous Federated Learning [18.4] デバイス上でのKDに基づくヘテロジニアスFL法を提案する。
我々のアプローチは、ラベル付きローカルデータから学習するために小さな補助モデルを活用する。
強力なシステムリソースを持つクライアントのサブセットは、オンデバイスKDを介して知識を大きなモデルに転送します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:40:37 GMT)
Wearable intelligent throat enables natural speech in stroke patients with dysarthria [18.4] ウェアラブル型サイレント音声システムは, 音声障害患者のコミュニケーション回復に有意な可能性を秘めている。
喉の筋肉振動と頸動脈パルス信号センサを統合したAI駆動型インテリジェント喉(IT)システムを提案する。
変形性脳症の脳卒中患者5名を対象に、ITのLLMエージェントはトークンエラーをインテリジェントに修正し、文レベルの感情的および論理的一貫性を充実させた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:14:26 GMT)
Bridging the LLM Accessibility Divide? Performance, Fairness, and Cost of Closed versus Open LLMs for Automated Essay Scoring [18.3] 我々は、テキスト評価と自動エッセイスコアリングに関連する生成タスクにおいて、9つの主要な大規模言語モデル(LLM)を比較した。
その結果,Llama 3 や Qwen2.5 などのオープン LLM は GPT-4 に比較して,予測性能が向上することがわかった。
生成タスクにおいて、トップオープンLLMによって生成されたエッセイは、セマンティックコンポジション/埋め込みやML評価スコアの点から、クローズドLLMに匹敵するものである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:34:40 GMT)
Rethinking Multi-modal Object Detection from the Perspective of Mono-Modality Feature Learning [18.3] 我々は,マルチモーダル検出器に線形探索評価を導入し,マルチモーダル物体検出タスクを再考する。
M$2$D-LIFという,モノモダリティ蒸留(M$2$D)法と局所照明対応核融合(LIF)モジュールからなる新しいフレームワークを構築した。
我々のM$2$D-LIFは、Fusion Degradation現象を効果的に軽減し、以前のSOTA検出器より優れている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:15:53 GMT)
Safe-VAR: Safe Visual Autoregressive Model for Text-to-Image Generative Watermarking [18.3] 自己回帰学習はテキストと画像の生成において支配的なアプローチとなり、高い効率と視覚的品質を提供する。
拡散モデルのために設計された既存の透かし法は、しばしばVARモデルのシーケンシャルな性質に適応するのに苦労する。
自動回帰テキスト・画像生成に特化して設計された最初のウォーターマーキングフレームワークであるSafe-VARを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:45:10 GMT)
TASTE-Rob: Advancing Video Generation of Task-Oriented Hand-Object Interaction for Generalizable Robotic Manipulation [18.1] TASTE-Robは、エゴ中心のハンドオブジェクトインタラクションビデオ100,856のデータセットである。
それぞれのビデオは、言語指示と慎重に一致し、一貫したカメラ視点から記録される。
リアリズムを高めるために,我々は3段階のポーズ・リファインメント・パイプラインを導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:09:31 GMT)
How Problematic Writer-AI Interactions (Rather than Problematic AI) Hinder Writers' Idea Generation [18.1] 学生のアイデア開発に対するgenAIの影響は、AIだけでなく、学生と学生の相互作用にも大きく依存している。
積極的にアイデアを探求する学生は、オートコンプリートでもソクラティックAIアシスタントでも、新しいアイデアを書けるようになった。
これらの発見は、AI記述アシスタントを設計する機会を示唆している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:53:53 GMT)
Generative Multi-Agent Q-Learning for Policy Optimization: Decentralized Wireless Networks [18.0] 協調分散型無線ネットワークのための新しいマルチエージェントMEMQ(M-MEMQ)を提案する。
非協調状態においては、TXは個々のコストを最小化し、局所的なQ-関数を更新するために独立に作用する。
M-MEMQは、平均ポリシーエラー(APE)が55%、収束が35%速く、ランタイムの複雑さが50%減少し、サンプルの複雑さが45%減少します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:46:50 GMT)
Hiding Local Manipulations on SAR Images: a Counter-Forensic Attack [17.8] オンラインポータルを通じてSAR(Synthetic Aperture Radar)画像の膨大なアクセシビリティが、様々な分野の研究を推進している。
脆弱性は、ほとんどのSAR製品が振幅のみの情報としてリリースされることによってさらに強調される。
本稿では、専門家がSARデータの複雑な性質を利用して操作の兆候を隠蔽できることを実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:31:15 GMT)
Preparation of high fidelity entangled cat states with composite pulses [17.6] 本研究では, 複合パルスを用いた高忠実な絡み合った猫状態の調製のためのプロトコルを提案する。
パラメータを適切に設計することにより、各カー非線形共振器はキャット状態部分空間に閉じ込められる。
複数振幅の複合2光子駆動を導入し, 絡み合った猫状態の忠実度を向上させる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:23:34 GMT)
Align in Depth: Defending Jailbreak Attacks via Progressive Answer Detoxification [17.5] 大規模言語モデル(LLM)は、有害な応答を誘発するクラフトプロンプトを使用するジェイルブレイク攻撃に対して脆弱である。
本稿では,LLMを微調整して生成したコンテンツを段階的に解毒する,堅牢な防衛フレームワークであるDEEPALIGNを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:32:12 GMT)
Lifelong Knowledge Editing for Vision Language Models with Low-Rank Mixture-of-Experts [17.4] 我々は、生涯LLM編集とビジョンLLM編集のギャップを埋めるために、LIfelong Vision言語modEl EditのLiveEditを提案する。
ビジュアルセマンティック知識を活用するためにハードフィルタリング機構を開発し、入力クエリの視覚的に無関係な専門家を排除した。
視覚的に関係のある専門家を統合するために,テキストの意味的関連性に基づくソフトルーティング機構を導入し,マルチエキスパート融合を実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:47:02 GMT)
High-rate discrete-modulated continuous-variable quantum key distribution with composable security [17.3] 構成可能な秘密鍵レート18.93 Mbpsの連続可変量子鍵分布系を25km繊維チャネル上の集団攻撃に対して報告する。
この記録破り率は確率型16QAM変調プロトコルによって達成される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:21:08 GMT)
Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping [17.2] 本稿では,小サンプルサイズ体制における2つの政策を厳密に比較するための新しい統計枠組みを提案する。
実験では、ほぼ最適に停止し、研究者が評価を中止し、最小限の試行で決定を下せることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:21:48 GMT)
DeskVision: Large Scale Desktop Region Captioning for Advanced GUI Agents [17.2] 本稿では,GUIデータの自動生成パイプラインであるAutoCaptionerを提案する。
私たちは、日々の使用を反映し、さまざまなシステムやUI要素をカバーする、新しい大規模なデスクトップGUIデータセットであるDeskVisionを作成しました。
我々は新しいGUI理解モデル GUIExplorerを訓練し、ビジュアル要素の理解とグラウンド化において最先端(SOTA)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:16:02 GMT)
TimeMixer++: A General Time Series Pattern Machine for Universal Predictive Analysis [17.1] 時系列解析は多くのアプリケーションにおいて重要な役割を担い、予測、分類、異常検出、計算などのタスクをサポートする。
本研究では,高機能な表現とパターン抽出機能を通じて,幅広い時系列タスクを最適化するモデルである時系列パターンマシン(TSPM)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:04:53 GMT)
A Test of Time: Predicting the Sustainable Success of Online Collaboration in Wikipedia [17.1] 我々は,ウィキペディア記事の持続可能な成功を予測するために,機械学習モデルを開発した。
記事が高品質であると認識されるのに時間がかかるほど、時間とともにそのステータスを維持する可能性が高くなる。
我々の分析はウィキペディア以外の幅広い集団的行動に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:47:49 GMT)
Quality In, Quality Out: Investigating Training Data's Role in AI Code Generation [16.9] トレーニング中に見られた低品質のコードインスタンスが、推論時に生成されたコードの品質にどの程度影響するかを調査する。
微調整されたモデルを使って551kのPython関数を生成し、そのうち5.85%が少なくとも1つの品質問題の影響を受けていることを示す。
本研究は,コードジェネレータにおける高品質なトレーニングデータの重要性を実証的に裏付けるものである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:43:43 GMT)
Layton: Latent Consistency Tokenizer for 1024-pixel Image Reconstruction and Generation by 256 Tokens [16.9] Layton(Latent Consistency Tokenizer)は、事前学習された潜在拡散モデル(LDM)のコンパクト潜在空間で離散的視覚トークンをブリッジする
MSCOCO-2017の1024x1024画像再構成のためのFrechet Inception DistanceをMSCOCO-2017 5Kベンチマークで10.8再構成した。
私たちはLaytonをテキストから画像生成モデルであるLaytonGenに拡張し、自動回帰で作業します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:16:25 GMT)
Modeling Subjectivity in Cognitive Appraisal with Language Models [16.8] 様々なシナリオに対して包括的な実験と分析を行うことで、言語モデルがどのように主観性を活用できるかを示す。
その結果,人格特性と人口統計情報は主観性を測定する上で重要であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:25:41 GMT)
Towards A Correct Usage of Cryptography in Semantic Watermarks for Diffusion Models [16.6] セマンティックな透かしのための暗号プリミティブを再検討する。
本稿では,意味的な透かしに対するIND$-CPAセキュリティに基づく,損失のない性能の新たな一般的な証明を紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:45:46 GMT)
RECAST: Reparameterized, Compact weight Adaptation for Sequential Tasks [16.5] RECASTはタスク固有のトレーニング可能なパラメータを50未満に劇的に削減する新しい手法である。
本稿では,RECASTが様々なスケール,アーキテクチャ,パラメータ空間において,最先端の技術を最大3%向上させることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:36:26 GMT)
Are Deep Speech Denoising Models Robust to Adversarial Noise? [16.3] 近年の4つのDNSモデルは,それぞれ,対向雑音を付加することにより,非知能なジブベリッシュを出力できることを示す。
本研究は,DNSシステムにおける実践的対策の必要性を強調した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:46:34 GMT)
Diffuse-CLoC: Guided Diffusion for Physics-based Character Look-ahead Control [16.3] 物理に基づくルックアヘッド制御のためのガイド付き拡散フレームワークであるDiffuse-CLoCを提案する。
直感的で、ステアブルで、物理的にリアルなモーション生成を可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:42:29 GMT)
Leveraging Diffusion Knowledge for Generative Image Compression with Fractal Frequency-Aware Band Learning [16.1] 生成的画像圧縮アプローチは、シャープな再構築ではなく、詳細で現実的な画像を生成する。
拡散知識を取り入れた新しい深層学習に基づく画像圧縮手法を提案する。
提案手法は, 従来よりも低歪みで, 高いリアリズム, より優れたリアリズムの歪みを実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:41:33 GMT)
Anchors Aweigh! Sail for Optimal Unified Multi-Modal Representations [16.0] 多様なデータソースを効果的に統合するためには,マルチモーダル学習における統一表現空間が不可欠である。
ImageBindのような最近のバインディング手法は、通常、複数のモーダルデータを整列するために単一の固定アンカーモダリティに依存している。
我々は,我々のフレームワークであるCentroBindで実証された適応型アンカーバインディング手法の必要性を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:36:53 GMT)
Fine-Grained and Multi-Dimensional Metrics for Document-Level Machine Translation [16.0] 大規模言語モデル(LLM)は機械翻訳(MT)を含む様々なNLPタスクに優れている。
本研究は,文書レベル翻訳(docMT)における命令調整型LLMの本質的能力について検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:12:38 GMT)
Semi-Supervised Co-Training of Time and Time-Frequency Models: Application to Bearing Fault Diagnosis [15.6] 本稿では、時間と時間周波数の機械学習モデルを組み合わせて、性能と信頼性を向上させる半教師付き協調学習手法を提案する。
クラウドエッジネットワークで動作し、エッジリアルタイム監視とクラウドベースの更新と修正をカバーする多くのアプリケーションに対して、全体的なサポートを提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:24:38 GMT)
The Nyström method for convex loss functions [15.4] 仮説空間は与えられたヒルベルト空間内のランダム部分空間からなる古典的経験的リスク計算の拡張について検討する。
ランダムな部分空間を使うことは自然に計算上の利点をもたらすが、重要な問題は学習精度を損なうかどうかである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:16:59 GMT)
Category Prompt Mamba Network for Nuclei Segmentation and Classification [15.3] 以前の核分割と分類モデルでは、トレーニングのために大きな画像を小さなパッチに分割する必要がある。
Mambaは、線形時間複雑性とメモリ消費の低い大規模イメージをモデル化する能力に注目を集めている。
本稿では,各カテゴリの特徴を上位から下位への信頼度に応じて独立にランク付け・走査する,カテゴリ確率ソートに基づく新しいスキャン戦略を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:56:52 GMT)
Augmenting Image Annotation: A Human-LMM Collaborative Framework for Efficient Object Selection and Label Generation [15.3] 本稿では,大規模マルチモーダルモデル(LMM)の視覚的理解機能を活用してアノテーションを補助する新しいフレームワークを提案する。
提案手法では,人間アノテータはバウンディングボックスを介してオブジェクトを選択することに集中し,LMMは関連するラベルを自律的に生成する。
提案するフレームワークはアノテーションを再定義するこのアプローチの可能性を強調し,コンピュータビジョンにおける大規模データラベリングのためのスケーラブルで効率的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:38:53 GMT)
A Framework for a Capability-driven Evaluation of Scenario Understanding for Multimodal Large Language Models in Autonomous Driving [15.2] MLLM(Multimodal large language model)は、自動運転の可能性を秘めている。
自律運転システムへの統合は、概念実証アプリケーションにおいて有望な結果を示す。
本稿では,自律運転におけるMLLMの能力駆動評価のための総合的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:43:26 GMT)
Alchemist: Towards the Design of Efficient Online Continual Learning System [15.2] 我々はAlchemistを提案し、私たちの知る限り、トレーニングスループットを向上させるためにサービス活性化を効率的に再利用する最初のオンライン連続学習システムを提案する。
Alchemyはトレーニングスループットを最大1.72倍に向上し、トレーニング中に最大47%のメモリ使用量を削減し、最大2倍のトレーニングトークンをサポートする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:57:12 GMT)
Instance Temperature Knowledge Distillation [15.1] 既存の学習方法は、学生ネットワークが様々な学習困難に適応できるように、動的に温度調整を行う。
本稿では,温度調整を逐次意思決定タスクとして定式化し,強化学習に基づく手法を提案する。
我々のフレームワークは、様々なKDメソッドに簡単に挿入できるプラグイン・アンド・プレイ技術として機能する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:03:43 GMT)
SPORTU: A Comprehensive Sports Understanding Benchmark for Multimodal Large Language Models [15.1] SPORTUはマルチレベルスポーツ推論タスク間でMLLM(Multimodal Large Language Models)を評価するために設計されたベンチマークである。
SPORTUは2つの重要なコンポーネントで構成されている。 SPORTU-textは900の多重選択質問と、ルール理解と戦略理解のための人間アノテーションによる説明を含む。
SPORTUビデオは、7つの異なるスポーツで1,701本のスローモーションビデオクリップと12,048本のQAペアで構成され、マルチレベル推論を評価するように設計されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:32:04 GMT)
L2RSI: Cross-view LiDAR-based Place Recognition for Large-scale Urban Scenes via Remote Sensing Imagery [14.9] 従来の3Dマップのコストと時間を要するLiDARによる位置認識の課題に対処する。
高分解能リモートセンシング画像を用いたLiDAR位置認識のための新しい手法L2RSIを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:52:54 GMT)
Performative Reinforcement Learning with Linear Markov Decision Process [14.8] 提案手法がマルコフ決定過程の報酬と遷移の両方に影響を及ぼすような表現的強化学習の設定について検討する。
大規模MDPの主要な理論モデルであるEmphlinear Markov決定過程を一般化する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:32:50 GMT)
Key, Value, Compress: A Systematic Exploration of KV Cache Compression Techniques [14.7] 大規模言語モデル(LLM)は、テキスト、画像、ビデオコンテンツを生成する際、例外的な能力を示した。
文脈長が大きくなるにつれて、トークンの数が増えるにつれて、注意の計算コストは2次的に増加する。
本稿では,キーバリュー(KV)キャッシュ圧縮戦略の解析を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:02:16 GMT)
AugGen: Synthetic Augmentation Can Improve Discriminative Models [14.7] 自己完結型合成拡張技術を紹介する。
ターゲットデータセットにのみ訓練された条件生成モデルから戦略的にサンプリングする。
IJB-CベンチマークとIJB-Bベンチマークで1~12%のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:10:21 GMT)
Examples as the Prompt: A Scalable Approach for Efficient LLM Adaptation in E-Commerce [14.4] Prompt (EaP) はラベル付きデータを利用してプロンプトを強化するフレームワークである。
EaPは手作りのプロンプトに比べて同等またはそれ以上のパフォーマンスを達成する。
EaP_liteはプロンプトの自然言語コンポーネントをラベル付き例で置き換える。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:22:43 GMT)
Mitigating Bad Ground Truth in Supervised Machine Learning based Crop Classification: A Multi-Level Framework with Sentinel-2 Images [14.4] 農業経営においては,正確なグラウンドトラス(GT)データは,正確な機械学習(ML)に基づく作物分類に不可欠である。
我々は,これらの問題に対処するために,多段階のSentinel-2データを利用した多段階GTクリーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:50:30 GMT)
Content ARCs: Decentralized Content Rights in the Age of Generative AI [14.2] 本稿では,EmphContent ARC (Authenticity, Rights, Compensation) と呼ばれるフレームワークを提案する。
証明と動的ライセンシングのオープンスタンダードとデータ属性を組み合わせることで、Content ARCは、権利を管理し、AIトレーニングで自分の仕事を使用するためのクリエイターを補償するメカニズムを作成します。
我々は、Content ARCs内のAIデータライセンス分野におけるいくつかの初期段階の成果を特徴づけ、エンドツーエンドフレームワークを完全に実装するための課題がどこにあるかを特定します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:57:08 GMT)
OASIS: Order-Augmented Strategy for Improved Code Search [14.2] コード検索の改善のための新しい秩序強化戦略を提案する。
オーダーベースの類似性ラベルを活用してモデルをトレーニングし、負のペア間の類似性の微妙な違いを捉えます。
これは、効果的なコード埋め込みトレーニングのために、オーダラベルと負のペア間の微妙な違いを利用する価値を強調している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:09:13 GMT)
Neural Tangent Kernel of Neural Networks with Loss Informed by Differential Operators [13.8] 我々は物理インフォームド・ロスを持つディープニューラルネットワークのNTK理論を開発した。
ほとんどの場合、損失関数の微分作用素はより高速な固有値減衰率と強いスペクトルバイアスを誘導しない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:55:13 GMT)
A Survey of Cross-domain Graph Learning: Progress and Future Directions [13.6] グラフ学習は、グラフデータに関わる複雑な関係をマイニングし分析する上で重要な役割を果たす。
CVとNLPは、グラフドメインにおいても重要な強力なクロスドメイン機能を示している。
CVやNLPの成功にインスパイアされたクロスドメイングラフ学習は、真のグラフ基盤モデルの実現に再び注目の的になっている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:53:27 GMT)
M2LADS Demo: A System for Generating Multimodal Learning Analytics Dashboards [13.6] 本稿では,M2LADS (System for Generating Multimodal Learning Analytics Dashboards) と呼ばれるWebベースのシステムを提案する。
本システムは,Web ベースのダッシュボード上での生体情報および行動データを多岐にわたって提示し,様々な生理的および活動的指標に関する詳細な知見を提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:33:44 GMT)
Structure-guided Deep Multi-View Clustering [13.6] 深いマルチビュークラスタリングは、クラスタリング性能を改善するために、複数のビューから豊富な情報を活用することを目指している。
既存のクラスタリング手法の多くは、多視点構造情報の完全なマイニングを無視することが多い。
構造誘導型深層多視点クラスタリングモデルを提案し,多視点データの分布を探索する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:35:13 GMT)
Online Assortment and Price Optimization Under Contextual Choice Models [13.6] 我々は、販売者が販売可能なさまざまなアイテムをN$で販売する、品揃え選択と価格設定の問題を考える。
各ラウンドにおいて、販売者は、ユーザに対して、$d$次元のコンテキスト優先情報ベクタを観察し、販売者が選択した価格で、ユーザに対して$K$アイテムを提供する。
利用者は、パラメータが不明な多項ロジット選択モデルに従って、提供された品目から少なくとも1つの商品を選択する。
我々は,ユーザのフィードバックから学習し,$widetildeO(d sqrtK)の収益を後悔するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:15:33 GMT)
Neutralizing Bias in LLM Reasoning using Entailment Graphs [13.5] LLMは自然言語推論(NLI)が可能であるとしばしば主張されるが、これはより複雑な推論の基盤として広く見なされている。
我々は,検証バイアスを低減するために,非教師なしのフレームワークを設計し,反実的推論データと微調整LDMを構築した。
我々のフレームワークは、元のNLIデータセットとバイアスニュートラル化されたNLIデータセットの推論性能を一貫して改善する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:33:30 GMT)
Spatio-temporal Fourier Transformer (StFT) for Long-term Dynamics Prediction [13.5] マルチスケールおよびマルチ物理システムの長期的ダイナミクスのシミュレーションは、科学と工学において大きな課題となる。
ニューラル演算子は、その柔軟性と計算効率のために、そのようなダイナミクスを予測するための有望なモデルとして登場した。
本稿では,予測の不確実性を推定・緩和し,長期予測の精度と信頼性を高めるための生成残差補正機構を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:04:03 GMT)
Auto-GDA: Automatic Domain Adaptation for Efficient Grounding Verification in Retrieval-Augmented Generation [13.1] 検索強化生成(RAG)は,大規模言語モデル(LLM)出力の事実性を高めることが示されている。
RAG入力は、NLIモデルのトレーニングに使用されるほとんどのデータセットよりも複雑である。
教師なし領域適応を実現するために自動生成適応(Auto-GDA)を導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:27:00 GMT)
Neurons: Emulating the Human Visual Cortex Improves Fidelity and Interpretability in fMRI-to-Video Reconstruction [13.1] NEURONSは、学習を4つの相関したサブタスクに分離するコンセプトフレームワークである。
これは視覚野の機能的特殊化をシミュレートし、モデルが多様なビデオコンテンツをキャプチャすることを可能にする。
NEURONSは視覚野と強い機能相関を示し、脳とコンピュータのインターフェースと臨床応用の可能性を強調している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:12:28 GMT)
Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control [13.1] 適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:13:42 GMT)
CSCE: Boosting LLM Reasoning by Simultaneous Enhancing of Causal Significance and Consistency [13.0] チェーン・オブ・シンキング(CoT)のような連鎖型推論手法は、大規模言語モデル(LLM)の推論タスクの解決において、その役割を担っている。
本稿では、因果的重要性と一貫性を同時に考慮する非チェーン型推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:56:37 GMT)
Tora: Trajectory-oriented Diffusion Transformer for Video Generation [12.8] Toraは、テキスト、ビジュアル、およびトラジェクトリ条件を統合する最初のトラジェクトリ指向のDiTフレームワークである。
Toraは、様々な期間、アスペクト比、解像度で制御可能な動画を生成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:03:31 GMT)
Through the Magnifying Glass: Adaptive Perception Magnification for Hallucination-Free VLM Decoding [12.8] 既存の視覚言語モデル(VLM)はしばしば視覚幻覚に悩まされ、生成した応答は視覚入力に基づかない不正確さを含む。
本稿では、注意に基づいて関連した視覚トークンを反復的に分離し、対応する領域を拡大する新しい視覚的復号法であるパーセプション・マグニファイア(PM)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:48:33 GMT)
GPT for Games: An Updated Scoping Review (2020-2024) [12.8] 本稿では,2024年に出版された177記事122記事のスコーピングレビューを改訂し,GPTによるゲームの可能性を探る。
現在のゲーム研究におけるGPTの顕著な応用は,プロシージャコンテンツ生成,混合開始型ゲームデザイン,混合開始型ゲームプレイ,ゲームプレイ,ゲームユーザリサーチの5つである。
このレビューは、ゲームにおける革新的なGPTアプリケーションにおける技術の現状を説明することを目的としており、ゲーム開発を充実させ、最先端のAIイノベーションを通じてプレイヤー体験を強化する基盤を提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:50:19 GMT)
Sketch-to-Skill: Bootstrapping Robot Learning with Human Drawn Trajectory Sketches [12.6] ロボット操作の訓練には、伝統的に多数のデモや環境のロールアウトが必要となる。
Sketch-to-Skillは、ロボット操作のためのブートストラップとガイドRLに、人間の描いた2Dスケッチトラジェクトリを活用する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:08:29 GMT)
VA-AR: Learning Velocity-Aware Action Representations with Mixture of Window Attention [12.5] 本研究では,速度認識型行動認識(VA-AR)フレームワークを導入し,異なる速度におけるロバストな行動表現を実現する。
VA-ARはMixture of Window Attention (MoWA)戦略を採用し、アクションの速度に基づいて注意窓のサイズを動的に調整する。
VA-ARは同じ5つのデータセットで最先端のパフォーマンスを実現し、幅広いアクション認識シナリオでVA-ARの有効性を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:03:37 GMT)
ShEPhERD: Diffusing shape, electrostatics, and pharmacophores for bioisosteric drug design [12.4] 医薬品設計において、既知の生物活性ヒットの生体異性体類似は、しばしば、形状、静電気、薬局類似度スコアリング機能を持つ化学ライブラリーを事実上スクリーニングすることによって識別される。
3次元分子構造上の結合分布とその相互作用プロファイルを学習する生成モデルが3次元相互作用を意識した化学設計を促進すると仮定する。
具体的には、ShEPhERDという3次元分子グラフとそれらの形状、静電ポテンシャル表面、および(方向)医薬泳動をガウスノイズから/から連続的に拡散・除去するSE(3)同変拡散モデルの設計を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:13:25 GMT)
Greener GRASS: Enhancing GNNs with Encoding, Rewiring, and Attention [12.4] 本稿では,新しいGNNアーキテクチャであるGraph Attention with Structures (GRASS)を紹介する。
GRASSはランダムな正規グラフを重畳して入力グラフをリワイヤし、長距離情報伝搬を実現する。
また、グラフ構造化データに適した新しい付加的注意機構も採用している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:47:53 GMT)
Polyhedral Surface: Self-supervised Point Cloud Reconstruction Based on Polyhedral Surface [12.3] 局所表面を表す新しい多面体表面を提案する。
ニューラルネットワークを導入する上で重要な局所座標系は不要である。
提案手法は,3つの一般的なネットワーク上での最先端の処理結果を実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:25:32 GMT)
The Role of Quantum Measurements when Testing the Quantum Nature of Gravity [12.1] 我々は、Schroedinger-Newton(CCSN)理論の因果条件定式化(Causal Conditional Formulation of Schroedinger-Newton)がこの枠組みの最小モデルであると主張する。
CCSNは量子フィードバック制御スキームとみなすことができるため、これまでSN理論を悩ませていた病理学を使わずに因果関係を作ることができる。
自己古典重力の質量集中効果は,相互絡み合いの試験よりもCCSNの試験がずっと容易であることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:09:17 GMT)
Visual Modality Prompt for Adapting Vision-Language Object Detectors [12.1] ゼロショット性能を劣化させることなく、視覚言語検出器を新たなモダリティに適応させる視覚的プロンプト戦略を提案する。
特にエンコーダ・デコーダの視覚的プロンプト戦略が提案され、推論に親しみやすいモダリティ・プロンプト・デカップリング残差の統合によりさらに強化される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:32:12 GMT)
PersonaCraft: Personalized and Controllable Full-Body Multi-Human Scene Generation Using Occlusion-Aware 3D-Conditioned Diffusion [11.9] PersonaCraftは、複雑なシーンで複数の個人をパーソナライズする、コントロール可能でオクルージョンを損なうフルボディ画像合成のためのフレームワークである。
SMPLxをベースとした形状パラメータとテクスチュアリファインメントを併用した双方向の体形表現により,高精度な全身のパーソナライズとフレキシブルなユーザ定義体形調整が可能となった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:05:11 GMT)
k-fold Subsampling based Sequential Backward Feature Elimination [11.6] このアルゴリズムはフィルタとラッパー法の利点を組み合わせたハイブリッドな特徴選択手法である。
SVM分類器の検出速度は50%以上向上し、検出精度は最大2%向上する。
また, このアルゴリズムは, 変形可能な部品モデルで導入された等価システムよりも約9%の精度で性能を向上する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:10:08 GMT)
A Framework for Evaluating Emerging Cyberattack Capabilities of AI [11.6] 本稿では,AIサイバー能力評価に対する新しいアプローチを提案する。
我々は、サイバー攻撃にAIを使おうとする現実世界の12,000件の事例を分析した。
私たちの評価ベンチマークは、サイバー攻撃の異なるフェーズにまたがる50の新たな課題で構成されています。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:05:02 GMT)
GKG-LLM: A Unified Framework for Generalized Knowledge Graph Construction [11.6] 一般化知識グラフを構築するための統一的なフレームワークを提案する。
まず、3種類のグラフにまたがる29のデータセットで15のサブタスクからデータを収集する。
そこで我々は,3種類のグラフからの知識を大規模言語モデルに反復的に注入することにより,3段階のカリキュラム学習微調整フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:23:22 GMT)
Multi-modal Vision Pre-training for Medical Image Analysis [11.6] 自己教師型学習は、実世界のアプリケーションに対するトレーニングデータ要求を抑えることにより、医療画像解析を大いに促進してきた。
我々は,3つの代用タスクによる新しいマルチモーダル画像事前学習を行い,相互モダリティ表現と相関の学習を容易にする。
Dice Scoreは6つのセグメンテーションベンチマークで0.28%-14.47%改善し、4つの画像分類タスクで0.65%-18.07%向上した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:32:09 GMT)
Trust Under Siege: Label Spoofing Attacks against Machine Learning for Android Malware Detection [11.5] これは、最小限で検出不能な悪意のあるパターンを埋め込むことによって、クラウドソースデータセットを汚染する新たな脅威である。
我々は、現実的なデータソースを汚染する手法であるAndroVenomを開発することで、このシナリオを実証する。
実験により、最先端の機能抽出器はそのようなインジェクションをフィルタリングできないだけでなく、さまざまなMLモデルがDenial of Serviceを経験していることが示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:05:56 GMT)
Cyclic Contrastive Knowledge Transfer for Open-Vocabulary Object Detection [11.5] 我々は、余分な監督なしに訓練されたCCKT-Detを提案する。
提案フレームワークは,視覚言語モデル(VLM)から抽出した言語クエリと視覚領域の特徴から,循環的かつ動的に知識を伝達する。
CCKT-Detは、VLMの規模が大きくなるにつれて、一貫して性能を向上させることができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:04:28 GMT)
Proceedings of the ISCA/ITG Workshop on Diversity in Large Speech and Language Models [11.5] 現代の技術は1つまたは複数の言語の一般的な知識を表現するために大きなモデルに依存している。
人間がそのような技術と対話するとき、その相互作用の有効性は、人間が同じタイプの言語をどこまで使うかによって影響される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:24:05 GMT)
EmoAgent: Multi-Agent Collaboration of Plan, Edit, and Critic, for Affective Image Manipulation [11.3] Affective Image Manipulation (AIM)は、複数の視覚要素を調整して特定の感情を誘発することで、イメージの感情的影響を変化させることを目的としている。
AIMのための最初のマルチエージェントコラボレーションフレームワークであるEmoAgentを紹介する。
EmoAgentの有効性を高めるために,感情要素情報検索装置,決定木空間,ツールライブラリを開発する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:55:56 GMT)
Solution for 8th Competition on Affective & Behavior Analysis in-the-wild [11.3] 本研究は,第8回感情行動分析コンペティションにおけるAU(Action Unit)検出問題に対する解決策を提案する。
本手法では,画像エンコーダとしてConvNeXtを用い,Whisperを用いてMelスペクトルの特徴を抽出する。
これにより、Aff-Wild2データセットでトレーニングされた後続の多層パーセプトロン(MLP)に対して、リッチな高次元特徴表現が提供される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:26:55 GMT)
Approximating the Total Variation Distance between Gaussians [11.3] 総変分距離は統計学と確率論における中心的な重要性の計量である。
2つの$n$次元ガウス距離を近似するアルゴリズムを与える。
私たちの仕事における主要な技術ツールは、テレビ距離計算の最近の進歩を拡大するのに役立つ減量です。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:42:10 GMT)
StyleMorpheus: A Style-Based 3D-Aware Morphable Face Model [11.2] StyleMorpheusは、最初のスタイルベースの3Dモールブルフェイスモデルである。
我々は、デコーダをスタイルベースで生成した逆数学習によって微調整し、フォトリアリスティックな3Dレンダリング品質を実現する。
我々のモデルはリアルタイムのレンダリング速度を実現し、バーチャルリアリティーアプリケーションでの使用を可能にした。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:32:02 GMT)
EmT: A Novel Transformer for Generalized Cross-subject EEG Emotion Recognition [11.0] 感情トランス(EmT)と呼ばれる新しいトランスモデルを導入する。
EmTは、一般化されたクロスオブジェクトEEG感情分類と回帰タスクの両方において優れているように設計されている。
4つの公開データセットの実験により、EmTは脳波の感情分類と回帰タスクの両方のベースラインメソッドよりも高い結果が得られることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:17:27 GMT)
Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method [11.0] そこで我々は,新たな暴力検出フレームワークを提案する。
一助多目的学習(unimodal multiple-instance learning)は、一助多目的学習(unimodal semantic features)、多モーダルアライメント(multimodal alignment)、多モーダル融合(multimodal fusion)、最終検出(final detection)からなる。
ベンチマークデータセットによる実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:22:02 GMT)
A Review of DeepSeek Models' Key Innovative Techniques [11.0] DeepSeek-V3とDeepSeek-R1はオープンソースのLarge Language Modelsをリードしている。
我々はこれらのモデルの顕著な有効性と効率を駆動するコア技術についてレビューする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:11:29 GMT)
Few-Shot Learning for Mental Disorder Detection: A Continuous Multi-Prompt Engineering Approach with Medical Knowledge Injection [10.9] 本研究では、現在最先端のAI技術を用いて、ユーザーが生成したテキストコンテンツを通して精神疾患を検出する。
本稿では,大規模言語モデルと連続的マルチプロンプト工学を活用することで,これらの課題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:34:01 GMT)
Parameter-Efficient Fine-Tuning of State Space Models [10.8] Deep State Space Models (SSM) は、言語モデリングの強力なツールとなり、シーケンス長で高いパフォーマンスと線形スケーラビリティを提供する。
本稿では,パラメータ効率のよい微調整法(PEFT)のSSMモデルへの適用について検討する。
SSMモジュールに適したPEFT法であるスパース次元チューニング(SDT)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:26:57 GMT)
Nested stochastic block model for simultaneously clustering networks and nodes [10.8] ネットワークの集合をクラスタ化すると同時に,各ネットワーク内のコミュニティを同時に検出するために,ネストブロックモデル(NSBM)を導入する。
NSBMには、潜在的に異なるノードセットを持つ未ラベルネットワークで動作する機能など、いくつかの魅力的な機能がある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:40:37 GMT)
Dual-Stage Cross-Modal Network with Dynamic Feature Fusion for Emotional Mimicry Intensity Estimation [10.7] Emotional Mimicry Intensity Estimationは、人間の社会的行動を理解し、人間とコンピュータの相互作用体験を強化するための重要な技術である。
本稿では,動的相関モデリングとマルチモーダル時間信号のロバスト融合のための2段階クロスモーダルアライメントフレームワークを提案する。
Hume-Vidmimic2データセットの実験結果から,6つの感情次元の平均ピアソン相関係数0.35が得られた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:55:43 GMT)
Accessibility Considerations in the Development of an AI Action Plan [10.5] 我々はアクセシビリティがいくつかの重要なドメインで表現される必要があると主張している。
AIベースのアクセシビリティ技術によって収集されたデータを含む、データセキュリティとプライバシとプライバシのリスク。
障害固有のAIリスクとバイアス(障害者によるAI使用中)と間接バイアス(障害者に関連するデータでAIが他の誰かによって使用される場合)の両方を含む。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:57:23 GMT)
Minding Fuzzy Regions: A Data-driven Alternating Learning Paradigm for Stable Lesion Segmentation [10.4] 医用画像の病変領域には境界の曖昧さ、不規則な形状、組織密度の小さな違いがあり、ラベルの曖昧さにつながっている。
既存のモデルは、トレーニングプロセスで品質の違いを考慮することなく、すべてのデータを均等に扱う。
データ駆動の交互学習パラダイムが提案され、モデルのトレーニングプロセスを最適化し、安定かつ高精度なセグメンテーションを実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:08:22 GMT)
SpaceSeg: A High-Precision Intelligent Perception Segmentation Method for Multi-Spacecraft On-Orbit Targets [10.4] 本稿では,4つのコア技術革新を伴う革新的なビジョン基盤モデルに基づくセグメンテーションフレームワークであるSpaceSegを提案する。
テストでは、SpaceSegは89.87$%$ mIoUと99.98$%$ mAccで最先端のパフォーマンスを達成し、既存のベストメソッドを5.71ポイント上回る。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:50:37 GMT)
PSF-4D: A Progressive Sampling Framework for View Consistent 4D Editing [10.3] 4次元編集のためのプログレッシブサンプリングフレームワーク(PSF-4D)を提案する。
時間的コヒーレンスのために、時間とともにフレームをリンクする相関したガウス雑音構造を設計する。
ビュー間の空間的整合性を実現するために、クロスビューノイズモデルを実装している。
提案手法は,外部モデルに頼らずに高品質な4D編集を可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:16:42 GMT)
Human-in-the-Loop Local Corrections of 3D Scene Layouts via Infilling [10.1] 我々は,エゴセントリックな視点から人間からのフィードバックを用いた3次元シーンレイアウトを推定するための,新しい人間-イン・ザ・ループアプローチを提案する。
本研究では,新しい局所修正タスクを導入し,ユーザが局所的誤りを識別し,モデルに自動的に修正を促す手法を提案する。
本システムでは,最終改良レイアウトをトレーニング分布から切り離し,複雑なレイアウトのより正確なモデリングを可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:45:19 GMT)
Combining Causal Models for More Accurate Abstractions of Neural Networks [10.1] 因果抽象化は、ネットワークがアルゴリズムを実装した際の正確な概念を提供する。
現実的な設定における典型的な問題は、アルゴリズムがネットワークを完全に忠実に抽象化していないことである。
我々は,より忠実なネットワーク表現を生成するために,異なる単純な高レベルモデルを組み合わせるソリューションを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:14:43 GMT)
MobiVital: Self-supervised Time-series Quality Estimation for Contactless Respiration Monitoring Using UWB Radar [10.1] 超広帯域(UWB)レーダーデータから得られた呼吸波形の品質を向上させる新しい手法MobiVitalを提案する。
MobiVitalは、波形抽出のための自己教師付き自己回帰モデルと、生体情報処理アルゴリズムを組み合わせて波形インバージョンを検出し、修正する。
以上の結果から, 本システムで生成する呼吸波形は, ベースラインに比べて7~34%の忠実性を示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:14:27 GMT)
Layer-wise Update Aggregation with Recycling for Communication-Efficient Federated Learning [9.8] 過剰なコミュニケーションコストは、フェデレートラーニング(FL)における一般的なパフォーマンスボトルネックである
通信効率FLのための再資源化手法であるFedLUARを提案する。
本手法はAG Newsの精度をFedAvgとほぼ同等にし,通信コストを17%削減する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:33:15 GMT)
Understanding Flatness in Generative Models: Its Role and Benefits [9.8] 生成モデルにおける損失面平坦性の役割を理論的にも経験的にも検討する。
より平坦なミニマは、対象の事前分布における摂動に対する堅牢性を改善するという理論的主張を確立する。
拡散モデルにおける平坦なミニマは、生成性能も向上するが、ロバスト性も向上することを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:38:53 GMT)
Revisiting FastMap: New Applications [9.8] 最初にFastMapを提示し、ほぼ直線時間でグラフのユークリッド埋め込みを生成する。
次に、FastMapのグラフバージョンを適用して、様々なグラフ理論問題を効率的に解決する。
また,FastMapとSupport Vector Machinesを組み合わせた新しい学習フレームワークFastMapSVMを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:29:10 GMT)
AQUA-SLAM: Tightly-Coupled Underwater Acoustic-Visual-Inertial SLAM with Sensor Calibration [9.7] 本稿では, 密結合型音響-視覚-慣性SLAM手法を提案する。
グラフ最適化フレームワーク内に、ドップラー速度ログ(DVL)、ステレオカメラ、慣性測定ユニット(IMU)を融合させる。
本手法は, 位置推定精度とロバスト性の観点から, 現在最先端の水中・ビジュアル・慣性SLAMシステムを超えていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:03:33 GMT)
AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection [9.5] AnywhereDoorは、オブジェクト検出のためのマルチターゲットバックドアアタックである。
敵は、すべてのオブジェクトクラスまたは特定のオブジェクトクラスをまたいで、オブジェクトを消したり、新しいオブジェクトを作ったり、ラベルを間違えたりすることができる。
このような柔軟な制御のための既存の手法の適応と比較して、攻撃成功率を26%向上させる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:12:52 GMT)
Translating Between the Common Haar Random State Model and the Unitary Model [9.5] いくつかの分離はCommon Haar Random State (CHRS)モデルで知られている。
我々は、CHRS分離を汎用的に持ち上げることができる一般的な条件を証明した。
従来CHRSモデルでしか知られていなかった新たな分離と同様に,既存の分離の簡易な証明を可能にした。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:52:48 GMT)
Emergent Abilities in Large Language Models: A Survey [9.5] 大規模言語モデル(LLM)は、人工知能への最も有望な研究の流れの1つとして、新しい技術革命を導いている。
これらのモデルのスケーリングは、以前は観測されていなかった様々な創発的能力と関連付けられている。
これらの能力は、高度な推論やコンテキスト内学習からコーディングや問題解決まで多岐にわたる。
トランスフォーメーションの可能性にもかかわらず、創発的能力は未理解のままであり、定義、性質、予測可能性、含意について誤解を招く。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:28:04 GMT)
Compound Expression Recognition via Large Vision-Language Models [9.4] 複合表現認識(CER)は、人間の感情を理解し、人間とコンピュータの相互作用を改善するために重要である。
これらの問題に対処するため、我々はLVLM(Large Vision-Language Models)を利用した新しいアプローチを提案する。
提案手法は,2段階の微調整プロセスを用いており,第1に,事前学習したLVLMは基本的表情に基づいて微調整を行い,基礎的パターンを確立する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:46:05 GMT)
PBR3DGen: A VLM-guided Mesh Generation with High-quality PBR Texture [9.3] 高品質なPBR材料を用いた2段階メッシュ生成法であるPBR3DGenを提案する。
視覚言語モデル(VLM)を用いて多視点拡散を誘導し,反射金属材料の空間分布と特性を正確に把握する。
我々の復元モデルはPBR材料で高品質なメッシュを再構築する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:11:19 GMT)
SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion [9.2] 本稿では,エンドツーエンドの文書変換を目的とした超コンパクトな視覚言語モデルであるSmolDoclingを紹介する。
我々のモデルは、新しいユニバーサルマークアップフォーマットであるDocTagsを生成することによって、ページ全体を包括的に処理する。
SmohDoclingは、コードリスト、テーブル、方程式、チャート、リストなどのドキュメント機能を正しく再現する上で、堅牢なパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:44:14 GMT)
Nonreciprocal quantum photon-pair source with chiral ferroelectric nematics [9.2] マイクロ/ナノスケールヘリカル構造非線形光学流体に高効率な量子光子源を実験的に実装した。
両光子生成における22.6dBの分離と、古典的な光学的相互性を維持しながら、非相互量子偏光状態の分離を実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:42:30 GMT)
GauSTAR: Gaussian Surface Tracking and Reconstruction [9.0] GauSTARは、写真リアルなレンダリング、正確な表面再構成、信頼性の高い3Dトラッキングを実現する新しい手法である。
本手法は動的表面を効果的に追跡・再構成し,様々な応用を可能にする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:19:59 GMT)
Resource Constrained Pathfinding with A* and Negative Weights [8.9] 制約付きパスフィニングはよく研究されているが、ネットワーク最適化の問題である。
本稿では,大規模ネットワークにおけるRCSPに取り組むために,A*に基づく新たなリソース制約付き検索フレームワークを提案する。
文献の最先端RCSPアルゴリズムと比較して最大2桁高速な性能を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:06:40 GMT)
Optimal Transport and Adaptive Thresholding for Universal Domain Adaptation on Time Series [8.9] UniDAは、クラスが完全に共有されていない場合でも、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することを目的としている。
輸送コストの未知のターゲットサンプルを最適輸送方式であるUniJDOTを紹介する。
TSベンチマークの実験では、UniJDOTの識別性、堅牢性、最先端性能が示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:09:21 GMT)
Upcycling Text-to-Image Diffusion Models for Multi-Task Capabilities [8.8] マルチタスク・アップサイクリング(Multi-Task Upcycling, MTU)は、トレーニング済みのテキスト・ツー・イメージ拡散モデルの能力を拡張し、様々な画像・画像生成タスクをサポートするレシピである。
MTUは、マルチタスクとデバイス上の互換性をシームレスにブレンドする最初のマルチタスク拡散モデリング手法である。
MTUの性能は,複数のタスクにまたがる単一タスクの微調整拡散モデルと同等であることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:19:20 GMT)
Trust in Disinformation Narratives: a Trust in the News Experiment [8.8] 本研究の目的は,ジェンダー,気候変動,CO-19VIDに基づく偽ニュース記事の信頼度を検討することである。
オンライン実験参加者は,3つの偽ニュース記事を読み,信頼度を1件(真実ではない)から8件(真実)に評価するよう求められた。
その結果、ニュース記事、スタンス、人々の年齢、性別、政治的イデオロギーの話題がニュースに対する信頼のレベルに著しく影響を与えているのに対し、著者(人間またはChatGPT)は大きな影響を与えていないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:28:22 GMT)
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model [8.7] Bird's-Eye-View (BEV) 画像は、自動運転において最も広く採用されているデータ表現の1つである。
ポーズの条件生成としてLiDAR局所化を定式化する新しいフレームワークであるBEVDiffLocを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:17:43 GMT)
Deep Lossless Image Compression via Masked Sampling and Coarse-to-Fine Auto-Regression [8.7] 本稿では,マスクサンプリングと粗大な自動回帰によるロスレス画像圧縮を提案する。
これは、様々な方向からコンテキストを融合させる、損失のある再構築と漸進的な残留圧縮を組み合わせたものである。
提案手法は、競合する符号化速度と柔軟性を有する広範囲なデータセットにおいて、同等の圧縮性能を実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:29:55 GMT)
Context-Aware Rule Mining Using a Dynamic Transformer-Based Framework [8.5] 本研究では,改良されたTransformerアーキテクチャに基づく動的ルールデータマイニングアルゴリズムを提案する。
改良されたTransformerモデルにより,ルールマイニングの精度,カバレッジ,安定性が大幅に向上したことを示す。
今後の研究は、計算効率の最適化と、より深い学習技術を組み合わせて、アルゴリズムの適用範囲を広げることに注力する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:37:04 GMT)
PrivacyScalpel: Enhancing LLM Privacy via Interpretable Feature Intervention with Sparse Autoencoders [8.5] 大規模言語モデル(LLM)は自然言語処理において顕著な能力を示したが、個人識別情報(PII)を記憶・漏洩することによりプライバシーリスクを生じさせる。
差分プライバシーやニューロンレベルの介入のような既存の緩和戦略は、しばしばモデルユーティリティを劣化させたり、リークを効果的に防いだりしない。
性能を維持しながらPIIリークを識別・緩和するために解釈可能性技術を活用する,新たなプライバシ保護フレームワークであるPrivacyScalpelを紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:31:01 GMT)
Fast and Robust Localization for Humanoid Soccer Robot via Iterative Landmark Matching [8.5] 本稿では,ヒューマノイドロボットの反復的ランドマークマッチング(ILM)による高速でロバストなローカライズ手法を提案する。
提案手法の有効性を実験を通じて徹底的に評価し, ヒューマノイドロボットARTEMISで検証した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:36:09 GMT)
OmniDiff: A Comprehensive Benchmark for Fine-grained Image Difference Captioning [8.4] OmniDiffは324の多様なシナリオスパンニング現実環境と3D合成環境からなる包括的データセットである。
M$3$Diffは、MDP(Multi-scale Differential Perception)モジュールによって拡張されたMultiModalの大型言語モデルである。
M$3$Diffは、Spot-the-Diff、IEdit、CLEVR-Change、CLEVR-DC、OmniDiffなど、複数のベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:34:16 GMT)
Do Comments and Expertise Still Matter? An Experiment on Programmers' Adoption of AI-Generated JavaScript Code [8.4] AI生成コードの採用は、AI生成ソリューションと参加者が提出したソリューションのコード類似性によって評価された。
その結果,コメントの存在は,参加者の開発専門知識に関わらず,プログラマのAI生成コードの採用に大きく影響していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:42:51 GMT)
Riemannian Geometric-based Meta Learning [8.4] 「学習への学習」は、最小限のデータでモデルが新しいタスクに迅速に適応できるようにすることを目的としている。
Model-Agnostic Meta-Learning (MAML)のような従来の手法は、複雑な学習力学を捉えるのに苦労することが多い。
シュティーフェル多様体内を最適化することによりリーマン幾何学を統合するシュティーフェル-MAMLを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:34:55 GMT)
Do Construction Distributions Shape Formal Language Learning In German BabyLMs? [8.3] ドイツ語の児童指向音声における発話レベルの構成分布が形式的言語能力に与える影響を解析する。
トレーニングデータ中の構造が著しく異なる場合、トラジェクトリは驚くほど堅牢であることがわかった。
我々は、発達的に妥当なデータに基づいて訓練されたLMが、言語刺激がいかに豊かであるか、あるいは不十分であるかについての議論に寄与すると主張している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:02:45 GMT)
Designing Neural Synthesizers for Low Latency Interaction [8.3] 対話型ニューラルオーディオ合成(NAS)モデルで典型的に見られる遅延源とジッタについて検討する。
次に、この解析を畳み込み変分オートエンコーダであるRAVEを用いて音色伝達のタスクに適用する。
これは、私たちがBRAVEと呼ぶ低レイテンシで、ピッチと大音量の再現性が向上したモデルで終わる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:30:31 GMT)
TigerLLM -- A Family of Bangla Large Language Models [8.3] バングラ語モデルのファミリーであるTigerLLMを紹介します。
以上の結果から,これらのモデルがすべてのオープンソース代替品を上回り,GPT3.5のような大型のプロプライエタリモデルを上回る結果が得られた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:41:16 GMT)
LuSeg: Efficient Negative and Positive Obstacles Segmentation via Contrast-Driven Multi-Modal Feature Fusion on the Lunar [8.2] 我々は月面探査シミュレータ(LESS)と呼ばれる月面シミュレーションシステムを開発した。
また,LuSegと呼ばれる新しい2段階セグメンテーションネットワークを提案する。
LuSegはステージIのRGBエンコーダとステージIIの深さのセマンティック一貫性を強制する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:51:52 GMT)
Heterogeneous Causal Discovery of Repeated Undesirable Health Outcomes [8.2] 因果発見は、観測データから原因と効果の仮説を生成することによって、従来のアプローチに代わる手段を提供する。
しばしば強いあるいは証明不可能な仮定に頼り、その実践的応用を制限することができる。
本研究は、複数の仮定を考慮し、異種効果を同定することにより、因果発見をより実用的なものにすることを目的としている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:05:17 GMT)
Quantum Parameter Estimation for Detectors in Constantly Accelerated Motion [8.1] 加速検出器の状態パラメータの量子フィッシャー情報(QFI)のダイナミクスを解析する。
十分に大きな加速に対して、加速パラメータを推定する最適な精度は、有限進化時間で達成できる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:26:22 GMT)
UMB@PerAnsSumm 2025: Enhancing Perspective-Aware Summarization with Prompt Optimization and Supervised Fine-Tuning [8.1] 本稿では,パーアンサム共有タスク(PerAnsSumm Shared Task)について,パースペクティブ・スパン識別とパースペクティブ・アウェア・サマリゼーションを包含するアプローチを提案する。
スパン識別には、平均化によって3つのトランスフォーマーモデルを統合するアンサンブル学習を採用し、個々のモデルの強みを利用する。
要約のために、キーフレーズを組み込んだ一連のCoT(Chain-of-Thought)を設計し、要約生成を管理可能なステップに導く。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:29:51 GMT)
GMG: A Video Prediction Method Based on Global Focus and Motion Guided [8.0] 現在の予測モデルは、特徴抽出のために畳み込み操作やスライディングウィンドウに依存している。
気象データは、しばしば非剛体で、その運動過程は予測不可能な変形を伴う。
これら2つの課題に対処するためのGMGモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:06:49 GMT)
Preference Elicitation for Multi-objective Combinatorial Optimization with Active Learning and Maximum Likelihood Estimation [8.0] 現実の最適化問題には、価格、製品品質、持続可能性など、相反する目標が伴うことが多い。
複数の目的に対処する計算効率のよい方法は、それらを線形結合のような単目的関数に集約することである。
Constructive Preference Elicitationフレームワークを構築し、これらの3つのプロパティをどのように改善できるかを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:24:27 GMT)
Multimodal-Aware Fusion Network for Referring Remote Sensing Image Segmentation [8.0] リモートセンシング画像セグメンテーション(RRSIS)は、リモートセンシング画像セグメンテーションにおける新しい視覚課題である。
我々は,2つのモード間の微粒なアライメントと融合を実現するために,マルチモーダル・アウェア・フュージョン・ネットワーク(MAFN)を設計する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:31:21 GMT)
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning [7.9] マルチモーダル表現学習は、複数のモーダルをまたいだ共有情報と相補的セマンティック情報の両方をキャプチャすることを目的としている。
マルチモーダル表現をモダリティ・ユニク(異種)とモダリティ・コモン(異種)に分離するために設計された,新しい階層的クロスモーダルアライメントフレームワークであるDecAlignを紹介する。
広く使われている4つのマルチモーダルベンチマーク実験により、DecAlignは既存の最先端手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:47:48 GMT)
CoPAL: Corrective Planning of Robot Actions with Large Language Models [7.9] 本稿では,認知レベル間のシームレスな相互作用を編成し,推論,計画,動作生成を包含するシステムアーキテクチャを提案する。
中心となるのは、生成した計画における物理的に基底的、論理的、セマンティックなエラーを処理する、新しいリプラン戦略である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:03:24 GMT)
Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality [7.9] 視覚的でない命令信号を視覚的に表現する「仮想誘導」技術を紹介する。
これらの視覚的手がかりは、エージェントのカメラビューにオーバーレイされ、分かりやすいナビゲーション誘導信号として機能する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:17:05 GMT)
Rule-Guided Feedback: Enhancing Reasoning by Enforcing Rule Adherence in Large Language Models [7.8] Rule-Guided Feedback (RGF)は、LLM(Large Language Model)のパフォーマンスを向上させるために設計されたフレームワークである。
RGFは、ルールフォローが確立されたガイドラインによって強制される教師学生パラダイムを実装している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:05:06 GMT)
RESPONSE: Benchmarking the Ability of Language Models to Undertake Commonsense Reasoning in Crisis Situation [7.8] 提案するTextsfRESPONSEは,6037の質問を含む1789の注釈付きインスタンスを含むデータセットである。
このデータセットには、問題記述、不足するリソース、時間に敏感なソリューション、およびそれらの正当化が含まれており、環境エンジニアによって検証されているサブセットが含まれている。
以上の結果から,GPT-4のような最先端モデルでさえ,即時反応の正当性は37%に過ぎなかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:32:40 GMT)
Resolving UnderEdit & OverEdit with Iterative & Neighbor-Assisted Model Editing [7.8] 大規模言語モデル(LLM)は、様々な下流言語タスクで使用される。
モデルの再トレーニングと微調整はどちらもコストがかかる可能性がある。
モデル編集は、モデルパラメータの重要なサブセットにのみ更新することで、効率的で効果的な代替手段を提供する。
単一パラメータの更新が不十分な場合が多いという仮説に基づいて,反復的モデル編集を提案する。
提案手法は,複数のモデル編集アルゴリズム,LLM,ベンチマークデータセットに対して,最大38ポイント,OverEditを最大6ポイント削減する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:53:12 GMT)
Real-Time Decision-Making for Digital Twin in Additive Manufacturing with Model Predictive Control using Time-Series Deep Neural Networks [7.7] Digital Twinは、リアルタイム監視、モデル更新、予測、意思決定を可能にする物理システムの仮想レプリカである。
本稿では,リアルタイム意思決定のためのマルチステップモデル予測制御フレームワークを提案する。
また,TiDEは溶融プール温度と深さを正確に予測できることを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:33:47 GMT)
Potential Applications of Quantum Computing at Los Alamos National Laboratory [7.6] 過去10年間の量子コンピューティング技術の出現は、量子力学システムの研究における変革的な影響の可能性を示している。
本稿では,ロスアラモス国立研究所の様々な量子物理学研究活動を強化するために,量子コンピューティング技術をどのように活用できるかを詳細に検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:16:42 GMT)
CURIE: Evaluating LLMs On Multitask Scientific Long Context Understanding and Reasoning [7.4] 我々は、科学的な問題解決におけるLarge Language Models(LLM)の可能性を測定するためのベンチマークであるCURIEを紹介する。
このベンチマークでは、合計580の課題と6つの分野の専門家がキュレートしたソリューションペアを備えた10の課題が紹介されている。
CURIEのタスクには、ドメインの専門知識、長いコンテキスト内情報の理解、複数ステップの推論を必要とする、クローズドでオープンなLCMを幅広く評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:53:03 GMT)
Enhancing Deep Learning Based Structured Illumination Microscopy Reconstruction with Light Field Awareness [7.3] 本稿では,データ分散シフトによる誤差を補正するために,実際の光場を直接推定するAL-SIM(Awareness-of-Light-field SIM)再構成手法を提案する。
本手法は,正規化ルート平均二乗誤差(NRMSE)を7%低減し,再建アーチファクトを大幅に低減することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:56:49 GMT)
FMNet: Frequency-Assisted Mamba-Like Linear Attention Network for Camouflaged Object Detection [7.2] カモフラージュ対象物検出(COD)は、カモフラージュ対象物とその周囲の強い類似性のために困難である。
既存の手法は主に空間的局所的特徴に依存しており、グローバルな情報を捉えていない。
これを解決するために、FMNet ( Frequency-Assisted Mamba-Like Linear Attention Network) を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:55:19 GMT)
Harvesting correlations from BTZ black hole coupled to a Lorentz-violating vector field [7.2] ローレンツ違反は、時空の量子的性質として、時空で符号化された量子情報容量に固有の制約を課す可能性がある。
ローレンツ対称性の破れは、交絡影領域を拡張し、量子相関に対する破壊的な効果を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:44:38 GMT)
AI-assisted Early Detection of Pancreatic Ductal Adenocarcinoma on Contrast-enhanced CT [7.2] 膵管腺癌 (PDAC) は, 膵癌で最も多く, 活発な膵癌の1つである。
本研究ではコントラスト強調CTでPDACを検出するための粗大なアプローチを開発する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:17:12 GMT)
Observation-Graph Interaction and Key-Detail Guidance for Vision and Language Navigation [7.2] 視覚と言語ナビゲーション(VLN)では、エージェントが自然言語の指示に従う環境をナビゲートする必要がある。
既存の手法は、ナビゲーション中に視覚的な観察と指示の詳細を効果的に統合するのに苦労することが多い。
OIKGは2つのキーコンポーネントを通してこれらの制限に対処する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:05:16 GMT)
CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.1] 交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:40:39 GMT)
Training Diagonal Linear Networks with Stochastic Sharpness-Aware Minimization [7.0] 線形回帰課題における対角線ネットワークのランドスケープとトレーニングのダイナミクスを解析する。
基礎となる景観に対する作用とトレーニングのダイナミクスと損失の鋭さを関連づけたいくつかの結果が証明された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:45:12 GMT)
A study of why we need to reassess full reference image quality assessment with medical images [7.0] PSNRとSSIMは、多くの自然画像処理に成功するために知られ、テストされている。
医療シナリオの相違が報告され、開発と実際の臨床応用のギャップを浮き彫りにしている。
本稿では,PSNR と SSIM が新規アルゴリズムの評価に不適であることが証明された事例について概説する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:56:29 GMT)
Learn to Teach: Sample-Efficient Privileged Learning for Humanoid Locomotion over Diverse Terrains [7.0] 本研究は,教師と学生の政策学習を統合したワンステージ・トレーニング・フレームワーク,Learn to Teach (L2T)を提案する。
提案手法は, サンプルをリサイクルし, 共有力学を用いて学習軌跡を同期させ, サンプルの複雑さと学習時間を著しく低減する。
深度推定モジュールを使わずに12以上の困難な地形上で, ゼロショットのシミュレートとロバストな性能を実証し, シミュレーションとハードウェアテストによりRL変種(L2T-RL)を検証した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:05:18 GMT)
Ranking and Selection with Simultaneous Input Data Collection [6.9] 本稿では,ストリーミング入力データに基づくランキングと選択の新たな定式化を提案する。
我々は、不均一な入力分布で生成されるシミュレーション出力を時間とともに集約し、性能推定器を構成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:04:55 GMT)
Disentangled Object-Centric Image Representation for Robotic Manipulation [6.8] 本研究では,対象物,障害物,ロボットの体現物に対する不整合表現を導入したオブジェクト中心のフレームワークであるDOCIRを提案する。
提案手法は,多目的環境における視覚的インプットから選択と配置のスキルを習得する上で,最先端のパフォーマンスに繋がることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:33:48 GMT)
A Two-Step Concept-Based Approach for Enhanced Interpretability and Trust in Skin Lesion Diagnosis [6.7] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解できない概念のセットに対する最終疾患予測を制約することにより、固有の解釈可能性を提供する。
これらの課題に対処する新しい2段階の方法論を導入する。
CBMの2段階をシミュレートすることにより,臨床概念を自動予測する事前訓練型視覚言語モデル(VLM)と,外来型大規模言語モデル(LLM)を用いて疾患診断を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:51:44 GMT)
The Feedback Loop Between Recommendation Systems and Reactive Users [6.7] ユーザの意見力学とレコメンデーションシステムとのフィードバックループをモデル化する。
反応ポリシーは、ユーザーが望ましくない意見の変化を効果的に防いだり、制限したりするのにどう役立つかを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:45:57 GMT)
Enhancing Resiliency of Sketch-based Security via LSB Sharing-based Dynamic Late Merging [6.6] 我々は、最先端のスケッチとそのセキュリティアプリケーションのストリームを脅かす新しいスケッチ指向の攻撃を導入する。
Siamese Counterは最先端のスキームよりも47%正確な結果を提供し、通常の測定シナリオでは最大82%の精度で推定できる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:12:14 GMT)
Interpretation of Superradiant Ramsey Spectroscopy in a Coherent Picture Based on Transverse Spins Superposition [6.4] 最近の実験では、ストロンチウム88原子がレーザーパルスによって横に励起される遅延超放射能を持つラムゼイ分光法が実証された。
2つの原子サブアンサンブルの逆集合スピン作用素の相内および相外重ね合わせを考慮し、2つの相補的画像を導入する。
シミュレーションにより,外部駆動のダイナミックスに異なる画像を用いることで,原子アンサンブル全体のコヒーレントな画像が確立できることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:46:45 GMT)
A Novel Decomposed Feature-Oriented Framework for Open-Set Semantic Segmentation on LiDAR Data [6.4] 本稿では,LiDARデータのオープンセットセマンティックセマンティックセグメンテーションのための特徴指向フレームワークを提案する。
閉集合セマンティックセマンティックセグメンテーションを同時に実行し、未知のオブジェクトに特有の特徴を生成するために、デュアルデコーダネットワークを設計する。
近接したセマンティックセグメンテーションと異常検出の結果を統合することで、効率的な特徴駆動型LiDARオープンセットセマンティックセグメンテーションを実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:40:05 GMT)
Heterogenous graph neural networks for species distribution modeling [6.4] グラフニューラルネットワーク(GNN)を用いた新しい存在のみの種分布モデル(SDM)を提案する。
本モデルでは, 種と位置を2つの異なるノード集合として扱い, 学習課題は, 位置と種をつなぐエッジとして検出記録を予測している。
SDMのベンチマークのためのNational Center for Ecological Analysis and Synthesis (NCEAS) によってコンパイルされた6領域データセット上で,本手法の可能性を評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:08:30 GMT)
Hyperparameter Selection in Continual Learning [6.4] 学習者がデータのストリームでトレーニングを行う連続学習(CL)では、標準パラメータ最適化(HPO)を適用することはできない。
学習者がストリームを一度しか見ることができないため、トレーニング終了のHPOは実際には使用できない。
我々は、トレーニング終了を含むHPOフレームワークが、人気のあるCLベンチマークの他のフレームワークよりも一貫してパフォーマンスが向上していることを発見した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:30:09 GMT)
From Abstraction to Reality: DARPA's Vision for Robust Sim-to-Real Autonomy [6.4] TIAMATは、動的および複雑な環境にまたがる自律技術の迅速かつ堅牢な移行に取り組むことを目的としている。
現在のシミュレート・トゥ・リアル(シミュレート・トゥ・リアル)転送の方法は、しばしば高忠実度シミュレーションに依存している。
TIAMATのアプローチは、効果的かつ迅速な現実世界適応のための抽象的から現実的移行を実現することを目的としている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:06:10 GMT)
Crafting Synthetic Realities: Examining Visual Realism and Misinformation Potential of Photorealistic AI-Generated Images [6.3] この研究は、AIGIのAIフォトリアリズムを4つの重要な側面、コンテンツ、人間、美学、生産機能から解き放つ。
フォトリアリスティックAIGIは、しばしば人間の人物、特に有名人や政治家を描写する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:38:35 GMT)
Real-time edge dynamics of non-Hermitian lattices [6.2] 時間的極限におけるすべての次元の一般非エルミート帯域系の開辺におけるグリーン函数の形式を導出する。
エッジ力学は複素運動量である「支配サドル点」によって決定され、これは以前の予想とは対照的に、一般化されたブリルアンゾーンの外側にある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:28:49 GMT)
Diverse Projection Ensembles for Distributional Reinforcement Learning [6.1] 分布強化学習アルゴリズムは、期待値ではなく、リターンの分布を学習することを目的としている。
分布アンサンブルにおける複数の異なる射影と表現の組み合わせについて検討する。
我々は,平均1-ワッサーシュタイン距離で測定されたアンサンブル不一致を,深層探査のボーナスとして利用するアルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:26:57 GMT)
FastCHGNet: Training one Universal Interatomic Potential to 1.5 Hours with 32 GPUs [5.9] グラフニューラルネットワークユニバーサル原子間ポテンシャル(GNN-UIPs)は、物質発見と特性予測において顕著な一般化と伝達能力を示す。
注目すべき例としてCrystal Hamiltonian Graph Neural Network (CHGNet)があり、MPtrjデータセットからエネルギー、力、応力、磁気モーメントを事前訓練している。
本稿では3つのコントリビューションを持つ最適化CHGNetであるFastCHGNetを紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:01:35 GMT)
Behavioral Machine Learning? Computer Predictions of Corporate Earnings also Overreact [5.9] 先行する手法がニュースに体系的に過剰反応していることを示す。
機械学習トレーニングを持つアナリストは、従来のアナリストよりもはるかに少ない。
我々の発見は、AIツールが金融市場の行動バイアスを減らしているわけではないことを示唆している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:54:43 GMT)
Quantifying Interpretability in CLIP Models with Concept Consistency [5.9] CLIPのようなモデルにおける注意頭のためのテキスト記述の概念的一貫性について検討する。
本稿では,新しい解釈可能性尺度である概念一貫性スコア(CCS)を提案する。
我々は,高いCCSヘッドが重要な概念を捕捉し,ドメイン外検出,概念固有の推論,ビデオ言語理解において重要な役割を担っていることを発見した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:47:17 GMT)
Asynchronous Sharpness-Aware Minimization For Fast and Accurate Deep Learning [5.8] Sharpness-Aware Minimization (SAM) は機械学習モデルの一般化性能を改善する最適化手法である。
その優れた一般化にもかかわらず、SAMは高価な計算コストのために現実世界のアプリケーションでは積極的に使われていない。
本稿では,モデル摂動とモデル更新の間のデータ依存性を破りながら,オリジナルのSAMとほぼ同じ勾配正規化効果を達成できる新しい非同期並列SAMを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:34:39 GMT)
A Two-Stage Imaging Framework Combining CNN and Physics-Informed Neural Networks for Full-Inverse Tomography: A Case Study in Electrical Impedance Tomography (EIT) [5.8] 電気インピーダンストモグラフィーは非常に不適切な逆問題である。
本稿では,畳み込みニューラルネットワーク(CNN)とPINNを組み合わせた2段階のハイブリッド学習フレームワークを提案する。
このフレームワークはデータ駆動とモデル駆動のパラダイムを統合し、教師付き学習と教師なし学習を組み合わせて導電性を再構築する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:21:43 GMT)
Dynamic Obstacle Avoidance with Bounded Rationality Adversarial Reinforcement Learning [5.8] 本稿では,障害物を敵エージェントとしてモデル化するトレーニングプロセスにより,ロバスト性のあるナビゲーションポリシーを実現する新しい手法を提案する。
我々はこの手法を、量子応答適応強化学習(Hi-QARL)による多元的ポリシーと呼ぶ。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:54:02 GMT)
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Spatial Reasoning Questions [5.7] 本稿では,空間的タスクにRAGを拡張するフレームワークである空間検索拡張生成(Spatial-RAG)を提案する。
多目的ランキング戦略は空間的制約と意味的関連性のバランスを保ち、LLM誘導ジェネレータはコヒーレント応答を保証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:48:55 GMT)
Three-body scattering hypervolume of two-component fermions in three dimensions [5.7] 3つのフェルミオンのゼロエネルギー衝突について検討し、そのうちの2つはスピンダウン($downarrow$)状態にあり、そのうちの1つはスピンアップ($uparrow$)状態にある。
低エネルギーで衝突する3つのフェルミオンに対するT$-行列要素を、2体相互作用がない場合に$D$で計算する。
また、D$による大周期立方体における3つの2成分フェルミオンのエネルギーシフトを分析し、これを多価フェルミオン系に一般化する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:38:42 GMT)
COMMA: Coordinate-aware Modulated Mamba Network for 3D Dispersed Vessel Segmentation [5.7] コーディネート対応変調マンバネットワーク(COMMA)について紹介する。
これまでで最大規模の3Dコンテナデータセットである570件のデータセットを手作業でラベル付けしました。
COMMAを6つのデータセットで評価し,2つの画像モダリティと5種類の血管組織について検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:00:48 GMT)
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model [5.6] 不確かさの定量化は強化学習と深層学習の重要な側面である。
本研究では,1つのモデルによる深層ニューラルネットワークのアンサンブルの分散を明示的に推定する新しい手法である文脈類似蒸留を提案する。
提案手法は,様々なアウト・オブ・ディストリビューション検出ベンチマークとスパース・リワード強化学習環境にまたがって実証的に検証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:09:58 GMT)
Simulating Dual-Pixel Images From Ray Tracing For Depth Estimation [5.6] シミュレーションされたDPデータと実DPデータの領域ギャップについて検討し、レイトレーシング方式によるDP画像のシミュレーション手法を提案する。
SdirtスキームはレイトレーシングによりリアルなDP画像を生成し、それらを深度推定訓練パイプラインに統合する。
実験結果から,Sdirt-simulated image を用いて訓練したモデルは実DPデータより一般化された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:03:25 GMT)
Zero-shot Imputation with Foundation Inference Models for Dynamical Systems [5.5] 我々は,ODEによって決定されると仮定される時系列データの欠落を補うという古典的な問題に対して,新たな視点を提供する。
本稿では,いくつかの(隠れた)ODEを満たすパラメトリック関数を通じて,ゼロショット時系列計算のための新しい教師付き学習フレームワークを提案する。
我々は,1と同一(事前学習)の認識モデルが,63個の異なる時系列に対してゼロショット計算を行なえることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:37:14 GMT)
GPT's Devastated and LLaMA's Content: Emotion Representation Alignment in LLMs for Keyword-based Generation [5.5] 大きな言語モデル(LLM)を用いた制御されたテキスト生成では、言語モデルの解釈と人間の期待との間にギャップが生じる。
我々は4つの感情表現を選択した:単語、語彙と形の両方で表現されるValence-Arousal-Dominance(VAD)次元、および絵文字。
人間の評価では,各表現に対するHuman-LLMアライメントと,生成された文の精度とリアリズムを検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:07:56 GMT)
Characterizing GPU Resilience and Impact on AI/HPC Systems [5.5] 現在600ペタプロビジョン以上のピーク計算スループットを持つ大規模AIシステムであるDeltaのGPU障害を特徴付ける。
この研究はGPUエラーに関する2年半のデータを用いている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:14:18 GMT)
Why Johnny Signs with Sigstore: Examining Tooling as a Factor in Software Signing Adoption in the Sigstore Ecosystem [5.4] 我々は、現代的で広く採用されているソフトウェア署名ツールであるSigstoreの形式的ユーザビリティについて研究する。
ツールの選択に影響を与える要因について,13名 (13名) のセキュリティ実践者に対してインタビューを行った。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:30:15 GMT)
RONA: Pragmatically Diverse Image Captioning with Coherence Relations [5.2] RONAはマルチモーダル大規模言語モデルのための新しいプロンプト戦略である。
ronAは, 全体的な多様性と地道整合性を向上したキャプションを生成することを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:45:38 GMT)
Enhanced Soups for Graph Neural Networks [5.2] 個別に訓練されたグラフニューラルネットワーク(GNN)は、推論時に計算コストやメモリコストを増大させることなく、パフォーマンスを向上させることができる。
本稿では,時間とメモリのオーバーヘッドを大幅に低減する勾配差に基づくスープング戦略であるLearned Souping for GNNを紹介する。
また、メモリ使用量を大幅に削減する、新しいパーティションベースの学習スープの変種であるパーティションラーニングソーピングを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:29:27 GMT)
A Survey on SAR ship classification using Deep Learning [5.2] 深層学習(DL)は,SAR(Synthetic Aperture Radar)船舶分類の強力なツールとして登場した。
本調査は,本領域で使用されている多種多様なDL手法を包括的に分析する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:19:24 GMT)
FedALT: Federated Fine-Tuning through Adaptive Local Training with Rest-of-the-World LoRA [5.2] ファインチューニングされた大型言語モデル(LLM)は、プライバシ保護の適応を可能にするが、モデルアグリゲーションによるクロスクライアント干渉に悩まされる。
我々は,新しいパーソナライズされたLoRAファインチューニングアルゴリズムである textbfFedALT を提案する。
我々は,FedALTが,最先端のパーソナライズされたLoRAファインチューニング手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:07:46 GMT)
Conversational AI as a Coding Assistant: Understanding Programmers' Interactions with and Expectations from Large Language Models for Coding [5.1] 大規模言語モデル(LLM)を利用した会話型AIインタフェースは、コーディングアシスタントとしてますます利用されている。
本研究は,LLM駆動型コーディングアシスタントにおけるプログラマの利用パターン,知覚,インタラクション戦略について検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:06:07 GMT)
On the phase diagram of extensive-rank symmetric matrix denoising beyond rotational invariance [5.1] 我々は、信号が因子行列 $XXintercal$ で回転不変でないとき、行列の分解の理解に向けて前進する。
我々は、因子化(すなわち、$X$自身を推定する)が不可解な普遍性(英語版)(insolvable universality)まで可能となるのは、遷移を超えてのみであると主張する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:58:33 GMT)
Advancing 3D Gaussian Splatting Editing with Complementary and Consensus Information [5.0] テキスト誘導型3Dガウス版(3DGS)編集の視覚的忠実度と一貫性を向上させるための新しいフレームワークを提案する。
本手法は,最先端手法と比較して,レンダリング品質とビューの整合性に優れた性能を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:15:26 GMT)
MUSS: Multilevel Subset Selection for Relevance and Diversity [4.8] レコメンデーションシステムでは、さまざまなレコメンデーションを提供しながら、関連する項目を選択することに興味がある。
関連性および多種多様な選択に対する多レベルアプローチを用いた新しい手法であるMUSSを提案する。
本手法はベースラインと同等の性能を達成できるが, 4.5倍から20倍高速である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:37:17 GMT)
FlowKac: An Efficient Neural Fokker-Planck solver using Temporal Normalizing flows and the Feynman Kac-Formula [4.8] FlowKacは、Fokker-Planck方程式をFeynman-Kac公式を用いて再構成する新しいアプローチである。
FlowKacの重要な革新は、計算の複雑さを大幅に減らす適応型サンプリング方式にある。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:14:20 GMT)
High Probability Guarantees for Random Reshuffling [4.8] 最適化問題に対処するためにランダムリシャッフル(mathsfRR$)の勾配法を検討する。
本手法の1次複雑性保証を行う。
我々は、$mathsfp$-$mathsfRR$provably escapes strict point and a high tail.
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:45:53 GMT)
Multi-Knowledge-oriented Nighttime Haze Imaging Enhancer for Vision-driven Intelligent Transportation Systems [4.7] ヘイズなどの逆画像条件は、画質を著しく劣化させる。
マルチ知識指向型夜間ヘイズイメージングエンハンサー(MKoIE)を提案する。
MKoIEは、昼間の脱毛、低照度強化、夜間の脱毛という3つのタスクを統合している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:54:26 GMT)
Josephson traveling-wave parametric amplifier based on low-intrinsic-loss coplanar lumped-element waveguide [4.7] 本稿では、低損失コプラナーラム素子導波路アーキテクチャに基づくJTWPA(Josephson Travel-wave Parametric GC)を提案する。
オープンスタブコンデンサとマンハッタンパターンジャンクションを用いることで、1dB以下で最大12GHzの挿入損失が得られる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:13:41 GMT)
Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning [4.7] 現実世界における低コスト四足歩行ロボットの方向移動の深層強化学習訓練について述べる。
我々は、動作状態遷移の探索を促進するためにロボットが従わなければならない方向のランダム化を利用する。
エピソードの先頭のリセットを現在のヨーと通常の分布から引き出されたランダムな値に変更すると、複雑な軌跡に従うことができるポリシーが得られる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:53:01 GMT)
Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments [4.7] シミュレーションから実時間DRL法を探索するための低コストな物理逆振り子装置とソフトウェア環境について述べる。
特に,本装置の設計により,センサ,通信,学習,推論,動作時の物理的システムに発生する遅延を詳細に調べることができる。
我々のデザインは、市販の電子製品や電気機械、センサーシステム、一般的な金属押出成形、ドール、3Dプリントのカップリングと組み合わせることで、安価な物理DRL装置を実現する方法を示している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:18:36 GMT)
RAG-KG-IL: A Multi-Agent Hybrid Framework for Reducing Hallucinations and Enhancing LLM Reasoning through RAG and Incremental Knowledge Graph Learning Integration [4.6] RAG-KG-ILは、大規模言語モデルの推論能力を高めるために設計された、新しいマルチエージェントハイブリッドフレームワークである。
Retrieval-Augmented Generation (RAG) と Knowledge Graphs (KG) をインクリメンタルラーニング (IL) アプローチに統合する。
我々は、健康関連クエリを含む実世界のケーススタディを用いて、このフレームワークを評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:50:16 GMT)
Preparing magnonic non-Gaussian states by adding a single magnon onto Gaussian states [4.6] 2つのガウス状態に1つのマグノンを加えることで、2種類の非ガウス的マグノン状態を作成する。
どちらの状態も、コヒーレントまたは熱マグノン励起を変化させることで、量子状態から古典状態への滑らかな遷移を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:44:22 GMT)
REGEN: A Dataset and Benchmarks with Natural Language Critiques and Narratives [4.6] Amazon Product Reviewsデータセットを拡張して,2つの重要な自然言語機能を取り入れています。
ストーリーには、製品の支持、購入説明、ユーザの好みの要約が含まれる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:47:46 GMT)
Floquet-ADAPT-VQE: A Quantum Algorithm to Simulate Non-Equilibrium Physics in Periodically Driven Systems [4.6] 本稿では、周期的に駆動される量子系の非平衡物理学をシミュレートするハイブリッド量子古典アルゴリズムFloquet-ADAPT-VQEを提案する。
磁場を伴う周期駆動型XYZモデル上で数値シミュレーションを行うことにより,本アルゴリズムを実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:32:52 GMT)
Expressive Music Data Processing and Generation [4.5] 音楽の表現性とコヒーレンスは、作曲と演奏に不可欠である。
本稿では,演奏の表現性を捉えるリスニングに基づくデータ処理手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:56:07 GMT)
Noise-strength-adapted approximate quantum codes inspired by machine learning [4.5] 我々は2つの新しい種類のノイズ強度適応型AQEC符号、すなわち自己補完型コードとペア補完型コードを構築した。
4ビットの自己補完型NSAコードは、非NSAコードよりも忠実さとKnill-Laflamme条件違反で優れています。
さらに、任意のシステムサイズを持つNSA AD符号の族へのアプローチと、単一光子損失のための0-2-4二項符号のNSA変種へのアプローチを一般化する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:17:26 GMT)
LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama [4.5] 本研究ではラトビアとジリアマの8つの言語モデル(LLM)を評価する。
OpenAIのo1モデルは、英語で92.8%、ラトビアで88.8%、グリアマで70.8%、全言語で他より優れています。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:50:50 GMT)
Optimizing Large Language Models for Detecting Symptoms of Comorbid Depression or Anxiety in Chronic Diseases: Insights from Patient Messages [4.4] 糖尿病患者は、うつ病や不安のリスクが高く、管理を複雑にしている。
本研究は,患者メッセージからこれらの症状を検出するための言語モデル(LLM)の性能を評価した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:27:35 GMT)
Collaboration is all you need: LLM Assisted Safe Code Translation [4.4] UniTranslatorは、複数のコンパクトLLM間の協調的な取り組みとしてコード翻訳を再想像するフレームワークである。
特殊なエージェントのインタラクションを編成することによって、UniTranslatorは、より大きなモノリシックモデルに匹敵する精度と効率のレベルを達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:42:07 GMT)
Road Rage Reasoning with Vision-language Models (VLMs): Task Definition and Evaluation Dataset [4.4] 交通渋滞やアグレッシブな運転などの運転関連の刺激によって引き起こされる道路の怒りは、道路の安全に重大な脅威をもたらす。
道路規制に関するこれまでの研究は、主に応答抑制に焦点を合わせており、予防能力は欠如している。
VLM(Vision-Language Models)の出現により、ドライバーの怒りがエスカレートする前に、視覚的にイベントをトリガーし、ダイアログベースの慰めを行うことが可能になった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:18:11 GMT)
BannerAgency: Advertising Banner Design with Multimodal LLM Agents [4.3] 本稿では,完全自動バナー広告デザイン作成のためのトレーニングフリーフレームワークを提案する。
本稿では,BannerAgencyというMLLMエージェントシステムについて紹介する。
マッチングされた背景画像を生成し、前景のデザイン要素のための青写真を作成し、最終的な創造物をFigmaやSVGフォーマットで編集可能なコンポーネントとしてレンダリングする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:54:05 GMT)
In Shift and In Variance: Assessing the Robustness of HAR Deep Learning Models against Variability [4.3] ウェアラブル慣性測定ユニット(IMU)センサーを用いたHAR(Human Activity Recognition)は、継続的な健康モニタリング、疾患予測、定期的な認識を可能にして、医療に革命をもたらすことができる。
ディープラーニング(DL)HARモデルの精度は高いが、実世界の変動に対する堅牢性はまだ証明されていない。
対象, 装置, 位置, 方向の変動を分離し, DL HARモデルへの影響を判定し, 実環境におけるそれらのモデルのロバスト性を評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:53:56 GMT)
QPRAC: Towards Secure and Practical PRAC-based Rowhammer Mitigation using Priority Queues [4.1] JEDECは、DDR5と将来のDRAMのためのPer Row Activation Counting (PRAC)フレームワークを導入した。
PRACはローハンマー攻撃の全体的緩和を可能にする。
本稿では,PRACフレームワークを使用した最初のセキュアでスケーラブルで実用的なRowHammerソリューションを提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:30:13 GMT)
A Multi-Objective Evaluation Framework for Analyzing Utility-Fairness Trade-Offs in Machine Learning Systems [4.0] 本研究では,機械学習システムにおけるユーティリティフェアネストレードオフの分析を可能にする,新たな多目的評価フレームワークを提案する。
このフレームワークはモデルに依存しず柔軟性があり、あらゆる種類の機械学習システムに適用できる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:32:42 GMT)
Creating a Good Teacher for Knowledge Distillation in Acoustic Scene Classification [3.9] 知識蒸留(KD)は、大規模モデルの知識をよりコンパクトで効率的なモデルに圧縮する技術である。
KDは、高い性能の低複雑性音響シーン分類(ASC)システムを構築するのに非常に有効であることが証明されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:57:12 GMT)
Potential of large language model-powered nudges for promoting daily water and energy conservation [3.9] 本研究では, 大規模言語モデル (LLM) を用いて, 適切な保全提案を行うことによる影響について検討した。
LLMを動力とするヌードは最大18.0%増加し、従来のヌードを88.6%上回った。
これらの知見は、個々の水とエネルギーの保存を促進する上でのLLMの変換ポテンシャルを浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:58:11 GMT)
ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement [3.9] 臨床画像では、磁気共鳴(MR)画像の体積は2次元スライス(英語版)のスタックとして取得され、スキャン時間が短縮され、信号-雑音比が向上し、2次元MRパルスシーケンスに特有のコントラストが向上する。
これは臨床評価に十分であるが、3D解析用に設計された自動アルゴリズムは2D取得スキャン、特に厚いスライスとスライス間の隙間を持つスキャンに対して準最適に実行する。
超解像法(SR)はこの問題に対処することを目的としているが、以前の方法はスライスプロファイル形状推定、スライスギャップ、ドメインシフト、非整数/任意といった全ての問題に対処していない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:24:35 GMT)
Floquet non-Abelian topological charges and edge states [3.8] 非アベリアトポロジカル絶縁体は、複数のエネルギーギャップに関する行列値の非可換トポロジカル電荷によって特徴づけられる。
フロケ駆動は非アベリア物質のトポロジーと相転移を富むだけでなく、非平衡な設定に特有のバルクエッジ対応を誘導できることを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:29:38 GMT)
Combating the Effects of Cyber-Psychosis: Using Object Security to Facilitate Critical Thinking [3.8] 人間性は、オンラインでの情報提供によって引き起こされる真実と現実の性質に関する現実的な危機に直面している。
我々は,インターネットにオブジェクトセキュリティサービス層が必要であることを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:17:19 GMT)
Exhaustive Search for Quantum Circuit Optimization using ZX Calculus [3.7] ZX計算と全探索を用いた量子回路最適化の最初の形式化を提供する。
我々は、100の標準量子回路に対して、我々のアプローチを広範囲にベンチマークする。
私たちの実装は、コンパイラパスとしてよく知られたライブラリであるPyZXとQiskitに統合されています。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:06:28 GMT)
Towards Privacy-preserved Pre-training of Remote Sensing Foundation Models with Federated Mutual-guidance Learning [3.6] リモートセンシングファウンデーションモデル(RSFM)は、大規模にキュレートされたリモートセンシングデータの自己監督を通じて、データ分散パラダイムで事前訓練される。
各機関について、RSFMの予備訓練を単体で行うと、最適以下の性能が得られ、また複数の機関からのリモートセンシングデータを集約して、集中的な事前トレーニングを行うとプライバシー上の懸念が生じる。
本研究では、複数の機関がプライベートデータを共有せずにRSFMを協調訓練できる新しいプライバシ保護事前学習フレームワーク(FedSense)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:38:49 GMT)
Application of the Pontryagin Maximum Principle to the robust time-optimal control of two-level quantum systems [3.6] フィールド不均一性を受ける2レベル量子系の時間-最適ロバスト制御について検討する。
我々はポントリャーギン最大原理を適用し、最適動力学が投影される還元空間を導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:47:08 GMT)
UStyle: Waterbody Style Transfer of Underwater Scenes by Depth-Guided Feature Synthesis [3.5] 本稿では,水中画像間で水体スタイルを伝達する最初のデータ駆動学習フレームワークであるUStyleを紹介する。
本研究では,物理に基づく水体合成を統合した深度認識型白化色変換(DA-WCT)機構を提案する。
UF7Dデータセットは、7つの異なる水体スタイルにまたがる高解像度水中画像の収集である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:49:40 GMT)
Scaffold-Assisted Window Junctions for Superconducting Qubit Fabrication [3.5] ウィンドウ接合(WJ)プロセスは、製造中のクビット品質の劣化を軽減し、足場をきれいに除去することができる。
PECVDで作製した足場と比較して、WJによって製造された物理的気相沈着(PVD)によるキュービットは、最大57,mutextsの緩和時間を達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:11:39 GMT)
Enhanced Low-Dose CT Image Reconstruction by Domain and Task Shifting Gaussian Denoisers [3.5] 低放射線線量 (LDCT) からのCTは, 投射データに高ノイズが伴うため困難である。
本稿では,2段階の手法と最先端の再現性を組み合わせた簡易性と効率性を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:30:28 GMT)
Simplifying Deep Temporal Difference Learning [3.5] 安定を保ちながら、政治外のTDトレーニングを加速し、簡素化できるかどうかを検討する。
我々の重要な理論的結果は、LayerNormのような正規化技術が証明可能な収束性TDアルゴリズムが得られることを初めて示している。
よりシンプルなオンラインQ-LearningアルゴリズムであるPQNを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:51:52 GMT)
How Green are Neural Language Models? Analyzing Energy Consumption in Text Summarization Fine-tuning [3.3] 本研究では,3つのニューラルネットワークモデル間のエネルギー消費と性能のトレードオフを分析する。
LLaMA-3-8Bは3つのモデルの中で最大の炭素フットプリントを生産している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:22:12 GMT)
Non-asymptotic Analysis of Biased Adaptive Stochastic Approximation [3.3] 適応的なステップを持つグラディエントDescent(SGD)は、ディープニューラルネットワークと生成モデルのトレーニングに広く使用されている。
本稿では,勾配関数に対するバイアスの影響を包括的に分析する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:27:25 GMT)
Explicit block encodings of boundary value problems for many-body elliptic operators [3.3] 離散化楕円演算子を符号化するブロックの量子回路複雑性を系統的に解析する。
我々は、多体ラプラシアンを分離可能な周期性、ディリクレ、ノイマン、ロビン境界条件で符号化する明示的な回路を提供する。
次に,多体対流作用素の符号化をブロックし,対ポテンシャルによって生じる力を受ける相互作用粒子を記述する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:37:23 GMT)
Playing with words: Comparing the vocabulary and lexical diversity of ChatGPT and humans [3.3] ChatGPTのような生成言語モデルは、テキストの生成方法を変える革命を引き起こした。
ChatGPTのようなツールの使用は、使用する語彙や語彙の豊かさを増減するか?
これは、AI生成コンテンツに含まれないコンテンツは、人気が減り、最終的には失われる傾向があるため、言葉に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:19:46 GMT)
APLA: A Simple Adaptation Method for Vision Transformers [3.3] Intention Projection Layer Adaptation (APLA)は、アーキテクチャの変更やパラメータの追加なしに視覚変換器(ViT)を適応するためのシンプルなアプローチである。
APLAは最先端のパフォーマンスを実現し、GPUメモリ使用量を52.63%削減し、トレーニング時間を最大43.0%削減する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:03:29 GMT)
Toward Unified Practices in Trajectory Prediction Research on Drone Datasets [3.1] 高品質なデータセットの可用性は、自動運転車の行動予測アルゴリズムの開発に不可欠である。
本稿では,動き予測研究における特定のデータセットの利用の標準化の必要性を強調した。
これを実現するためのツールとプラクティスのセットを提案します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:13:49 GMT)
The Road to Hybrid Quantum Programs: Characterizing the Evolution from Classical to Hybrid Quantum Software [3.1] 量子マシン上で有意義に実行できる量子候補コードフラグメントを識別する努力は、主に静的コード解析に依存している。
本稿では,古典的プログラムにおける量子候補とその適切な符号化過程を体系的に定式化することを目的とする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:37:57 GMT)
FedOSAA: Improving Federated Learning with One-Step Anderson Acceleration [3.1] Federated Learning(FL)は、複数のローカルクライアントと中央サーバが協力してモデルをトレーニングできる分散機械学習アプローチである。
特に分散低減手法を取り入れた一階法は、単純な実装と安定した性能のため、最も広く使われているFLアルゴリズムである。
本稿では,2次法に典型的に関連する高速収束を達成しつつ,1次法の簡易性を維持する新しい手法であるFedOSAAを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:10:02 GMT)
Exploring Performance-Complexity Trade-Offs in Sound Event Detection [3.0] 音響事象検出タスクのための新しい低複雑さネットワークの開発課題について検討する。
音声タグ付けに先立って提案した低複雑さ畳み込みモデルは,イベント検出に効果的に適応できることがわかった。
最適化されたトレーニング戦略と組み合わせることで、最先端のトランスフォーマーに匹敵するイベント検出性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:18:02 GMT)
Model-Agnostic Knowledge Guided Correction for Improved Neural Surrogate Rollout [3.0] 本稿では,ニューラルサロゲート,RL決定モデル,物理シミュレータを組み合わせることで,ロールアウト誤差を大幅に低減するモデルに依存しないコスト認識モデルを提案する。
HyPERは、物理的条件の変化に適応し、騒音の破損に抵抗するインテリジェントなポリシーを学ぶ。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:02:11 GMT)
It's complicated. The relationship of algorithmic fairness and non-discrimination regulations in the EU AI Act [3.0] EUは最近、AIモデルの特定のルールを規定するAI法を成立させた。
本稿では、法的な非差別規則と機械学習に基づくアルゴリズムフェアネスの概念の両方を紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:05:09 GMT)
Charge Parity Rates in Transmon Qubits with Different Shunting Capacitors [3.0] 超伝導共振器とミリケルビン温度で動作する量子ビットの非平衡準粒子は数十年前から知られている。
ここでは、5つのトランペット量子ビットのパリティ状態の変化を監視するためにラムゼイ型パルスシーケンスを用いている。
電荷パリティ比は準粒子トラップ率に弱い依存性を示し, 電荷パリティの主源は準粒子の生成であることを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:47:52 GMT)
Zero-TIG: Temporal Consistency-Aware Zero-Shot Illumination-Guided Low-light Video Enhancement [3.0] 低照度と水中のビデオは視界が悪く、コントラストが低く、ノイズが高い。
既存のアプローチは通常、ペア化された基底真理に依存しており、実際性は制限され、しばしば時間的一貫性の維持に失敗する。
本稿では、Retinex理論と光フロー技術を活用したゼロショット学習手法Zero-TIGを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:22:26 GMT)
Exact Quantum Dynamics, Shortcuts to Adiabaticity, and Quantum Quenches in Strongly-Correlated Many-Body Systems: The Time-Dependent Jastrow Ansatz [2.9] 複素数値時間依存のジャストロウ・アンサッツは対称性を欠いたより広範な動的過程のクラスを記述できることを示す。
カロジェロ・サザーランドや双曲モデルのような逆二乗相互作用を持つ系における我々の発見について述べる。
この結果は、連続変数を持つ非平衡強相関系の数値および量子シミュレーションのベンチマークとして機能する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:47:46 GMT)
S$^3$AD: Semi-supervised Small Apple Detection in Orchard Environments [2.9] 作物検出は、自動収量推定や果物の摘みなど、精密農業用途に不可欠である。
本研究では,リンゴ検出タスクを半教師付きで再構築することで課題に対処する。
14,667個のアノテートリンゴインスタンスと4,440個の未ラベル画像からなる105個のラベル付き画像からなる、大規模で高解像度のデータセットMADを提供する。
また,小型リンゴの検出の難易度を高めるため,コンテキストアテンションと選択タイリングに基づく半スーパービジョン型小型アップル検出システムS$3$ADを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:10:28 GMT)
Reasoning-Grounded Natural Language Explanations for Language Models [2.8] 本稿では,忠実な自然言語説明を得るための大規模言語モデル説明可能性手法を提案する。
トークンのシーケンスに変換されると、推論プロセスの出力がモデルコンテキストの一部となる。
また,提案手法を用いることで,回答の質を向上できることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:00:03 GMT)
DRAPER: Towards a Robust Robot Deployment and Reliable Evaluation for Quasi-Static Pick-and-Place Cloth-Shaping Neural Controllers [2.7] 本研究では、フラット化タスクと折り畳みタスクにおいて、異なるシミュレーション訓練されたニューラルコントローラの信頼性の高い実世界比較を示す。
我々は、これらのニューラルコントローラの真の能力を確実に反映した、この包括的な研究を可能にするために、DRAPERフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:15:09 GMT)
Optimization-Augmented Machine Learning for Vehicle Operations in Emergency Medical Services [2.6] 救急医療サービス(EMS)システムにとって、法的要件を満たして患者にタイムリーにサービスを提供するための応答時間を最小化することが重要である。
我々は,オンライン救急搬送・再配備政策を学習する中央制御型EMSシステムについて検討した。
本稿では,救急搬送と再配置のための効率的なポリシーを学習できる,新しい最適化強化機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:15:26 GMT)
Verifying the analogy between transversely coupled spin-1/2 systems and inductively-coupled fluxoniums [2.6] 誘導結合型超伝導フラクソニウム量子ビットの詳細な特性を報告する。
我々の回路は2つの横結合スピン-1/2系の場合と非常に密接に振る舞う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:27:40 GMT)
Designing a Syllabus for a Course on Empirical Software Engineering [2.5] この章は、コース設計における第一かつ最も重要なステップであるシラバスの作成において、教育者を支援することを目的としている。
それはシラバスの基本的な構成要素、すなわちコース、コーストピック、実践的な課題のリストを提供する。
コースのトピックは、この本の後続の章にも関連付けられており、読者はこれらの章を深く掘り下げて、特定の研究方法や横断的なトピックを教えることを支援することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:58:29 GMT)
Integrating Dynamical Systems Modeling with Spatiotemporal scRNA-seq Data Analysis [2.5] シングルセルRNAシークエンシング(scRNA-seq)は、遺伝子発現の静的スナップショットを提供する。
時間的に解決されたscRNA-seq、空間転写学(ST)、時系列転写学(temporal-ST)は、個々の細胞の動態を研究する能力にさらに革命をもたらした。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:25:27 GMT)
Alzheimer's Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models [2.5] 本研究は、高度深層学習技術を用いて、アルツハイマー病(AD)および健康管理(CO)患者の網膜OCT画像の分類を行う。
最高の分類アーキテクチャはTransNet OCTであり、入力されたOCT画像の平均精度は98.18%、セグメント化されたOCT画像では98.91%であり、5倍のクロスバリデーションである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:34:37 GMT)
OPTIMUS: Predicting Multivariate Outcomes in Alzheimer's Disease Using Multi-modal Data amidst Missing Values [2.4] アルツハイマー病(英語: Alzheimer's disease、AD)は、神経、遺伝、およびプロテオミクスに関連する疾患である。
最近の"deeper"機械学習アプローチでは、予測精度の向上が期待できるが、これらのモデルの生物学的関連性はさらにグラフ化する必要がある。
我々の研究は、予測的かつ生物学的に説明可能な機械学習フレームワークを構築し、マルチモーダルバイオマーカーを明らかにする可能性を実証している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:40:04 GMT)
A Transformer and Prototype-based Interpretable Model for Contextual Sarcasm Detection [2.4] サルカスムの検出は、その比喩的な性質をもって、感情分析を行うように設計された感情システムに固有の課題を提起する。
本稿では,感情埋め込みによって強化されたLMとプロトタイプベースのネットワークを活用して,解釈可能な皮肉検出を行う手法を提案する。
我々のアプローチは本質的に、余分なポストホック解釈のテクニックを使わずに解釈可能である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:58:43 GMT)
Hole spin splitting in a Ge quantum dot with finite barriers [2.4] 平面Ge量子ドット(QD)に閉じ込められた単一ホールの低エネルギースペクトルについて検討する。
QDは[001]方向に沿って成長した有限電位高さの2つのGeSi障壁の間に挟まれている。
トップゲート電界および残留張力ひずみがクビット状態に与える影響について検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:59:04 GMT)
Weakly Supervised Contrastive Adversarial Training for Learning Robust Features from Semi-supervised Data [2.4] 既存の敵の訓練方法は、しばしば摂動に悩まされる。
Weakly Supervised Contrastive Adversarial Training (WSCAT)を提案する。
WSCATは、ロバストでない特徴とラベルの相関を乱すことにより、堅牢な特徴の学習を改善するための完全な摂動を保証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:01:10 GMT)
Shedding Light in Task Decomposition in Program Synthesis: The Driving Force of the Synthesizer Model [2.4] タスク分解はプログラム合成の基本的なメカニズムであり、複雑な問題を管理可能なサブタスクに分解することができる。
本研究では,ExeDecの適応であるREGISMを開発し,分解誘導を除去し,反復的な実行駆動合成にのみ依存する。
以上の結果から,ExeDecは,その明示的な分解戦略により,長さ一般化や概念構成タスクにおいて有意な優位性を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:16:28 GMT)
Training Noise Token Pruning [2.3] 視覚変換器のためのトレーニングノイズトケイング(TNT)について述べる。
本手法は離散トークン投下条件を連続付加雑音に緩和する。
我々は、レーティング・ディストーションの文献と理論的に関係し、ImageNetデータセット上で実証的な評価を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:12:10 GMT)
PARIC: Probabilistic Attention Regularization for Language Guided Image Classification from Pre-trained Vison Language Models [2.3] 本稿では,言語仕様による視覚的注意を導くための確率的フレームワークであるPARICを紹介する。
提案手法は,事前学習した視覚言語モデルを用いて確率論的参照アテンションマップを生成する。
ベンチマークテスト問題に関する実験では、PARICが予測精度を高め、バイアスを軽減し、一貫した予測を保証し、さまざまなデータセットにわたって改善していることが示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:53:37 GMT)
Error mitigation with stabilized noise in superconducting quantum processors [2.3] 我々は,量子ビット-TLS相互作用のチューニングが雑音不安定を低減し,より信頼性の高い誤り軽減性能を実現することを実験的に実証した。
ここで導入された機能は、非自明なスケールのソリッドステートプロセッサ上での量子アプリケーションの探索に不可欠であると期待する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:32:35 GMT)
T2I-FineEval: Fine-Grained Compositional Metric for Text-to-Image Evaluation [2.3] そこで本研究では,画像のコンポーネント分割と,生成した画像に関する詳細な質問をテキストに分割して評価する手法を提案する。
提案手法は,テキストから画像への生成モデルの評価において,従来の最先端の指標よりも優れていた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:06:12 GMT)
Quantum algorithms for simulating systems coupled to bosonic modes using a hybrid resonator-qubit quantum computer [2.3] 計算要素としてマイクロ波共振器を用いて従来の超伝導量子ビットを増大させることにより,複合系を解くための量子アルゴリズムについて議論する。
典型的なモデルに対して効率的なアルゴリズムを導出し、線形オーバーヘッドを伴うシミュレーションの実現可能なスケーリングを可能にするデバイス接続を提案する。
その結果,商用量子プラットフォーム上での計算共振器を含む最初のディジタル量子シミュレーションが得られた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:29:41 GMT)
Trainability and Expressivity of Hamming-Weight Preserving Quantum Circuits for Machine Learning [2.2] 可変量子回路(VQC)のトレーニング性と制御性の解析
まず、新しいデータローダの実現可能性を示し、$n$-qubit量子回路をトレーニングすることにより、$binomnk$-dimensionalベクトルの量子振幅符号化を行う。
最後に、ハミング重み保存回路のトレーニング可能性を分析し、サブ空間の$binomnk$の分散がサブ空間の$binomnk$に応じて有界であることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:36:25 GMT)
A Quantum Algorithm for the Classification of Patterns of Boolean Functions [2.2] 本稿では,不均衡なブール関数のクラス階層を分類できる新しい量子アルゴリズムを提案する。
最終測定値が未知の関数を確率1ドルで明らかにするので,本アルゴリズムは簡単に分類できる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:26:36 GMT)
Vecchia Gaussian Process Ensembles on Internal Representations of Deep Neural Networks [2.2] レグレッションタスクでは、標準ガウス過程(GP)とディープニューラルネットワーク(DNN)が自然不確実性定量化(UQ)を提供する。
本稿では,DVE(Deep Vecchia ensemble)という代替手法を提案する。
DVEは事前訓練されたネットワークと互換性があり、計算オーバーヘッドが低い。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:50:47 GMT)
vesselFM: A Foundation Model for Universal 3D Blood Vessel Segmentation [2.2] 本稿では3次元血管セグメンテーションの幅広い課題に特化して設計された基盤モデルである vesselFM を提案する。
以前のモデルとは異なり、 vesselFM は見当たらない領域に懸命に一般化することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:56:29 GMT)
MoLEx: Mixture of Layer Experts for Finetuning with Sparse Upcycling [2.2] 深層モデルの大規模事前学習と微調整が自然言語処理(NLP)の基盤となっている。
本稿では,異なるタイプの言語情報の抽出器としてレイヤについて検討する。
我々は,事前学習モデルのレイヤーである専門家の疎結合であるMix of Layer Experts(Molex)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:22:07 GMT)
Standalone 16-bit Neural Network Training: Missing Study for Hardware-Limited Deep Learning Practitioners [2.1] 混合精度技術は、モデルトレーニングと推論の間に異なる数値精度を活用し、資源利用を最適化する。
リソースが限られている多くの人にとって、利用可能なオプションは32ビット、16ビット、または2つの組み合わせに限られている。
この研究は重要なギャップを埋め、スタンドアロンの16ビット精度のニューラルネットワークが32ビットと混合精度の精度で一致したことを初めて証明した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:05:05 GMT)
Interaction-Induced Higher-Order Topological Insulator via Floquet Engineering [2.1] Floquet Engineering による相互作用誘起高次トポロジカル位相の研究により,従来の研究を拡張した。
自明な位相から2重項に対する相互作用によって引き起こされる通常のフロケ2階位相角状態の出現を実証する。
相互作用によって引き起こされるFloquetの2階位相相が明らかとなり,doublesの内角状態が$pi/T$ギャップ内に出現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:49:43 GMT)
Singular Value Decomposition and Its Blind Spot for Quantum Chaos in Non-Hermitian Sachdev-Ye-Kitaev Models [2.1] 非エルミート量子系におけるカオスと複雑性の研究は、スペクトルにおける複素固有値の出現によって大きな課題をもたらす。
近年,これらの課題に対処するために特異値分解法(SVD)が提案されている。
我々は、Krylov複雑性とスペクトル統計を非エルミート的設定で解析する際に、SVDアプローチの2つの重要な欠点を同定する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:31:56 GMT)
BioMamba: Leveraging Spectro-Temporal Embedding in Bidirectional Mamba for Enhanced Biosignal Classification [2.0] 既存のバイオシグナル分類手法は、フィードフォワード層が密集した注意に基づくフレームワークに依存している。
これら3つの重要なコンポーネントを統合することで、BioMambaは既存のメソッドの制限を効果的に解決する。
大規模な実験により、BioMambaは最先端の手法を著しく上回り、分類性能が著しく向上していることが示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:42:58 GMT)
Tests for model misspecification in simulation-based inference: from local distortions to global model checks [2.0] 我々は、広範囲のモデル不一致分析タスクに対して、堅牢で柔軟な基盤を提供する。
我々は、異常検出、モデル検証、良質な残差分析といった古典的手法に明確な分析接続を行う。
本稿では, 実際の重力波データ, 特にGW150914について, このような歪み駆動型モデルの不特定試験を行う方法を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:47:52 GMT)
Data Pruning in Generative Diffusion Models [2.0] 生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:11:28 GMT)
Multi-View Node Pruning for Accurate Graph Representation [2.0] マルチビューフレームワークと再構成損失に基づくグラフ解析手法を提案する。
MVPは、再構築とタスク損失の両方を考慮して、各ノードのスコアを学習する。
MVPは基本グラフプーリング法の性能を大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:44:54 GMT)
Adaptive Stochastic Gradient Descents on Manifolds with an Application on Weighted Low-Rank Approximation [2.0] 適応学習率を持つ多様体上の勾配降下に対する収束定理を証明した。
重み付けされた低ランク近似問題に適用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:56:07 GMT)
Annotating Scientific Uncertainty: A comprehensive model using linguistic patterns and comparison with existing approaches [2.0] UnScientifyは学術的な全文で科学的不確実性を検出するように設計されたシステムである。
UnScientifyの中核となる方法論は、スパンパターンマッチング、複雑な文解析、著者参照チェックを統合した多面的パイプラインに基づいている。
評価結果は,現代大言語モデル(LLM)とUnScientifyシステムとのトレードオフを浮き彫りにした。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:21:59 GMT)
Early Directional Convergence in Deep Homogeneous Neural Networks for Small Initializations [2.0] 本稿では,局所的なリプシッツ均質性と2つ以上の厳密な順序を有すると仮定された深部均一性ニューラルネットワークのトレーニング時に生じる勾配流のダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:46:23 GMT)
Bayes and Biased Estimators Without Hyper-parameter Estimation: Comparable Performance to the Empirical-Bayes-Based Regularized Estimator [1.9] 一般化ベイズ推定器の族と閉形式偏り推定器の族を開発する。
我々は,これらの新しい推定器の性能が,経験的ベイズに基づく正規化推定器に匹敵することを示す数値シミュレーションを行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:33:08 GMT)
Similarity-Aware Token Pruning: Your VLM but Faster [1.9] 本稿では、視覚変換器(ViT)と視覚言語モデル(VLM)のためのトレーニングフリートークン解析フレームワークであるSAINTを紹介する。
系統的な解析により,変圧器における3段階の普遍的なトークン進化過程を同定し,臨界情報を犠牲にすることなく早期にアグレッシブプルーニングを可能にする。
ViTでは、SAINTは224pxでViT-H/14のスループットを2倍にし、ImageNet-1Kの精度はわずか0.6%で、最も近い競合相手を0.8%上回っている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:12:23 GMT)
OpeNLGauge: An Explainable Metric for NLG Evaluation with Open-Weights LLMs [1.8] OpeNLGaugeは、完全にオープンソースで参照不要なNLG評価指標であり、エラースパンに基づいた正確な説明を提供する。
我々はOpeNLGaugeが人間の判断と競合する相関を達成し、特定のタスクにおける最先端モデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:38:47 GMT)
Performance Analysis of Decentralized Federated Learning Deployments [1.7] これらの課題に対処するために、分散フェデレートラーニング(DFL)が導入されている。
中央サーバに頼ることなく、参加するデバイス間の直接的なコラボレーションを促進する。
本研究は、DFLモデルの収束と一般化能力に影響を与える決定的な要因について考察する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:37:13 GMT)
The Beginner's Textbook for Fully Homomorphic Encryption [1.7] FHE(Fully Homomorphic Encryption)は、暗号化データ上で直接計算を行うことができる暗号方式である。
すべての計算が暗号化されたデータ上で実行されると、結果を明らかにするために復号化することができる。
FHEは機密ブロックチェーンサービスに適用可能で、スマートコントラクトの機密データが暗号化され、機密保持されることを保証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:22:13 GMT)
Hierarchical Information-Guided Spatio-Temporal Mamba for Stock Time Series Forecasting [1.7] 階層型情報ガイド型時空間マンバ(HIGSTM)フレームワークについて紹介する。
HIGSTMは、時間的動的パターンと、株式市場内のグローバルな静的関係の両方をキャプチャする。
本稿では,マクロ情報をシーケンス選択プロセスに統合する情報誘導型マンバを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:30:38 GMT)
The waves-in-space Purcell effect for superconducting qubits [1.6] 空間におけるキュービット場を可視化すると、キュービット場が強く、空洞場が弱い場所が明らかになる。
チップインチューブ幾何学におけるlambda/2$の読み出しモードの場合、ミリ秒レベルのPurcell保護と、逆に大幅に強化されたPurcell崩壊の両方を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:58:28 GMT)
Involutive Markov categories and the quantum de Finetti theorem [1.6] 帰納的マルコフ圏はパルジニャートの量子マルコフ圏と同値である。
最小の C*-テンソルノルムと最大の C*-テンソルノルムの両方に対して量子デ・フィネッティの定理を証明する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:39:38 GMT)
Unifying Structural Proximity and Equivalence for Enhanced Dynamic Network Embedding [1.6] 本稿では,構造的近接性と等価性の両方を同時に維持する新しい動的ネットワーク埋め込み法を提案する。
次に時間-構造的ランダムウォークを導入し、進化する構造における時間的近接性と類似性の両方を考慮して、ノードの時間-反射配列を柔軟にサンプリングする。
提案手法は,ノード分類における5つの実世界のネットワークを用いて評価され,ベンチマーク手法よりも優れている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:40:05 GMT)
Spatio-Temporal Graph Structure Learning for Earthquake Detection [1.6] 本研究では,地震観測所間の静的および動的関係をモデル化するための時空間グラフ畳み込みネットワーク(GCN)を提案する。
提案手法は, マルチステーション波形データを処理し, ステーション固有検出確率を生成する。
実験は、真正レート(TPR)と偽正レート(FPR)の観点から、従来のGCNベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:07:18 GMT)
A Neural Network Architecture Based on Attention Gate Mechanism for 3D Magnetotelluric Forward Modeling [1.6] 本稿では,3次元MTフォワードモデリングのためのアテンションゲーティング機構を統合したMTAGU-Netという新しいニューラルネットワークアーキテクチャを提案する。
デュアルパスアテンションゲーティングモジュールは、前方応答データ画像に基づいて設計され、エンコーダとデコーダの間のスキップ接続に埋め込まれる。
3次元ガウスランダム場(GRF)を利用した合成モデル生成法は,実世界の地質学的シナリオの電気的構造を正確に再現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:48:25 GMT)
Semantic and Contextual Modeling for Malicious Comment Detection with BERT-BiLSTM [1.6] BERTとBiLSTMを組み合わせたディープラーニングモデルを提案する。
BERTモデルは、事前トレーニングを通じて、テキストの深いセマンティックな特徴をキャプチャし、BiLSTMネットワークはシーケンシャルなデータを処理するのに優れている。
Jigsaw Unintended Bias in Toxicity Classificationデータセットの実験結果は、BERT+BiLSTMモデルが悪意のあるコメント検出タスクにおいて優れたパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:51:36 GMT)
Implementation of classical client universal blind quantum computation with 8-state RSP in current architecture [1.6] 計測に基づく量子計算(MBQC)に基づくUniversal blind quantum computing (UBQC)プロトコルの実装を提案する。
UBQCは、半古典的なクライアントが量子サーバーに普遍的な量子計算を委譲し、その計算自体がサーバに見えないまま、対話的に結果をフェッチすることを可能にする。
このような実装は、最も弱いセキュリティモデルであるゲームベースのセキュリティ設定において、すでに安全であることが示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:52:02 GMT)
A Real-World Energy Management Dataset from a Smart Company Building for Optimization and Machine Learning [1.5] 2018年から2023年までの6年間,スマート企業施設の監視から得られた,大規模な実世界のデータセットを提示する。
データセットは、各種施設領域及びコンポーネントからのエネルギー消費データ、太陽光発電システムと複合熱・発電プラントからのエネルギー生産データ、暖房・冷却システムからの運転データ、オンサイト気象観測所からの気象データを含む。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:55:22 GMT)
The Introduction of README and CONTRIBUTING Files in Open Source Software Development [1.5] ConTRIBUINGファイルは、フリー/ライブラリおよびオープンソースソフトウェア(FLOSS)プロジェクトへの潜在的コントリビュータにとって、最初の接触ポイントとなる。
Mozilla、GitHub、Linux Foundationなどの著名なオープンソースソフトウェア組織は、プロジェクトは早期にコミュニティにフォーカスし、プロセス指向のドキュメントを提供し、採用と活動を促進することを提唱している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:00:28 GMT)
Assessing the validity of new paradigmatic complexity measures as criterial features for proficiency in L2 writings in English [1.5] この記事では、新しい文法的および構造的複雑性メトリクスの調査を通じて、第二言語(L2)による開発について述べる。
言語機能と特定の文法的パラダイムをリンクすることで、学習者英語におけるパラダイム生産を探求する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:44:13 GMT)
Logit-Q Dynamics for Efficient Learning in Stochastic Teams [1.4] ゲームにおける効率的な学習のための新しいロジット-Qダイナミクスのファミリーを提示する。
未知のダイナミックスを持つチームでは,ロジット-Qのダイナミクスが(ほぼ)効率のよい平衡に到達できることが示される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:00:31 GMT)
Clustering Items through Bandit Feedback: Finding the Right Feature out of Many [1.4] 本稿では,帯域幅フィードバックに基づいて項目集合をクラスタリングする問題について検討する。
そこで我々は,学習者が1つの項目と1つの特徴を選択し,その特徴をうるさく評価する,逐次的かつ適応的な設定について考察する。
逐次Halvingアルゴリズムを利用して,クラスタリングタスクに関連する特徴の探索に依存するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:56:30 GMT)
Evaluating the Process Modeling Abilities of Large Language Models -- Preliminary Foundations and Results [1.4] 大規模言語モデル(LLM)は自然言語処理に革命をもたらした。
LLMがどの程度優れたプロセスモデルを生成するか、現在議論中である。
我々はこれらの課題を詳細に議論し、これらの課題に科学的に取り組むための将来の実験について議論する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:52:18 GMT)
UBMF: Uncertainty-Aware Bayesian Meta-Learning Framework for Fault Diagnosis with Imbalanced Industrial Data [1.4] 機械機器の故障診断には、データ収集、特徴抽出、パターン認識が含まれる。
本研究では,4つのモジュールを統合したUncertainty-Aware Bayesian Meta-Learning Framework (UBMF)を提案する。
UBMFは10のAny-way 1-5ショットの診断タスクで平均42.22%の改善を実現している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:05:18 GMT)
From Dionysius Emerges Apollo -- Learning Patterns and Abstractions from Perceptual Sequences [1.4] 感覚ストリームは単純化され、1次元のシーケンスである。
このようなシーケンスを学習する際には、自然にそれらを部品(チャンキングと呼ばれるプロセス)に分割します。
私はチャンクを学習し、シーケンスをチャンクごとに解析するモデルを開発しました。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:37:28 GMT)
Non Line-of-Sight Optical Wireless Communication using Neuromorphic Cameras [1.4] 受動可視光通信(VLC)のためのニューロモルフィックカメラを用いた新しいシステムを提案する。
以上の結果から,NLoS通信ではより明るい色合いの光沢のある物体がよいが,大きな物体やマットを持つ物体はマルチパス反射により高い誤差率を経験することがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:22:51 GMT)
Comparative Analysis of Advanced AI-based Object Detection Models for Pavement Marking Quality Assessment during Daytime [1.3] 本稿では,You Only Look Once (YOLO) モデルを用いて,昼間の舗装のマーキング品質を検出することに焦点を当てた。
YOLOv8m、YOLOv8n、YOLOv8xの3種類が使用された。
その結果, YOLOv8nは精度と計算効率のバランスが良いことがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:06:46 GMT)
Combinatorial Optimization with Quantum Computers [1.2] 量子コンピュータは、古典的コンピュータに対して潜在的に有利な計算を行う。
量子コンピュータは、演算子をバイナリ文字列の重ね合わせに適用し、バイナリ出力の重ね合わせを提供する。
量子アニール(quantum annealers)と呼ばれる量子マシンのファミリーは、最適化問題を解決するために特別に設計されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:43:50 GMT)
A Plug-and-Play Method for Guided Multi-contrast MRI Reconstruction based on Content/Style Modeling [1.2] 複数のMRIコントラストには冗長な情報が含まれているため、アンサンプされた後続のコントラストの再構築を導くための先行として、1コントラストが使用できる。
この問題に対処するガイド付き再構成のためのモジュラー2世代手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:39:10 GMT)
Infinity-norm-based Input-to-State-Stable Long Short-Term Memory networks: a thermal systems perspective [1.2] リカレントニューラルネットワーク(RNN)は,システム識別において顕著な性能を示した。
安定は実用上重要な課題です
ISS$_infty$-promoted LSTM は物理モデルと ISS$_infty$-promoted Gated Recurrent Unit (GRU) ネットワークの両方より優れている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:17:31 GMT)
Improving the Efficiency of a Deep Reinforcement Learning-Based Power Management System for HPC Clusters Using Curriculum Learning [1.1] 機械学習はノードのオン/オフに最適な時間を決定することを約束している。
本研究では、カリキュラム学習(CL)を統合することで、HPC電力管理のための深層強化学習(DRL)エージェントの性能を向上させる。
実験結果から, 無駄なエネルギー使用量を減らすという点で, 容易にハードなカリキュラムは, 他の訓練命令よりも優れていたことが確認された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:47:22 GMT)
Latent Space Representation of Electricity Market Curves for Improved Prediction Efficiency [1.1] 本研究は、電力市場曲線の高次元および時系列特性を扱うために設計された3相ML予測フレームワークを提案する。
前処理フェーズでは、元のデータを変換して統一的な構造を実現し、可能なアウトレイラの効果を緩和する。
最後に、様々な機械学習手法を用いて、一度潜在空間で表現されたサプライと需要曲線を予測する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:04:46 GMT)
What's DAT? Three Case Studies of Measuring Software Development Productivity at Meta With Diff Authoring Time [1.1] Diff Authoring Time (DAT)は、ソフトウェア開発の生産性を測定するための強力な、しかし概念的にはシンプルなアプローチです。
DATを観察研究、調査、可視化、記述統計を通じて検証する。
DATは、開発生産性の正確かつ高カバレッジな指標を提供し、ビジネス上の決定を支援します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:50:12 GMT)
Advancing the Database of Cross-Linguistic Colexifications with New Workflows and Data [1.1] 複数の意味を持つ単語の比較研究のための高度なデータベースを提案する。
新バージョンには、データのハンドリング、選択、表示の改善が含まれている。
我々は,新たな言語横断的コレキシフィケーションデータベースが,エキサイティングな新しい研究を刺激する可能性があると結論づける。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:22:09 GMT)
Affinity-VAE: incorporating prior knowledge in representation learning from scientific images [1.1] Affinity-VAEは、学習中に学習した表現にデータセットのインスタンスの類似性に関する科学的直感を課すことができる生成モデルである。
本稿では, 低温電子トモグラフィー(cryo-ET)の科学的領域におけるアプローチの有用性を実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:34:24 GMT)
On Regulating Downstream AI Developers [1.1] ファンデーションモデルは、親密な画像の乱用、サイバー攻撃、バイオテロなど、重大なリスクを負う可能性がある。
これらのリスクを減らすため、政策立案者はこれらのモデルの開発者に義務を課し始めている。
下流の開発者は、モデルの能力を改善したり、安全性機能を妥協することで、リスクを創造または増幅することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:15:54 GMT)
Watch and Learn: Leveraging Expert Knowledge and Language for Surgical Video Understanding [1.0] データセットの欠如は、正確で包括的なワークフロー分析ソリューションの開発を妨げる。
本稿では,専門家を観察し,その説明を理解するための人間の学習手順から着想を得た,データの空間性と不均一性に対処する新しいアプローチを提案する。
手術領域に既存のデータセットが存在しないにもかかわらず,この課題に対処するため,外科的ビデオの高密度字幕化(DVC)のための最初の包括的ソリューションを提示する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:36:13 GMT)
Policy Frameworks for Transparent Chain-of-Thought Reasoning in Large Language Models [1.0] CoT(Chain-of-Thought)推論は、複雑な問題をステップバイステップのソリューションに分解することで、大きな言語モデル(LLM)を強化する。
現在のCoT開示ポリシは、可視性、APIアクセス、価格戦略など、さまざまなモデルで大きく異なり、統一されたポリシフレームワークが欠如している。
学術,ビジネス,一般ユーザ向けにCoTの可用性を調整し,透明性,説明責任,セキュリティのバランスをとるタイレッドアクセスポリシフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:54:18 GMT)
Research Vision: Multi-Agent Path Planning for Cops And Robbers Via Reactive Synthesis [1.0] 反応合成による古典的コップスとロバースゲームの一般化のためのマルチエージェントパス計画法を提案する。
コーディネーション・シンセサイザーの応用により、様々なCopsやRobersのゲームが実現可能であるかどうかを確認する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:03:32 GMT)
Identifying Likely-Reputable Blockchain Projects on Ethereum [1.0] この研究は、信頼性、透明性、全体的な信頼性を評価するために、複数のデータソースと高度な分析を統合する体系的なアプローチを提示している。
この研究は、不正行為に関連する2,179のエンティティと、信頼できるプロジェクトに関連する3,977のデータセットに基づいて、アカウントを分類する。
LightGBMアルゴリズムを用いて、平均精度0.984、平均AUC0.999を10倍のクロスバリデーションで検証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:43:25 GMT)
On the Limits of Distributed Quantum Computing [1.0] 量子アルゴリズムは、古典的なアルゴリズムよりも指数関数的に高速に特定の問題を解くことができる。
帯域幅制限ネットワークでは、量子分散ネットワークは古典的ネットワークよりも計算上の優位性を示している。
計算能力と通信帯域幅が制約されない分散計算モデルであるLOCALモデルに焦点をあてる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:36:51 GMT)
Combinatorial Optimization for All: Using LLMs to Aid Non-Experts in Improving Optimization Algorithms [1.0] 大規模言語モデル(LLM)は最適化アルゴリズムのためのコード生成において顕著な可能性を示している。
本稿では,アルゴリズムをスクラッチから作成するのではなく,専門知識を必要とせずに既存のものを改善する方法について検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:26:00 GMT)
Physics-constrained DeepONet for Surrogate CFD models: a curved backward-facing step case [1.0] PC-DeepONetアーキテクチャは、基本的な物理知識をデータ駆動型DeepONetモデルに組み込んでいる。
どちらのモデルも50サンプルの小さなデータセットで収束し、収束するのに50イテレーションしか必要としない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:43:36 GMT)
Enhancing Hand Palm Motion Gesture Recognition by Eliminating Reference Frame Bias via Frame-Invariant Similarity Measures [0.9] 記録されたハンドパーム動作(HPM)ジェスチャの新しいデータセットを提案する。
このデータセットの動作ジェスチャーは、特定の参照フレームや方向の手がかりに依存せずに区別できるように設計されている。
複数の不変トラジェクトリ記述子をベンチマークして、その性能が新しいHPMデータセットにどのように一般化するかを評価する。
最良のスコアリングアプローチは、リアルタイム概念証明を開発することで、オンライン認識のために検証される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:40:43 GMT)
On the Limitations of Vision-Language Models in Understanding Image Transforms [0.9] 視覚言語モデル(VLM)は、様々な下流タスクにおいて大きな可能性を証明している。
本稿では,VLMのイメージレベルの理解,特にOpenAIによるCLIPとGoogleによるSigLIPについて検討する。
以上の結果から,これらのモデルには複数の画像レベルの拡張の理解が欠如していることが判明した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:44:17 GMT)
Fully quantum inflation: quantum marginal problem constraints in the service of causal inference [0.9] 特定の多部量子状態に対して、特定の因果構造を持つ量子ネットワークで実現可能であるか否かを決定する問題を考える。
これは、因果推論研究者が因果発見の問題と呼ぶ完全な量子バージョンである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:31:38 GMT)
Experimental Demonstration of a Quantum-Optimal Coronagraph Using Spatial Mode Sorters [0.9] 深層回折による太陽系外惑星の発見は、現在最先端の直接撮像コロナグラフの到達範囲を超えている。
我々は、レイリー回折限界以下での太陽系外惑星の検出と局在の量子限界を達成することができる直接撮像コロナグラフの設計の実証実験を行った。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:35:32 GMT)
Prosocial Media [0.8] ソーシャルメディアは「ソーシャル・ファブリック」をアルゴリズムで活用し、分散コンテンツ制作を促進する
本稿では、社会的・政治的価値観や慣習、特に社会的結束をプラットフォームデザインに変換するためのオープンかつ継続的な考察に参加する。
ソーシャルファブリックに明示的な出力と入力を含む代替プラットフォームモデルを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:24:40 GMT)
ANCHOLIK-NER: A Benchmark Dataset for Bangla Regional Named Entity Recognition [0.8] データセットは約17,405文、1リージョンあたり3,481文である。
データは2つの公開データセットから収集され、様々なオンライン新聞や記事からウェブスクレイピングによって収集された。
バングラ方言のNERシステムを強化し、地域言語理解を改善し、機械翻訳、情報検索、会話AIの応用をサポートするために利用することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:13:50 GMT)
CyclePose -- Leveraging Cycle-Consistency for Annotation-Free Nuclei Segmentation in Fluorescence Microscopy [0.8] 合成データ生成とセグメンテーションのトレーニングを統合したハイブリッドフレームワークであるCyclePoseを提案する。
CyclePoseは、顕微鏡画像とセグメンテーションマスクの間の未ペア翻訳を可能にするCycleGANアーキテクチャ上に構築されている。
セグメンテーションモデルをCycleGANに組み込み、自己超越のためにサイクル整合損失を利用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:22:26 GMT)
AI-assisted hyper-dimensional broadband quantum memory with efficiency above 90% in warm atoms [0.8] 軌道角運動量(OAM)とスピン角運動量(SAM)を符号化した超次元光子に対する効率的な量子記憶法を示す。
OAM情報は -5 から +5 にエンコードされ、スピン角運動量エンコーディングと組み合わされ、最大22次元まで可能である。
その結果、高次元量子情報処理における優れた性能と潜在的な応用が示された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:40:22 GMT)
Measuring Similarity in Causal Graphs: A Framework for Semantic and Structural Analysis [0.7] 因果グラフは一般に複雑なシステムを理解しモデル化するために用いられる。
研究者はしばしば異なる視点からこれらのグラフを構築し、同じ問題に対して大きなバリエーションをもたらす。
その重要性にもかかわらず、因果グラフ比較の研究は依然として少ない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:29:26 GMT)
Stabilizing Quantization-Aware Training by Implicit-Regularization on Hessian Matrix [0.7] 損失の急激な状況は、劇的なパフォーマンス低下を招き、不安定を引き起こす重要な要因であることがわかった。
本稿では, 定量化モデルに特徴蒸留法を適用し, 一般化するためのFPQを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:56:20 GMT)
Challenges and Advancements in Modeling Shock Fronts with Physics-Informed Neural Networks: A Review and Benchmarking Study [0.7] 本研究は,PINNを用いたPDE不連続性管理技術について概説する。
この結果は、PINNの複雑な不連続性を扱う能力を改善するためのさらなる研究の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:26:10 GMT)
Learning to reset in target search problems [0.7] 本稿では,リセット方法を学ぶことで,環境における探索効率を最適化できるエージェントを訓練するための強化学習フレームワークを提案する。
まず、再設定を伴うブラウン探索という、十分に確立されたベンチマークでアプローチを検証する。
次に、エージェントがリセットするだけでなく、アクションを回すことで、その空間的ダイナミクスを制御できるようにすることで、フレームワークを拡張します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:57:51 GMT)
Untapped Potential in Self-Optimization of Hopfield Networks: The Creativity of Unsupervised Learning [0.6] 我々は、自己最適化(SO)モデルが創造的プロセスに必要な十分な条件を満たすことを論じる。
確率以上の創造的な結果を見つけるためには,学習が必要であることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:04:53 GMT)
Cross-Platform Benchmarking of the FHE Libraries: Novel Insights into SEAL and Openfhe [0.6] ホモモルフィック暗号化(HE)は、プライバシー問題に対処するための重要なソリューションとなっている。
本稿では2つの主要なHEライブラリであるSEALとOpenFHEを総合的に評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:08:30 GMT)
Multi-objective Good Arm Identification with Bandit Feedback [0.6] 我々は,多目的のバンドイット設定において,良好な腕識別問題を考える。
各ラウンド$t$に対して、プレーヤ/algorithmは1つのアーム$i_t$をプルし、$mathcalD_i_t$に従ってサンプリングされたM$次元ベクトルフィードバックを受け取る。
提案アルゴリズムは,合成および実データを用いた実験において,他のベースラインよりも優れた数値性能が得られる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:37:28 GMT)
Synthesizing Access Control Policies using Large Language Models [0.6] クラウドコンピューティングシステムでは、管理者はプライベートデータへのアクセスを管理するアクセス制御ポリシーを書くことができる。
ポリシはAWS IdentityやAccess Management Policy Languageといった便利な言語で記述されているが、手書きのポリシは複雑でエラーが多いことが多い。
本稿では,Large Language Models (LLM) がアクセス制御ポリシの合成にどの程度有効かを検討する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:40:25 GMT)
StyleSSP: Sampling StartPoint Enhancement for Training-free Diffusion-based Method for Style Transfer [0.6] 学習自由拡散に基づく手法は、スタイル伝達において顕著な成功を収めた。
しかし、トレーニング不要な手法は、オリジナルコンテンツのレイアウト変更やスタイルイメージからのコンテンツのリークに悩まされることが多い。
そこで我々は,スタイルイメージからオリジナルコンテンツのレイアウト変更やコンテンツのリークに対処するための,より良いスタートポイントの獲得を目的としたStyleSSPを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:29:05 GMT)
Theoretical Insights into CycleGAN: Analyzing Approximation and Estimation Errors in Unpaired Data Generation [0.6] 我々は、CycleGANと呼ばれる未ペアデータ生成モデルの過大なリスクを分析することに重点を置いている。
古典的なGANとは異なり、CycleGANは2つの障害のない分布間でデータを変換するだけでなく、マッピングの一貫性を保証する。
モデルアーキテクチャとトレーニング手順の両方の影響を考慮すると、リスクは近似誤差と推定誤差の2つの項に分解される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:37:35 GMT)
Quantum Dual Extended Hamming Code Immune to Collective Coherent Errors [0.5] パラメータが $[[2r+1, 2r-(r+1, 4]]$ である新しい励起安定化符号群を提案する。
既存の $[[20,1,4]]$ CE 安定化器コードと比較すると、最小のインスタンスである $[[8,1,4]]$ CE 安定化器コードは、必要な物理量子ビットの数を著しく削減します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:41:57 GMT)
Grand Unification of All Discrete Wigner Functions on $d \times d$ Phase Space [0.5] 単一の$d$次元のquditに対して、可能なすべての$dtimes d$離散ウィグナー関数を定義、視覚化、変換するための普遍的なフレームワークを提案する。
このフレームワークは、自然に現れる2dtimes 2d$離散ウィグナー関数とステンシルと呼ばれる情報再構成関数を相互に関連付けて有効な関数を構築する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:05:45 GMT)
PharmacoMatch: Efficient 3D Pharmacophore Screening via Neural Subgraph Matching [0.5] 本稿では,ニューラルサブグラフマッチングに基づく新しいコントラスト学習手法であるPharmacoMatchを紹介する。
本手法は,医薬検診を近似的な部分グラフマッチング問題として再解釈する。
既存のソリューションに匹敵する、はるかに短いランタイムとパフォーマンスメトリクスを示します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:51:43 GMT)
Lie-algebraic classical simulations for quantum computing [0.4] 我々は「$mathfrakg$-sim」と呼ばれる古典シミュレーションのためのフレームワークを提案する。
我々は、$mathfrakg$-simが古典シミュレーションの新しいレギュレーションを可能にすることを示す。
ベンチマーク問題に対する大規模ノイズレスおよびノイズの多いシミュレーションを報告する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:10:26 GMT)
Quantum memory assisted observable estimation [0.4] 量子情報処理の重要な課題は、多ビット可観測物の推定である。
本稿では,1量子ビット量子メモリへのアクセスを利用するCoherent Pauli Summationという新しい手法を提案する。
我々の研究は、単一長コヒーレンス量子ビットメモリが、基数タスクにおいてノイズの多い多量子ビットデバイスを動作させるのにどのように役立つかを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:27:48 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [0.3] 近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。
第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。
テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 05:43:47 GMT)
Numerical security analysis for quantum key distribution with partial state characterization [0.3] 本稿では,準備・測定および測定・デバイスに依存しないQKDプロトコルの秘密鍵レートを評価する新しいセキュリティ証明手法を提案する。
提案手法は, 達成可能なシークレットキーレートの観点から, 部分状態のキャラクタリゼーションに対処する現在の解析手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:39:11 GMT)
Don't Forget It! Conditional Sparse Autoencoder Clamping Works for Unlearning [0.3] 大きな言語モデル(LLM)の能力は大きな可能性をもたらしていますが、新たなリスクも生じています。
例えば、生物兵器、先進化学、サイバー攻撃の知識を持つLSMは、間違った手や故障時に暴力を引き起こす可能性がある。
近黒の箱としての性質から、LLM内部の直観的な解釈は依然としてオープンな研究課題である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:43:19 GMT)
Prompt Sentiment: The Catalyst for LLM Change [0.3] 本研究では,感情変化が大規模言語モデル(LLM)に与える影響を系統的に検討する。
私たちの分析は、コンテンツ生成、会話型AI、法的および財務分析、ヘルスケアAI、クリエイティブライティング、および技術ドキュメントを含む、AI駆動の6つのアプリケーションにまたがる。
以上の結果から,肯定的な感情はモデル反応に大きく影響し,否定的な感情は事実の精度を低下させ,バイアスを増幅する一方,肯定的な感情は冗長性や感情の伝播を増大させる傾向が示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:25:21 GMT)
A Benchmarking Study of Vision-based Robotic Grasping Algorithms [0.3] 本稿では,視覚に基づくロボットグルーピングアルゴリズムのベンチマーク研究について述べる。
文献から既存のベンチマークプロトコルを用いて,機械学習に基づく2つのアルゴリズムと2つの分析アルゴリズムを比較した。
シミュレーションと実際のロボットで同様の実験を行い、その相違点を提示する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:03:20 GMT)
The Architecture and Evaluation of Bayesian Neural Networks [0.3] 有望な理論的結果にもかかわらず、最もよく使われる後部近似の性質はしばしば疑問視される。
現代の深層モデルの次元と識別可能性の欠如により、マルコフ連鎖モンテカルロは高価になり、後部を十分に探索することができない。
本稿では,広帯域データやサンプル外データを含む様々なシナリオにおいて,計算コスト,精度,不確かさの定量化を考慮し,この点にいくつかの光を当てることを目的とする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:55:48 GMT)
CRPS-Based Targeted Sequential Design with Application in Chemical Space [0.2] 我々は、関心の反応の予め定義された範囲内で正確である必要があるGPモデルの獲得戦略に焦点をあてる。
2つの異なる重み付け尺度に依拠して、ポイントワイドおよびインテリジェンス基準を研究し、競合相手に対してそれらをベンチマークする。
得られた獲得戦略は、幅広い分野に適用され、スコアリングルールに依存したシーケンシャルな設計をさらに発展させる道を開く。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:00:24 GMT)
LLMPerf: GPU Performance Modeling meets Large Language Models [0.2] 大規模言語モデル(LLM)は、多様なプログラミング課題に対処する上で、その効果を実証している。
我々の研究は、LLMと性能モデリングの関連性を確立し、LLMを性能推定器として利用する。
我々のモデルは、利用可能なOpenCLプログラムのセットに対して、平均絶対的なパーセンテージエラーを46.1%で達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:52:30 GMT)
Cost-effective Deep Learning Infrastructure with NVIDIA GPU [0.2] ネパールのような発展途上国は、これらの目的のために新しいより良いハードウェアに投資するために必要な資源に苦しむことが多い。
これらのニーズに対処するため、4つのNVIDIA GTX 1650グラフィックカードを使用してクラスタを構築しました。
設計と実装プロセスで遭遇した継続的な課題にもかかわらず、このプロジェクトは、リソース集約的なタスクを処理するために、いかに強力な計算クラスタを構築することができるかを実証する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:54:36 GMT)
Generative Modelling for Mathematical Discovery [0.2] そこで本研究では,その遺伝子アルゴリズムの新たな実装について述べる。
我々の目的は数学者への関心の例を作成することである。
機械学習や高性能コンピューティングリソースへのアクセスに関する専門知識は必要ない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:54:43 GMT)
Fault-tolerant logical state construction based on cavity-QED network [0.2] 本稿では,キャビティ量子電気力学(CQED)ネットワークを用いたスケーラブルで実用的なアーキテクチャを提案し,評価する。
我々のアーキテクチャは、中性原子の安定性とCQEDネットワークの柔軟性を利用する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:26:29 GMT)
Lightweight Learning for Grant-Free Activity Detection in Cell-Free Massive MIMO Networks [0.2] Grant-free random access (GF-RA) は、将来の無線ネットワークにおける大規模機械型通信(mMTC)のための有望なアクセス技術である。
本研究では、デバイスアクティビティ検出(AD)における課題に対処するために、教師付き機械学習技術を用いた効率性を検討する。
我々は,mMTC 用の GF-RA のアクティビティ検出に特化して設計された,新しい軽量なデータ駆動型アルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:18:47 GMT)
Crash Severity Analysis of Child Bicyclists using Arm-Net and MambaNet [0.2] 児童自転車(14歳以下)が最も脆弱な道路利用者である。
この研究は、2017年から2022年にかけてテキサス州で2394人の児童自転車事故を分析した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:02:14 GMT)
Earthquake Response Analysis with AI [0.2] 本研究は, 地震応答解析にTwitterデータを活用する可能性を探るものである。
自然言語処理(NLP)技術を取り入れた機械学習(ML)フレームワークを開発した。
このアプローチは主に、影響を受けた地域を特定するために、ツイートから位置情報を抽出することに焦点を当てている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:45:07 GMT)
Colour Morphological Distance Ordering based on the Log-Exp-Supremum [0.2] 本稿では,色行列の対数-exp-sup-supremumの理論と,事前順序付けの形でよく知られた色距離アプローチを組み合わせる方法について述べる。
このアプローチの目的は、いくつかの望ましい性質を満たす上限に最も近い構造要素内の原色を特定することである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:57:34 GMT)
Cultural Differences and Perverse Incentives in Science Create a Bad Mix: Exploring Country-Level Publication Bias in Select ACM Conferences [0.1] ビッグサイエンスの時代、多くの国家政府は、国家主義の野望を果たすために、十分に資金提供された科学者チームの構築を支援している。
我々は,Gini Indexの標準指標を用いて,個々の科学者の出版率に有意な不平等を示す証拠を提示する。
上位5カ国に属す科学者は、他の科学者よりも出版率の不平等に大きく貢献していることがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:46:15 GMT)
Practical Implications of Implementing Local Differential Privacy for Smart grids [0.1] スマートグリッドのための LDP モデルを実装する際の課題について論じる。
本稿では, LDPの理論的モデルを, 様々なユーティリティ機能のためのスマートグリッドの実践的な設定に翻訳することの課題について論じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:11:46 GMT)
Tesseract: A Search-Based Decoder for Quantum Error Correction [0.0] Tesseractは、低密度パリティチェック量子誤り訂正符号のための最もよく似たエラーデコーダである。
等速な物理誤差率を維持しながら,テッセラクトは整数プログラミングよりもかなり高速であることを示す。
また、テッセラクトは中性原子量子コンピュータ上で表面符号のプロトコルをデコードできる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:23:53 GMT)
Deep thermalization under charge-conserving quantum dynamics [0.0] 深熱化」は量子多体力学における普遍波動関数分布の出現を記述している。
本研究では, 連続内部対称性と関連する保存則が深部熱化に及ぼす影響について詳細に検討した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:40:42 GMT)
PUBLICSPEAK: Hearing the Public with a Probabilistic Framework in Local Government [0.0] PUBLICSPEAKは,地方自治体の会合で公的な発言を発見できる確率的枠組みである。
PUBLICSPEAKが平均して10%向上し,最大40%向上することが確認された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:04:36 GMT)
NeuMC -- a package for neural sampling for lattice field theories [0.0] 格子場理論におけるニューラルサンプリングの促進を目的としたpytorchに基づくtextttNeuMCソフトウェアパッケージを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:07:04 GMT)
Who Are You Behind the Screen? Implicit MBTI and Gender Detection Using Artificial Intelligence [0.0] 本研究は,Telegram 会話データにおける言語パターンから直接,人格と性別の変数を推定する暗黙の分類について検討する。
本研究では,トランスフォーマーに基づく言語モデル (RoBERTa) を改良し,人格特性や性差を示す複雑な言語的手がかりを抽出する。
信頼度はモデル精度を86.16%に大きく上げるのに役立つため、RoBERTaは会話テキストデータから暗黙のパーソナリティタイプを一貫して識別する能力を持っている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:59:45 GMT)
Visual Adaptive Prompting for Compositional Zero-Shot Learning [0.0] VLM(Vision-Language Models)は、視覚およびテキストデータの共同表現を学習する際、印象的な能力を示す。
CZSLは、トレーニング中に明示的に遭遇しなかった属性やオブジェクトのような新しい視覚的プリミティブの組み合わせに一般化するモデルを必要とする。
意味的特徴と視覚的特徴のギャップを埋める視覚適応型プロンプトシステム(VAPS)を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:01:37 GMT)
TypedMatrices.jl: An Extensible and Type-Based Matrix Collection for Julia [0.0] TypedMatrices.jlは、テスト行列を整理するJuliaパッケージである。
デフォルトでは、このパッケージにはいくつかの組み込み行列とインターフェースが付属しており、ユーザーがプロパティに基づいてテストケースを選択するのに役立つ。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:44:11 GMT)
Two-particle scattering on general graphs [0.0] 量子ウォーク(英: Quantum walk)は、一般的なグラフ、あるいはより具体的にはグラフ上の散乱において、普遍的な量子計算を実行するのに十分な複雑さを包含する。
グラフ上に多粒子散乱の完全な理論を開発し始め、異なる性質を持つ多粒子ガジェットの初期的応用を提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:21:47 GMT)
Transfer Learning for Automated Feedback Generation on Small Datasets [0.0] 人間のマーカーに依存する場合、このフィードバックをタイムリーかつ正確にすることは難しい。
本稿では,非常に長いシーケンスを持つ非常に小さなデータセット上で,そのようなシステムを訓練する手法について述べる。
実世界における自動評価・フィードバック生成システムの利用についても論じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:57:54 GMT)
Towards a Digital Twin Modeling Method for Container Terminal Port [0.0] 本稿では,積み重ねクレーンの操作を合理化するためのディジタルツインベース手法の実装を提唱する。
提案手法では,デジタルツインシステム内の物理ヤードをミラーする仮想コンテナヤードを作成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:36:03 GMT)
To Assess the Impact of Smart Cities on Urbanization Patterns in the United States [0.0] 本研究は、スマートシティに関連する4つの重要な変数とその都市化への影響を明らかにする。
スマートシティ技術の実装は、人口密度の変化、土地利用の多様化、インフラのダイナミクスの強化と大きく関連している。
住民は、効率的な都市移動、環境持続可能性、個人の社会経済的改善に基づくスマートシティの嗜好を示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:13:17 GMT)
Thermalization rates and quantum Ruelle-Pollicott resonances: insights from operator hydrodynamics [0.0] 指数減衰率$overlineg$と局所ユニタリ進化の性質を拡散する作用素の関係を導出する。
我々の計算は、ランダムなユニタリ回路の解析結果に基づいているが、エルゴディックフロケ系では同様の結果が成り立つと論じている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:56:05 GMT)
The Problem of the Priors, or Posteriors? [0.0] 後頭骨の問題に対処する鍵は、後頭骨を統治する規範を考えることであると私は主張する。
私は、後部クレデンスを真実に収束させる、前向きのベイズ主義への特定のアプローチを開発します。
このアプローチは、オッカムのカミソリのベイズ的基礎と、統計学と機械学習における関連する推論手法にとって重要であると主張されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:06:34 GMT)
Testing eigenstate thermalization hypothesis on small scale quantum processors [0.0] 固有状態熱化仮説(英: Eigenstate Thermalization hypothesis、ETH)は、孤立した多体量子系におけるカオス力学に由来する熱的挙動を議論するための枠組みである。
ゲートベースの量子回路アプローチは、時間進化をシミュレートし、カオスの度合いの尺度であるOut-of-Time-Ordered Correlator (OTOC) を計算する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:35:15 GMT)
Systematic Classification of Studies Investigating Social Media Conversations about Long COVID Using a Novel Zero-Shot Transformer Framework [0.0] 新型コロナウイルスは、SARS-CoV-2感染から回復したかなりの数の個人に影響を及ぼすことで、公衆衛生に挑戦し続けている。
ソーシャルメディアは、リアルタイム情報、ピアサポート、Long COVIDに関連する健康上の懸念の検証を求める人々にとって、重要なリソースとして浮上している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:13:08 GMT)
Survey of City-Wide Homelessness Detection Through Environmental Sensing [0.0] アメリカにおけるホームレスの危機は、複雑な社会、経済、公衆衛生の課題を提起している。
従来のアセスメント手法は、その動的で分散した性質を捉えるのに苦労しており、スケーラブルでデータ駆動型検出の必要性を強調している。
この調査では、コンピュータビジョンとディープラーニングによるエンキャンプメントと都市指標の識別、固定、モバイル、クラウドソースによる空気質のセンシング、リアルタイムの都市モニタリングのためのIoTとエッジコンピューティング、モビリティパターンのための歩行者行動分析の4分野にわたる計算アプローチについて調査した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:06:18 GMT)
States of Disarray: Cleaning Data for Gerrymandering Analysis [0.0] 我々は、研究者、学生、一般市民が容易にアクセスし分析できる22の州のデータを作成しました。
提出時点では、研究者、学生、一般市民が容易にアクセスし分析できる22の州のデータがあります。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:33:00 GMT)
Standards for Belief Representations in LLMs [0.0] 我々は、信念のように数えられるように記入する表現の妥当性を論じる。
理論的考察と実践的制約のバランスをとるための4つの基準を確立する。
提案する基準は,精度,コヒーレンス,均一性,使用性である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:14:16 GMT)
Splitting and connecting singlets in atomic quantum circuits [0.0] 我々は、光学格子中にフェルミオンカリウム-40原子の2つの磁性状態の一対の対を作る。
我々は,50以上の格子点に対して99.78(3)%の単一シフト忠実度でパンピングを行い,このペアを非コヒーレンスな部分空間に分割する。
我々の研究は、絡み合いの複雑なパターンを作り、量子処理、センシング、原子干渉計への新しいアプローチを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:41:54 GMT)
Scattering resonances and pairing in a Rabi-coupled Fermi gas [0.0] 2つのフェルミオン種(スピン)がRabiと結合し、第3の未結合種と相互作用するシナリオを考察する。
最小限の低エネルギーモデル内での正確な計算を用いて、有効散乱長と有効範囲に関する解析式を導出する。
一般化されたThouless criterionにより、散乱特性がRabi結合フェルミガスの超流動遷移に直接的な影響を与えることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:49:22 GMT)
Scaling the Automated Discovery of Quantum Circuits via Reinforcement Learning with Gadgets [0.0] 強化学習(Reinforcement Learning, RL)は、量子回路を設計するための強力なツールである。
本稿では,複合ゲートの体系的発見と導入に基づく原則的アプローチを提案する。
我々は、標準のCNOTゲートとアダマールゲートに加えて、複合クリフォードゲートの形でガジェットを組み込むことで、RLエージェントの効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:55:49 GMT)
SDF-TopoNet: A Two-Stage Framework for Tubular Structure Segmentation via SDF Pre-training and Topology-Aware Fine-Tuning [0.0] 主な課題は、計算効率を維持しながら位相的正しさを確保することである。
改良されたトポロジ対応セグメンテーションフレームワークである textbfSDF-TopoNet を提案する。
SDF-TopoNetは, 位相的精度と定量的セグメンテーションの指標の両方において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 23:54:38 GMT)
RetrieveGPT: Merging Prompts and Mathematical Models for Enhanced Code-Mixed Information Retrieval [0.0] インドでは、ソーシャルメディアのユーザーはローマ文字を使ってコードミキシングされた会話をすることが多い。
本稿では,コードミキシングによる会話から関連情報を抽出することの課題に焦点をあてる。
我々は、コードミキシングされた会話から最も関連性の高い回答を自動的に識別するメカニズムを開発する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:04:15 GMT)
Rethinking Rotation-Invariant Recognition of Fine-grained Shapes from the Perspective of Contour Points [0.0] 形状認識のための輪郭幾何学的認識に基づく反雑音回転不変畳み込みモジュールを提案する。
その結果, 粒状形状の回転不変認識において, 優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:34:20 GMT)
Remote preparation of motional Schrödinger cat states via dissipatively-driven non-Gaussian mechanical entanglement [0.0] 非ガウス的機械的絡み合った状態を生成するための駆動散逸方式を提案する。
また, アンタングルを介し, 機械的シュリンガー猫状態も遠隔操作で作成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:53:09 GMT)
Relevance Isn't All You Need: Scaling RAG Systems With Inference-Time Compute Via Multi-Criteria Reranking [0.0] 標準的なRAGパイプラインでは、コンテキスト関連性のみを最大化することで、ダウンストリーム応答の品質を低下させることができることを示す。
本稿では,Rerankyond reLevance (REBEL)を導入し,推論時間計算でRAGシステムをスケールできるようにする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:19:39 GMT)
Refining spectroscopic calculations for trivalent lanthanide ions: a revised parametric Hamiltonian and open-source solution [0.0] パラメトリックな半経験的ハミルトン派を改訂し、文学における長年の相違に対処する。
文献で利用可能な実験データに基づいて、LaF$_3$とLiYF$_4$のイオンに対する新しいパラメータのセットを示す。
この結果の再現性を確保するため,オープンソースコードである $mathbftexttqlanth$ を,電子ファイルの包括的なセットとともに利用可能にしている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:03:11 GMT)
Questões à "Interpretação da Consciência Processual" da Mecânica Quântica [0.0] 本稿は、その究極的な存在論的結果に対する標準的な解釈を提示し、PCIを紹介し、XX ANPOF MeetingにおけるPCIに関する質問に基づくリフレクションを提供する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:11:32 GMT)
Quantum permutation puzzles with indistinguishable particles [0.0] 置換パズルの量子バージョンを導入し、パズルの断片を区別不可能な量子粒子に置き換える。
同一の粒子が絡み合っているにもかかわらず、粒子の置換を単純に古典的な置換パズルにマッピングできることが示される。
結果として得られるパズルは古典的な置換パズルにマッピングできない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:54:41 GMT)
Quantum Dissipative Search via Lindbladians [0.0] 我々は、構造化されていない古典的な探索空間上の純粋に散逸した量子ランダムウォークを解析する。
ある種のジャンプ演算子は量子過程を古典的過程に複製させ、他方はオープン量子(OQRW)と古典的ランダムウォークの違いをもたらすことを示す。
また,従来観測されていた2次高速化も明らかにし,OQRWは古典的検索ほど効率的ではないことを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:46:15 GMT)
Provenance Detection for AI-Generated Images: Combining Perceptual Hashing, Homomorphic Encryption, and AI Detection Models [0.0] 我々は、セキュアでトランスフォーメーションに耐性のあるAIコンテンツ検出のためのフレームワークを開発する。
我々は、対角的に頑健な最先端の知覚ハッシュモデルDinoHashを開発した。
我々は,ユーザクエリとレジストリプライバシの両方の保護を確保するために,MP-FHE(Multi-Party Fully Homomorphic Encryption)方式を提案フレームワークに統合する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:42:18 GMT)
Prompt Injection Detection and Mitigation via AI Multi-Agent NLP Frameworks [0.0] 本稿では,プロンプトインジェクションの脆弱性に対処するためのマルチエージェントNLPフレームワークを提案する。
このフレームワークは、レスポンスの生成、アウトプットの衛生化、ポリシーコンプライアンスの実施のための特別なエージェントを編成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:41:45 GMT)
Probing prethermal nonergodicity through measurement outcomes of monitored quantum dynamics [0.0] また, 計測結果から, 監視力学系自体の特性について重要な情報が得られることを示した。
システム内の情報損失は、増大する絡み合いによって反映され、創発的構造によって補償される。
本研究は, 熱水性非エルゴディティの捕食における測定とそれに伴う古典的結果の重要な役割を明らかにするものである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:17:23 GMT)
Probability-turbulence divergence: A tunable allotaxonometric instrument for comparing heavy-tailed categorical distributions [0.0] 正規化可能なカテゴリーの周波数分布を比較するための調整可能な機器である「確率乱流発散」を導入し,検討する。
確率乱流の発散が既存の多くの距離や測度を明示的にあるいは機能的に一般化することを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:01:29 GMT)
Proactive Adversarial Defense: Harnessing Prompt Tuning in Vision-Language Models to Detect Unseen Backdoored Images [0.0] バックドア攻撃は、隠れたトリガーを入力に埋め込むことで重大な脅威となり、モデルがそれらをターゲットラベルに誤って分類する。
トレーニングと推論の両方において、未確認のバックドア画像を検出するための画期的な手法を提案する。
われわれのアプローチは、学習可能なテキストプロンプトを訓練し、クリーンな画像と隠れたバックドアトリガーを区別する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:24:34 GMT)
Privacy Violations in Election Results [0.0] 個々の投票記録の公開は、99.83%の有権者の投票選択を公表することにつながるものではない。
透明性の潜在的なメリットについて議論し、プライバシー侵害を減らすか排除するための対策を比較し、すべての選挙報告に固有のプライバシーと透明性のトレードオフを強調します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:14 GMT)
Power-consumption Backdoor in Quantum Key Distribution [0.0] 本稿では、QKD送信機の電気光学成分を制御する電子ドライバの消費電力を利用して、QKDシステムに対する電力側チャネル解析を提案し、実装する。
我々の結果は一貫性があり、重要な情報漏洩を示し、送信されたキュービットを100MHzの繰り返し周波数で予測する際の最大精度は73.35%に達した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:01:11 GMT)
Power Spectrum Signatures of Graphs [0.0] グラフ信号の2乗グラフフーリエ変換として定義される新しい点符号、パワースペクトル符号、$mathbbR$の尺度を提案する。
入力グラフの摂動の下では、パワースペクトルのシグネチャは、ワッサーシュタイン計量に関して安定であることを示す。
このシグネチャの実用的価値を示すために、ポイントクラウドデータにおける幾何や対称性を特徴づけるいくつかの応用とグラフ回帰問題を紹介した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:09:50 GMT)
Positivity sets of hinge functions [0.0] 実平面のどの部分集合が、一層ReLUニューラルネットワークが正の値を取る点の集合として実現可能であるかを検討する。
このような一層ニューラルネットワークの様々な例を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:26:24 GMT)
Physics-based simulation ontology: an ontology to support modelling and reuse of data for physics-based simulation [0.0] この研究は、物理学ベースのシミュレーションオントロジー(PSO)という、工学設計における物理ベースのシミュレーションのために開発されたオントロジーを提示する。
PSO-Physics(PSO-Physics)とPSO-Physics(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO-Physic s)(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO-Physics)(PSO))。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:51:42 GMT)
Physical Principles of Quantum Biology [0.0] 物理の観点から量子生物学にアプローチする。
研究者、生物学者、物理学者、生化学者、医学者、量子力学の学生のために書かれた。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:12:25 GMT)
Pesti-Gen: Unleashing a Generative Molecule Approach for Toxicity Aware Pesticide Design [0.0] 気候変動により作物の弾力性と農薬の効力は減少し、合成農薬への依存は避けられない。
本稿では, 変異型オートエンコーダをベースとした新しい生成モデルであるPesti-Genを提案し, 最適化特性を有する殺虫剤候補を生成する。
ペスティ-ゲンは、新しい分子構造を生成する際に、およそ68%の構造的妥当性を達成する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 06:16:49 GMT)
Permutation Equivariant Neural Networks for Symmetric Tensors [0.0] 我々は、$mathbbRn$の対称パワー空間の間のすべての線型置換同変関数の2つの異なる特徴付けを示す。
これらの関数は標準テンソルと比較して非常に効率的であり、異なる大きさの対称によく一般化できることを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:33:13 GMT)
Performance of wave function and Green's functions based methods for non equilibrium many-body dynamics [0.0] 量子多体系の非平衡力学は、強い駆動場と弱い駆動場の観点から研究される。
類似性変換されたハミルトニアンに基づく圧縮された定式化は、弱場において実質的に正確であり、したがって弱あるいは中程度に相関する系であることを示す。
グリーン関数が(広く普及している)GW近似で予測するダイナミクスは、強駆動状態における平均場の結果を著しく改善することで、より正確ではない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:06:45 GMT)
Over-Squashing in Graph Neural Networks: A Comprehensive survey [0.0] この調査は、グラフニューラルネットワーク(GNN)におけるオーバースカッシングの課題を掘り下げるものだ。
オーバースカッシングの原因、結果、緩和戦略を包括的に探求する。
グラフの書き換え、新しい正規化、スペクトル分析、曲率に基づく戦略など、様々な手法がレビューされている。
また、オーバー・スムーシングなど、オーバー・スカッシングと他のGNN制限との相互作用についても論じている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:10:31 GMT)
Order Fairness Evaluation of DAG-based ledgers [0.0] 分散台帳の順序公正性(英: Order fairness)とは、トランザクションが送信されたり、受信されたりした順序を、最終的な順序に関連付ける性質を指す。
本稿では,DAGをベースとした台帳の整合性を定量化することを目的とする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:43:17 GMT)
Optimal sampling of tensor networks targeting wave function's fast decaying tails [0.0] 等尺テンソルネットワーク状態に対する局所測定文字列の量子結果のサンプリングに最適戦略を導入する。
このアルゴリズムはサンプルの繰り返しを回避し、指数関数的に減衰する尾を持つサンプリング分布を効率的に行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:03:00 GMT)
Optical-pumping attack on a quantum key distribution laser source [0.0] 光源レーザのパルスエネルギを外部光で閉じ込めるだけでなく, パルスエネルギを増大させることが可能である。
レーザダイオードを1310nm, 1.6mW cwレーザー光に照射すると, パルスエネルギーは10%増加した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:44:40 GMT)
On the relationship between Koopman operator approximations and neural ordinary differential equations for data-driven time-evolution predictions [0.0] 辞書学習(EDMD-DL)による拡張動的モード分解は、状態空間上の非線形離散時間フローマップのニューラルネットワーク表現と等価であることを示す。
ロレンツ系におけるカオス力学の数値実験と乱流せん断流れの9モードモデルを用いてこれらの手法を評価する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:22:16 GMT)
Nonequilibrium Universality of a Squeezing Phase Transition [0.0] ハイゼンベルクに特徴的な位相と部分集合位相の遷移を見出した。
本研究は, 低温原子, 分子, ライドバーグプラットフォームにおける量子センシングおよび量子シミュレーションへの応用の可能性を考慮した新しい動的相転移を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:43:34 GMT)
Noise immunity in quantum optical systems through non-Hermitian topology [0.0] 非整合性は非線形駆動散逸系の非平衡定常状態から一方向のノイズの流れを可能にすることを示す。
この一方向流は、量子ノイズに対する非エルミート皮膚効果(NHSE)から生じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:40:54 GMT)
Noise effects on the diagnostics of quantum chaos [0.0] 本稿では、スペクトル形成因子(SFF)、クリロフ複雑性(Krylov complexity)、時間外相関器(OTOCs)の3つの主要なツールに焦点を当て、ノイズが量子カオスの診断に与える影響について検討する。
強い雑音の限界では、SFF、二点相関関数、OTOCはカオス的振舞いの区別に効果がない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:43:09 GMT)
Multi-Stage Generative Upscaler: Reconstructing Football Broadcast Images via Diffusion Models [0.0] 本研究では, 劣化画像の高分解能化のための多段階生成アップスケーリングフレームワークを導入し, 最大6.4×64$の入力を高忠実度1024×1024$の出力に変換する。
イメージ・ツー・イメージ・パイプライン、コントロールネット・コンディショニング、LoRAファインチューニングを統合することで、我々は複雑なテクスチャやプレイヤーの詳細やジャージーのロゴといったドメイン固有の要素を復元する従来のアップスケーリング手法を超えている。
ControlNetは細部を精細化し、LoRAはタスク固有要素の強化を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:28:30 GMT)
Mechanical Sensors for Ultraheavy Dark Matter Searches via Long-range Forces [0.0] メカニカルセンサを用いたプランクスケール周辺での暗黒物質候補探索の道を探る。
これらのダークマター粒子は、機械的センサーアレイの符号として軌道を残すことが期待されている。
統計的手法を用いて,このようなトラックを効果的に探索できることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:59:03 GMT)
Matching Lagrangian and Hamiltonian Simulations in (2+1)-dimensional U(1) Gauge Theory [0.0] U$(1)$ゲージ理論のハミルトン極限を$(2+1)$次元で数値的に計算する。
これは、時間方向に異方性を持つ格子を持つラグランジュ形式論におけるモンテ・カルロのシミュレーションによって達成される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:05:55 GMT)
Master Stability Functions in Complex Networks [0.0] 同期現象の安定性はマスター安定性関数(MSF)を用いて広範囲に研究されている。
MSF分析は25年間、同期状態の安定性の研究に使われてきた。
多様な非指向型および指向型ネットワークシステムに対する簡易かつ統一的なMSF解析法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:23:18 GMT)
Markov chain Monte Carlo Detector Tomography applied to a NbTiN nanobridge [0.0] 我々は, フレキシブルかつ高精度なマルコフ連鎖モンテカルロ量子検出器トモグラフィー法を用いて, 120nm幅のNbTiN超伝導ナノブリッジ単光子検出器の応答を記述する。
内部量子効率と外部量子効率の分離は、非均一な1光子内部量子効率を持つ検出器と比較して理想的な1光子しきい値検出器の飽和挙動の違いにより可能である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:20:13 GMT)
Majorana fermions solve the tetrahedron equations as well as higher simplex equations [0.0] ヤン・バクスター方程式は量子可積分モデルを定義する。
四面体と高次単純方程式は多次元一般化である。
より低い単純度演算子から高次単純度演算子を構築する体系的手法を開発する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 03:31:24 GMT)
Long optical coherence times and coherent rare earth-magnon coupling in a rare earth doped anti-ferromagnet [0.0] 希土類イオンドープ結晶のスピンおよび光遷移に長いコヒーレンス時間が示されている。
希土類イオンドーパントに対する低ひずみスピンフリーホスト結晶はまだ証明されていない。
反強磁性秩序のガドリニウムバンデン酸ガドリニウム中のエルビウムドーパントで報告された長い光コヒーレンス時間は、別の方法を示している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:11:44 GMT)
Line of Duty: Evaluating LLM Self-Knowledge via Consistency in Feasibility Boundaries [0.0] 本研究は,新たな手法を用いて,異なるタイプのLDM自己知識に関する本質的な洞察を得ることを目的とする。
GPT-4oやMistral Largeのようなフロンティアモデルでさえ、その80%以上の能力を確信していないことが分かりました。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:07:07 GMT)
Limits of nonlinear and dispersive fiber propagation for photonic extreme learning [0.0] スペクトル符号化, 読み出し, ノイズのパラメータとともに, 伝搬力学の精度がどう影響するかを考察する。
異常および正常な分散状態において, それぞれ91%以上, 93%以上の検定精度が観察された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:36:47 GMT)
Light Dark Matter Search with Nitrogen-Vacancy Centers in Diamonds [0.0] 本研究では, ダイヤモンド中の窒素空孔中心を持つ磁気計を用いて, アクシオンやダーク光子などの暗黒物質を探索する新しいアイデアを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 17:56:30 GMT)
LLMs for Translation: Historical, Low-Resourced Languages and Contemporary AI Models [0.0] 本稿は、ゲミニが18世紀のオスマン帝国の写本『Infidels: The Memoirs of Osman Agha of Timisoara』を翻訳した際の業績について考察する。
我々の分析によると、ジェミニの安全メカニズムは、原稿の14~23%を有害と判断し、未訳の通過をもたらすことがわかった。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:59:12 GMT)
LEACH-RLC: Enhancing IoT Data Transmission with Optimized Clustering and Reinforcement Learning [0.0] 本稿では,Low-Energy Adaptive Clustering with Reinforcement Learning-based Controller (LEACH-RLC)を提案する。
MILPアプローチによるクラスタヘッド(CH)とノード対クラスタ割り当ての戦略的選択
新しいクラスタを生成するための最適なタイミングを学習することで、制御オーバーヘッドを最小限に抑えるRLエージェント。
その結果、最先端プロトコルよりもLEACH-RLCの方が優れた性能を示し、ネットワーク寿命の向上、平均エネルギー消費の削減、制御オーバーヘッドの最小化を示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:36:09 GMT)
Josephson vortices and persistent current in a double-ring supersolid system [0.0] ポテンシャル障壁によって生成される放射結合同心円環トラップにおける超低温双極子原子の性質を理論的に検討する。
超流動-超固体相転移における非回転基底相の研究を行った。
回転を適用すれば、角運動量や障壁強度によって、どちらの環でも密度変調が誘導される。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:03:10 GMT)
Integrating LLMs in Gamified Systems [0.0] このフレームワークは、タスクダイナミクス、ユーザエンゲージメント、報酬システムの改善に重点を置いている。
シミュレーション環境はフレームワークの適応性をテストし、現実世界のアプリケーションにその可能性を示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:47:04 GMT)
Impurity-induced counter skin-effect and linear modes in non-Hermitian systems [0.0] 非相互格子系は最も単純な非エルミート系の一つである。
本研究では,不純物が本システムの内在性非エルミート皮膚効果にどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:32:44 GMT)
Implicit Bias-Like Patterns in Reasoning Models [0.0] インプシットバイアス(英語: Implicit bias)とは、知覚、判断、行動を形成する自動的または自発的な精神過程のことである。
本稿では、推論モデルにおける暗黙のバイアス様パターンを研究するために、Reasoning Model Implicit Association Test (RM-IAT) と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:40:02 GMT)
HopCast: Calibration of Autoregressive Dynamics Models [0.0] ディープラーニングモデルは、微分方程式を用いてモデル化できる力学系を近似するためにしばしば訓練される。
これらのモデルは、予測モデルが不確実性を定量化できれば、一歩先を予測し、キャリブレーションされた予測を生成するように最適化されている。
この研究は、マルチステップ予測のための深いアンサンブルを用いた校正誤差に基づいて、既存の不確実性伝搬法をベンチマークした最初のものである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 01:19:34 GMT)
Hong-Ou-Mandel Comb and Switch using parallel chains of non-identical Micro-Ring Resonators [0.0] マイクロリング共振器(MRR)は,様々な可変パラメータの組み合わせでHong-Ou-Mandel(HOM)効果にアクセスできる。
我々は、香港・ウー・マンデル多様体(HOMM)の変化のために、非同一のMRRパラメータを調整する方法について議論する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:07:02 GMT)
HateGPT: Unleashing GPT-3.5 Turbo to Combat Hate Speech on X [0.0] マクロF1スコアを用いた分類モデルの性能評価を行った。
その結果,ラン1が最高性能を示し,精度とリコールの点でモデルが一貫して良好に動作していることが示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:06:53 GMT)
Hamiltonian Reordering for Shallower Trotterization Circuits [0.0] 我々は、より浅い進化回路を生成するために、トロタライゼーションの前にハミルトニアンを前処理することに注力する。
具体的には、パウリ語を並べ替え、「ゲート並列性」を高めるためにグラフ色付け手法を適用する。
以上の結果から,回路の浅部は非整合回路に比べて高速に収束し,エネルギー準位に達することが示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 07:43:09 GMT)
Hacking Cryptographic Protocols with Advanced Variational Quantum Attacks [0.0] 我々は,S-DES,S-AES,Blowfishなどの対称鍵プロトコルに対する攻撃シミュレーションを実装した。
我々の攻撃によって、小さな8量子ビット量子コンピュータの古典的なシミュレーションによって、32ビットのBlowfishインスタンスの秘密鍵を、ブルートフォース攻撃の24倍の回数で見つけることができることを示す。
また、非対称キープロトコルやハッシュ関数など、対称キー暗号以外の応用についても論じている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:36:05 GMT)
Generalized Bayesian Ensemble Survival Tree (GBEST) model [0.0] 本稿では,一般ベイズアンサンブルサバイバルツリー(GBEST)と呼ばれる生存予測モデルを提案する。
我々の貢献は、ベイジアンブートストラップ法とベータステイシーブートストラップ法を用いてサバイバルアプリケーションの結果を改善するアンサンブル手法の提案である。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:40:18 GMT)
GPDFlow: Generative Multivariate Threshold Exceedance Modeling via Normalizing Flows [0.0] GPDFlowは、正規化フローを利用して依存構造を柔軟に表現する革新的なmGPDモデルである。
GPDFlowは依存のパラメトリックな仮定を明示していないため、柔軟性が向上し、性能が向上する。
GPDFlowは従来のパラメトリック手法と比較してモデリング精度と柔軟性を著しく向上することを示した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:20:38 GMT)
Further Exploration of Precise Binding Energies from Physics Informed Machine Learning and the Development a Practical Ensemble Model [0.0] 機械学習モデルに通知された16の新しい物理は、現代の質量モデルからのエネルギー残基の結合について訓練されている。
モデルはAME 2012データのサブセットでトレーニングされ、AME 2020データのサブセットで検証されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 04:19:23 GMT)
From Generative AI to Innovative AI: An Evolutionary Roadmap [0.0] 本稿では,ジェネレーティブ・人工知能(GenAI)からイノベーティブ・人工知能(InAI)への移行について検討する。
この文脈では、イノベーションは、学習したデータの単なる複製を超えて、新しく有用なアウトプットを生成する能力として定義される。
本稿では、コンテンツを生成し、自律的な問題解決と創造的思考に携わるAIシステム開発のためのロードマップを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:03:28 GMT)
Forecasting Empty Container availability for Vehicle Booking System Application [0.0] 本研究では,VBSフレームワーク内のコンテナ端末システムにおいて,空きコンテナの可用性を予測するためのデータ駆動型アプローチの開発と評価に焦点をあてる。
空のコンテナドウェル時間の最適化に関する研究のギャップに対処し、コンテナ端末操作の運用効率を高めることを目的としている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 08:29:04 GMT)
Finding a Fair Scoring Function for Top-$k$ Selection: Hardness, Algorithms, and Experiments [0.0] ここでは, 線形スコアリング関数を, 公平なトップ$k$選択に対して同定する問題を考える。
関数は各項目のスコアを(数値的な)属性値の重み付け和として計算する。
既存のアルゴリズムは大規模で高次元のデータセットに効果的にスケールしない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:40:36 GMT)
FedMentalCare: Towards Privacy-Preserving Fine-Tuned LLMs to Analyze Mental Health Status Using Federated Learning Framework [0.0] FedCareは、メンタルヘルスケアアプリケーションに大規模言語モデル(LLM)をデプロイするための、プライバシ保護フレームワークである。
われわれのフレームワークは、現実のメンタルヘルスシナリオにLSMをデプロイするためのスケーラブルでプライバシに配慮したアプローチを実証している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 00:18:36 GMT)
Exponential Quantum Advantage for Simulating Open Classical Systems [0.0] この利点は、散逸を経験するオープン古典システムの力学を計算するためにどのように利用できるかを示す。
これは、流体力学から熱化に至るまでの文脈において、散逸が重要な役割を果たすため、特に興味深いシステムである。
量子ゲートを$O(rm poly(d, n, t, varepsilon-1))$O(rm poly(d, n, t, varepsilon-1)$)$O(rm poly(d, n, t, varepsilon-1)$)$O()$O(rm poly(d, n, t, varepsilon-1)$)$自由度に結合した$d$自由度をシミュレートすることができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:07:24 GMT)
Evaluating Synthetic Tabular Data Generated To Augment Small Sample Datasets [0.0] 本研究は,小サンプルデータセットの増大にともなう合成データの評価手法を提案する。
実験の結果,大域的測度とトポロジカル測度との間には大きな矛盾が認められた。
単一の計量が分布的および構造的類似性の両方を確実に捉えることはない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:08:54 GMT)
Estimating Bell Diagonal States with Separable Measurements [0.0] この研究は、局所的な行動や古典的な通信に限られる量子ネットワーク内のベル対角状態の推定を分析する。
我々は,直接反転と最大推定よりもベイズ平均推定の利点を示し,推定リスクの解析式を提供し,数値シミュレーションによる解析結果の支持を行う。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:43:02 GMT)
Efficient Truncations of SU($N_c$) Lattice Gauge Theory for Quantum Simulation [0.0] 格子ゲージ理論は、量子色力学の非摂動力学を研究する可能性を与える。
ナイーブ分析は 膨大な計算資源を必要とすることを示唆している
これらのハミルトニアンによって生成される時間進化の量子シミュレーションに必要な計算資源は、以前のアプローチよりも17-19桁小さいことが示されている。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 21:30:47 GMT)
Dynamics of Quantum Correlations within the double Caldeira-Leggett formalism [0.0] 本研究では,デコヒーレンスとスクイージングが様々な量子特性の力学に及ぼす影響について検討した。
異なる環境と相互作用する粒子と、共通の環境に結合する粒子の2つのシナリオを比較した。
温度はデコヒーレンスを高め、コヒーレンス回復を抑制する一方、スクイージングは過渡的なダイナミクスに影響を与えるが、長期的なコヒーレンス飽和には影響しない。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:11:33 GMT)
Does calibration mean what they say it means; or, the reference class problem rises again [0.0] グループキャリブレーションスコアは、異なるグループの個人に対して"平均的に同じもの"である。
キャリブレーションは、同じ意味の絵が公正のために重要なことを意味しているような一貫性のあるスコア解釈を保証できない。
この監視の起源を反映して、より広いレンズがアルゴリズム的公正性の主要な方法論に開きます。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:04:21 GMT)
Deepfake Detection of Face Images based on a Convolutional Neural Network [0.0] フェイクニュース、特にディープフェイク(非リアルな画像やビデオコンテンツ)は、ここ数年で深刻な話題になっている。
我々は、人間の肖像画を映し出した、このような生成および偽画像を検出するために、畳み込みニューラルネットワークに基づくモデルを構築したい。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:33:22 GMT)
Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves [0.0] 簡単な回避ゲームを行う深層学習エージェントによって表現される最適な戦略を提案する。
我々は、2人のエージェントの学習と行動を分析する。
本研究は,ゲーム『ホークス』や『ダブズ』に類似した行動を示し,攻撃的エージェントが目標に到達するための攻撃的戦略を採用し,他のエージェントが攻撃的エージェントを避ける方法を学ぶことを示唆している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:41:08 GMT)
DCAT: Dual Cross-Attention Fusion for Disease Classification in Radiological Images with Uncertainty Estimation [0.0] 本稿では,医用画像解析のための新しい二重対向核融合モデルを提案する。
機能統合と解釈可能性における重要な課題に対処する。
提案されたモデルはAUCの99.75%、100%、99.93%、98.69%、AUPRの99.81%、100%、99.97%、96.36%をそれぞれコビッド19、結核、肺炎胸部X線画像、網膜CT画像で達成した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:28:20 GMT)
Contract Based Program Models for Software Model Checking [0.0] 構成モデル検査のために以前に開発された形式主義を提案する。
InCで書かれた組込み型安全クリティカルソフトウェアにおいて,提案する検証手法をサポートするために,作業フローとツールチェーンの構想について述べる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:34:59 GMT)
Configuration Design of Mechanical Assemblies using an Estimation of Distribution Algorithm and Constraint Programming [0.0] 機械工学における構成設計の問題は、部品と関節の最適な組み立てを見つけることである。
このような問題は離散的で制約があり、ブラックボックス最適化の問題である。
二変量分布アルゴリズムと制約プログラミングを適用して,この問題を解く新しい手法を開発した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 02:00:54 GMT)
Cloud2BIM: An open-source automatic pipeline for efficient conversion of large-scale point clouds into IFC format [0.0] 本稿では,ポイントクラウドのBIMモデルへの変換を自動化するために設計された,オープンソースのソフトウェアツールであるCloud2BIMを紹介する。
既存のツールとは異なり、RANSACのような計算および校正集約技術を避け、非直交ジオメトリーをサポートし、高速競合ソリューションよりも最大7倍高速な処理速度を実現する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:26:02 GMT)
Characterization of coherent errors in gate layers with robustness to Pauli noise [0.0] 最先端のキャラクタリゼーションプロトコルは、しばしばコヒーレントノイズに焦点を当て、パウリやクリフォード・トワイリング技術を使用する際のコヒーレントエラーを取り除く。
我々は,不整合局所パウリ雑音モデルの拡張をコヒーレントエラーに動機付け,任意のゲート層に対する実用的な特徴付けプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:35:21 GMT)
Cardiomyopathy Diagnosis Model from Endomyocardial Biopsy Specimens: Appropriate Feature Space and Class Boundary in Small Sample Size Data [0.0] 本研究の目的は, 心筋症の病態診断において, テクスチャの特徴が特徴抽出に有効かどうかを検討することである。
以上の結果より, テクスチャの特徴が心筋症の病態診断に有効である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 11:59:23 GMT)
Boosting Hierarchical Reinforcement Learning with Meta-Learning for Complex Task Adaptation [0.0] 階層強化学習(HRL)は、それらを構造化されたポリシーに分解することで複雑なタスクを解決するのに適している。
エージェントが階層的なポリシーをより効果的に学習し、適応できるように、メタラーニングをHRLに統合することを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:52:03 GMT)
Banking on Feedback: Text Analysis of Mobile Banking iOS and Google App Reviews [0.0] この研究は、Google PlayとiOS Appストアから収集された5つの主要なカナダの銀行からのm-bankingアプリの消費者レビューを分析した。
肯定的なレビューはユーザビリティ、信頼性、特徴を称賛する一方で、否定的なレビューはログインの問題、不具合、更新に対する不満を指摘した。
発見は、ユーザフレンドリなデザイン、安定したアップデート、より良いカスタマーサービスの重要性を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:41:17 GMT)
Automated Verification of Equivalence Properties in Advanced Logic Programs -- Bachelor Thesis [0.0] 最適化されたサブプログラムが元のサブプログラムを置き換えることができるかどうかを自動的に検証できるツールを持つことが望ましい。
そのため、翻訳ツールのアンセムが開発された。
2つのプログラムが強い同値であることを検証するために、古典論理のための自動定理証明器と併用することができる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 18:06:10 GMT)
Analog Quantum Simulation of Coupled Electron-Nuclear Dynamics in Molecules [0.0] プレBOフレームワークにおける分子ビブロニックダイナミクスに対する最初のアナログ量子シミュレーション手法を提案する。
提案手法は,等価な古典的アルゴリズムと比較して資源と計算コストが指数関数的に削減されていることを示す。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 20:25:45 GMT)
An experimental approach on Few Shot Class Incremental Learning [0.0] FSCIL(Few-Shot Class-Incremental Learning)は、機械学習の幅広い範囲における最先端のパラダイムである。
本論文では,大規模データセットにまたがる広範な実験を含む,さまざまなソリューションを提案する。
それらの利点を強調し、最も有望なものを改善するために実験的なアプローチを提示します。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:36:15 GMT)
An automated geometric space curve approach for designing dynamically corrected gates [0.0] 量子ハードウェアのノイズの性質は、ノイズに敏感な方法で高忠実度量子ゲートの実装を必要とする。
本稿では、ロバスト量子(BARQ)制御のためのB'ezier Ansatzと呼ばれる動的修正ゲートを設計する手法を提案する。
BARQは、量子の進化を幾何学的空間曲線にマッピングする空間曲線量子制御形式(Space Curve Quantum Control formalism)を使用している。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 15:18:32 GMT)
An Ensemble-Based Two-Step Framework for Classification of Pap Smear Cell Images [0.0] Pap Smear Cell Classification Challenge (PS3C)は2025年にI SBIと共同で設立された。
本研究の目的は,パップスミア画像分類のための自動ツールの開発を促進することである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 09:12:38 GMT)
An Algebraic Approach to Moralisation and Triangulation of Probabilistic Graphical Models [0.0] モラル化と三角形化は、確率分布をグラフィカルモデルに分解する様々な方法の切り替えを可能にする変換である。
本稿では、これらの変換をベイジアンネットワークとマルコフネットワークの間の関手としてモデル化する分類的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 19:16:41 GMT)
Aligning Graphical and Functional Causal Abstractions [0.0] 因果抽象化により、異なるレベルの粒度の因果モデルを関連付けることができる。
因果的抽象化のための2つの方法が文献で一般的である: (i) 構造レベルでモデルを関連付けるクラスタDAGや(ii) 変数と範囲の間のマップによるモデルを関連付ける$alpha$-abstractionsのような機能的抽象化。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:11:04 GMT)
Agent-Enhanced Large Language Models for Researching Political Institutions [0.0] 本稿では,タスクを合理化できる動的エージェントとして,Large Language Models (LLM) がどのように機能するかを示す。
エージェント検索増強世代(Agentic RAG)が中心である。
このアプローチの可能性を実証するために、米国議会の研究者を支援するために設計されたLLMエージェントであるコングレスラを紹介する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 22:04:40 GMT)
Advancements in Real-Time Oncology Diagnosis: Harnessing AI and Image Fusion Techniques [0.0] 人工知能(AI)を用いたリアルタイムコンピュータ支援診断は、腫瘍学者が高い精度で早期に癌を診断するのに役立つ。
本稿では,リアルタイムイメージングと画像融合の現在と将来の可能性について考察する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 12:00:22 GMT)
Additive Manufacturing for Advanced Quantum Technologies [0.0] 本稿では, 量子技術への添加性製造の適用について概説する。
光学,光学,磁気部品,真空装置などの添加物製造における技術の現状について論じる。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 16:38:32 GMT)
Adaptive Torque Control of Exoskeletons under Spasticity Conditions via Reinforcement Learning [0.0] 膝外骨格に対する深部強化学習(RL)による新しい適応型トルク制御器について述べる。
模擬膝伸展運動の結果から, 味覚レベルが異なる個人に対して, エージェントが外骨格を制御できることが判明した。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 14:22:09 GMT)
AI and Deep Learning for Automated Segmentation and Quantitative Measurement of Spinal Structures in MRI [0.0] 本研究では,MRIスキャンにおける重要な脊髄構造をセグメント化し,計測する自律型AIシステムの開発を行う。
目標は、臨床の作業量を削減し、診断の整合性を高め、評価を改善することである。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 10:39:52 GMT)
A posteriori error estimates for the Lindblad master equation [0.0] 我々は、無限次元ヒルベルト空間におけるリンドブラッドマスター方程式によって支配される開量子系のシミュレーションに興味がある。
標準的なアプローチは、有限次元部分空間における微分方程式を導出する2つの逐次近似を含む。
本稿では,数値結果の精度を保証するために明示的に計算できる2つの近似のバウンダリを確立する。
論文参考訳(メタデータ) (Fri, 14 Mar 2025 13:06:40 GMT)