ProVision: Programmatically Scaling Vision-centric Instruction Data for Multimodal Language Models [103.3] 既存のプラクティスは命令データを生成するために、強力だが高価な言語モデル(LLM)やマルチモーダル言語モデル(MLM)に依存している。
本稿では,シーングラフを画像のシンボル表現として利用し,視覚中心の命令データを体系的に合成するプログラムを提案する。
提案手法は,データ生成プロセスの解釈可能性と制御性を保証し,実際の精度を維持しながら効率よくスケールする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:52:23 GMT)
RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness [102.1] RLAIF-Vは,MLLMを完全なオープンソースパラダイムで整列させる新しいフレームワークである。
RLAIF-Vは、高品質なフィードバックデータ生成を含む2つの観点から、オープンソースのMLLMを最大限に探求する。
RLAIF-Vは、自動評価と人的評価の両方で6つのベンチマーク実験を行い、モデルの信頼性を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:31:22 GMT)
VMamba: Visual State Space Model [98.1] 状態空間言語モデルであるMambaを、線形時間複雑性を持つビジョンバックボーンであるVMambaに適合させる。
VMambaのコアには2D Selective Scan (SS2D)モジュールを備えたVisual State-Space (VSS)ブロックのスタックがある。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:57:13 GMT)
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models [79.0] VLN(Vision-and-Language Navigation)は近年注目を集めている。
基礎モデルは、VLN研究の課題と手法を形作っている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:16:37 GMT)
Language Model Preference Evaluation with Multiple Weak Evaluators [78.5] GED(Preference Graph Ensemble and Denoise)は、複数のモデルベースの評価器を活用して嗜好グラフを構築する新しいアプローチである。
GEDは,モデルランキング,応答選択,モデルアライメントタスクにおいて,ベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:08:04 GMT)
LLM2: Let Large Language Models Harness System 2 Reasoning [65.9] 大規模言語モデル(LLM)は、無数のタスクにまたがって印象的な機能を示してきたが、時には望ましくない出力が得られる。
本稿では LLM とプロセスベースの検証器を組み合わせた新しいフレームワーク LLM2 を紹介する。
LLMs2は妥当な候補を生成するのに責任を持ち、検証者は望ましい出力と望ましくない出力を区別するためにタイムリーなプロセスベースのフィードバックを提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:32:36 GMT)
Utilizing Multimodal Data for Edge Case Robust Call-sign Recognition and Understanding [65.6] アーキテクチャの堅牢性は、特にエッジケースでは明らかです。
マルチモーダルコールサインコマンドリカバリモデル(CCR)を提案する。
CCRアーキテクチャは、エッジケースのパフォーマンスを最大15%向上させる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:45:11 GMT)
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models [63.1] テキスト,画像,構造化されていない3Dオブジェクトから意味のある部分からなる3Dオブジェクトを生成する新しいアプローチであるPartGenを紹介する。
提案手法は, 生成された実物および実物の3次元資産に対して評価し, セグメンテーションおよび部分抽出ベースラインを大きなマージンで上回っていることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:01:58 GMT)
JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.8] JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。
私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。
提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:18:35 GMT)
SoundLoc3D: Invisible 3D Sound Source Localization and Classification Using a Multimodal RGB-D Acoustic Camera [61.6] SoundLoc3Dはタスクをセット予測問題として扱い、セットの各要素は潜在的な音源に対応する。
大規模シミュレーションデータセットにおけるSoundLoc3Dの有効性と優位性を示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:06:53 GMT)
HALLUCINOGEN: A Benchmark for Evaluating Object Hallucination in Large Visual-Language Models [57.6] LVLM(Large Vision-Language Models)は、複雑なマルチモーダルタスクの実行において顕著な性能を示す。
本稿では,新しい視覚的質問応答(VQA)オブジェクト幻覚攻撃ベンチマークであるHALLUCINOGENを提案する。
バイオメディカルドメインに適合した幻覚攻撃であるMED-HALLUCINOGENを導入した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:56:01 GMT)
ReTaKe: Reducing Temporal and Knowledge Redundancy for Long Video Understanding [55.3] 長時間ビデオ理解のための時間的視覚的冗長性と知識的冗長性を両立させるトレーニングフリー手法である$bfReTaKe$を導入する。
DPSelectは、人間の映像知覚と密接に一致している視覚的特徴に基づいて、局所的な最大ピーク距離を持つビデオを特定する。
PivotKVはピボットとしてVideoBenchsを使用し、注意スコアの低い非テキストトークンに対してKVキャッシュ圧縮を実行する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:42:24 GMT)
Explaining Length Bias in LLM-Based Preference Evaluations [51.1] 本研究では,選好評価指標,特に勝率を,好ましさと情報量という2つの重要な要素に分解する。
応答長が情報量に影響を与えることにより評価に影響を及ぼすことを示す。
本稿では,利得率測定のための簡易かつ効果的な調整法であるAdapAlpacaを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:52:29 GMT)
Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.3] 人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:59:45 GMT)
Game-Theoretic Joint Incentive and Cut Layer Selection Mechanism in Split Federated Learning [49.2] スプリット・フェデレーション・ラーニング(SFL)は、フェデレーションとスプリット・ラーニングの利点を組み合わせることで、有望なアプローチとして登場した。
階層的意思決定手法を用いて,単一リーダマルチフォロワStackelbergゲームとして定式化された問題をモデル化する。
以上の結果から,Stackelberg平衡解はクライアントとSFLモデル所有者の両方の実用性を最大化することがわかった。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:55:22 GMT)
DPBridge: Latent Diffusion Bridge for Dense Prediction [49.2] 拡散モデルは密度予測問題において顕著な成功を収めた。
画像条件付き生成問題として高密度予測タスクを定式化する生成フレームワーク DPBridge を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:50:34 GMT)
Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection [49.1] ヘイトフルミーム検出のためのLMM(Large Multimodal Models)の可能性を探る。
提案するEvolverは,Chain-of-Evolution (CoE) Promptingを介してLMMを組み込む。
Evolverは、ステップバイステップでLMMを通してミームと理由の進化と表現のプロセスをシミュレートする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 01:13:50 GMT)
MetricDepth: Enhancing Monocular Depth Estimation with Deep Metric Learning [46.6] 単分子深度推定において、クラスの自然な定義が存在しないことは、深度メートル法学習の活用に困難をもたらす。
本稿では,深度学習を統合した単眼深度推定法であるMetricDepthを紹介する。
さまざまなデータセットとモデルタイプにわたる実験は、MetricDepthの有効性と汎用性を示している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:57:12 GMT)
Boosting 3D Object Detection with Semantic-Aware Multi-Branch Framework [44.4] 自律走行では、LiDARセンサーは3Dポイントの雲の取得に不可欠であり、信頼できる幾何学的情報を提供する。
従来の前処理のサンプリング手法は意味的特徴を無視することが多く、詳細な損失や接地点干渉を引き起こす。
本稿では,Semantic-aware Multi-branch Smpling (SMS)モジュールとマルチビュー制約を用いたマルチブランチ2次元オブジェクト検出フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:32:27 GMT)
Stochastic gradient descent estimation of generalized matrix factorization models with application to single-cell RNA sequencing data [41.9] 単細胞RNAシークエンシングは、個々の細胞レベルでの遺伝子発現の定量化を可能にする。
次元の減少は、サンプルの可視化、クラスタリング、表現型特徴付けを単純化する一般的な前処理ステップである。
一般指数分散族分布を仮定した一般化行列分解モデルを提案する。
本稿では,モデルを効率的に推定できるスケーラブル適応降下アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:02:15 GMT)
Low-Overhead Channel Estimation via 3D Extrapolation for TDD mmWave Massive MIMO Systems Under High-Mobility Scenarios [41.2] 高モビリティのシナリオでは、チャネルの老朽化のため、頻繁にアップリンクチャネルを推定する必要がある。
本稿では,空間,周波数,時間領域にまたがる3領域(3D)チャネル外挿フレームワークを提案する。
数値実験の結果,提案手法はパイロット訓練のオーバーヘッドを16倍に抑えることができた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:54:13 GMT)
Training-free Heterogeneous Model Merging [40.7] 異種モデル用に設計された革新的なモデルマージフレームワークを提案する。
構造的に不均一なモデルのマージは、均質なマージに匹敵する性能レベルを達成することができることを示す。
私たちのコードはhttps://github.com/zju-vipa/training_free_heterogeneous_model_mergingで公開されています。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:49:11 GMT)
A Self-Supervised Robotic System for Autonomous Contact-Based Spatial Mapping of Semiconductor Properties [40.4] 我々は、ロボットにドメインエキスパート測定の原則に従うように教えるコンタクトベースのロボットシステムに、自己監督型の自律性を構築する。
半導体光伝導性を特徴付けるために,4自由度ロボットプローブを24時間自律駆動することで,このアプローチの性能を実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:13:04 GMT)
Dynamic Optimization of Storage Systems Using Reinforcement Learning Techniques [40.1] 本稿では,ストレージシステム構成を動的に最適化する強化学習ベースのフレームワークであるRL-Storageを紹介する。
RL-Storageは、リアルタイムI/Oパターンから学習し、キャッシュサイズ、キュー深さ、readahead設定などの最適なストレージパラメータを予測する。
スループットは最大2.6倍、レイテンシはベースラインに比べて43%向上する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:41:40 GMT)
A Unified Analysis of Federated Learning with Arbitrary Client Participation [39.2] Federated Learning(FL)は、断続的なクライアント可用性と計算/通信効率の課題に直面します。
部分的なクライアントの参加が収束にどのように影響するかを理解することが重要です。
我々は、任意のクライアント参加を伴うFLの統一収束解析を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:00:26 GMT)
Conformable Convolution for Topologically Aware Learning of Complex Anatomical Structures [38.2] トポロジ的一貫性を明示するために設計された新しい畳み込み層であるConformable Convolutionを紹介する。
Topological Posterior Generator (TPG)モジュールは、重要なトポロジ的特徴を特定し、畳み込み層をガイドする。
本稿では,構造物の相互接続性維持が重要となるセグメンテーション作業におけるフレームワークの有効性を示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:41:33 GMT)
Beyond KAN: Introducing KarSein for Adaptive High-Order Feature Interaction Modeling in CTR Prediction [37.8] Kolmogorov-Arnold Represented Sparse Interaction Network (KarSein)を紹介する。
KarSeinは予測精度と計算効率の両方を最適化するように設計されている。
計算オーバーヘッドを最小限に抑えて、かなりの予測精度を達成する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 01:51:59 GMT)
Beyond Gradient Averaging in Parallel Optimization: Improved Robustness through Gradient Agreement Filtering [36.9] 従来の分散データ-並列勾配勾配は、モデルパラメータの更新に使用されるマクロバッチを計算するために、マイクロバッチの勾配を平均化する。
本研究では,マイクログラディエント間のコサイン距離を計算し,グラディエンス分散を簡易かつ効果的に低減する手法を提案する。
従来のトレーニング手法と比較して,検証精度が最大18.2%向上するケースもある。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:44:55 GMT)
Is Your Image a Good Storyteller? [35.4] 画像間の意味複雑性には違いがある。
よりリッチなセマンティクスを持つ画像は、鮮明で魅力的なストーリーを伝え、幅広いアプリケーションシナリオを提供することができる。
この問題に対処するために,画像意味評価(ISA)タスクを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:04:39 GMT)
Asynchronous Federated Clustering with Unknown Number of Clusters [35.4] フェデレートクラスタリング(FC)は、ラベルのない非独立なIdentically Distributed(非IID)データから知識をマイニングするために重要である。
本稿では,非同期クラスタ学習(AFCL)手法を提案する。
過剰な数のシードポイントを学習媒体としてクライアントに分散し、それらをクライアント全体にコーディネートしてコンセンサスを形成する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:56:32 GMT)
Accelerated regularized learning in finite N-person games [34.4] 我々は、加速的リーダー(FTXL)と呼ばれる、加速的学習手法のファミリーを紹介する。
FTXLは局所的に超線形速度で厳密なナッシュ平衡に収束し、バニラ正規化学習法を指数的に高速化する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:09:26 GMT)
Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models [33.5] インストラクションチューニングは、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
自然言語処理(NLP)とディープラーニングの分野において,データアセスメントと選択手法が提案されている。
本稿では,データアセスメントと選択に関する既存の文献を総合的にレビューし,特にLLMの命令チューニングについて述べる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:41:32 GMT)
EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers [33.2] EraseAnythingは、最新のフローベースのT2Iフレームワークにおける概念消去に対処するために特別に開発された最初の方法である。
概念消去を二段階最適化問題として定式化し,LoRAに基づくパラメータチューニングとアテンションマップ正規化器を用いた。
本研究では,意図しない概念の除去が意図せず,無関係な概念のパフォーマンスを損なうことのない自己矛盾型学習戦略を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:42:53 GMT)
Beyond Efficiency: A Systematic Survey of Resource-Efficient Large Language Models [32.8] LLM(Large Language Models)は、計算、メモリ、エネルギー、金融資源の高消費に課題をもたらす。
本調査は, LLMの資源効率向上を目的とした多種多様な手法を概観することにより, これらの課題を体系的に解決することを目的としている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:38:32 GMT)
Bringing Objects to Life: 4D generation from 3D objects [31.5] ユーザが提供する3Dオブジェクトをテキストプロンプトに条件付けしてアニメーション化して4D生成を誘導する手法を提案する。
本手法はLPIPSスコアを用いた個人認証の3倍の精度向上を実現する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 10:12:01 GMT)
Toward Scene Graph and Layout Guided Complex 3D Scene Generation [31.4] Scene GraphとLayout Guided 3D Scene Generation(GraLa3D)の新たなフレームワークを提案する。
複雑な3Dシーンを記述するテキストプロンプトが与えられたとき、GraLa3Dはレイアウト境界ボックス情報を持つシーングラフ表現を使用してシーンをモデル化する。
GraLa3Dは、単一オブジェクトノードと複合スーパーノードでシーングラフを独自に構築する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:21:03 GMT)
Towards Explaining Uncertainty Estimates in Point Cloud Registration [30.5] 反復閉点 (ICP) は、2つの点間の変換を推定するアルゴリズムである。
本稿では,確率的ICP法が特定の出力を生成する理由を説明する手法を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:03:44 GMT)
EmoReg: Directional Latent Vector Modeling for Emotional Intensity Regularization in Diffusion-based Voice Conversion [30.3] Emotional Voice Conversion (EVC) は、音源の感情から特定の発話のターゲットへの離散的な感情状態を変換することを目的としている。
本研究では,対象感情の正確な音声を生成するために,拡散型ECVフレームワークにおける感情強度の正規化を提案する。
提案手法の有効性は、英語とヒンディー語に対する主観的および客観的評価の観点から、最先端(SOTA)ベースラインにまたがって示されている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:30:06 GMT)
Polarimetric BSSRDF Acquisition of Dynamic Faces [29.9] 動的人間の顔に対する新しい偏光量取得法を提案する。
肌のトーンや表情の広い範囲にわたって、空間的に異なる外観と正確な幾何学を捉えている。
我々の研究は、生体物理学に基づく皮膚パラメータと幾何学とともに、偏光と分光の反射情報を同時に取得した初めてのものである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:57:25 GMT)
Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks [29.5] ベイズニューラルネットワーク(BNN)の計算負担を軽減するための革新的な枠組みを導入する。
提案手法は,ディープアンサンブルに基づくベイズ的手法の原理に従っているが,事前学習されたニューラルネットワークから生じるパラメータの低ランク摂動により,コストを大幅に削減する。
バニラ版のアンサンブルと、Stein Variational Gradient Descent (SVGD)を用いたベイズ学習のようなより洗練されたスキームは、提案フレームワーク内でシームレスに実装できる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:42:58 GMT)
On the Probability of Necessity and Sufficiency of Explaining Graph Neural Networks: A Lower Bound Optimization Approach [29.2] GNN(NSEG)のための必要・必要記述のためのフレームワークを提案する。
具体的には,GNNを構造因果モデル(SCM)として記述し,その確率を推定する。
実験の結果、NSEGは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:47:53 GMT)
BiM-VFI: directional Motion Field-Guided Frame Interpolation for Video with Non-uniform Motions [28.5] 既存のビデオフレーム(VFI)モデルは、一様でない動きのビデオで訓練する際、時間と位置のあいまいさに悩まされる傾向がある。
非一様運動を効果的に記述するための双方向運動場(Bidirectional Motion Field, BiM)を提案する。
BiM-VFIモデルは、最近の最先端のVFI手法を26%、LPIPSとSTLPIPSの45%で大幅に上回っている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:11:31 GMT)
Understanding the Impact of Confidence in Retrieval Augmented Generation: A Case Study in the Medical Domain [27.5] 本研究では,RAGが医療領域内の信頼度に与える影響について,様々な構成とモデルを用いて検討した。
その結果,入力プロンプトのモデル,設定,フォーマットによって,信頼度や精度に大きな変化があることが判明した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 00:58:33 GMT)
How the (Tensor-) Brain uses Embeddings and Embodiment to Encode Senses and Symbols [26.5] Brain (TB) は知覚と記憶の計算モデルとして導入された。
本稿では,TBモデルの概要を述べるとともに,その機能に関する最近の展開と洞察を紹介する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:20:18 GMT)
Impact of Data Distribution on Fairness Guarantees in Equitable Deep Learning [24.9] 等価深層学習におけるデータ分布と公平性保証の関係を理論的に解析する枠組みを提案する。
フェアネス誤差と収束率の包括的理論的境界を導出し、グループ間の分布差がフェアネスと精度の基本的なトレードオフにどのように影響するかを特徴付ける。
この研究は、AIベースの診断システムにおける公正性の理解を深め、より公平なアルゴリズムを開発するための理論的基盤を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:43:43 GMT)
Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems [24.4] トラッキングコントローラにより、ロボットシステムは計画された基準軌道を正確に追従することができる。
本研究では,フローティングベースを持つロボットシステムの固有リー群対称性を活用して,トラッキングコントローラの学習における課題を軽減する。
その結果,対称性を意識したアプローチはトレーニングを加速し,同一のトレーニングステップの後に追跡誤差を減少させることがわかった。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:04:29 GMT)
Hybrid LLM-DDQN based Joint Optimization of V2I Communication and Autonomous Driving [23.7] 大規模言語モデル(LLM)は、その卓越した推論と理解能力により、最近かなりの関心を集めている。
本研究は、車両間通信(V2I)と自律運転(AD)ポリシーを共同で最適化することを目的として、車載ネットワークにLLMを適用することを検討する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:08:04 GMT)
Learning from Heterogeneity: A Dynamic Learning Framework for Hypergraphs [22.6] 本稿では,動的ハイパーエッジ構築と注意深い埋め込み更新が可能なLFHというハイパーグラフ学習フレームワークを提案する。
提案手法の有効性を評価するため,いくつかの一般的なデータセットを対象とした総合的な実験を行った。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:14:40 GMT)
RGBT Tracking via All-layer Multimodal Interactions with Progressive Fusion Mamba [22.4] 本稿では,ロバストなRGBTトラッキングを実現するために,AINetという新しいマルチモーダル・インタラクション・ネットワークを提案する。
我々は,AINetが既存の最先端手法に対して先進的な性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:59:42 GMT)
Fairness without Demographics through Learning Graph of Gradients [22.3] 勾配と群間の相関がグループフェアネスの同定と改善に役立つことを示す。
提案手法はノイズに対して頑健であり,全体の精度を過度に低下させることなく,公平性を著しく向上させることができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:33:27 GMT)
SAFE-MEME: Structured Reasoning Framework for Robust Hate Speech Detection in Memes [21.9] 我々は,Q&Aスタイルの推論と階層的分類を取り入れた新しいフレームワークSAFE-MEMEを導入し,ミームにおける堅牢なヘイトスピーチ検出を実現する。
本研究では,SAFE-MEME-Hにおける単一層アダプタの微調整が,通常の微調整されたモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:16:28 GMT)
Spin-Weighted Spherical Harmonics for Polarized Light Transport [21.5] スピン重み付き球高調波理論に基づく分極球高調波(PSH)と呼ばれる新しい手法を開発した。
PSHに基づく分極レンダリング方程式と球面畳み込みの周波数領域定式化を導入する。
その結果, 複雑な反射現象における偏光相互作用を効果的に, 正確に再現できることが示唆された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:03:29 GMT)
Unlocking adaptive digital pathology through dynamic feature learning [21.2] そこで我々はPathFiTという動的特徴学習手法を紹介した。
PathFiTは、下流の特異性に関係なく、様々な病理アプリケーションに対してシームレスに実装する。
我々は、35タスク中34タスクで最先端のパフォーマンスを示し、23タスクで大幅に改善され、特殊撮像タスクで10.20%向上した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 10:47:01 GMT)
Modality-missing RGBT Tracking: Invertible Prompt Learning and High-quality Benchmarks [21.1] モーダル情報は、熱センサーの自己校正やデータ伝送誤差などの要因によって見逃される可能性がある。
本稿では、コンテンツ保存プロンプトをよく訓練された追跡モデルに統合する、新しい非可逆的プロンプト学習手法を提案する。
提案手法は,最先端手法と比較して,大幅な性能向上を実現している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:01:40 GMT)
FairDiffusion: Enhancing Equity in Latent Diffusion Models via Fair Bayesian Perturbation [21.0] 本研究は,医療用テキスト・画像拡散モデルの公平性に関する総合的研究である。
FairDiffusion(フェアディフュージョン)は、画像生成品質と臨床特徴のセマンティックな相関の両面において公平性を高める、自己認識型潜伏拡散モデルである。
また、医療生成モデルの公正性を研究するための最初のデータセットであるFairGenMedを設計し、キュレートする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:33:37 GMT)
AFLNet Five Years Later: On Coverage-Guided Protocol Fuzzing [20.7] 本稿では,過去5年間のAFLNetの技術的貢献を概観する。
AFLNetは、コードとステートをカバーした最初のプロトコルファザである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:39:27 GMT)
A Predefined-Time Convergent and Noise-Tolerant Zeroing Neural Network Model for Time Variant Quadratic Programming With Application to Robot Motion Planning [20.6] 本稿では,PTC-NT-FOZNN(PTC-NT-FOZNN)モデルについて述べる。
PTC-NT-FOZNNは、FOZNNとして知られる可変利得ZNNスペクトルの新たなイテレーションから派生したもので、時間とともに利得が減少し、事前定義された時間収束を伴う耐雑音性を結婚する。
PTC-NT-FOZNNは6つの確立されたZNNに対して評価すると,0αleq 1$のパラメータを持つため,付加雑音に対する位置精度とレジリエンスが向上した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:30:11 GMT)
A First Look at Package-to-Group Mechanism: An Empirical Study of the Linux Distributions [20.5] パッケージ・ツー・グループ・メカニズム(P2G)は、インストール、アンインストール、複数パッケージの同時更新を可能にするために使用される。
本稿では,Linuxディストリビューションを事例として,その応用動向,進化パターン,グループ品質,開発者の傾向に着目した実証的研究を行う。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:47:48 GMT)
Training Verification-Friendly Neural Networks via Neuron Behavior Consistency [20.5] 本研究は,検証に親しみやすいニューラルネットワークをトレーニングするための新しい手法を提案する。
本手法は,ニューロンの行動一貫性をトレーニングプロセスに統合する。
提案手法は既存の手法と組み合わせることで,ネットワークの妥当性をさらに向上できることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:48:34 GMT)
Treatment Effect Estimation for Graph-Structured Targets [20.0] Graph-target Treatment Effect Estimation (GraphTEE)は、グラフ構造化対象に対する治療効果を推定するフレームワークである。
バイアス緩和の観点から,GraphTEEの優れた性能に関する理論的解析を行った。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:21:17 GMT)
Dive into Time-Series Anomaly Detection: A Decade Review [19.9] 時系列異常検出は重要な活動であり、サイバーセキュリティ、金融市場、法執行機関、医療など様々な分野で応用されている。
この調査は、時系列の文脈においてプロセス中心の分類の下で既存のソリューションを異常に検出し、要約する。
異常検出手法の独自の分類に加えて,文献のメタアナリシスを行い,時系列異常検出研究における一般的な傾向を概説する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:11:46 GMT)
ICLR: In-Context Learning of Representations [19.3] 文脈の規模が拡大するにつれて、事前訓練された意味表現から、グラフ構造に整合した文脈内表現への突然の再構成が存在することを示す。
以上の結果から,拡張コンテキストサイズはモデル表現を柔軟に再構成し,新たな能力を解き放つ可能性が示唆された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:58:09 GMT)
Sub-optimal Learning in Meta-Classifier Attacks: A Study of Membership Inference on Differentially Private Location Aggregates [19.1] 情報攻撃者であっても,DPが期待する攻撃精度と経験的攻撃精度との間には,有意なギャップがあることが示唆された。
提案手法は,1閾値攻撃と2閾値攻撃の2つである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:51:34 GMT)
Cut the Deadwood Out: Post-Training Model Purification with Selective Module Substitution [18.4] HuggingFaceのようなオープンソースのプラットフォームからの公開データセットが人気を集めており、データ中毒攻撃の重大なリスクを生じさせている。
本稿では,Greedy Module Substitution (GMS)を提案する。
本手法は,クリーンなデータセットやクリーンな補助モデルに対する事前モデル浄化手法の共通依存性を緩和する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:29:34 GMT)
Counterfactual Samples Constructing and Training for Commonsense Statements Estimation [18.0] 可塑性推定は、言語モデルが現実世界を客観的に理解できるようにする上で重要な役割を果たす。
理想的なPEモデルの2つの重要な特徴を欠いている。
本稿では,Commonsense Counterfactual Samples Generatingと呼ばれる新しいモデル非依存手法を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:18:52 GMT)
Tell What You Hear From What You See -- Video to Audio Generation Through Text [18.0] VATTは、ビデオとオプションのテキストプロンプトを入力として取り、オーディオとオプションのテキスト記述を生成するマルチモーダル生成フレームワークである。
VATTは、音声キャプションを通じてビデオのテキストプロンプトを推奨するだけでなく、テキストによる制御可能なビデオ音声生成を可能にする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:26:52 GMT)
Artificial Intelligence for Quantum Error Correction: A Comprehensive Review [17.6] このサーベイは、量子エラー補正スキームを強化するために人工知能(AI)ツールの使用の進歩をレビューする。
我々は機械学習(ML)戦略に重点を置いており、教師なし、教師なし、半教師付きから強化学習方法まで幅広い。
この結果から, これらの手法は従来手法に比べてQECパイプラインの効率と精度が優れていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:58:21 GMT)
Safe Multiagent Coordination via Entropic Exploration [17.5] 制約付きマルチエージェント強化学習(E2C)のためのエントロピー探索を提案する。
E2Cは、調査のインセンティブを高め、安全で効果的な協調行動の学習を促進するために、観察を$%利用している。
ますます複雑な領域にわたる実験により、E2Cエージェントはタスクパフォーマンスにおいて、制約のない、制約のない一般的なベースラインを超えることが示されている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:50:19 GMT)
Boosting Column Generation with Graph Neural Networks for Joint Rider Trip Planning and Crew Shift Scheduling [17.5] 本稿では,JRTPCSSP(Joint Rider Trip Planning and Crew Shift Scheduling Problem)とAttention and Gated GNN-Informed Column Generation(AGGNNI-CG)と呼ばれる新しい解法を提案する。
AGGNNI-CGは、列生成と機械学習をハイブリダイズして、アプリケーションの現実的な制約を伴って、JRTPCSSPのほぼ最適解を得る。
AGGNNI-CGは、ジョージア州チャタム郡のパラトランジットシステムから、挑戦的な実世界のデータセットに適用されている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:09:54 GMT)
Stability and convergence analysis of AdaGrad for non-convex optimization via novel stopping time-based techniques [17.3] 適応勾配(AdaGrad)は、ディープラーニングの強力なツールとして登場した。
AdaGradを包括的に分析し、文献の既存のギャップを埋める。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:53:55 GMT)
Contrastive Conditional Alignment based on Label Shift Calibration for Imbalanced Domain Adaptation [16.9] 教師なしドメイン適応(UDA)のためのラベルシフトキャリブレーション(CCA-LSC)に基づくコントラスト条件アライメントを提案する。
本手法は,ラベルシフトと共変量シフトを併用したベンチマークにおいて,既存のUDA法およびIDA法より優れる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:34:31 GMT)
Diminishing Return of Value Expansion Methods [16.5] 本稿では, モデルに基づく値展開法において, 改良された力学モデルから試料効率が向上する可能性について検討する。
より長いロールアウト地平線はサンプル効率を高めるが、追加の展開ステップによって改善は急速に減少する。
モデル精度の向上は、同一の水平線を持つ学習モデルと比較して、サンプル効率をわずかに向上させる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:51:11 GMT)
Neural Algorithmic Reasoning with Multiple Correct Solutions [16.0] 一部のアプリケーションでは、複数の正しい解を回収することが望ましい。
BF(Bellman-Ford)とDFS(Depth-First Search)の2つの古典的アルゴリズムで本手法を実証する。
この方法は、モデル出力からソリューションをサンプリングし、検証するだけでなく、適切なトレーニングデータを生成することを含む。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:25:02 GMT)
Open-Sora: Democratizing Efficient Video Production for All [15.7] 高忠実度ビデオコンテンツを作成するために設計された,オープンソースのビデオ生成モデルであるOpen-Soraを開発した。
Open-Soraは、テキスト・ツー・イメージ生成、テキスト・ツー・ビデオ生成、画像・ビデオ生成など、幅広いビジュアル生成タスクをサポートしている。
オープンソース原則を受け入れることで、Open-Soraはトレーニング/推論/データ準備コードとモデルウェイトへの完全なアクセスを民主化します。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:52:49 GMT)
Tri-Ergon: Fine-grained Video-to-Audio Generation with Multi-modal Conditions and LUFS Control [15.3] Tri-Ergonは拡散に基づくV2Aモデルであり、テキスト、聴覚、ピクセルレベルの視覚的プロンプトを組み込んでいる。
LUFSの埋め込みにより、個々のオーディオチャンネルの時間とともに大きな変化を正確に手動で制御できる。
Tri-Ergonは44.1kHzの高忠実度ステレオオーディオクリップを最大60秒まで作成できる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:46:24 GMT)
Convergence of the Min-Max Langevin Dynamics and Algorithm for Zero-Sum Games [15.1] エントロピー正則化を伴うユークリッド空間 $mathbbRd$ 上の確率分布空間におけるゼロサムゲームについて検討する。
平均場 min-max Langevin ダイナミクスに対する指数収束保証を証明し、平衡分布を計算する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:20:23 GMT)
Motion Transfer-Driven intra-class data augmentation for Finger Vein Recognition [15.0] フィンガー静脈認識 (FVR) は, 血管内生情報の機密性から, 安全な生体計測技術として出現している。
そこで本研究では,指の姿勢と回転運動をモデル化し,指静脈画像データ拡張のための新しい動き伝達モデルを提案する。
3つのパブリックフィンガー静脈データベースで行った実験により,提案した動き伝達モデルが認識精度を効果的に向上できることが示された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:51:57 GMT)
Open-Source Heterogeneous SoCs for AI: The PULP Platform Experience [14.2] TheParallel Ultra-Low Power Platformプロジェクトは、研究用IPの設計とオープンソースとしてリリースにおいて、最も活発で成功したイニシアチブの1つです。
本稿では、異種AIアクセラレーションSOCを設計するPULP体験に焦点を当てる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:04:54 GMT)
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models [14.1] ブラックボックスFRモデルに対する堅牢で消去可能なプライバシ保護スキームであるErasableMaskを提案する。
具体的には、EasableMaskは、ブラックボックス転送性を高める新しいメタ補助攻撃を導入している。
また、画像品質を劣化させることなく、保護された顔における意味的摂動の消去をサポートする摂動消去機構を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:06:48 GMT)
Distilling Desired Comments for Enhanced Code Review with Large Language Models [14.1] 本稿では,コードレビューデータセットからDRCを識別することで,蒸留データセットを自動構築するデータセット蒸留手法Desiviewを提案する。
150K以上のレビューエントリからなるCodeReviewerデータセットの実験では、Desiviewは88.93%、80.37%、86.67%、84.44%の精度、リコール、正確性、F1という印象的なパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:49:13 GMT)
Breaking Fine-Grained Classification Barriers with Cost-Free Data in Few-Shot Class-Incremental Learning [13.8] 細粒度分類における障壁を破る新しい学習パラダイムを提案する。
これにより、標準的なトレーニングフェーズを超えてモデルを学習し、システム運用中に発生するコストフリーなデータの恩恵を受けることができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:11:44 GMT)
On Adversarial Robustness of Language Models in Transfer Learning [13.4] 転送学習は、標準的なパフォーマンス指標を改善する一方で、敵攻撃に対する脆弱性の増加につながることがよく示される。
以上の結果から, モデルサイズ, アーキテクチャ, 適応手法の複雑な相互作用が示唆された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:55:35 GMT)
Natural Language Fine-Tuning [13.1] 自然言語をファインチューニングに利用する自然言語ファインチューニング(NLFT)を初めて紹介する。
言語情報をNLFTで効果的に活用するため,提案手法はトレーニングコストを大幅に削減する。
トレーニング効率を著しく向上し、精度、省時間、資源保全において強化微調整アルゴリズムを総合的に上回っている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:02:45 GMT)
Differential Evolution Integrated Hybrid Deep Learning Model for Object Detection in Pre-made Dishes [12.6] 本稿では,食器の物体を検出するための差分進化統合型ハイブリッドディープラーニング(DEIHDL)モデルを提案する。
実際のデータセットに対する大規模な実験により、提案したDEIHDLモデルは、プリメイド料理の物体を検出する上で、ベースモデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:28:07 GMT)
Exploiting Hybrid Policy in Reinforcement Learning for Interpretable Temporal Logic Manipulation [12.2] 強化学習(Reinforcement Learning, RL)に基づく手法は, ロボット学習においてますます研究されている。
本稿では,エージェントの性能向上のために3段階決定層を利用する時間論理誘導型ハイブリッドポリシーフレームワーク(HyTL)を提案する。
我々は,HyTLを4つの困難な操作タスクで評価し,その有効性と解釈可能性を示した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:34:53 GMT)
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection [12.0] 大型視覚言語モデル(LVLM)は、しばしば物体幻覚(OH)に悩まされる。
本稿では,安全でない部分空間に基づいてモデルの重みを効率よく編集する手法を提案する。
実験により,提案手法は,余分な推論コストを伴わずに複数のLVLMファミリー間でOHを効果的に緩和し,一般LVLMベンチマークで高い性能を示すことを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:32:10 GMT)
Real-time Fake News from Adversarial Feedback [11.7] フェイクニュース検出のための既存の評価は、LCMベースの検出器の時間経過とともに高い精度をもたらす。
我々は、RAGベースの検出器からの自然言語フィードバックを利用して、リアルタイムニュースを偽ニュースに反復的に修正する新しいパイプラインを開発した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:22:27 GMT)
Deep Learning in Image Classification: Evaluating VGG19's Performance on Complex Visual Data [11.6] VGG19ディープ畳み込みニューラルネットワークは、SVM、XGBoost、ResNet50といった古典的なモデルと比較される。
VGG19は精度(92%)、AUC(0.95)、F1スコア(0.90)、リコールレート(0.87)などの複数の指標でよく機能し、他の比較モデルよりも優れている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:07:58 GMT)
Confidence Interval Construction and Conditional Variance Estimation with Dense ReLU Networks [11.2] 本稿では,Rectified Linear Unit (ReLU) アクティベーション機能を持つ高密度ネットワークを用いた非パラメトリック回帰における条件分散推定と信頼区間構成の問題に対処する。
本稿では, 条件付き分散推定のための残差に基づくフレームワークを提案し, ヘテロセダスティックおよびホモセダスティックな設定下での分散推定のための漸近的境界を導出する。
本研究では,ReLUネットワークをベースとしたロバストブートストラップ手法を開発し,その適用範囲を理論的に保証し,不確実性定量化と深層学習環境における信頼性信頼区間の構築に大きく貢献する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:17:58 GMT)
Pirates of the RAG: Adaptively Attacking LLMs to Leak Knowledge Bases [11.1] 本稿では,RAGシステムにプライベート知識ベースを漏洩させるブラックボックス攻撃を提案する。
関連性に基づくメカニズムとアタッカーサイドのオープンソース LLM は、(隠された)知識ベースの大部分をリークする効果的なクエリの生成を好んでいる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:25:04 GMT)
MaskGaussian: Adaptive 3D Gaussian Representation from Probabilistic Masks [10.9] 3D Gaussian Splattingは、新しいビュー合成とリアルタイムレンダリングにおいて顕著な性能を示した。
しかし、数百万ガウスの使用によるメモリ消費の増大は、その実用性を制限している。
ガウスを恒久的に除去するのではなく確率的実体としてモデル化するMaskGaussianを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:12:16 GMT)
Zero-Shot Image Restoration Using Few-Step Guidance of Consistency Models (and Beyond) [10.0] そこで本研究では,CMを用いたゼロショット復元方式を提案する。
画像の超解像, 劣化, 塗装に対するアプローチの利点を実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:00:42 GMT)
FreqMixFormerV2: Lightweight Frequency-aware Mixed Transformer for Human Skeleton Action Recognition [10.0] FreqMixForemrV2は、微妙で差別的なアクションを特定するために、周波数対応のMixed Transformer(FreqMixFormer)上に構築されている。
提案手法は, 精度と効率のバランスが良く, パラメータの60%しか持たない最先端の手法より優れている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:52:40 GMT)
Protégé: Learn and Generate Basic Makeup Styles with Generative Adversarial Networks (GANs) [9.6] 我々は、新しいメイクアプリケーションProt'eg'eを提案し、最新の生成モデル -- GANを使ってメイクスタイルを学習し、自動生成する。
多様な化粧品の学習と創造におけるプロテグの能力を示す大規模な実験が実施されている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:02:33 GMT)
AdaRankGrad: Adaptive Gradient-Rank and Moments for Memory-Efficient LLMs Training and Fine-Tuning [9.5] 大規模言語モデル(LLM)の訓練と微調整には、メモリと計算要求に関する課題が伴う。
低ランク適応(LoRA)など、これらの課題に対処する様々な技術が開発されている。
トレーニングが進むにつれて、推定勾配のランクが徐々に低下する現象に着想を得た新しい手法を導入する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:34:41 GMT)
PTQ4VM: Post-Training Quantization for Visual Mamba [9.4] 本稿では,PTS(Per-Token Static Quantization)とJLSS(Joint Learning of Smoothing Scale and Step Size)の2つの主要な戦略を紹介する。
PTQ4VM は様々な Visual Mamba のバックボーンに適用でき、事前訓練されたモデルを15分以内で量子化されたフォーマットに変換する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:21:33 GMT)
Segmented Private Data Aggregation in the Multi-message Shuffle Model [9.3] 我々は、差分プライバシーのマルチメッセージシャッフルモデルにおいて、セグメント化されたプライベートデータアグリゲーションの研究を開拓した。
当社のフレームワークでは,ユーザに対するフレキシブルなプライバシ保護と,アグリゲーションサーバのための拡張ユーティリティを導入している。
提案手法は,既存手法と比較して推定誤差を約50%削減する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:22:04 GMT)
CASUAL: Conditional Support Alignment for Domain Adaptation with Label Shift [9.3] 教師なしドメイン適応(Unsupervised domain adapt, UDA)とは、ソースドメインのラベル付きサンプルとターゲットドメインのラベルなしサンプルに基づいて学習モデルをトレーニングするドメイン適応フレームワークである。
そこで本稿では,条件付き適応型Support alignment (CASUAL) を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:24:30 GMT)
AKiRa: Augmentation Kit on Rays for optical video generation [9.3] AKiRaは、カメラアダプタを既存のビデオ生成バックボーンの上に複雑なカメラモデルで構築し、訓練する、新しい拡張フレームワークである。
カメラの動きの微調整と複雑な光学パラメータにより、ズーム、魚眼効果、ボケなどの映画効果を達成できる。
この研究は、制御され、光学的に強化されたビデオ生成において新しいランドマークを設定し、将来の光ビデオ生成方法への道を開く。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:22:30 GMT)
Deep Neural Networks and Brain Alignment: Brain Encoding and Decoding (Survey) [9.1] 人工知能は人間の脳の秘密を解き放つことができるのか?
脳記録のパワーをタップすることでAIを強化することは可能か?
本調査は,ヒト脳記録研究と最先端認知神経科学データセットに焦点を当てた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:54:51 GMT)
Tuning Vision-Language Models with Candidate Labels by Prompt Alignment [8.9] 視覚言語モデル(VLM)は、画像テキストペアの大規模なトレーニングデータセットから高品質な表現を学習することができる。
プロンプト学習は、下流タスクに適応するためにVLMを微調整する一般的なアプローチである。
本稿では,学習過程を候補ラベルでガイドする枠組みを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:17:33 GMT)
Zeroth-Order Methods for Nonconvex Stochastic Problems with Decision-Dependent Distributions [8.9] 決定変数に依存する不確実性のある最適化問題を考える。
この問題では、決定依存分布が未知であるため、目的関数の勾配は明示的には得られない。
いくつかのゼロ階法が提案され、繰り返しをサンプリングして更新することでノイズの多い目標値が得られる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:05:34 GMT)
An Efficient Matrix Multiplication Algorithm for Accelerating Inference in Binary and Ternary Neural Networks [8.8] 大規模言語モデル(LLM)は、高度な計算インフラに依存しながら推論の非効率さに悩まされる。
3次重み付き1.58ビットLLMの推論時間とメモリ効率を改善するアルゴリズムを提案する。
その結果,時間とメモリの両面でのアプローチの優位性が確認され,推論時間は最大29倍,メモリ使用量は最大6倍に短縮された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:43:04 GMT)
Safe Bayesian Optimization for the Control of High-Dimensional Embodied Systems [8.7] 現在の安全な探索アルゴリズムは非効率であり、大きな高次元の入力空間では不可能になる可能性がある。
既存の高次元制約最適化手法は探索過程の安全性を無視する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:42:50 GMT)
Scalable Bayesian Optimization via Focalized Sparse Gaussian Processes [8.4] 我々は,より効率的な表現力を検索空間の関連領域に割り当てることのできる,疎いGPを用いたベイズ最適化アルゴリズムについて論じる。
本研究では,FocalBOが大量のオフラインおよびオンラインデータを効率よく活用し,ロボット形態学設計における最先端性能と585次元筋骨格系を制御できることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:36:15 GMT)
CompetitorFormer: Competitor Transformer for 3D Instance Segmentation [8.2] トランスフォーマーベースの手法が3Dインスタンスセグメンテーションの主要なアプローチとなっている。
現在のモデルは、シーン内に存在するインスタンスよりも、固定的で高いクエリを使用する。
このようなインスタンスでは、複数のクエリが同じインスタンスを予測しますが、最終的には1つのクエリのみが最適化されます。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:48:13 GMT)
MR-Occ: Efficient Camera-LiDAR 3D Semantic Occupancy Prediction Using Hierarchical Multi-Resolution Voxel Representation [8.1] MR-Occは,カメラ-LiDAR融合による3Dセマンティック占有率予測の新しい手法である。
HVFRは重要なボクセルの機能を強化し、計算コストを削減することで性能を向上させる。
MODは、センサービューから隠された領域をよりよく扱い、精度を向上させるために、Occluded'クラスを導入している。
PVF-Netは、デフォルマブルアテンション機構を通じてカメラとLiDARデータを効果的に融合するために、密度の高いLiDAR機能を利用する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:39:21 GMT)
Enhancing Code LLMs with Reinforcement Learning in Code Generation [7.8] コード生成と最適化のための重要なテクニックとして強化学習(RL)が登場した。
本稿では,コード最適化と生成におけるRLの適用について,系統的な調査を行った。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:15:41 GMT)
Cost-Aware Dynamic Cloud Workflow Scheduling using Self-Attention and Evolutionary Reinforcement Learning [7.7] 本稿では,クラウドワークフロースケジューリングのための自己注意ポリシーネットワークを提案する。
トレーニングされたSPN-CWSは、すべての候補インスタンスを効果的に処理し、ワークフロータスクを実行するのに最も適したVMインスタンスを特定する。
提案手法は,複数のベンチマークCDMWS問題において,最先端のアルゴリズムよりも顕著に優れている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:29:57 GMT)
A Deep Subgrouping Framework for Precision Drug Repurposing via Emulating Clinical Trials on Real-world Patient Data [7.6] 本稿では,サブグループ分析と治療効果推定を統合した新しい薬物再資源化フレームワークであるSTEDRを紹介する。
提案手法は, 実世界の患者データを用いて, 複数の臨床試験をエミュレートして, 再購入候補を同定する。
アルツハイマー病 (AD) は, 承認された薬剤がほとんどなく, 治療反応の異種性も知られている疾患である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:32:52 GMT)
Predicting Preschoolers' Externalizing Problems with Mother-Child Interaction Dynamics and Deep Learning [7.3] これまでの研究では、母親が子どもの抑うつに反応して支援を行うのが、子どもの外部化問題のレベルが低かったことが示されている。
本研究は,母子間相互作用のダイナミクスを用いて,子どもの外部化問題の予測精度を評価・改善することを目的とする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:22:48 GMT)
Distributionally Robust Optimization via Iterative Algorithms in Continuous Probability Spaces [7.0] 最短ケースの分布が連続している場合、分布的ロバストな最適化(DRO)によって動機付けられたミニマックス問題を考える。
最近の研究では、ニューラルネットワークに基づく生成ネットワークを用いた最悪のケース分布の学習について検討されている。
本稿では,そのようなミニマックス問題を解くための反復アルゴリズムを提案することによって,この理論的課題を橋渡しする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:31:23 GMT)
A Theory of Formalisms for Representing Knowledge [6.6] フォーマリズムがAIの知識を表現するのに最適なのかという長年にわたる論争があった。
我々は,私たちが関心を持っている様々な知識表現形式を捉えるための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:14:29 GMT)
New Perspectives on Regularization and Computation in Optimal Transport-Based Distributionally Robust Optimization [6.5] 本研究では, 有限の輸送コストで所定の基準分布による不確実な問題パラメータの分布を選択することができるような, 最適輸送に基づく分布安定度最適化問題について検討する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:24:17 GMT)
TetraLoss: Improving the Robustness of Face Recognition against Morphing Attacks [6.5] 顔認識システムは、高セキュリティアプリケーションに広くデプロイされている。
フェースモーフィングのようなデジタル操作は、顔認識システムにセキュリティ上の脅威をもたらす。
本稿では,ディープラーニングに基づく顔認識システムを,顔形態攻撃に対してより堅牢なものにするための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:17:57 GMT)
Planning, Living and Judging: A Multi-agent LLM-based Framework for Cyclical Urban Planning [5.9] 都市再生は、都市化の文脈において重要な課題である。
本稿では,循環型都市計画(CUP)を提案する。これは,閉ループ内の都市計画を連続的に生成し,評価し,洗練する新しいパラダイムである。
実世界のデータセットの実験は、継続的かつ適応的な計画プロセスとして、我々のフレームワークの有効性を実証している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:43:25 GMT)
Do Current Video LLMs Have Strong OCR Abilities? A Preliminary Study [5.7] 本稿では,ビデオにおけるマルチモーダルモデルのOCR性能を評価するための新しいベンチマークを提案する。
我々は,画像LLMのOCR能力と手作業による改善,効率のバランス,コスト,データ品質を統合する半自動手法を用いて,このベンチマークを開発した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:20:01 GMT)
Learning Operators with Stochastic Gradient Descent in General Hilbert Spaces [5.7] 本研究では、一般ヒルベルト空間間の作用素の学習に勾配降下(SGD)を活用することを検討する。
我々は、SGDアルゴリズムの収束率の上限を確立し、最小限の低境界解析を行う。
ベクトル値および実値のカーネルヒルベルト空間に基づく演算子学習問題への解析の適用により、新たな収束結果が得られる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:05:26 GMT)
LEARNER: A Transfer Learning Method for Low-Rank Matrix Estimation [5.1] 本稿では,対象個体群と対象個体群間の潜在列と列空間の類似性を利用して,対象個体群の推定を改善する手法を提案する。
LEARNERは,対象個体群と対象個体群間の遅延列と列空間の違いをペナルティ化する,対象個体群データの低ランク近似を行う。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:26:16 GMT)
Quantum gravity corrections to the spontaneous excitation of an accelerated atom interacting with a quantum scalar field [5.1] 一般化不確実性原理(GUP)はハイゼンベルク不確実性原理(HUP)を拡張する
我々は, GUPが慣性運動における励起状態原子の自発放出率を高めることができることを示した。
一様加速および一様円運動の原子の場合、GUPは自発放出率と自発励起率の両方を変えることができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:10:31 GMT)
ssProp: Energy-Efficient Training for Convolutional Neural Networks with Scheduled Sparse Back Propagation [4.8] バックプロパゲーション(BP)は、ディープラーニングモデルをトレーニングする際の計算コストの主要な源泉である。
ディープラーニングアーキテクチャにシームレスに統合できる汎用的でエネルギー効率の良い畳み込みモジュールを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:45:44 GMT)
Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding [4.6] 本研究では,この分野でのマルチモーダル理解の技術的欠点を解決するために,多シナリオ推論アーキテクチャを提案する。
この結果は、マルチモーダルデータにおけるこのアーキテクチャの実現可能性を示している。
動的環境におけるヒューマノイドロボットのクロスモーダルインタラクション戦略の探索のための参照体験を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 10:46:08 GMT)
Introducing Semantic Capability in LinkedIn's Content Search Engine [4.6] これまでは、検索エンジンに発行される検索クエリのほとんどは、短くてシンプルだった。
メンバーは現在、長く複雑な自然言語クエリを発行する習慣を発達させている。
このようなクエリに答えるには、セマンティックな能力を持つために、検索エンジンの進化が必要である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:10:31 GMT)
FedSTaS: Client Stratification and Client Level Sampling for Efficient Federated Learning [4.4] フェデレートラーニング(FL)は、複数の分散クライアントをまたいだグローバルモデルの協調的なトレーニングを、プライバシ保護の方法で行う。
textitFedSTS と textitFedSampling にインスパイアされたクライアントおよびデータレベルのサンプリング手法である textitFedSTaS を提案する。
textitFedSTaSは、一定回数のトレーニングラウンドにおいて、textitFedSTSよりも高い精度のスコアが得られることを示す実験である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:15:59 GMT)
GPT or BERT: why not both? [4.3] GPT-BERTは標準的な因果関係やマスキング言語モデルのように透過的に使用することができる。
モデルをオープンにリリースし、コーパスとコードをトレーニングします。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:00:05 GMT)
Bridging the Gap: A Decade Review of Time-Series Clustering Methods [4.3] 時系列データは、拡張時間スケールで潜伏構造を解析する上で重要な課題を示す。
時系列クラスタリングは、類似した時系列をグループ化する教師なし学習戦略として確立された。
この調査は重要な開発点を強調し、時系列クラスタリングにおける今後の研究を導くための洞察を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:04:35 GMT)
Time-independent Spiking Neuron via Membrane Potential Estimation for Efficient Spiking Neural Networks [4.1] スパイキングニューラルネットワーク(SNN)の計算的非効率性は、主に膜電位の逐次更新によるものである。
スパイキングニューロンの並列計算法である膜電位推定並列スパイキングニューロン(MPE-PSN)を提案する。
提案手法では,特に高次ニューロン密度条件下での計算効率の向上が期待できる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:13:26 GMT)
Gravity induced entanglement of multiple massive particles with large spin [4.1] 大規模スピンを持つ多粒子系における量子エンタングルメントの生成速度について検討した。
セットアップの異なる構成に対する絡み合いの発生率を計算する。
粒子数, スピン数とともに絡み合いの量が増加し, 中心に粒子を配置したプリズムの配置が絡み合いの最高速度を生成すると結論付けた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:14:24 GMT)
Entanglement dynamics in 2d HCFTs on the curved background: the case of q-Möbius Hamiltonian [4.0] 境界状態と熱場状態から始まり、曲線の背景にあるハミルトニアンとともにユークリッド時間に系を進化させ、同じハミルトニアンでそれをリアルタイムで発展させる。
その結果, 初期および後期の絡み合い構造は曲線の背景に依存するが, 絡み合い成長は行わず, 線形であることがわかった。
熱場二重状態の重力双対では、この絡み合いの増大はワームホールの線形成長によるものであるが、境界状態の場合は、世界の終わりが崩壊することによるものである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:48:06 GMT)
Anomalous Heat Transfer in Nonequilibrium Quantum Systems [4.0] 異常熱伝達(英: Anomalous Heat Transfer、AHT)は、熱が低温から高温へと自然に流れる過程である。
我々は、量子情報の観点から、非平衡量子系におけるAHTのメカニズムの完全な分類を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:49:14 GMT)
Can Robots "Taste" Grapes? Estimating SSC with Simple RGB Sensors [4.0] テーブルブドウ栽培では、収穫は果実の品質を正確に評価することに依存する。
Soluble Solid Content (SSC)は、熟度と相関する重要な品質要因であるが、色との直接的な因果関係は欠いている。
本研究では,無制御照明下での簡易RGBセンサの可能性について検討し,SSCと色を推定し,費用対効果の高いロボットによる収穫を可能にした。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:10:35 GMT)
Atom graph, partial Boolean algebra and quantum contextuality [3.9] 有限次元量子系は原子グラフによって一意に決定されることを示す。
また、グラフに基づいたKochen-Specker定理の一般かつパラメトリックな記述も提示する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:41:27 GMT)
Lungmix: A Mixup-Based Strategy for Generalization in Respiratory Sound Classification [3.9] Lungmixは、Mixupにインスパイアされた、新しいデータ拡張テクニックである。
意味に基づいてラベルを補間しながら、大音量とランダムマスクを用いて波形をブレンドして拡張データを生成する。
4クラスの分類スコアを最大3.55%向上させ、ターゲットデータセット上で直接トレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:44:13 GMT)
Regulating radiology AI medical devices that evolve in their lifecycle [3.8] 深層学習モデルは、画像特性のわずかなバリエーションにも非常に影響を受けやすい。
最近まで、米国と欧州連合でそのようなモデル更新を実施することは、再承認の申請を意味していた。
2024年、これらの領域の規制フレームワークにおけるいくつかの開発が実施され、モデル更新を安全にロールアウトするプロセスを合理化することを約束している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:28:26 GMT)
Diff4MMLiTS: Advanced Multimodal Liver Tumor Segmentation via Diffusion-Based Image Synthesis and Alignment [3.7] マルチモーダル学習は、様々な臨床課題におけるパフォーマンスを高めることが実証されている。
Diff4MMLiTSは4段階のマルチモーダル肝腫瘍セグメンテーションパイプラインである。
公開および内部データセットの実験は、他の最先端マルチモーダルセグメンテーション法よりもDiff4MMLiTSの方が優れていることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:55:00 GMT)
Exploring the Magnitude-Shape Plot Framework for Anomaly Detection in Crowded Video Scenes [3.7] 本研究では,機能的データ分析フレームワークにおけるビデオ異常検出について検討し,Magnitude-Shape (MS) Plotの適用性に着目した。
オートエンコーダは、異常のないトレーニングデータから通常の行動パターンを学習し、再構成するために使用される。
MS-Plotは、統計的に原則化された、異常検出のための解釈可能なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:58:50 GMT)
A Survey on Time-Series Distance Measures [3.6] 時系列分析タスクの基本的な構成要素の1つとして,距離測定が認識されている。
この研究は、100以上の最先端距離尺度を7つのカテゴリに分類する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:47:08 GMT)
Industrial-scale Prediction of Cement Clinker Phases using Machine Learning [3.6] セメントの生産量は410億トンを超え、年間2.4トンのCO2を生産している。
セメント製造の伝統的なプロセスモデルは、鉱物学的相の予測能力に制限のある定常状態に限られている。
ここでは, 産業用セメントプラントからの総合的な2年間の運用データセットを利用して, プロセスデータからクリンカー鉱物学を正確に予測する機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 01:03:00 GMT)
Dual-Level Precision Edges Guided Multi-View Stereo with Accurate Planarization [3.6] 低テクスチャ領域のマルチビューステレオ (MVS) 再構築が注目されている。
従来のMVSメソッドは、オブジェクト境界と限られた知覚範囲をまたぐような問題にしばしば遭遇する。
平面モデル構築のロバスト性を高めるため、細部および粗部を含む二段精度エッジ情報を導入する。
提案手法は,ETH3D と Tanks & Temples ベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:54:01 GMT)
Goal-Conditioned Data Augmentation for Offline Reinforcement Learning [3.6] Goal-cOnditioned Data Augmentation (GODA) は、ゴール条件付き拡散法である。
GODAは、元のオフラインデータセットの包括的な分布表現を学習し、選択的に高いリターン目標を持つ新しいデータを生成する。
我々は,D4RLベンチマークと実世界の課題,特に交通信号制御(TSC)タスクについて実験を行い,GODAの有効性を実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:42:30 GMT)
Enhancing Entertainment Translation for Indian Languages using Adaptive Context, Style and LLMs [3.6] 本稿では,現在のセッションの文脈とスタイルを推定するアルゴリズムを導入し,これらの推定値を用いてLLM(Large Language Model)を誘導し,高品質な翻訳を生成するプロンプトを生成する。
本手法はLLMに依存しない言語であり,汎用ツールである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:33:51 GMT)
Recommender systems and reinforcement learning for human-building interaction and context-aware support: A text mining-driven review of scientific literature [3.5] この研究はScienceDirectデータベースから27,595の論文を分析した。
協調フィルタリング、コンテンツベース、知識ベースの手法を含む伝統的なレコメンデーションアルゴリズムが一般的に採用されている。
このレビューは、建物や屋内環境におけるレコメンデーターシステムとRLの適用を拡大する大きな可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:59:50 GMT)
Extensive manipulation of transition rates and substantial population inversion of rotating atoms inside a cavity [3.4] 高品質キャビティ内における電磁真空変動と相互作用する遠心加速原子の遷移速度について検討した。
その結果, キャビティの正常モード周波数と回転角速度を調節することにより, 発光速度と励起速度を広範囲に制御できることが判明した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:23:52 GMT)
Multimodal Variational Autoencoder: a Barycentric View [3.4] バリセンタのレンズによる多モードVAEの代替的および理論的定式化を提供する。
特に、2-ワッセルシュタイン距離で定義されるワッセルシュタイン準中心を探索し、一次元分布の幾何学をよりよく保存する。
3つのマルチモーダルベンチマークに関する実証研究により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:02:50 GMT)
Multi-Objective Large Language Model Unlearning [3.4] グラディエント・アセント(GA)は、対象データ上のモデルの予測確率を減少させるプロアクティブな方法である。
本稿では,多目的大規模言語モデル学習(MOLLM)アルゴリズムを提案する。
実験の結果,MLLM が SOTA GA をベースとした LLM アンラーニング法よりも非ラーニング効果とモデルユーティリティ保存の点で優れていたことが確認された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:35:56 GMT)
E-Sort: Empowering End-to-end Neural Network for Multi-channel Spike Sorting with Transfer Learning and Fast Post-processing [3.1] E-Sortは、トランスファーラーニングと並列化可能な後処理を備えた、エンドツーエンドのニューラルネットワークベースのスパイクソータである。
我々のフレームワークは、スクラッチからのトレーニングに比べて、トレーニングに必要な注釈付きスパイクの数を44%削減し、最大25.68%の精度を達成する。
合成されたニューロピクセル記録では、E-SortはKilosort4と同等の精度を達成し、50秒のデータをわずか1.32秒でソートする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:53:05 GMT)
The Impact of Prompt Programming on Function-Level Code Generation [3.1] 大規模言語モデル(LLM)は、コード生成にソフトウェアエンジニアによってますます利用されている。
我々は,5つのプロンプトテクニックを評価するために設計された7072プロンプトのデータセットであるCodePromptEvalを紹介する。
その結果,特定のプロンプト手法が生成したコードに顕著に影響を及ぼすが,複数の手法を組み合わせることで必ずしも結果が向上するとは限らないことがわかった。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:34:10 GMT)
Error Estimates and Higher Order Trotter Product Formulas in Jordan-Banach Algebras [3.0] 我々は、三階および高階を含むトロッタースズキ近似の解析をジョルダン・バナッハ代数に拡張する。
提案手法は, トロッター積公式の適応性および非連想的設定に対する推定値を示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:21:41 GMT)
Hilbert Curve Based Molecular Sequence Analysis [2.9] ヒベルト曲線に基づくカオスゲーム表現法(CGR)を提案する。
この方法は、分子配列からヒルベルト曲線に基づく画像表現を構築するのに使用される新しいAlphabetic index mapping技術を含む変換関数である。
肺がんデータセット上でCNNモデルを用いて試験した場合,94.5$%,F1スコアが9,3.9%と高い精度を達成し,現在最先端の手法を上回り,有望な結果を示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:26:43 GMT)
Converting Time Series Data to Numeric Representations Using Alphabetic Mapping and k-mer strategy [2.9] 本稿では,時系列信号を生体/分子配列型表現に変換する手法を提案する。
英語アルファベットの26文字に対応する26の範囲を生成することにより、時系列内の各値をその範囲に基づいて特定の文字にマッピングする。
実世界の時系列信号を文字シーケンスに変換し、シーケンス分類を行うことにより、このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:29:05 GMT)
Explainability of Machine Learning Models under Missing Data [2.9] データ不足は、モデルの性能と解釈可能性を著しく損なうおそれのある問題である。
本稿では, 欠落データ分野の展開を要約し, 種々の計算法がシェープリー値の計算に与える影響について考察する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:25:11 GMT)
Riemannian Stochastic Approximation for Minimizing Tame Nonsmooth Objective Functions [2.8] 本研究では, 多様体上の成層関数の性質と退化降下, 勾配, 段数減少の挙動について検討し, それらの関数を最小化する。
本稿では、多様体上のそのような成層関数の性質と、その関数を最小化するために、段差を小さくした引き算降下、勾配の挙動について検討する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:27:33 GMT)
MATEY: multiscale adaptive foundation models for spatiotemporal physical systems [2.8] 局所的な特徴に基づくパッチサイズを動的に調整する2つの適応トークン化方式を提案する。
提案するマルチスケール適応モデルであるMATEYの性能を実験で評価する。
また、PDEデータに基づいて事前学習した物理を特徴とする微調整タスクについても紹介する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:13:16 GMT)
Cross-Modal Fusion and Attention Mechanism for Weakly Supervised Video Anomaly Detection [2.7] 弱教師付きビデオ異常検出(WS-VAD)が現代研究の方向性として浮上している。
暴力やヌードなどの異常を正確に検出するマルチモーダルなWS-VADフレームワークを提案する。
提案モデルでは,暴力とヌード検出のベンチマークデータセットを用いて,最先端の結果が得られた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:46:57 GMT)
Mind the Data Gap: Bridging LLMs to Enterprise Data Integration [2.7] 本研究では,大規模言語モデル(LLM)に基づく手法の性能が,実世界のデータセットでテストした場合に著しく低下することを示す。
我々は、エンタープライズデータ統合の発見を前進させるために、新しいベンチマークデータセットであるGOBY Benchmarkをリリースする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:07:20 GMT)
Attention Mechanism and Context Modeling System for Text Mining Machine Translation [2.6] Transformerモデルは、並列計算能力とマルチヘッドアテンション機構により、機械翻訳タスクでよく機能する。
高度に複雑な言語構造を扱う際に、文脈の曖昧さや局所的な特徴を無視することがある。
この表現にはK-Meansアルゴリズムが組み込まれており、入力されたテキスト項目の語彙とイディオムを階層化するのに使われる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:00:55 GMT)
A Novel Pseudo-Spectral Time-Domain Theory of Magnetic Neutron Scattering Illustrated Using A Uniformly Magnetized Sphere [2.5] 磁気中性子散乱の研究のために普遍的な数値計算法を開発した。
擬スペクトル時間領域アルゴリズムをシュリンガー方程式のスピノルバージョンに適用することにより、散乱波のスピン状態の進化を全空間と時間で解くことができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:56:28 GMT)
A General PSTD Method to Solve Quantum Scattering in the Fresnel and Far-field regions by A Localized Potential of Arbitrary Form [2.5] 有限範囲の任意のポテンシャルで量子散乱を解くための時間領域法を提案する。
近接場、中場(領域)、遠場を含む全空間の散乱波関数を得ることができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:48:12 GMT)
Innovative Approaches to Teaching Quantum Computer Programming and Quantum Software Engineering [2.5] 量子コンピューティングは、シミュレーション最適化やデータ処理など、さまざまな領域に革命をもたらすことを約束する。
本稿では,フィンランドとスペインの大学講師が,量子コンピュータプログラミングと量子ソフトウェア工学を教えるために開発した,革新的な教育戦略について概説する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:01:16 GMT)
Single-image reflection removal via self-supervised diffusion models [2.4] 本稿では,周期整合性と拡散確率モデル(DDPM)を組み合わせたハイブリッド手法を提案する。
実験により,SIR$2のFlashベース反射除去(FRR)データセットと,新たに導入されたMRRデータセットに対する提案手法の有効性が示された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:41:33 GMT)
Privacy-Preserving Identity and Access Management in Multiple Cloud Environments: Models, Issues, and Solutions [2.4] 本稿では,複数のクラウド環境におけるプライバシ保護のアイデンティティとアクセス管理に注目した。
我々は,最先端の研究提案の革新的な分類を参照科学分野に組み込む概要表を提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:15:19 GMT)
Multi-Agent Planning Using Visual Language Models [2.2] 大規模言語モデル(LLM)とビジュアル言語モデル(VLM)は、様々なドメインやタスクにわたるパフォーマンスとアプリケーションの改善により、関心を集めている。
LLMとVLMは、特に問題領域の深い理解が必要な場合、誤った結果をもたらす。
本稿では,特定のデータ構造を入力として必要とせずに動作可能なマルチエージェント型タスクプランニングアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:15:40 GMT)
Improving Graph Neural Network Training Efficiency By Using Top Non-Robust Samples In The Training Set [2.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理するための、非常に効果的なニューラルネットワークアーキテクチャである。
本稿では,与えられたモデルに対して特にノイズに敏感なトレーニングサンプルを同定し,トレーニングセットを構築するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:42:39 GMT)
Optimal L-Systems for Stochastic L-system Inference Problems [1.9] 本稿では,与えられた文字列列を生成することができる最適L-システムの構築に焦点を当てる。
与えられたシーケンスから最適L系を推論するアルゴリズムを導入する。
これにより、トレーニングに陽性データのみを使用して機械学習のモデルとしてLシステムを使用することが可能になる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:13:59 GMT)
A Particle Algorithm for Mean-Field Variational Inference [1.9] 平均場変動推定のための新しい粒子ベースアルゴリズムを提案する。
我々はアルゴリズムに対して漸近的でない有限粒子収束を保証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:21:13 GMT)
A Survey on Online User Aggression: Content Detection and Behavioral Analysis on Social Media [1.6] ソーシャルメディアプラットフォームの普及は、サイバーいじめ、オンラインハラスメント、攻撃的およびヘイトスピーチの普及など、サイバー攻撃的な行動の増加につながっている。
これらの行動は、オンラインの匿名性から、うつ病、自殺傾向、場合によってはオフライン暴力などの現実的な結果まで、社会的な重大な結果に結びついている。
本稿では,異なる研究のギャップを埋めることを目的として,攻撃的ユーザに対する攻撃的コンテンツ検出と行動分析の分野を掘り下げる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:16:05 GMT)
Solving the Perfect Domination Problem by Quantum Approximate Optimization Algorithm with Small Layers [1.3] 完全支配問題(PDP)は、無線やソーシャルネットワークといった現実のシナリオにおいて重要な応用がある。
量子コンピューティングの最近の進歩により、NP完全問題に対処する量子アルゴリズムの開発が急増した。
この研究は、量子アルゴリズムをPDPに適用する先駆的な取り組みであり、それを解決するための有効性を示している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:53:05 GMT)
Adversarial Negotiation Dynamics in Generative Language Models [1.3] 生成言語モデルは、契約の起草と拡張にますます使われています。
これは、競合する当事者が異なる言語モデルを相互にデプロイするシナリオを生み出します。
我々は,主要なオープンソース言語モデルの性能と脆弱性を正面競争で評価する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:17:55 GMT)
When the whole is greater than the sum of its parts: Scaling black-box inference to large data settings through divide-and-conquer [1.2] ディープニューラルネットワークのようなブラックボックス法は、モデルパラメータの点推定を非常に高速に得る。
我々は,データシミュレーションが計算コストが高い場合のブラックボックス分割/コンカレンダ推定と推論の枠組みを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:29:54 GMT)
BEACON: A Bayesian Optimization Strategy for Novelty Search in Expensive Black-Box Systems [1.2] ノベルティ・サーチ (NS) は、シミュレーションや実験を通じて様々なシステムの振る舞いを自動的に発見する探索アルゴリズムのクラスである。
ベイズ最適化の原理にインスパイアされたサンプル効率のNS法を提案する。
BEACONは、限られたサンプリング予算の下で、かなり大きな多様な振る舞いの集合を見出すことで、既存のベースラインを総合的に上回ります。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 03:24:33 GMT)
Real-time Speech Enhancement on Raw Signals with Deep State-space Modeling [1.1] ATENNuateは、オンライン生音声の効率向上のために構成された、シンプルなディープな状態空間オートエンコーダである。
我々は、VoiceBank + DEMANDとMicrosoft DNS1合成テストセットでaTENNuateをベンチマークする。
ネットワークは、PSSQスコア、パラメータカウント、MAC、レイテンシの点で、従来のリアルタイムデノナイズモデルを上回っている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:03:13 GMT)
Towards a General Framework for Practical Quantum Network Protocols [0.9] この論文の主な貢献は、量子ネットワークにおけるエンタングルメント分布プロトコルの数学的枠組みである。
我々は、絡み合い分布の実践的な側面を取り入れた地上および衛星ベースの量子ネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:20:59 GMT)
AmalREC: A Dataset for Relation Extraction and Classification Leveraging Amalgamation of Large Language Models [0.7] この研究は、(i)関係から文を生成する方法、(ii)関係を比較・ランク付けする方法、(iii)個々の方法の強みを組み合わせて、文のさらにベットな品質を生成する方法、(iv)最終的なデータセットを評価する方法、といった主な疑問に焦点を当てた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 10:36:33 GMT)
Solving the Independent Domination Problem by Quantum Approximate Optimization Algorithm [0.6] 独立支配問題(IDP)は、様々な現実のシナリオにおいて実践的な意味を持つ。
IDPの既存の古典的アルゴリズムは計算の複雑さに悩まされている。
本稿では、IDPに対処するための量子近似最適化(QAOA)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:40:25 GMT)
QUBO Formulations for Variation of Domination Problem [0.6] 支配問題 (DP) は, 消防署問題, ソーシャルネットワーク理論など, 現実の多くの実践的問題に関係している。
本稿では,従来のDPのQUBOモデリング手法とその変種について検討する。
従来の研究と比較して、従来のDPのモデリング手法であるQUBOでは、量子コンピュータ上でのDP解決の障壁を低くすることができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:30:42 GMT)
Segmentation of Muscularis Propria in Colon Histopathology Images Using Vision Transformers for Hirschsprung's Disease [0.6] ビジョントランスフォーマー(ViT)は、自己意識によって強力なディープラーニングアプローチとして登場した。
本研究は,カレチニン染色組織像における筋プロプライア分画に対するViTsの応用について検討した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:43:43 GMT)
Four-qubit critical states [0.6] 文献に現れる高絡み合いや有用な4ビット状態は,そのような絡み合い対策の静止点であることを示す。
我々は(ケンプ=ネッス定理の意味で)臨界点の概念をヴィンバーグ理論と共に使用し、問題の複雑さを著しく減少させる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:49:19 GMT)
The intrinsic motivation of reinforcement and imitation learning for sequential tasks [0.5] この研究は、強化学習と模倣学習の間に新しいドメインブリッジを考案することを目的としている。
学習エージェントが学習カリキュラムを自動的に選択するための経験的進歩に基づく本質的な動機付けの共通的な定式化を提案する。
我々は、複数のタスクを学習するための機械学習アルゴリズムを用いて、社会的にガイドされた本質的な動機付けの枠組みを開発した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:44:59 GMT)
Learning Optimal Control and Dynamical Structure of Global Trajectory Search Problems with Diffusion Models [0.5] 本稿では,循環制限型3体問題における2つの大域的探索問題について検討する。
我々は、拡散モデルを適用して条件付き確率分布を学習するために、事前生成機械学習フレームワークを構築した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:13:12 GMT)
Application of Quantum Approximate Optimization Algorithm in Solving the Total Domination Problem [0.5] 総合支配問題(TDP)はこの分野における古典的かつ批判的な事例である。
量子コンピューティングの最近の進歩は、最適化問題に量子アルゴリズムを適用することに大きな研究をもたらした。
本稿では,量子近似最適化アルゴリズム(QAOA)の先駆的応用について述べる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 07:44:36 GMT)
Testing and Improving the Robustness of Amortized Bayesian Inference for Cognitive Models [0.5] 汚染物質観測とアウトリーチは、認知モデルのパラメータを推定する際にしばしば問題を引き起こす。
本研究では,アモルタイズされたベイズ推定を用いたパラメータ推定のロバスト性を検証・改善する。
提案手法は実装が簡単で実用的であり,外乱検出や除去が困難な分野に適用可能である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:22:24 GMT)
Scalar, Vector Perturbations and Effective Hawking Radiation of Cylindrical Black Holes in $f(\mathcal{R})$ and Ricci-Inverse Gravity [0.5] 本稿では,$f(mathcalR)$-gravityとRicci-Inverse(mathcalRI$)重力の枠組み内に構築された円筒型ブラックホールに付随する摂動と準正規モード(QNMs)について検討する。
これらのブラックホール溶液中のホーキング放射を修正し,結合定数の影響を解析した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 00:25:59 GMT)
Chain-of-Translation Prompting (CoTR): A Novel Prompting Technique for Low Resource Languages [0.4] Chain of Translation Prompting (CoTR)は、低リソース言語における言語モデルの性能を高めるために設計された新しい戦略である。
CoTR再構成は、まず入力コンテキストを低リソース言語から高リソース言語に翻訳する。
本稿では,この手法の有効性を低リソースのインディア言語であるMarathiのケーススタディを通じて実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 06:29:14 GMT)
LSQCA: Resource-Efficient Load/Store Architecture for Limited-Scale Fault-Tolerant Quantum Computing [0.4] 約100%のメモリ密度を達成できる新しいフロアプラン戦略に基づくFTQCアーキテクチャを提案する。
私たちのアーキテクチャの背景にある考え方は、すべてのメモリ領域を、計算レジスタ(CR)と呼ばれる小さな計算空間と、Scan-Access Memory(SAM)と呼ばれる空間効率のよいメモリ空間に分けることである。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:58:23 GMT)
Potential Enabling Technologies for 7G Networks: Survey [0.3] 6Gと7Gのイノベーションの第2のクラスでは、高度なMLとAI全般の最適な統合に重点を置いています。
量子技術を導入することで、7Gはネット上の計算プロセスを高速化し、ネットワークセキュリティを強化し、分散QCを可能にする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:34:07 GMT)
Automated Auxiliary Qubit Allocation in High-Level Quantum Programming [0.3] マルチキュービットゲート分解のための補助量子ビットの割り当てを自動化することで、量子回路のコンパイルを最適化する手法を提案する。
このアプローチは、高レベルの量子プログラミングプラットフォームKetで実装され、評価される。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:19:06 GMT)
A comparison of HPC-based quantum computing simulators using Quantum Volume [0.3] 本稿では、単一のCPUまたはGPUベースのHPCノードで動作する量子コンピューティングシミュレータを比較した。
シミュレーターはノイズに悩まされないため、比較で使われる計量は、設定された量子体積をシミュレートするのに必要な時間である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:40:54 GMT)
Neural Likelihood Surfaces for Spatial Processes with Computationally Intensive or Intractable Likelihoods [0.2] 本稿では,畳み込みニューラルネットワークを用いて空間過程の確率関数を学習する。
本手法は信頼性の高い不確実性定量化法を用いて高速かつ正確なパラメータ推定を行う。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:08:34 GMT)
GliLem: Leveraging GliNER for Contextualized Lemmatization in Estonian [0.2] 本稿では, 厳密な規則に基づく形態素解析器であるVabamorfを改良した, エストニア人のための新しいハイブリッド補題化システムを提案する。
本稿では,事前学習したGliNERモデルの柔軟性を活用し,Vabamorfの補間精度を10%向上させる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:02:00 GMT)
Controlling Out-of-Domain Gaps in LLMs for Genre Classification and Generated Text Detection [0.2] 本研究は,Large Language Models (LLMs) の現代世代において,事前学習型言語モデル (PLMs) の先行研究において観測された,同じ領域外(OOD) 性能差に悩まされていることを示す。
本稿では,予測指標が使用されるか,分類中に除外されるかを制御する手法を提案する。
このアプローチにより、数ショットのセットアップで最大20パーセントのOODギャップが削減される。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:54:39 GMT)
Emerging Quadrature Lattices of Kerr Combs [0.2] フォトニック二次格子の非エルミート格子効果を初めて実験的に研究した。
我々の研究は量子非エルミート物理学とケーラーコムという2つの主要な分野を統一する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:21:59 GMT)
Optical Character Recognition using Convolutional Neural Networks for Ashokan Brahmi Inscriptions [0.1] この研究は主に、トレーニング済みの3つのCNN(LeNet、VGG-16、MobileNet)に焦点を当てている。
この結果、MobileNetは他の2モデルよりも精度が高く、検証精度は95.94%、検証損失は0.129であることがわかった。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:56:03 GMT)
HindiLLM: Large Language Model for Hindi [0.1] 我々はヒンディー語のための2つの自己回帰型大規模言語モデル(LLM)を事前訓練した。
教師なし事前学習と教師付き微調整を含む2段階のプロセスを用いる。
評価の結果,HindiLLMをベースとした微調整モデルでは,言語関連タスクの大部分において,いくつかのモデルよりも優れていた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:28:15 GMT)
Capturing strong correlation effects on a quantum annealer: calculation of avoided crossing in the H$_4$ molecule using the quantum annealer eigensolver [0.1] 本稿では,量子アナーラー固有解法(QAE)アルゴリズムの範囲を拡張し,回避された交差を予測する。
5000kbit D-Wave Advantage System 4.1 の量子コンピュータで得られた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:37:02 GMT)
Probing de Sitter Space Using CFT States [0.0] dS$_3/$CFT$$の演算は、AdS$_3/$CFT$$の演算と明らかに異なる。
これにより、CPT-in方式で異なる一次状態から構築された2つの局所状態を組み合わせる必要がある。
この分析は、dS ユークリッド真空におけるグリーン関数が、AdS のウィック回転から簡単には得られない理由を説明する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:27:10 GMT)
Towards Neural No-Resource Language Translation: A Comparative Evaluation of Approaches [0.0] 最小あるいは非デジタル表現の非オープンソース言語は、機械翻訳(MT)に固有の課題を提起する。
制限はあるが既存のコーパスに依存している低リソース言語とは異なり、非リソース言語は訓練に使える文章が100文未満であることが多い。
本研究は,3つの異なるアプローチによるノンリソース翻訳の問題について考察する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:12:39 GMT)
Theory of Valley Splitting in Si/SiGe Spin-Qubits: Interplay of Strain, Resonances and Random Alloy Disorder [0.0] 歪んだSi/SiGe量子井戸における重要な課題は、伝導帯の最小値に2つのほとんど退化した谷の状態が存在することである。
経験的擬ポテンシャル法による包括的包絡関数理論を開発し, 合金障害, ひずみ, 非自明共鳴の影響を取り入れた。
このフレームワークは、谷分割におけるこれらの効果の相互作用を定量化するための効率的なツールを提供し、複雑なエピタキシャルプロファイルの最適化を可能にする。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:43:41 GMT)
The Synergy of Automated Pipelines with Prompt Engineering and Generative AI in Web Crawling [0.0] 本研究では,生成型AIツールClaude AI(Sonnet)とChatGPT4.0を統合することにより,Webスクレイピングを自動化する。
クロードAIは一貫してChatGPT-4.0のスクリプト品質と適応性に優れていた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:27:55 GMT)
Symmetry protected topological phases under decoherence [0.0] 特に、様々な種類のデコヒーレンスの下で対称性保護トポロジカル位相(SPT)のクラスについて検討する。
本研究では,SPT基底状態からの非自明な位相情報をデコヒーレンスの下でも保持できることを実証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:15:59 GMT)
Symmetries of Liouvillians of squeeze-driven parametric oscillators [0.0] 我々は、カー係数 $K$ に対するデチューニングパラメータ $omega$ の比 $eta =omega /K$ の整数値において、顕著な準スピン対称性 $su(2)$ を求める。
我々の発見は、量子コンピューティングに関心のある状態の生成と安定化に応用できるかもしれない。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 04:58:33 GMT)
Random Matrix Theory for Stochastic Gradient Descent [0.0] 機械学習アルゴリズムにおける学習のダイナミクスを調べることは、アプローチが成功する方法と理由を理解する上で、最重要事項である。
ここでは、ダイソン・ブラウン運動の枠組みを用いて、ランダム行列理論からウェイト行列ダイナミクスを記述する。
学習速度(ステップサイズ)とバッチサイズの間の線形スケーリングルールを導出し、重み行列力学の普遍的および非普遍的側面を同定する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:21:13 GMT)
Quantum Phase Transitions in the Spin 1 Bilinear-Biquadratic Heisenberg Model Based on Classical and Quantum Correlations [0.0] 一次元スピン1双線型バイカッドラティックハイゼンベルクモデルにおける熱的および非熱的量子相関について検討した。
我々の負性分析は、0または非常に低温でほぼ同じ結果を示す。
奇数のスピンを持つスピン鎖は、QPTを同定する偶数を持つスピン鎖よりも効果的であると主張する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 08:14:13 GMT)
Protein Structure Prediction in the 3D HP Model Using Deep Reinforcement Learning [0.0] 本稿では,2つの新しいディープラーニングアーキテクチャによる3次元疎水性・多孔格子モデルにおけるタンパク質構造予測について述べる。
36残基以下のタンパク質について、我々のハイブリッド貯水池モデルでは、固定されたランダムプロジェクションとトレーニング可能な深層を組み合わせ、トレーニングエピソードを25%減らして最適なコンフォーメーションを達成する。
より長いシーケンスに対して、私たちは、最もよく知られたエネルギー値に一致する、多面的な注意を持つ長い短期記憶ネットワークを使用します。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 02:55:54 GMT)
Post-Quantum Cryptography(PQC): Generalized ElGamal Cipher over GL(8,F251) [0.0] ポスト量子暗号(PQC)は、攻撃に耐性のある暗号プロトコルを見つけようとする。
本稿では、一般化されたElGamal非軌道化プロトコルに基づく非対称暗号に焦点をあてる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:42:36 GMT)
Phonon-Induced Effects in Quantum Dot Absorption and Resonance Fluorescence with Hierarchy of Pure States [0.0] 超音速スペクトル密度で振動環境に結合し、漏れキャビティモードに弱い量子ドット(QD)システムについて検討する。
フォノンカップリングは吸収線形状と放出線形状を劣化させ、一方、弱い結合キャビティモードはQDを効果的に駆動する。
本研究では, 強いフォノンカップリング強度と有限温度での吸収スペクトルと, 異なるフォノンカップリング強度と温度での共鳴蛍光スペクトルについて数値計算を行った。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:05:16 GMT)
NLP-based Regulatory Compliance -- Using GPT 4.0 to Decode Regulatory Documents [0.0] 本研究は,GPT-4.0の規制要件内での競合を識別する能力を評価する。
精度、リコール、F1スコアなどの測定値を用いて、実験はGPT-4.0が不整合を検出する効果を示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:14:59 GMT)
Multi-Channel Cross Modal Detection of Synthetic Face Images [0.0] 合成生成された顔画像は、人間による実際の画像と区別できないことが示されている。
高速かつ任意の画像後処理が可能な新しい生成モデルを提案する。
完全に合成された顔画像を検出するためのマルチチャネルアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 22:51:50 GMT)
Matrix Concentration for Random Signed Graphs and Community Recovery in the Signed Stochastic Block Model [0.0] エッジとその記号が任意のノードから無作為に無作為に加算されるグラフを考える。
この結果を用いて,摂動符号ブロックモデルから得られたグラフについて検討する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:49:25 GMT)
Left-handed representation in top 100 male professional tennis players: Multi-disciplinary perspectives [0.0] 一般的には、左利きのテニス選手は、一般市民の左利きの比率に比べて過剰に代表されるという意見がある。
この研究は、データ分析によって支持されるドメインの洞察を提供し、親とコーチの意思決定を知らせる助けとなる。
洞察とデータ分析は、ハンドネスの決定、先進的なコーチングと戦略ゲームの概念、メディアカバレッジ/分析の強化、左利きの事実と統計、テニス用品の製造を通知することができる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:43:40 GMT)
Kryptonite-N: Machine Learning Strikes Back [0.0] Quinnらは、Kryptonite-Nと呼ばれる研究で挑戦的データセットを提案する
これらのデータセットは、機械学習の普遍関数近似引数に対抗することを目的としている。
我々の研究は、この主張を否定し、普遍関数近似がうまく適用可能であることを示す。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 21:23:09 GMT)
Integrating Natural Language Processing Techniques of Text Mining Into Financial System: Applications and Limitations [0.0] 本研究では,金融システムの各種構成要素における自然言語処理技術としてのテキストマイニングの活用について検討する。
研究は、新しい特定のアルゴリズムが開発され、金融システムの焦点は主に資産価格コンポーネントに焦点を当てていることに気づいた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:25:03 GMT)
IRFusionFormer: Enhancing Pavement Crack Segmentation with RGB-T Fusion and Topological-Based Loss [0.0] 本稿では,RGBと熱データを効果的に統合したフラクチャーセグメンテーションの新しいモデルであるIRFusionFormerを提案する。
本手法は,90.01%のDiceスコアと81.83%のIoUで最先端性能を実現し,各種環境条件におけるロバスト性および精度を著しく向上させる。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:49:46 GMT)
Hybrid CNN-LSTM based Indoor Pedestrian Localization with CSI Fingerprint Maps [0.0] 本稿では,CSI(Channel State Information)データを用いた新しいWi-Fiフィンガープリントシステムを提案する。
提案システムは,CSIデータから抽出した特徴の周波数多様性と空間的多様性を利用して,CSIフィンガープリントマップを生成する。
次に、このCSIフィンガープリントマップによるCSIデータの表現を用いて、ハイブリッドアーキテクチャを用いた歩行者軌道仮説を生成する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:02:59 GMT)
How do machines learn? Evaluating the AIcon2abs method [0.0] 本研究は,AIcon2abs法(コンクリートから抽象へのAI:人工知能を一般大衆に普及させるAI)の評価を目的とした先行研究の拡大である。
このアプローチでは、単純さとユーザアクセシビリティで知られている、ウェイトレスニューラルネットワークであるWiSARDアルゴリズムを採用している。
WiSARDはインターネットを必要とせず、技術的でないユーザーやリソースに制限のある環境に最適である。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:54:43 GMT)
Game Theory and Multi-Agent Reinforcement Learning : From Nash Equilibria to Evolutionary Dynamics [0.0] 本稿では,本研究を基礎とした複雑なマルチエージェントシステムにおける先進的なトピックについて考察する。
マルチエージェント強化学習(MARL: Multi-Agent Reinforcement Learning)における4つの基本的な課題について検討する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:15:40 GMT)
Foveated Retinotopy Improves Classification and Localization in CNNs [0.0] 画像分類タスクにおいて,葉柄付き網膜移植が深層畳み込みニューラルネットワーク(CNN)にどのような効果をもたらすかを示す。
以上の結果から,葉状網膜地図は視覚的物体形状に関する暗黙の知識をコードしていることが示唆された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:13:50 GMT)
Fast TILs -- A Pipeline for Efficient TILs Estimation in Non-Small Cell Lung Cancer [0.0] 非小細胞肺癌(NSCLC)における腫瘍浸潤リンパ球(TIL)の定量化には大きな課題がある。
本研究は,半確率的パッチサンプリングとパッチ分類を用いて,予後関連パッチを保持する自動パイプラインを提案する。
パイプラインは、予後に関係のない領域の約70%を効率よく排除し、予後の正確性を維持するために残りのパッチの5%しか必要としない。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 16:15:51 GMT)
False vacuum decay of excited states in finite-time instanton calculus [0.0] 我々は、励起状態の減衰に対応する有限時間振幅を計算するために標準インスタンス形式に適応する。
任意のポテンシャルに対して、主量子補正を含む追従減衰幅を明示的に計算する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 10:47:54 GMT)
Ensemble of classifiers for speech evaluation [0.0] 本稿では,医学における音声評価の問題を解決するために,バイナリ分類器のアンサンブルを適用しようとする試みについて述べる。
音節の発音品質の定量的および専門的な評価に基づいてデータセットを作成した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:28:32 GMT)
Enhancing autonomous vehicle safety in rain: a data-centric approach for clear vision [0.0] 我々は,雨による視覚障害を取り除くために,ライブ車両のカメラフィードを処理する視覚モデルを開発した。
従来のエンコーダ・デコーダアーキテクチャを用いて,接続をスキップし,操作を連結した。
その結果, 降雨条件下での航法安全性と信頼性を高めるため, 操舵精度が向上した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 20:27:12 GMT)
Edge of Stochastic Stability: Revisiting the Edge of Stability for SGD [0.0] ミニバッチ勾配勾配勾配 (SGD) の列車を, エッジ・オブ・安定性 (Edge of Stability) と呼ぶ。
この体制では、$2/eta$でホバリングされるのは、ミニバッチ(MiniBS)損失のHessianの最大の固有値のバッチの平均である。
これは、より小さなバッチやより大きな学習率でトレーニングする場合、シャープネスが一般的に低いことを意味する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 18:59:01 GMT)
EXAdam: The Power of Adaptive Cross-Moments [0.0] 本稿では,広く使用されているAdamAdamアルゴリズムに基づく新しい最適化アルゴリズムであるEXAdamを紹介する。
EXAdamには、(1)モーメント推定を改善するための新しいデバイアス項、(2)勾配に基づく加速度機構、(3)動的ステップサイズ公式の3つの重要な拡張が含まれている。
EXAdamはAdamよりも優れており、48.07%の高速化と4.6%、4.13%、そして2.39%の改善を実現している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 00:11:54 GMT)
ELECTRA and GPT-4o: Cost-Effective Partners for Sentiment Analysis [0.0] 本稿では,3方向感情分類のためのELECTRAとGPT-4oの協調的アプローチについて検討する。
我々はStanford Sentiment Treebank(SST)とDynaSentのレビューを組み合わせて、4つのモデルを微調整した。
この結果から,微調整エンコーダの予測による拡張プロンプトが性能向上に有効であることが示唆された。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 05:29:52 GMT)
Cyber-Physical Security Vulnerabilities Identification and Classification in Smart Manufacturing -- A Defense-in-Depth Driven Framework and Taxonomy [0.0] 既存のソリューションは、製造環境の複雑なドメイン固有の脆弱性に対処するのに不足している。
本稿では, 脆弱性と防御の二重性に基づく新たな特徴付けを導入することにより, 製造状況における脆弱性を再定義する。
我々は,製造サイバースペース,人体要素,ポストプロダクション検査システム,生産プロセス監視,組織方針および手順の脆弱性を特定し,分類する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:41:06 GMT)
CubeSat single-photon detector module for investigating in-orbit laser annealing to heal radiation damage [0.0] シリコンをベースとした単光子アバランシェフォトダイオード(SPAD)は、量子衛星通信において広く検討されている。
SPADは陽子放射によって誘導される活動領域の変位による暗カウント率(DCR)の上昇に悩まされる。
以前の実験では、約1Wの光学パワーを持つSPADs活性領域のレーザーアニールは、放射線誘起DCRを著しく減少させることを示した。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:53:31 GMT)
Critical spectrum of the anisotropic two-photon quantum Rabi model [0.0] 二重縮退した例外状態は解析的手法によって同定される。
2つの異方性に依存した臨界原子周波数の間に有限個の有界状態が存在することを厳密に発見する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 11:21:40 GMT)
Cool, But What About Oracles? An Oracle-Based Perspective on Blockchain Integration in the Accounting Field [0.0] 本研究の目的は、会計におけるブロックチェーン統合に関する論文が、オラクルが引き起こす制限を考慮し、対処するかどうかを検討することである。
その結果,本研究は多数の論文を数えているものの,オラクルの限界を考慮した実際の研究は欠落している,という見解が得られた。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 12:09:19 GMT)
Comparative Performance of Advanced NLP Models and LLMs in Multilingual Geo-Entity Detection [0.0] 本稿では,主要なNLPモデルの包括的評価を行う。
精度,精度,リコール,F1スコアなどの指標を用いて,これらのモデルの性能について検討する。
この実験から得られた結論は、より高度で包括的なNLPツールの強化と作成を指向することを目的としている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:47:14 GMT)
Audiopedia: Audio QA with Knowledge [0.0] 本稿では,Audiopediaという,Audio Question Answering with Knowledgeという新しいタスクを紹介する。
従来のAQA(Audio Question Answering)ベンチマークとは異なり、Audiopediaは知識集約的な質問をターゲットにしている。
我々は,これらのサブタスク上で大規模音声言語モデル (LALM) をベンチマークし,準最適性能を観察する。
LALMに適応可能な汎用フレームワークを提案し,知識推論機能を備える。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 23:48:35 GMT)
Attacks on the neural network and defense methods [0.0] 本稿では、音声データに基づいてトレーニングされたニューラルネットワークに対する攻撃の使用と、これらの攻撃に対する防御方法について論じる。
FGSM、PGD、CW攻撃、およびデータ中毒について検討する。
攻撃アプリケーションのフレームワーク内で得られた精度指標を提示する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 17:33:04 GMT)
An alternative explicit circuit diagram for the quantum search algorithm by implementing a non-unitary gate [0.0] 非ユニタリ行列の平方根を用いた明示的ユニタリ実装の例を示す。
元のアルゴリズムのマーク部分である$U_mark$を使用するため、回路の単一繰り返しの複雑さはこの演算子の複雑さによって制限される。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 13:20:37 GMT)
A Multiparty Homomorphic Encryption Approach to Confidential Federated Kaplan Meier Survival Analysis [0.0] 私たちはaを提案します。
マルチパーティの同型暗号化ベースのフレームワーク。
プライバシー保護連合カプラン-マイエサバイバル分析
我々のフレームワークは、暗号化されたサバイバル推定を、公式なユーティリティーロス境界によって支持された集中的な結果と密接に一致させることを保証する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 15:17:42 GMT)
A Multidisciplinary Approach to Telegram Data Analysis [0.0] 本稿では,サイバー脅威に関する早期警戒情報を得るために,Telegramのデータ分析のための多分野的アプローチを提案する。
ニューラルネットワークアーキテクチャと従来の機械学習アルゴリズムを組み合わせています。
我々は、サイバー脅威に対する早期警告システムを強化し、潜在的なセキュリティ侵害に対するより積極的な対応を可能にすることを目指している。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:10:52 GMT)
A Model of Entropy Production [0.0] 量子力学のトランザクショナル解釈(Transactional Interpretation of Quantum Mechanics)のキーテレットは、光子吸収が吸収物質系を局在させるという考えである。
我々は光子吸収過程におけるエントロピー生成の厳密なモデルを開発する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 19:22:21 GMT)
A Comprehensive Framework for Reliable Legal AI: Combining Specialized Expert Systems and Adaptive Refinement [0.0] 本稿では,専門家システムと知識に基づくアーキテクチャを組み合わせた新しい枠組みを提案する。
このフレームワークは特殊なモジュールを利用し、それぞれが特定の法的領域に焦点を当て、構造化された運用ガイドラインを取り入れて意思決定を強化する。
提案されたアプローチは、既存のAIモデルよりも大幅に改善され、法的タスクのパフォーマンスが向上し、よりアクセシブルで手頃な価格の法律サービスを提供するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 14:00:11 GMT)
"Generative Models for Financial Time Series Data: Enhancing Signal-to-Noise Ratio and Addressing Data Scarcity in A-Share Market [0.0] ストックデータを合成するための2つの生成モデルに基づくアプローチを示す。
第1の方法は、中国A株市場におけるさまざまな分野の株式の特徴を分類することで、株価データの信号対雑音比を高める。
第2の方法は、上場期間が短い株と、それに相当する限られた会社でデータを合成するように設計されている。
論文参考訳(メタデータ) (Sun, 29 Dec 2024 09:35:23 GMT)