Tensor-GaLore: Memory-Efficient Training via Gradient Tensor Decomposition [94.0] 本研究では,高次テンソル重み付きニューラルネットワークの効率的なトレーニング手法であるNavier-GaLoreを提案する。
様々なPDEタスクの中で、Navier-GaLoreはメモリ節約を実現し、最大75%のメモリ使用量を削減している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:51:51 GMT)
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration [76.8] SeedVRは、任意の長さと解像度で現実世界のビデオ再生を処理するために設計された拡散トランスフォーマーである。
合成ベンチマークと実世界のベンチマーク、AI生成ビデオで高い競争力を発揮する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:11:49 GMT)
Benchmarking Large and Small MLLMs [71.8] 大規模なマルチモーダル言語モデル(MLLM)は、マルチモーダルコンテンツの理解と生成において顕著な進歩を遂げている。
しかし、そのデプロイメントは、遅い推論、高い計算コスト、デバイス上のアプリケーションに対する非現実性など、重大な課題に直面している。
LLavaシリーズモデルとPhi-3-Visionによって実証された小さなMLLMは、より高速な推論、デプロイメントコストの削減、ドメイン固有のシナリオを扱う能力を備えた有望な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:44:49 GMT)
AutoGAN-Distiller: Searching to Compress Generative Adversarial Networks [68.6] 既存のGAN圧縮アルゴリズムは、特定のGANアーキテクチャの処理と損失に限られている。
近年の深部圧縮におけるAutoMLの成功に触発されて,GAN圧縮にAutoMLを導入し,AutoGAN-Distillerフレームワークを開発した。
我々はAGDを画像翻訳と超解像の2つの代表的なGANタスクで評価する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:50:17 GMT)
Test-Time Training on Video Streams [66.6] 以前の作業では、テスト時にトレーニングされたモデルをさらに改善するための一般的なフレームワークとして、テスト時間トレーニング(TTT)が確立されていた。
TTTをストリーミング設定に拡張し、複数のテストインスタンスが時間順に到着します。
オンラインTTTは、現実世界の3つのデータセット上で、4つのタスクで固定モデルベースラインを大幅に上回る。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:59:48 GMT)
FracTrain: Fractionally Squeezing Bit Savings Both Temporally and Spatially for Efficient DNN Training [62.9] 本稿では, アクティベーション, ウェイト, 勾配の精度を徐々に向上させる, プログレッシブ分数量子化を統合したFracTrainを提案する。
FracTrainはDNNトレーニングの計算コストとハードウェア量子化エネルギー/レイテンシを削減し、同等以上の精度(-0.12%+1.87%)を達成する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:47:41 GMT)
Joint Optimization for 4D Human-Scene Reconstruction in the Wild [59.3] モノクロビデオから野生の4次元人間シーンを再現する新しい最適化手法JOSHを提案する。
実験の結果,JOSHはグローバルな人間の動き推定と密集したシーン再構築において,より良い結果が得られることが示された。
さらに、より効率的なモデルJOSH3Rを設計し、Webビデオから直接擬似ラベルでトレーニングします。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 01:53:51 GMT)
Self-Supervised Learning for Detecting AI-Generated Faces as Anomalies [58.1] 本稿では、写真顔画像から純粋にカメラ固有の特徴と顔特有の特徴の自己教師付き学習を活用することで、AI生成顔の異常検出手法について述べる。
提案手法の成功は,特徴抽出器を訓練して4つの通常交換可能な画像ファイルフォーマット(EXIF)をランク付けし,人工的に操作された顔画像の分類を行うプリテキストタスクを設計することにある。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:23:24 GMT)
InstantNet: Automated Generation and Deployment of Instantaneously Switchable-Precision Networks [57.4] 可変ビット幅で動作する即時切替可能精度ネットワークを自動生成・展開するInstantNetを提案する。
実験では、提案されたInstantNetは最先端の設計を一貫して上回っている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:46:10 GMT)
Towards Faster k-Nearest-Neighbor Machine Translation [51.9] k-nearest-neighbor 機械翻訳アプローチは、トークンをデコードする際に、データストア全体の重い検索オーバーヘッドに悩まされる。
ニューラルネットワークの翻訳モデルとkNNが生成する確率によってトークンが共同で翻訳されるべきかどうかを予測するための,単純で効果的な多層パーセプトロン(MLP)ネットワークを提案する。
本手法は,翻訳品質をわずかに低下させることなく,kNN検索のオーバーヘッドを最大53%削減する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 10:02:11 GMT)
Personalized Graph-Based Retrieval for Large Language Models [51.7] ユーザ中心の知識グラフを利用してパーソナライゼーションを強化するフレームワークを提案する。
構造化されたユーザ知識を直接検索プロセスに統合し、ユーザ関連コンテキストにプロンプトを拡大することにより、PGraphはコンテキスト理解と出力品質を向上させる。
また,ユーザ履歴が不足あるいは利用できない実環境において,パーソナライズされたテキスト生成タスクを評価するために設計された,パーソナライズドグラフベースのテキスト生成ベンチマークを導入する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 01:46:49 GMT)
Learning Evolution via Optimization Knowledge Adaptation [50.3] 進化的アルゴリズム(EA)は、複雑なタスクの解を見つけるために、進化的演算子を通して集団を維持する。
最適化知識適応進化モデル(okaEM)を導入し,最適化能力を向上する。
okaEMは、様々な知識伝達設定におけるパフォーマンス向上のために、事前知識を活用する。
自然選択と遺伝子組換えの原理をエミュレートすることができる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:35:21 GMT)
ROLO-SLAM: Rotation-Optimized LiDAR-Only SLAM in Uneven Terrain with Ground Vehicle [49.6] 荒地における地上車両の姿勢推定精度を向上させるために,LiDARを用いたSLAM法を提案する。
累積誤差の低減を支援するために,グローバルスケールの因子グラフが確立されている。
その結果,ROLO-SLAMは地上車両の姿勢推定に優れ,既存のLiDAR SLAMフレームワークよりも優れていた。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:44:27 GMT)
Towards Multi-Modal Animal Pose Estimation: A Survey and In-Depth Analysis [48.6] 動物ポーズ推定(英: Animal pose Estimation、APE)は、様々なセンサーとモダリティ入力を用いて、動物の身体の部位を特定することを目的としている。
2011年以降、176の論文を評価した結果、APE法は入力センサとモードタイプ、出力形式、学習パラダイム、実験セットアップ、アプリケーションドメインによって分類された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:01:22 GMT)
The Efficiency vs. Accuracy Trade-off: Optimizing RAG-Enhanced LLM Recommender Systems Using Multi-Head Early Exit [46.4] 本稿では,Retrieval-Augmented Generation(RAG)と革新的なマルチヘッドアーリーエグジットアーキテクチャを組み合わせた最適化フレームワークを提案する。
我々の実験は、信頼性の高いレコメンデーション配信に必要な精度を犠牲にすることなく、このアーキテクチャがいかに効果的に時間を削減するかを実証している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:26:46 GMT)
Publicly-Detectable Watermarking for Language Models [45.3] 本稿では,LMの電子透かし方式について述べる。
我々は、リジェクションサンプリングを用いてLM出力に暗号署名を埋め込む。
我々は,この手法が不規則かつ歪みのないテキスト出力を生成することを証明した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:52:49 GMT)
Improving Synthetic Image Detection Towards Generalization: An Image Transformation Perspective [45.2] 現在の合成画像検出(SID)パイプラインは、主に普遍的なアーティファクト機能を構築することを目的としている。
3つの簡単な画像変換を持つ軽量かつ効率的な検出器SAFEを提案する。
我々のパイプラインは、新しい最先端のパフォーマンスを実現し、既存の手法に対する平均精度は4.5%、平均精度は2.9%向上した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:17:20 GMT)
Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer [43.9] 古典的な1次メモリを備えた細調整の大型言語モデル(LLM)は、バックプロパゲーションプロセスによって禁止的なGPUを必要とする。
最近の研究は微調整のためのゼロオーダーに変化しており、2つのフォワードパスを使用することでかなりのメモリを節約している。
本研究では, 対角的ヘッセン情報に基づくゼロ階軌道であるHiZOOを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:57:22 GMT)
Hierarchical Mixture of Experts: Generalizable Learning for High-Level Synthesis [43.6] 高レベル合成(HLS)は、FPGA(Field Programmable Gate Array)の設計において広く使われているツールである。
よりドメイン一般化可能なモデル構造として, 2段階の階層的エキスパート混合(MoE)を提案する。
低レベル MoE では、プログラムの3つの自然な粒度(ノード、基本ブロック、グラフ)に MoE を適用する。
ハイレベルなMoEは、最終決定のために3つの粒度を集約することを学ぶ。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:07:28 GMT)
Knowledge Graph Retrieval-Augmented Generation for LLM-based Recommendation [43.5] 大規模言語モデル(LLM)は目覚ましい成果をもたらし、次世代のレコメンデーターシステムの開発の可能性を示している。
LLMは、LLMのバックボーン、特に幻覚の問題、最新のドメイン固有の知識の欠如に起因する固有の制限に直面している。
本稿では,知識グラフ(KG)から高品質かつ最新の構造情報を検索して,推薦を増強することを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:16:23 GMT)
DeServe: Towards Affordable Offline LLM Inference via Decentralization [42.9] 本稿では,大規模言語モデル(LLM)推論のための分散型オフラインサービスシステムの設計について述べる。
アイドルGPUリソースを利用することで,提案システムであるDeServeは,LLMへのアクセスを低コストで分散化する。
実験によると、DeServeは既存のサービスシステムのベースラインよりもスループットが6.7x-12.6倍向上している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:10:50 GMT)
RiTTA: Modeling Event Relations in Text-to-Audio Generation [41.4] テキスト・ツー・オーディオ生成モデルにおける音声イベント関係モデリングを体系的に研究する。
本稿では,既存のTTAモデルの音声イベント関係をモデル化する機能を強化するための微調整フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:03:35 GMT)
Generalizable Origin Identification for Text-Guided Image-to-Image Diffusion Models [39.2] テキストインプロンプトに基づく画像の翻訳において,テキスト誘導画像から画像への拡散モデルが優れている。
これは、テキスト誘導画像-画像拡散モデル(ID$2$)の原点識別タスクの導入を動機付けます。
ID$2$の直接的な解決策は、クエリと参照イメージの両方から機能を抽出し比較するために、特別なディープ埋め込みモデルをトレーニングすることである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:34:53 GMT)
CORD: Generalizable Cooperation via Role Diversity [37.8] 我々は,役割多様性,すなわち CORD を通じて一般化可能な協調を可能にする階層的MARL手法を提案する。
CORDのハイレベルコントローラは、制約付きロールエントロピーを最大化することで、ローレベルエージェントにロールを割り当てる。
この制約された目的は、合理的な役割割り当てを可能にする役割の因果的影響と、一貫性のない非冗長な役割クラスタを生み出す役割の不均一性に分解できることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:53:38 GMT)
MPT: A Large-scale Multi-Phytoplankton Tracking Benchmark [36.4] 本稿では,様々な背景情報と観測時の動作変化を網羅するベンチマークデータセットであるMultiple Phytoplankton Tracking (MPT)を提案する。
このデータセットには27種類の植物プランクトンと動物プランクトンが含まれ、14種類の背景があり、多様な複雑な水中環境をシミュレートしている。
標準特徴抽出器の出力残量を予測するための追加特徴抽出器を導入し、抽出器の異なる層の特徴に基づいて多スケールのフレーム間類似性を計算した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:58:00 GMT)
Diffusion Model-Based Data Synthesis Aided Federated Semi-Supervised Learning [33.6] フェデレートされた半教師付き学習(FSSL)は、主にクライアント間でラベル付きデータの不足と、クライアント間でのデータの非独立性と同一の分散(非IID)という2つの要因によって挑戦されている。
本稿では,拡散モデルを用いたデータ合成支援FSSL (DDSA-FSSL) を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:38:15 GMT)
Residual connections provably mitigate oversmoothing in graph neural networks [33.5] グラフニューラルネットワーク(GNN)は、グラフ構造化データの処理と表現において、目覚ましい成功を収めた。
しかし、"oversmoothing"として知られる重要な課題が続き、表現的特徴が深いGNNではほとんど区別できないようになる。
本研究では,GNNの残差と非残差を考慮した過平滑化速度を解析する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:14:11 GMT)
WalkVLM:Aid Visually Impaired People Walking by Vision Language Model [30.3] 世界中で約2億人が視覚障害に悩まされている。
近年,視覚言語モデル (VLM) の進歩に伴い,この領域を改善するためにVLMを用いた研究が盛んに行われている。
ブラインドウォーキングタスクでは、リアルタイムのストリーミングビデオ解析を行い、簡潔で情報に富むリマインダーを生成する必要がある。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:21:58 GMT)
On Expressivity of Height in Neural Networks [29.5] 私たちは、幅、深さ、高さが特徴のニューラルネットワークを3Dネットワークと呼んでいる。
我々は、同じ数のニューロンとパラメータを与えられた場合、幅$W$、深さ$K$、高さ$H$の3D ReLUネットワークは、幅$Htimes W$および深さ$K$の2Dネットワークよりも表現力が高いことを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:25:06 GMT)
On LLM-Enhanced Mixed-Type Data Imputation with High-Order Message Passing [29.1] データ計算の欠如は、データセットの完全性を達成するために、生データセットの欠落した値をインプットすることを目的としている。
1)数値データと分類データしかサポートしていないか,2)不満足な性能を示す。
We propose UnIMP, a Unified IMPutation framework that leverageing LLM and high-order message passing to enhance the imputation of mixed-type data。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:05:44 GMT)
A Survey of Recent Backdoor Attacks and Defenses in Large Language Models [28.6] 人間の言語理解と複雑な問題解決のギャップを埋める大規模言語モデル(LLM)は、いくつかのNLPタスクで最先端のパフォーマンスを達成する。
研究は、言語モデルは潜在的なセキュリティ上の脆弱性、特にバックドア攻撃の影響を受けやすいことを実証している。
本稿では, 微調整手法に着目し, LLMのバックドア攻撃に対する新たな視点について述べる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:39:47 GMT)
Bridge the Inference Gaps of Neural Processes via Expectation Maximization [27.9] ニューラルプロセス (NP) は関数上の分布を学習するための計算効率の良いモデルのファミリーである。
本稿では,期待フレームワーク内でのメタデータセットのログライクなターゲットのサロゲート目的を提案する。
結果のモデルは、自己正規化重み付きニューラルネットワーク(SI-NP)と呼ばれ、より正確な機能前処理を学習することができる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:28:21 GMT)
OpenHumanVid: A Large-Scale High-Quality Dataset for Enhancing Human-Centric Video Generation [27.5] 大規模で高品質な人中心ビデオデータセットOpenHumanVidを紹介する。
まず、大規模で高品質なデータセットを組み込むことによって、生成された人間のビデオの評価基準を大幅に強化する。
第二に、高品質のビデオ出力を生成するためには、人間の外見、人間の動き、顔の動きとテキストの効果的なアライメントが不可欠である。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:16:56 GMT)
Prepending or Cross-Attention for Speech-to-Text? An Empirical Comparison [27.4] 音声エンコーダが高密度特徴予測(DFP)に与える影響について検討する。
DFPとクロスアテンションをさまざまな構成で比較する。
DFPは横断的注意よりも有病率が高いが,DFPの優位性は明らかではない。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:14:16 GMT)
StreamFP: Learnable Fingerprint-guided Data Selection for Efficient Stream Learning [26.8] ストリーム学習(SL)は、継続的に進化するデータに迅速に適応できるモデルを必要とする。
従来のルールベースのデータ選択手法は、ストリーミングデータの動的な性質に対応するのに苦労する。
データ分散の変化に対処する最近のアプローチは、速いペースの環境での有効性を制限する課題に直面している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:29:42 GMT)
A Practical Examination of AI-Generated Text Detectors for Large Language Models [25.9] 本稿では,いくつかの一般的な機械生成コンテンツ検出装置について批判的に評価する。
我々は、敵攻撃をシミュレートするために様々なプロンプト戦略を採用し、中程度の努力でも検出を著しく回避できることを示した。
以上の結果から, トレーニングとゼロショット検出は高い感度を維持するのに苦慮し, 正の正の正の率を達成することが示唆された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:26:15 GMT)
S-INF: Towards Realistic Indoor Scene Synthesis via Scene Implicit Neural Field [25.5] 室内シーン合成のためのS-INF(Scene Implicit Neural Field)を導入し,マルチモーダルな関係の有意義な表現を学習することを目的とした。
S-INFは、マルチモーダルな関係をシーンレイアウトの関係と詳細なオブジェクト関係に切り離し、後に暗黙のニューラルネットワークを通してそれらを融合させる。
室内シーンの異なるタイプの合成において、最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:42:33 GMT)
Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks [25.4] ポートレートアニメーションのための予め訓練されたトランスフォーマーに基づくビデオ生成モデルの最初の応用について紹介する。
提案手法は,ベンチマーク実験と新たに提案したワイルドデータセットを用いて検証する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:49:09 GMT)
CPT: Efficient Deep Neural Network Training via Cyclic Precision [24.2] DNNの精度は、DNNトレーニング中の学習率と同じような効果がある可能性があると推測する。
本稿では,2つの境界値の精度を変化させるサイクル精度訓練(CPT)を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:43:40 GMT)
Nighttime Person Re-Identification via Collaborative Enhancement Network with Multi-domain Learning [24.1] 本稿では、夜間のReIDのための並列フレームワークにおいて、多レベル特徴相互作用を行うCENetという新しい協調型拡張ネットワークを提案する。
特に,CENetの設計した並列構造は,リライティング画像の品質がReID性能に与える影響を回避するだけでなく,画像リライティングと人物ReIDタスクの協調関係を掘り下げることを可能にする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:50:09 GMT)
2-in-1 Accelerator: Enabling Random Precision Switch for Winning Both Adversarial Robustness and Efficiency [23.5] DNN加速器の対向的堅牢性と効率の両立を目的とした2-in-1加速器を提案する。
具体的には、まず、DNNを敵攻撃から効果的に防御できる乱精度スイッチ(RPS)アルゴリズムを提案する。
さらに,(1)新しい精度・スケール可能なユニットアーキテクチャを特徴とする,新しい精度・スケール可能なアクセラレーションを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:40:39 GMT)
DepthShrinker: A New Compression Paradigm Towards Boosting Real-Hardware Efficiency of Compact Neural Networks [23.5] ハードウェアフレンドリーなコンパクトネットワークを開発するために,DepthShrinkerというフレームワークを提案する。
我々のフレームワークは、最先端のDNNや圧縮技術より優れたハードウェアフレンドリーなコンパクトネットワークを提供する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:32:03 GMT)
Mixture of Experts Meets Prompt-Based Continual Learning [23.4] 本稿では、連続学習におけるそのような利点をいかにもたらすかを明らかにするための理論的分析を行う。
我々は,新しいタスク固有の専門家の追加として,プレフィックスチューニングに関する新しい視点を提供し,新しいゲーティング機構の設計を刺激する。
NoRGaの有効性は、様々なベンチマークや事前学習パラダイムで理論的にも経験的にも裏付けられている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:04:50 GMT)
Auto-CARD: Efficient and Robust Codec Avatar Driving for Real-time Mobile Telepresence [23.2] 我々は,Codec Avatarのリアルタイムかつ堅牢な運転を可能にするAuto-CARDというフレームワークを提案する。
評価のために、リアルタイムのCodec Avatar駆動設定におけるAuto-CARDフレームワークの有効性を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:29:37 GMT)
Losses Can Be Blessings: Routing Self-Supervised Speech Representations Towards Efficient Multilingual and Multitask Speech Processing [23.1] リッチな音声表現のための自己教師型学習は、低リソース自動音声認識(ASR)やその他の音声処理タスクにおいて経験的な成功を収めた。
しかし、高度な音声SSLモデルはますます大きくなり、デバイス上のリソースは限られている。
本研究の目的は,提案したS$3$-フレームワークによる効率向上と過度なオーバーフィッティングの両面において,音声SSLモデルの実用的利用を向上させることである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:31:16 GMT)
Modulating State Space Model with SlowFast Framework for Compute-Efficient Ultra Low-Latency Speech Enhancement [23.1] 深層学習に基づく音声強調(SE)手法は、低レイテンシ要求を満たす必要がある場合、しばしば重要な計算課題に直面する。
本稿では,低遅延化が必要な場合の計算コストの削減を目的としたSlowFastフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 10:59:32 GMT)
OpenSlot: Mixed Open-Set Recognition with Object-Centric Learning [21.9] オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか含まないと仮定するが、未知のテストセットは既知のテストセットから切り離されたラベル空間を持つ。
本稿では,テスト画像が複数のクラスセマンティクスを含む混合OSR問題について紹介する。
本稿では,多様なクラスセマンティクスを表現し,クラス予測を生成するためにスロット機能を利用する,オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:46:09 GMT)
CorrFill: Enhancing Faithfulness in Reference-based Inpainting with Correspondence Guidance in Diffusion Models [21.8] 基準画像と対象画像との幾何的相関の認識を高めるために設計されたトレーニングフリーモジュールであるCorrFillを提案する。
実験の結果,CorrFillは複数のベースライン拡散法の性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:31:01 GMT)
PrivDPR: Synthetic Graph Publishing with Deep PageRank under Differential Privacy [21.8] グラフ合成のための新しいプライバシー保護型ディープページランクであるPrivDPRを設計する。
特に,学習中の特定の重みに対する勾配に雑音を加えることでDPを実現する。
PrivDPRが生成した合成グラフがノードレベルの差分プライバシーを満たすことを証明している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:19:21 GMT)
TeeRollup: Efficient Rollup Design Using Heterogeneous TEE [21.7] 本稿では,TEERollupについて紹介する。Trusted Execution Environments(TEEs)を利用して,低ガスコストと短時間の離脱遅延を実現する,効率的なロールアッププロトコルである。
TEERollupは、TEEの完全性と可用性が損なわれる可能性がある、実用的な脅威モデルを採用している。
TEERollupはゼロ知識ロールアップ(ZKロールアップ)よりも優れており、オンチェーン検証コストは約86%削減され、離脱遅延は数分である。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:23:22 GMT)
Hyperbolic Contrastive Learning for Hierarchical 3D Point Cloud Embedding [21.5] 双曲型マルチモーダルコントラスト事前学習における3Dポイントクラウドのモダリティを拡張する。
また,階層型3次元埋め込み学習のための細分化,モダリティギャップ,アライメントレギュレータについても検討する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:27:18 GMT)
Automatically Learning a Precise Measurement for Fault Diagnosis Capability of Test Cases [21.3] 本稿では,強化学習によるテストのFDC値の予測を行う,結果に依存しない新たな指標 RLFDC を提案する。
特に、FL結果を報奨信号として扱い、直接FLフィードバックでFDC予測モデルを訓練し、より正確な測定結果を自動的に学習する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:16:49 GMT)
GPT4AIGChip: Towards Next-Generation AI Accelerator Design Automation via Large Language Models [20.8] GPT4AIGChipは、人間の自然言語を活用してAIアクセラレータ設計を民主化するためのフレームワークである。
この研究は、LLMを利用した自動AIアクセラレータ生成のための効果的なパイプラインを初めて実証したものだ。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:25:20 GMT)
A3C-S: Automated Agent Accelerator Co-Search towards Efficient Deep Reinforcement Learning [19.8] 本稿では,最適に整合したDRLエージェントとアクセルを自動的に共同検索する,A3C-S(Automated Agent Accelerator Co-Search)フレームワークを提案する。
我々の実験は、最先端技術よりもA3C-Sの方が優れていることを一貫して検証している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:42:13 GMT)
Attribute-Based Robotic Grasping with Data-Efficient Adaptation [19.7] 属性に基づくロボットグルーピングを学習するエンド・ツー・エンドのエンコーダ・デコーダネットワークを提案する。
提案手法は,未知のオブジェクトに対して,成功率を81%以上獲得する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:37:17 GMT)
Enhanced Atom-by-Atom Assembly of Defect-Free Two-Dimensional Mixed-Species Atomic Arrays [19.4] 我々は120種の混合原子を持つ欠陥のない原子配列を作る。
改良されたアルゴリズムは、他の原子種の組み合わせにも拡張できると期待されている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 10:13:52 GMT)
NeRFool: Uncovering the Vulnerability of Generalizable Neural Radiance Fields against Adversarial Perturbations [19.2] Generalizable Neural Radiance Fields (GNeRF) は、新しいビュー合成のための最も有望な現実のソリューションの1つである。
我々は、GNeRFの対角的堅牢性を理解するための最初の研究であるNeRFoolについて述べる。
我々はさらに、GNeRFを広範囲のターゲットビューで効果的に攻撃できる2つの技術を統合するNeRFool+を開発した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:28:40 GMT)
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization [19.0] 光音響イメージング(PAI)は、再構成された結果の品質を低下させる固有の限界に悩まされる。
本稿では,2次元と3次元のPAI再構成結果に対する新たな最適化手法を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:25:27 GMT)
V2X-DGPE: Addressing Domain Gaps and Pose Errors for Robust Collaborative 3D Object Detection [18.7] V2X-DGPEは高精度で堅牢なV2X特徴レベルの協調認識フレームワークである。
提案手法は既存の手法より優れ、最先端検出性能を実現する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:28:55 GMT)
Robust Tickets Can Transfer Better: Drawing More Transferable Subnetworks in Transfer Learning [18.6] Transfer Learningは、ソースタスクとリッチデータで事前訓練されたディープニューラルネットワーク(DNN)の機能表現を活用して、下流タスクの微調整を強化する。
我々は,ロバストなチケットがより優れた転送を可能にすること,すなわち,適切に誘導された敵のロバスト性によって引き起こされたワークが,バニラ宝くじよりも優れた転送性を得ることができることの発見を活用する新しい転送学習パイプラインを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:27:05 GMT)
Training-Free Point Cloud Recognition Based on Geometric and Semantic Information Fusion [18.6] 幾何学的特徴と意味的特徴を統合した学習自由な手法を提案する。
提案手法は,主要なベンチマークデータセットにおいて,既存の最先端のトレーニングフリーアプローチよりも優れている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:45:30 GMT)
MagicFace: High-Fidelity Facial Expression Editing with Action-Unit Control [17.9] 同一人物からの顔行動単位(AU)の相対的変動を制御し,表情編集の課題に対処する。
これにより、特定の人の表現をきめ細かな、連続的で解釈可能な方法で編集することができる。
MagicFaceをダブしたモデルのキーとなるのは、AUのバリエーションとIDエンコーダを条件とした拡散モデルです。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 11:28:49 GMT)
Gen-NeRF: Efficient and Generalizable Neural Radiance Fields via Algorithm-Hardware Co-Design [17.3] Gen-NeRFは、一般化可能なNeRFアクセラレーションに特化したアルゴリズムハードウェアの共同設計フレームワークである。
アルゴリズム側では、Gen-NeRFは粗いthen-focusサンプリング戦略を統合する。
ハードウェア面では、Gen-NeRFはデータ再利用の機会を最大化するためのアクセラレーターマイクロアーキテクチャを強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:21:45 GMT)
DiffGraph: Heterogeneous Graph Diffusion Model [16.7] グラフニューラルネットワーク(GNN)は、グラフ構造化データモデリングに革命をもたらしたが、従来のGNNは、現実のシナリオで一般的な複雑な異種構造に苦戦している。
異種グラフ拡散モデル(DiffGraph)は,革新的なクロスビュー・デノベーション・ストラテジーを導入した先駆的なフレームワークである。
中心となるDiffGraphは、高度な遅延不均一グラフ拡散機構を備え、優れたノイズ管理のための新しい前方および後方拡散プロセスを実装している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 15:30:48 GMT)
Drawing Robust Scratch Tickets: Subnetworks with Inborn Robustness Are Found within Randomly Initialized Networks [16.6] 一般的な宝くじ券の仮説とは別として、元の密集ネットワークや特定されたRTTをトレーニングする必要はない。
同一の高密度ネットワークから引き出された疎度比の異なるRTT間の逆転送性について検討した。
本稿では,Random RST Switch (R2S) 技術を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:38:40 GMT)
Plasma-CycleGAN: Plasma Biomarker-Guided MRI to PET Cross-modality Translation Using Conditional CycleGAN [16.5] MRIとPET画像の相互変換は、これらのモダリティの根底にある異なるメカニズムのために困難である。
血液ベースのバイオマーカー(BBBM)は、患者と脳アミロイドレベルを特定することでアルツハイマー病(AD)の検出に革命をもたらしている。
本稿では,CycleGANをベースとした新しい生成モデルであるPDP-CycleGANを提案し,BBBMを条件としてMRIからPET画像を合成する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:20:25 GMT)
Patch-Fool: Are Vision Transformers Always Robust Against Adversarial Perturbations? [16.0] ビジョントランスフォーマー(ViT)は、ビジョンタスクにおける記録的なパフォーマンスのおかげで、ニューラルアーキテクチャ設計の新しい波を最近開始した。
最近の研究によると、ViTsは畳み込みニューラルネットワーク(CNN)と比較して敵の攻撃に対してより堅牢である。
本稿では,Patch-Foolと呼ばれる攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:37:30 GMT)
Auto-NBA: Efficient and Effective Search Over the Joint Space of Networks, Bitwidths, and Accelerators [15.5] 本稿では,ネットワーク,ビット幅,アクセラレータを共同で検索するためのAuto-NBAというフレームワークを提案する。
本フレームワークは,各ターゲットデータセットとアクセラレーション仕様の巨大な共同設計空間内で,最適設計を効率的にローカライズする。
われわれのAuto-NBAは、ネットワークとアクセラレーターが一貫して最先端の設計を上回っている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:30:36 GMT)
What Kind of Visual Tokens Do We Need? Training-free Visual Token Pruning for Multi-modal Large Language Models from the Perspective of Graph [15.4] 本稿では,G-Prune と呼ばれる学習自由な視覚トークンプルーニングのためのグラフベースの手法を提案する。
G-Pruneは視覚トークンをノードとみなし、それらの意味的類似性に基づいて接続を構築する。
実験結果から,G-Pruneは粗いタスクと微粒なタスクの両方で高い性能を維持しながら,計算オーバーヘッドを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:14:42 GMT)
Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning Agents via Neural Architecture Search [15.4] 本稿では,様々なタスクに対して最適なDRLエージェントを自動検索するAuto-Agent-Distiller (A2D) フレームワークを提案する。
我々は,バニラNASがDRLトレーニング安定性のばらつきが大きいため,最適なエージェントの探索に容易に失敗できることを実証した。
そこで我々は,教師エージェントのアクターと評論家の両方から知識を蒸留し,探索プロセスを安定させ,探索エージェントの最適性を向上する新しい蒸留機構を開発する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:46:53 GMT)
Mitigating Knowledge Conflicts in Language Model-Driven Question Answering [15.3] 2つの基本的な知識源は、文書ベースの質問応答と文書要約システムにおいて重要な役割を担っている。
近年の研究では、モデル固有の知識とトレーニングデータにおける基礎的真理解との間に不整合が存在する場合、システムは推論中に問題のある振る舞いを示す可能性があるという重要な課題が明らかにされている。
本研究は,ソース入力と出力との明示的な接続を構築することで,幻覚を最小化する手法を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:16:31 GMT)
Guiding Medical Vision-Language Models with Explicit Visual Prompts: Framework Design and Comprehensive Exploration of Prompt Variations [15.1] 医用視覚言語モデルのための視覚的プロンプト生成および微調整フレームワークであるMedVPを紹介する。
我々は、複数の医療用VQAデータセットにおいて、最新の最先端の大規模モデルを上回る結果を得た。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 21:23:36 GMT)
Table as Thought: Exploring Structured Thoughts in LLM Reasoning [14.9] 大規模言語モデルの推論能力は、思考過程を整理する手法の恩恵を受ける。
既存のアプローチは、主に思考の順序を整理することに焦点を当て、個々の思考ステップの構造を過小評価している。
人間の思考に関する認知神経科学理論にインスパイアされたフレームワークであるテーブル・アズ・シント(Table as Thought)を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:58:06 GMT)
Chiral Virasoro algebra from a single wavefunction [14.7] エッジが純粋にキラルであるとき、低エネルギーエッジ励起のヒルベルト空間は単一のビラソロ代数の表現を形成することができる。
単一基底状態波動関数からビラソロ代数の生成元を体系的に抽出する手法を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:05:41 GMT)
Accounting for Focus Ambiguity in Visual Questions [14.7] VQ-FocusAmbiguityは最初のVQAデータセットで、答えに到達するのに必要な質問で記述された各領域を視覚的にグラウンド化する。
視覚的疑問があいまいさに焦点を合わせているかどうかを認識し、画像内のすべての可視的焦点領域をローカライズする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:36:11 GMT)
Optimizing Edge AI: A Comprehensive Survey on Data, Model, and System Strategies [14.1] 5Gとエッジコンピューティングハードウェアは、人工知能に大きな変化をもたらした。
リソース制約のあるエッジデバイスに最先端のAIモデルをデプロイすることは、大きな課題に直面している。
本稿では,効率的かつ信頼性の高いエッジAIデプロイメントのための最適化トライアドを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:17:48 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8] 非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。
我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。
我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:48:29 GMT)
Who Wrote This? Zero-Shot Statistical Tests for LLM-Generated Text Detection using Finite Sample Concentration Inequalities [13.7] その結果,本試験におけるI型およびII型エラーはテキスト長で指数関数的に減少することがわかった。
文字列が$A$で生成される場合、$A$以下の文字列の対数複雑度は、文字列長の指数的に小さい確率を除いて、$A$以下の文字列の平均エントロピーに収束することを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 23:51:43 GMT)
TDM: Temporally-Consistent Diffusion Model for All-in-One Real-World Video Restoration [13.5] 本手法は,単一の統一モデルを用いて,様々な種類の映像劣化を復元することができる。
本手法は,複数のアプリケーションにまたがる映像品質を向上する統合ソリューションを提供することにより,映像復元タスクを高速化する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:15:37 GMT)
Explicit and data-Efficient Encoding via Gradient Flow [13.4] 遅延空間にデータを直接エンコードするために勾配流を用いたデコーダのみの手法を提案する。
共役法を用いてデコーダを訓練し、コストのかかる積分を最小限の精度で回避できることを示す。
この研究は、正確で効率的なエンコーディングが不可欠である科学への機械学習の統合の道を開いた。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:09:44 GMT)
Optimal discrimination of quantum sequences [13.4] 量子情報理論の鍵となる概念は、量子システムに符号化された情報にアクセスするためには、システムが持つ可能性のあるいくつかの状態の区別が必要であるということである。
本稿では、与えられたシーケンスのメンバがアンサンブルから秘密に、あるいは異なるアンサンブルから独立して描画された場合、そのシーケンスの個々のメンバの固定された局所的な測定により、最適な成功確率が達成可能であることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:03:42 GMT)
SMDP-Based Dynamic Batching for Improving Responsiveness and Energy Efficiency of Batch Services [12.6] 並列コンピューティングリソースは、より大きなバッチサイズで動作する場合の計算効率とエネルギー効率が向上する。
オンラインサービスの世界では、より大きなバッチサイズを採用することで、レスポンス時間が長くなる可能性がある。
本稿では,レイテンシと効率を微妙にバランスさせる動的スキームを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:14:09 GMT)
Textual and Visual Prompt Fusion for Image Editing via Step-Wise Alignment [10.8] 本研究では,生成した視覚的参照とテキストガイダンスを融合したフレームワークを提案する。
私たちのフレームワークは、小さなニューラルネットワークのみを使用して、テキストプロンプトによって直感的に駆動される多様なコンテンツや属性を制御する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:24:37 GMT)
On the Low-Complexity of Fair Learning for Combinatorial Multi-Armed Bandit [10.1] Combinatorial Multi-Armed Bandit with fairness constraintsは、複数のアームがスーパーアームを形成するフレームワークである。
我々は、いわゆるピック・アンド・コンペア・アプローチに基づく、低複雑さなフェアラーニングアルゴリズムを開発した。
我々の理論的な証明は、この低複雑さ設計は、公正さと後悔したパフォーマンスをわずかに犠牲にするだけであることを示している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:17:21 GMT)
Unsupervised Class Generation to Expand Semantic Segmentation Datasets [9.1] 基礎となるアルゴリズムを変更することなく、トレーニングデータに新しいサンプルを導入する。
モデルが新しいクラスをセグメンテーションする方法を効果的に学べるだけでなく、平均性能は51% IoUであり、既存のクラスに対するエラーを減らすことができることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 11:53:13 GMT)
AdaSkip: Adaptive Sublayer Skipping for Accelerating Long-Context LLM Inference [9.0] レイヤワイズ・スキップ法は有望な最適化であるが、長文推論では滅多に探索されない。
sysnameは、長文推論用に特別に設計された適応的なサブレイヤスキップ手法である。
sysnameはオンザフライの類似性情報を活用することで、重要でないレイヤを適応的に識別する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:01:30 GMT)
SR-Reward: Taking The Path More Traveled [8.8] オフラインでのデモンストレーションから報酬関数を直接学習する新しい手法を提案する。
従来の逆強化学習(IRL)とは異なり,本手法は学習者の方針から報酬関数を分離する。
textitSR-Rewardと呼ばれる我々の報酬関数は、後継表現(SR)を利用して、実証ポリシーと遷移ダイナミクスの下で期待される将来の状態の訪問に基づいて状態をエンコードする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:21:10 GMT)
Survey on Question Answering over Visually Rich Documents: Methods, Challenges, and Trends [8.7] Visuallyrich Document Understanding (VrDU)にLarge Language Models (LLM)を使用すると、理解と生成の両方を必要とするタスクのパフォーマンスが大幅に向上する。
この調査では、LLMs関数によって強化されたVrDUモデルがどのように説明され、VrD機能をLLMに統合し、重要な課題を強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:45:24 GMT)
A Robotics-Inspired Scanpath Model Reveals the Importance of Uncertainty and Semantic Object Cues for Gaze Guidance in Dynamic Scenes [8.6] 本稿では,物体のセグメンテーションと視線挙動を相互接続的にシミュレーションする計算モデルを提案する。
このモデルでは,サスカディック・モーメントや事前サカディック・アテンションなどの拡張が可能であることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 21:19:54 GMT)
Taming Feed-forward Reconstruction Models as Latent Encoders for 3D Generative Models [7.5] 最近のAIベースの3Dコンテンツ作成は、フィードフォワード画像から3Dへの再構成アプローチと、2Dまたは3D監視でトレーニングされた3D生成モデルという、2つの経路に沿って大きく進化している。
本稿では,既存のフィードフォワード再構成手法が3次元生成モデルのトレーニングに有効な潜伏エンコーダとして有効であることを示し,これら2つのパラダイムをブリッジする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:27:57 GMT)
Generating Multimodal Images with GAN: Integrating Text, Image, and Style [7.5] GAN(Generative Adversarial Networks)に基づくマルチモーダル画像生成手法を提案する。
この方法は、テキストエンコーダ、画像特徴抽出器、スタイル統合モジュールの設計を含む。
実験結果から,提案手法は複数の公開データセットにまたがって,高い明瞭度と一貫性を有する画像を生成することがわかった。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:51:28 GMT)
Optimization and Application of Cloud-based Deep Learning Architecture for Multi-Source Data Prediction [7.4] 本研究では,早期糖尿病予測のためのクラウドベースのディープラーニングシステムを開発した。
予測に基づく早期介入は、ターゲット人口の37.5%の糖尿病罹患率を減少させる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:29:01 GMT)
Understanding How Nonlinear Layers Create Linearly Separable Features for Low-Dimensional Data [7.0] ディープニューラルネットワークは、様々な分類タスクで顕著な成功を収めている。
最近の実証研究により、ディープネットワークはクラス間で線形に分離可能な特徴を学習することが示されている。
この研究は、経験的観測と非線形ネットワークの分離能力の理論的理解のギャップを埋めるものである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:43:21 GMT)
Adaptive Local Neighborhood-based Neural Networks for MR Image Reconstruction from Undersampled Data [6.8] 近年の研究では,少ないサンプルのk空間データから深層学習を用いたMR画像の再構成が期待されている。
そこで本研究では,ニューラルネットワークを適応的に推定された訓練セットの小さな地区に適合させることにより,再構築時に直接ディープニューラルネットワークを推定する手法を提案する。
提案手法は,大規模データセットおよび他のスキャン適応手法を用いて世界規模で訓練されたモデルと比較して,高品質な再構成を実現することを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:04:11 GMT)
Molecule-dynamic-based Aging Clock and Aging Roadmap Forecast with Sundial [6.8] サンディアル出身の速い個体は、監督された老化時計から同定された個体よりも病気のリスクが高い。
このフレームワークは、年齢や性別に特有な老化ダイナミクスや、より高速で健康な老化パスなど、重要なトピックを探求するための新たな道を開く。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:33:38 GMT)
Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey [6.7] VLM(Multimodal Vision Language Models)は、コンピュータビジョンと自然言語処理の交差点において、トランスフォーメーション技術として登場した。
VLMは、視覚的およびテキスト的データに対して強力な推論と理解能力を示し、ゼロショット分類において古典的な単一モダリティ視覚モデルを上回る。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:59:33 GMT)
KD-MSLRT: Lightweight Sign Language Recognition Model Based on Mediapipe and 3D to 1D Knowledge Distillation [6.7] 本稿では,3次元から1次元へのクロスモーダル多知識蒸留手法と,新しいエンドツーエンドのテキスト修正フレームワークを提案する。
PHOENIX14とPHOENIX14Tデータセットのワード誤り率(WER)は最先端のCorrNetと比較して少なくとも1.4%低下する。
また、中国語手話データセットの収集とリリースも行い、専門的な訓練語彙を開発した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 15:59:33 GMT)
Hype-Adjusted Probability Measure for NLP Stock Return Forecasting [6.7] 本論文では,ストックリターンとボラティリティ予測のための自然言語処理(NLP)アプローチの文脈で開発されたHype-Adjusted Probability Measureを紹介する。
コンポーネントとメモリ効果をキャプチャし、動的パラメータを割り当てるために、新しい感情スコア方程式が提示される。
このアプローチは、ニュースの予測価値を分析し改善するための機械学習技術を統合する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:11:26 GMT)
Robust Uplift Modeling with Large-Scale Contexts for Real-time Marketing [6.5] アップリフトモデリングは、対応するユーザを満たすために異なる処理(割引、ボーナスなど)を適用することで、この問題を解決するために提案される。
現実のシナリオでは、オンラインプラットフォーム(例えば、ショートビデオ、ニュース)で利用可能なリッチなコンテキストがあり、アップリフトモデルは各ユーザーにインセンティブを与える必要がある。
リアルタイムマーケティングのための大規模コンテキスト(UMLC)フレームワークを用いたモデルに依存しないロバスト昇降モデリングを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:55:50 GMT)
A ghost mechanism: An analytical model of abrupt learning [6.5] 一次元のシステムでさえ、分岐よりもゴーストポイントを通して突然学習できることを示す。
本モデルは,突発学習のための分岐のない機構を明らかにし,学習力学の安定化における意図的不確実性と冗長性の両方の重要性を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:49:20 GMT)
Explicit vs. Implicit: Investigating Social Bias in Large Language Models through Self-Reflection [5.8] 大規模言語モデル(LLM)は、生成されたコンテンツに様々なバイアスとステレオタイプを示すことが示されている。
本稿では, LLMにおける明示的, 暗黙的な偏見を解明するために, 社会心理学理論に基づく体系的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:08:52 GMT)
Robust Multi-Dimensional Scaling via Accelerated Alternating Projections [5.8] 本稿では,ロバスト多次元(RMDS)問題について考察する。
古典的MDSA理論に着想を得て, 交互投影法を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:28:10 GMT)
DDEvENet: Evidence-based Ensemble Learning for Uncertainty-aware Brain Parcellation Using Diffusion MRI [5.8] EVENetは、拡散MRIを用いた解剖学的脳解析のためのエビデンスベースのエンサンブルニューラルネットワークである。
健常層および臨床集団の異なるデータセットの正確なパーセレーションと不確実性の推定値を得た。
この不確実性評価により,EVENet法は病変症例の異常脳領域の検出に有効であることが示された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:20:29 GMT)
Accurate Crop Yield Estimation of Blueberries using Deep Learning and Smart Drones [5.6] コンピュータビジョンを備えたスマートドローンを用いて、より正確な果実数と収量推定を行うAIパイプラインを提案する。
コアコンポーネントは、YOLOディープラーニングアーキテクチャに基づく2つのオブジェクト検出モデルである。
我々は、異なるサンプリング戦略を用いてブルーベリーフィールドをマップアウトするためのモデルをデプロイする方法を説明します。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:45:29 GMT)
Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning [5.4] 自己監視型学習(SSL) 対照的な学習は、データの不足を軽減できる可能性を示している。
本研究の目的は,PCG分類におけるSSLモデルの性能向上を目的とした,幅広いオーディオベースの拡張と組み合わせの探索と評価である。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:36:39 GMT)
Leverage Staking with Liquid Staking Derivatives (LSDs): Opportunities and Risks [5.2] Proof of Stakeのエコシステムでは、ユーザーはETHをLidoに賭けてstETHを受け取ることができる。
本稿では,stETHを用いたレバレッジ・ステークの形式的枠組みを確立する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:13:26 GMT)
Semantic-guided modeling of spatial relation and object co-occurrence for indoor scene recognition [5.1] SpaCoNetは、セマンティックセグメンテーションによって導かれるオブジェクトの空間的関係と共起を同時にモデル化する。
広範に利用されている3つのシーンデータセットの実験結果から,提案手法の有効性と汎用性を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:23:26 GMT)
Interpretable Load Forecasting via Representation Learning of Geo-distributed Meteorological Factors [5.0] 気象要因 (MF) は, 消費者の電力消費行動に大きな影響を与えるため, 日頭負荷予測において重要である。
地域内の様々な場所で収集されたMFの違いは重要であり、多くの場所から適切なMFを選択することが困難である。
空間的関係を考慮しつつ、地理的に分散したMFを抽出する表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:05:06 GMT)
A Pioneering Neural Network Method for Efficient and Robust Fluid Simulation [4.7] 本研究では,複雑な環境下での流体シミュレーションを効率的かつ堅牢に行うために設計された,最初のニューラルネットワーク手法を提案する。
このモデルは、そのような複雑なシナリオで流体粒子力学を安定にモデル化できる最初のモデルでもある。
既存のニューラルネットワークに基づく流体シミュレーションアルゴリズムと比較して、高速な計算速度を維持しながら精度を大幅に向上させた。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:52:53 GMT)
Optimizing Small Language Models for In-Vehicle Function-Calling [4.1] 本稿では,小型言語モデル(SLM)をエッジデバイスとして車両内の機能呼び出しエージェントとして展開するための総合的アプローチを提案する。
SLMを利用することで、車両制御機構を簡素化し、ユーザエクスペリエンスを向上させる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:32:56 GMT)
Generative AIBIM: An automatic and intelligent structural design pipeline integrating BIM and generative AI [4.1] 本稿では、既存のAIベースのデザインフレームワークを4つの側面から革新する。
まず、提案されたパイプラインは、BIMの適用範囲を広げる。
第2に、生成AI(TGAI)を組み込んだ2段階生成フレームワークは、設計問題の複雑さを単純化するために設計されている。
第3に、TGAIにおけるAIモデルにおいて、物理条件を拡散モデル(DM)に融合させ、新しい物理ベースの条件拡散モデル(PCDM)を構築するパイオニアである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:24:14 GMT)
PANDA -- Paired Anti-hate Narratives Dataset from Asia: Using an LLM-as-a-Judge to Create the First Chinese Counterspeech Dataset [3.8] 現代標準中国語の流行にもかかわらず、中国語の対訳資源は事実上存在しない。
中国本土でヘイトスピーチと戦うことに焦点を当てたコーパスを紹介する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:36:35 GMT)
Fresh-CL: Feature Realignment through Experts on Hypersphere in Continual Learning [3.7] 連続学習におけるハイパーSpHereのエキスパートによる特徴認識(Feature Realignment)という手法を提案する。
超球面上の既定および固定単純な等角的タイトフレーム(ETF)分類器を利用することで,タスク内およびタスク間の特徴分離を改善することができる。
11のデータセットの実験では、最強のベースラインに比べて精度が2%向上した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:20:53 GMT)
AdaMixup: A Dynamic Defense Framework for Membership Inference Attack Mitigation [3.6] メンバーシップ推論攻撃は、ディープラーニングモデルのトレーニングにおいて重要なプライバシー上の懸念として浮上している。
AdaMixupは、モデルのメンバシップ推論攻撃に対する堅牢性を高めるために、適応的なミックスアップ技術を使用している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:21:48 GMT)
Machine learning with tree tensor networks, CP rank constraints, and tensor dropout [3.4] CPランク制約とテンソルドロップアウトを備えたツリーテンソルネットワーク(TTN)が機械学習においてどのように使用できるかを示す。
分岐比が$b=4$の低ランクTTN分類器は、低コストでテストセット精度90.3%に達する。
パラメータの数を減らし、より自由に調整し、オーバーフィッティングを制御し、計算特性を改善し、コストを削減できる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 21:35:30 GMT)
Multi-Objective Large Language Model Unlearning [3.4] グラディエント・アセント(GA)は、対象データ上のモデルの予測確率を減少させるプロアクティブな方法である。
本稿では,多目的大規模言語モデル学習(MOLLM)アルゴリズムを提案する。
実験の結果,MLLM が SOTA GA をベースとした LLM アンラーニング法よりも非ラーニング効果とモデルユーティリティ保存の点で優れていたことが確認された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:27:04 GMT)
Digital Twin Calibration with Model-Based Reinforcement Learning [3.0] 本稿では,デジタルツインの校正をモデルベース強化学習に取り入れた,アクタ・シミュレータと呼ばれる新しい方法論フレームワークを提案する。
提案手法はディジタルツインを共同で校正し,最適制御ポリシーを探索し,モデル誤差を考慮・低減する。
この二重成分アプローチは、最適方針に確実に収束し、バイオ医薬品製造領域に基づく広範な数値実験において、既存の手法よりも優れる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:15:28 GMT)
REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models [3.0] 本稿では,従来のREINFORCEアルゴリズムの拡張版であるREINFORCE++について述べる。
ReINFORCE++は、(1)単純さ、(2)訓練安定性の強化、(3)計算オーバーヘッドの削減の3つの主な目的を達成する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:08:06 GMT)
Easing Optimization Paths: a Circuit Perspective [2.9] グラディエント降下(Gradient descend)は、大規模な人工知能システムの訓練方法である。
メカニスティック・インタプリタビリティによってもたらされるサーキット・パースペクティブを活用することを提案する。
制御された環境で効率的に学習するためのカリキュラムを設計する方法を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:28:54 GMT)
From Images to Detection: Machine Learning for Blood Pattern Classification [2.5] 血痕パターン分析(BPA)は、血痕の大きさ、形状、分布に焦点をあてて、血痕がどのように形成されるかを理解するのに役立つ。
BPAの課題の1つは、銃や衝撃、その他のメカニズムなど、さまざまな種類の血痕を区別することである。
本研究は, 銃創血痕パターンと飛散血痕パターンの鑑別に焦点をあてる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:54:32 GMT)
Financial Named Entity Recognition: How Far Can LLM Go? [2.4] 大規模言語モデル(LLM)は、財務声明や発表、ビジネスニュースの増大から重要な情報の抽出と分析に革命をもたらした。
金融名付きエンティティ認識(NER)問題において,最先端のLCMを体系的に評価し,その手法を推し進める。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:47:21 GMT)
PM-Dedup: Secure Deduplication with Partial Migration from Cloud to Edge Servers [2.3] PM-Dedupは、新しいセキュアなソースベースの重複解法である。
また,データ重複の安全性と効率を高めるために,様々な設計を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:12:23 GMT)
Thinking with Many Minds: Using Large Language Models for Multi-Perspective Problem-Solving [2.1] 複雑な問題解決には、その特異性を保ちながら複数の視点を楽しませる能力が必要である。
多様な視点を具現化したエージェント間の会話をシミュレートする合成検討法を提案する。
このアプローチは戦略的計画、政策立案、紛争解決の約束を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:04:47 GMT)
Majorization-Minimization Dual Stagewise Algorithm for Generalized Lasso [2.1] 本稿では,一般化ラッソ問題の全解経路を効率的に追従するために,一般化最小化二段階法(MM-DUST)アルゴリズムを提案する。
我々は,MM-DUSTの計算複雑性を解析し,近似解経路の一様収束性を確立する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:20:26 GMT)
Path Space Partitioning and Guided Image Sampling for MCMC [2.0] レンダリングアルゴリズムは通常、経路空間上の光経路を統合する。
分割経路空間と分割空間のそれぞれを別個の推定器に統合することは利点があることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:16:32 GMT)
Revelio: A Real-World Screen-Camera Communication System with Visually Imperceptible Data Embedding [2.0] 我々は,OKLAB色空間における時間的フレッカ融合を利用した実世界のスクリーンカメラ通信システムであるRevelioについて述べる。
Revelioは、ノイズ、非同期性、およびスクリーンカメラチャネルの歪みに対して頑健さを維持しながら、視覚的に知覚できないデータ埋め込みを実現する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:05:08 GMT)
RadarNeXt: Real-Time and Reliable 3D Object Detector Based On 4D mmWave Imaging Radar [1.9] RadarNeXtは4D mmWaveのレーダー点雲に基づくリアルタイムで信頼性の高い3Dオブジェクト検出器である。
我々は,RadarNeXtが4D mmWaveレーダに基づく3次元知覚のための新しい,効果的なパラダイムを提供することを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 15:40:46 GMT)
Lorentz-Equivariant Quantum Graph Neural Network for High-Energy Physics [1.9] 現在の量子グラフニューラルネットワーク(GNN)はノイズに対する堅牢性を欠き、しばしば固定対称群によって制約される。
本稿では,LorentzNet における Lorentz Group Equivariant Block モジュールを量子回路で置き換えることにより,性能が著しく向上することを示す。
本研究は, ノイズ耐性ジェットタグ, イベント分類, 広範囲なデータ共有型HEPタスクにおけるローレンツ・EQGNNの即時適用の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:41:31 GMT)
CODEOFCONDUCT at Multilingual Counterspeech Generation: A Context-Aware Model for Robust Counterspeech Generation in Low-Resource Languages [1.9] 本稿では,MCG-COING-2025共有タスクにおいて大きな成功を収めた,頑健な対音声生成のための文脈認識モデルを提案する。
多言語データセットに微調整されたシミュレーションアニーリングアルゴリズムを活用することで、モデルはヘイトスピーチに対する現実的に正確な応答を生成する。
4つの言語で最先端のパフォーマンスを実証し、バスク語で第1位、イタリア語で第2位、英語とスペイン語で第3位にランク付けしました。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:38:15 GMT)
Heterogeneous Graph Pre-training Based Model for Secure and Efficient Prediction of Default Risk Propagation among Bond Issuers [1.7] 本稿では、債券発行企業におけるデフォルトリスクの効率的な予測のための新しい2段階モデルを提案する。
第一段階では、革新的なMasked Autoencoders for Heterogeneous Graph (HGMAE)を用いて、巨大な企業知識グラフの事前トレーニングを行います。
第2段階では、デフォルトのリスク伝搬確率を予測するために、特殊分類器モデルを訓練する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 11:10:16 GMT)
Quantum noise induced nonreciprocity for single photon transport in parity-time symmetric systems [1.7] 我々は、利得と損失を伴う結合光学系において、量子ノイズによる単一光子入力に対する非相互光伝搬を示す。
直接結合した2つの共振器または2つの有限長導波路を平行に結合した2つのパリティ時間(mathcalPT$)対称線形光学系を考える。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:22:11 GMT)
KCNet: An Insect-Inspired Single-Hidden-Layer Neural Network with Randomized Binary Weights for Prediction and Classification Tasks [1.7] 嗅覚入力は、それぞれの匂いの混合物を符号化する脳の触覚ローブによって受信される。
我々は,入力層と隠蔽層との間の疎結合,ランダム化,二重みを含む単一隠れ層ニューラルネットワークKCNetを提案する。
臭気の知覚特性を予測する臭気知覚タスクに対して、KCNetが既存のデータ駆動アプローチより優れていることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:56:41 GMT)
Exploring the Capabilities and Limitations of Large Language Models for Radiation Oncology Decision Support [1.6] 放射線腫瘍学におけるGPT-4の性能を評価する試みは、専用の100点検試験によって行われた。
臨床放射線腫瘍学の幅広い分野におけるGPT-4の性能は,ACR放射線腫瘍学検査(TXIT)により評価された。
AAPM TG-263の報告に従って構造名の再ラベリングのパフォーマンスもベンチマークされ、96%以上の精度を達成した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:57:33 GMT)
tCURLoRA: Tensor CUR Decomposition Based Low-Rank Parameter Adaptation for Medical Image Segmentation [1.3] 伝達学習は、事前訓練されたモデルからの知識を活用することで、目標タスクの性能を大幅に向上させた。
ディープニューラルネットワークのスケールアップに伴って、フル微調整によって、計算とストレージの大幅な課題がもたらされる。
テンソルCUR分解に基づく新しい微調整法であるtCURLoRAを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:25:32 GMT)
Societal Adaptation to Advanced AI [1.3] 先進的なAIシステムからリスクを管理する既存の戦略は、AIシステムの開発方法と拡散方法に影響を与えることに集中することが多い。
我々は、先進的なAIへの社会適応の増大という補完的なアプローチを奨励する。
我々は、AIシステムの潜在的に有害な使用を回避し、防御し、治療する適応的介入を特定するのに役立つ概念的枠組みを導入する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:23:22 GMT)
Vanishing Feature: Diagnosing Model Merging and Beyond [1.2] 結合モデルによる伝搬中に入力誘起特徴が減少する「消滅特徴」現象を同定する。
既存の正規化戦略は、消滅する特徴問題を的確に標的にすることで強化できることを示す。
初期層機能の保存に重点を置いたPFM(Preserve-First Merging')戦略を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:51:11 GMT)
LLMzSzŁ: a comprehensive LLM benchmark for Polish [1.1] この記事では、ポーランド語に関するこの規模での最初の包括的なベンチマークについて紹介する。
これは、ポーランド中央試験委員会のアーカイブから抽出された学術試験と専門試験の両方を含む、ポーランドの国家試験の一貫性のあるコレクションに基づいている。
そのほか、約19万のクローズドエンドの質問で構成されている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:04:46 GMT)
Restart uncertainty relation for monitored quantum dynamics [1.1] モニタリングされた量子力学における再起動の文脈内での時間-エネルギーの不確実性関係を新たに導入する。
我々の研究は、量子計測と力学に関する基本的な側面の理解に寄与している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:01:04 GMT)
Random unitaries in extremely low depth [0.9] 1D線を含む任意の幾何学上のランダム量子回路は、$log n$ 深さで$n$ qubits以上の近似ユニタリな設計をすることができることを証明している。
同様の方法で、1D回路では$textpoly(log n)$ depthで、全接続回路では$textpoly(log log n)$ depthで$textpoly(log log n)$ depthで擬似ランダムユニタリ(PRU)を構築する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 09:19:23 GMT)
Wave packet dynamics in parabolic optical lattices: From Bloch oscillations to long-range dynamical tunneling [0.9] 本稿では,光格子と大域パラボラトラップを組み合わせたパラボラ光学格子における波パケットのダイナミクスについて検討する。
量子状態はセパラトリクスにまたがって混合力学を示すことができることを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:57:02 GMT)
GNSS/GPS Spoofing and Jamming Identification Using Machine Learning and Deep Learning [0.9] グローバルナビゲーション衛星システム(GNSS)は、密封や妨害などの悪意のある脅威に対して脆弱である。
機械学習とディープラーニングの最近の進歩は、検出と緩和戦略を強化するための有望な道を提供する。
本稿では、機械学習、ディープラーニング、コンピュータビジョン技術を通じて、現実世界の課題に取り組むことによって、スプーフィングとジャミングの両方に対処する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:14:43 GMT)
Feature Based Methods in Domain Adaptation for Object Detection: A Review Paper [0.6] ドメイン適応は、異なるデータ分布を持つターゲットドメインにデプロイされた場合、機械学習モデルの性能を向上させることを目的としている。
本総説では, 対人学習, 相違に基づく多分野, 教師学生, アンサンブル, ビジョン言語モデルなど, ドメイン適応のための高度な方法論を考察する。
特に合成ドメインシフトを含むシナリオにおいて、ラベル付きデータへの依存を最小限に抑える戦略に特に注意が払われる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:03:35 GMT)
An Empirical Study of Safetensors' Usage Trends and Developers' Perceptions [0.5] 本稿では,Hugging Face上でのセーフテンソル利用への開発者のシフトについて検討する。
より多くの開発者がセーフテンソルを採用しており、多くのセーフテンソルの採用は既存のモデルの自動変換によって行われています。
しかし、ほとんどの開発者は変換ツールのプルリクエストを無視していることもわかりました。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:04:56 GMT)
Optimization of conveyance of quantum particles by moving potential well [0.4] 本研究では,ポテンシャル井戸内の粒子トラップの搬送を成功させる可能性について検討する。
搬送の実際の動きについては、粒子の移動を加速し、目的地で停止するために減速する必要がある。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 11:09:31 GMT)
Efficient Video-Based ALPR System Using YOLO and Visual Rhythm [0.4] 車両1台あたり1フレームを正確に抽出し,この特異画像からナンバープレート文字を認識できるシステムを提案する。
初期の実験では、この手法が有効であることが示されている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:15:58 GMT)
Setting Standards in Turkish NLP: TR-MMLU for Large Language Model Evaluation [0.3] トルコ語MMLU(TR-MMLU)ベンチマークは、トルコ語における大規模言語モデル(LLM)の言語的および概念的能力を評価するために設計された。
TR-MMLUは、62のセクションにまたがる6200の多重選択質問からなるデータセットから構築され、67の分野にまたがる280000の質問と、トルコの教育システム内の800以上のトピックからなるプールから選択される。
この結果から,トークン化や微調整戦略の影響などの重要な課題が明らかとなり,モデル設計改善の領域が強調された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:42:33 GMT)
iTARGET: Interpretable Tailored Age Regression for Grouped Epigenetic Traits [0.0] そこで本研究では,DNAメチル化パターンから時系列年代を正確に予測する2相アルゴリズムを提案する。
提案手法は予測精度を向上するだけでなく,鍵となる年齢関連CpGサイトを明らかにし,老化率の変化を検出し,CpGサイト間の相互の相互作用を識別する。
実験の結果,本手法は従来のエピジェネティッククロックや機械学習モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 23:06:46 GMT)
When is the Computation of a Feature Attribution Method Tractable? [0.0] SHAP以外の電力指標の計算複雑性について検討する。
電力指標を一定数の期待値評価に単純化できることを示す。
また、特徴部分集合の重要性を定量化する相互作用指標についても検討する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:37:02 GMT)
Validity Arguments For Constructed Response Scoring Using Generative Artificial Intelligence Applications [0.0] ジェネレーティブAIは、従来のAIスコアリングにおける手作り機能に必要な労力を減らすため、特に魅力的である。
我々は,人間の評価,特徴に基づく自然言語処理AIスコアリングエンジン,生成AIを用いたスコアリングシステムに必要な妥当性証拠を比較した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:59:29 GMT)
Trees that can be grown in "too many" ways: A review of Bouch's construction [0.0] 正方格子上の木(Bouch2015)の階層構造について概観し、その根からL!/CL$の異なる方法で成長することができる。
この結果は、2次元以上の量子スピン系の作用素成長に影響を及ぼす。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:41:04 GMT)
Towards a constructive framework for control theory [0.0] 計算の不確実性は、コントローラ合成とシステム解析において明示的に対処すべきである。
建設システムの安定性と安定化、近似最適制御、固有値問題、カラテオドリ軌道、測定可能なセレクタなど、以前の一連の研究の概要が述べられている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 12:07:45 GMT)
The Race to Efficiency: A New Perspective on AI Scaling Laws [0.0] 我々は、古典的なAIスケーリング法則を拡張する時間と効率を意識したフレームワークを導入する。
私たちのモデルでは、継続的な効率向上がなければ、高度なパフォーマンスは何千年ものトレーニングや非現実的な大規模なGPUフリートを必要とする可能性がある。
このレースを効率性にフォーマルにすることで、AIスタック全体の漸進的な改善と、フロントエンドGPU投資のバランスをとるための定量的ロードマップを提供します。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 01:45:32 GMT)
The Integration of Blockchain and Artificial Intelligence for Secure Healthcare Systems [0.0] 多くの保健所は、ビッグデータの分類、保管、交換を容易にするために様々な技術を使っている。
AIでは、データ駆動操作とビッグデータ効率が改善されている。
この研究は、機械学習、弾道学、アクリル学習による応用AIベースのヘルスケアスキームに光を当て、ブロックチェーン構造を異にする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:53:55 GMT)
The Convergence of Blockchain Technology and Islamic Economics: Decentralized Solutions for Shariah-Compliant Finance [0.0] 本稿では、デジタル交換媒体としての暗号通貨の出現を超えて、現在進行中の金融革命を概観する。
この革命の核心は、ブロックチェーンの技術進歩とイスラム経済学の基礎原理に根ざしたパラダイムシフトである。
本稿は、この変化の意義と、世界経済の展望を再形成する可能性を強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 11:45:24 GMT)
The Application of Large Language Models in Recommendation Systems [0.0] 大規模言語モデルは、非構造化データソースへのレコメンデーションフレームワークの利用を可能にする強力なツールである。
本稿では,レコメンデーションシステム,特に電子商取引,ソーシャルメディアプラットフォーム,ストリーミングサービス,教育技術におけるLLMの適用について論じる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:02:23 GMT)
Syntactic Evolution in Language Usage [0.0] この研究は2004年のlogger.com のブログのデータセットを利用しており、構文解析のための英語に焦点を当てている。
本研究は, 言語学, 心理学, コミュニケーション研究に影響を及ぼす可能性があり, 年齢と言語との複雑な関係に光を当てている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 22:27:24 GMT)
Sub-Poissonian Light in a Waveguide Kerr-medium [0.0] チップ上の導波路は、光の非線形光学変換を実装するための新しい媒体である。
光子ノイズ抑制の程度は、波長数メートルの導波路において、100mWの光力を持つ5~15dBの値に達することが示されている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 23:50:49 GMT)
Segmenting Action-Value Functions Over Time-Scales in SARSA via TD($Δ$) [0.0] 本研究では,時間差分分解法であるTD($Delta$)をSARSAアルゴリズムに拡張する。
TD($Delta$)は、アクション値関数を異なる割引係数に関連するコンポーネントに分解することで、いくつかの時間スケールでの学習を容易にする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 03:57:50 GMT)
Secure IAM on AWS with Multi-Account Strategy [0.0] 小さな組織は、セキュアなアーキテクチャを設計するのに十分な人材を持っていないことが多い。
クラウドアーキテクチャを確保するためのマルチアカウント戦略を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:42:27 GMT)
Scaling of contraction costs for entanglement renormalization algorithms including tensor Trotterization and variational Monte Carlo [0.0] テンソルトロッタライゼーションやモンテカルロサンプリングが量子インスパイアされた古典的MERAアルゴリズムに繋がるかどうかを考察する。
アルゴリズム位相図は、エネルギー精度のスケーリングと結合次元のトロッターステップの最適数に依存する最良のMERA法を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 22:17:32 GMT)
Revisiting Compactness for District Plans [0.0] 人口重み付けされた形状ベースのスコアを導入し、形状に基づくスコアと離散的なスコアを補間する正確な感覚を示す。
第2に、形状に基づくコンパクト度スコアを改良したマップのアンサンブルを生成するReComサンプリング手法の修正を導入する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:13:08 GMT)
Resolving the Exploration-Exploitation Dilemma in Evolutionary Algorithms: A Novel Human-Centered Framework [0.0] いわゆる探索・探索ジレンマを解決するために,人間中心の新たな枠組みが提案されている。
従来のアプローチとは異なり、検索プロセスは単一フェーズで妥協されることはない。
制約なし最適化における14のよく知られたベンチマーク問題に対して,その有効性を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 01:06:46 GMT)
Post-Quantum Key Agreement Protocols Based on Modified Matrix-Power Functions over Singular Random Integer Matrix Semirings [0.0] 量子コンピュータによる脅威に対するデジタル通信を確保するには、ポスト量子暗号が不可欠である。
本稿では,標準的なコンピュータ上で容易に実装可能な2つの新しい量子後鍵合意プロトコルを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:01:09 GMT)
Phase Retrieval by Quaternionic Reweighted Amplitude Flow on Image Reconstruction [0.0] 準イオン信号処理は、カラー信号を効率的に管理するための強力なツールを提供する。
そこで我々は,振幅モデルに基づく新しいアルゴリズムを体系的に開発することで,準イオン位相探索問題に対処する。
提案手法は, 最先端手法と比較して, 回復性能と計算効率を著しく向上させる。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 04:09:57 GMT)
On The Causal Network Of Face-selective Regions In Human Brain During Movie Watching [0.0] 我々は,脳の顔選択ネットワークの因果構造を調べるために,M-行列による非循環性グラフを用いた。
以上の結果から,大脳皮質下領域が根治不全を満足する上で重要な役割を担っていることが示唆された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:57:43 GMT)
Mixed state topological order: operator algebraic approach [0.0] 二次元量子スピン系における混合状態の分類問題について検討する。
我々は、近似双対性の混合状態バージョンを満たす各状態に、ブレイドされた$C*$-tensor圏を関連付ける。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 22:45:00 GMT)
Many-body tunneling in a double-well potential [0.0] 本稿では,多体システムにおけるワニエ関数の評価手法を提案する。
非標準のハバード項に対処し、多体力学にそれらの重要な影響を実証する。
この発見は、ツイスト二層グラフェンの超伝導や金属絶縁体転移などの現象に重要な意味を持つ。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:25:55 GMT)
Leveraging Large Language Models and Machine Learning for Smart Contract Vulnerability Detection [0.0] 我々は、モデル性能を比較するために、機械学習アルゴリズムを訓練、テストし、タイプに応じてスマートコントラクトコードを分類する。
我々の研究は、機械学習と大規模言語モデルを組み合わせて、さまざまなスマートコントラクトの脆弱性を検出するリッチで解釈可能なフレームワークを提供します。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 08:32:53 GMT)
LLM Content Moderation and User Satisfaction: Evidence from Response Refusals in Chatbot Arena [0.0] 我々は,新しい細調整RoBERTaモデルを用いて,約5万個のアリーナ応答対を解析した。
コンテンツモデレーションに対する重大な拒絶のペナルティがみられ、ユーザーは倫理に基づく拒絶を好みのLSM応答の約4分の1の頻度で選択する。
これらの結果は、倫理的保護とユーザの満足度をバランスさせるニュアンスド・モデレーション戦略の必要性を強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:36:44 GMT)
High Temperature Superconductivity in the Cuprates: Phenomena from a Theorist's Point of View [0.0] 超伝導遷移温度$T_c$と超伝導状態における金属銅酸塩に関する実験結果の選定について述べる。
これは物理世界のまだ理解されていない部分を強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 18:13:04 GMT)
Guiding Treatment Strategies: The Role of Adjuvant Anti-Her2 Neu Therapy and Skin/Nipple Involvement in Local Recurrence-Free Survival in Breast Cancer Patients [0.0] 本研究では, 因果推論モデルを用いて, 統計因子, 治療, 状況, 結果の因果関係を観察患者データから抽出する方法について検討した。
Duke MRI乳がんデータセットの40以上の特徴を用いて,Adjuvant Anti-Her2 Neu 療法は局所再発のない生存期間を169日延長した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:17:12 GMT)
Graph-Aware Isomorphic Attention for Adaptive Dynamics in Transformers [0.0] 変換器の注意機構をグラフ演算として再構成する。
スパース GIN-Attention はスパース GIN を用いた微調整手法である。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 22:30:21 GMT)
Genuine $k$-partite correlations and entanglement in the ground state of the Dicke model for interacting qubits [0.0] 我々は、qubit-qubit相互作用の存在下でのDickeモデルの相関を計算し、研究する。
我々は、粒子置換下でのモデルの不変性に基づいて、Genuine Multipartite correlations (GMC) を用いる。
相互作用する量子ビットを持つディックモデルを、マグノンの量子場と相互作用する固体のスピンにマッピングし、このモデルの実験的な実現の可能性を示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 21:30:14 GMT)
GDP nowcasting with artificial neural networks: How much does long-term memory matter? [0.0] 我々は、米国経済の四半期GDP成長を予測するために、人工知能ニューラルネットワーク(ANN)を適用した。
5つの異なるANNアーキテクチャのキャスト性能を比較した。
1D CNNとエルマンRNNは、現在のウィンドウの各ステップで8ヶ月の入力シーケンスで最もうまく機能する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:33:26 GMT)
Flat Bands and Compact Localised States: A Carrollian roadmap [0.0] 一次元フェルミオン系の構築において,キャロル対称性が重要であることを示す。
我々はこの理論を、ゼロと有限の化学的ポテンシャルの両方について詳細に分析する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:47:19 GMT)
Fast Mølmer-Sørensen gates in trapped-ion quantum processors with compensated carrier transition [0.0] イオン鎖におけるモルマー-ソレンセンゲートのレーザーパルス形状設計手法を提案する。
高速振動キャリアという用語は、イオンに作用するスピン依存力を効果的に修飾することを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 21:33:24 GMT)
Exploring Secure Machine Learning Through Payload Injection and FGSM Attacks on ResNet-50 [0.0] 本稿では,ResNet-50画像分類モデルのレジリエンスを,敵攻撃と悪意のあるペイロードインジェクションの2つの重要なセキュリティ脅威下で検討する。
モデルはクリーンな画像上で53.33%の精度を達成する。FGSM摂動を受けると、その全体的な精度は変わらないが、誤った予測に対するモデルの自信は顕著に増加する。
これらの発見は、ハイパフォーマンスなニューラルネットワークの脆弱性を浮き彫りにして、セキュリティクリティカルなアプリケーションのためのより堅牢な防御メカニズムを開発する緊急性を強調している。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:21:23 GMT)
Examining the Robustness of Homogeneity Bias to Hyperparameter Adjustments in GPT-4 [0.0] 人間の生成した大量のデータを学習した視覚言語モデルは、しばしば社会的ステレオタイプを再現し増幅する。
我々は,このバイアスがGPT-4の過度パラメータ調整にどのように反応するかを検討する。
黒人や女性は、白人や男性よりも均質に表現されている。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 06:51:49 GMT)
Evaluation of the Code Generation Capabilities of ChatGPT 4: A Comparative Analysis in 19 Programming Languages [0.0] この論文は、19のプログラミング言語にわたるコード生成におけるChatGPT 4の機能について考察する。
ChatGPT 4は全てのタスクの39.67%をうまく解決したが、複雑性が増大すると成功率は大幅に低下した。
このモデルは、全てのプログラミング言語で平均以上の実行効率を示した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 17:17:01 GMT)
Establishing baselines for generative discovery of inorganic crystals [0.0] 生成的人工知能は、材料発見のための有望な道を提供するが、従来の方法に対するその優位性はいまだ不明である。
本研究では、電荷バランスのプロトタイプのランダム列挙と既知の化合物のデータ駆動イオン交換という、2つのベースラインアプローチをベンチマークする。
以上の結果から, イオン交換などの確立された手法は, 安定物質の生成において良好に機能することが示唆された。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:14:59 GMT)
Enhancing Workplace Productivity and Well-being Using AI Agent [0.0] 本稿では、職場生産性と従業員の幸福感を高めるために人工知能(AI)の利用について論じる。
機械学習(ML)技術と神経生物学的データを統合することにより、提案手法は人間の倫理基準に適合する。
このシステムは、従業員からの生体フィードバックを利用して、パーソナライズされたヘルスプロンプトを生成し、支援作業環境を育む。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 20:11:00 GMT)
Distance-Preserving Spatial Representations in Genomic Data [0.0] 単一細胞遺伝子発現データの空間的コンテキストは、多くの下流解析において重要であるが、実際的および技術的制限のため、しばしばアクセスできない。
本稿では、提供された遺伝子発現データに関連する空間座標を再構成できる汎用表現学習・伝達学習フレームワークdp-VAEを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 16:49:17 GMT)
Diabetic Retinopathy Detection Using CNN with Residual Block with DCGAN [0.0] 糖尿病網膜症(英: Diabetic Retinopathy, DR)は、糖尿病による網膜血管の損傷による視覚障害の主要な原因である。
本研究では,残差ブロック構造を持つ畳み込みニューラルネットワーク(CNN)を用いたDR検出システムを提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:48:28 GMT)
Deep Learning-Driven Segmentation of Ischemic Stroke Lesions Using Multi-Channel MRI [0.0] 本研究は,虚血性脳梗塞の分節化のための新しい深層学習法を提案する。
提案アーキテクチャは、DenseNet121をエンコーダとして、デコーダに自己組織化オペレーショナルニューラルネットワーク(ONN)を組み込む。
DWIだけで83.88%、DWIとADCで85.86%、DWI、ADC、eDWIの統合で87.49%のDice similarity Coefficients(DSC)を達成した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:38:06 GMT)
Coupling quantum-like cognition with the neuronal networks within generalized probability theory [0.0] 我々は通信ニューロンのネットワークの量子的表現を開発する。
この表現は標準量子論ではなく、一般化された確率論に基づいている。
この枠組みはてんかんやうつ病などの神経疾患の医学診断における量子的モデリングをサポートする。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 13:39:24 GMT)
Context Aware Lemmatization and Morphological Tagging Method in Turkish [0.0] 単語の語根探索法である補題化モデルと、単語の文法的知識を予測する形態的タグ付けモデルを示す。
提示されたモデルはトルコ語向けに開発され、どちらのモデルも単語の意味を考慮に入れて予測を行う。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:12:43 GMT)
ColorFoil: Investigating Color Blindness in Large Vision and Language Models [0.0] 我々は新しいV&LベンチマークであるColorFoilを紹介する。
私たちはCLIP、VLT、GroupViT、BridgeTowerを含む最先端V&Lモデル7つのモデルを評価した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 19:33:49 GMT)
Can ChatGPT implement finite element models for geotechnical engineering applications? [0.0] 本研究では,一組のプロンプトから地盤工学応用のための有限要素コードを生成するChatGPTの能力を評価する。
不飽和土壌を加水-機械的に結合した3種類の初期境界値問題について検討した。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 05:21:40 GMT)
Bit-bit encoding, optimizer-free training and sub-net initialization: techniques for scalable quantum machine learning [0.0] 入力と出力の両方をバイナリ文字列としてエンコードする量子分類器を提案する。
1つのパラメータが一度に更新されると、古典的な最小値を用いることなく変動量子回路を訓練できることが示される。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 00:35:14 GMT)
Beyond Log-Concavity and Score Regularity: Improved Convergence Bounds for Score-Based Generative Models in W2-distance [0.0] スコアベース生成モデル(SGM)における収束解析のための新しい枠組みを提案する。
データ分布の弱い対数共振器は時間とともに対数共振器へと進化することを示す。
本手法は, スコア関数とその正則性に対する厳密な正則性条件の必要性を回避するものである。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 14:33:27 GMT)
Analysis of Fluorescence Telescope Data Using Machine Learning Methods [0.0] 我々は、小型地上望遠鏡のモデルデータを用いて、機械学習とニューラルネットワークのいくつかの手法を試し、そのデータ内の広範囲な大気シャワーの軌跡を認識する。
また、この手法を他の蛍光望遠鏡に応用する機会についてコメントし、提案手法の性能改善の可能性について概説する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 15:20:09 GMT)
Advancing Neural Network Performance through Emergence-Promoting Initialization Scheme [0.0] 機械学習の創発は、トレーニングデータのスケールと構造から生じる能力の自発的な出現を指す。
我々は、出現の可能性を高めることを目的とした、新しい単純なニューラルネットワーク初期化スキームを導入する。
バッチ正規化の有無にかかわらず,モデル精度とトレーニング速度の両面で大幅に向上したことを示す。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 02:50:10 GMT)
A Toffoli Gate Decomposition via Echoed Cross-Resonance Gates [0.0] 完全に機能的でスケーラブルな量子コンピュータは、科学研究、物質科学、化学、薬物発見など様々な分野を変革することができる。
量子ハードウェアは、デコヒーレンス、ゲート不完全性、制限された量子ビット接続といった課題に直面している。
本稿では,Echoed Cross-Resonance (ECR) ゲートを用いたトフォリゲートの新たな分解法を提案する。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 07:55:32 GMT)
A Comparative Study on Self-Organization in Wireless Sensor Networks [0.0] 無線センサネットワーク(WSN)は、効率的な資源利用と多数のアプリケーションへの扉を開くことができる。
WSNは、その展開領域の環境要因に影響を受けやすく、損傷を被る可能性がある。
これらの課題に対処し、リソースの制約に適応するためには、WSNメカニズムは自己組織化能力を示す必要があります。
論文参考訳(メタデータ) (Sat, 04 Jan 2025 23:03:56 GMT)