Playing for 3D Human Recovery [88.9] 本研究では,自動注釈付けされた3Dグラウンド真理でビデオゲームをプレイすることで,膨大な人間のシーケンスを得る。
具体的には,GTA-Vゲームエンジンで生成された大規模3次元人文データセットであるGTA-Humanをコントリビュートする。
GTA-Humanで訓練された単純なフレームベースのベースラインは、より高度な手法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:20:11 GMT)
SS-GEN: A Social Story Generation Framework with Large Language Models [87.1] 自閉症スペクトラム障害(ASD)を持つ子供たちは、しばしば社会的状況を誤解し、日々のルーチンに参加するのに苦労する。
社会物語は伝統的にこれらの課題に対処するために厳格な制約の下で心理学の専門家によって作られた。
幅広い範囲でリアルタイムでソーシャルストーリーを生成するフレームワークである textbfSS-GEN を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:06:37 GMT)
Fact-and-Reflection (FaR) Improves Confidence Calibration of Large Language Models [84.9] ファクト・アンド・リフレクション(FaR)プロンプトを提案し,LLMキャリブレーションを2ステップで改善する。
実験の結果、FaRはキャリブレーションが大幅に向上し、期待される誤差を23.5%下げた。
FaRは、信頼性の低いシナリオにおいて、言語的に関心を表現できる能力さえも持っています。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:17:32 GMT)
A General Framework for Clustering and Distribution Matching with Bandit Feedback [81.5] 我々は,帯域幅フィードバックを用いたクラスタリングと分散マッチング問題のための一般的なフレームワークを開発する。
誤り確率が$delta$を超えない任意のオンラインアルゴリズムに対して、平均アームプル数に基づいて漸近的でない下界を導出する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:19:12 GMT)
DiffUHaul: A Training-Free Method for Object Dragging in Images [78.9] DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:31:22 GMT)
Toward Understanding BERT-Like Pre-Training for DNA Foundation Models [78.5] 既存のDNA配列の事前訓練方法は、NLPからのBERT事前訓練の直接的な採用に依存している。
マスク境界を連続的に拡張することにより,BERTライクな事前学習作業の難易度を徐々に向上させるRandomMaskという新しい手法を提案する。
RandomMaskは、マシューのエピジェネティック・マーク・予測の相関係数の68.16%を突破し、ベースラインの19.85%を突破した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 09:50:13 GMT)
WaterSeeker: Efficient Detection of Watermarked Segments in Large Documents [65.1] WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
WaterSeekerのローカライゼーション機能は、解釈可能なAI検出システムの開発をサポートする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:45:47 GMT)
Silent Guardian: Protecting Text from Malicious Exploitation by Large Language Models [63.9] 大規模言語モデル(LLM)に対するテキスト保護機構であるSilent Guardianを紹介する。
保護されるテキストを慎重に修正することで、TPEはLDMを誘導して最初にエンドトークンをサンプリングし、直接相互作用を終了させることができる。
本研究では,SGがターゲットテキストを種々の構成で効果的に保護し,保護成功率の約100%を達成できることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 04:35:19 GMT)
A Survey on Mixup Augmentations and Beyond [59.6] 選択したサンプルと対応するラベルを凸的に組み合わせた混合および関連データ混合手法が広く採用されている。
本調査では, 基礎混合法とその応用について概観する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:32:22 GMT)
No Train but Gain: Language Arithmetic for training-free Language Adapters enhancement [59.4] 本稿では,学習不要な後処理が可能な言語演算法を提案する。
提案手法の有効性を,MAD-Xに基づく言語間スキームの3つの下流課題に適用した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:03:14 GMT)
Can OOD Object Detectors Learn from Foundation Models? [56.0] アウト・オブ・ディストリビューション(OOD)オブジェクト検出は、オープンセットのOODデータがないため、難しい課題である。
テキストから画像への生成モデルの最近の進歩に触発されて,大規模オープンセットデータを用いて訓練された生成モデルがOODサンプルを合成する可能性について検討した。
SyncOODは,大規模基盤モデルの能力を活用するシンプルなデータキュレーション手法である。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:28:22 GMT)
CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code [56.0] 大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げた。
CodeIPは、新しいマルチビット透かし技術で、出所の詳細を保存するために追加情報を埋め込む。
5つのプログラミング言語にまたがる実世界のデータセットで実施された実験は、CodeIPの有効性を実証している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:50:38 GMT)
PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.5] 医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:02:25 GMT)
Personalized Federated Learning via Active Sampling [50.5] 本稿では,類似した(あるいは関連する)データジェネレータを逐次同定する手法を提案する。
本手法は,局所的なデータセットを用いて勾配ステップの効果を評価することにより,データ生成の関連性を評価する。
データ生成器が提供する局所的データセットを用いて仮説を更新するために、勾配ステップの適切な一般化により、この手法を非パラメトリックモデルに拡張する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:29:34 GMT)
Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.9] 我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:08:45 GMT)
TF-Attack: Transferable and Fast Adversarial Attacks on Large Language Models [46.3] 従来の敵攻撃法は、大きな言語モデル(LLM)に適用した場合、限られた転送可能性を示し、特に非効率である。
LLMに対するTransferableおよびFast攻撃のための新しいスキームTF-Attackを導入する。
提案手法は従来手法を常に上回り,従来の攻撃戦略の最大20倍の速度向上を実現している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:44:45 GMT)
READoc: A Unified Benchmark for Realistic Document Structured Extraction [44.4] 本稿では,DSEを現実的なタスクとして定義するREADocという新しいベンチマークを紹介する。
READocデータセットは、arXivとGitHubの2,233の多種多様な実世界のドキュメントから派生したものだ。
さらに,最先端DSE手法の統一評価法を開発した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:42:48 GMT)
OneGen: Efficient One-Pass Unified Generation and Retrieval for LLMs [44.1] ワンパス生成・検索フレームワーク(OneGen)
OneGenは、自動回帰的に生成された検索トークンを組み込むことで、生成と検索のための従来の別々のトレーニングアプローチを橋渡しする。
その結果,LLMの生成能力を維持しつつ,検索性能の向上を図っている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:35:19 GMT)
Improving Retrieval-Augmented Generation in Medicine with Iterative Follow-up Questions [42.7] i-MedRAGは、過去の情報検索の試みに基づいてフォローアップクエリを反復的に要求するシステムである。
ゼロショットのi-MedRAGは、GPT-3.5上で既存のプロンプトエンジニアリングと微調整の方法をすべて上回ります。
ケーススタディでは,i-MedRAG が追従クエリを柔軟に問合せして推論連鎖を形成できることが示されている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 02:42:07 GMT)
Learning to Classify Quantum Phases of Matter with a Few Measurements [41.9] 相図の一部のみが予め知られている場合, 物質の量子相を0温度で同定する。
未知の領域でも位相を分類できる観測可能な構造を構築するために,これまでの知識をいかに活用するかを示す。
この発見の重要な応用は、量子シミュレーターで得られた物質相の分類である。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:52:34 GMT)
Generalization Measures for Zero-Shot Cross-Lingual Transfer [40.4] その知識を一般化するモデルの能力は、堅牢で信頼性の高い機械学習システムを構築するために不可欠である。
言語モデル評価タスクには、モデル一般化に関する情報指標が欠けている。
本稿では,一般化に相関するモデル最適化のシャープネスを確実かつ安定に計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 00:54:58 GMT)
T2VSafetyBench: Evaluating the Safety of Text-to-Video Generative Models [39.2] T2VSafetyBenchは,テキスト・ビデオモデルの安全性評価のための新しいベンチマークである。
ビデオ生成の安全性に関する12の重要な側面を定義し,悪意のあるプロンプトデータセットを構築する。
異なるモデルは様々な強みを示す。
テキスト・ビデオ生成モデルのユーザビリティと安全性にはトレードオフがある。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:19:53 GMT)
A Survey on Diffusion Models for Recommender Systems [36.5] 本稿では,拡散モデルに関する最初の総合的な調査について紹介する。
DMは、堅牢な生成能力のため、レコメンデーターシステムのための有望なソリューションとして現れてきた。
我々の分類学は、複雑なデータ分布を捉える際の拡散モデルのユニークな強みを強調している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:57:12 GMT)
DynamicFL: Federated Learning with Dynamic Communication Resource Allocation [35.0] Federated Learning(FL)は、複数のユーザがローカルデータを使ってモデルを分散的にトレーニングできる、協調的な機械学習フレームワークである。
我々は,グローバルモデルの性能と通信コストのトレードオフを調査する新しいFLフレームワークであるDynamicFLを紹介する。
モデル精度は最大10%向上し,DynamicFLは最先端の手法を超越していることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:53:32 GMT)
Advances and Open Challenges in Federated Foundation Models [34.4] ファウンデーションモデル(FM)とフェデレートラーニング(FL)の統合は、人工知能(AI)における変革的パラダイムを提示する
本稿では,フェデレーション・ファンデーション・モデル(FedFM)の新興分野に関する包括的調査を行う。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 09:38:11 GMT)
Human-In-The-Loop Machine Learning for Safe and Ethical Autonomous Vehicles: Principles, Challenges, and Opportunities [33.9] 我々は、カリキュラム学習(CL)、ヒューマン・イン・ザ・ループ強化学習(HITL-RL)、アクティブ・ラーニング(AL)、倫理的原則に焦点を当てる。
CLでは、人間の専門家が単純なタスクから始めて、より難しいタスクへと徐々に進むことで、MLモデルを体系的に訓練する。
HITL-RLは報酬形成、アクションインジェクション、対話型学習といった技術を通じて人間の入力を組み込むことで、RLプロセスを大幅に強化する。
ALは、人間の監視でラベル付けする必要がある特定のインスタンスをターゲットにすることで、アノテーションプロセスを合理化する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:18:40 GMT)
STLLM-DF: A Spatial-Temporal Large Language Model with Diffusion for Enhanced Multi-Mode Traffic System Forecasting [32.9] マルチタスク輸送予測を改善するため,時空間大言語モデル(STLLM-DF)を提案する。
DDPMの堅牢なdenoising機能により、ノイズの多い入力から基盤となるデータパターンを復元することができる。
STLLM-DFは既存のモデルより一貫して優れており,MAEでは平均2.40%,RMSEでは4.50%,MAPEでは1.51%の削減を実現している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:29:27 GMT)
Leveraging Large Language Models for Wireless Symbol Detection via In-Context Learning [29.3] 本稿では,大規模言語モデル(LLM)の文脈内学習能力(即ち,プロンプト)を活用して,学習や微調整をすることなく,低データ体制下での無線タスクを解決することを提案する。
この結果から,ICL法によるLCMはシンボル復調作業において従来のDNNよりも優れていたことが判明した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:49:46 GMT)
Influence-based Attributions can be Manipulated [26.6] 我々は、影響に基づく属性を操作するための現実的なインセンティブを提示し、これらの属性が敵によって体系的に妨げられるかどうかを調査する。
我々の研究は、敵対的な状況下での影響力に基づく属性の信頼性に関する疑問を提起する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:52:00 GMT)
LLM-based Abstraction and Concretization for GUI Test Migration [26.5] GUIテストマイグレーションは、ターゲットアプリの特定の機能をテストするために、イベントとアサーションを備えたテストケースを生成することを目的としている。
本稿では,まず,対象機能に対するテストロジックを抽象化する新たなマイグレーションパラダイムを提案する。
このパラダイムに基づいてGUIテストケースを移行する最初のアプローチであるMACdroidを紹介します。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:46:05 GMT)
CONNECTOR: Enhancing the Traceability of Decentralized Bridge Applications via Automatic Cross-chain Transaction Association [25.8] クロスチェーントランザクションアソシエーションは、ブリッジDAppによって実行されるユニークなトランザクションを特定し、マッチングする。
橋梁スマートコントラクトに基づくクロスチェーントランザクションアソシエーション分析手法であるCONNECTORを提案する。
各種橋梁における実環境実験を行い, 実環境における CONNECTOR の有効性を実証する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 00:52:06 GMT)
Adversarial Purification and Fine-tuning for Robust UDC Image Restoration [25.0] Under-Display Camera (UDC) 技術は、敵対的摂動に対する感受性によって悪化する独自の画像劣化問題に直面している。
本研究は、敵攻撃に対する堅牢性に着目し、UDC画像復元モデルの強化に焦点を当てた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:46:02 GMT)
Deep Self-cleansing for Medical Image Segmentation with Noisy Labels [25.0] 医用画像のセグメンテーションは、疾患の診断と手術計画を支援する医療画像の分野で重要である。
確立されたセグメンテーション手法の多くは、監督された深層学習に依存しており、クリーンで正確なラベルが監督に不可欠である。
トレーニング段階でノイズを除去しながら、クリーンなラベルを保存できるディープ・セルフ・クリーン・セグメンテーション・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:33:32 GMT)
A Pair Programming Framework for Code Generation via Multi-Plan Exploration and Feedback-Driven Refinement [24.3] PairCoderは、コードを生成するための大規模言語モデル(LLM)のための新しいフレームワークである。
ハイレベルな計画のためのナビゲータエージェントと、特定の実装のためのドライバエージェントの2つのコラボレーティブエージェントが組み込まれている。
ドライバは、Navigatorの指示に従って、初期コード生成、コードテスト、改善を行う。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:22:19 GMT)
Vision-fused Attack: Advancing Aggressive and Stealthy Adversarial Text against Neural Machine Translation [24.2] 本稿では,視覚融合攻撃(VFA)フレームワークを提案する。
そこで本研究では,ヒトのテキスト読解機構を整列させるために,認識が保持するテキスト選択戦略を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:22:17 GMT)
Machine Learning-Based Prediction of Key Genes Correlated to the Subretinal Lesion Severity in a Mouse Model of Age-Related Macular Degeneration [23.8] 加齢関連黄斑変性症(AMD)は、高齢者の視覚障害の主要な原因である。
AMDの理解の進歩にもかかわらず、網膜下傷(線維症)の重症度を誘導する分子的要因はいまだ解明されていない。
本研究では、病変の重症度に強く相関するキー遺伝子を予測する機械学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 10:08:54 GMT)
Unsupervised Multimodal 3D Medical Image Registration with Multilevel Correlation Balanced Optimization [22.6] マルチレベル相関バランス最適化に基づく教師なしマルチモーダル医用画像登録手法を提案する。
異なるモードの術前医療画像に対して、変形場間の最大融合により有効な情報のアライメントと積み重ねを実現する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 09:38:59 GMT)
Robust COVID-19 Detection in CT Images with CLIP [21.8] 深層学習モデルは、特に新型コロナウイルス検出において、医療画像の課題に直面している。
凍結したCLIP画像エンコーダとトレーニング可能な多層認識(MLP)を活用して,これらの障害を克服するための最初の軽量検出器を提案する。
教師と学生のフレームワークを統合して、大量のラベルのないデータに便乗し、本質的なデータ制限にもかかわらず、我々のモデルは優れたパフォーマンスを達成できる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 04:36:57 GMT)
Evaluating the design space of diffusion-based generative models [21.5] この記事では、生成プロセス全体について、初めて定量的に理解する。
勾配降下下での復調スコアマッチングの非漸近収束解析を行う。
分散爆発モデルに対する精密サンプリング誤差解析も提供する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 22:48:07 GMT)
Exploiting Code Symmetries for Learning Program Semantics [21.1] コード対称性をセマンティクス保存変換として定義するグループ理論フレームワークを導入する。
プログラム依存グラフ上に定義された置換群から符号対称性に即時同値な自己意図の新たな変種を開発する。
この結果から,コード対称性群を経由したコード構造を符号化するコードLLMが,より高速に一般化されることが示唆された。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:23:16 GMT)
A Bag of Tricks for Few-Shot Class-Incremental Learning [21.0] 数ショットのクラス増分学習(FSCIL)のためのトリックの袋を提示する。
FSCILは安定性と適応性の両方を必要とし、新しいタスクを学習しながら、以前に学習したタスクの習熟性を維持する。
これらのトリックを,安定性トリック,適応性トリック,トレーニングトリックという3つのカテゴリに分類する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 10:59:16 GMT)
Estimation and inference for the Wasserstein distance between mixing measures in topic models [18.7] 混合測度間のワッサーシュタイン距離は混合モデルの統計解析において中心的な位置を占めるようになった。
この研究は、この距離の新しい標準解釈を提案し、トピックモデルにおけるワッサーシュタイン距離の推論を行うためのツールを提供する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 23:55:58 GMT)
Towards Patronizing and Condescending Language in Chinese Videos: A Multimodal Dataset and Detector [18.1] Patronizing and Condescending Language (PCL)は、脆弱なグループをターゲットにした差別的有害なスピーチの一種である。
本稿では,Bilibiliによる715の注釈付きビデオからなるPCLのための中国初のマルチモーダルデータセットについて紹介する。
また,PCL認識のための表情検出モジュールを備えたマルチPCL検出器を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:26:13 GMT)
UMOD: A Novel and Effective Urban Metro Origin-Destination Flow Prediction Method [18.0] 3つのコアモジュールからなる有効都市流予測法(UMOD)を提案する。
データ埋め込みモジュールは、生のODペアの入力を隠れた空間表現に投影する。
時間的および空間的関係モジュールは、時間的および空間的関係モジュールによって処理され、ペア内およびペア内OD-時間的依存関係の両方をキャプチャする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 01:44:46 GMT)
Time-Distributed Feature Learning for Internet of Things Network Traffic Classification [17.9] 深層学習に基づくネットワークトラフィック分類(NTC)のための,効率的で包括的特徴抽出手法を提案する。
我々はNTCの精度を最大化するために時間分散特徴学習を用いる。
提案手法は, 擬似時間的特徴と時空間的特徴がNTCの頑健性と性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:46:56 GMT)
Investigating the Role of Cultural Values in Adopting Large Language Models for Software Engineering [17.8] 本研究は,ソフトウェア開発における大規模言語モデル(LLM)導入における専門家の文化的価値の役割に焦点を当てた。
LLM導入の主要因は習慣やパフォーマンスの期待度であるが,文化的価値はそれほど緩やかではない。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 10:58:45 GMT)
Revisiting Trace Norm Minimization for Tensor Tucker Completion: A Direct Multilinear Rank Learning Approach [17.6] 本論文では、タッカー完備化におけるトレースノルムに基づく定式化は、多重線型階数最小化において非効率であることを示す。
等価表現の係数行列にトレースノルム最小化を適用するタッカー形式の新しい解釈を提案する。
数値的な結果から,提案アルゴリズムは多線形階数学習における性能が著しく向上していることが示唆された。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:44:00 GMT)
Asymptotic and Non-Asymptotic Convergence Analysis of AdaGrad for Non-Convex Optimization via Novel Stopping Time-based Analysis [17.3] アダプティブはディープラーニングの強力なツールとして現れ、勾配に基づいて学習率を動的に調整している。
これらの手法は様々なディープラーニングタスクに大きく成功したが、AdaGradがこの研究の基盤となっている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:29:51 GMT)
Global-local Fourier Neural Operator for Accelerating Coronal Magnetic Field Model [17.3] FNOの2つの分岐を含むグローバルローカルフーリエニューラル演算子(GL-FNO)を提案する。
GLFNOの性能は、FNO、U-NO、U-FNO、Vision Transformer、CNN-RNN、CNN-LSTMといった最先端のディープラーニング手法と比較される。
その結果、GL-FNOはMHDシミュレーションを加速するだけでなく、信頼性の高い予測能力も提供し、宇宙気象力学の理解に大きく貢献することが示された。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:28:18 GMT)
Expanding Expressivity in Transformer Models with MöbiusAttention [17.2] M"obiusAttentionは、Transformerベースのモデルの注意機構にM"obius変換を統合する。
これらの性質を取り入れることで、M"obiusAttention はトークン間のより複雑な幾何学的関係を学習するモデルに権限を与える。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:56:33 GMT)
Contraction Theory for Nonlinear Stability Analysis and Learning-based Control: A Tutorial Overview [17.1] 収縮理論 (contraction theory) は、非自明(時間変化)非線形系の微分力学を研究するための解析ツールである。
その非線形安定解析は、線形行列の不等式として表される安定性条件を満たす適切な収縮計量を見つけるために沸騰する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 22:42:54 GMT)
MIM-Refiner: A Contrastive Learning Boost from Intermediate Pre-Trained Representations [16.9] MIM-Refinerは、事前訓練されたMIMモデルの対照的な学習促進である。
我々はMIMモデルの特徴を、サブパーから最先端のオフ・ザ・シェルフ機能まで洗練する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:48:34 GMT)
Unraveling Challenges with Supply-Chain Levels for Software Artifacts (SLSA) for Securing the Software Supply Chain [16.6] この調査は、233のGitHubリポジトリから抽出された1,523のSLSA関連問題を分析した。
4つの重要な課題と5つの採用戦略を特定しました。
提案されている戦略には、生成プロセスの合理化、SLSA検証プロセスの改善、具体的で詳細なドキュメントの提供が含まれる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:54:16 GMT)
Hate Content Detection via Novel Pre-Processing Sequencing and Ensemble Methods [15.6] ソーシャルメディア、特にTwitterは、トロールやヘイトスピーチといったインシデントが大幅に増加した。
本稿では,ウェブ上のヘイトコンテンツを抑制するための計算フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:32:17 GMT)
GS-PT: Exploiting 3D Gaussian Splatting for Comprehensive Point Cloud Understanding via Self-supervised Learning [15.6] ポイントクラウドの自己教師型学習は、ラベルのない3Dデータを活用して、手動のアノテーションに頼ることなく意味のある表現を学習することを目的としている。
本稿では,3Dガウススプラッティング(3DGS)をポイントクラウドの自己教師型学習に初めて統合したGS-PTを提案する。
我々のパイプラインは、トランスフォーマーを自己教師付き事前学習のバックボーンとして利用し、3DGSによる新しいコントラスト学習タスクを導入している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:46:47 GMT)
Green Screen Augmentation Enables Scene Generalisation in Robotic Manipulation [15.5] 視覚に基づく新しい環境に対する操作ポリシーの一般化は、限られた探索の難しい領域のままである。
現在のプラクティスでは、ひとつの場所にデータを集め、このデータを使って模倣学習や強化学習のポリシーを訓練し、同じ場所にポリシーをデプロイする。
本稿では,主にグリーンスクリーンを特徴とする場所でデータを収集する手法を提案する。
背景テクスチャをグリーンスクリーン上にオーバーレイするためにクロマキーアルゴリズムを用いたグリーンスクリーン拡張(GreenAug)を導入する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:33:45 GMT)
A Survey on Large Language Models for Software Engineering [15.5] 大規模言語モデル(LLM)は、幅広いソフトウェア工学(SE)タスクを自動化するために使われる。
本稿では,LLMを基盤としたSEコミュニティにおける最先端の研究について概説する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:29:38 GMT)
TimelyGPT: Extrapolatable Transformer Pre-training for Long-term Time-Series Forecasting in Healthcare [14.1] 我々は、時間生成事前学習変換器(TimelyGPT)を提示する。
TimelyGPTは、トレンドと周期パターンを時系列表現にエンコードするために、extrapolatable position (xPos) を組み込んでいる。
また、再帰的な注意と時間的畳み込みモジュールを統合して、グローバルな時間的依存関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:09:23 GMT)
Semantic-Enhanced Indirect Call Analysis with Large Language Models [13.5] 本稿では,間接的呼分析の有効性を高めるためにセマンティック・エンハンスメント・アナリティクス(SEA)を提案する。
一般的なプログラミングのプラクティスでは、間接呼び出しは、しばしば呼び出されたターゲットとセマンティックな類似性を示す。
SEAは、複数の視点から間接呼び出しとターゲット関数の両方の自然言語要約を生成する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:56:47 GMT)
DDNet: Deformable Convolution and Dense FPN for Surface Defect Detection in Recycled Books [13.2] DDNetは、欠陥のローカライゼーションと分類を強化するために設計された革新的な検出モデルである。
リサイクルおよび再循環書籍における表面欠陥検出に特化して算出されたデータセットについて述べる。
DDNetは表面欠陥の正確な位置化と分類を行い、mAP値は46.7%である。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:18:19 GMT)
Sight View Constraint for Robust Point Cloud Registration [13.2] 部分的ポイントクラウド登録(部分的PCR)は、特に低い重複率を扱う場合、難しいタスクである。
本稿では、不正確な変換を確定的に識別する、新規で一般的な視線制約(SVC)を提案する。
挑戦的な3DLoMatchデータセットでは、登録リコールが78%から82%に増加し、最先端の結果が得られた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 11:58:20 GMT)
A foundation model enpowered by a multi-modal prompt engine for universal seismic geobody interpretation across surveys [13.2] 本研究では, 地震探査における地盤構造を解析するための基礎モデルを提案する。
このモデルは、事前訓練されたビジョンファウンデーションモデル(VFM)と洗練されたマルチモーダルプロンプトエンジンを統合している。
提案手法は地学データ解釈のための新しいパラダイムを確立し,他のタスクへの転送の可能性も広い。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:44:23 GMT)
Socially Responsible Data for Large Multilingual Language Models [12.3] 大規模言語モデル(LLM)は、過去3年間で、急速にサイズと明らかな能力が向上している。
グローバル・ノース以外の地域社会の言語に対応するためのモデルを模索している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 23:51:04 GMT)
Jointly Complementary&Competitive Influence Maximization with Concurrent Ally-Boosting and Rival-Preventing [12.3] C$2$ICモデルは、相補的および競合的な影響が多エージェント環境下で包括的に広がると考えている。
NP-hardの問題を示し、影響促進問題と影響遮断問題を一般化することができる。
そこで本研究では,実ソーシャルネットワーク上で広範囲に実験を行い,提案アルゴリズムの有効性を実証した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 23:11:55 GMT)
DEFormer: DCT-driven Enhancement Transformer for Low-light Image and Dark Vision [12.2] ネットワークに新たな手がかりとして周波数を導入し,DCT駆動型拡張トランスフォーマ(DEFormer)フレームワークを提案する。
我々のフレームワークは、LOLとMIT-Adobe FiveKデータセットの両方で高度な結果を達成し、ダーク検出の性能を改善した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:21:24 GMT)
Estimating Indoor Scene Depth Maps from Ultrasonic Echoes [11.8] 本稿では,難聴エコーを用いたエコーに基づく深度推定について考察する。
超音波は理論上高い測定精度を提供するが、超音波を用いた場合の実際の深さ推定精度は未定である。
本稿では, 超音波エコーを用いた深度推定の精度を向上させるための新しい深度学習法を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:21:13 GMT)
DP-BREM: Differentially-Private and Byzantine-Robust Federated Learning with Client Momentum [11.7] フェデレートラーニング(FL)は、複数の参加するクライアントが機械学習モデルを協調的にトレーニングすることを可能にする。
既存のFLプロトコルは、データのプライバシやモデルの堅牢性を損なうような攻撃に対して脆弱である。
我々は,クロスサイロFLにおける差分プライバシ(DP)とビザンチンの堅牢性を同時に達成することに注力する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 21:11:35 GMT)
Root Cause Analysis for Microservice System based on Causal Inference: How Far Are We? [11.6] マイクロサービスシステムに対する因果推論に基づく根本原因分析手法の包括的な評価を行う。
それぞれの手法は有効性、効率性に欠ける傾向にあり、特定のパラメータに対する感度を示す傾向にある。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:05:45 GMT)
Distributed Speculative Inference of Large Language Models is Provably Faster [11.3] 大規模言語モデル(LLM)の推論を加速することは、人工知能において重要な課題である。
本稿では、投機推論(SI)や従来の自己回帰推論(非SI)よりも確実に高速な分散推論アルゴリズムである分散推論(DSI)を紹介する。
DSI が SI よりも 1.29-1.92 倍速い現実的な単一ノード設定において,本シミュレーションは既製の LLM の高速化を示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:15:17 GMT)
Transformer with Leveraged Masked Autoencoder for video-based Pain Assessment [11.0] 我々は、トランスフォーマーに基づくディープラーニングモデルにおいて、顔画像解析を用いて、痛み認識を強化する。
強力なMasked AutoencoderとTransformersベースの分類器を組み合わせることで,表現とマイクロ表現の両方を通じて痛みレベルインジケータを効果的にキャプチャする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:14:03 GMT)
Leveraging WaveNet for Dynamic Listening Head Modeling from Speech [11.0] 対面会話中のリスナーからの対話的コミュニケーションフィードバックをシミュレートすることを目的としたリスナー顔応答の作成。
提案手法は,聴取者のフィードバックの微妙なニュアンスを捉え,個々の聴取者のアイデンティティを確実に保持することに焦点を当てる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:19:22 GMT)
KModels: Unlocking AI for Business Applications [10.8] 本稿では、KModelのアーキテクチャと、それを形作る重要な決定について述べる。
KModelsにより、AI消費者は専用のデータサイエンティストの必要性を排除できる。
オンプレミスのデプロイメントに非常に適しているが、クラウド環境でも使用できる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:19:12 GMT)
Towards Category Unification of 3D Single Object Tracking on Point Clouds [10.6] カテゴリー特化モデルは、シームズや動き中心のパラダイムに関わらず、3次元単体追跡(SOT)において非常に価値のある手法である。
本稿ではまず,共有モデルパラメータを持つ単一ネットワークを用いて,すべてのカテゴリにまたがるオブジェクトを同時に追跡できる統一モデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:31:38 GMT)
ProGRes: Prompted Generative Rescoring on ASR n-Best [10.5] 大規模言語モデル(LLM)は,ビーム探索過程において発生するn-best仮説を効果的に再現することにより,音声認識の性能を向上させる能力を示した。
本稿では, 命令調整型LLMを用いて, 適切にプロンプトされたLLMを用いて生成した新しい仮説を用いて, n-best音声認識仮説を動的に拡張する手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 20:08:16 GMT)
Balancing Security and Accuracy: A Novel Federated Learning Approach for Cyberattack Detection in Blockchain Networks [10.3] 本稿では,ブロックチェーンベースのデータ共有ネットワークのセキュリティ向上を目的とした,CCD(Collaborative Cyber attack Detection)システムを提案する。
本稿では,攻撃検出精度,ディープラーニングモデル収束時間,グローバルモデル生成の全体的な実行時間など,様々なノイズタイプが重要なパフォーマンス指標に与える影響について検討する。
この結果から,データプライバシの確保とシステムパフォーマンスの維持という,複雑なトレードオフが明らかとなり,これらのパラメータを多様なCCD環境に最適化するための貴重な洞察が得られた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 04:38:07 GMT)
Deep Generic Representations for Domain-Generalized Anomalous Sound Detection [10.2] ドメイン一般化ASDのためのkNNと組み合わされた大規模事前学習型特徴抽出器の汎用的特徴表現を利用するtextitGenRepを提案する。
textitGenRepは、DCASE2023T2 Evalセットで73.79%のオフィシャルスコアを持つラベル付きデータを必要とせずに、最高のOEベースのアプローチより優れている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 09:20:30 GMT)
Deep Bayesian Active Learning-to-Rank with Relative Annotation for Estimation of Ulcerative Colitis Severity [10.2] 本稿では,相対的アノテーションに対して適切なペアを自動的に選択する深ベイズ能動的学習 to ランクを提案する。
本手法は,サンプルのモデル不確実性から,ラベルのないペアに高い学習効率でアノテートする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 02:19:40 GMT)
From Computation to Consumption: Exploring the Compute-Energy Link for Training and Testing Neural Networks for SED Systems [9.7] 本稿では,音事象検出システムの主要なコンポーネントであるニューラルネットワークアーキテクチャについて検討する。
我々は,小規模から大規模アーキテクチャの訓練および試験におけるエネルギー消費量を測定した。
我々は,エネルギー消費,浮動小数点演算数,パラメータ数,GPU/メモリ利用率の複雑な関係を確立する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:51:34 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [9.2] CD-NGPは動的シーンにおける3次元再構成と新しいビュー合成のための高速でスケーラブルな表現である。
連続学習にインスパイアされた本手法は,まず入力ビデオを複数のチャンクに分割し,次にモデルのチャンクをチャンクで訓練し,最後に,第1枝とその後の枝の特徴を融合させる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:35:48 GMT)
BBS: Bi-directional Bit-level Sparsity for Deep Learning Acceleration [9.1] ビットレベルのスパーシリティ法は非効率なゼロビット演算をスキップし、通常はビットシリアル深層学習アクセラレーターに適用される。
そこで本研究では,ビットレベル空間の実用性と効率を,新しいアルゴリズムによるビットプルーニング,平均化,圧縮手法により改善する。
ハードウェア面では、低オーバーヘッドでDNNを高速化する効率的なPE設計を備えたビットシリアルアーキテクチャであるBitVertによるBBSの可能性を示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 21:45:12 GMT)
DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation [8.3] DSLRは、検索された文書を文に分解し、無関係な文をフィルタリングし、それらを再び一貫性のある文に再構成する、教師なしのフレームワークである。
我々は,複数のオープンドメインQAデータセット上でDSLRを実験的に検証し,DSLRが従来の固定サイズパスよりもRAG性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:01:56 GMT)
Hint of Thought prompting: an explainable and zero-shot approach to reasoning tasks with LLMs [6.0] 本稿では、説明可能性とゼロショットの一般化を促進させる新しい思考ヒント(HoT)を提案する。
説明可能なサブクエスト、論理的推論、答えの3つのステップに分けられる。
実験の結果、HoTプロンプトは既存のゼロショットCoTと比較してゼロショット推論タスクにおいて大きな利点があることがわかった。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:41:12 GMT)
ELMS: Elasticized Large Language Models On Mobile Devices [5.7] デバイス上の大規模言語モデル(LLM)は、プライバシー問題に対処しながら、UI自動化などのアプリケーションを可能にする、モバイルAIに革命をもたらしている。
ELMSは、モデルとプロンプト次元の両方で弾力性を提供するように設計されたデバイス上でのLCMサービスである。
トランスモデルに固有の置換整合性を利用して高品質で柔軟なサブモデルを作成するワンタイムリオーダーニューロニング技術。
プロンプトを効率的に洗練し、モデルプロンプト間の弾性適応をコーディネートするデュアルヘッドコンパクト言語モデル。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:32:08 GMT)
TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6] 本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。
本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:54:43 GMT)
Keyword-driven Retrieval-Augmented Large Language Models for Cold-start User Recommendations [5.4] コールドスタートユーザレストランレコメンデーションの問題に対処するフレームワークであるKALM4Recを紹介する。
KALM4Recは、候補検索とLLMベースの候補の再ランクの2つの主要な段階で動作する。
Yelpのレストランデータセットを用いて、英語圏の3都市からのユーザレビューを行い、提案したフレームワークが推奨品質を大幅に改善することを示す。
論文参考訳(メタデータ) (Sun, 08 Sep 2024 20:32:47 GMT)
Synthetic Tabular Data Generation for Class Imbalance and Fairness: A Comparative Study [4.4] データ駆動性のため、機械学習(ML)モデルは、データから受け継がれたバイアスの影響を受けやすい。
クラス不均衡(分類対象)とグループ不均衡(性や人種のような保護された属性)はMLの有用性と公平性を損なう可能性がある。
本稿では、最先端モデルを用いて、クラスとグループの不均衡に対処する比較分析を行う。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 20:08:09 GMT)
On the Need to Monitor Continuous Integration Practices -- An Empirical Study [4.4] 継続的統合(CI)は、ソフトウェア開発を強化するために広く採用されているプラクティスの集合を含んでいる。
この記事では、CIプラクティスの監視に関する開発者の認識について説明する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:08:07 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3] 大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。
LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。
本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:09:33 GMT)
Multi-V2X: A Large Scale Multi-modal Multi-penetration-rate Dataset for Cooperative Perception [3.1] 本稿では,V2X知覚のための大規模・マルチモーダル・マルチペネレーションレートデータセットであるMulti-V2Xを紹介する。
私たちのMulti-V2Xデータセットは、合計549kのRGBフレーム、146kのLiDARフレーム、4,219kの注釈付き3Dバウンディングボックスで構成されています。
最も高いCAV侵入率は86.21%に達し、通信範囲に31のエージェントがある。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:22:00 GMT)
Evaluating Large Language Models with Tests of Spanish as a Foreign Language: Pass or Fail? [3.0] 本研究は,最近発表された海外学生を対象としたスペイン試験と類似の尺度を用いて,最先端のLCMの性能評価を行った。
その結果,LLMはスペイン語の理解に優れていたが,文法的能力の面では,母語話者のレベルには程遠いことがわかった。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 11:30:03 GMT)
The first Cadenza challenges: using machine learning competitions to improve music for listeners with a hearing loss [2.8] 音楽を聴くことは難聴者にとって問題であることは確かである。
機械学習はどのようにしてこの問題に対処できるのか?
本稿では,聴力障害のある者を対象とした,機械学習による音楽の音質向上のためのオープンチャレンジ手法の最初の応用について述べる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:45:45 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8] 本稿では,診療所における低コストシステムを用いた心疾患の迅速かつ効率的な診断方法を提案する。
LSCNネットワークによる心臓音の総合的分類精度は96%以上である。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:20:57 GMT)
Low Latency Transformer Inference on FPGAs for Physics Applications with hls4ml [2.7] 本研究では, hls4ml を用いたフィールドプログラミング可能なゲートアレー (FPGA) におけるトランスフォーマアーキテクチャの効率的な実装を提案する。
VU13P FPGAチップへの展開は2us未満の達成であり、リアルタイムアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:50:25 GMT)
Tasks People Prompt: A Taxonomy of LLM Downstream Tasks in Software Verification and Falsification Approaches [2.7] 我々は、分類、マッピング、分析を行うための新しい下流タスク分類法を開発した。
主な分類基準は、タスクタイプの変動点を示しながら、共通点を強調することである。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:59:39 GMT)
2DSig-Detect: a semi-supervised framework for anomaly detection on image data using 2D-signatures [2.7] 本稿では,2DSig-Detectと呼ばれる画像における異常検出のための新しい手法を提案する。
画像中の対向摂動の存在を検出するために,優れた性能と時間の短縮が示される。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:35:05 GMT)
Fast Deep Predictive Coding Networks for Videos Feature Extraction without Labels [2.6] ディープ予測符号化ネットワーク(DPCN)は、双方向情報フローを通じて映像特徴をキャプチャする。
本稿では,特徴クラスタリングの空間性と精度を向上する内部モデル変数を高速に推定するDPCNを提案する。
CIFAR-10、スーパーマリオブラザース、Coil-100などのデータセットで実験を行った結果、そのアプローチが検証された。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 01:53:25 GMT)
Ultron: Enabling Temporal Geometry Compression of 3D Mesh Sequences using Temporal Correspondence and Mesh Deformation [2.1] 既存の3Dモデル圧縮手法は主に静的モデルに焦点を当てており、フレーム間情報を考慮していない。
本稿では,時間的対応とメッシュ変形を用いた任意のトポロジでメッシュ列を圧縮する方法を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:34:19 GMT)
Pseudorandom Permutations from Random Reversible Circuits [2.0] 固定された最寄りのアーキテクチャにおいて,各層が$approx n/3$のランダムゲートからなる深さ$n cdot tildeO(k2)$のランダム回路がほぼ$k$の独立な置換をもたらすことを示す。
また、擬似乱数関数からの擬似乱数置換のLuby-Rack-off構成は可逆回路で実装可能であることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:37:35 GMT)
Insights from Benchmarking Frontier Language Models on Web App Code Generation [1.7] 本稿では,WebApp1Kベンチマークによる16のフロンティア大言語モデル(LLM)の評価から得られた知見について述べる。
結果は、全てのモデルが類似した知識を持っているが、それらの性能は、それらが犯した誤りの頻度によって区別されることを示している。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:24:26 GMT)
An Analog and Digital Hybrid Attention Accelerator for Transformers with Charge-based In-memory Computing [1.7] 本稿では,65nmCMOS技術における変圧器の注目機構を高速化するアナログ・ディジタルハイブリッドプロセッサを提案する。
超低消費電力・遅延で実行中に平均75%の低スコアトークンを発生させるアナログ・コンピューティング・イン・メモリ・コアを提案する。
デジタルプロセッサは、アナログCIMコアによって選択された25%の未処理トークンに対してのみ正確な計算を行い、劣化精度を防止する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 01:27:56 GMT)
Thermodynamics of Spin-Imbalanced Fermi Gases with SU(N) Symmetric Interaction [1.5] 我々は密度変動に基づくSU($N$)フェルミオンの熱力学的研究をスピン不均衡な構成に一般化する。
具体的には、2つの種と4つの種の構成を調査し、理論的な予測を検証した。
本研究はスピン不均衡多成分フェルミガスの熱力学特性についてより深く理解する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:33:41 GMT)
Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis [1.4] 大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。
本研究では、感情分析と意味分析を用いて、人間の専門家による機械翻訳モデルの自動評価を行う。
Google翻訳は中国語の特定の単語やフレーズを翻訳することができない。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 04:03:55 GMT)
Using Large Language Models for Template Detection from Security Event Logs [0.9] イベントログ分析技術は、サイバー攻撃のタイムリーな検出と、過去のセキュリティインシデントの分析でセキュリティ専門家を支援するために不可欠である。
構造化されていないテキストイベントログから行パターンやテンプレートを検出することは、イベントログ分析の重要なタスクとして認識されている。
本稿では,構造化されていないセキュリティイベントログからテンプレートを教師なし検出するためのLarge Language Models (LLMs) の適用について検討する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 10:06:54 GMT)
Image color consistency in datasets: the Smooth-TPS3D method [0.9] カラーチャート(例えば、Macbeth ColorChecker)や他の機械可読パターンと組み合わせて使用する3次元薄膜スプライン(TPS3D)色補正法を提案する。
Smooth-TPS法は元の方法よりも20%高速であることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:58:56 GMT)
A Generative Marker Enhanced End-to-End Framework for Argument Mining [0.8] Argument Mining (AM)は、Argumentative Components (AC)とそれに対応するArgumentative Relations (AR)を識別・抽出する。
本稿では、生成パラダイムに基づくエンドツーエンドフレームワークargTANLを紹介する。
Augmented Natural Language (ANL) というラベル付きテキストに議論構造をフレーム化する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:24:11 GMT)
Learning nonnegative matrix factorizations from compressed data [0.8] スケーラブルな非負行列分解のためのフレキシブルで理論的に支持されたフレームワークを提案する。
目標は、圧縮された測定値から直接非負の低ランクコンポーネントを見つけ、元のデータに1回か2回だけアクセスすることである。
圧縮されたデータにのみ依存する最適化問題を定式化し、元の行列に近似した非負の分解を復元する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:18:30 GMT)
Data Alignment for Zero-Shot Concept Generation in Dermatology AI [0.7] ゼロショット機能を提供するCLIPのようなファンデーションモデルは、この課題を軽減するのに役立つ。
CLIPは、ドメイン固有のイメージキャプチャペアを使用して微調整することで、分類性能を改善することができる。
私たちのゴールは、これらのモデルを使用して、臨床辞書とCLIPの事前学習データに使用される自然言語の両方に適合するキャプションテキストを生成することです。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:46:36 GMT)
Evaluation of Tropical Cyclone Track and Intensity Forecasts from Artificial Intelligence Weather Prediction (AIWP) Models [0.6] 4つのオープンソースAIWPモデルが検討されている(FourCastNetv1、FourCastNetv2-small、GraphCast-operational、Pangu-Weather)。
NHCモデルコンセンサスに対するAIWPモデルの貢献も評価した。
かなりの負の強度バイアスにもかかわらず、AIWPモデルは強度のコンセンサスに中立的な影響を与える。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 22:58:46 GMT)
BMR and BWR: Two simple metaphor-free optimization algorithms for solving real-life non-convex constrained and unconstrained problems [0.6] 本稿では,Best-MeanRandom (BMR) とBest-Worst-Random (BWR) の2つの単純な最適化アルゴリズムについて述べる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:36:59 GMT)
Magnetic Dipolar Quantum Battery with Spin-Orbit Coupling [0.5] 本稿では,ゼーマン分裂,DM相互作用,KSEA交換相互作用に影響される磁気双極子系について検討する。
我々は、コヒーレンス、量子不協和、コンカレンスなどの量子資源に対する劣化ノイズと熱平衡の影響を分析する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:12:18 GMT)
Uncertainty estimation in Deep Learning for Panoptic segmentation [0.5] 本研究では, アンサンブルに基づく不確実性推定手法が汎視的セグメンテーション領域でどのように利用できるかを示す。
COCO、KITTI-STEP、VIPERデータセットで結果が示されている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:54:24 GMT)
Anomaly Detection for Real-World Cyber-Physical Security using Quantum Hybrid Support Vector Machines [0.4] サイバー攻撃のような異常なデータは、インフラと人間のオペレーターの安全を著しく危険にさらしている。
量子の異常検出への応用は、物理的センサーデータにおけるサイバー攻撃の識別を大幅に改善することができる。
我々は,8量子ビット16量子カーネルを用いて,F-1スコア0.86,精度87%のHAI CPSデータセットを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 00:15:30 GMT)
FedFT: Improving Communication Performance for Federated Learning with Frequency Space Transformation [0.4] フェデレート学習環境におけるモデルパラメータを伝達するための簡易かつ効果的な手法であるFedFT(Federated frequency-space transformation)を導入する。
FedFTは離散コサイン変換(DCT)を用いて周波数空間のモデルパラメータを表現し、効率的な圧縮と通信オーバーヘッドの低減を実現している。
我々は,3つの最先端FLベースラインとの比較研究を用いて,FedFT手法の4つのデータセット上での汎用性を実証した。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 23:05:35 GMT)
Evaluating Neural Networks Architectures for Spring Reverb Modelling [0.2] スプリングレバーブの電気機械的機能により、デジタル領域で完全にエミュレートすることが難しい非線形システムとなる。
我々は、畳み込みモデルと繰り返しモデルを含む5つの異なるニューラルネットワークアーキテクチャを比較し、この音響効果の特性を再現する効果を評価する。
本稿では,春の残響領域における現在のブラックボックスモデリング技術の境界線を推し進めることを目的として,パラメトリック制御を提供するニューラルオーディオアーキテクチャに焦点を当てた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 02:37:42 GMT)
Predictability maximization and the origins of word order harmony [0.2] シーケンスの予測可能性を最大化するヘッドの配置を最適に検討する。
提案手法では,頭部の延期が予測可能性の最大化のための最適戦略であると同時に,依存者の予測可能性の最大化のための最適戦略であることを示す。
以上の結果から,実言語で採用した頭部の配置や,異なる種類の実験で出現した頭部の配置が明らかになった。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:08:00 GMT)
PatchAlign:Fair and Accurate Skin Disease Image Classification by Alignment with Clinical Labels [0.1] 我々は,皮膚条件画像の分類精度と公平性を高めるために,新しいアプローチであるPatchAlignを導入する。
PatchAlignは、グラフ最適トランスポート(GOT)ロスを正規化子として、クロスドメインアライメントを実行する。
皮膚の音色間の正の正の比率の公平性は一貫して向上する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 05:00:37 GMT)
From Struggle to Simplicity with a Usable and Secure API for Encryption in Java [0.1] SafEncryptは、Java開発者のための暗号化タスクを合理化するAPIである。
ネイティブのJava Cryptography Architecture上に構築されており、暗号化の複雑さや誤った低レベルの詳細から開発者を保護する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:16:12 GMT)
Waiting time statistics for a double quantum dot coupled with an optical cavity [0.0] 光空洞に結合した二重量子ドットは、非自明な開量子系の原始的な例である。
近年の実験的および理論的研究により、このシステムはマイクロ波領域における単一光子検出の候補であることが示されている。
本稿では,量子ジャンプにおける待ち時間統計の詳細な解析を行う。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 21:04:03 GMT)
Using LLMs to Establish Implicit User Sentiment of Software Desirability [0.0] 本研究は、暗黙のソフトウェア望ましさを定量的にゼロショット感情分析するためのLLMの使用について検討する。
データはMicrosoft Product Desirability Toolkit (PDT)を使って収集される。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:59:06 GMT)
Universal Quantum Tomography With Deep Neural Networks [0.0] 純量子状態トモグラフィーと混合量子状態トモグラフィーの両方に対する2つのニューラルネットワークに基づくアプローチを提案する。
提案手法は,実験データから混合量子状態の再構成を行なえることを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 07:27:57 GMT)
Unexplainability of Artificial Intelligence Judgments in Kant's Perspective [0.0] 本稿は,AI判断が人間の判断の特性の観点から理解できない形態を示すものであることを論じる。
物理述語を含まない概念は、視覚を通して関数が示されるときの説明が簡単でないことを示す。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:33:08 GMT)
The limits of progress in the digital era [0.0] 進歩の概念は、科学、技術、経済、社会における活動を明確に表している。
これは、研究者としての日々の活動の駆動ベクトル(おそらくメインベクター)である。
しかし、進歩という概念には2つの大きな懸念が浮かび上がっている。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:59:26 GMT)
Statistical link between Bell nonlocality and uncertainty relations [0.0] ベルの非局所性と不確実性の関係は古典物理学とは異なる量子論の特徴である。
ここでは、アハロノフ・ヴァイドマン恒等式を用いて、これらの2つの量子文字間の統計的リンクを確立する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:17:41 GMT)
Self-Reflection in LLM Agents: Effects on Problem-Solving Performance [0.0] 大規模言語モデル(LLM)における自己回帰が問題解決性能に及ぼす影響について検討した。
各質問に対して, 誤りを反映するように8種類の自己反射型LLMエージェントを指示した。
このガイダンスを用いて、各自己表現エージェントは、同じ質問を再回答しようと試みた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 20:33:03 GMT)
SEF: A Method for Computing Prediction Intervals by Shifting the Error Function in Neural Networks [0.0] 本稿では,このカテゴリに属する新しい手法としてSEF(Shifting the Error Function)法を提案する。
提案手法では,1つのニューラルネットワークを3回トレーニングすることで,与えられた問題に対して対応する上境界と下限とを推定する。
この革新的なプロセスは、PIを効果的に生成し、不確実性定量化のための堅牢で効率的な技術をもたらす。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:46:45 GMT)
Reconstruction of Quantum Particle Statistics: Bosons, Fermions, and Transtatistics [0.0] 我々は、よく動機付けられた仮定に基づいて量子粒子統計を分類する。
我々は、最小対称性の統計量としてボソンとフェルミオンを含む完全な特徴付けを開発する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 21:02:37 GMT)
Random walk model that universally generates inverse square Lévy walk by eliminating search cost minimization constraint [0.0] L'evyは2つ近いパワー指数を持つ歩行を頻繁に観察するが、その根本原因はいまだ解明されていない。
本研究では,逆正方形L'evyウォークを生成するために考案された,シンプルで抽象的なランダムウォークモデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 01:15:05 GMT)
Quantum Entanglement in Two-Photon Rabi Stark Model [0.0] 異なるスタークカップリング強度値の影響下での結合強度関数としての2光子ラビスタークモデルの検討を行った。
量子エンタングルメントを決定するスターク結合強度が果たす役割の理解を深める。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:39:46 GMT)
Polynomial Methods for Ensuring Data Integrity in Financial Systems [0.0] 本稿では,指標と次元をまたいだデータの整合性を維持する手法を用いて,ロバストな手法を提案する。
データ整合性は複雑なシステム、特に金融プラットフォームにおいて重要な要件である。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 08:45:03 GMT)
Online Graph Topology Learning from Matrix-valued Time Series [0.0] 焦点は、センサのネットワーク上でデータを収集する行列値時系列の統計解析である。
目標は、これらのセンサー間の依存関係構造を特定し、それをグラフで表現することだ。
オンラインアルゴリズムはこれらの拡張データモデルに適応しており、ストリーミングサンプルからグラフとトレンドを同時に学習することができる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 17:02:48 GMT)
On-demand single microwave photon source in a superconducting circuit with pulse-level frequency tunability over two octaves of bandwidth [0.0] 我々は、単一マイクロ波光子をオンデマンドで生成し、大きな周波数帯域で調整可能であることを示す。
出力光子の周波数を2オクターブ以上でパルスレベル制御できるプロトコルを考案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:56:39 GMT)
Nonlinear effect of magnetic field on the build-up of condensated quantum well exciton-polaritons [0.0] GaAs量子井戸におけるボース・アインシュタイン凝縮に対する励起子偏光子の緩和過程に及ぼす磁場の影響について検討する。
本研究により,エキシトンの有効質量,ラビ分裂,分散の変化が,凝縮に近づくにつれて偏光子の緩和速度を著しく変化させることが明らかとなった。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:12:42 GMT)
Maxwell relation between entropy and atom-atom pair correlation [0.0] 一次元(1次元)における超低温ボース気体の局所対相関とエントロピーの間の熱力学的マックスウェル関係を導出する。
我々の計算は、測定された原子-原子相関から量子気体のエントロピーを推定する実験手法の実証的な実証であると見なすことができる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 06:50:04 GMT)
Ion Trapping with a Laser-written 3D Miniaturized Monolithic Linear Paul Trap for Microcavity Integration [0.0] 我々は,金でコーティングした溶融シリカを用いた小型モノリシックイオントラップを,高い開口率で提案する。
溶融シリカのブロックからトラップ構造を抽出するために、選択的レーザーエッチングと呼ばれるレーザ書き込み方法を用いる。
完全なモノリシックな構造は、ファブリケーション後のアライメントを不要にする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:37:14 GMT)
How to integrate a miniature optical cavity in a linear ion trap: shielding dielectrics and trap symmetry [0.0] 光キャビティと複数のイオンを保持する線形トラップとの効率的な界面は、まだ解明されていない。
簡単な電気的導電性による繊維の遮蔽は、大きな利点をもたらす可能性がある。
小型光キャビティの集積を成功させるためには, 線形イオントラップに組み込むべき必須成分と設計戦略を同定する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 15:08:16 GMT)
GuideWalk: A Novel Graph-Based Word Embedding for Enhanced Text Classification [0.0] テキストデータの処理には埋め込みが必要であり、テキストの内容を数値ベクトルに変換する方法である。
新たなテキスト埋め込み手法,すなわちガイド遷移確率行列(GTPM)モデルを提案する。
提案手法は,実世界のデータセットと8つのよく知られた,成功した埋め込みアルゴリズムを用いて検証する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 13:12:42 GMT)
Generalized Parity Measurements and Efficient Large Multi-component Cat State Preparation with Quantum Signal Processing [0.0] 一般パリティ測定は、非自明な量子状態の生成に役立っている。
本稿では,量子信号処理に基づく効率的でロバストなパリティ測定手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:47:22 GMT)
Gaussian geometric discord, entanglement and EPR-steering of two rotational mirrors in a double Laguerre-Gaussian cavity optomechanics in the presence of YIG sphere [0.0] 二重ラゲール・ガウス空洞(DLGC)における2つの空間分離ミラー(Rms)の定常ガウス量子ステアリング、絡み合いおよび幾何学的不協和性について検討した。
熱影響下での定常絡み合いは脆弱であることを示すとともに,GGDは熱雑音に対する強い抵抗性を示し,Rmsの質量を増大させることによりさらに高めることができる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:45:24 GMT)
Floquet engineering of quantum thermal machines: A gradient-based spectral method to optimize their performance [0.0] 量子サーマルエンジン (QTM) の最適条件を求める手法について述べ, 実演した。
QTMは、開量子系の周期的に駆動される非平衡定常状態としてモデル化される。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 19:52:36 GMT)
Extended Generalized Uncertainty Principles, Liouville theorem and density of states: Snyder-De Sitter and Yang models [0.0] 一般化不確実性原理(GUP)と拡張不確実性原理(EUP)は、小・大距離で量子重力効果を導入する。
GUPとEUPの組み合わせ、拡張一般化不確実性原理(EGUPまたはGEUP)は、座標とモータの両方に非可換性を導入することでこれらの修正をさらに一般化する。
本稿では、非相対論的量子力学の枠組みにおける統計物理学および状態密度におけるEGUPのLiouville定理への影響について検討する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:43:05 GMT)
EdaCSC: Two Easy Data Augmentation Methods for Chinese Spelling Correction [0.0] Chinese Spelling Correction (CSC) は、音韻的・視覚的類似性に起因する中国語文の綴り誤りを検出し、訂正することを目的としている。
これらの制約に対処する2つのデータ拡張手法を提案する。
まず,長文を短い文に分割するか,複数文字の文の型を減らしてデータセットを増強する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 14:29:10 GMT)
Developing an Explainable Artificial Intelligent (XAI) Model for Predicting Pile Driving Vibrations in Bangkok's Subsoil [0.0] 本研究では,バンコク軟質土質土中における杭の振動を予測するための説明可能な人工知能(XAI)モデルを提案する。
深層ニューラルネットワークは1018個の実世界の杭駆動のデータセットを用いて開発された。
このモデルは0.276の平均絶対誤差(MAE)を達成し、従来の経験的手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 10:13:35 GMT)
Comparison of Two Augmentation Methods in Improving Detection Accuracy of Hemarthrosis [0.0] 本研究では,データ合成による拡張データの導入や,従来の拡張手法によるモデル精度の向上について検討した。
EffientNet-B4を用いて2つの拡張手法で「血」画像を認識するモデルテスト性能について検討した。
データ合成と従来の拡張技術という2つの拡張手法はどちらも、稀な疾患の診断に役立つ精度をある程度向上させる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 21:43:54 GMT)
CoLaNET -- A Spiking Neural Network with Columnar Layered Architecture for Classification [0.0] 本稿では、幅広い教師付き学習分類タスクに使用できるスパイキングニューラルネットワーク(SNN)アーキテクチャについて述べる。
全ての参加信号(分類対象記述、正しいクラスラベル、SNN決定)がスパイクの性質を持つと仮定する。
モデルに基づく強化学習に関わる課題に対して,私のネットワークの性能について解説する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 12:07:18 GMT)
Bellwether Trades: Characteristics of Trades influential in Predicting Future Price Movements in Markets [0.0] 我々は、重要な情報を含む取引の特徴を特定するために、強力な非線形機械学習手法を活用している。
まず、将来の市場の動きを正確に予測する上で、最適化されたニューラルネットワーク予測器の有効性を示す。
次に、この成功したニューラルネットワーク予測器から得られる情報を用いて、最適化されたニューラルネットワークの将来の価格変動予測に最も影響した各データポイント(トレーディングウィンドウ)内の個々の取引をピンポイントする。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 18:59:52 GMT)
Attention-Based Efficient Breath Sound Removal in Studio Audio Recordings [0.0] 非音声音声の自動検出と消去のための革新的でパラメータ効率の良いモデルを提案する。
提案モデルは,高度な深層学習技術の適用により達成された,合理化プロセスと優れた精度を提供することによって,限界に対処する。
我々のモデルは、音響技術者にとって貴重な時間を節約するだけでなく、オーディオ制作の品質と一貫性も向上させる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 02:11:33 GMT)
A Remote Control Painting System for Exterior Walls of High-Rise Buildings through Robotic System [0.0] 本稿では,建築壁の外装を自動塗装するプロトタイプを提案する。
試作機では4方向を移動可能な噴霧機構が導入された。
すべての操作は、スマートフォンのインターフェイスからリモートで制御される。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:37:27 GMT)
A Novel Efficient Multiparty Semi-Quantum Secret Sharing Protocol Using Entangled States for Sharing Specific Bits [0.0] 本稿では,ベル状態間の量子特性を用いて,盗聴者を検出する新しい多人数SQSS方式を提案する。
完全に一方通行の通信方式を採用しており、高価な量子デバイスを使わずにトロイの木馬の攻撃を完全に防いでいる。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 16:40:56 GMT)
A Low-Computational Video Synopsis Framework with a Standard Dataset [0.0] ビデオ合成は、監視ビデオの凝縮に有効な方法である。
ビデオ合成タスクの標準データセットの欠如は、異なるビデオ合成モデルの比較を妨げる。
本稿では,計算コストの低いFGSというビデオ合成モデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 22:08:36 GMT)
A Data-to-Product Multimodal Conceptual Framework to Achieve Automated Software Evolution for Context-rich Intelligent Applications [0.0] 本研究では,ソフトウェアの自動進化を実現するための概念的枠組みを提案する。
概念的枠組みに基づいて選択的シーケンススコープモデル(3S)モデルを開発する。
この研究はインテリジェントなアプリケーションに関するものだが、フレームワークと分析方法は、AIが彼らのライフサイクルにより多くのインテリジェンスをもたらすため、他のタイプのソフトウェアに適用される可能性がある。
論文参考訳(メタデータ) (Sun, 8 Sep 2024 03:36:45 GMT)