WavLLM: Towards Robust and Adaptive Speech Large Language Model [93.1] 本稿では,2つのエンコーダを持つ頑健で適応的な音声大言語モデルであるWavLLMと,プロンプト対応のLoRA重み付けアダプタを紹介する。
ASR, ST, SV, ERなどのタスクを含むユニバーサル音声ベンチマークにおいて提案手法の有効性を検証し, SQA用ガオカオ英語聴取理解セット, CoT 評価セットなどの特殊データセットに適用する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:27:30 GMT)
Instruction Following without Instruction Tuning [87.7] 命令チューニングに比較して不十分な2種類の適応(チューニング)があるが、それでも命令に従うことができる。
我々は、事前訓練されたモデルを用いて、エキスパート製品における指示に従うルールベースの言語モデルを手書きで支援する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 22:36:22 GMT)
Re-Reading Improves Reasoning in Large Language Models [87.5] 既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。
CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。
提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:24:45 GMT)
GraphMLP: A Graph MLP-Like Architecture for 3D Human Pose Estimation [68.7] GraphMLPは3次元ポーズ推定のためのグローバル-ローカル-グラフィック統合アーキテクチャである。
人体のグラフ構造をモデルに組み込んで、3D人間のポーズのドメイン固有の要求を満たす。
複雑な時間力学を単純な方法でモデル化するために拡張することができ、列長の計算コストは無視できる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:46:31 GMT)
Hype, Sustainability, and the Price of the Bigger-is-Better Paradigm in AI [67.6] AIパラダイムは、科学的に脆弱なだけでなく、望ましくない結果をもたらすものだ、と私たちは主張する。
第一に、計算要求がモデルの性能よりも早く増加し、不合理な経済要求と不均等な環境フットプリントにつながるため、持続可能ではない。
第二に、健康、教育、気候などの重要な応用は別として、他人を犠牲にして特定の問題に焦点をあてることである。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:43:54 GMT)
The Imperative of Conversation Analysis in the Era of LLMs: A Survey of Tasks, Techniques, and Trends [65.0] 会話分析(CA)は、会話データから重要な情報を発見し分析する。
本稿では,CAタスクの徹底的なレビューとシステム化を行い,既存の業務を要約する。
会話シーンの再構築,奥行きの属性分析,ターゲットトレーニングの実行,会話の生成から,CAの4つの重要なステップを導出した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:52:43 GMT)
ChemEval: A Comprehensive Multi-Level Chemical Evaluation for Large Language Models [62.4] この領域の既存のベンチマークは、化学研究専門家の特定の要求を適切に満たさない。
ChemEvalは化学の4つの重要な進歩レベルを特定し、42の異なる化学タスクで12次元のLCMを評価する。
その結果, LLMは文献の理解と指導に優れる一方で, 高度な化学知識を必要とするタスクでは不足していることがわかった。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:50:43 GMT)
Chain of Thought Empowers Transformers to Solve Inherently Serial Problems [57.6] 思考の連鎖(CoT)は、算術や記号的推論タスクにおいて、大きな言語モデル(LLM)の精度を向上させるための非常に効果的な方法である。
この研究は、表現性のレンズを通してデコーダのみの変換器に対するCoTのパワーを理論的に理解する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:48:45 GMT)
Verification of Geometric Robustness of Neural Networks via Piecewise Linear Approximation and Lipschitz Optimisation [57.1] 我々は、回転、スケーリング、せん断、翻訳を含む入力画像の幾何学的変換に対するニューラルネットワークの検証の問題に対処する。
提案手法は, 分枝・分枝リプシッツと組み合わせたサンプリングおよび線形近似を用いて, 画素値に対する楽音線形制約を求める。
提案手法では,既存の手法よりも最大32%の検証ケースが解決されている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 18:19:03 GMT)
Component-based Sketching for Deep ReLU Nets [55.4] 各種タスクのためのディープネットコンポーネントに基づくスケッチ手法を開発した。
我々はディープネットトレーニングを線形経験的リスク最小化問題に変換する。
提案したコンポーネントベーススケッチは飽和関数の近似においてほぼ最適であることを示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:30:43 GMT)
When AI Meets Finance (StockAgent): Large Language Model-based Stock Trading in Simulated Real-world Environments [55.2] LLMによって駆動される、StockAgentと呼ばれるマルチエージェントAIシステムを開発した。
StockAgentを使えば、ユーザーはさまざまな外部要因が投資家取引に与える影響を評価することができる。
AIエージェントに基づく既存のトレーディングシミュレーションシステムに存在するテストセットのリーク問題を回避する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:09:08 GMT)
Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.7] 本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:02:47 GMT)
PhyBench: A Physical Commonsense Benchmark for Evaluating Text-to-Image Models [50.3] テキスト・トゥ・イメージ(T2I)モデルは、物理コモンセンスと整合した画像を生成するのにしばしば失敗する。
現在のT2I評価ベンチマークは、精度、バイアス、安全性などの指標に焦点を当て、モデルの内部知識の評価を無視している。
メカニクス,光学,熱力学,材料特性の4つのカテゴリに700のプロンプトを含む総合的なT2I評価データセットであるPhyBenchを紹介する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:53:58 GMT)
R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models [50.2] 我々は、エージェントがスパース・リワード、継続的なアクション、ゴールベースのロボット制御POMDP環境においてエクササイズするのを助けるために、事前の選好学習手法と自己修正スケジュールを導入する。
我々のエージェントは、累積報酬、相対安定性、成功率の観点から、最先端モデルよりも優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 18:32:44 GMT)
SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.2] より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。
提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:46:16 GMT)
Large Language Model as an Assignment Evaluator: Insights, Feedback, and Challenges in a 1000+ Student Course [49.3] 大規模言語モデル(LLM)を自動評価に用いることは,NLP研究において重要な評価手法となっている。
本報告では,1028人の大学生を対象に,GPT-4を自動課題評価装置として利用する方法について述べる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:37:32 GMT)
Multiple-Exit Tuning: Towards Inference-Efficient Adaptation for Vision Transformer [47.9] マルチエクイットチューニング(MET)と呼ばれる推論効率のチューニング手法を提案する。
METは、複数の出口を事前訓練された視覚変換器(ViT)のバックボーンに統合する。
推論段階では、簡単なサンプルは早期の出口で終了し、十分なサンプルだけが最後の出口に流れるので、簡単なサンプルの計算コストを節約できる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:25:18 GMT)
RoTBench: A Multi-Level Benchmark for Evaluating the Robustness of Large Language Models in Tool Learning [45.4] ツール学習における大規模言語モデルの堅牢性を評価するためのベンチマークであるRoTBenchを紹介する。
広く使われている6つのモデルを含む実験は、ツール学習におけるLLMの堅牢性を高めるための緊急の必要性を浮き彫りにした。
ツール学習におけるLDMの堅牢性を高めるために,学習環境の多様性を充実させる戦略であるRoTTuningを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:03:33 GMT)
KALIE: Fine-Tuning Vision-Language Models for Open-World Manipulation without Robot Data [45.3] 本稿では,ロボット制御をスケーラブルに行うために,KALIE(Keypoint Affordance Learning from Imagined Environments)を提案する。
モーターコマンドを直接生成する代わりに、KALIEはポイントベースの価格表現を予測してロボットを制御する。
我々はKALIEが、50個のデータポイントしか持たない未確認オブジェクトで、新しい操作タスクを堅牢に解くことができることを実証した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:45:16 GMT)
CKBP v2: Better Annotation and Reasoning for Commonsense Knowledge Base Population [44.1] Commonsense Knowledge Bases (CSKB) PopulationはCSKBの知識を外部リソースで自動的に拡張することを目的としている。
CKBP v2はアノテータとしてドメインの専門家を雇い、評価データをより代表的なものにするために多彩な反対サンプルを取り入れている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:58:54 GMT)
Data-centric NLP Backdoor Defense from the Lens of Memorization [41.4] まず,言語モデルのメモリ化の定義を,サンプル単位からよりきめ細かな文要素単位に拡張する。
このような記憶の強さは、トレーニングデータセットにおける重複要素の頻度と正の相関関係があることが判明した。
結果として、バックドア攻撃を成功させるためには、重複文要素が必要である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 17:12:18 GMT)
PoseAugment: Generative Human Pose Data Augmentation with Physical Plausibility for IMU-based Motion Capture [40.8] VAEベースのポーズ生成と物理最適化を取り入れた新しいパイプラインであるPoseAugmentを提案する。
ポーズシーケンスが与えられた場合、VAEモジュールはデータ分布を維持しながら、高忠実度と多様性の両方で無限のポーズを生成する。
高品質なIMUデータは、モーションキャプチャーモデルを訓練するための強化されたポーズから合成される。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 10:51:16 GMT)
Recent Advances in OOD Detection: Problems and Approaches [40.3] Out-of-Distribution(OOD)検出は、トレーニングカテゴリ空間外のテストサンプルを検出することを目的としている。
評価シナリオ,様々な応用,今後の研究方向性について論じる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:36:21 GMT)
SMART-RAG: Selection using Determinantal Matrices for Augmented Retrieval [40.2] Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)を大幅に改善し、正確で文脈に根ざした応答を生成する。
RAGアプローチは、クエリコンテキストの関連性のみに基づくトップランクのドキュメントを優先し、冗長性と矛盾する情報をしばしば導入する。
本稿では,RAGにおける文脈選択の最適化を目的とした,教師なしおよびトレーニング不要なフレームワークであるRAG(Mathrices for Augmented Retrieval)によるタスク応答のための選択を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:03:09 GMT)
Combining Absolute and Semi-Generalized Relative Poses for Visual Localization [39.2] 最先端のローカライゼーションアプローチでは、クエリ画像中のピクセルとシーン内の3Dポイントの2D-3Dマッチングを使用してポーズ推定を行う。
対照的に、構造のない手法は2D-2Dマッチングに依存しており、3Dシーンモデルを必要としない。
両戦略を組み合わせることで,複数の現実的なシナリオにおけるローカライズ性能が向上することを示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:55:42 GMT)
Graph Learning and Its Advancements on Large Language Models: A Holistic Survey [37.0] この調査は、グラフ学習と事前訓練された言語モデルの統合における最新の進歩に焦点を当てる。
グラフ構造の観点から現在の研究を解析し、グラフ学習における最新の応用、トレンド、課題について論じる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:02:52 GMT)
Set-CLIP: Exploring Aligned Semantic From Low-Alignment Multimodal Data Through A Distribution View [35.4] マルチモーダル融合は様々なモダリティの境界を突破し、既に顕著な性能を達成している。
多くの専門分野において、トレーニングに十分なアライメントデータを得るのに苦労している。
本稿では,CLIPに基づく新しい手法であるSet-CLIPを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:50:33 GMT)
On Lexical Invariance on Multisets and Graphs [25.8] 我々は、多重集合とグラフの媒質を用いて、語彙不変性と呼ばれる新しい問題を研究する。
本稿では,入力語彙空間に適用された任意の射影変換に対して関数の出力が不変となる,より困難な設定について検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:52:01 GMT)
Reasoning Runtime Behavior of a Program with LLM: How Far Are We? [25.5] コードのための大規模な言語モデル(LLM)は、強力なコード理解と生成能力を示している。
コード推論は、コードLLMの最も重要な能力の1つである。
本稿では,プログラム実行によるLLMのコード推論能力と一貫性を評価するためのフレームワークであるRevalを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:48:58 GMT)
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.4] SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。
SSLはデータから直接監視信号を構築することを目的としている。
本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:48:14 GMT)
Can LLMs replace Neil deGrasse Tyson? Evaluating the Reliability of LLMs as Science Communicators [22.6] 大規模言語モデル(LLM)とAIアシスタントは、専門家とアマチュアユーザーの両方で、指数関数的な利用増加を経験している。
本研究では,現在のLLMの信頼性を科学コミュニケータとして評価することに焦点を当てる。
複雑な科学概念に埋め込まれた742 Yes/No クエリからなる新しいデータセット SCiPS-QA を導入する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:48:32 GMT)
Perfect Gradient Inversion in Federated Learning: A New Paradigm from the Hidden Subset Sum Problem [21.5] フェデレートラーニング(FL)は、複数の組織間で協調学習するための一般的なパラダイムとして登場した。
FLで共有される勾配情報を用いて入力再構成問題をHidden Subset Sum problemとして定式化する。
我々の分析は、なぜより大きなバッチサイズで経験的入力再構成攻撃が劣化したのかを洞察する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:01:33 GMT)
Improving 3D Semi-supervised Learning by Effectively Utilizing All Unlabelled Data [21.0] 半教師付き学習(SSL)は,少量のラベル付きデータから有効な3次元表現を学習する上での有効性を示した。
SSLベースの新しい3D分類フレームワークであるAllMatchを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:53:52 GMT)
Enhancing Advanced Visual Reasoning Ability of Large Language Models [20.3] VL(Vision-Language)研究の最近の進歩は、複雑な視覚的推論のための新しいベンチマークを引き起こした。
我々はCVR-LLM(Complex Visual Reasoning Large Language Models)を提案する。
提案手法は,反復的自己修正ループを用いて,画像の詳細なコンテキスト認識記述に変換する。
また、LLMの文脈的理解と推論を強化するために、新しいマルチモーダル・インコンテキスト学習(ICL)手法を導入する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:10:19 GMT)
Avatar Concept Slider: Manipulate Concepts In Your Human Avatar With Fine-grained Control [20.1] Avatar Concept Slider (ACS) は、人間のアバターにおけるセマンティックな概念を正確に操作できる3Dアバター編集法である。
その結果,ACSは3次元アバターの微細な編集を効率よく行うことができることがわかった。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:15:28 GMT)
AgentsCourt: Building Judicial Decision-Making Agents with Court Debate Simulation and Legal Knowledge Augmentation [19.7] 本稿では,司法判断のための新しいマルチエージェントフレームワーク,AgentsCourtを提案する。
弊社の枠組みは,裁判所の審理シミュレーション,法的資源の検索,意思決定の洗練など,古典的な審理過程を踏襲している。
この課題を支援するために,多リソースの法知識を持つ大規模法知識基盤であるLegal-KBを構築した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:49:53 GMT)
Co-occurrence is not Factual Association in Language Models [19.7] 言語モデルは,真の事実関連性ではなく,単語共起統計の学習に偏りがあることが示される。
本稿では,言語モデルにおける事実関連性の学習を改善するための2つの戦略を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:13:16 GMT)
GReDP: A More Robust Approach for Differential Private Training with Gradient-Preserving Noise Reduction [19.7] 我々は、GReDPと呼ばれる微分プライバシートレーニングに対して、より堅牢なアプローチを提案する。
周波数領域におけるモデル勾配を計算し、ノイズレベルを低減するための新しいアプローチを採用する。
これまでの研究とは異なり、我々のGReDPはDPSGDに比べてノイズスケールの半分しか必要としない。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 04:06:00 GMT)
Interpreting Arithmetic Mechanism in Large Language Models through Comparative Neuron Analysis [19.5] 演算能力は限られた数の注目ヘッド内に存在し、それぞれ異なる操作を専門とする。
本稿では,入力から予測までの4段階からなる内部論理チェーンを同定する,比較ニューロン解析(CNA)手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:46:54 GMT)
Vec2Face: Scaling Face Dataset Generation with Loosely Constrained Vectors [19.0] Vec2Faceは、サンプルベクターのみを入力として使用する総合モデルである。
Vec2Faceは顔画像再構成によって管理されており、推論に便利に使用できる。
Vec2Faceは、1500万枚の画像を含む3万個のIDを効率的に合成している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:04:29 GMT)
Training Large ASR Encoders with Differential Privacy [18.6] 大規模音声モデルのための自己教師付き学習(SSL)手法は、ASRにおいて非常に効果的であることが証明されている。
大規模な事前学習モデルの公開展開に関心があるため、意図しない記憶と、トレーニングデータからの機密データポイントの漏洩に対する懸念が高まっている。
本稿では,SOTA Conformer ベースのエンコーダに差分プライベート(DP)事前学習を適用し,微調整データを公開していると仮定した下流 ASR タスクにおいて,その性能について検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 00:01:49 GMT)
Advancing Medical Image Segmentation with Mini-Net: A Lightweight Solution Tailored for Efficient Segmentation of Medical Images [18.5] Mini-Netは医療画像用に設計された軽量セグメンテーションネットワークである。
パラメータが38,000未満のMini-Netは、高周波数と低周波数の両方を効率的にキャプチャする。
DRIVE, STARE, ISIC-2016, ISIC-2018, MoNuSegなど,様々なデータセット上でMini-Netを評価する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:05:31 GMT)
3D Unsupervised Learning by Distilling 2D Open-Vocabulary Segmentation Models for Autonomous Driving [17.4] 2次元開語彙セグメンテーションモデルを用いた新しい3次元教師なしフレームワークUOVを提案する。
最初の段階では、2次元オープン語彙モデルの高品質なテキストと画像の特徴を革新的に統合する。
第2段階では、点雲と画像の間の空間マッピングを利用して擬似ラベルを生成する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:25:40 GMT)
BurstM: Deep Burst Multi-scale SR using Fourier Space with Optical Flow [16.5] マルチフレーム超解像(MFSR)は単一画像超解像(SISR)よりも高い性能を達成する
最近のMFSRアプローチは、変形可能な畳み込みネットワーク(DCN)に適応してフレームを整列させる。
光フローを用いたフーリエ空間を用いたディープバーストマルチスケールSR(BurstM)を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:30:57 GMT)
MEGA-PT: A Meta-Game Framework for Agile Penetration Testing [13.3] MEGA-PTはメタゲーム浸透テストフレームワークである。
ノードレベルのローカルインタラクションのためのマイクロ戦術ゲームと、ネットワーク全体のアタックチェーンのためのマクロ戦略プロセスを備えている。
防衛戦略の改善と、ローカルレベルとネットワークレベルの変更への適応性を提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 18:46:29 GMT)
Automated Security Response through Online Learning with Adaptive Conjectures [13.3] 我々はITインフラに対する自動セキュリティ対応について研究する。
我々は攻撃者とディフェンダーとの相互作用を部分的に観察された非静止ゲームとして定式化する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:26:58 GMT)
A Survey on Multimodal Benchmarks: In the Era of Large AI Models [13.3] MLLM(Multimodal Large Language Models)は、人工知能に大きな進歩をもたらした。
この調査は、4つのコアドメイン(理解、推論、生成、アプリケーション)にわたるMLLMを評価する211のベンチマークを体系的にレビューする。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:22:26 GMT)
CSKV: Training-Efficient Channel Shrinking for KV Cache in Long-Context Scenarios [13.1] KVキャッシュ圧縮のための訓練効率の高いチャネルシンキング手法を提案する。
CSKVは、モデル長文機能を維持しながら、KVキャッシュのメモリオーバーヘッドを80%削減できることを示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:01:43 GMT)
End-to-End Full-Page Optical Music Recognition for Pianoform Sheet Music [12.8] 我々は、ページレベルの光音楽認識のための、真にエンドツーエンドなアプローチを初めて提示する。
本システムでは,音楽スコアページ全体を処理し,完全書き起こしを楽曲エンコーディング形式で出力する。
その結果,本システムは,全ページの楽譜の書き起こしに成功しただけでなく,ゼロショット設定とターゲットドメインとの微調整の両面において,商業ツールよりも優れていた。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:18:58 GMT)
Generative AI for Health Technology Assessment: Opportunities, Challenges, and Policy Considerations [12.7] 本稿では、医療技術評価(HTA)のための生成人工知能(AI)と大規模言語モデル(LLM)を含む基礎モデルについて紹介する。
本研究は, 4つの重要な領域, 合成証拠, 証拠生成, 臨床試験, 経済モデリングにおける応用について検討する。
約束にもかかわらず、これらの技術は急速に改善されているものの、まだ初期段階にあり、HTAへの適用には慎重な評価が引き続き必要である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:41:09 GMT)
Probing Context Localization of Polysemous Words in Pre-trained Language Model Sub-Layers [12.6] プレトレーニング言語モデル(PLM)の細粒度サブレイヤ表現に符号化された文脈化の程度について検討する。
文脈化へのサブレイヤの主な貢献を識別するために、まず、最小限の異なる文対における多文単語のサブレイヤ表現を抽出する。
また,これらのサブレイヤ表現に符号化された文脈化情報の強みを実証的にローカライズする。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 10:42:07 GMT)
Graph Neural Network Framework for Sentiment Analysis Using Syntactic Feature [12.6] 本研究は,話題記述者の位置的手がかりに適合する複合的枠組みを推し進める。
この統合グラフ中心のスキームは、評価的分類の有効性を著しく高めるという試行がなされている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:30:59 GMT)
DRAGIN: Dynamic Retrieval Augmented Generation based on the Information Needs of Large Language Models [12.6] 大規模言語モデル(LLM)のリアルタイム情報要求に基づく動的検索拡張生成を導入する。
本フレームワークは,テキスト生成プロセスにおいて,LLMのリアルタイム情報要求に基づいて,いつ,何を取得するかを決定するように設計されている。
実験の結果,DRAGINは全タスクにおいて優れた性能を示し,本手法の有効性を実証した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:27:16 GMT)
Batches Stabilize the Minimum Norm Risk in High Dimensional Overparameterized Linear Regression [12.4] 最小ノルム過パラメータ線形回帰モデルのレンズによるバッチ分割の利点を示す。
最適なバッチサイズを特徴付け、ノイズレベルに逆比例することを示す。
また,Weiner係数と同等の係数によるバッチ最小ノルム推定器の縮小がさらに安定化し,全ての設定において2次リスクを低くすることを示した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:39:26 GMT)
Are Music Foundation Models Better at Singing Voice Deepfake Detection? Far-Better Fuse them with Speech Foundation Models [12.0] 歌唱音声深度検出(SVDD)において,音楽基礎モデル (MFM) と音声基礎モデル (SFM) が有効かを検討した。
話者認識SFM表現は、すべての基礎モデル(FM)の中で最高である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:50:53 GMT)
LATTE: Improving Latex Recognition for Tables and Formulae with Iterative Refinement [11.9] LATTEは、式と表の両方のソース抽出精度を改善し、既存の技術とGPT-4Vより優れている。
本稿では,認識のための最初の反復的改良フレームワークであるLATTEを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 17:18:49 GMT)
Adversarial Attacks on Parts of Speech: An Empirical Study in Text-to-Image Generation [11.6] テキストプロンプト内の異なるPOSタグに対する敵対攻撃がT2Iモデルによって生成された画像に与える影響について検討する。
その結果,攻撃成功率 (ASR) はPOSタグのカテゴリーによって大きく異なることがわかった。
反対接尾辞の操舵効果のメカニズムを考察し, POSタグに有意なトークン数と内容の融合数が異なることを見出した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:19:55 GMT)
Data Generation via Latent Factor Simulation for Fairness-aware Re-ranking [11.1] 合成データはアルゴリズム研究に有用な資源である。
フェアネスを意識したリコメンデーションのための新しいタイプのデータ: 合成レコメンデーションシステム出力を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:13:50 GMT)
QMOS: Enhancing LLMs for Telecommunication with Question Masked loss and Option Shuffling [10.4] GPT-3.5は、最近の研究で、Retrieval Augmented Generationフレームワークにおいて、通信関連質問に対する注目すべき精度を得るために使われている。
本稿では、QMOSについて述べる。QMOSは、電信分野における複数の質問に答える際のLLMの性能を高めるために、Q-Masked LosとOption Shufflingのトリックを利用する革新的な手法である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:32:10 GMT)
Sublinear Regret for a Class of Continuous-Time Linear--Quadratic Reinforcement Learning Problems [10.4] 拡散に対する連続時間線形四元数制御(LQ)のクラスに対する強化学習について検討した。
本研究では,モデルパラメータの知識にも,その推定にも依存しないモデルフリーアプローチを適用し,最適なポリシーパラメータを直接学習するためのアクタ批判アルゴリズムを考案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:48:58 GMT)
StateAct: State Tracking and Reasoning for Acting and Planning with Large Language Models [10.4] 対話型環境における大規模言語モデル(LLM)を用いたリアルタスクの計画と実行が,AI手法の新たなフロンティアとなっている。
LLMの計画と動作のための状態追跡によるチェーン・オブ・シントの強化を目的とした,数発のインコンテキスト学習のみに基づく簡易な手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 05:54:35 GMT)
LFP: Efficient and Accurate End-to-End Lane-Level Planning via Camera-LiDAR Fusion [9.5] マルチモーダルシステムは自律走行の性能を高めるが、各モーダル内での非差別処理による非効率性に直面する。
我々は,重要な情報を保持しながら,LiDAR特徴量の削減を図った駆動関連要素をターゲットとして提案する。
このアプローチは、画像とLiDARブランチ間のレーンレベル相互作用を強化し、それぞれの有利な特徴の抽出と融合を可能にする。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:22:01 GMT)
P2LHAP:Wearable sensor-based human activity recognition, segmentation and forecast through Patch-to-Label Seq2Seq Transformer [9.5] P2LHAPは、効率的なシングルタスクモデルで3つのタスクすべてに取り組む新しいフレームワークである。
センサデータストリームを"パッチ"のシーケンスに分割し、入力トークンとして機能し、パッチレベルのアクティビティラベルのシーケンスを出力する。
センサ信号チャネルに依存しないトランスフォーマーエンコーダとデコーダによるパッチレベルの表現を学習する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:53:15 GMT)
OV-NeRF: Open-vocabulary Neural Radiance Fields with Vision and Language Foundation Models for 3D Semantic Understanding [9.3] OV-NeRFは、事前訓練されたビジョンと言語基盤モデルのポテンシャルを利用して、セマンティックフィールド学習を強化する。
提案手法は, Replica と ScanNet の mIoU 測定値において, 20.31% と 18.42% の大幅な改善を実現している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:06:21 GMT)
CUS3D :CLIP-based Unsupervised 3D Segmentation via Object-level Denoise [9.1] CUS3Dという新しい蒸留学習フレームワークを提案する。
オブジェクトレベルのデノシングプロジェクションモジュールは、ノイズのスクリーニングとより正確な3D機能を保証するように設計されています。
得られた特徴に基づき、3D特徴とCLIP意味的特徴空間を整合させる多モード蒸留学習モジュールを設計した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:17:35 GMT)
Cloud Adversarial Example Generation for Remote Sensing Image Classification [9.0] リモートセンシング画像に対する既存の敵攻撃手法の多くは、単に敵の摂動やパッチを追加するだけである。
パーリンノイズに基づくクラウド生成攻撃法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 20:15:22 GMT)
GroupDebate: Enhancing the Efficiency of Multi-Agent Debate Using Group Discussion [8.9] 本稿では,マルチエージェントの議論においてトークンコストを大幅に削減する手法を提案する。
本手法は,マルチエージェント討論におけるインタラクションの性能と効率を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:49:38 GMT)
Monocular Event-Inertial Odometry with Adaptive decay-based Time Surface and Polarity-aware Tracking [8.7] イベントカメラは、消費電力が低く、ダイナミックレンジが高く、動きがぼやけていない従来のカメラよりも利点があるため、かなりの注目を集めている。
本稿では,極性認識トラッキングを備えた適応型減衰カーネルベース時間面を応用した単分子イベント慣性オドメトリーを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:35:12 GMT)
Recovering Global Data Distribution Locally in Federated Learning [7.9] Federated Learning(FL)は、複数のクライアント間のコラボレーションを可能にする分散機械学習パラダイムである。
FLにおける大きな課題はラベルの不均衡であり、クライアントは少数派と欠落したクラスを多数持っている間、特定のクラスを独占する可能性がある。
本稿では,この課題に対処するための新しいアプローチであるReGLを提案し,その鍵となる考え方は,グローバルなデータ分布を局所的に検索することである。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:35:04 GMT)
ExFMan: Rendering 3D Dynamic Humans with Hybrid Monocular Blurry Frames and Events [7.8] ハイブリットフレームベースのRGBとバイオインスパイアされたイベントカメラを用いて,高品質な人間を高速動作でレンダリングする,最初のニューラルレンダリングフレームワークであるExFManを提案する。
まず、標準空間における3次元物体の速度場を定式化し、それを画像空間に描画して、動きのぼやけのある身体部位を識別する。
次に,2つの新たな損失,すなわちベロシティ対応光度損失とベロシティ関連事象損失を提案し,ニューラル・ヒューマンを両モードで最適化する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 10:58:01 GMT)
CubicML: Automated ML for Large ML Systems Co-design with ML Prediction of Performance [7.4] ディープラーニングモデルのスケールアップは、機械学習モデル(ML)のインテリジェンスを改善するために有効であることが証明されている。
本稿では,大規模分散MLシステムのトレーニング性能を自動最適化するCuicMLを提案する。
我々は,CubicMLがメタ広告において,73億のパラメータと最大4050億のパラメータを持つ社内推薦モデルのトレーニング速度を効果的に最適化できることを証明した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 05:55:30 GMT)
One Model, Any Conjunctive Query: Graph Neural Networks for Answering Complex Queries over Knowledge Graphs [7.3] 我々は,知識グラフ上の任意の共役クエリに対する回答を分類可能なグラフニューラルネットワークモデルであるAnyCQを提案する。
我々は、AnyCQが任意の構造を持つ大規模クエリに一般化できることを示し、既存のアプローチが失敗するサンプルに対する回答を確実に分類し、検索する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 00:30:44 GMT)
IPF-HMGNN: A novel integrative prediction framework for metro passenger flow [7.1] 階層型メッセージパッシンググラフニューラルネットワーク(IPF-HMGNN)を用いた新しい統合予測フレームワークを提案する。
従来の予測手法では、我々のIPF-HMGNNは、GNN予測モデルの平均絶対誤差(MAE)と根平均二乗誤差(RMSE)をそれぞれ49.56%、53.88%削減できる。
階層的予測アプローチでは、IPF-HMGNNは、階層的制約を満たすことなく、MAEで35.32%、RMSEで36.18%の最大還元を達成することができる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 11:11:05 GMT)
Bias and Toxicity in Role-Play Reasoning [6.9] LLM(Large Language Model)におけるロールプレイ(Role-play)は、モデルが特定の視点を採用することを可能にする重要なテクニックである。
ロールプレイは潜在的なリスクももたらします。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:09:13 GMT)
ChatEDA: A Large Language Model Powered Autonomous Agent for EDA [6.9] 本稿では, LLM, AutoMage, EDAツールがエグゼクタとして機能するEDA用自律エージェントChatEDAを紹介する。
ChatEDAは、タスク分解、スクリプト生成、タスク実行を効果的に管理することで、登録-転送レベル(RTL)からグラフデータシステムバージョンII(GDSII)への設計フローを合理化する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:28:05 GMT)
Holistic and Historical Instance Comparison for Cervical Cell Detection [6.7] 本稿では,頚部細胞検出のための総合的,歴史的事例比較手法を提案する。
具体的には、まず、RoIレベルとクラスレベルの細胞識別を併用した総合的な事例比較スキームを開発する。
この粗い細胞間比較は、モデルが前景の区別可能なクラスワイド表現を学習することを奨励する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:36:19 GMT)
Traffic Scenario Logic: A Spatial-Temporal Logic for Modeling and Reasoning of Urban Traffic Scenarios [6.7] 交通シナリオ論理(Traffic Scenario Logic、TSL)は、都市における歩行者自由交通シナリオのモデル化と推論のために設計された時空間論理である。
我々は,TSLを実装したTSL(Telingo,すなわちAnswer Set Programmingに基づく時間的プログラムの解法)を,異なる都市道路レイアウト上でテストした。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:58:55 GMT)
Data Management in the Noisy Intermediate-Scale Quantum Era [6.6] 現在我々はNISQ(Noisy Intermediate-Scale Quantum)の時代にいる。
我々は、将来の量子指向データ管理研究の明確なコースをグラフ化し、NISQ時代の量子コンピューティングの発展の基盤として確立する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 11:55:11 GMT)
MUTE-SLAM: Real-Time Neural SLAM with Multiple Tri-Plane Hash Representations [6.3] MUTE-SLAMは、効率的なシーン表現のために複数の三平面ハッシュエンコーディングを使用するリアルタイムニューラルネットワークRGB-D SLAMシステムである。
MUTE-SLAMは、カメラの位置を効果的に追跡し、小型および大型の屋内環境のためのスケーラブルなマルチマップ表現を漸進的に構築する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:11:26 GMT)
Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.3] 小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:23:01 GMT)
LogicNet: A Logical Consistency Embedded Face Attribute Learning Network [6.2] 論理的一貫性のためにデータチェックでトレーニングされたモデルが、一貫性のある予測を得られるようにするには、どうすればいいでしょうか?
本稿では,属性間の論理的関係を学習する逆学習フレームワークであるLogicNetを提案する。
実世界の事例分析では,本手法は他の手法と比較して平均失敗件数の50%以上削減できる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:17:45 GMT)
DiabetesNet: A Deep Learning Approach to Diabetes Diagnosis [6.1] 3つのデータセットの実験結果は、従来の手法と比較して、全体的な精度、感度、特異性を大幅に改善したことを示している。
このことは、堅牢な糖尿病診断のためのディープラーニングモデルの可能性を示している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:40:49 GMT)
UniMo: Universal Motion Correction For Medical Images without Network Retraining [6.1] 我々は、深層ニューラルネットワークを利用したユニバーサルモーション補正フレームワークを導入し、多様な画像モダリティをまたいだ動き補正の課題に取り組む。
提案手法では,ニューラルネットワークアーキテクチャと同変フィルタを併用し,現行モデルの限界を克服する。
モーション補正のための総合的なソリューションを提供することで、UniMoは医療画像の大幅な進歩を示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 17:36:11 GMT)
Relevance-driven Decision Making for Safer and More Efficient Human Robot Collaboration [6.0] 我々は人間ロボットコラボレーション(HRC)に関する新しい概念を紹介した。
関連性は、人間の目的や他の要因に対する対象の適用性と関係性に基づく対象の重要性として定義される。
我々は、リアルタイムと非同期処理を統合した新しい2ループフレームワークを開発し、関連性を定量化し、より安全で効率的なHRCに適用した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:20:53 GMT)
End to End Face Reconstruction via Differentiable PnP [5.9] 本報告は、FortectiveV 2022 WCPA Challenge, Face Reconstruction Trackの課題報告である。
我々は,この課題を達成するために2分岐ネットワークを設計し,その役割はフェイスレコンストラクションとフェイスランドマークである。
我々の手法はMVP-Humanデータセット上で非常に競争力のある定量的結果を設計し、その挑戦で3$の賞金を獲得している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 21:30:24 GMT)
Dequantization and Color Transfer with Diffusion Models [5.2] 量子化されたイメージは、パッチベースの編集とパレット転送を簡単に抽象化する。
提案モデルでは,ユーザが求めているカラーパレットを尊重する自然な画像を生成できることが示される。
本手法は,画像のテクスチャを尊重しながら,画像のパッチを塗り替えることによって,別の実用的な編集に拡張することができる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 22:05:23 GMT)
LLM-dCache: Improving Tool-Augmented LLMs with GPT-Driven Localized Data Caching [5.2] ツール拡張エージェントに公開された呼び出し可能なAPI関数としてキャッシュ操作を扱い,データアクセスを最適化するLLM-dCacheを導入する。
LLMには、既存の関数呼び出し機構とシームレスに統合することで、キャッシュ決定を管理する自律性を提供します。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:10:02 GMT)
Addressing and Visualizing Misalignments in Human Task-Solving Trajectories [5.2] 本稿では,軌跡データにおける不一致を検出し,分類するための可視化ツールとアルゴリズムを提案する。
これらのミスアライメントを取り除くことで、AIモデルのトレーニングのための軌道データの有用性が大幅に向上することを期待しています。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:38:22 GMT)
Towards Lightweight and Privacy-preserving Data Provision in Digital Forensics for Driverless Taxi [5.1] 本稿では,3つのメカニズムからなる新しい軽量・プライバシ保護データプロビジョニング手法を提案する。
楕円曲線暗号に基づくプライバシーフレンドリなバッチ検証機構(PBVm)
データアクセス制御機構 (DACm) は、暗号文による属性ベースの暗号化に基づく。
秘密共有に基づくDIWIm(Discentralized IN Warrant Issuance Mechanism)
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:51:26 GMT)
Re-Evaluating Privacy in Centralized and Decentralized Learning: An Information-Theoretical and Empirical Study [4.8] Decentralized Federated Learning (DFL)は、その堅牢性とスケーラビリティに注目を集めている。
Pasquiniらによる最近の研究はこの見解に異議を唱え、DFLは経験的攻撃に対するプライバシーを本質的に改善していないことを実証している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:05:50 GMT)
Congestion Pricing for Efficiency and Equity: Theory and Applications to the San Francisco Bay Area [4.8] 本稿では,全旅行時間を最小限に抑え,公平な目標を取り入れた新たな渋滞価格体系を提案する。
サンフランシスコ・ベイエリアの校正高速道路網における料金体系について検討した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:09:40 GMT)
Can Language Model Understand Word Semantics as A Chatbot? An Empirical Study of Language Model Internal External Mismatch [4.6] 研究は、プロンプトと内部表現の相違を示す。
我々は,意味論のみ,デコーダのみ,デコーダのみ,およびデコーダのみを対象とする内部的および外部的ミスマッチにおける単語理解について検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:35:58 GMT)
Evaluation of waterway lock service quality in Yangtze Delta: from the perspectives of customer and supplier [4.6] 船員は船の係留の遅れについて最大の懸念を表明し、船の係留の安全性は管理局の管理者にとって主要な懸念事項である。
水路の係留施設の強化は、船室の係留中の乗組員の満足度を著しく向上させる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:28:11 GMT)
A Sinkhorn Regularized Adversarial Network for Image Guided DEM Super-resolution using Frequency Selective Hybrid Graph Transformer [4.4] DEM(Digital Elevation Model)は、リモートセンシング(RS)ドメインにおいて、表面標高に関する様々なアプリケーションを分析するための重要な側面である。
本稿では、HRマルチスペクトル(MX)衛星画像を用いた高分解能(HR)DEMの生成をガイドとして扱う。
本稿では,Sinkhorn 距離を古典的 GAN で最適化する手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:59:08 GMT)
Exploring Automated Keyword Mnemonics Generation with Large Language Models via Overgenerate-and-Rank [4.4] キーワード・ムネモニクス(英: Keywords mnemonics)は、単語を単語のキューを通じて記憶可能な関連性を通じて記憶する技法である。
そこで本稿では,大規模言語モデルに言語的手がかりを生成させる手法として,新しいオーバージェネレーション・アンド・ランク法を提案する。
以上の結果から, LLM生成のメネモニクスは, 画像性, コヒーレンス, 知覚的有用性の観点から, 人間生成のミネモニクスに匹敵するものであることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 00:00:18 GMT)
AI Assistants for Spaceflight Procedures: Combining Generative Pre-Trained Transformer and Retrieval-Augmented Generation on Knowledge Graphs With Augmented Reality Cues [4.4] 本稿では,国際宇宙ステーション(ISS)での宇宙飛行士支援を目的とした知的パーソナルアシスタント(IPA)の能力と可能性について述べる。
本稿では,オフライン操作が可能な信頼性とフレキシブルなアシスタントの重要性を考察し,チェックイン情報を直感的に表示するための拡張現実要素を用いた音声視覚インタラクションの有用性を強調した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 17:41:46 GMT)
High-Level Synthetic Data Generation with Data Set Archetypes [4.1] クラスタ分析は、異なるアルゴリズムの評価と比較に有効なベンチマークに依存している。
データセットのアーキタイプに基づく合成データ生成を提案する。
評価シナリオの言葉による記述からベンチマークを純粋に設定することが可能である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 21:52:34 GMT)
Soft Segmented Randomization: Enhancing Domain Generalization in SAR-ATR for Synthetic-to-Measured [4.1] ドメインの差を小さくし、自動目標認識モデルを一般化する能力を向上させるために設計された,新しいフレームワークであるソフトセグメントランダム化を導入する。
実験により,提案したソフトセグメントランダム化フレームワークは,測定された合成開口レーダデータに対するモデル性能を著しく向上することが示された。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 08:24:51 GMT)
Exploring the Limitations of Large Language Models in Compositional Relation Reasoning [3.3] 本稿では,1500の英語テストケースを含むベンチマークを用いて,大規模言語モデルの合成関係を推論する能力を総合的に評価する。
多言語能力の重要性を認め,これらの症例の中国語,日本語,フランス語,韓国語への翻訳を含むように評価を拡大した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:21:12 GMT)
Spatiotemporal Forecasting of Traffic Flow using Wavelet-based Temporal Attention [3.0] 本稿では,ウェーブレットに基づく動的グラフニューラルネットワーク(DS-DSNN)を交通予測問題に対処するための時間的アテンションモデルを提案する。
提案手法は動的時間的および空間的ベンチマークをよりよく処理し,信頼性の高い長期予測を行う。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:35:22 GMT)
2022 Flood Impact in Pakistan: Remote Sensing Assessment of Agricultural and Urban Damage [3.0] パキスタンは2022年6月に世界最多の洪水に見舞われ、農業とインフラの被害を受けた。
本研究は, 洪水が作物や集積地に与える影響を評価することを目的としている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:09:11 GMT)
Super-Heisenberg scaling in a triple point criticality [2.8] 我々は,三点付近の終点に接近して励起を抑え,指数関数的超ハイゼンベルクスケーリングへと導く,断熱的進化プロトコルを開発した。
このスケーリング挙動は、コヒーレンス時間に制限された実験を推定する実用的なパラメーターにおいて非常に有用である。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:27:59 GMT)
Predictive Model Development to Identify Failed Healing in Patients after Non-Union Fracture Surgery [2.8] 骨偽関節は外傷手術に最も重篤な合併症の一つである。
機械学習の最近の進歩は、非統一的治癒を予測するモデルを開発することを約束している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 20:40:03 GMT)
Generalization in birdsong classification: impact of transfer learning methods and dataset characteristics [2.7] 大規模な鳥音分類における伝達学習の有効性について検討する。
実験により, 微調整蒸留と知識蒸留の双方で高い性能が得られた。
動物音コミュニティにおけるより包括的なラベリングの実践を提唱する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 11:33:12 GMT)
Developing a Thailand solar irradiance map using Himawari-8 satellite imageries and deep learning models [2.6] 本稿では,タイの太陽放射マップを30分毎に表示するオンラインプラットフォームを提案する。
これらの方法は、MERRA-2データベースから、クリアスキー光、クラウドインデックス、再解析されたGHI、および温度データを取得する。
最も優れたモデルはLightGBMで、MAEは78.58W/sqm、RMSEは118.97W/sqmである。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 03:45:05 GMT)
Uncovering Latent Chain of Thought Vectors in Language Models [2.6] 本研究では,特定のタスクから派生した「ステアリングベクトル」を用いて,言語モデルの前方通過をバイアスする,ステアリングベクトルの手法について検討する。
自然言語を介さずに思考の連鎖(CoT)推論を行うための言語モデルに適用する。
このアプローチはCoT応答に対して一貫したステアリングをもたらし、CoTへの微調整モデルの従来の方法よりも計算量が少なくなる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 05:58:07 GMT)
Universal distribution of the empirical coverage in split conformal prediction [2.2] 我々は、将来の観測可能量の有限バッチに対して生成された予測集合の経験的カバレッジの正確な分布と、バッチサイズが無限大になるときにそのほぼ確実な限界の正確な分布を決定する。
どちらの分布も普遍的であり、名目上の発見レベルと校正サンプルサイズによってのみ決定される。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:17:08 GMT)
Symphony: Symmetry-Equivariant Point-Centered Spherical Harmonics for 3D Molecule Generation [2.1] シンフォニー(英: Symphony)は、分子断片から分子を反復的に生成する3次元分子ジオメトリーの自己回帰生成モデルである。
我々は,SymphonyがQM9データセットから精度よく小さな分子を生成できることを示し,既存の自己回帰モデルより優れ,拡散モデルの性能に近づいていることを示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 00:28:52 GMT)
An Instance-based Plus Ensemble Learning Method for Classification of Scientific Papers [2.1] 本稿では,科学論文の分類に事例ベース学習とアンサンブル学習を併用した新しい手法を提案する。
実験の結果,提案手法は論文を様々な研究領域に分類する上で効果的かつ効果的であることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:42:15 GMT)
Quantum Computing for Automotive Applications: From Algorithms to Applications [2.0] この章では、自動車のバリューチェーンにおける効率性、正確性、スケーラビリティを高めるために、最先端の量子アルゴリズムを調査します。
我々は, 短期および耐故障性アルゴリズムにおける鍵となる課題と, 産業応用におけるその実践的利用について論じる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:03:23 GMT)
Data-Driven Approach to assess and identify gaps in healthcare set up in South Asia [1.9] 東南アジア諸国は主要な医療システムの改善に取り組んでいる。
データ駆動型監視アプローチが必要である。
我々は、地球観測技術の現在のブレークスルーを活用することを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:50:16 GMT)
The trade-off between data minimization and fairness in collaborative filtering [1.9] 一般データ保護規則は、個人個人の個人情報を害から保護することを目的としている。
完全なコンプライアンスはEUでは必須だが、他の地域では必須ではない。
本稿では,データ最小化の原理とレコメンダシステムにおける公平性の関係について検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:32:26 GMT)
CompressedMediQ: Hybrid Quantum Machine Learning Pipeline for High-Dimensional Neuroimaging Data [1.3] 本稿では,新しいハイブリッド量子古典型機械学習パイプラインであるCompressedMediQを紹介する。
高次元のマルチクラス・ニューロイメージングデータ解析に関連する計算課題に対処する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:59:55 GMT)
Herd: Using multiple, smaller LLMs to match the performances of proprietary, large LLMs via an intelligent composer [1.3] オープンソースモデルの群れは、インテリジェントルータを介して、プロプライエタリなモデルのパフォーマンスに適合または超えることができることを示す。
GPTがクエリに答えられない場合、Herdは少なくとも40%の確率でモデルを特定できる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:21:09 GMT)
Improved Robustness and Hyperparameter Selection in the Dense Associative Memory [1.2] Dense Associative Memoryは、よりシャープな相互作用関数を可能にすることでホップフィールドネットワークを一般化する。
しかし、ネットワークの実装は、メモリベクトルとプローブベクトルのドット積に大きな指数を適用することに依存している。
計算問題を詳細に記述し、元のネットワーク記述を変更して問題を緩和し、その修正がネットワークのダイナミクスを変えないことを示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:25:24 GMT)
MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder [1.2] MultiMedは、医療分野向けの小型から大規模のASRモデルのコレクションである。
医学的ASRにおける多言語性に関する初の再現可能な研究であり、エンドツーエンドのASRトレーニングのための階層的アブレーション研究を行い、多言語医学的ASRのための最初の言語学的分析を提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:05:48 GMT)
LLM Agents as 6G Orchestrator: A Paradigm for Task-Oriented Physical-Layer Automation [1.1] 本稿では,タスク指向型6G LLMエージェント構築のための包括的アプローチを提案する。
まず,フィールド基本モデルを構築するための2段階の事前学習と微調整方式を提案する。
物理層分解などの模範課題の実験結果から,提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 05:08:29 GMT)
A Distribution-Aware Flow-Matching for Generating Unstructured Data for Few-Shot Reinforcement Learning [1.1] 組込みプロセッサ上の数ショット強化学習(RL)に適した合成非構造化データを生成するために設計された分散型フローマッチングを提案する。
我々はランダムフォレストを通した特徴重み付けを重要データ面の優先順位付けに適用し,生成した合成データの精度を向上させる。
本手法は,最初期の第1タイムスタンプにおいて,フレームレートを30%向上しながら,最大Q値に基づく安定収束を提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:50:59 GMT)
Enhancing Multivariate Time Series-based Solar Flare Prediction with Multifaceted Preprocessing and Contrastive Learning [0.9] 正確な太陽フレア予測は、宇宙飛行士、宇宙機器、衛星通信システムに強い太陽フレアがもたらす重大なリスクのために重要である。
本研究は、先進的なデータ前処理と分類手法を利用して、太陽フレア予測を強化する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 05:00:34 GMT)
ChronoGAN: Supervised and Embedded Generative Adversarial Networks for Time Series Generation [0.9] これらの問題を効果的に解決し緩和することを目的とした堅牢なフレームワークを導入します。
このフレームワークは、Autoencoderの生成した埋め込み空間の利点と、GANの対角的トレーニングダイナミクスを統合する。
我々は、安定度を高め、短命連続と短命連続の両方で効果的な一般化を保証するために、初期生成アルゴリズムと改良されたニューラルネットワークアーキテクチャを導入する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 04:51:35 GMT)
Structure Learning via Mutual Information [0.9] 本稿では、相互情報(MI)機能を用いて、データ内の機能的関係を学習し、表現するためのフレームワークを提案する。
本手法は,より効率的で一般化可能な学習アルゴリズムを実現することを目的としている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:33:56 GMT)
Present and Future Generalization of Synthetic Image Detectors [0.6] 検出器は広く一般化でき、制御不能な変更に対して堅牢である必要がある。
評価された検出器はどれも普遍的ではないが、結果はアンサンブルの可能性を示している。
ワイルドで収集されたデータに関する実験は、このタスクが大規模なデータセットによって定義されたものよりも難しいことを示している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:46:17 GMT)
Towards Building Efficient Sentence BERT Models using Layer Pruning [0.5] 本研究では,SBERT(Sentence BERT)モデル作成におけるレイヤプルーニングの有効性について検討した。
我々のゴールは、強い埋め込み類似性を保ちながら複雑さを減らし、より小さな文埋め込みモデルを作ることです。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:10:06 GMT)
Data Bias According to Bipol: Men are Naturally Right and It is the Role of Women to Follow Their Lead [0.5] 英語のGLUE/SuperGLUEリーダーボードのベンチマークデータセットを含む,評価された5つの言語の10のデータセットすべてにバイアスが存在することを示す。
3つの新しい言語は、合計600万のラベル付きサンプルを与え、SotAの多言語事前トレーニングモデルであるmT5とmBERTを使ってこれらのデータセットをベンチマークします。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:52:02 GMT)
Defining Boundaries: The Impact of Domain Specification on Cross-Language and Cross-Domain Transfer in Machine Translation [0.4] 言語間変換学習はニューラルマシン翻訳(NMT)に有望なソリューションを提供する
本稿では,ドメイン仕様と言語要因が伝達効率に与える影響に焦点を当てる。
ポルトガル語、イタリア語、フランス語、チェコ語、ポーランド語、ギリシャ語など、複数の対象言語を評価します。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:39:56 GMT)
On Importance of Pruning and Distillation for Efficient Low Resource NLP [0.4] 大規模なトランスフォーマーモデルは自然言語処理に革命をもたらし、テキスト分類などのタスクが大幅に進歩した。
英語モデルの小型化と高速化が試みられているが、この領域の研究は低リソース言語では不十分である。
本研究では,低リソース・トピック・オール・docv2モデルをベースラインとして,計算時間とメモリ使用量を削減する最適化手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:58:12 GMT)
FeDETR: a Federated Approach for Stenosis Detection in Coronary Angiography [0.4] 冠動脈狭窄は心不全の根底にある因子である。
冠動脈病変の診断にはいくつかの欠点がある。
深層学習法は、FFR/iFR値の自動推定において、心臓科医を支援するために登場した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 23:52:05 GMT)
Digital Advertising in a Post-Cookie World: Charting the Impact of Google's Topics API [0.4] GoogleのTopics APIをデジタル広告エコシステムに統合することは、プライバシを重視した広告プラクティスへの大きなシフトである。
本稿では、競合のダイナミクスと広告空間のアクセシビリティに焦点をあて、広告ネットワークにトピックAPIを実装することの意味を分析する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:04:16 GMT)
An Evolutionary Algorithm For the Vehicle Routing Problem with Drones with Interceptions [0.2] トラックとドローンをラストマイル配送の課題への解決策として利用することは、この論文で探求された新しい、有望な研究方向である。
本稿では,ドローンのインターセプションによる車両ルーティング問題を解決するための進化的アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:26:24 GMT)
Predicting Coronary Heart Disease Using a Suite of Machine Learning Models [0.2] 冠動脈疾患は世界中で何百万人もの人に影響を与えており、医療の分野としてよく研究されている。
心臓病の診断と予測には実用的かつ正確な方法が数多く存在するが、侵襲性、遅延検出、コストといった限界がある。
機械学習アルゴリズムによる教師付き学習は、早期診断の先駆けとなる、低コスト(コンピュータによる)非侵襲的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:22:41 GMT)
Remote sensing framework for geological mapping via stacked autoencoders and clustering [0.2] リモートセンシングデータを処理するための教師なし機械学習ベースのフレームワークを提案する。
オーストラリアのムタウィンチ地域の地質マッピングの枠組みを評価するために,ランドサット8,ASTER,Sentinel-2のデータセットを用いた。
本研究により, 岩盤単位を効率的に識別し, 高精度かつ解釈可能な地質図を作成できることが判明した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 06:02:47 GMT)
Cabello's nonlocality argument for multisetting high-dimensional systems and its experimental test [0.1] カベロの非局所的議論(CNA)は、非局所的特徴を説明できる優れた選択として現れる。
我々は,マルチセットと多次元CNAのための新しい論理的枠組みを構築した。
実験的に、制御可能なフォトニック軌道角運動量エンタングルメントを用いて、実験で記録された20.29%の確率で非局所性を示す。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:05:03 GMT)
What is a Digital Twin Anyway? Deriving the Definition for the Built Environment from over 15,000 Scientific Publications [0.0] デジタル双生児の概念は様々な領域で注目されている。
しかし、定義の量は膨大であり、用語的コンセンサスには及ばない。
我々は自然言語処理(NLP)技術を用いて、15,000のフルテキスト記事のコーパスからデジタル双対の定義を抽出し分析した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:19:29 GMT)
Universal and complete extraction for energy-invariant catalysis in quantum batteries versus no uncorrelated state-invariant catalysis [0.0] 量子電池からのエネルギー抽出における触媒の役割について検討する。
触媒の基本的なクラスは、エネルギー-および状態-不変触媒である。
相関状態不変触媒に対する対応するno-go結果を求める。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:09:08 GMT)
The use of GPT-4o and Other Large Language Models for the Improvement and Design of Self-Assessment Scales for Measurement of Interpersonal Communication Skills [0.0] OpenAIのChatGPT(GPT-4およびGPT-4o)およびその他の大規模言語モデル(LLM)は、科学研究の様々な段階において効果的に利用できる。
多様な言語タスクや推論におけるそれらのパフォーマンスは、平均的な人間レベルに近いかそれ以上である。
本稿では, GPT-4o や他の高度な LLM を, 自己評価尺度の設計における典型的な課題に利用できる可能性について述べる。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:37:21 GMT)
Routing in Sparsely-gated Language Models responds to Context [0.0] 類似性アノテーション付きテキストペアのルーティング決定をトレースし、学習したトークン-専門家の割り当てのコンテキスト感度を評価する。
エンコーダ層内のルーティングは,主に(意味的)アソシエーションに依存するが,文脈的キューは付加的な改善のレイヤを提供する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 11:25:19 GMT)
Robust Single-Photon Generation for Quantum Information Enabled by Stimulated Adiabatic Rapid Passage [0.0] 我々は、非常に低い光子数コヒーレンスを持つ、識別不能な単一光子状態のコヒーレント生成のためのロバストなスキームを提案する。
我々の新しいアプローチは、断熱的急速通過(ARP)と2光子励起(sTPE)の利点を組み合わせたものである。
発光光状態の素量子光学的品質を維持しつつ、ロバストな量子光発生を実証する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 02:12:16 GMT)
ReFine: Boosting Time Series Prediction of Extreme Events by Reweighting and Fine-tuning [0.0] 衝撃的な出来事を表すため、極端に重要な出来事である。
極端な出来事を正確に予測することは 困難です 希少さと不規則さのために
課題に対処するために、再重み付けと微調整という2つの戦略を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:29:29 GMT)
Quantum enhanced stratification of Breast Cancer: exploring quantum expressivity for real omics data [0.0] 量子カーネル(QK)は、分子特性に基づいて、乳癌(BC)患者のサブタイプを効果的に分類できる。
以上の結果から,QKは従来の手法と同等のクラスタリング結果が得られるが,データポイントは少ないことがわかった。
その結果,NISQデバイス上で計算パイプラインを確実に実装できることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 10:00:09 GMT)
Price predictability in limit order book with deep learning model [0.0] 本研究では,ディープラーニングモデルを用いた高周波価格変化の予測について検討する。
未定義の目標価格プロセスでは,過去の情報を組み込むことで予測が無意味になることが判明した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:40:13 GMT)
Keeping Humans in the Loop: Human-Centered Automated Annotation with Generative AI [0.0] 我々は、GPT-4を使用して、パスワードで保護された11のデータセットに27のアノテーションタスクを複製する。
各タスクについて,人間の注釈付き接地木ラベルに対するGPT-4アノテーションと,人為的ラベルに微調整された教師付き分類モデルからのアノテーションを比較した。
本研究は,人間中心のワークフローと注意深い評価基準の重要性を裏付けるものである。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:41:27 GMT)
Improved models for ideal Fermi gas and ideal Bose gas using quantum phase space [0.0] この改良は、現在の理想フェルミと理想気体のモデルに導入できることが示されている。
改良されたモデルの構築は、量子力学の位相空間表現の概念の利用に基づいている。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:43:32 GMT)
Implicit Test Oracles for Quantum Computing [0.0] ソフトウェアエンジニアリングでは、暗黙のオラクルは、テストクラッシュ中のソフトウェアのような、普遍的に望ましくない振る舞いを自動的にチェックします。
我々は、全ての量子コンピューティングが持たなければならない4つの特性を提案し、量子回路と量子プログラムのシミュレータの自動、ランダム、ファズテストのための暗黙のテスト託として提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:09:40 GMT)
Galvanically connected tunable coupler between a cavity and a waveguide [0.0] 可変スタブを備えた半無限導波路において, 優れたオンオフ比を有する共振器-導波管共振器を提案する。
本装置の動作原理は、スタブ端における可変境界条件により誘導されるキャビティモードのノード位置のシフトである。
同時に、ガルバニック接続により、この装置は容易に超強空洞導波路結合を実現する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:32:53 GMT)
GSIFN: A Graph-Structured and Interlaced-Masked Multimodal Transformer-based Fusion Network for Multimodal Sentiment Analysis [0.0] マルチモーダルセンチメント分析(MSA)は、複数のデータモーダルを利用して人間の感情を分析する。
既存のMSAモデルでは、MSA能力を促進するために、最先端のマルチモーダル融合と表現学習に基づく手法が一般的である。
提案するGSIFNは,これらの問題を解決するために2つの主成分を組み込んでいる。
これはInterlaced Mask機構を採用し、堅牢なマルチモーダルグラフ埋め込みを構築し、オールモーダルインワントランスフォーマーベースの融合を実現し、計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:38:36 GMT)
Enhancing One-Way Steering and Non-Classical Correlations in Magnomechanics via Coherent Feedback [0.0] コヒーレントフィードバックは キャビティ・マグノンメカニカル・システムにおける 量子相関を強化するのに使われます
その結果,ビームスプリッタの反射パラメータの調整は量子相関を著しく向上させることが示された。
システムを検証し、絡みを検知する能力を示すことで結論付ける。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 13:30:39 GMT)
Encryption of Audio Signals Using the Elzaki Transformation and the Lorenz Chaotic System Lorenz Chaotic System [0.0] デジタル画像のプライバシーを確保するために、いくつかの暗号技術が特に設計されている。
本研究ではカオス理論と特殊変換を用いたカラー画像の暗号化手法を提案する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 10:13:17 GMT)
Detecting Inpainted Video with Frequency Domain Insights [0.0] 本稿では、検出精度を大幅に向上させる周波数領域洞察ネットワーク(FDIN)を提案する。
公開データセットに対する以前の評価は、FDINが最先端のパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 01:51:07 GMT)
Derivation of Schrodinger's equation from the Hamilton-Jacobi and the Eikonal equations [0.0] 幾何学光学において、ハミルトン・ヤコビ方程式とアイコン方程式からシュロディンガー方程式の詳細な導出を与える。
我々は、ド・ブロイの早期理解を用いて、粒子と波の両方が存在するというボルンの統計則を導出した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 12:54:26 GMT)
Democratising Artificial Intelligence for Pandemic Preparedness and Global Governance in Latin American and Caribbean Countries [0.0] 直接または間接的に伝染する感染症は、疫病やパンデミックの主要な原因の一つである。
The Global South AI for Pandemic & Epidemic Preparedness & Response Network (AI4PEP)は、世界南部16か国で16のプロジェクトからなるイニシアチブを開発した。
この意見は、ラテンアメリカとカリブ海(LAC)諸国における私たちのブランチを紹介し、バイオテクノロジーの観点から、LACにおけるAIガバナンスについて議論する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 15:59:13 GMT)
Bosonic and fermionic coherence of N-partite states in the background of a dilaton black hole [0.0] 我々は、ガーフィンクル・ホロウィッツ・ストロミンジャー・ディラトンブラックホールの事象地平線付近にN個の観測者が浮かぶとき、自由ボソニック場およびフェルミオン場に対するGHZおよびW状態のN粒子コヒーレンスを研究する。
ボーソニック場のコヒーレンスはフェルミオン場のコヒーレンスよりも大きく、フェルミオン場の絡み合いはディラトン時空のボソニック場のコヒーレンスよりも大きいことが判明した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 00:56:33 GMT)
Automatic Speech Recognition Advancements for Indigenous Languages of the Americas [0.0] The Second Americas (Americas Natural Language Processing) Competition Track 1 of NeurIPS (Neural Information Processing Systems) 2022年、Cechua、Guarani、Brbri、Kotiria、Wa'ikhanaの5つの先住民言語の自動音声認識システムの訓練タスクを提案した。
対象言語毎の最先端のASRモデルの微調整について,データ拡張法に富んだ多種多様な情報源からの音声データの約36.65時間を用いて述べる。
私たちは各言語で最高のモデルをリリースし、Wa'ikhanaとKotiriaの最初のオープンなASRモデルをマークしています。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 19:48:21 GMT)
An average case efficient algorithm for solving two variable linear diophantine equations [0.0] 2つの可変線形ディオファンチン方程式を解くことは、RSAや楕円曲線暗号などの多くの暗号プロトコルに応用できる。
2つの線形ディオファンチン方程式を解くために2つのアルゴリズムを再検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 07:51:12 GMT)
Advancing Employee Behavior Analysis through Synthetic Data: Leveraging ABMs, GANs, and Statistical Models for Enhanced Organizational Efficiency [0.0] この研究は、従業員のパフォーマンスを包括的に理解するための強力なツールである、合成データの作成に重点を置いています。
合成データは、従業員の活動の詳細と正確な画像を提供する。
我々は、合成データが専門分野から従業員の行動研究に欠かせない資源へとどのように進化してきたかを検討する。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 16:58:23 GMT)
AMT-APC: Automatic Piano Cover by Fine-Tuning an Automatic Music Transcription Model [0.0] AMT-APCと呼ばれる学習アルゴリズムを提案する。
実験により, AMT-APCモデルは既存のどのモデルよりも正確なトラックを再現できることを示した。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 09:51:22 GMT)
A simple gravitational self-decoherence model [0.0] 本稿では,単純な重力自己脱コヒーレンス機構を提案する。
自由量子粒子の純度損失を評価した結果, 素粒子の純度損失は極めて非効率であることが判明した。
その背景にある物理的な特徴は、コヒーレンスが十分に重い粒子から時空の量子自由度へと容易に漏れることである。
論文参考訳(メタデータ) (Sat, 21 Sep 2024 14:21:11 GMT)