Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions [101.7] 近年のAIの進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。
人間のAIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の共同作業を妨げる、大きな障害となる。
我々は、2019年から2024年1月までに400以上の論文を体系的にレビューし、HCI(Human-Computer Interaction)、自然言語処理(NLP)、機械学習(ML)といった複数の分野にまたがって紹介する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:50:39 GMT)
High-fidelity and Lip-synced Talking Face Synthesis via Landmark-based Diffusion Model [89.3] 本稿では,発話顔生成のためのランドマークに基づく新しい拡散モデルを提案する。
まず、音声から唇と顎の目印運動への不明瞭さの少ないマッピングを確立する。
そこで我々はTalkFormerと呼ばれる革新的な条件付けモジュールを導入し、合成された動きをランドマークで表現された動きと整合させる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:58:28 GMT)
TinyLVLM-eHub: Towards Comprehensive and Efficient Evaluation for Large Vision-Language Models [86.9] この研究は、LVLM(Large Vision-Language Models)の早期かつ総合的な評価を提示する。
LVLM-eHubの軽量版であるTiny LVLM-eHubを提案する。
視覚的知覚、視覚的知識獲得、視覚的推論、視覚的常識、物体幻覚、具体的知能の6つのカテゴリの体系的な評価を提供する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:51:58 GMT)
Best Practices and Lessons Learned on Synthetic Data [83.6] AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:46:47 GMT)
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation [73.4] 本稿では,LN3Diffと呼ばれる新しいフレームワークを導入し,統一された3次元拡散パイプラインに対処する。
提案手法では,3次元アーキテクチャと変分オートエンコーダを用いて,入力画像を構造化されたコンパクトな3次元潜在空間に符号化する。
3次元生成のためのShapeNetの最先端性能を実現し,モノクロ3次元再構成と条件付き3次元生成において優れた性能を示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:32:21 GMT)
ReToMe-VA: Recursive Token Merging for Video Diffusion-based Unrestricted Adversarial Attack [71.2] ビデオ拡散に基づく非制限アドリアック攻撃(ReToMe-VA)における再帰的トークンマージを提案する。
ReToMe-VAは、空間的非受容性を達成するために、Timestep-wise Adrial Latent Optimization (TALO)戦略を採用する。
ReToMe-VAには、ビデオフレーム間でトークンのマッチングとマージを行うRecursive Token Merging(ReToMe)メカニズムが導入されている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:10:30 GMT)
Q-Bench+: A Benchmark for Multi-modal Foundation Models on Low-level Vision from Single Images to Pairs [71.1] 低レベルの視覚に関連する人間の言語応答をエミュレートするためのベンチマーク設定を設計する。
我々は,MLLMの低レベルの認識関連質問応答と記述評価を,単一画像から画像ペアへ拡張する。
複数のMLLMが単一の画像に対して十分な低レベルの視覚能力を持つことを示したが、GPT-4Vのみが人間よりも高い精度で比較できる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:53:16 GMT)
Are language models rational? The case of coherence norms and belief revision [63.8] 我々は、論理的コヒーレンス規範と、言語モデルにおける信念の強さに結びついたコヒーレンス規範を考察する。
コヒーレンスに結びついた有理ノルムはいくつかの言語モデルに適用できるが、他のモデルには適用されない。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:55:08 GMT)
ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.1] 本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:53:41 GMT)
CLIP in Medical Imaging: A Comprehensive Survey [59.4] コントラスト言語-画像事前学習は、視覚モデルにテキスト管理を導入することに成功している。
様々なタスクにおいて有望な結果を示しており、その一般化可能性と解釈可能性に起因している。
CLIPの使用は、最近医療画像領域への関心が高まっている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:22:25 GMT)
Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion [59.2] 投機的復号化は,モデル出力の品質を犠牲にすることなく,大規模言語モデル推論を高速化する手法として広く採用されている。
本稿では,離散拡散モデルを用いてドラフトシーケンスを生成する投機的復号法を提案する。
提案手法であるtextitSpeculative Diffusion Decoding (SpecDiff) は、標準言語生成ベンチマークで検証され、標準生成プロセスの8.7倍の高速化と既存の投機的デコードアプローチの2.5倍の高速化を提供する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:24:25 GMT)
Sequential Representation Learning via Static-Dynamic Conditional Disentanglement [58.2] 本稿では,ビデオ中の時間非依存要因と時間変化要因を分離することに着目し,逐次的データ内での自己教師付き不整合表現学習について検討する。
本稿では,静的/動的変数間の因果関係を明示的に考慮し,それらの因子間の通常の独立性仮定を破る新しいモデルを提案する。
実験により、提案手法は、シーンのダイナミックスが内容に影響されるシナリオにおいて、従来の複雑な最先端技術よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:04:39 GMT)
Deep Backtracking Counterfactuals for Causally Compliant Explanations [57.9] 本稿では,DeepBC(Deep Backtracking counterfactuals)と呼ばれる手法を導入する。
特別な場合として、我々の定式化は、対実的説明の分野における手法に還元される。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:18:14 GMT)
TrustAgent: Towards Safe and Trustworthy LLM-based Agents through Agent Constitution [50.7] 本稿では,エージェント・コンスティチューションをベースとしたエージェント・フレームワークであるTrustAgentについて述べる。
提案枠組みは,計画立案前のモデルに安全知識を注入する事前計画戦略,計画立案時の安全性を高める内計画戦略,計画後検査による安全性を確保する後計画戦略の3つの戦略要素を通じて,エージェント憲法の厳格な遵守を保証する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:00:25 GMT)
How Does Audio Influence Visual Attention in Omnidirectional Videos? Database and Model [50.2] 本稿では,全方向ビデオ(ODV)における音声・視覚的注意を主観的視点と客観的視点の両方から包括的に検討する。
AVS-ODVデータベースに基づく新たなベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:45:46 GMT)
Simple and Nearly-Optimal Sampling for Rank-1 Tensor Completion via Gauss-Jordan [49.2] ランク1テンソルを$otimes_i=1N mathbbRd$で完了する際のサンプルと計算複雑性を再考する。
本稿では,一対のランダム線形系上で,ガウス・ヨルダンに相当するアルゴリズムを許容する問題のキャラクタリゼーションを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:26:19 GMT)
Aligning with Human Judgement: The Role of Pairwise Preference in Large Language Model Evaluators [48.5] 大規模言語モデル(LLM)は、生成された自然言語の品質を評価する上で有望な能力を示している。
LLMは依然として評価のバイアスを示しており、人間の評価と整合したコヒーレントな評価を生成するのに苦労することが多い。
Pairwise-preference Search (PairS)は、LLMを用いてペア比較を行い、候補テキストを効率よくランク付けする不確実性誘導探索手法である。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:42:51 GMT)
Redundancy-Aware Efficient Continual Learning on Edge Devices [47.4] 推論精度、微調整実行時間、エネルギー効率を最適化する効率的なエッジ連続学習フレームワークであるETunerを提案する。
実験結果から,ETunerは全体の微調整実行時間を64%削減し,エネルギー消費量を56%削減し,即時モデル微調整アプローチよりも平均推定精度を1.75%向上した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 03:28:13 GMT)
PointMT: Efficient Point Cloud Analysis with Hybrid MLP-Transformer Architecture [46.3] 本研究は,効率的な特徴集約のための複雑局所的注意機構を導入することで,自己注意機構の二次的複雑さに取り組む。
また,各チャネルの注目重量分布を適応的に調整するパラメータフリーチャネル温度適応機構を導入する。
我々は,PointMTが性能と精度の最適なバランスを維持しつつ,最先端手法に匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:16:03 GMT)
Time Series Forecasting with LLMs: Understanding and Enhancing Model Capabilities [46.0] 大規模言語モデル(LLM)は多くの分野に適用され、近年急速に発展してきた。
近年の研究では、大規模な言語モデルを、さらなる微調整を行なわずに、アンフェロショット時系列推論として扱っている。
本研究は,LLMが周期性に欠けるデータセットにおいて,明確なパターンや傾向を持つ時系列予測において良好に機能することを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 05:15:08 GMT)
Meta Clustering of Neural Bandits [45.8] ニューラルバンドのクラスタリング(Clustering of Neural Bandits)という新しい問題を,任意の報酬関数に拡張することで研究する。
本稿では,メタラーナーを用いて動的クラスタを高速に表現・適応する,M-CNBという新しいアルゴリズムを提案する。
M-CNBはレコメンデーションとオンラインの分類シナリオの両方で広範な実験を行い、SOTAベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:09:51 GMT)
NVS-Adapter: Plug-and-Play Novel View Synthesis from a Single Image [45.3] NVS-Adapterは、Text-to-Image(T2I)モデルのプラグインモジュールである。
T2Iモデルの一般化能力を完全に活用しながら、新しい視覚オブジェクトのマルチビューを合成する。
実験により,NVS-Adapterは幾何的に一貫した多視点を効果的に合成できることが示されている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:07:35 GMT)
Variational Inference Failures Under Model Symmetries: Permutation Invariant Posteriors for Bayesian Neural Networks [43.9] 重み空間置換対称性が変分推論に与える影響について検討する。
置換不変変分後部を構築するための対称対称性機構を考案する。
本研究は, 対称性分布が真の後部と厳密に適合していること, 元のELBO目標を用いてトレーニングできること, を示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:06:34 GMT)
You Augment Me: Exploring ChatGPT-based Data Augmentation for Semantic Code Search [43.9] コード検索はソフトウェア開発において重要な役割を担い、開発者は自然言語クエリを使ってコードを検索し再利用することができる。
近年,大規模言語モデル (LLM) は自然言語の理解と生成において顕著な進歩を遂げている。
本稿では,大規模言語モデルによって生成された高品質で多様な拡張データを利用する新しいアプローチChatDANCEを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:51:21 GMT)
Featurizing Koopman Mode Decomposition For Robust Forecasting [43.5] 本稿では、FKMD(Featurized Koopman Mode Decomposition)と呼ばれる高度なクープマンモード分解技術を紹介する。
FKMDは遅延埋め込みと学習したマハラノビス距離を用いて高次元力学系の解析と予測を強化する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:42:31 GMT)
FTS: A Framework to Find a Faithful TimeSieve [43.5] 本稿では,TimeSieveにおける不信の識別と修正を目的とした新しいフレームワークを提案する。
我々のフレームワークは、モデルの安定性と忠実性を高めるために設計されており、その出力が上記の要因の影響を受けにくいことを保証します。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:42:45 GMT)
Exploring Applications of State Space Models and Advanced Training Techniques in Sequential Recommendations: A Comparative Study on Efficiency and Performance [41.7] 本研究は, シーケンシャルレコメンデーションにおける3つの有望な方向性に焦点を当てる。
ひとつは、SSM(State Space Models)を使うことで、レイテンシ、メモリ、推論コストの低いシーケンシャルレコメンデーションドメインでSOTA結果を達成することができるように、スピードを向上することである。
2つ目は、LLM(Large Language Models)によるレコメンデーションの品質向上、参照モデルなしでのモノリシックな選好最適化(ORPO)、コスト削減とトレーニングプロセスの高速化を目的とした適応型バッチおよびステップサイズアルゴリズムの実装である。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 18:09:10 GMT)
PersonViT: Large-scale Self-supervised Vision Transformer for Person Re-Identificat [41.2] Person Re-Identification (ReID) は、重複しないカメラ画像において、関連する個人を検索することを目的としている。
近年、視覚変換器(ViT)と自己教師あり学習技術の発展により、自己教師あり事前学習に基づく人物ReIDの性能が大幅に向上している。
本稿では,最近登場したMasked Image Modeling (MIM) の自己教師型学習手法について紹介する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 01:35:06 GMT)
PixelFade: Privacy-preserving Person Re-identification with Noise-guided Progressive Replacement [41.1] オンラインの人物識別サービスは、データ漏洩回復攻撃によるプライバシー侵害を検知する。
これまでのプライバシ保護者再識別手法では、回復攻撃に抵抗できず、精度を損なうことはできない。
歩行者画像を保護するための反復的(PixelFade)手法を提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:52:54 GMT)
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models [39.6] 視覚大言語モデル(VLLM)のための新しいデータ合成パイプラインであるSynthVLMを紹介する。
画像からキャプションを生成する既存の方法とは異なり、SynthVLMは高度な拡散モデルと高品質なキャプションを使用して、キャプションから高解像度の画像を自動的に生成し、選択する。
我々は、様々な視覚的質問応答タスクにおける最先端(SoTA)のパフォーマンスを達成し、高いアライメント品質を維持し、高度な言語能力を維持する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:06:12 GMT)
KeyVideoLLM: Towards Large-scale Video Keyframe Selection [38.4] KeyVideoLLMは、ビデオLLMデータを効率的に管理するためのテキストフレーム類似性に基づく選択方法である。
データ圧縮速度は最大60.9倍に向上し、ディスクスペースの要求を大幅に低減する。
既存の選択方法と比較して、処理速度を最大200倍に向上させる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:57:37 GMT)
In-Context Exploiter for Extensive-Form Games [38.2] In-Context Exploiter (ICE) という新しい手法を導入し、ゲーム内の任意のプレイヤーとして動作し、コンテキスト内学習によって完全に対戦相手を適応的に活用できる単一モデルを訓練する。
我々のICEアルゴリズムは、多様な相手戦略の生成、強化学習アルゴリズムによる対話的履歴データの収集、そしてよく設計されたカリキュラム学習フレームワークにおけるトランスフォーマーベースのエージェントの訓練を含む。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:59:09 GMT)
Investigating Instruction Tuning Large Language Models on Graphs [37.2] グラフ関連のタスクにLLM(Large Language Models)を適用することへの関心が高まっている。
本研究は,実世界のグラフに係わる命令追従型LLMの能力について考察する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:54:35 GMT)
Radiance Field Learners As UAV First-Person Viewers [36.6] 第一パーソンビュー(FPV)は無人航空機(UAV)の軌道に革命をもたらす大きな可能性を秘めている
従来のNeNeRF(Neural Radiance Field)手法は、粒度ごとに単一点をサンプリングするといった課題に直面している。
FPV-NeRFを導入し、これらの課題に3つの重要な面を通して対処する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:29:11 GMT)
Large, Complex, and Realistic Safety Clothing and Helmet Detection: Dataset and Method [35.4] 我々は、大型で複雑で現実的な安全服とヘルメット検出データセットを構築した。
SFCHDは、12,373のイメージ、7のカテゴリ、50,552のアノテーションからなる2つの真正化学プラントに由来する。
我々は空間的およびチャネル的注意に基づく低照度拡張モジュールを設計する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 18:49:11 GMT)
Chain of Condition: Construct, Verify and Solve Conditions for Conditional Question Answering [34.6] 条件付き質問応答(CQA)は、可能な答えを見つけ、その答えをサポートするために満たすべき条件を特定することを目的としている。
既存のアプローチは、条件とそれらの論理的関係を正確に識別し、条件の検証と解決という2つの主要な課題のために、CQAと苦労している。
本稿では,まずすべての条件を識別し,それらの論理的関係を文書に従って明示的に構築する,新しい促進手法であるChain of Conditionを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 05:09:11 GMT)
GEM: Context-Aware Gaze EstiMation with Visual Search Behavior Matching for Chest Radiograph [32.1] 本稿では,放射線科医が収集した視線データを用いて視覚的な探索行動パターンをシミュレートする,文脈対応型Gaze EstiMation (GEM) ネットワークを提案する。
コンテキスト認識モジュール、視覚行動グラフ構築、視覚行動マッチングで構成される。
4つの公開データセットの実験は、既存の方法よりもGEMの方が優れていることを示している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:46:25 GMT)
Thought-Like-Pro: Enhancing Reasoning of Large Language Models through Self-Driven Prolog-based Chain-of-Thought [32.0] 大規模言語モデル(LLM)は汎用アシスタントとして非常に優れた性能を示している。
多様な推論タスクにおける学習と一般化を容易にする新しい学習フレームワークTHOUGHT-LIKE-PROを導入する。
実験結果から,本手法はLLMの推論能力を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:54:20 GMT)
Judging the Judges: A Systematic Investigation of Position Bias in Pairwise Comparative Assessments by LLMs [29.7] 本研究では,反復的整合性,位置整合性,位置整合性などの指標を用いて位置バイアスを定量化する枠組みを開発した。
我々はMTBenchベンチマークとDevBenchベンチマークから22タスクにわたる9つの判断モデルと40近い回答生成モデルを用いて実験を行い、約80,000の評価インスタンスを生成する。
本研究は,位置バイアスを理解するための新しい概念を導入し,評価のための多次元フレームワークを提供することによって,この分野に大きく貢献する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:52:13 GMT)
PolygloToxicityPrompts: Multilingual Evaluation of Neural Toxic Degeneration in Large Language Models [28.0] 既存の毒性ベンチマークは圧倒的に英語に焦点を当てている。
PTP(PolygloToxicity Prompts)は、17言語にまたがる自然発生プロンプト425Kの大規模多言語毒性評価ベンチマークである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:27:57 GMT)
Non-Negative Reduced Biquaternion Matrix Factorization with Applications in Color Face Recognition [27.1] 非負の RB 行列の概念を導入し、次に RB の乗算特性を用いて非負の RB 行列分解モデルを提案する。
カラー顔認識におけるNRBMFモデルの有効性と優位性を検証した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:25:42 GMT)
Collaborative Learning Framework to Detect Attacks in Transactions and Smart Contracts [26.7] 本稿では、ブロックチェーントランザクションとスマートコントラクトの攻撃を検出するために設計された、新しい協調学習フレームワークを提案する。
当社のフレームワークは,マシンコードレベルでの複雑な攻撃を含む,さまざまな種類のブロックチェーン攻撃を分類する機能を示している。
我々のフレームワークは、広範囲なシミュレーションによって約94%の精度を達成し、リアルタイム実験では91%のスループットで毎秒2,150トランザクションを処理している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:24:01 GMT)
UrFound: Towards Universal Retinal Foundation Models via Knowledge-Guided Masked Modeling [26.1] UrFoundは、マルチモーダル網膜画像とドメイン知識の両方から普遍的な表現を学ぶために設計された網膜基盤モデルである。
約180万枚の網膜画像のトレーニングにより、UrFoundは最大1.6万枚の未表示画像に基づいてトレーニングされた最先端の網膜基盤モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:31:29 GMT)
DreamTalk: When Emotional Talking Head Generation Meets Diffusion Probabilistic Models [25.4] 本研究では,感情的な話し声を生成するためのフレームワークであるDreamTalkを提案する。
このフレームワークは、認知ネットワーク、スタイル認識のリップエキスパート、スタイル予測器で構成されている。
つまりDreamTalkは、さまざまな感情にまたがる鮮やかな会話の表情を一貫して生成し、パーソナライズされた感情を便利に特定できる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:37:55 GMT)
LITE: Modeling Environmental Ecosystems with Multimodal Large Language Models [25.0] LITEは環境生態系モデリングのための大きな言語モデルである。
異なる環境変数を自然言語記述や線グラフ画像に変換することで統一する。
このステップでは、不完全な機能は、sparse Mixture-of-Expertsフレームワークによって説明される。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:03:44 GMT)
Can LLMs Replace Manual Annotation of Software Engineering Artifacts? [24.6] 大規模言語モデル(LLM)は、最近、いくつかの領域で人間レベルのパフォーマンスを実証し始めた。
本稿では、コードやコード関連アーティファクトの評価において、より安価なLCMクエリーでコストのかかる被験者を代用する可能性について検討する。
以上の結果から,LLMを人体アノテーションに置き換えることで,人体・人体・人体間の合意に等しいあるいは近い契約が成立する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:30:01 GMT)
Synth-Empathy: Towards High-Quality Synthetic Empathy Data [23.9] Synth-Empathyは、高品質な共感データを自動的に生成し、低品質なデータを破棄するパイプラインである。
データ量と品質のトレードオフを示し、共感的なデータ生成と選択に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:04:28 GMT)
Asynchronous Approximate Agreement with Quadratic Communication [23.3] 本研究では,入力の凸内積にほぼ等しい出力が得られるような近似一致について検討する。
これは、信頼できるブロードキャストあたり$Omega(n2)$メッセージ、または合計$Omega(n3)$メッセージを必要とする。
我々は、放送を禁止し、$n3$ではなく$n2$に比例する通信を必要とする最適な弾力性のある非同期近似合意プロトコルを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:03:06 GMT)
kNN-CLIP: Retrieval Enables Training-Free Segmentation on Continually Expanding Large Vocabularies [22.5] kNN-CLIPは連続セグメンテーションのためのトレーニング不要の戦略である。
再トレーニングや大きなメモリコストを必要とせずに、継続的に成長する語彙に適応することができる。
大語彙セマンティクスとパノプティクスセグメンテーションデータセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:36:30 GMT)
P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for Optimizing LLM Training [22.2] 本稿では,大規模言語モデルにおける微調整性を高めるために,タスク固有のデータプルーニングと選択に焦点を当てる。
本稿では,動的適応型学習戦略によりLCM性能を向上させる革新的フレームワークであるP3を紹介する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:44:49 GMT)
Improving Whisper's Recognition Performance for Under-Represented Language Kazakh Leveraging Unpaired Speech and Text [22.2] 表現不足の言語でWhisperのパフォーマンスを改善する方法について研究する価値がある。
我々は、アクセシブル・アンペア音声とテキストデータを利用し、言語モデルGPTとカザフ語Whisperを組み合わせた。
複数の実験で10%以上の絶対WER削減を達成した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:39:13 GMT)
Scene123: One Prompt to 3D Scene Generation via Video-Assisted and Consistency-Enhanced MAE [22.1] Scene123は3次元シーン生成モデルであり,映像生成フレームワークを通じて現実性と多様性を保証する。
具体的には、入力画像(またはテキストから生成された画像)をワープして、隣接したビューをシミュレートし、MAEモデルで見えない領域を埋める。
生成したビューの細部やテクスチャの忠実度をさらに高めるため,映像生成モデルを用いて入力画像から得られた画像に対して,GANベースのロスを用いた。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:09:57 GMT)
PointNCBW: Towards Dataset Ownership Verification for Point Clouds via Negative Clean-label Backdoor Watermark [20.7] 我々は,点雲に対するクリーンラベルバックドアベースのデータセット透かしを提案し,有効性とステルス性の両方を保証する。
我々は、トリガーパターンを挿入する前に、形状的にも点的にも非ターゲットカテゴリの点雲を摂動する。
そのため、ウォーターマークされたデータセットでトレーニングされたモデルには、独特だがステルス的なバックドアの挙動がある。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:31:58 GMT)
DenoDet: Attention as Deformable Multi-Subspace Feature Denoising for Target Detection in SAR Images [20.1] 本稿では、畳み込みバイアスを校正し、高周波により多くの注意を払うために、明示的な周波数領域変換によって支援されるネットワークを提案する。
変換領域ソフトしきい値処理を行う動的周波数領域アテンションモジュールであるTransDenoを設計する。
プラグアンドプレイのTransDenoは、複数のSARターゲット検出データセットに対して最先端のスコアを設定する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:51:02 GMT)
Language Models Learn Rare Phenomena from Less Rare Phenomena: The Case of the Missing AANNs [19.8] 言語モデルは希少な現象から一般化することで希少な文法現象を学習できることを示す。
この結果から, LMが希少な現象から一般化することで, 希少な文法現象を学習できることが示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:45:30 GMT)
HoME: Hierarchy of Multi-Gate Experts for Multi-Task Learning at Kuaishou [19.1] クアイショーのショートビデオサービスで学んだ実践的問題と教訓について紹介する。
業界では、広く使われているマルチタスクフレームワークはMixture-of-Experts(MoE)パラダイムである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:25:48 GMT)
On the Geometry of Reinforcement Learning in Continuous State and Action Spaces [18.4] 我々は幾何レンズを用いて連続状態と行動空間の理論的理解を構築する。
遷移力学が高次元名目状態空間に埋め込まれた到達可能な状態の低次元多様体を誘導するという考えを証明する。
この方法で学んだポリシーは、4つの MuJoCo コントロールスイートタスクに対して同等以上のパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:28:27 GMT)
DeepFace-Attention: Multimodal Face Biometrics for Attention Estimation with Application to e-Learning [18.4] 本研究では,Webカメラビデオに適用した顔分析手法のアンサンブルを用いて,注意レベル(認知的負荷)を推定する革新的な手法を提案する。
我々のアプローチは、最先端の顔分析技術を適用し、ユーザの認知的負荷を、高い注意や低い注意の形で定量化する。
提案手法は,mEBAL2ベンチマークを用いて,既存の最先端の精度を向上する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:39:11 GMT)
Cohesive Conversations: Enhancing Authenticity in Multi-Agent Simulated Dialogues [17.4] 本稿では,Large Language Models (LLM) を用いたシミュレーションにおけるマルチエージェント対話の品質について検討する。
本稿では,発話誤りを検出し,訂正する新しいスクリーニング,診断,再生(SDR)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:31:22 GMT)
V2A-Mark: Versatile Deep Visual-Audio Watermarking for Manipulation Localization and Copyright Protection [17.2] V2A-Markは、現在のビデオ改ざん法医学の限界に対処するために提案されている。
本手法は,オリジナルビデオフレームとオーディオに,視覚的・音響的ローカライゼーションの透かしと著作権の透かしを埋め込むことができる。
V2A-Markの有効性は、ビジュアル・オーディオ・タンパリング・データセット上で検証されている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:09:49 GMT)
LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale [17.0] 大規模言語モデル(LLM)サービスシステムにおいて、汎用的なハードウェア・ソフトウェア動作を正確にモデル化できるシミュレーション基盤が欠如している。
本稿では,LLMServingSimと呼ばれる効率的なシミュレーションツールを開発し,LCMサービスシステムにおける今後の研究を支援することを目的とする。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:26:15 GMT)
DESTEIN: Navigating Detoxification of Language Models via Universal Steering Pairs and Head-wise Activation Fusion [17.0] ファインチューニングや補助モデルを含む現在のソリューションは通常、広範な計算資源を必要とする。
本稿では,資源と時間コストの低い活性化空間における表現工学を適用して,LMをデトックス化する新しい手法であるDeSteinを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:17:59 GMT)
Topological Blind Spots: Understanding and Extending Topological Deep Learning Through the Lens of Expressivity [16.9] トポロジカルディープラーニング(TDL)は、トポロジカル構造で表されるデータからの学習を容易にする。
本稿では,高次メッセージパッシング(HOMP)の長所と短所について検討する。
我々は,マルチセルネットワーク(MCN)とスケーラブルマルチセルネットワーク(SMCN)という,TDLモデルの2つの新しいクラスを開発する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:27:58 GMT)
SAM2-Adapter: Evaluating & Adapting Segment Anything 2 in Downstream Tasks: Camouflage, Shadow, Medical Image Segmentation, and More [16.4] 本稿では SAM2-Adapter について紹介する。
SAM-Adapterの強みの上に構築され、多様なアプリケーションに対する一般化性と構成性の向上を提供する。
我々は、SAM2-AdapterでSAM2モデルを活用する可能性を示し、研究コミュニティに奨励する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:20:52 GMT)
A Versatile Framework for Attributed Network Clustering via K-Nearest Neighbor Augmentation [14.3] ANCKAは、属性グラフクラスタリング(AGC)、属性多重グラフクラスタリング(AMGC)、属性ハイパーグラフクラスタリング(AHC)が可能な汎用属性ネットワーククラスタリングフレームワークとして開発されている。
我々は,提案手法を8つの属性付きハイパーグラフ上の19の競合,6つの属性付きグラフ上の16の競合,および3つの属性付き多重グラフ上の16の競合と比較した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:59:51 GMT)
Context-Driven Index Trimming: A Data Quality Perspective to Enhancing Precision of RALMs [14.3] データ品質の観点から、ALMの回答の精度を高めるために、コンテキスト駆動インデックストリミング(CDIT)フレームワークが提案されている。
CDITは、クエリコンテキストと矛盾する検索結果を効果的に識別し、破棄することができる。
実験は、挑戦的な質問応答タスクを実証する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:39:22 GMT)
Three-layer deep learning network random trees for fault detection in chemical production process [14.0] 3層深層学習ネットワークランダムツリー(TDLN-trees)と呼ばれる新しい断層検出モデルを提案する。
まず、ディープラーニングコンポーネントは、産業データから時間的特徴を抽出し、それらを組み合わせて高レベルのデータ表現に変換する。
次に、機械学習コンポーネントは、最初のステップで抽出された特徴を処理し、分類する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:16:49 GMT)
PRTGaussian: Efficient Relighting Using 3D Gaussians with Precomputed Radiance Transfer [13.9] PRTGaussianはリアルタイムに再生可能な新規ビュー合成法である。
マルチビューOLATデータにガウスアンを組み込むことで,リアルタイムで自由視点のリライトを可能にする。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:57:38 GMT)
FuXi Weather: An end-to-end machine learning weather data assimilation and forecasting system [13.8] 本稿では,エンド・ツー・エンドの機械学習による天気予報システムであるFuXi Weatherを紹介する。
FuXi Weatherは、様々な情報源の情報を統合するために、特別なデータ前処理とマルチモーダルデータ融合技術を採用している。
安定で正確な10日間の世界的な天気予報を、空間解像度0.25textで独自に生成する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:42:01 GMT)
Scene-aware Human Motion Forecasting via Mutual Distance Prediction [13.1] 本研究では,人体とシーン間の相互距離による人間とシーンの相互作用をモデル化する。
このような相互距離は局所的な動きと大域的な動きの両方を制約し、結果として全身的な動きは予測される。
2つのステップでパイプラインを構築し、まず将来の相互距離を予測し、次に将来の人間の動きを予測する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:46:00 GMT)
LlaSMol: Advancing Large Language Models for Chemistry with a Large-Scale, Comprehensive, High-Quality Instruction Tuning Dataset [13.1] 大規模言語モデル (LLMs) は, 包括的な化学タスクにおいて, 非常に強力な結果が得られることを示す。
命令チューニングのための大規模で包括的で高品質なデータセットであるSMolInstructを提案する。
SMolInstructを使ってオープンソースのLCMの集合を微調整し、その中のMistralが化学タスクの最良のベースモデルであることを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:28:11 GMT)
Multimodal generative semantic communication based on latent diffusion model [13.0] 本稿では,mm-GESCOというマルチモーダル・ジェネリック・セマンティック・コミュニケーション・フレームワークを提案する。
このフレームワークは、可視および赤外線モダル画像データのストリームを取り込み、融合したセマンティックセグメンテーションマップを生成して送信する。
受信終了時に、このフレームワークはセマンティックマップに基づいて、元のマルチモーダルイメージを再構築することができる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:23:41 GMT)
What Matters in Autonomous Driving Anomaly Detection: A Weakly Supervised Horizon [12.9] 自律走行シナリオにおけるビデオ異常検出(VAD)は重要な課題であるが、エゴ中心のビューと移動カメラのためにいくつかの課題が伴う。
弱教師付きVOD法の最近の進歩は、静的カメラシナリオにおける重要な現実世界の異常の検出において顕著な進歩を見せている。
自動運転VADの弱制御手法開発を促進することを目的としている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:04:52 GMT)
Impacts of Darwinian Evolution on Pre-trained Deep Neural Networks [12.8] 本研究では進化論に基づくニューラルネットワーク最適化フレームワークを提案する。
ダーウィン進化とニューラルネットワーク最適化の関係を調べる実験を行った。
提案するフレームワークはネットワークに肯定的な影響を与える。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:08:33 GMT)
SAMSA: Efficient Transformer for Many Data Modalities [12.8] 本稿では,コンテキスト認識型線形複雑性自己認識機構SAMSA-SAMpling-Self-Attentionを提案する。
我々のメカニズムは、私たちが発見した代替手法を使わずに、微分可能なサンプリングに基づいています。
SAMSAは多くのベンチマークで競合やSOTAの結果を得たが、他の非常に特殊なモデルに比べて推論が速い。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:09:06 GMT)
Cross-view image geo-localization with Panorama-BEV Co-Retrieval Network [12.7] クロスビュージオローカライゼーションは、地理参照衛星データベースとマッチングすることで、ストリートビュー画像の地理的位置を識別する。
そこで我々は,パノラマBEVコレトリヴァルネットワーク(Panorama-BEV Co-Retrieval Network)という,クロスビュー画像のジオローカライズのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:03:58 GMT)
SuperEncoder: Towards Universal Neural Approximate Quantum State Preparation [12.6] トレーニング済みのニューラルネットワークを利用して任意の量子状態に対してQSP回路を直接生成できることが示される。
我々の研究は、近似QSPのための普遍的ニューラルデザイナに向けて着実に進んでいる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:39:05 GMT)
Uncertainty-Aware Deep Neural Representations for Visual Analysis of Vector Field Data [12.6] 定常ベクトル場を効果的にモデル化するために,不確実性を考慮した暗黙的ニューラル表現を開発する。
いくつかのベクトルデータセットを用いて詳細な探索を行ったところ、不確実性を考慮したモデルがベクトル場の特徴の情報可視化結果を生成することが示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:06:38 GMT)
Preserving Privacy in Large Language Models: A Survey on Current Threats and Solutions [12.5] 大規模言語モデル(LLM)は、人工知能の大幅な進歩を表し、様々な領域にまたがる応用を見つける。
トレーニングのための大規模なインターネットソースデータセットへの依存は、注目すべきプライバシー問題を引き起こす。
特定のアプリケーション固有のシナリオでは、これらのモデルをプライベートデータで微調整する必要があります。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 05:41:19 GMT)
Model Breadcrumbs: Scaling Multi-Task Model Merging with Sparse Masks [12.1] 目標問題に対する一般的なアプローチは、特定の目標タスクに対して、訓練済みの基礎モデルを微調整することである。
この研究は、補助的なタスクのスペクトルから導かれた同じ基礎モデルの複数の微調整をマージする問題に焦点を当てる。
事前学習したモデルの重み空間内でモデル適応を誘導する疎定義の重み集合からなる,新しい簡易な方法であるモデルブレッドクラブを導入する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:02:00 GMT)
Predicting Long-Term Allograft Survival in Liver Transplant Recipients [11.7] 移植後5年以内に肝移植患者の約20%に肝移植不全が発生する。
我々は,他の先進的生存モデルよりも優れた線形リスクスコアであるMAS(Model for Allograft Survival)を導入する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:44:36 GMT)
Policy Gradient Converges to the Globally Optimal Policy for Nearly Linear-Quadratic Regulators [11.4] 準線形2次制御系における最適速度について検討する。
本稿では、勾配アルゴリズムを用いて、グローバルな最適レートで保証されるポリシーを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 23:14:00 GMT)
Visual SLAM with 3D Gaussian Primitives and Depth Priors Enabling Novel View Synthesis [11.2] 従来の幾何学に基づくSLAMシステムは、密度の高い3D再構成機能を持たない。
本稿では,新しいビュー合成技術である3次元ガウススプラッティングを組み込んだリアルタイムRGB-D SLAMシステムを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:23:08 GMT)
Asynchronous Message-Passing and Zeroth-Order Optimization Based Distributed Learning with a Use-Case in Resource Allocation in Communication Networks [11.2] 分散学習と適応は大きな関心を集め、機械学習信号処理に広く応用されている。
本稿では、エージェントが共通のタスクに向けて協調するシナリオに焦点を当てる。
送信者として働くエージェントは、グローバルな報酬を最大化するために、それぞれのポリシーを共同で訓練する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:30:29 GMT)
Augmented Physics: Creating Interactive and Embedded Physics Simulations from Static Textbook Diagrams [10.9] 静的教科書図から組込みインタラクティブな物理シミュレーションを作成するための機械学習統合オーサリングツールであるAugmented Physicsを紹介した。
本システムでは,物理教科書から図表を半自動抽出し,抽出した内容に基づいてインタラクティブなシミュレーションを生成する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:37:38 GMT)
WiDe-analysis: Enabling One-click Content Moderation Analysis on Wikipedia's Articles for Deletion [10.8] コンテンツモデレーションの議論にワンクリック分析を提供することを目的としたPythonパッケージであるウィキペディア削除議論とワイドアナライス(ウィキペディア削除分析)に関する一連の実験を紹介する。
データ、モデル、Pythonパッケージ、およびHuggingFaceスペースを含む、幅広い分析に関連するすべての資産をリリースし、ウィキペディアなどにおけるコンテンツモデレーションの自動化に関する研究を加速することを目的としています。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 23:43:11 GMT)
DAIRstega: Dynamically Allocated Interval-Based Generative Linguistic Steganography with Roulette Wheel [10.7] 言語ステガノグラフィー(LS)タスクは、秘密に基づいてステガノグラフィーテキスト(ステゴ)を生成することを目的としている。
本稿ではDAIRstegaと呼ばれる動的に割り当てられた間隔に基づくLSスキームを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:26:01 GMT)
RSL-BA: Rolling Shutter Line Bundle Adjustment [10.6] 本稿では,最初のローリングシャッターラインベースバンドル調整ソリューションであるRSL-BAを紹介する。
安定かつ効率的な一連の再射誤差定式化を導出する。
提案手法は,既存のポイントベースローリングシャッタバンドル調整ソリューションに匹敵する効率と精度を実現する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:30:23 GMT)
Unidirectional imaging with partially coherent light [10.0] 一方向撮像器は、例えば視野AからFOVBまでの1方向のみの入力対象の画像を形成し、逆方向の画像形成をブロックする。
そこで本稿では,空間的に部分的にコヒーレントな光下での一方向イメージングを行い,前向きにのみ高画質イメージングを実演する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:01:06 GMT)
ViC: Virtual Compiler Is All You Need For Assembly Code Search [9.7] 本稿では,汎用コンパイラをエミュレートするLarge Language Model(LLM)のトレーニングについて検討する。
さらに、任意の言語のソースコードをアセンブリコードにコンパイルできる仮想コンパイラ(ViC)としてCodeLlamaを事前訓練します。
組立コード検索性能は大幅に向上し,ベースラインを26%上回った。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:23:02 GMT)
Unraveling the Mystery of Quantum Measurement with A New Space-Time Approach to Relativistic Quantum Mechanics [9.1] 量子測定は量子力学の分野における基本的な概念である。
その重要性にもかかわらず、4つの基本的な問題は、より広範な量子計測の応用に重大な課題を提起し続けている。
我々は、これらの問題に体系的に対処するために、相対論的量子力学に新しい時空アプローチを採用する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:29:33 GMT)
Eigen Attention: Attention in Low-Rank Space for KV Cache Compression [9.1] 我々は,低ランク空間における注意操作を行うEigen Attentionを提案し,KVキャッシュメモリのオーバーヘッドを低減する。
その結果,Eigen AttentionはKVキャッシュサイズを最大40%削減し,注目動作遅延を最大60%低減し,性能の低下を最小化できることがわかった。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:47:12 GMT)
Pauli Check Sandwiching for Quantum Characterization and Error Mitigation during Runtime [8.9] この研究は、パウリチェックサンドイッチ(PCS)を適用した新しい量子システムの特徴付けとエラー軽減フレームワークを提案する。
PCSとマルチプログラミングを組み合わせることで、量子プログラムの結果の非自明な忠実さが向上する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:21:45 GMT)
Don't Splat your Gaussians: Volumetric Ray-Traced Primitives for Modeling and Rendering Scattering and Emissive Media [8.8] 我々は、単純なカーネルベースのボリュームプリミティブの混合物を用いて散乱媒体と放射媒体のモデリングを形式化し、一般化する。
本手法は,散乱媒体の前方および逆レンダリングのための他の形態のボリュームモデリングに代わる,コンパクトで効率的な代替手段であることを示す。
また,エパネチニコフカーネルを導入し,シーン再構築作業において従来のガウスカーネルに代わる効率的な代替手段としての可能性を示した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:46:56 GMT)
Representation Alignment from Human Feedback for Cross-Embodiment Reward Learning from Mixed-Quality Demonstrations [8.7] 本研究では,1つ以上の実施形態におけるビデオデモから報酬関数を学習したいと考える,クロス・エボディメント逆強化学習の課題について検討する。
本研究では,人間からのフィードバックを表現学習やアライメントに活用し,効果的なクロス・エボディメント学習を実現する技術について分析する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 18:24:14 GMT)
MEEG and AT-DGNN: Improving EEG Emotion Recognition with Music Introducing and Graph-based Learning [8.6] 本研究では、音楽誘発脳波(EEG)記録のマルチモーダルコンパイルであるMEEGデータセットを構築し、既存の脳波データセットを拡張した。
本稿では,脳波の感情認識のための新しいフレームワークである動的グラフニューラルネットワーク(AT-DGNN)を用いた注意に基づく時間学習について紹介する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:50:28 GMT)
Accuracy and Political Bias of News Source Credibility Ratings by Large Language Models [8.4] 本稿では,3大プロバイダから広く利用されている8つの言語モデル(LLM)を評価し,信頼性と高品質な情報ソースを識別する能力を評価する。
より大規模なモデルは、情報不足のために評価の提供を拒否する傾向にあるのに対して、より小さなモデルは、その評価において幻覚を起こす傾向にある。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:09:27 GMT)
Large Language Model-based Role-Playing for Personalized Medical Jargon Extraction [8.3] ロールプレイングは、14の異なる社会デミノグラフィー背景の95%のケースにおいて、F1スコアを改善する。
ロールプレイングとインコンテキスト学習の適用は、従来の最先端モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:40:44 GMT)
Precision Enhancement in Spatial Measurement by Introducing Squeezed Light into Weak Value Amplification [8.2] 高精度光空間測定を実験的に実現するために、WVA技術と圧縮ビーム注入を組み合わせるのはこれが初めてである。
マッハ・ツェンダー干渉計の真空入力ポートに圧縮ビームを加えることにより、500kHzで1.3倍の精度向上を実現することができる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:09:17 GMT)
FTMixer: Frequency and Time Domain Representations Fusion for Time Series Modeling [8.0] 時系列データは、時間領域と周波数領域の両方で表すことができる。
両領域の強度を利用するために、周波数・時間領域混合器(FTMixer)を提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:09:23 GMT)
Convergence Analysis for Deep Sparse Coding via Convolutional Neural Networks [8.0] 本稿では,Deep Sparse Coding(DSC)モデルについて紹介する。
スパース特徴を抽出する能力において,CNNの収束率を導出する。
スパースコーディングとCNNの強いつながりにインスパイアされた私たちは、ニューラルネットワークがよりスパースな機能を学ぶように促すトレーニング戦略を探求する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:43:55 GMT)
Spectral Clustering for Crowdsourcing with Inherently Distinct Task Types [7.8] Dawid-Skeneモデルは、クラウドソーシングアルゴリズムの分析において最も広く想定されているモデルである。
マルチタイプモデルには,異なるタイプに対する異なる重み付けが必要であることを示す。
数値実験により,地味ラベルを推定する前にタイプ別クラスタリングタスクが,クラウドソーシングアルゴリズムの性能を高めることを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:48:05 GMT)
SHREC: a SRE Behaviour Knowledge Graph Model for Shell Command Recommendations [6.9] ITシステムオペレーションでは、シェルコマンドは日々のタスクにサイト信頼性エンジニア(SRE)が使用する一般的なコマンドラインツールである。
本研究では,シェルコマンドレコメンデーションのためのSRE行動知識グラフモデルであるSHRECを提案する。
知識グラフは、SRE操作効率を改善するために、リアルタイムでシェルコマンドレコメンデーションを提供するために使用される。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:32:29 GMT)
fastkqr: A Fast Algorithm for Kernel Quantile Regression [6.9] 我々は、再生されたカーネルヒルベルト空間における量子レグレッションの計算を大幅に改善するfastkqrを導入する。
fastkqrのコアは、近似よりも正確に回帰量子を魔法のように生成する有限な平滑化アルゴリズムである。
さらに、Fastkqrを拡張して、データ駆動の交差ペナルティで柔軟なカーネル量子化レグレッションを実現する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:18:56 GMT)
Mesh deformation-based single-view 3D reconstruction of thin eyeglasses frames with differentiable rendering [6.7] 1枚のRGB画像から高精度3次元フルフレーム眼鏡モデルを復元するためのメッシュ変形に基づく最初の再構成フレームワークを提案する。
合成データセットと実画像の両方の実験結果から,提案アルゴリズムの有効性が示された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 01:40:57 GMT)
Path-LLM: A Shortest-Path-based LLM Learning for Unified Graph Representation [6.4] 統一グラフ表現を学習するための新しいパス-LLMモデルを提案する。
まず,長短経路(L2SP)選択のための新しいメカニズムを提案する。
そして、L2SPベースのトレーニングテキストを得るために経路テキスト化を設計する。
次に,テキストを自己教師型LLM学習プロセスに入力し,埋め込み学習を行う。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:35:11 GMT)
Stable Messenger: Steganography for Message-Concealed Image Generation [6.3] 我々は、より総合的な評価のために、デコードされたメッセージ全体を評価する新しいメトリクスである「メッセージ精度」を導入する。
メッセージの精度を高めるために調整された適応的普遍的損失であるLog-Sum-Exponential(LSE)損失を提案する。
我々はまた、事前訓練された安定拡散を利用した高度なステガノグラフィー画像生成のための新しい潜在認識符号化手法である Approach を導入している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:06:28 GMT)
Controlling for discrete unmeasured confounding in nonlinear causal models [6.3] 理論的には、観測データが潜在ガウス混合モデルの断片的なアフィン変換であるという仮定の下で、コンバウンディングが検出され、修正可能であることを示す。
我々は,このモデルを推定し,デコンウンディングを行うフローベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:50:08 GMT)
MABR: A Multilayer Adversarial Bias Removal Approach Without Prior Bias Knowledge [6.2] 実世界のデータに基づいてトレーニングされたモデルは、しばしば既存の社会的バイアスを反映し、悪化させる。
本稿では,従来のバイアス型知識とは独立して機能する,新たな対人訓練戦略を提案する。
本手法は,人口統計学的アノテーションを必要とせずに,社会的バイアスを効果的に低減する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:11:01 GMT)
A Finite Expression Method for Solving High-Dimensional Committor Problems [5.7] 有限表現法(FEX)をコミッタの計算ツールとして検討する。
FEXベースのコミッタソルバは、いくつかの高次元ベンチマーク問題でテストされる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:40:06 GMT)
Long working distance portable smartphone microscopy for metallic mesh defect detection [5.3] LD-RSMは外部光学部品とスマートフォンを備えた4f光イメージングシステムを構築している。
光学分解能は4.92$mu$m、加工距離は22.23mmである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:02:03 GMT)
Your Context Is Not an Array: Unveiling Random Access Limitations in Transformers [5.2] トランスフォーマーベースの大規模言語モデルは驚くべき障害モードを示す。
長大一般化の失敗は、コンテキストウィンドウ内でランダムなメモリアクセスを実行することができないモデルと複雑な関係がある。
注意マップの可視化を通して、ランダムなメモリアクセスの失敗の場所と方法を示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:12:09 GMT)
Testing Bell inequalities and probing quantum entanglement at a muon collider [4.7] ここでは、将来のミューオンコライダーにおけるH-ZZ-4l事象における量子エンタングルメントの検出とベルの不等式違反の可能性を示す。
Zボソン対のスピン密度行列は、Zボソン崩壊による荷電レプトンの運動学を用いて再構成可能であることを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:22:53 GMT)
Meta-heuristic Optimizer Inspired by the Philosophy of Yi Jing [4.7] 我々は,Yy-Yangペア最適化(YYPO)アルゴリズムの思想から着想を得た。
本稿では,YiJingの逆の概念に基づいて,Yi最適化(Yi Optimization, YI)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:17:42 GMT)
MS23D: A 3D Object Detection Method Using Multi-Scale Semantic Feature Points to Construct 3D Feature Layer [4.6] LiDAR点雲は、三次元空間における物体の動きと姿勢を効果的に描写することができる。
自律運転のシナリオでは、点雲の空間性と空洞性は、ボクセルベースの方法にいくつかの困難をもたらす。
我々はMS23Dと呼ばれる2段階の3Dオブジェクト検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 05:07:52 GMT)
Image Clustering Algorithm Based on Self-Supervised Pretrained Models and Latent Feature Distribution Optimization [4.4] 本稿では,自己教師付き事前学習モデルと潜在特徴分布最適化に基づく画像クラスタリングアルゴリズムを提案する。
我々の手法は最新のクラスタリングアルゴリズムより優れ、最先端のクラスタリング結果が得られる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:14:36 GMT)
An Optimization-based Baseline for Rigid 2D/3D Registration Applied to Spine Surgical Navigation Using CMA-ES [4.1] 整形外科ロボットのナビゲーションシステムには,堅牢で効率的な2D/3D登録フレームワークが不可欠である。
CMA-ESアルゴリズムに基づく粗大な登録フレームワークを提案する。
以上の結果から,本フレームワークが実際の整形外科手術データに及ぼす影響が示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:25:30 GMT)
Object Re-identification via Spatial-temporal Fusion Networks and Causal Identity Matching [4.1] 本稿では,外観特徴と空間的時間的キューを組み合わせた新しいReIDフレームワークについて紹介する。
VeRi776、Valby-3I、Market-1501など、いくつかのデータセットで優れたパフォーマンスを実現した。
カメラネットワークトポロジに基づいてギャラリーセットを動的に割り当てるCIM手法により、リアルタイム設定におけるReID精度とロバスト性をさらに向上する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:50:43 GMT)
Residual-INR: Communication Efficient On-Device Learning Using Implicit Neural Representation [3.8] Residual-INRはフォグコンピューティングに基づく通信効率の高いデバイス上での学習フレームワークである。
データ転送を最大5.16倍に削減する。
また、CPUを使わずにデバイス上での学習を加速し、精度を犠牲にすることなく最大2.9倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:31:21 GMT)
Artworks Reimagined: Exploring Human-AI Co-Creation through Body Prompting [3.8] 本稿では、生成人工知能を用いた画像生成のための入力として、ボディプロンプトについて考察する。
このコンセプトをインタラクティブなアートインスタレーションであるArtworks Reimaginedに実装し、ボディプロンプトを通じてアートを変換します。
我々は、生成AIとの3つの異なる相互作用パターンを識別し、参加者のボディプロンプトとAI共創体験に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:05:59 GMT)
Convergence of Implicit Gradient Descent for Training Two-Layer Physics-Informed Neural Networks [3.7] 暗黙の勾配降下(IGD)は、ある種のマルチスケール問題を扱う場合、共通勾配降下(GD)よりも優れる。
IGDは線形収束速度で大域的に最適解を収束することを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:30:32 GMT)
Mitigating Metropolitan Carbon Emissions with Dynamic Eco-driving at Scale [3.5] 我々は、二酸化炭素排出量を減らす新たな機会として、半自律車の採用の増加を考えています。
交通シナリオと車両排出の複雑さにより、包括的影響分析は手に入らなかった。
我々は,米国三大都市を横断する信号化交差点6,011箇所で,ダイナミックエコドライブの詳細な影響評価を行う。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 18:23:59 GMT)
CryoBench: Diverse and challenging datasets for the heterogeneity problem in cryo-EM [3.4] 核電子顕微鏡(cryo-EM)は、画像データから高分解能の3次元生体分子構造を決定するための強力な技術である。
CryoBenchは、Cryo-EMにおける異種再構築のためのデータセット、メトリクス、パフォーマンスベンチマークのスイートである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:48:14 GMT)
Advancing Pavement Distress Detection in Developing Countries: A Novel Deep Learning Approach with Locally-Collected Datasets [3.4] 開発途上国の道路インフラ整備は、資源の制約と多様な環境要因により、独特な課題に直面している。
本研究は, 効率的な, 正確で, 局所的な舗装災害検出法の必要性に対処するものである。
本稿では、YOLO(You Only Look Once)オブジェクト検出モデルと畳み込みブロック注意モジュールを組み合わせた新しいディープラーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 23:20:36 GMT)
Federated Smoothing Proximal Gradient for Quantile Regression with Non-Convex Penalties [3.3] IoT(Internet-of-Things)の分散センサーは、大量のスパースデータを生成する。
本稿では, 滑らか化機構をそのビューに統合し, 精度と計算速度を両立させる, 結合型滑らか化近位勾配(G)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:50:19 GMT)
Dynamical causality under invisible confounders [3.1] 因果推論は、複雑なシステムにおける実質的な共同設立者のために、因果関係を刺激的に引き起こす傾向がある。
本研究では,このような課題を克服し,目に見えない共同設立者の下で動的因果性を推定する手法を提案する。
我々のCIC法の中核は、観測された変数を元の空間ではなく、共通の部分空間とプライベート部分空間にそれぞれ遅延埋め込む能力にある。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:32:12 GMT)
Moreau-Yoshida Variational Transport: A General Framework For Solving Regularized Distributional Optimization Problems [3.0] クラス確率分布上に定義された複合目的関数を最小化する一般的な最適化問題を考える。
本稿では,正規分布最適化問題の解法として,モロー・吉田変分輸送(MYVT)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:23:54 GMT)
Structure and Reduction of MCTS for Explainable-AI [2.6] 本稿ではモンテカルロ木探索データ構造における情報に焦点を当てる。
モンテカルロ木探索の簡易化と削減のための情報理論ツールを用いた新しい手法を提案する。
本稿では,計算コストを抑えながら,基本的な説明可能性量を計算可能であることを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:33:30 GMT)
BeyondCT: A deep learning model for predicting pulmonary function from chest CT scans [2.6] BeyondCT モデルは,非造影胸部CT から1秒間 (FEV1) の強制活量および強制呼気量を予測するために開発された。
肺機能予測には非造影胸部CT検査が有用であった。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:28:02 GMT)
Efficient Quantum Gradient and Higher-order Derivative Estimation via Generalized Hadamard Test [2.6] パラメータ化量子回路(PQC)の動作を理解するためには、勾配に基づく手法が不可欠である
有限差分、シフト規則、アダマール試験、直接アダマール試験などの既存の勾配推定法は、特定のPQCに対して最適な勾配回路を得ることが多い。
本稿では,一階勾配推定法に適用したフレキシブル・アダマールテスト(Flexible Hadamard Test)を提案する。
また、PQ内の個々のパラメータに対する最適勾配推定手法を適応的に選択する統一勾配法である量子自動微分(QAD)を導入する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:08:54 GMT)
Trustworthiness for an Ultra-Wideband Localization Service [2.5] 本稿では,超広帯域自己ローカライゼーションのための総合的信頼性評価フレームワークを提案する。
我々の目標は、客観的な証拠に基づいてシステムの信頼性を評価するためのガイダンスを提供することである。
我々のアプローチは、結果の信頼性指標が、選択された現実世界の脅威に対応することを保証します。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:57:10 GMT)
Multi-agent Planning using Visual Language Models [2.2] 大規模言語モデル(LLM)とビジュアル言語モデル(VLM)は、様々なドメインやタスクにわたるパフォーマンスとアプリケーションの改善により、関心を集めている。
LLMとVLMは、特に問題領域の深い理解が必要な場合、誤った結果をもたらす。
本稿では,特定のデータ構造を入力として必要とせずに動作可能なマルチエージェント型タスクプランニングアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:10:17 GMT)
Quantum Computing for All: Online Courses Built Around Interactive Visual Quantum Circuit Simulator [2.1] 我々は、インタラクティブな量子回路シミュレータを中心に構築されたオンラインコースを開発した。
即時フィードバックと自動評価タスクは、学生全員の量子コンピューティングへの参入障壁を低くする。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:42:14 GMT)
Cryptographically Secure Pseudo-Random Number Generation (CS-PRNG) Design using Robust Chaotic Tent Map (RCTM) [2.0] 本稿では,ロバストなカオステントマップ(RCTM)を用いて,暗号的にセキュアな擬似ランダム数(CSPRNG)を生成する新しい手法を提案する。
生成した疑似ランダムビットのランダム性を確認する様々な統計的試験が実施されている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:16:00 GMT)
Dilated Convolution with Learnable Spacings [1.8] この論文は、Dilated Convolution with Learnable Spacings (DCLS)法を提示し、評価する。
コンピュータビジョン、音声、音声処理の分野における様々な教師あり学習実験を通じて、DCLS法は、標準および高度な畳み込み技術よりも優れていることを証明した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:12:39 GMT)
A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data Modalities [1.6] ハンドジェスチャ認識(HGR)システムは、自然、効率的、そして認証された人間とコンピュータの相互作用を促進する。
大幅な進歩にもかかわらず、手の動きを自動的かつ正確に識別することはコンピュータビジョンにおいて大きな課題である。
本稿では,2014年から2024年までのHGR技術とデータモダリティを概観し,センサ技術とコンピュータビジョンの進歩を探求する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:40:01 GMT)
SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning [1.6] Large Language Models (LLM) と Multi-modal Large Language Models (MLLM) は、注意に基づくトランスフォーマーアーキテクチャを利用している。
SWIFTは、大型モデルのためのカスタマイズ可能なワンストップインフラストラクチャである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:00:13 GMT)
A Structural Feature-Based Approach for Comprehensive Graph Classification [1.5] 本稿では,基本グラフ構造特性に基づいて特徴ベクトルを構成する手法を提案する。
これらの特徴は、単純さにもかかわらず、同じクラス内のグラフの本質的な特性を捉えるのに十分強力であることを示す。
このアプローチの重要な利点は、その単純さです。これにより、幅広いアプリケーションにアクセスし、適応できます。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 07:59:43 GMT)
Pretrained-Guided Conditional Diffusion Models for Microbiome Data Analysis [1.4] マイクロバイオームデータ計算と復調のための新しい訓練済み条件拡散モデルmbVDiTを紹介する。
原因不明のデータと患者のメタデータを条件付きガイダンスとして使用し、欠落した値を計算します。
また、VAEを使用して他の公開マイクロバイオームデータセットを統合し、モデルパフォーマンスを向上させる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 01:54:06 GMT)
Hierarchical Multi-Armed Bandits for the Concurrent Intelligent Tutoring of Concepts and Problems of Varying Difficulty Levels [1.0] マルチアーム・バンディット(MAB)の知的家庭教師は、学生問題推奨のための探検・探検のトレードオフ景観を横断する際、顕著な能力を持っている。
本稿では,MABの知的チューリング技術に関する最近の文献を,オープンソースかつデプロイ可能な階層型MABアルゴリズムに統合する。
我々のアルゴリズムは難易度に依存しない場合、学生の成功を著しく向上させ、問題分散適応のさらなる追加は、この指標を顕著に改善する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:11:52 GMT)
Enhancing Computational Efficiency in Intensive Domains via Redundant Residue Number Systems [1.0] 本稿では, RNS (termed R-RNS) と冗長数系を融合することにより, 遅延を低減し, 回路実装を向上する方法について検討する。
RNS、冗長数システム、BNS(Binary Number System)、SD-RNS(Signed-Digit Redundant Residue Number System)の4つのシステムの比較分析を行った。
SD-RNS は RNS と BNS でそれぞれ 1.27 倍, 2.25 倍の高速化を実現し, 逐次加算および乗算作業において BNS と比較してエネルギー消費量を60% 削減できることを示した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:45:35 GMT)
Mathematical Models of Computation in Superposition [0.9] 重ね合わせは、現在のAIシステムを機械的に解釈する上で深刻な課題となる。
重ね合わせにおけるエンフン計算の数学的モデルを提案し, 重ね合わせはタスクを効率的に遂行するのに有効である。
我々は、重ね合わせで計算を実装するニューラルネットワークを解釈する研究の潜在的な応用について、結論付けている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 06:11:48 GMT)
Highly-entangled stationary states from strong symmetries [0.9] 強い非アベリア保存量は、ユニタリ量子チャネルにおいても高い絡み合った定常状態をもたらす可能性がある。
これらは、すべての強保存量を特徴づける可換体がリー代数の普遍包絡代数またはリード=セール可換環に対応するような開量子進化に適用されることを証明している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:55:27 GMT)
Civiverse: A Dataset for Analyzing User Engagement with Open-Source Text-to-Image Models [0.7] 我々は、何百万もの画像と関連するメタデータを含むCiviverseプロンプトデータセットを解析する。
本稿では,テキストプロンプトのセマンティックな特徴について,プロンプト解析に着目する。
本研究は, 意味的コンテンツの均質化に焦点をあてた上で, 明示的コンテンツの生成を優先する傾向を示した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:41:03 GMT)
Evolutionary Neural Architecture Search for 3D Point Cloud Analysis [0.6] 本稿では, 連続点干渉次元探索(SHSADE-PIDS)を用いた成功史に基づく自己適応微分進化法を提案する。
SHSADE-PIDSは、離散的なディープニューラルネットワークアーキテクチャを連続空間にエンコードし、効率的なポイントクラウドニューラルネットワークアーキテクチャのための連続空間での探索を実行する進化的NASフレームワークである。
挑戦的な3Dセグメンテーションと分類ベンチマークに関する総合的な実験は、SHSADE-PIDSの機能を示している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:41:18 GMT)
Exchange control in a MOS double quantum dot made using a 300 mm wafer process [0.6] 300mmウエハ金属酸化物半導体(MOS)プロセスで作製された量子ドットの最近の研究は、個々のスピン量子ビットの制御と読み出しを示している。
スピン-スピン交換相互作用を用いた2つの電子スピンのコヒーレント制御を実証し、エンタングゲートの基礎を形成する。
本研究は,分散センシング技術との統合とともに,2量子演算のための産業用グレードプラットフォームを実証した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 18:02:11 GMT)
A forward differential deep learning-based algorithm for solving high-dimensional nonlinear backward stochastic differential equations [0.6] 我々は、高次元非線形後方微分方程式(BSDEs)を解くための新しい前方微分深層学習アルゴリズムを提案する。
差分深度学習がラベルとその導関数を入力に対して効率的に近似できるという事実により、BSDE問題を差分深度学習問題に変換する。
アルゴリズムの主な考え方は、オイラー・丸山法を用いて積分を離散化し、3つのディープニューラルネットワークを用いて未知の離散解を近似することである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:34:03 GMT)
Forecasting Day-Ahead Electricity Prices in the Integrated Single Electricity Market: Addressing Volatility with Comparative Machine Learning Methods [0.6] 本稿では,アイルランド総合電力市場を中心に,電力価格予測手法の総合的な検討を行う。
本研究の主な目的は,様々な予測モデルの性能を評価し,比較することである。
この論文は、毎日のEU天然ガス価格が、ヘンリー・ハブ天然ガス価格よりもアイルランドの電力価格予測に有用な特徴であることを実証している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:43:21 GMT)
Leveraging Hamiltonian Simulation Techniques to Compile Operations on Bosonic Devices [0.4] 特定の操作のクラスを実現するために,厳密に証明されたエラー境界を用いた解析的手法を提案する。
本研究は、ハイブリットボソン量子ビットデバイスをよりよく制御するために、ハミルトンシミュレーションの手法を適用する方法を示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:52:20 GMT)
A Web-based Software Development Kit for Quantum Network Simulation [0.3] 量子ネットワーキングコミュニティを構築するための牽引力は限られている。
我々のQuantum Network Development Kit(QNDK)プロジェクトはこれらの問題を解決することを目的としている。
非常に少ないコードで簡単に量子ネットワークシミュレーションを開発、実行するためのグラフィカルなユーザーインターフェイスを含んでいる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:15:13 GMT)
Detecting Masquerade Attacks in Controller Area Networks Using Graph Machine Learning [0.3] 本稿では,グラフ機械学習(ML)を用いたCANバスにおけるマスクレード攻撃検出のための新しいフレームワークを提案する。
本稿では,CANバスフレームをメッセージシーケンスグラフ(MSG)として表現し,時系列からコンテキスト統計属性を付加することにより,検出能力を向上できることを示す。
提案手法は,CANフレームの相互作用を包括的かつ動的に解析し,ロバスト性や効率性を向上する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:17:58 GMT)
Anticipation through Head Pose Estimation: a preliminary study [0.2] 本稿では,行動目標を理解し,予測するための視覚的手がかりとして頭部ポーズを用いた予備実験について論じる。
短期的な予測が可能であることを示し、人間とロボットの相互作用に将来の応用の基礎を築いていく。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 10:58:33 GMT)
Camera Perspective Transformation to Bird's Eye View via Spatial Transformer Model for Road Intersection Monitoring [0.1] 道路交差点の監視と制御の研究は、しばしば鳥の目視(BEV)シミュレータを利用する。
実際の交通状況では、シミュレーターと同様のBEVを達成するには、ドローンや特定のセンサーを配置する必要がある。
道路交差点の1台のカメラの視点をBEVに変換する新しいディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:01:19 GMT)
LaiDA: Linguistics-aware In-context Learning with Data Augmentation for Metaphor Components Identification [0.1] 大規模言語モデル(LLM)は、複雑な自然言語テキストの正確な理解のための新しい道を提供する。
LLMベースの新しいフレームワークが提案され、Lingguistics-aware In-context Learning with Data Augmentation (LaiDA) と名付けられた。
グラフアテンションネットワークエンコーダは言語的にリッチな特徴表現を生成し、同様の例を検索する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 02:02:26 GMT)
XpookyNet: Advancement in Quantum System Analysis through Convolutional Neural Networks for Detection of Entanglement [0.0] 量子システムに適したカスタムディープ畳み込みニューラルネットワーク(CNN)モデルを導入する。
提案するCNNモデルであるXpookyNetは,複素数データを扱うという課題を効果的に克服する。
まず第一に、量子状態は完全かつ部分的に絡み合った状態を調べるためにより正確に分類されるべきである。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:09:05 GMT)
Transformer-based Neuro-Animator for Qualitative Simulation of Soft Body Movement [0.0] 人間の心は、風力の下で揺らぎや手を振っている旗など、物理学の法則によって支配される物体の動きを、力ずくでシミュレートする。
本稿では,ニューロアニメーターモデルとしての最近のトランスフォーマーアーキテクチャの適用について検討する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:05:24 GMT)
Transfer and entanglement stability of property ($UW${\normalsize\it{E}}) [0.0] 作用素 $Tin B(H)$ が性質 (UW$scriptsize itE) を満たすと、本質的な近似点スペクトルの近似点スペクトルの補関数がスペクトルの孤立固有値と一致する。
上三角作用素行列の2倍の時間に対する特性(UW$scriptsize itE)の絡み合い安定性について検討した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:34:20 GMT)
The trouble with pilot-wave theory: a critical evaluation [0.0] パイロット波理論の根本的性質は、しばしば誤解されるか、見過ごされるかを示す。
我々は、その力学の新規性を強調し、測定の理解にその意味を明らかにする。
アインシュタインはもはや説得力のない理由から、パイロット波理論を断念したと我々は主張する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 01:45:59 GMT)
The fast committor machine: Interpretable prediction with kernels [0.0] 本稿では,高速コミッタマシン(FCM)と呼ばれる,コミッタの効率的な近似アルゴリズムを提案する。
カーネル関数は、$A$から$B$遷移を最適に記述する低次元部分空間を強調するように構成される。
FCMは精度が高く、同じ数のパラメータを持つニューラルネットワークよりも速くトレーニングする。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 22:20:10 GMT)
Semantic web technologies in sensor-based personal health monitoring systems: A systematic mapping study [0.0] 本研究では,センサを用いた個人健康モニタリングシステムにおけるセマンティックWeb技術の利用状況について分析する。
我々は、インターオペラビリティ、コンテキスト認識、状況検出、状況予測、意思決定支援、説明可能性、不確実性処理の7つの主要な課題に対して、選択されたシステムが対処する範囲を批判的に分析する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:03:00 GMT)
Safety Enhancement in Planetary Rovers: Early Detection of Tip-over Risks Using Autoencoders [0.0] この研究は、これらの重要な瞬間を予測し、完全に起こる前に検出するための、潜在的なチップオーバーイベントの早期兆候を特定することに焦点を当てている。
慣性測定ユニット(IMU)は、コンパクトで堅牢で効率的なオートエンコーダを開発するために使用される。
この研究は、チップオーバーリスクを検出し、より信頼性の高い探査ミッションのための安全対策を開発するための予測能力に貢献する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 17:34:48 GMT)
S-SIRUS: an explainability algorithm for spatial regression Random Forest [0.0] 本研究は,コンパクトで単純な規則リストを抽出することにより,空間依存データにおける回帰RFを説明することを目的とする。
S-SIRUSとS-SIRUSを比較検討し,S-SIRUSとS-SIRUSを比較検討した。
その結果,空間相関が存在する場合,S-SIRUSはSIRUSよりも高いテスト予測精度を示すことが示唆された。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:41:43 GMT)
Robustness and classical proxy of entanglement in variants of quantum walk [0.0] 量子ウォーク(QW)は内部の量子状態を利用して変位を決定する。
絡み合いは時間的および空間的依存的ランダム性の両方に対して頑健であることを示す。
本稿では、内部状態の確率分布の重なりを文字通り測定する古典的な量呼び出し重なりについて述べる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:57:50 GMT)
Quantum-secure multiparty deep learning [0.0] 我々は,光の量子的性質を利用した線形代数エンジンを,情報理論的に安全なマルチパーティ計算に導入する。
このエンジンをディープラーニングに適用し、ディープニューラルネットワーク重みとクライアントのデータの両方の情報漏洩に関する厳密な上限を導出する。
我々の研究は、実用的な量子セキュアな計算の基礎を築き、セキュアなクラウド深層学習をフィールドとして解き放ちます。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:48:40 GMT)
Quantum geometry and geometric entanglement entropy of one-dimensional Floquet topological matter [0.0] 一次元周期駆動系におけるフロケ位相状態の量子幾何学と関連する絡み合いエントロピーを明らかにする。
フロッケ状態の量子計量テンソルは、位相相転移点において非解析的シグネチャを示す。
その結果,Floquet状態の豊富な量子幾何学が明らかとなり,ギャップを持つFloquet位相のEEの幾何学的起源が明らかにされた。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:44:06 GMT)
Quantum Codes from Twisted Unitary $t$-groups [0.0] ツイスト付きユニタリ$t$-群は、既約表現によるツイスト化の下でのユニタリ$t$-群の一般化である。
次に、Knill-Laflamme誤差補正条件に表現法を適用し、ねじれたユニタリ$t$-群が距離$d=t+1$の符号に自動的に対応することを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 15:03:22 GMT)
On stability issues of the HEOM method [0.0] 補助密度演算子の階層化に必要な切り離しは,完全制御不能な誤差を生じさせると考えられる。
放散型貯水池との強い結合には, 階層構造を任意の有限サイズに切り離すことが問題となる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 11:13:18 GMT)
More Skin, More Likes! Measuring Child Exposure and User Engagement on TikTok [0.0] 子どものTikTok曝露に関する研究
子どもをフィーチャーした115のユーザーアカウントから5,896本のビデオに対する432,178件のコメントを分析した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 19:44:12 GMT)
Modeling Multi-Step Scientific Processes with Graph Transformer Networks [0.0] 回帰タスクに対する幾何学習の有効性は線形モデルの集合に対してベンチマークされた。
グラフトランスフォーマーネットワークは、プロセスステップとシーケンス依存機能の間の隠れた相互作用を特徴とするシナリオにおいて、すべてのテストされた線形モデルを上回った。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:03:51 GMT)
Metacognitive Myopia in Large Language Models [0.0] 大規模言語モデル(LLM)は、文化的に固有のステレオタイプ、クラウドの道徳的判断、あるいは多数派の肯定的な評価を強化する潜在的に有害なバイアスを示す。
認知・生態的枠組みとしてメタ認知ミオピアを提案する。
我々の理論的枠組みは, メタ認知, 監視, 制御の2つの要素が欠如していることが, メタ認知性ミオピアの5つの症状を引き起こすことを示唆している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:43:57 GMT)
Latent class analysis for multi-layer categorical data [0.0] 本稿では, より一般的な多層分類データについて考察する。
我々は,新しい統計モデル,多層潜在クラスモデル(多層LCM)を提案する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 12:31:31 GMT)
Incremental Gauss-Newton Descent for Machine Learning [0.0] 本稿では,ガウス・ニュートン法に基づく近似2次情報を利用したグラディエントDescentアルゴリズムの修正を提案する。
Incrmental Gauss-Newton Descent (IGND)と呼ばれる新しい手法は、基本的に標準SGDと同じ計算負担を持つ。
IGNDは、少なくとも最悪の場合には、SGDと同等以上の性能を保ちながら、SGDを著しく上回る。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:52:40 GMT)
Implementing and Executing Static Analysis Using LLVM and CodeChecker [0.0] 本チュートリアルでは,C++プログラミング言語の問題点を2つ提示する。
チェッカーを実装するためのステップバイステップガイドを提供します。
このチュートリアルの読者は静的解析ツールのアーキテクトと開発者の両方である。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 23:49:04 GMT)
IVISIT: An Interactive Visual Simulation Tool for system simulation, visualization, optimization, and parameter management [0.0] IVISITは、Python/Numpyをベースとした汎用的なインタラクティブビジュアルシミュレーションツールである。
システムシミュレーション、パラメータ最適化、パラメータ管理、システムのダイナミクスの可視化に使用できる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:01:23 GMT)
From Monte Carlo to neural networks approximations of boundary value problems [0.0] ポアソン方程式の解はモンテカルロ法により超ノルムで数値的に近似できることを示す。
また、得られたモンテカルロ解法は、ポアソン問題に対する建設的なReLUディープニューラルネットワーク(DNN)の解法を示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 04:55:50 GMT)
Fever Detection with Infrared Thermography: Enhancing Accuracy through Machine Learning Techniques [0.0] 赤外線サーモグラフィー(IRT)は体温を測定するための重要な非接触法であることが証明されている。
従来の非接触赤外線温度計(NCIT)は、読書において大きな変動を示すことが多い。
そこで我々は,温度測定の精度と信頼性を高めるために,機械学習アルゴリズムをIRTと統合した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:18:33 GMT)
FedRobo: Federated Learning Driven Autonomous Inter Robots Communication For Optimal Chemical Sprays [0.0] フェデレーション学習は、中央集権的なデータ収集に頼ることなく、ロボットが互いの経験から学ぶことを可能にする。
化学噴霧を最適化するための通信プロトコルが設計されている。
クラスタベースのフェデレーション学習手法は,グローバルサーバの計算負荷を効果的に削減する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:32:39 GMT)
Entanglement in Quantum Dots: Insights from Dynamic Susceptibility and Quantum Fisher Information [0.0] 本研究では,量子ドット(QD)の粒子間クーロン相互作用を電荷エネルギーと交換結合項に分解するハミルトニアンの下での絡み合い特性について検討した。
動的感受性と量子フィッシャー情報(QFI)を解析することにより、交換定数、温度変動、閉じ込め効果に影響される興味深い挙動を明らかにする。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:35:46 GMT)
EPAM-Net: An Efficient Pose-driven Attention-guided Multimodal Network for Video Action Recognition [0.0] 本稿では,ビデオにおける行動認識のための効果的なポーズ駆動型注意誘導型マルチモーダル行動認識(EPAM-Net)を提案する。
具体的には、RGBビデオとそのスケルトンシーケンスから、ポーズストリームとネットワーク時間特徴の両方にX3Dネットワークを適用した。
我々のモデルはFLOPの6.2-9.9-x削減(浮動小数点演算、乗算加算数)とネットワークパラメータの9-9.6倍削減を提供する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 03:15:24 GMT)
Document-Level Event Extraction with Definition-Driven ICL [0.0] 本稿では,DDEE(Definition-driven Document-level Event extract)と呼ばれる最適化手法を提案する。
プロンプトの長さを調整し,プロンプトの明瞭度を高めることにより,大規模言語モデル(LLM)のイベント抽出性能を大幅に改善した。
さらに、構造化手法の導入と厳密な制限条件により、イベントと引数の役割抽出の精度が向上した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:24:09 GMT)
Distributing quantum correlations through local operations and classical resources [0.0] 我々は,グローバルな量子相関を量子メモリに分散できる,堅牢で物理的に動機づけられたプロトコルを提案する。
これに加えて, 分布は測定アウトカム独立であり, 分布は局所的ユニタリ演算と射影測定のみを用いて行われる。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 08:42:06 GMT)
Convergence to Bohmian mechanics in a de Broglie-like pilot-wave system [0.0] ボヘミア力学と古典的パイロット波動理論を橋渡しする一般的な結果を示す。
結合の異なる選択により、ド・ブロイのような系は、非相対論的極限における単粒子ボヘミア力学に正確に還元されることを示す。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 00:57:47 GMT)
Complexity of two-level systems [0.0] スピン、量子ビット、磁気モーメントなどの2段階系の複雑性を解析する。
複雑さはシャノンエントロピーとR'enyiエントロピーの間の差として定義される。
その結果,制御パラメータの選択に要する最大複雑性が得られた。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 13:47:18 GMT)
Comparative Study of Recurrent Neural Networks for Virtual Analog Audio Effects Modeling [0.0] 仮想アナログモデリングにおける機械学習の応用について検討する。
我々は、ステートスペースモデルと線形リカレントユニットを、より一般的なLong Short Term Memoryネットワークと比較する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:17:50 GMT)
Broad Instantaneous Bandwidth Microwave Spectrum Analyzer with a Microfabricated Atomic Vapor Cell [0.0] 87mathrmRb$原子のマイクロ波スペクトル解析
センサー(Sensor)はMEMSの原子蒸気電池で、等方的に純粋な8,7mathrmRb$と$mathrmN$バッファーガスで満たされている。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:48:37 GMT)
Balancing Innovation and Ethics in AI-Driven Software Development [0.0] 本稿では,GitHub CopilotやChatGPTといったAIツールをソフトウェア開発プロセスに統合することの倫理的意味を批判的に考察する。
コードオーナシップ、バイアス、説明責任、プライバシ、雇用市場への影響の可能性などについて検討する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 14:11:22 GMT)
Asymmetric EPR Steering in a Cavity-Magnon System Generated by a Squeezed Vacuum Field and an Optical Parametric Amplifier [0.0] 共振器マイクロ波場に結合した2つのマグノンモードを有するキャビティ・マグノン系について検討した。
我々は,OPAゲインとスクイーズパラメータの増大が量子エンタングルメントとアインシュタイン-ポドルスキー-ローゼンステアリングを著しく向上させることを示した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 21:39:49 GMT)
Artificial Data, Real Insights: Evaluating Opportunities and Risks of Expanding the Data Ecosystem with Synthetic Data [0.0] Synthetic Dataは新しいものではないが、Generative AIの最近の進歩は、研究ツールボックスの拡張への関心を高めている。
この記事では、Synthetic Dataドメインの全範囲を分類します。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 16:46:35 GMT)
An Information-Theoretic Analysis of Temporal GNNs [0.0] 情報理論は、時間的GNNの分析のためのフレームワークを提供するための主要なツールとして使用される。
情報ボトルネックの概念は、そのようなネットワークの時間的分析に適したように利用され、調整される。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:11:11 GMT)
AdaMoLE: Fine-Tuning Large Language Models with Adaptive Mixture of Low-Rank Adaptation Experts [0.0] 本稿では,Lank Adaptation ExpertsのAdaptive Mixtureを通じて,大規模言語モデル(LLM)を微調整する新しい手法であるAdaMoLEを紹介する。
AdaMoLEは専用のしきい値ネットワークを使用してアクティベーション閾値を動的に調整し、異なるタスクの複雑さに応じて適応的に応答する。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 05:26:24 GMT)
AI-Powered Energy Algorithmic Trading: Integrating Hidden Markov Models with Neural Networks [0.0] 本研究では,HMM(Hidden Markov Models)とニューラルネットワークを組み合わせた新たなアプローチを提案する。
新型コロナウイルスの期間(2019-2022年)に、この二重モデルアプローチはシャープ比0.77で83%のリターンを達成した。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 20:45:35 GMT)
A Laplacian-based Quantum Graph Neural Network for Semi-Supervised Learning [0.0] 本研究では,4つのベンチマークデータセットにまたがって,ラプラシアンをベースとした量子半教師付き学習法の性能について検討した。
追加のQubitsの有効性は、量子アルゴリズムとデータセットの適合性に依存する。
ラプラシア語学習のパフォーマンスは、異なるデータセット間で最適な設定が異なり、絡み合うレイヤの数に大きく依存している。
論文参考訳(メタデータ) (Sat, 10 Aug 2024 09:13:42 GMT)