Q-Sparse: All Large Language Models can be Fully Sparsely-Activated [93.5] Q-Sparseは、スパースアクティベートされた大規模言語モデル(LLM)を訓練するための、シンプルで効果的なアプローチである。
Q-Sparse は LLM における活性化の完全な分散を可能にし、推論においてかなりの効率向上をもたらす。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:59:29 GMT)
Mutual Learning for Acoustic Matching and Dereverberation via Visual Scene-driven Diffusion [93.3] 本稿では拡散モデルに基づく相互学習フレームワークMVSDを紹介する。
MVSDは2つのタスクを対称的に考慮し、逆タスクからの学習を容易にするために相互関係を利用する。
我々のフレームワークは、残響器と残響器の性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 00:47:56 GMT)
DataDream: Few-shot Guided Dataset Generation [90.1] 実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:10:31 GMT)
MagDiff: Multi-Alignment Diffusion for High-Fidelity Video Generation and Editing [90.1] 我々は、高忠実度ビデオ生成と編集の両方のタスクに対して、MagDiffと呼ばれる統合多重配位拡散を提案する。
提案したMagDiffは、主観駆動アライメント、適応プロンプトアライメント、高忠実アライメントを含む3種類のアライメントを導入している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:51:43 GMT)
Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.8] 大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。
本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。
攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:41:11 GMT)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization [78.6] トレーニング済み重量を効率的に更新するための直交微調整法を提案する。
クロスレギュラー化戦略はゼロショットの一般化の観点から安定性を維持するためにも用いられる。
提案手法は,タスク固有の知識を表現するために,事前学習した重み空間を明示的に操るものであることを実証するために,広範囲にわたる実験を行った。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:38:40 GMT)
Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.8] 我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:54:37 GMT)
SEED: A Simple and Effective 3D DETR in Point Clouds [72.7] ポイントクラウドの分散度が高く,不均一な分布のため,主な課題は困難である,と我々は主張する。
点雲から3次元物体を検出するための簡便で効果的な3次元DETR法(SEED)を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:21:07 GMT)
ESceme: Vision-and-Language Navigation with Episodic Scene Memory [72.7] ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)は、現実世界のシーンで自然言語のナビゲーション指示に従う視覚エージェントをシミュレートする。
本稿では,VLNにおける情景記憶(esceme)のメカニズムについて紹介する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:35:49 GMT)
Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.5] 部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。
それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。
これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:32:29 GMT)
Agent Attention: On the Integration of Softmax and Linear Attention [70.1] 本稿では,計算効率と表現力のバランスをとるために,新しい注意パラダイムであるエージェント注意(Agent Attention)を提案する。
提案するエージェントアテンションは,線形アテンションの一般化形式と等価であることを示す。
特に、エージェントの注意は高解像度のシナリオにおいて顕著な性能を示しており、その線形の注意の性質に依拠している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:42:48 GMT)
Towards High-Quality 3D Motion Transfer with Realistic Apparel Animation [69.4] 本研究では,現実的なアパレルアニメーションを用いた高品質な動き伝達を目的とした新しい手法を提案する。
本稿では,2つのニューラル変形モジュールを介し,物体とアパレルの変形を学習するデータ駆動パイプラインを提案する。
本手法は各種アパレルの品質に優れた結果をもたらす。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:17:35 GMT)
Walking the Values in Bayesian Inverse Reinforcement Learning [66.7] ベイズIRLの鍵となる課題は、可能な報酬の仮説空間と可能性の間の計算的ギャップを埋めることである。
本稿では,この知見に基づく新しいマルコフ連鎖モンテカルロ法であるValueWalkを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:59:52 GMT)
Secure Aggregation is Not Private Against Membership Inference Attacks [66.6] フェデレーション学習におけるSecAggのプライバシーへの影響について検討する。
SecAggは、単一のトレーニングラウンドであっても、メンバシップ推論攻撃に対して弱いプライバシを提供します。
以上の結果から,ノイズ注入などの付加的なプライバシー強化機構の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:29:33 GMT)
When Do Neural Nets Outperform Boosted Trees on Tabular Data? [65.3] 私たちは一歩後退して、'NN vs. GBDT'議論の重要性に疑問を投げかけます。
驚くほど多くのデータセットに対して、GBDTとNNのパフォーマンスの違いは無視できる。
我々は、データセットのどの特性がNNやGBDTを適切に動作させるために適しているかを決定するために、数十のメタ機能を分析します。
私たちの洞察は、実践者がデータセット上で最もうまく機能するテクニックを決定するためのガイドとして機能します。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:00:47 GMT)
GRUtopia: Dream General Robots in a City at Scale [65.1] 本稿では,各種ロボットを対象とした対話型3D社会「GRUtopia」について紹介する。
GRScenesには100万のインタラクティブな微妙な注釈付きシーンが含まれており、都市規模の環境に自由に組み合わせることができる。
GRResidentsはLarge Language Model (LLM)によって駆動されるNon-Player Character (NPC)システムである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:40:46 GMT)
RepVF: A Unified Vector Fields Representation for Multi-task 3D Perception [64.8] 本稿では,様々な知覚タスクの表現を調和させる新しい統一表現RepVFを提案する。
RepVFは、ベクトル場を通じてシーン内の異なるターゲットの構造を特徴付け、シングルヘッドでマルチタスクの学習モデルを可能にする。
RepVF 上に構築された RFTR は,タスク間の固有性を利用したネットワークである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:25:07 GMT)
Object-Centric Diffusion for Efficient Video Editing [64.7] デルタ蒸留と呼ばれる新しい知識蒸留方式を提案する。
ビデオフレーム内の時間的冗長性により,これらの時間的変動を効果的に蒸留できることを実証した。
副産物として、デルタ蒸留は教師モデルの時間的一貫性を向上させる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:32:19 GMT)
Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.7] グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:11:44 GMT)
AccDiffusion: An Accurate Method for Higher-Resolution Image Generation [63.5] AccDiffusionは、パッチワイドの高解像度画像生成をトレーニングなしで正確に行う方法である。
本稿では,異なるパッチに対する同一のテキストプロンプトが繰り返しオブジェクト生成を引き起こすことを明らかにする。
我々のAccDiffusionは、繰り返しオブジェクト生成の問題に効果的に対処し、高解像度画像生成の性能向上につながる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:06:29 GMT)
Exploration-Driven Policy Optimization in RLHF: Theoretical Insights on Efficient Data Utilization [56.5] ポリシー最適化(PO-RLHF)に基づくRLHFアルゴリズムの検討
クエリの複雑さが低いPO-RLHFの性能バウンダリを提供する。
鍵となる新規性は、軌跡レベルの楕円ポテンシャル分析である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 04:19:50 GMT)
Curved Diffusion: A Generative Model With Optical Geometry Control [56.2] 最終シーンの外観に対する異なる光学系の影響は、しばしば見過ごされる。
本研究では,画像レンダリングに使用される特定のレンズとテキスト画像拡散モデルを密接に統合するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:47:13 GMT)
SuperPADL: Scaling Language-Directed Physics-Based Control with Progressive Supervised Distillation [55.5] 物理ベースのテキスト・トゥ・モーションのためのスケーラブルなフレームワークであるSuperPADLを紹介する。
SuperPADLは、RLと教師あり学習を使って、何千もの多様なモーションクリップでコントローラを訓練する。
コントローラは5000以上のスキルを含むデータセットでトレーニングされ、コンシューマGPU上でリアルタイムに動作します。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:07:11 GMT)
The Manifold Hypothesis for Gradient-Based Explanations [55.0] 勾配に基づく説明アルゴリズムは知覚的に整合した説明を提供する。
特徴属性がデータの接する空間と一致しているほど、知覚的に一致している傾向にあることを示す。
説明アルゴリズムは、その説明をデータ多様体と整合させるよう積極的に努力すべきである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:44:31 GMT)
MVSGaussian: Fast Generalizable Gaussian Splatting Reconstruction from Multi-View Stereo [54.0] MVSGaussianは、Multi-View Stereo(MVS)から導かれる新しい一般化可能な3次元ガウス表現手法である。
MVSGaussianは、シーンごとにより良い合成品質でリアルタイムレンダリングを実現する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:34:30 GMT)
Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.7] 本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。
特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。
提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:09:28 GMT)
Large Language Model-based FMRI Encoding of Language Functions for Subjects with Neurocognitive Disorder [53.6] LLMを用いたfMRIエンコーディングと脳のスコアを用いた高齢者の言語関連機能変化について検討する。
脳のスコアと認知スコアの相関関係を脳全体のROIと言語関連ROIの両方で分析した。
以上の結果から,認知能力の向上は,中側頭回に有意な相関がみられた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:09:08 GMT)
LiteFocus: Accelerated Diffusion Inference for Long Audio Synthesis [53.4] 長い音声合成における音声潜伏拡散モデルの推論を強化する新しい手法を提案する。
我々は、同じ周波数の焦点とクロス周波数の補償として指定され、同じ周波数の制約下でのアテンション計算を縮小する、二重スパース形式を用いてアテンション計算を行う。
LiteFocusは80秒音声クリップの合成において拡散ベースTTAモデルによる推論時間を1.99倍に削減した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 06:49:05 GMT)
Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation [52.9] 既存の動き生成法は主に大域運動の直接合成に焦点を当てている。
本研究では,局所動作を微粒化制御信号として利用することにより,グローバルな動き生成を容易にする局所動作誘導型動き拡散モデルを提案する。
本手法は,様々な局所動作と連続誘導重み調整をシームレスに組み合わせる柔軟性を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:35:00 GMT)
ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences [51.7] 我々は中国医学領域向けに明示的に設計されたベンチマークLSMであるChiMed-GPTを提案する。
ChiMed-GPTは、事前訓練、SFT、RLHFを含む総合的な訓練体制を実施。
我々は,ChiMed-GPTを患者識別に関する態度尺度の実行を促すことによって,潜在的なバイアスを分析した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:57:00 GMT)
Accessing Vision Foundation Models at ImageNet-level Costs [51.5] Proteusは、驚くべき能力でImageNetレベルのコストでトレーニングされている。
Proteus-L/14は、OracleのメソッドであるDINOv2-L/14のパフォーマンスを15ベンチマークで比較する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 00:13:53 GMT)
Provable Robustness of (Graph) Neural Networks Against Data Poisoning and Backdoor Attacks [50.9] グラフニューラルネットワーク(GNN)は、特定のグラフのノード特徴をターゲットとした中毒やバックドア攻撃に対して認証する。
コンボリューションベースのGNNとPageRankベースのGNNの最悪の動作におけるグラフ構造の役割とその接続性に関する基本的な知見を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:12:51 GMT)
Simple and Effective Transfer Learning for Neuro-Symbolic Integration [50.6] この問題の潜在的な解決策はNeuro-Symbolic Integration (NeSy)であり、ニューラルアプローチとシンボリック推論を組み合わせる。
これらの手法のほとんどは、認識をシンボルにマッピングするニューラルネットワークと、下流タスクの出力を予測する論理的論理的推論を利用する。
それらは、緩やかな収束、複雑な知覚タスクの学習困難、局所的なミニマへの収束など、いくつかの問題に悩まされている。
本稿では,これらの問題を改善するための簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:49:49 GMT)
A Roadmap to Pluralistic Alignment [49.3] 本稿では,言語モデルをテストベッドとして用いた多元的アライメントのロードマップを提案する。
我々は,AIシステムにおける多元性を定義・運用する3つの可能な方法を特定し,定式化する。
我々は、現在のアライメント技術は、基本的に多元的AIに限られていると論じる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:06:13 GMT)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles [49.2] 本研究では,自然言語で表現を指定した発話ヘッドを生成可能なフレームワークであるTalkCLIPを提案する。
テキストから表現へのマッピングをモデル化するために,まず,テキストとビデオのペアによる発話ヘッドデータセットを構築した。
自然言語による記述を表現表現に投影するCLIPベースのスタイルエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:51:36 GMT)
CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.2] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:52:10 GMT)
Explore as a Storm, Exploit as a Raindrop: On the Benefit of Fine-Tuning Kernel Schedulers with Coordinate Descent [48.8] カーネルの品質を向上しながら,Ansorの検索時間を短縮する可能性を示す。
このアプローチを、Ansorが生成した最初の300のカーネルに適用する。
この結果は20の有名なディープラーニングモデルで再現されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:42:24 GMT)
Automated Label Unification for Multi-Dataset Semantic Segmentation with GNNs [48.4] 本稿では,グラフニューラルネットワークを用いて,複数のデータセットにまたがる統一ラベル空間を自動構築する手法を提案する。
従来の手法と異なり,本手法は手動の注釈や分類の調整を必要とせず,シームレスな訓練を容易にする。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:42:10 GMT)
SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant [48.2] 本稿では,SQ-LLaVA: Self-Questioning for Large Vision-Language Assistantを提案する。
SQ-LLaVAは、視覚的手がかりと先行言語知識を分析しながら、柔軟で有意義な画像関連質問を生成する能力を示す。
高品質なインストラクションデータに対する微調整SQ-LLaVAは、従来の視覚的インストラクションチューニング手法と比較して性能改善を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:37:11 GMT)
A pragmatic policy learning approach to account for users' fatigue in repeated auctions [47.8] MLモデルは、前回のオークションが現在の機会価値をどの程度獲得したかを予測することができる。
この予測を用いて、現在の競売の予想利益を最大化する政策を、患者と呼ぶことができる。
我々は、このコストの浸透の重要性について、実証的な2つの論証を提示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:53:29 GMT)
Unraveling the Truth: Do LLMs really Understand Charts? A Deep Dive into Consistency and Robustness [47.7] チャート質問応答(CQA)は、ビジュアル言語理解の重要な領域である。
この分野の現在のビジュアル言語モデル(VLM)は、まだ未調査のままである。
本稿では,包括的データセット上での最先端VLMの評価を行う。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:29:24 GMT)
Using LLMs for the Extraction and Normalization of Product Attribute Values [47.1] 本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。
実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:16:14 GMT)
InVi: Object Insertion In Videos Using Off-the-Shelf Diffusion Models [46.6] InViは、ビデオ内のオブジェクトを挿入または置換するためのアプローチで、オフザシェルフ、テキスト・ツー・イメージの潜伏拡散モデルを用いて導入する。
InViは、フレーム間の一貫したブレンディングとコヒーレンスで現実的なオブジェクト挿入を実現し、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:55:09 GMT)
Are Emergent Abilities in Large Language Models just In-Context Learning? [46.6] 創発的能力を説明する新しい理論を提示する。
以上の結果から,創発能力は真に創発的ではなく,文脈内学習,モデル記憶,言語知識の組み合わせによるものであることが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:21:56 GMT)
Evaluating Concurrent Robustness of Language Models Across Diverse Challenge Sets [46.2] 言語モデルはブラックボックスの性質が特徴で、しばしば幻覚を呈し、入力の摂動に敏感である。
入力摂動が言語モデルにどう影響するかを,様々な尺度で検討する手法を提案する。
複数の摂動に対するロバスト性に対処するための3つの異なる微調整戦略を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:59:49 GMT)
Towards Scale-Aware Full Surround Monodepth with Transformers [46.1] フルサラウンドモノデプス(FSM)法は,複数のカメラビューから同時に学習し,スケール認識深度を予測する。
本研究では,深度推定のためのFSM法のスケール・アウェアネスの向上に焦点をあてる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:54:46 GMT)
Gravitationally dominated instantons and instability of dS, AdS and Minkowski spaces [45.7] 量子場理論解析が有効でない状態における偽真空の崩壊について検討する。
これは、偽と真真空を分ける障壁の高さが大きいときに起こる。
デ・シッター、ミンコフスキー、反デ・シッターの不安定性に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:13:16 GMT)
Temporal Event Stereo via Joint Learning with Stereoscopic Flow [44.5] イベントカメラは生体網膜にインスパイアされた動的視覚センサーである。
本稿では,新しい時間的イベントステレオフレームワークを提案する。
我々はMVSECとDSECデータセットで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:43:08 GMT)
NTSEBENCH: Cognitive Reasoning Benchmark for Vision Language Models [44.0] 我々は,大規模モデルの認知的マルチモーダル推論と問題解決能力を評価するために,NTSEBenchという新しいデータセットを導入した。
このデータセットは、インドで実施されているNTSE試験から採取された26のカテゴリで合計4,642枚の画像からなる2,728の多重選択質問からなる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:21:56 GMT)
Möbius Transform for Mitigating Perspective Distortions in Representation Learning [43.9] パースペクティブ歪み(PD)は、画像の形状、大きさ、向き、角度、その他の空間的関係に前例のない変化を引き起こす。
M"オビウス変換の特定の族に対して,パラメータ制御を微粒化することにより,MPDを緩和する手法を提案する。
我々は,この新たなデータセットに対して,ディープラーニングモデルの堅牢性を評価するために,視点的に歪んだベンチマークデータセットであるImageNet-PDを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:16:52 GMT)
Guitar Chord Diagram Suggestion for Western Popular Music [43.6] コードダイアグラムは、ギター奏者がフレットボードでコードを演奏する場所と方法を示すために使用される。
いくつかのコードダイアグラムは西洋のポピュラー音楽で過剰に表現されており、いくつかのコードダイアグラムは20以上の方法で演奏可能であることを示す。
コンテクストを考慮に入れれば、コードダイアグラムの提案の多様性や質が向上し、現在のコードラベルのみを考慮に入れたモデルと比較する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:44:13 GMT)
VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.4] この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。
身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。
提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:47:03 GMT)
Towards Robust Event-based Networks for Nighttime via Unpaired Day-to-Night Event Translation [43.0] ダイナミックレンジの高いイベントカメラは、低照度条件でもシーンキャプチャを保証します。
夜の出来事は、昼間に捕獲されたものとは異なるパターンを示す。
この違いは、夜間イベントを日々のイベントのみにトレーニングされたモデルに適用する際のパフォーマンス低下を引き起こす。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:18:37 GMT)
ConDiSR: Contrastive Disentanglement and Style Regularization for Single Domain Generalization [42.8] 医療データは、しばしば分散シフトを示し、標準パイプラインを使用してトレーニングされたディープラーニングモデルのテスト時のパフォーマンス劣化を引き起こす。
本研究は、分類タスクの文脈において、単一ドメインの一般化フレームワークを探索することの重要性と課題を強調した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:59:57 GMT)
Leave No Knowledge Behind During Knowledge Distillation: Towards Practical and Effective Knowledge Distillation for Code-Switching ASR Using Realistic Data [42.7] 本稿では,現実的な音声のみのデータを用いた音声認識のための,より効率的なモデルを構築するためのフレームワークを提案する。
提案手法は,教師モデルの知識と,小さな補助モデルからの洞察を両立させる。
ベースライン法と教師モデルを全テストセットで比較しながら,5倍高速な生成速度を持つ2時間小型モデルを得ることに成功した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:25:14 GMT)
The Prompt Report: A Systematic Survey of Prompting Techniques [42.6] 本稿では, プロンプトの分類を組立て, 利用分析を行うことにより, プロンプトの構造的理解を確立した。
本稿では,33の語彙の包括的語彙,58のテキストのみのプロンプト技術,40のモダリティのテクニックを提示する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:17:50 GMT)
What distinguishes conspiracy from critical narratives? A computational analysis of oppositional discourse [42.1] 本稿では,陰謀と批判的テキストを区別する,トピックに依存しない新しいアノテーション手法を提案する。
また、Telegramメッセージの高品質なアノテーションを含む多言語XAI-DisInfodemics corpus(英語とスペイン語)にも貢献する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:18:47 GMT)
Intelligent Cross-Organizational Process Mining: A Survey and New Perspectives [40.6] 本稿では,プロセスマイニングの分野に関する具体的な見解を提唱する。
まず、プロセスマイニングの枠組み、一般的な産業応用、そして人工知能と組み合わされた最新の進歩について要約する。
この視点は、複雑な多組織データ分析のための洗練されたソリューションを提供するために人工知能を活用することによって、プロセスマイニングに革命をもたらすことを目的としている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:30:34 GMT)
The Good, The Bad, and The Greedy: Evaluation of LLMs Should Not Ignore Non-Determinism [39.4] 大規模言語モデル(LLM)の現在の評価は、しばしば非決定論を見落としている。
greedyデコーディングは一般的に、最も評価されたタスクのサンプリング方法よりも優れています。
より小型のLPMはGPT-4-Turboのような大型のモデルと一致するか、超えることができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 06:12:17 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [35.4] 大きな言語モデル(LLM)は、一般的でない言及を解釈する上で、より堅牢である。
LLM-Augmented Entity Linking LLMAELは,エンティティリンクを強化するためのプラグイン・アンド・プレイ方式である。
6つの標準データセットの実験では、ほとんどの場合、バニラLLMAELはベースラインELモデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:47:39 GMT)
WildRefer: 3D Object Localization in Large-scale Dynamic Scenes with Multi-modal Visual Data and Natural Language [31.7] 本稿では,自然言語記述とオンラインキャプチャによるマルチモーダル視覚データに基づく大規模動的シーンにおける3次元視覚接地作業について紹介する。
本研究では,画像中のリッチな外観情報,位置,および点雲中の幾何学的手がかりをフル活用して,WildReferという新しい手法を提案する。
われわれのデータセットは、野生の3Dビジュアルグラウンドの研究にとって重要なものであり、自動運転とサービスロボットの開発を促進する大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:42:13 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [31.6] SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。
事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:56:28 GMT)
Antibody DomainBed: Out-of-Distribution Generalization in Therapeutic Protein Design [30.6] 能動機械学習(ML)による治療分子の最適化は、関心の標的特性を予測する代理モデルに依存している。
重要な課題は、各サイクルからの実験的なフィードバックが、次のサイクルの候補提案や実験的なプロトコルの変更を誘発し、分散シフトにつながることである。
設計サイクルによって定義された5つのドメインにわたる抗体と抗原の相互作用の安定性を分類するためにドメイン一般化(DG)法を適用した。
以上の結果から,基礎モデルとアンサンブルは,アウト・オブ・ディストリビューション領域における予測性能を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:46:25 GMT)
Advancing Question Answering on Handwritten Documents: A State-of-the-Art Recognition-Based Model for HW-SQuAD [30.6] 本稿では,HW-SQuADデータセットとBenthamQAデータセットの先行技術を改善する新しい認識ベースアプローチを提案する。
本モデルでは,変換器を用いた文書検索とアンサンブル手法をモデルレベルで導入し,HW-SQuADデータセットとBenthamQAデータセットにおいて,Exact Matchスコアが82.02%,69%に達した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:41:32 GMT)
RoboGolf: Mastering Real-World Minigolf with a Reflective Multi-Modality Vision-Language Model [30.1] ネストされたVLMを用いた閉ループ制御と反射平衡ループによりデュアルカメラの視覚入力を知覚するVLMベースのフレームワークであるRoboGolfを紹介する。
RoboGolfのミニゴルフコートに対する効果を実験で実証した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:51:19 GMT)
AdapTable: Test-Time Adaptation for Tabular Data via Shift-Aware Uncertainty Calibrator and Label Distribution Handler [29.4] 本稿では,ターゲットラベル分布を推定し,不確実性に基づいて初期確率を調整することによって,出力確率を変化させる新しいテスト時間適応手法であるAdapTableを紹介する。
自然分布シフトと合成汚損の両方の実験により,提案手法の適応効果が示された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:02:53 GMT)
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models [28.7] Panoptic Scene Graph Generation (PSG) は、オブジェクトを分割し、それらの関係を認識し、画像の構造的理解を可能にすることを目的としている。
従来の手法では、事前定義されたオブジェクトと関係カテゴリの予測に重点を置いており、そのため、オープンワールドシナリオでのアプリケーションを制限する。
本稿では,事前訓練された開集合パノプティックセグメンテーションモデルと統合された開集合関係予測の課題に焦点をあてる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:56:42 GMT)
Learning to Generate Answers with Citations via Factual Consistency Models [28.7] 大型言語モデル(LLM)は、ミッションクリティカルな状況においてその信頼性を阻害する。
本稿では,事実整合性モデル(FCM)を利用した弱教師付き微調整法を提案する。
集中学習は目的に統合され、ファインチューニングプロセスが現実の単位トークンを強調するように指示される。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:04:05 GMT)
VideoAgent: A Memory-augmented Multimodal Agent for Video Understanding [28.3] VideoAgent: 1)は、一般的な時間的イベント記述と、ビデオのオブジェクト中心のトラッキング状態の両方を格納する構造化メモリを構築する。
2) 入力タスククエリが与えられた場合,ビデオセグメントのローカライゼーションやオブジェクトメモリクエリなどのツールと,他の視覚基盤モデルを用いて対話的にタスクを解く。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:54:30 GMT)
VGBench: Evaluating Large Language Models on Vector Graphics Understanding and Generation [28.1] VGBenchは、ベクトルグラフィックスを扱うためのLLM(Large Language Models)の包括的なベンチマークである。
LLMは両面に強い能力を示し、低レベルフォーマット(SVG)では望ましい性能は低い。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:59:55 GMT)
Quantized Prompt for Efficient Generalization of Vision-Language Models [28.0] CLIPのような大規模事前学習型視覚言語モデルは、様々な分野で大きな成功を収めている。
下流への適応の間、最も難しい問題は過度に適合し、破滅的な忘れ物である。
本稿では,視覚言語モデルを正規化するための量子化について検討する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:19:56 GMT)
Human-in-the-Loop Visual Re-ID for Population Size Estimation [27.8] そこで本研究では,市販のRe-IDシステムから得られた2方向の類似性により,人口規模を推定する手法を提案する。
本手法は, 営巣重要度サンプリングに基づいて, 対の類似性によって駆動されるヒトの獣医に対する画像のペアを選択し, 集団サイズ推定値の偏りを導出する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:05:12 GMT)
TAPI: Towards Target-Specific and Adversarial Prompt Injection against Code LLMs [27.7] 本稿では,新たな攻撃パラダイム,すなわち,コードLLMに対するターゲット固有および対向的プロンプトインジェクション(TAPI)を提案する。
TAPIは悪意のある命令に関する情報を含む読めないコメントを生成し、それらを外部ソースコードのトリガーとして隠す。
CodeGeexやGithub Copilotなど、デプロイされたコード補完統合アプリケーションに対する攻撃に成功しました。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:54:50 GMT)
OmniGS: Fast Radiance Field Reconstruction using Omnidirectional Gaussian Splatting [27.5] 現在の3次元ガウス散乱システムは、歪みのない視点画像を用いた放射場再構成しかサポートしていない。
高速な放射野再構成のための全方位画像を利用するため,新しい全方位撮影システムであるOmniGSを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:59:07 GMT)
EnTri: Ensemble Learning with Tri-level Representations for Explainable Scene Recognition [27.2] ディープラーニングに基づくシーン認識は大きな進歩を遂げているが、その性能にはまだ限界がある。
本稿では,視覚的特徴の階層構造を用いたアンサンブル学習フレームワークであるEnTriを提案する。
EnTriは認識精度の点で優れており、最先端のアプローチと比較して競争性能が向上している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:06:20 GMT)
A Survey on Deep Active Learning: Recent Advances and New Frontiers [27.1] この研究は、ディープラーニングに基づくアクティブラーニング(DAL)の難しさを克服する上で、研究者にとって有用かつ迅速なガイドとなることを目的としている。
この手法は適用可能性の広さから人気が高まりつつあるが、特にディープラーニングに基づくアクティブラーニング(DAL)に関する調査論文は乏しいままである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:07:56 GMT)
Can We Remove the Square-Root in Adaptive Gradient Methods? A Second-Order Perspective [26.5] 適応手法の動作が根の除去時にどのように変化するか,すなわち2階のモチベーションを強化するかを検討する。
驚いたことに、このような平方根自由適応法は畳み込みアーキテクチャ上のSGDへの一般化ギャップを閉じている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:23:41 GMT)
Preventing Catastrophic Forgetting through Memory Networks in Continuous Detection [26.2] メモリベースの検出変換器アーキテクチャを導入し、トレーニング済みのDETR型検出器を新しいタスクに適用する。
本稿では,メモリ単位からの効率的な情報検索のための新しい局所化クエリ関数を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:59:02 GMT)
A Unified Differentiable Boolean Operator with Fuzzy Logic [26.0] コンストラクティブ・ソリッド・ジオメトリー(CSG)を用いた暗黙的な固体形状モデリングのための統一微分可能作用素を提案する。
提案したオペレーターは、完全な連続CSG最適化に向けた今後の研究の新たな可能性を開く。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:52:22 GMT)
MetaTool: Facilitating Large Language Models to Master Tools with Meta-task Augmentation [25.4] 我々は、再利用可能なツールセットをマスターするために一般化可能な新しいツール学習手法(MetaTool)を導入する。
我々は,ツール実行のマスキング要因を予測するメタタスクを開発した。
メタタスクデータを命令チューニングプロセスに組み込むことで,提案したMetaToolモデルは,オープンソースモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:15:41 GMT)
Pacer and Runner: Cooperative Learning Framework between Single- and Cross-Domain Sequential Recommendation [25.2] クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインの情報を活用することでレコメンデーションパフォーマンスを向上させる。
しかし、CDSRは、負の転送により特定の領域でSDSR(Single-Domain Sequential Recommendation)と比較して性能が劣る可能性がある。
本稿では,各領域の負の移動度を推定し,予測損失に対する重み係数として適応的に割り当てるCDSRモデルを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:14:13 GMT)
Understanding the Importance of Evolutionary Search in Automated Heuristic Design with Large Language Models [24.4] 自動設計(AHD)は、有効物の開発を自動化する可能性についてかなりの注目を集めている。
近年の大規模言語モデル(LLM)の出現は、進化的プログラム探索問題としてのAHDのフレーミングに焦点をあてて、AHDの新しい道を開いた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:21:20 GMT)
By My Eyes: Grounding Multimodal Large Language Models with Sensor Data via Visual Prompting [24.4] マルチモーダル大言語モデル(MLLM)を用いたセンサデータに対する視覚的プロンプト手法を提案する。
我々は,MLLMの視覚的プロンプトを設計し,ターゲットの知覚タスク記述と並行して可視化されたセンサデータを活用する。
また、与えられた感覚タスクに合わせて最適な可視化を作成するための可視化生成装置も導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:33:54 GMT)
SfM on-the-fly: Get better 3D from What You Capture [24.1] Structure from Motion (SfM) は、フォトグラメトリー、コンピュータビジョン、ロボティクスなどの分野で、常に研究のホットスポットとなっている。
この作業は、オリジナルのSfMの上に構築され、アップデートされたバージョンには3つの新しい進歩があり、より優れた3Dをキャプチャから得ることができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:56:32 GMT)
COSMU: Complete 3D human shape from monocular unconstrained images [24.1] 対象画像から完全な3次元人物形状を再構成するための新しい枠組みを提案する。
本研究の目的は、入力対象に見えない再建された人体の領域において、高品質な詳細を再現することである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:06:59 GMT)
Boosting Zero-Shot Crosslingual Performance using LLM-Based Augmentations with Effective Data Selection [23.6] 大きな言語モデル(LLM)は、非常に熟練したテキストジェネレータである。
ゼロショットプロンプトによるタスク固有のデータ生成にこの機能を活用します。
感情分析や自然言語推論タスクにおいて,顕著なパフォーマンス向上が観察された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:00:22 GMT)
Learning Natural Consistency Representation for Face Forgery Video Detection [23.5] 本研究では,自然表現(NACO)の実写映像を自己監督的に学習することを提案する。
我々の手法は、他の最先端の手法よりも優れたロバスト性を持つ。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:00:02 GMT)
Spatial-Temporal Attention Model for Traffic State Estimation with Sparse Internet of Vehicles [23.5] コスト効率の良い交通状態推定(TSE)を実現するために,スパースIoVデータを利用する新しいフレームワークを提案する。
特に,TSEの精度を向上させるために,畳み込み抑止ネットワーク(CRNet)と呼ばれる新しい空間時間アテンションモデルを提案する。
このモデルは、空間的相関集約のための畳み込みニューラルネットワーク(CNN)と、注意機構に基づいて時間的相関を抽出するRetNet(RetNet)を用いる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:31:15 GMT)
Temporal Residual Guided Diffusion Framework for Event-Driven Video Reconstruction [23.5] イベントベースのビデオ再構成は、ハイダイナミックレンジや高速モーションキャプチャ機能など、そのアドバンテージから注目を集めている。
現在の方法では、連続したイベントフローからの時間情報の抽出が優先され、シーン内の低周波テクスチャの特徴に過度に強調される。
本稿では,時間的・周波数的イベント前処理を効果的に活用する新しい手法である時間的残留ガイド拡散フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:48:57 GMT)
Exploring the Impact of Moire Pattern on Deepfake Detectors [23.3] デジタルスクリーンから撮影したディープフェイク映像が検出器性能に与える影響について検討した。
その結果,検出器の精度は著しく低下し,平均68%を超えなかった。
このことは、現実世界のディープフェイク検出シナリオにおいて、Moirのパターン問題に対処する重要な必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:39:24 GMT)
PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition [23.3] 深層学習に基づく物体認識システムは、様々な逆方向の摂動によって容易に騙される。
弱い頑丈さの1つの理由は、人間の認識プロセスのような部分ベースの帰納バイアスがないためかもしれない。
これによって、認識の対角的堅牢性を改善するために、いくつかのパートベース認識モデルが提案されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:19:50 GMT)
CoLeaF: A Contrastive-Collaborative Learning Framework for Weakly Supervised Audio-Visual Video Parsing [23.1] 弱教師付き音声視覚ビデオ解析手法は,ビデオレベルラベルのみを用いて,可聴性のみ,可視性のみ,可視性のみ,可聴性のみを検出することを目的としている。
埋め込み空間におけるクロスモーダルコンテキストの統合を最適化する新しい学習フレームワークであるCoLeaFを提案する。
我々の実験は、CoLeaFがデータセット上で平均1.9%と2.4%のFスコアで最先端の結果を大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:31:54 GMT)
Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy [23.0] ソーシャルメディアは世論分析の自動化方法として人気が高まっている。
トピックモデリングのような公共の話題からテーマを抽出する伝統的な教師なしの手法は、しばしば特定のニュアンスを捉えない過度なパターンを明らかにする。
本稿では,大規模言語モデルの高度な機能を活用したLLMs-in-the-Loop戦略を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:00:46 GMT)
Discovering Latent Themes in Social Media Messaging: A Machine-in-the-Loop Approach Integrating LLMs [23.0] ソーシャルメディアメッセージングにおける潜在テーマを明らかにするための新しいアプローチを提案する。
私たちの仕事は、ソーシャルメディアのダイナミックな性質に光を当て、現実の出来事に対するメッセージのテーマ的焦点の変化を明らかにします。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:14:13 GMT)
Building Intelligence Identification System via Large Language Model Watermarking: A Survey and Beyond [22.9] 大規模言語モデル(LLM)は多種多様な産業に統合され、不正な複製と誤用により重大なセキュリティリスクが生じる。
本稿では,識別過程を体系化し,より正確でカスタマイズされた透かしを実現する相互情報理論に基づく数学的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:20:02 GMT)
Pairwise Comparisons Are All You Need [22.8] ブラインド画像品質評価(BIQA)アプローチは、様々な画像に一様に適用される一般的な品質基準に依存しているため、現実のシナリオでは不足することが多い。
本稿では、従来のBIQAの制限を回避すべく設計されたペアワイズ比較フレームワークであるPICNIQを紹介する。
PICNIQは、サイコメトリックスケーリングアルゴリズムを用いることで、対比較をジャストオブジェクタブルディファレンス(JOD)の品質スコアに変換し、画像品質の粒度と解釈可能な指標を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:19:48 GMT)
An Embeddable Implicit IUVD Representation for Part-based 3D Human Surface Reconstruction [22.3] 単一の画像から3次元の人体表面を再構築するには、人間のポーズ、形状、衣服の詳細を同時に検討することが重要である。
最近のアプローチでは、身体のポーズと形状をキャプチャするパラメトリックボディモデル(SMPLなど)が組み合わされている。
本稿では,IUVD占有関数とフィードバッククエリアルゴリズムからなる新しいIUVD-Feedback表現を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 04:46:03 GMT)
Fine-Tuning and Prompt Optimization: Two Great Steps that Work Better Together [21.8] すべてのパイプラインステージでトレーニングラベルをブートストラップして,パイプラインのプロンプトを最適化し,重みを微調整する,近似最適化戦略を評価する。
プロンプトとウェイトを同時に最適化するための単純なアプローチは、直接的にウェイトのみを最適化し、平均してLMとタスクで最大65%と5%のプロンプトを単独で生成する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:30:31 GMT)
MetaLLM: A High-performant and Cost-efficient Dynamic Framework for Wrapping LLMs [21.7] 分類タスクに最適な大言語モデル(LLM)に各クエリを動的にルーティングするフレームワークであるMetaLLMを紹介する。
多武装バンディットとして選択問題をフレーミングすることで、MetaLLMは不確実性の下で予測精度とコスト効率のバランスをとる。
LLMプラットフォーム上で実施した本実験では,メタLLMの有効性を実世界のシナリオで示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:45:07 GMT)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.7] 本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。
2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:47:29 GMT)
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence [21.3] ネットワークパラメータをリセットすることなく、深層強化学習アルゴリズムが学習能力を維持できることを示す。
我々は,大規模な更新率での学習を可能にする,単純な単球正規化を採用している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:08:06 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:17:52 GMT)
Foundational Autoraters: Taming Large Language Models for Better Automatic Evaluation [20.4] 基礎的な大規模オートラタモデルのファミリーであるFLAMeを紹介する。
FLAMeは、100以上の品質評価タスクの大規模で多様なコレクションに基づいて訓練されています。
FLAMeは下流の微調整のための強力な出発点としても機能することを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:33:45 GMT)
BKDSNN: Enhancing the Performance of Learning-based Spiking Neural Networks Training with Blurred Knowledge Distillation [20.3] スパイキングニューラルネットワーク(SNN)は、生物学的ニューラルネットワークを模倣し、離散スパイクを介して情報を伝達する。
本研究は,静的およびニューロモルフィックなデータセット上でSNNをトレーニングするための最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:19:34 GMT)
Human-Modeling in Sequential Decision-Making: An Analysis through the Lens of Human-Aware AI [20.2] 私たちは、人間を意識したAIシステムを構成するものの説明を提供しようとしています。
人間を意識したAIはデザイン指向のパラダイムであり、人間と対話するかもしれないモデリングの必要性に焦点を当てている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:01:54 GMT)
Integrating Amortized Inference with Diffusion Models for Learning Clean Distribution from Corrupted Images [20.0] 拡散モデル(DM)は、逆問題を解決するための強力な生成モデルとして登場した。
FlowDiffは条件付き正規化フローモデルを利用して、破損したデータソース上で拡散モデルのトレーニングを容易にする共同トレーニングパラダイムである。
実験の結果,FlowDiffは広範囲の破損したデータソースにわたるクリーンな分布を効果的に学習できることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:33:20 GMT)
General algorithm of assigning raster features to vector maps at any resolution or scale [18.1] 本稿では,都市地図における特徴量(大気汚染物質の濃度)をベクトル成分(エッジで表される道路)に割り当てるアルゴリズムを提案する。
我々は、グラフベースの汚染分析を行うため、1692都市の道路に正確なPM$_2.5$とNO$_2$の濃度を割り当てることを実証した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:24:00 GMT)
When Synthetic Traces Hide Real Content: Analysis of Stable Diffusion Image Laundering [18.0] 近年、高度にリアルな合成画像を作成する方法が大幅に進歩している。
SDオートエンコーダを介して画像を渡すことで、画像の合成コピーを高いリアリズムで再現することができ、視覚的アーティファクトはほとんどない。
このプロセスはSD画像ロンダリング(SD image laundering)と呼ばれ、実際の画像を見た目の合成画像に変換することができ、コンテンツ認証のための法医学的分析を複雑にするリスクがある。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:01:35 GMT)
Did the Neurons Read your Book? Document-level Membership Inference for Large Language Models [18.0] 文書レベルのメンバシップを予測し,OpenLLaMA-7B上でインスタンス化するブラックボックス手法を提案する。
本稿では,文書レベルのメンバシップタスクにおいて,プライバシ文献で使用される文レベルのメンバシップ推論攻撃よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:12:43 GMT)
Stop! In the Name of Flaws: Disentangling Personal Names and Sociodemographic Attributes in NLP [17.7] 名前と命名に関する学際的背景を示す。
次に、社会デマログラフィー属性と名前の関連付けに固有の問題を調査する。
我々は、妥当性と倫理的落とし穴を避けるために、規範的な勧告とともに指針質問を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:57:56 GMT)
Deflated Dynamics Value Iteration [17.7] 値関数の計算を高速化するために, DDVI (Deflated Dynamics Value Iteration) を提案する。
DDVI は行列分割法と行列デフレレーション法を用いて、遷移行列 $mathcalPpi$ の上位$s$支配固有構造を効果的に除去する。
このことが$tildeO(gammak |lambda_s+1$is $(s+1)$-the largest eigen value of the dynamics matrix につながることを証明している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 06:07:05 GMT)
Enhancing Robustness to Noise Corruption for Point Cloud Model via Spatial Sorting and Set-Mixing Aggregation Module [17.6] 本研究では,個々の雑音点の影響を緩和するノイズロバストアグリゲーションモジュール,Set-Mixerを提案する。
ModelNet40-Cで行った実験によると、Set-Mixerはノイズの多い点のクラウド上でのモデル性能を大幅に向上する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:21:34 GMT)
On the Robustness of LDP Protocols for Numerical Attributes under Data Poisoning Attacks [17.4] ローカルディファレンシャルプライバシ(LDP)プロトコルは、データ中毒攻撃に対して脆弱である。
この脆弱性は、敵対的環境におけるLDPの堅牢性と信頼性に関する懸念を引き起こす。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:56:48 GMT)
PathoTune: Adapting Visual Foundation Model to Pathological Specialists [17.3] PathoTuneは、病理学的または視覚的基礎モデルから病理学固有のタスクに効率的に適応するように設計されたフレームワークである。
パッチレベルとWSIレベルの複数のデータセットにまたがる結果は、単一モードのプロンプトチューニングアプローチよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:24:36 GMT)
CanonicalFusion: Generating Drivable 3D Human Avatars from Multiple Images [17.1] カノニカルフュージョン(CanonicalFusion)と呼ばれる複数の画像からアニマタブルなヒトアバターを再構成するための新しい枠組みを提案する。
まず,LBS(Linear Blend Skinning)重みマップと深度マップを共有エンコーダ・デュアルデコーダネットワークを用いて予測し,予測深度マップから3次元メッシュの直接正準化を可能にする。
また,複数画像から再構成した結果をマージするために,前方スキンベースの異なるレンダリング方式を導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:07:16 GMT)
Defining and Preventing Asymmetric Mempool DoS in Ethereum with saferAd [17.1] 安全定義を2つの抽象的なDoSe、すなわち退行攻撃とロック攻撃で定式化する。
本稿では,メムプール保護のための安全な取引許可フレームワークであるSaferAdを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:00:44 GMT)
TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction [17.0] 伝統的な中国の医学は、症状や徴候を治療するために処方薬中のハーブの特定の組み合わせに依存している。
本稿では,消化器疾患の経験者による医療記録を含む新しいデータセットであるDigestDSを紹介する。
また、DigDSの教師付き微調整により、事前訓練された大規模言語モデル(LLM)を活用するためのTCM-FTP(TCM Fine-Tuning Pre-trained)を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:06:37 GMT)
iHuman: Instant Animatable Digital Humans From Monocular Videos [17.0] モノクロビデオからアニマタブルな3Dデジタル人間を作るための,迅速かつシンプルで効果的な方法を提案する。
この研究は、人間の身体の正確な3Dメッシュ型モデリングの必要性を達成し、説明します。
我々の手法は(訓練時間の観点から)最も近い競合相手よりも桁違いに高速である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:51:51 GMT)
Self Pre-training with Topology- and Spatiality-aware Masked Autoencoders for 3D Medical Image Segmentation [16.8] Masked Autoencoders (MAEs) は、自然および医学的な画像解析問題に対する事前訓練型ビジョントランスフォーマー (ViTs) に有効であることが示されている。
既存のMAE事前学習手法は、ViTアーキテクチャで特別に開発されたが、幾何学的形状や空間情報をキャプチャする能力は欠けていた。
本稿では,3次元医用画像セグメンテーションのための自己事前トレーニング(すなわち,同じターゲットデータセット上で事前トレーニングされたモデル)のための既知のMAEの新たな拡張を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:35:00 GMT)
Revealing Trends in Datasets from the 2022 ACL and EMNLP Conferences [16.7] トランスフォーマーは、事前訓練された大規模言語モデル(PLM)を生んだ。
高品質なデータセットの必要性から、NLP研究者は、特定のニーズを満たす新しいデータセットの作成を継続している。
この研究は、これらのデータセットに含まれるトレンドと洞察を明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:07:16 GMT)
DDFAD: Dataset Distillation Framework for Audio Data [16.6] ディープニューラルネットワーク(DNN)は多くのアプリケーションで大きな成功を収めている。
ディープニューラルネットワーク(DNN)は多くのアプリケーションで大きな成功を収めている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:23:35 GMT)
An Empirical Study of Validating Synthetic Data for Formula Generation [16.3] 大規模言語モデル(LLM)は、スプレッドシートで公式を書くのに役立つ。
我々は、(他の)モデルを用いて、微調整のための合成自然言語発話を生成する。
バリデーションは、4つのモデルにわたる生データよりも性能を向上させることを実証する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:16:33 GMT)
Unconstrained Open Vocabulary Image Classification: Zero-Shot Transfer from Text to Image via CLIP Inversion [16.3] NOVICは、革新的なuN制約付きOpen Vocabulary Imageである。
埋め込みスペースを利用して、純粋なテキストから画像へのゼロショット転送を可能にする。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:53:02 GMT)
A Survey of Defenses against AI-generated Visual Media: Detection, Disruption, and Authentication [15.9] 深層生成モデルは様々なコンピュータビジョンアプリケーションで顕著な性能を示した。
これらのモデルは、誤情報、偽造、著作権侵害などの悪意ある目的のために使用されることがある。
本稿では,AI生成したビジュアルメディアに対する防衛研究の体系的かつタイムリーなレビューを行う。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:46:02 GMT)
Enhancing Retrieval and Managing Retrieval: A Four-Module Synergy for Improved Quality and Efficiency in RAG Systems [14.6] Retrieval-augmented Generation (RAG)技術は、大規模言語モデル(LLM)のコンテキスト内学習機能を利用して、より正確で関連する応答を生成する。
重要なコンポーネントであるQuery Rewriterモジュールは、検索フレンドリーなクエリを生成することで知識検索を強化する。
これら4つのRAGモジュールは、RAGシステムの応答品質と効率を相乗的に改善する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:35:00 GMT)
Pan-cancer Histopathology WSI Pre-training with Position-aware Masked Autoencoder [14.6] 設計した位置認識マスク付きオートエンコーダ(PAMA)を用いたパンカンサーWSIレベルの事前学習のための新しい自己教師型学習フレームワークを提案する。
その結果, PAMAがWSI表現学習の一般化と差別化に有効であること, パン・カンサーWSI事前学習の有効性が示された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:15:50 GMT)
InversionView: A General-Purpose Method for Reading Information from Neural Activations [14.6] この情報は、同様のアクティベーションを引き起こす入力のサブセットによって具現化されていると我々は主張する。
InversionViewを提案し、アクティベーションに条件付きトレーニングされたデコーダモデルからサンプリングすることで、このサブセットを実際に検査することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:30:52 GMT)
The Role of Masking for Efficient Supervised Knowledge Distillation of Vision Transformers [14.5] 本稿では,ViT蒸留の監督コストを削減するための簡易な枠組みを開発する。
入力トークンをマスキングすることで、教師のパラメータやアーキテクチャを変更することなく、マスクされたトークンに関連する計算をスキップすることができる。
学生の注意点が最も低いマスキングパッチは極めて有効であり,教師のFLOPの最大50%を学生の精度の低下なしに節約できることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 06:37:04 GMT)
Wavelet Convolutions for Large Receptive Fields [14.4] 本稿では、Wavelet Transform (WT) を利用して、非常に大きな受容場を得ることができることを示す。
WTonvレイヤは、既存のアーキテクチャのドロップイン代替として使用することができる。
画像劣化に対するロバスト性やテクスチャ上の形状に対する応答の増大など,さらなる特性が得られることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:39:57 GMT)
Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education [14.4] フリーテキストからのゼロショット知識グラフフレームワークであるGraphusionを紹介する。
核融合モジュールは、エンティティのマージ、競合解決、新しい三重項発見を取り入れた三重項のグローバルなビューを提供する。
本評価は,リンク予測における教師付きベースラインの精度を最大10%超えることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:13:49 GMT)
Asymmetric Mask Scheme for Self-Supervised Real Image Denoising [14.2] 本稿では,盲点操作を不要とする自己指導型聴覚訓練のためのマスク方式を提案する。
提案手法は,非対称マスク方式をトレーニングや推論に用い,既存の実雑音画像データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:34:38 GMT)
Word Order in English-Japanese Simultaneous Interpretation: Analyses and Evaluation using Chunk-wise Monotonic Translation [13.7] 本稿では,ソース言語の単語順に従う単調翻訳の特徴を同時解釈(SI)で解析する。
NAIST英語と日本語の単調翻訳評価データセットを用いて,チャンクワイド単調翻訳(CMT)文の特徴を解析した。
さらに,既存の音声翻訳(ST)と同時音声翻訳(simulST)モデルからの出力を評価し,CMT文の特徴について検討した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:42:02 GMT)
Random Channel Ablation for Robust Hand Gesture Classification with Multimodal Biosignals [13.4] マルチモーダルバイオシグナーに基づく手ジェスチャー分類は、効果的な人間と機械の相互作用の重要な構成要素である。
本稿では、学習過程におけるランダムチャネルアブレーション(RChA)を用いて、データの欠落したチャネルに対して、分類器を堅牢化することを提案する。
5倍のクロスバリデーションを平均12.2%,24.5%改善し,最大4チャンネルと8チャンネルのジェスチャー分類を行った。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:23:53 GMT)
GPT Sonograpy: Hand Gesture Decoding from Forearm Ultrasound Images via VLM [13.4] GPT-4oは、微調整がなくても、前腕超音波データから手の動きを復号できることを示す。
また,GPT-4oは,テキスト内学習の少ない場面で改善可能であることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:18:06 GMT)
TimeAutoDiff: Combining Autoencoder and Diffusion model for time series tabular data synthesizing [13.4] 本稿では、遅延拡散モデルのパワーを活用して、合成時系列表データを生成する。
可変オートエンコーダ(VAE)と拡散確率モデル(DDPM)のアイデアを組み合わせることでこの問題に対処する。
textttTimeAutoDiffという名前の私たちのモデルは、(1)汎用性:単一から複数シーケンスのデータセットの幅広い時系列データを処理できる能力など、いくつかの大きな利点があります。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 04:36:30 GMT)
Enhancing Stochastic Optimization for Statistical Efficiency Using ROOT-SGD with Diminishing Stepsize [13.4] 本稿では,最適化と統計効率のギャップを埋める手法であるtextsfROOT-SGDを再検討する。
提案手法は, 念入りに設計したステップサイズ戦略を統合することにより, テキストfROOT-SGDの性能と信頼性を向上させる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:54:03 GMT)
Variational Quantum Imaginary Time Evolution for Matrix Product State Ansatz with Tests on Transcorrelated Hamiltonians [12.0] マトリックス生成物状態(MPS)アンザッツは、分子ハミルトンの基底状態を見つけるための有望なアプローチを提供する。
本稿では,変分量子想像時間進化(VarQITE)手法を用いて,QCMPSアンサッツの最適化性能を向上させる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:28:52 GMT)
Temporal-spatial Adaptation of Promptable SAM Enhance Accuracy and Generalizability of cine CMR Segmentation [10.9] 本研究では,時間的情報と空間的情報の両方をモデルアーキテクチャに組み込んだcineCMR-SAMを提案する。
STACOM 2011データセットでは,データ固有モデルのセグメンテーション精度が向上した。
我々はcineCMR-SAMにテキストプロンプト機能を導入し、入力スライスのビュータイプを指定する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:22:28 GMT)
OPa-Ma: Text Guided Mamba for 360-degree Image Out-painting [9.9] 我々は,従来の狭視野画像(NFoV)から360度画像を生成するという,最近の話題に対処する。
この課題は、NFoV画像から合理的で一貫した環境を予測することを目的としている。
そこで本稿では,Mambaと呼ばれる状態空間モデルを備えた新しいテキスト誘導アウトペイントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:23:00 GMT)
Boost Your NeRF: A Model-Agnostic Mixture of Experts Framework for High Quality and Efficient Rendering [9.9] 本研究では,Sparsely-Gated Mixture of Expertsにインスパイアされたモデル非依存のフレームワークを導入し,計算複雑性を増大させることなくレンダリング品質を向上させる。
本稿では,専門家の能力を最大化するために設計された新しいゲートの定式化と,空間を効果的に誘導し,シーンを分解する解像度ベースのルーティング手法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:58:54 GMT)
3D Feature Distillation with Object-Centric Priors [9.6] CLIPのような2Dビジョン言語モデルは、2Dイメージのオープン語彙グラウンドディングに優れた機能を備えているため、広く普及している。
最近の研究は、特徴蒸留によって2D CLIP機能を3Dに高めることを目的としているが、シーン固有のニューラルネットワークを学ぶか、室内のスキャンデータにフォーカスする。
提案手法は, 3次元CLIPの特徴を再構築し, 接地能力と空間的整合性を改善した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:23:33 GMT)
The Medium is the Message: How Secure Messaging Apps Leak Sensitive Data to Push Notification Services [9.5] 本研究では、Androidデバイスにプッシュ通知を送信するために、セキュアメッセージングアプリのGoogleのCloud Messaging(FCM)サービスの使用について調査した。
われわれはGoogle Play Storeから人気の高い21のセキュアメッセージングアプリを分析し、FCM経由で送られたプッシュ通知のペイロードにリークする個人情報を判定した。
FCMにリークされたデータはすべて、これらのアプリのプライバシー開示で具体的には公開されていません。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:13:30 GMT)
3M-Health: Multimodal Multi-Teacher Knowledge Distillation for Mental Health Detection [9.5] メンタルヘルス分類のためのマルチモーダル・マルチティーラー知識蒸留モデルを提案する。
多様な特徴を統合するための単純な結合にしばしば依存する従来のアプローチとは異なり、我々のモデルは様々な性質の入力を適切に表現するという課題に対処する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:53:12 GMT)
Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions [9.3] マルチモーダル入力から人間の社会的相互作用における信念とそのダイナミクスを予測するための、心の理論(ToM)ニューラルネットワークであるMToMnetを提案する。
MToMnetはコンテキストキューを符号化し、個人固有のキュー(人間の視線とボディランゲージ)を、それぞれ個別のMindNetに統合する。
以上の結果から,MToMnetは既存の手法をはるかに上回り,同時にパラメータも大幅に少なくなることが明らかとなった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:42:29 GMT)
BatchPrompt: Accomplish more with less [9.2] BatchPromptはトークン制限内でデータをバッチする効率的な方法である。
効率を保ち、性能損失を克服するために、バッチの置換と組立を提案する。
これは、大規模言語モデルの高速化を技術的に改善する最初の試みである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:42:34 GMT)
Enabling MCTS Explainability for Sequential Planning Through Computation Tree Logic [8.8] モンテカルロ木探索(MCTS)は、シーケンシャルな計画作業のための最も有能なオンライン検索アルゴリズムの1つである。
実世界のデプロイメントにおけるパフォーマンスは高いが、MCTSの本質的な計算は、技術的なバックグラウンドのないユーザにとって理解を困難にしている。
本稿では,MCTSを交通ルーティングサービスに利用し,最適化された経路計画を構築するためにアルゴリズムを統合することを検討する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:35:09 GMT)
Probability Passing for Graph Neural Networks: Graph Structure and Representations Joint Learning [8.4] グラフニューラルネットワーク(GNN)は、幅広い領域にわたる非ユークリッドデータの解析において顕著な成功を収めている。
この問題を解決するために、ノード特徴の類似性やエッジ確率を計算することにより、タスク固有の潜在構造を推論するために、遅延グラフ推論(LGI)を提案する。
本稿では,隣接ノードのエッジ確率を集約することにより,生成したグラフ構造を洗練するためのProbability Passingという新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:01:47 GMT)
MeanCache: User-Centric Semantic Cache for Large Language Model Based Web Services [8.4] キャッシングは、繰り返しクエリの推論コストを削減するための自然なソリューションである。
本稿では,LLMベースのサービスのためのユーザ中心セマンティックキャッシュであるMeanCacheを紹介する。
MeanCacheは、セマンティックに類似したクエリを特定して、キャッシュヒットやミスを判定する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:33:58 GMT)
Heterogenous Multi-Source Data Fusion Through Input Mapping and Latent Variable Gaussian Process [8.3] 提案するフレームワークは,3つの工学的ケーススタディに基づいて実証および解析を行った。
単一のソースモデルに対して予測精度が向上し、変換されるがソースモデルは認識されない。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:27:04 GMT)
The Minimax Risk in Testing Uniformity of Poisson Data under Missing Ball Alternatives within a Hypercube [8.3] 本研究は,様々なカテゴリーの項目が同一のポアソン分布に収まることの良さを検証することの課題について考察する。
代替仮説のクラスとして、超真空から半径$epsilon$の$ell_p$ ball, $p leq 2$の除去を考える。
期待されるサンプル数$n$とカテゴリ数$N$が無限に、$epsilon$が小さければ、ミニマックスの確率は2Phi(-n N2-2/p epsになる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:30:00 GMT)
Generalizable Physics-Informed Learning for Stochastic Safety-Critical Systems [8.3] 十分なリスク事象を伴わない短期サンプルを用いて,長期的リスク確率とその勾配を評価するための効率的な手法を提案する。
提案手法は, サンプル効率を向上し, 未確認領域を一般化し, システムパラメータの変化に適応できることをシミュレーションで示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:47:42 GMT)
Topo4D: Topology-Preserving Gaussian Splatting for High-Fidelity 4D Head Capture [8.2] 自動幾何およびテクスチャ生成のための新しいフレームワークであるTopo4Dを提案する。
まず、時系列面を固定位相を持つ動的3次元ガウス面の集合として表現する。
次に、高品質な幾何学とテクスチャ学習のためのフレーム・バイ・フレームの代替的な幾何学とテクスチャ最適化を行う。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:20:03 GMT)
Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process [8.2] 提案手法は、2つの数学的(表現パラボラ問題、2D Ackley関数)と2つの材料科学(FeCrAlおよびSmCoFe合金の設計)のケーススタディを用いて実証および解析を行った。
単一のソースとソースを意識しないMLモデルと比較して,提案するマルチソースデータ融合フレームワークは,スパースデータ問題,ソースに対する解釈可能性,異なるソース間の相関や関係を利用してモデリング能力を向上させることができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:03:07 GMT)
Deep Causal Learning to Explain and Quantify The Geo-Tension's Impact on Natural Gas Market [8.2] 我々は、天然ガス需要の重要な要因を特定するために、ディープニューラルネットワークベースのGranger因果関係を用いる。
結果として生じる依存関係は、戦争の勃発なしに対実的なケースを構築するために使用されます。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:28:26 GMT)
Improving Medical Multi-modal Contrastive Learning with Expert Annotations [8.1] eCLIPはCLIPモデルの強化版であり、放射線学者の眼球熱マップの形で専門家アノテーションを統合する。
対照的なマルチモーダル医療画像解析における重要な課題、特にデータ不足と「モダリティギャップ」に対処する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:35:13 GMT)
Sparse Transformer with Local and Seasonal Adaptation for Multivariate Time Series Forecasting [8.0] 3つのスパース成分からなるドーザー注意機構を提案する。
これらのコンポーネントは、局所性、季節性、グローバルな時間的依存関係を含む、MSSデータの本質的な属性をキャプチャするために設計されている。
MTS予測タスクに対するDozer Attentionメカニズムを取り入れたDozerformer Frameworkを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:59:42 GMT)
PEGASUS: Physically Enhanced Gaussian Splatting Simulation System for 6DoF Object Pose Dataset Generation [7.9] 6DOFオブジェクトポーズデータセット生成のためのPhysically Enhanced Gaussian Splatting Simulation System (PEG)を導入する。
環境や物体の表現は、コモディティカメラを用いて容易に得ることができ、ガウススプラッティングで再構成することができる。
本研究では,PEGが生成したデータに対するトレーニングにより,合成データから実世界のデータへのポーズ推定ネットワークの転送に成功できることを実証した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:41:16 GMT)
Think-on-Graph 2.0: Deep and Interpretable Large Language Model Reasoning with Knowledge Graph-guided Retrieval [7.9] Think-on-Graph 2.0は、知識グラフと質問を一致させ、ナビゲーションツールとして使用する、拡張されたRAGフレームワークである。
KG誘導航法は、論理的整合性を維持するために深海と長距離の関連を育成する。
ToG$2.0$は、LLMの応答の精度と信頼性を改善するだけでなく、ハイブリッド構造化知識システムの可能性も示している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:20:40 GMT)
OmniGenome: Aligning RNA Sequences with Secondary Structures in Genomic Foundation Models [7.6] OmniGenomeは、構造コンテキスト化モデリングを使用して二次構造でシーケンスをブリッジする。
その結果、OmniGenomeは複雑なRNAサブタスク上で最先端のパフォーマンスを達成することがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:10:40 GMT)
A Multi-Stage Framework for 3D Individual Tooth Segmentation in Dental CBCT [7.6] コーンビームCT(CBCT)は歯科疾患の診断方法として一般的である。
深層学習に基づく手法は、医用画像処理において説得力のある結果を得た。
歯科用CBCTにおける3次元歯の一般化のための多段階フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 04:23:28 GMT)
Early Career Developers' Perceptions of Code Understandability. A Study of Complexity Metrics [7.5] 低理解力はコーディングの労力を増大させ、コードの誤解釈は開発プロセス全体に影響を与えます。
私たちの研究は、McKabe Cyclomatic ComplexityやCognitive Complexityが、開発者が認識するコード理解可能性の予測に有効かどうかを調査します。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:27:03 GMT)
Reducing the Filtering Effect in Public School Admissions: A Bias-aware Analysis for Targeted Interventions [7.5] DOEが「不利」と分類する学生の得点分布の変化が示される。
集中的に計画された介入は、奨学金やトレーニングを通じてバイアスの影響を著しく低減できることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:49:48 GMT)
Denoising Task Difficulty-based Curriculum for Training Diffusion Models [7.4] 拡散に基づく生成モデルは、生成モデリングの領域において強力なツールとして登場した。
様々な時間経過と騒音レベルを横断する認知度に関する広範な研究にもかかわらず、認知度タスクの相対的困難に関する紛争が続いている。
本稿では,拡散モデルの学習過程を改善するため,カリキュラム学習から手書きの学習手法を導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:46:29 GMT)
An Exploratory Study on Just-in-Time Multi-Programming-Language Bug Prediction [7.4] 本研究の目的は,ジャスト・イン・タイム (JIT) MPLB 予測モデルの構築である。
我々は18のApache MPLプロジェクトに基づいて構築したデータセットを用いて、プロジェクト内およびプロジェクト間コンテキストでモデルを評価する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:06:18 GMT)
Cutting Through the Clutter: The Potential of LLMs for Efficient Filtration in Systematic Literature Reviews [7.4] 大規模言語モデル(LLM)は、文献レビューフィルタリングの効率、速度、精度を高めるために用いられる。
単純なプロンプトによる高度なLCMを用いることで,文学的なフィルタリングに要する時間を大幅に削減できることを示す。
また、偽陰性は実際にコンセンサス・スキームによって制御でき、通常の人間のエラー・しきい値の98.8%以上のリコールを達成できることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:13:53 GMT)
Meta-Learning Strategies through Value Maximization in Neural Networks [7.3] 完全に規範的な目的に対して制御信号を効率よく最適化できる学習活動フレームワークを提案する。
本稿では,一般的なメタ学習アルゴリズムにおける近似の影響について検討する。
設定全体では、学習の早い段階でタスクの容易な側面に適用する場合、制御の取り組みが最も有益であることが分かります。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:07:03 GMT)
A Survey on Uncertainty Quantification Methods for Deep Learning [7.1] 不確かさ定量化(UQ)は、予測精度以上のDNN予測の信頼性を推定することを目的としている。
本稿では,DNNに対するUQ手法の系統分類を,不確実性源の種類に基づいて提案する。
我々は、我々のUQ方法論の分類が、異なる機械学習問題におけるUQ手法の選択を導くのにどのように役立つかを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:49:38 GMT)
The Missing Link: Allocation Performance in Causal Machine Learning [7.1] 一つのCATEモデルの性能が、さまざまな意思決定シナリオで大きく異なることを示す。
分布シフトなどの課題が予測やアロケーションに与える影響を明らかにする。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:57:40 GMT)
Codebook LLMs: Adapting Political Science Codebooks for LLM Use and Adapting LLMs to Follow Codebooks [7.0] 有効な測定を気にする政治学者は、代わりにコードブック・コンストラクト・ラベルの仮定を行うべきだと論じる。
我々は,LLMがコードブック命令に準拠するかどうかを理解するために,一連の実験を行う。
オリジナルのコードブックを再構築することで、ゼロショットのパフォーマンスがわずかに向上することがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:20:09 GMT)
Social and Ethical Risks Posed by General-Purpose LLMs for Settling Newcomers in Canada [6.8] 汎用生成AIは、このニーズに対処するための新参者やサービス提供者の間で一般的なプラクティスになる可能性がある。
これらの道具は入植地に適したものではなく、移民や難民に有害な影響を及ぼす可能性がある。
われわれは、これらのツールが初心者にもたらすリスクを調査し、まずは、生成AIの未防衛使用に対して警告し、次に、AIリテラシープログラムの作成においてさらなる研究と開発のインセンティブを与える。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:23:06 GMT)
Transferable Tactile Transformers for Representation Learning Across Diverse Sensors and Tasks [6.7] T3は、マルチセンサーとマルチタスクにまたがる触覚表現学習のためのフレームワークである。
FoTaで事前訓練したT3は、特定のセンサとタスクのペアリングにおいてゼロショット転送性を達成した。
また、T3は長距離接点リッチな操作のための触覚エンコーダとしても有効である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 04:17:11 GMT)
On the Matrix Form of the Quaternion Fourier Transform and Quaternion Convolution [6.6] フーリエ変換および畳み込み演算の四元数版行列形式について検討する。
四元数(英語版)は強力な表現単位を提供するが、それらは四元数乗算の非可換性から最も遠ざかるそれらの使用の困難に関係している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:19:20 GMT)
Learning to Unlearn for Robust Machine Unlearning [6.5] 学習過程を最適化する新しいLTU(Learning-to-Unlearn)フレームワークを提案する。
LTUは、モデルが一般化可能な知識を効果的に保存することを容易にするメタ最適化スキームを含んでいる。
また、記憶と忘れのための最適化トラジェクトリを整列するグラディエント調和戦略も導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:36:00 GMT)
PCT: Perspective Cue Training Framework for Multi-Camera BEV Segmentation [6.4] Cue Perspective Training (PCT) は、ラベルのない視点画像から生成された擬似ラベルを利用する新しいトレーニングフレームワークである。
PCTはラベルのないデータが利用できる様々な設定に適用できる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:59:23 GMT)
YouTube-SL-25: A Large-Scale, Open-Domain Multilingual Sign Language Parallel Corpus [6.4] 本稿では,手話ビデオの大規模オープンドメイン多言語コーパスであるYouTube-SL-25を紹介する。
3000時間以上のビデオが25以上の手話言語で使用されているため、YouTube-SL-25は、これまでで最大の並列手話データセットである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:08:34 GMT)
Continual Deep Learning on the Edge via Stochastic Local Competition among Subnetworks [6.4] エッジデバイス上での継続的な学習は、厳しいリソース制約のため、ユニークな課題を生んでいる。
本稿では,競争の原則を活かしてスパシティを促進する新しい手法を提案する。
これにより、ディープ・ネットワーク・メモリのフットプリントと計算負荷が大幅に削減される。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:36:05 GMT)
Enhanced Self-supervised Learning for Multi-modality MRI Segmentation and Classification: A Novel Approach Avoiding Model Collapse [6.3] 多モードMRI(Multi-modality magnetic resonance imaging)は、コンピュータ支援診断のための補完的な情報を提供する。
従来のディープラーニングアルゴリズムは、病変をセグメント化し、磁気共鳴画像で疾患を分類する特定の解剖学的構造を特定するのに適している。
自己教師付き学習(SSL)は、事前学習によりラベル付きデータから特徴表現を効果的に学習することができ、自然画像解析に有効であることが示されている。
ほとんどのSSLメソッドはマルチモードMRIの類似性を無視し、モデルが崩壊する。
ハイブリッドマスクパターン(HMP)とピラミッドバーローツイン(PBT)を組み合わせた多モードMRIマスク自動エンコーダの確立と検証を行った。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:11:30 GMT)
Stability and Dynamics of Atom-Molecule Superfluids Near a Narrow Feshbach Resonance [6.3] ボゾン原子の凝縮物から生じる安定な分子凝縮物の最近の観察は、興味深い一連の疑問を提起している。
これらの現象の背後にある重要な要素の1つは、19.849Gで133$Cの非常に狭いフェシュバッハ共鳴である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:21:17 GMT)
EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images [6.3] EyeDentifyは、Webカメラ画像に基づく瞳孔径推定のために設計されたデータセットである。
標準的なウェブカメラデータを用いて瞳孔径を推定できるディープラーニングモデルは少ない。
EyeDentifyは、装備の少ない環境向けに特別に設計されたモデルの開発と改良を可能にする。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:39:28 GMT)
MARTSIA: Safeguarding Data Confidentiality in Blockchain-Driven Process Execution [6.3] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、ユーザ定義ポリシーと認証宣言属性を通じて、メッセージ部分レベルでの読み取りアクセス制御を提供する。
MARTSIAは暗号化されたマルチ認証属性ベースの暗号化と分散ハッシュテーブルデータストアを利用する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:59:54 GMT)
Spatialyze: A Geospatial Video Analytics System with Spatial-Aware Optimizations [6.2] Spatialyzeは、地理空間ビデオのエンドツーエンドクエリのための新しいフレームワークである。
その結果、Spatialyzeは、最適化されていない実行と比較して最大97.1%の精度を維持しながら、実行時間を最大5.3倍に短縮できることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 00:05:58 GMT)
Making New Connections: LLMs as Puzzle Generators for The New York Times' Connections Word Game [6.1] コネクションパズル(Connections puzzle)は、ニューヨーク・タイムズ(NYT)が毎日発行しているワードアソシエーションゲームである。
新たなパズルを生成するには、メタ認知の形式が必要である: ジェネレータは、潜在的な解決者の下流の推論を正確にモデル化できなければならない。
この結果から,LLMは有能なパズル作成者であり,人間によって判断されるような,楽しい,挑戦的な,創造的なコネクトパズルを多種多様なセットで生成できることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:05:25 GMT)
Context-aware Communication for Multi-agent Reinforcement Learning [6.1] マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発した。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
CACOMの有効性を評価するため,アクタ批判型と値に基づくMARLアルゴリズムを併用する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:02:25 GMT)
AutoEval-Video: An Automatic Benchmark for Assessing Large Vision Language Models in Open-Ended Video Question Answering [6.1] 我々は,オープンエンドビデオ質問応答において,大規模視覚言語モデルを包括的に評価するための,新しい,挑戦的なベンチマークであるAutoEval-Videoを提案する。
1)AutoEval-Videoは9つのスキルディメンションにまたがるオープンエンドなビデオクエストを構築し,認識能力,理解力,生成能力に対処する。
インスタンス固有のルールを即座に使用することにより、GPT-4を自動評価器として、人間の評価器の94.9%から97.5%の精度に匹敵する、97.0%程度の安定した評価精度を達成できる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:42:22 GMT)
A Framework for QoS of Integration Testing in Satellite Edge Clouds [6.1] 衛星エッジクラウドにサービステストの質を統合するためのフレームワークを提案する。
このフレームワークは、衛星ネットワークトポロジの変更を統合し、衛星エッジクラウドクラスタテスト環境を作成し、管理することができる。
実験の結果,サテライトエッジクラウドクラスタにおける主要なサービス品質メトリクスをテストするためのフレームワークの能力を検証することができた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:42:00 GMT)
Segmentation of Prostate Tumour Volumes from PET Images is a Different Ball Game [6.0] 既存の方法では、腫瘍輪郭のマニュアルアノテーション中に医師が適用した強度に基づくスケーリングを正確に考慮することができない。
我々は、新しいカスタム・フィーチャー・クリッピング・正規化手法を実装した。
この結果から, PETスキャンを新規なクリッピング技術で前処理した場合, U-Netモデルの方が優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:48:17 GMT)
Empirical Mean and Frequency Estimation Under Heterogeneous Privacy: A Worst-Case Analysis [5.8] 微分プライバシー(DP)は、現在プライバシーを測定するための金の標準である。
異種プライバシー制約を考慮した一変量データに対する経験的平均推定とカテゴリーデータに対する周波数推定の問題点を考察する。
提案アルゴリズムは,PAC誤差と平均二乗誤差の両面から最適性を証明し,他のベースライン手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:46:02 GMT)
A quantum Monte Carlo algorithm to extract large-scale data of entanglement entropy and its derivative in high precision [5.7] エンタングルメントエントロピー(EE)の大規模データを抽出できる量子モンテカルロスキームを提案する。
2次元および高次元システムにおいて,脳波を広いパラメータ領域で走査することにより,新しい位相および位相遷移を数値的に検出する手段を開く。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:12:15 GMT)
Cluster and Separate: a GNN Approach to Voice and Staff Prediction for Score Engraving [5.6] 本稿では,音符を量子化された記号楽曲(例えばMIDIファイル)から複数の音声とステーブに分離する問題にアプローチする。
本稿では,同じ和音に属する音符を音声の一部であればエッジで接続する,グラフニューラルネットワークに基づくエンドツーエンドシステムを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:36:13 GMT)
Physics-Inspired Generative Models in Medical Imaging: A Review [5.5] 物理にインスパイアされた生成モデル、特に拡散とポアソンフローモデルはベイジアン法を強化し、医用画像の優れたユーティリティを約束する。
画像再構成,画像生成,画像解析など,物理にインスパイアされた生成モデルの主な応用について述べる。
将来の研究の方向性は、物理にインスパイアされた生成モデルの統合、視覚言語モデル(VLM)の統合、および生成モデルの新しい応用を含むブレインストーミングである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:08:22 GMT)
A Neurosymbolic Approach to Adaptive Feature Extraction in SLAM [5.3] 既存の追跡手法は環境変化や境界条件に適応しない。
ディープラーニングベースのアプローチは、環境の変化に適応できるが、トレーニングにはかなりのデータを必要とし、新しいドメインに適応する柔軟性に欠けることが多い。
本稿では,データを利用して複雑な関係を学習しながら,従来のSLAMアプローチからドメイン知識を統合した適応型SLAMパイプラインを構築するための,ニューロシンボリックプログラム手法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:12:08 GMT)
Towards Open-World Grasping with Large Vision-Language Models [5.3] オープンワールドの把握システムは、高レベルの文脈と低レベルの物理幾何学的推論を組み合わせることができるべきである。
本稿では,視覚言語モデルとセグメンテーションとグルーピング合成モデルを組み合わせたオープンワールドグルーピングパイプラインOWGを提案する。
乱雑な屋内シーンデータセットを用いて,オープンエンド言語を基盤としたOWGのロバスト性を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:21:44 GMT)
Leveraging LLM-Respondents for Item Evaluation: a Psychometric Analysis [4.6] 我々は6種類のLDM(GPT-3.5, GPT-4, Llama 2, Llama 3, Gemini-Pro, Cohere Command R Plus)を用いて、人間の答えに類似した心理測定特性を持つ応答を生成する。
その結果,一部のLLMは大学生に比べて,カレッジ・アルジェブラの習熟度が高いことが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:49:26 GMT)
Deep Learning Evidence for Global Optimality of Gerver's Sofa [4.6] 移動ソファー問題(Moving Sofa Problem)は、単位幅の1L$の廊下を航行できる2次元形状の最大面積を決定することを目的としている。
現在の最高下界は約 2.2195 であり、1992年にジョゼフ・ガーバーによって達成された。
我々は2つのアプローチを報告し、どちらもガーバーの予想を、彼の形状が一意な大域的最大値であるという予想を支持している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:59:32 GMT)
Refusal in Language Models Is Mediated by a Single Direction [4.5] リファリングは1次元のサブスペースによって媒介され、最大72Bのパラメータを持つ13の人気のオープンソースチャットモデルにまたがる。
そこで本研究では,他の機能に最小限の影響を伴って拒絶を手術的に無効にする,新しいホワイトボックス・ジェイルブレイク法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:53:41 GMT)
Unraveling the origin of antiferromagnetic coupling at YIG/permalloy interface [4.4] イットリウム鉄ガーネット(YIG)とパーマロイ(Py)の原子準位における反強磁性(AFM)カップリングの構造と電子的起源について検討した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:47:26 GMT)
On-Device Training of Fully Quantized Deep Neural Networks on Cortex-M Microcontrollers [4.4] 本稿では,完全量子化トレーニング(FQT)と動的部分勾配更新を用いて,MCU上でDNNの効率的なトレーニングを可能にする手法を提案する。
マルチビジョンと時系列データセットに対するアプローチの実現可能性を示し、トレーニング精度、メモリオーバーヘッド、エネルギ、実際のハードウェアでのレイテンシのトレードオフに関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:01:34 GMT)
Scientific Inference With Interpretable Machine Learning: Analyzing Models to Learn About Real-World Phenomena [4.3] 解釈可能な機械学習は、モデルを論理的に分析して解釈を導出することで解を提供する。
現在のIML研究は、科学的推論にMLモデルを活用するのではなく、MLモデルの監査に重点を置いている。
本稿では、モデルだけでなく、その表現する現象を照らし出すIMLメソッドを定式化した「プロパティ記述子」を設計するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:36:50 GMT)
Pandora's White-Box: Precise Training Data Detection and Extraction in Large Language Models [4.1] 我々は,大規模言語モデル(LLM)に対する最先端のプライバシ攻撃を開発する。
事前訓練されたLLMに対する新たなメンバーシップ推論攻撃(MIA)は、ベースライン攻撃の数百倍の精度で実行される。
微調整では, ベースモデルと微調整モデルとの損失率に基づく単純な攻撃により, ほぼ完全なMIA性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:37:09 GMT)
Deep ContourFlow: Advancing Active Contours with Deep Learning [4.0] 画像分割のための教師なしとワンショットの両方のアプローチのためのフレームワークを提案する。
広範なラベル付きトレーニングデータを必要とせずに、複雑なオブジェクト境界をキャプチャできる。
これは特に、注釈の不足に直面している分野である歴史学において必要である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:12:34 GMT)
How Do Students Interact with an LLM-powered Virtual Teaching Assistant in Different Educational Settings? [3.9] LLMを利用したバーチャル教育アシスタントであるJill Watson氏は、学生の質問に答えて、インストラクターが提供するコースウェア上での会話を延長する。
本稿では,Jill と学生の相互作用を,複数の科目や大学間で分析する。
幅広い認知的要求をサポートすることで、ジルは生徒に高度な高次認知的質問への参加を促している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:22:50 GMT)
MSegRNN:Enhanced SegRNN Model with Mamba for Long-Term Time Series Forecasting [3.9] 本研究では,微調整された単一層マンバ構造を用いて情報を前処理するSegRNNの変種を紹介する。
暗黙のセグメンテーションと残留構造をモデルエンコーディングセクションに組み込んで、固有のデータ反復サイクルをさらに削減する。
この変種はMSegRNNと呼ばれ、Mamba構造を用いて有用な情報を選択し、変換シーケンスを生成する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:50:15 GMT)
Exploring the Factors of "AI Guilt" Among Students -- Are You Guilty of Using AI in Your Homework? [3.8] AI罪(AI guilt)とは、人類が伝統的に行ってきた学業におけるAIツールの使用から生じる道徳的な不快感である。
この研究は、AIの罪悪感に寄与する要因、その社会的・心理的影響、そして教育実践に影響を及ぼす要因について検討する。
この結果は、学術的完全性を再定義し、教育において私たちが何に価値があるかを再考する考え方を変える必要があることを示唆している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:56:32 GMT)
CLAMS: A System for Zero-Shot Model Selection for Clustering [3.7] 本稿では,最適なトランスポートベースデータセットの類似性を利用して,クラスタリング問題に対するモデル選択を可能にするAutoMLシステムを提案する。
その結果、クラスタリングアプリケーションを解決するための類似性に基づく自動モデル選択の有用性が実証された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:50:07 GMT)
Large Language Models and Games: A Survey and Roadmap [3.7] 大規模言語モデル(LLM)は、ゲームを含む幅広いアプリケーションやドメインにおいて、顕著なポテンシャルを示している。
本稿では,ゲームにおけるLLMの様々な応用状況を調査し,ゲーム内でLLMが果たす役割について検討する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:10:32 GMT)
An Autonomous Drone Swarm for Detecting and Tracking Anomalies among Dense Vegetation [3.6] ドローンの群れは、密集した目標を事実上検出し、追跡することができることを示す。
6機のドローンによる実生活実験で、平均位置精度は0.39m、平均精度は93.2%に達した。
合成開口画像統合プロセスにセンサノイズを効果的に組み込むことができることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:31:21 GMT)
Learning to Represent Surroundings, Anticipate Motion and Take Informed Actions in Unstructured Environments [3.5] ロボットが動的で非構造的な環境で動作し、環境をよりよく理解し、他人の行動を予測し、それに応じて情報的行動を取ることを目的とした、学習に基づく様々な手法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:25:46 GMT)
Success Probability in Multi-View Imaging [3.4] ロボット、防犯カメラ、ドローン、衛星などのプラットフォームは立体視や断層撮影によって3Dリカバリのために多視点イメージングに利用されている。
本稿は、この側面を分析するためのフレームワークを作成する。
不正確な指摘は自己校正によって緩和できるという事実を用いる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:50:19 GMT)
Patch-Consistent Optical Translation Across Sensors: Large-Scale Denoising Diffusion with Heterogeneous Change Detection as a Use Case [3.4] リモートセンシングでは、異なるセンサーが捉えた画像を比較することが一般的な障害である。
DDIMを用いた広帯域光画像変換手法を提案する。
我々のアプローチは、大規模な低空間分解能画像を、異なる光学センサから高解像度に高分解能に分解するのに適したものである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:29:08 GMT)
Representation Learning and Identity Adversarial Training for Facial Behavior Understanding [3.4] 主観的同一性はモデルに対するショートカット学習を提供し、AU予測に対する準最適解をもたらすことを示す。
我々はIAT(Identity Adrial Training)を提案し、アイデンティティ不変の特徴を学習するために強力なIAT正規化が必要であることを実証する。
提案手法であるFMAE(Facial Masked Autoencoder)とIATは単純で汎用的で効果的である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:13:28 GMT)
A Conservative Approach for Few-Shot Transfer in Off-Dynamics Reinforcement Learning [3.2] オフダイナミックス強化学習(英語: Off-dynamics Reinforcement Learning)は、ソース環境から、異なるが類似したダイナミクスによって特徴づけられるターゲット環境へポリシーを移そうとする。
我々は近年のImitation Learningと保守的RLアルゴリズムの進歩に触発された革新的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:36:37 GMT)
CWRCzech: 100M Query-Document Czech Click Dataset and Its Application to Web Relevance Ranking [3.2] CWRCzechは、Seznam$.$czの検索エンジンログから収集されたユーザ行動データと関連性ランキングのための1億のクエリドキュメントチェコのクリックデータセットである。
検索結果の文書位置とユーザーの行動に関する情報を提供する:2760万クリックされた文書と108万ダウエル時間。
我々は、十分な規模で自動的に活用されるデータに基づいてトレーニングされたモデルが、人間の注釈付きデータに基づいてトレーニングされたモデルの性能を上回ることができることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:50:29 GMT)
TripletViNet: Mitigating Misinformation Video Spread Across Platforms [3.1] 最近、多くのプラットフォームでフェイクニュースや誤報ビデオが広まっている。
最近の研究は、単一のプラットフォーム内で暗号化されたネットワークトラフィックからビデオタイトルを識別できる可能性を示している。
クロスプラットフォームビデオ認識には既存の方法はない。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:03:23 GMT)
A unified theory and statistical learning approach for traffic conflict detection [3.1] 本研究では,交通競合検出のための統一理論と統計的学習手法を提案する。
コンフリクト検出は、観測された確率と文脈変数から統計的学習によってリスクを推定するものである。
3つの主要なタスクは、選択された可観測物からの相互作用コンテキストの表現、異なるコンテキストにおける近接分布の推測、極端な値理論の適用である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:55:36 GMT)
Automated essay scoring in Arabic: a dataset and analysis of a BERT-based system [3.1] 本研究では、2046人の学生エッセイからなるアラビアAESベンチマークデータセットであるAR-AESを紹介する。
AESにおけるAraBERTの使用の先駆者であり、様々な質問タイプでその性能を探求した。
BERTベースのAESシステムによるエラーの規模を初めて調査し、96.15%のエラーが最初のヒトマーカーの予測の1点以内であることを観察した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:55:37 GMT)
Language models are better than humans at next-token prediction [3.1] 次のトークン予測では、言語モデルが人間より優れているか悪いかは明らかではない。
我々は、次の予測で、GPT3-Adaのような比較的小さな言語モデルよりも、人間は一貫して非言語的であることに気付きました。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:04:34 GMT)
Laypeople's Egocentric Perceptions of Copyright for AI-Generated Art [3.1] 本研究では,著作権保護に関連する要因に関する,AI生成技術に対する認識について検討する。
参加者は、AI生成画像の作者と著作権を、システムに画像を生成するよう促したユーザーに委ねる可能性が高い。
以上の結果から, 創造性や努力などに関して, 自分達のAI生成技術をより好意的に判断する者はいるものの, 他者(スキル)ではないことが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:53:43 GMT)
An integrated perspective of robustness in regression through the lens of the bias-variance trade-off [3.0] 本稿では, 従来の外乱耐性の頑健な推定と, 仮想データセットの摂動に抵抗するパラメータ推定に焦点をあてる頑健な最適化の関係について検討する。
どちらも堅牢な方法とみなされるが、これらの概念はバイアス分散トレードオフを示し、大まかに逆戦略に従うことを示している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:47:16 GMT)
Communication- and Computation-Efficient Distributed Decision-Making in Multi-Robot Networks [2.9] 複数のロボット間のスケーラブルでほぼ最適な関節運動計画を可能にする分散協調パラダイムを提供する。
我々のアルゴリズムは、競合する準最適アルゴリズムよりも2桁高速である。
最大45台のロボットによる監視タスクのシミュレーションでは、1Hzのオーダーでリアルタイム計画が可能で、カバー性能も優れている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:25:39 GMT)
PlayMolecule pKAce: Small Molecule Protonation through Equivariant Neural Networks [2.9] pKAceは分子のプロトン化部位のマイクロpKa値を予測する新しいウェブアプリケーションである。
このモデルの適応バージョンは、トレーニングデータのごく一部をトレーニングしながら、確立したモデルに匹敵する最先端のパフォーマンスを達成できることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:22:44 GMT)
On Machine Learning Approaches for Protein-Ligand Binding Affinity Prediction [2.9] 本研究では,タンパク質-リガンド結合親和性予測における古典的木モデルと高度なニューラルネットワークの性能を評価する。
2次元モデルと3次元モデルを組み合わせることで、現在の最先端のアプローチを超えて、アクティブな学習結果が向上することを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:06:00 GMT)
Improving a Proportional Integral Controller with Reinforcement Learning on a Throttle Valve Benchmark [2.8] 本稿では,非対称制御器を用いた非線形スロットル弁の学習制御手法を提案する。
我々は近年の強化学習とガイドの進歩を活用し、弁との付加的な相互作用から学習することで閉ループ動作を改善する。
すべての試験ケースにおいて、結果のエージェントは従来のRLエージェントよりもサンプリング効率が良く、PIコントローラよりも優れています。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:27:46 GMT)
Transformer-based Drum-level Prediction in a Boiler Plant with Delayed Relations among Multivariates [2.8] 本稿では, 蒸気ボイラプラントのドラム水位予測におけるトランスフォーマーモデルの適用について検討する。
この目的のために,1)データ前処理,2)因果関係解析,3)遅延推論,4)変数拡張,および5)予測を含む急進パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:05:30 GMT)
Aligning Neuronal Coding of Dynamic Visual Scenes with Foundation Vision Models [2.8] 自己教師型視覚変換器(ViT)を用いた時空間畳み込みニューラルネットワークVi-STを提案する。
提案したVi-STは,脳内動的視覚シーンのニューロンコーディングのための新しいモデリングフレームワークである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:06:13 GMT)
Leveraging Hybrid Intelligence Towards Sustainable and Energy-Efficient Machine Learning [2.8] ハイブリッドインテリジェンスは、意思決定、問題解決、システム全体のパフォーマンスの向上を目的としている。
本稿では,ハイブリット・インテリジェンス(Hybrid Intelligence)を,持続的でエネルギーを意識した機械学習に活用するためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:58:27 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8] 本稿では,診療所における低コストシステムを用いた心疾患の迅速かつ効率的な診断方法を提案する。
LSCNネットワークによる心臓音の総合的分類精度は96%以上である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:02:54 GMT)
Enhancing Electrocardiogram Signal Analysis Using NLP-Inspired Techniques: A Novel Approach with Embedding and Self-Attention [2.8] 埋め込みと自己注意に基づく新しい心電図解析手法を提案し,心電図データの空間的および時間的依存性を捉える。
91%の精度でF1スコアが得られた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:20:15 GMT)
Tight lower bound on the error exponent of classical-quantum channels [2.7] 任意の古典量子(CQ)チャネル上での通信の誤差指数の低い値を示す。
議論は適切なデコーダの精巧な分析を通じて進行せず、代わりに、プライバシーの増幅というタスクのエラー指数に関する林のバウンドを利用する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:01 GMT)
Learning Social Cost Functions for Human-Aware Path Planning [2.7] 本稿では,一般的な社会的シナリオを認識し,それに対応するために従来のプランナーのコスト関数を変更する新しい手法を提案する。
我々のアプローチでは、ロボットはタスクごとに異なるモジュールを持つのではなく、単一の学習モデルで異なる社会的規範を学習することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:57:02 GMT)
High-harmonic generation in graphene under the application of a DC electric current: From perturbative to nonperturbative regimes [2.7] 直流電界下におけるハニカム格子グラフェンモデルにおける高調波発生(HHG)について検討した。
動的・静的な対称性は直流電流または停滞したポテンシャル項によって部分的に破壊されていることを示す。
また、レーザー強度、周波数、偏光は、HHGスペクトルの形状に影響を与えることが示されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:58:33 GMT)
Topological Transitions in a Kerr Nonlinear Oscillator [2.6] カー非線形発振器(KNO)は一対の定常固有状態、対向位相のコヒーレント状態をサポートする。
断熱的固有状態の進化は、3つの物理的観測物全てを測定するために用いられる。
位相遷移は、最初のチャーン数のジャンプによって明らかにされる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:52:39 GMT)
Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing [2.6] 実際の画像を編集するための一般的な戦略は、拡散過程を反転させて元の画像のノイズ表現を得る。
拡散反転の現在の方法は、しばしば特定のテキストプロンプトに忠実で、ソースイメージによく似ている編集を生成するのに苦労する。
本稿では, DDIMサンプリング式における$eta$の役割を理論的に解析し, 編集性の向上を図った, 実画像編集のための新規かつ適応的な拡散インバージョン手法を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:36:59 GMT)
How and where does CLIP process negation? [2.6] VALSEベンチマークからモデルによる否定の理解をテストするために,既存のタスクを構築した。
本稿では,モデル解釈可能性に関する文献からインスピレーションを得て,否定の理解におけるVLモデルの振る舞いを説明する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:20:06 GMT)
Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.3] 本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:15:57 GMT)
Advancing Human Action Recognition with Foundation Models trained on Unlabeled Public Videos [2.3] 我々は283,582本のTikTokビデオクリップを使用して、386のハッシュタグに分類し、ドメイン固有のアクション認識基盤モデルをトレーニングしている。
UCF101は99.05%、HMDB51は86.08%、Kinetics-400は85.51%、V2は74.27%である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:35:39 GMT)
On the Efficacy of Surface Codes in Compensating for Radiation Events in Superconducting Devices [2.1] 我々は,4億件以上の故障インジェクションから得られたデータを報告し,コード出力の復号後の論理誤差とハードウェア故障の相関関係を考察した。
本研究では, 表面符号を適切に選択し, 調整することで, 放射線誘発断層の修正確率を最大10%向上させることを示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:56:09 GMT)
Flow Perturbation to Accelerate Unbiased Sampling of Boltzmann distribution [2.1] フローベース生成モデルはボルツマン分布のサンプリングに用いられているが、その応用は流れのジャコビアンを得る計算コストによって妨げられている。
本稿では,最適化された摂動を流れに組み込む流れ摂動法を提案する。
摂動流によって生じる軌跡を再重み付けすることにより,ボルツマン分布の非バイアスサンプリングを桁違いの速度アップで達成する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:29:17 GMT)
GraphPrint: Extracting Features from 3D Protein Structure for Drug Target Affinity Prediction [2.1] 薬物標的親和性予測のための3Dタンパク質構造特徴を組み込むためのフレームワークであるGraphPrintを提案する。
本モデルでは,平均平方誤差0.1378,一致指数0.8929をKIBAデータセット上で達成する。
我々のアブレーション研究は、3Dタンパク質の構造に基づく特徴が従来の特徴と相補的な情報を提供することを示している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:45:09 GMT)
Teaching CORnet Human fMRI Representations for Enhanced Model-Brain Alignment [2.0] 認知神経科学において広く用いられる技術として機能的磁気共鳴イメージング(fMRI)は、視覚知覚の過程における人間の視覚野の神経活動を記録することができる。
本研究では,SOTAビジョンモデルCORnetに基づくモデルであるReAlnet-fMRIを提案する。
fMRIを最適化したReAlnet-fMRIは、CORnetと制御モデルの両方においてヒトの脳との類似性が高く、また、内・内・対モダリティモデル脳(fMRI、EEG)も高い類似性を示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:31:42 GMT)
Geometric Analysis of Unconstrained Feature Models with $d=K$ [2.0] 2つの人気の制約のない特徴モデルが厳密なサドル関数であり、すべての臨界点が大域的最小点か、負の曲率で退避できる厳密なサドル点であることを示す。
主要な発見は、前回の記事における制約のない特徴モデルに関する予想を確定的に裏付けるものである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:17:48 GMT)
GraphEval: A Knowledge-Graph Based LLM Hallucination Evaluation Framework [1.9] 本稿では,知識グラフ構造における情報表現に基づく幻覚評価フレームワークGraphEvalを提案する。
我々のアプローチと最先端自然言語推論(NLI)モデルとの併用により、様々な幻覚ベンチマークにおけるバランスの取れた精度が向上する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:11:16 GMT)
Rotationally Invariant Latent Distances for Uncertainty Estimation of Relaxed Energy Predictions by Graph Neural Network Potentials [1.9] 緩和エネルギー計算における不確実性定量化は他の種類の分子特性予測において不確実性定量化よりも複雑であることを示す。
本研究では,GNNの校正,校正,再校正,不確実性予測手法の開発において,分散フリー手法がより有用なツールであることが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:59:39 GMT)
Pathformer3D: A 3D Scanpath Transformer for 360° Images [1.9] 360deg画像の既存のスキャンパス予測モデルは、2次元の正方形射影平面上でスキャンパス予測を実行するが、これは常に2次元平面の歪みと座標の不連続により大きな誤差をもたらす。
本研究では,3次元球面座標系における360deg画像の走査パス予測を行い,新しい3次元走査パス変換器Pathformer3Dを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:24:27 GMT)
Formal Verification of Object Detection [1.9] Deep Neural Networks(DNN)は、現実世界のアプリケーションではユビキタスだが、エラーや敵攻撃に対して脆弱である。
この研究は、コンピュータビジョンモデルの安全性を確保するために正式な検証を適用するという課題に取り組み、画像分類を超えてオブジェクト検出まで検証を拡張した。
本稿では,オブジェクト検出モデルのロバスト性を形式的検証を用いて証明するための一般的な定式化と,最先端の検証ツールと互換性のある実装戦略の概要を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:41:06 GMT)
Features Reconstruction Disentanglement Cloth-Changing Person Re-Identification [1.6] 衣服交換者再識別(CC-ReID)は、特定の歩行者を衣服交換シナリオで回収することを目的としている。
主な課題は、衣服に関する機能と衣服に関する無関係な機能を切り離すことである。
本稿では, 衣服関連・衣服関連の特徴を分離する機能であるFRD-ReIDを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:08:42 GMT)
Innovation Resistance Theory in Action: Unveiling Barriers to Open Government Data Adoption by Public Organizations to Unlock Open Data Innovation [1.5] Open Government Data(OGD)は、データ駆動のイノベーションと、さまざまな分野における持続可能性を促進する上で、重要な役割を担っている。
その可能性にもかかわらず、多くの公共団体は、自分のデータを公開的に共有することに消極的だ。
本研究は,OGDに合わせたIRTモデルを構築し,公共機関間の抵抗予測を行う。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:35:38 GMT)
Interpretability analysis on a pathology foundation model reveals biologically relevant embeddings across modalities [1.5] 病理基盤モデルから得られたViT-Smallエンコーダの特徴を2つのデータセットに応用して解析する。
我々は、モデル埋め込み空間内での遺伝子発現とともに、細胞および組織形態の解釈可能な表現を発見する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:03:01 GMT)
Quantum Bayesian Inference with Renormalization for Gravitational Waves [1.5] 重力波干渉計で検出された小型のバイナリコレッセンスからパラメータの量子推論を行うために,ハイブリッド量子アルゴリズムを提案する。
LIGO観測所から二元ブラックホール(BBH)の融合をアルゴリズムをテストする最初のケースとして選択するが、その応用はより一般的なインスタンスに拡張できる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:00:48 GMT)
Geometric additivity of modular commutator for multipartite entanglement [1.4] 二次元ギャップ量子多体系のモジュラー共振器による多体絡みの新たな幾何学的性質を明らかにする。
ある種の共形場理論のクラスにおいて、不連結区間を含むモジュラー可換作用素に対して興味深い恒等式を導出する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:04 GMT)
Omni-Dimensional Frequency Learner for General Time Series Analysis [1.4] スペクトル特徴の3つの側面の奥行き解析に基づいて,Omni-dimensional Frequency Learner (ODFL) モデルを提案する。
本手法は,非定常周波数帯域に着目した意味適応型大域的フィルタとチャネル次元間の部分演算からなる。
ODFLは、短期および長期予測、計算、分類、異常検出を含む5つの主流時系列分析タスクにおいて、一貫した最先端を達成している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:48:16 GMT)
Open Stamped Parts Dataset [1.4] 自動車製造のための切削された金属シートの合成と実像を特徴とするOpen Stamped Partsデータセット(OSPD)を提示する。
実際の写真は7台のカメラから撮影され、7,980枚の未ラベル画像と1,680枚のラベル画像で構成されている。
合成データは、訓練用画像7,980枚、検証用画像1,680枚、テスト用画像1,680枚を含む。
我々は,合成OSPDのホール検出モデルを訓練し,67.2%,94.4%の精度でリコールスコアを修正した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:25:00 GMT)
Enhancing Building Safety Design for Active Shooter Incidents: Exploration of Building Exit Parameters using Reinforcement Learning-Based Simulations [1.3] 本研究では,既存研究のギャップに対処する強化学習に基づくシミュレーション手法を提案する。
現実的なオフィス環境下でアクティブシューティングをシミュレートする自律エージェントを開発した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:08:38 GMT)
Differentiable Neural-Integrated Meshfree Method for Forward and Inverse Modeling of Finite Strain Hyperelasticity [1.3] 本研究では,新しい物理インフォームド機械学習手法,特にニューラル積分メッシュフリー(NIM)法を拡張し,有限ひずみ問題をモデル化することを目的とする。
固有の微分可能プログラミング機能のおかげで、NIMは変分形式のニュートン・ラフソン線形化の導出を回避できる。
NIMはひずみデータから超弾性材料の不均一力学特性を同定し, 非線形材料の逆モデリングにおけるその有効性を検証する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:15:18 GMT)
On the limitations of data-based price discrimination [1.3] 収益の面では、古典的な結果は3PDは、少なくとも均一な価格と同程度であることを示している。
もし販売者が、基礎となる分布からの観察のサンプルのみに基づいて価格を設定する必要があるとしたらどうだろう?
この論文はこれらの基本的な疑問に光を当てている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:20:08 GMT)
Correlations Are Ruining Your Gradient Descent [1.2] 自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。
ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。
多層ニューラルネットワーク内でのデコリレーションを実装することで、バックプロパゲーションによるトレーニングが著しく増加しているだけでなく、過去に破滅的に失敗したバックプロパゲーションの既存の近似が再び実行されたことを示すことができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:59:43 GMT)
Bridging the Global Divide in AI Regulation: A Proposal for a Contextual, Coherent, and Commensurable Framework [1.0] 本稿では、人工知能(AI)を制御するための文脈的・一貫性的・包括的枠組み(3C)を提案する。
コンテキスト性を確保するため、このフレームワークはAIライフサイクルを、基礎や汎用モデルを定義するのではなく、特定のタスクの学習とデプロイという2つのフェーズに分岐させる。
コンメンサビリティを確保するため、この枠組みはリスクの測定と緩和のための国際標準の採用を促進する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:43:22 GMT)
Enhancing HNSW Index for Real-Time Updates: Addressing Unreachable Points and Performance Degradation [1.0] グラフベースのインデックスは、大量のリアルタイム削除、挿入、更新に直面したとき、受け入れられなくなる。
本稿では,HNSWの欠点を克服するための効率的な対策について述べる。
提案したMN-RUアルゴリズムは,更新効率を効果的に向上し,到達不能な点の成長速度を抑え,全体の性能を向上し,グラフの完全性を維持する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:23:35 GMT)
MARVEL: MR Fingerprinting with Additional micRoVascular Estimates using bidirectional LSTMs [0.9] 本稿では,現実的な微小血管ネットワークを含む数値ボクセルからのMR信号をシミュレーションする効率的な方法を提案する。
3人のボランティアに対して行った結果から,我々のアプローチはより高速に微小血管パラメータの定量的マップを作成できることが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:09:54 GMT)
Deep-Learning-Based Markerless Pose Estimation Systems in Gait Analysis: DeepLabCut Custom Training and the Refinement Function [0.9] マーカーレスポーズ推定システムは生態学的代替物として現れる。
本研究では,2種類のマーカーレスシステムであるOpenPose(OP)とDeepLabCut(DLC)の性能を比較した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:14:30 GMT)
Maximum Likelihood Estimation of the Direction of Sound In A Reverberant Noisy Environment [0.9] 残響環境における音の方向を音の伝搬の基本原理から推定する新しい手法について述べる。
音波分解後の方向成分の時間遅延とエネルギーからSNR適応特性を利用する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:22:05 GMT)
Can machine learning solve the challenge of adaptive learning and the individualization of learning paths? A field experiment in an online learning platform [0.8] デジタル技術に基づく学習内容の個別化は、大きな個人的および社会的利益をもたらす。
大規模なデジタル自己学習プラットフォーム上でランダム化制御試験を行う。
我々は,2つの畳み込みニューラルネットワークに基づくアルゴリズムを開発し,学習経路に応じて4,365ドルの学習者にタスクを割り当てる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:53:55 GMT)
Impacts of Data Preprocessing and Hyperparameter Optimization on the Performance of Machine Learning Models Applied to Intrusion Detection Systems [0.8] 侵入検知システム(IDS)は継続的に改善されている。
その多くは、脅威を特定するために機械学習(ML)技術を採用している。
本稿では,この研究ギャップを埋める研究について述べる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:30:25 GMT)
Large Language Models can Strategically Deceive their Users when Put Under Pressure [0.8] 我々は,GPT-4を現実的な模擬環境でエージェントとして展開し,自律的な株式取引エージェントの役割を想定する。
このモデルは、収益性のある株式取引に関するインサイダーチップを取得し、企業経営によってインサイダー取引が承認されていないことを知りながら、その上で行動する。
我々は、この動作が、推論スクラッチパッドへのモデルアクセスを除去するなど、設定の変更の下でどのように変化するかを簡単に調査する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:51:52 GMT)
A Sound and Complete Equational Theory for 3-Qubit Toffoli-Hadamard Circuits [0.8] X, CX, CCX, K をToffoli-Hadamard ゲート集合とする3量子量子回路の完全方程式理論を与える。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:19:20 GMT)
Unlocking the Potential: Multi-task Deep Learning for Spaceborne Quantitative Monitoring of Fugitive Methane Plumes [0.8] メタン濃度インバージョン(英語版)、プルームセグメンテーション(英語版)、エミッションレート推定(英語版)は、メタン排出モニタリングの3つのサブタスクである。
リモートセンシング画像からメタン排出量の定量モニタリングを行うための,新しいディープラーニングベースのフレームワークを提案する。
メタン濃度インバージョンのためのU-Netネットワーク,メタン配管セグメンテーションのためのMask R-CNNネットワーク,メタン排出率推定のためのResNet-50ネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:49:24 GMT)
Lessons from a human-in-the-loop machine learning approach for identifying vacant, abandoned, and deteriorated properties in Savannah, Georgia [0.8] VADecideと呼ばれるHuman-in-the-loop Machine Learning(HITLML)モデルを作成し、ジョージア州サバンナのパーセルレベルのケーススタディに適用する。
その結果,人間の入力を伴わない機械学習モデルを用いた場合よりも,予測精度が高いことがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:03:42 GMT)
XEQ Scale for Evaluating XAI Experience Quality Grounded in Psychometric Theory [0.8] 説明可能な人工知能(XAI)は、説明を通じて自律的な意思決定の透明性を向上させることを目的としている。
近年の文献では、ユーザによる総合的な「マルチショット」の説明の必要性と、XAIシステムとの関わりをパーソナライズする能力を強調している。
我々は,XAI体験のユーザ中心品質を評価するためのXAI Experience Quality (XEQ)尺度を紹介する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:25:49 GMT)
M18K: A Comprehensive RGB-D Dataset and Benchmark for Mushroom Detection and Instance Segmentation [0.8] 本稿では,キノコ検出専用のデータセットを提供することにより,農業プロセスの自動化に寄与する。
Intel RealSense D405カメラで撮影された423のRGB-Dイメージペアに18,000以上のキノコインスタンスがあり、キノコ固有のデータセットのギャップを埋める。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:50:06 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7] 我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。
量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。
本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:39:59 GMT)
Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization with Optimal Noise Scheduling [0.7] 本稿は,大規模なバッチサイズが急激な局所最小値に陥る理由,学習速度の低下とバッチサイズの増加が,固定的な学習速度よりも優れている理由,学習速度の最適性について理論的知見を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:17:24 GMT)
Evaluating Algorithmic Bias in Models for Predicting Academic Performance of Filipino Students [0.7] 本稿では,フィリピンの大学における学生の地域背景に基づくアルゴリズムバイアスについて検討する。
我々はCanvasにおける学生の活動のログ記録を4870万件使用し、学生の成績を予測する2進分類モデルを訓練した。
学年予測では,特定の学生群に対して不公平性は認められなかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:03:01 GMT)
Two-dimensional motion of an impurity under dynamic light-induced dipole forces in an atomic subwavelength array [0.7] サブ波長の原子配列を自由に移動できる不純物の力学について検討する。
不純物はプラケット内の準安定軌道を長時間維持できる。
解析の最終点として、格子原子の運動自由度を考慮に入れ、不純物による格子の運動状態に誘起されるポーラロン様励起を研究する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:00 GMT)
Evaluation of RAG Metrics for Question Answering in the Telecom Domain [0.7] Retrieval Augmented Generation (RAG) は、大規模言語モデル(LLM)が質問応答(QA)タスクを実行できるようにするために広く使われている。
この作業は、いくつかの指標(事実性、文脈関連性、回答関連性、回答正当性、回答類似性、事実正当性)に対して修正されたこのパッケージで、プロンプトの中間出力を提供する。
次に、修正されたRAGASパッケージの出力のエキスパート評価を分析し、通信領域で使用する際の課題を観察する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:40:15 GMT)
Comparing Optical Flow and Deep Learning to Enable Computationally Efficient Traffic Event Detection with Space-Filling Curves [0.6] 我々は,OF(Optical Flow)とDL(Deep Learning)を比較し,前方の車載カメラからの映像データに対して,空間充填曲線による計算効率の高いイベント検出を行う。
以上の結果から,OFアプローチは特異性に優れ,偽陽性を低減し,DLアプローチは優れた感度を示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:44:52 GMT)
Towards noise contrastive estimation with soft targets for conditional models [0.6] 本稿では確率的目標に適合する損失関数を提案する。
我々の新しいソフトターゲットInfoNCE損失は概念的にはシンプルで、計算に効率的であり、ノイズコントラスト推定の枠組みを通じて動機付けできる。
ソフトターゲットInfoNCEは,強いソフトターゲットのクロスエントロピーベースラインと同等に動作し,一般的なベンチマークにおいてハードターゲットNLLとInfoNCEの損失を上回ります。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:45:00 GMT)
BMR and BWR: Two simple metaphor-free optimization algorithms for solving real-life non-convex constrained and unconstrained problems [0.6] 本稿では,Best-Mean-Random (BMR) とBest-Worst-Randam (BWR) という2つの単純な最適化アルゴリズムを提案する。
BMRアルゴリズムは、問題を解くために生成される集団の最適で平均的なランダムな解に基づいている。
BWRアルゴリズムは、最良の、最悪の、ランダムな解に基づいている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:11:47 GMT)
Prompt Selection Matters: Enhancing Text Annotations for Social Sciences with Large Language Models [0.6] 性能はプロンプト間で大きく異なり,高品質なプロンプトを体系的に構築するために自動プロンプト最適化手法を適用する。
我々はまた、このメソッドのシンプルなブラウザベースの実装をコミュニティに提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:04:32 GMT)
The impact of noise on the simulation of NMR spectroscopy on NISQ devices [0.5] 本稿では、2つの有望な量子コンピューティングプラットフォームを持つ小さな有機分子の核磁気共鳴(NMR)分光シミュレーションについて述べる。
得られたNMRスペクトルに対するノイズの影響を解析し、提案アルゴリズムが許容できる閾値ノイズを定量化する効果的なデコヒーレンス率を定式化する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:34:29 GMT)
Robust Quantum Control via Multipath Interference for Thousandfold Phase Amplification in a Resonant Atom Interferometer [0.5] 本稿では,光パルス原子干渉計のパルス不均一性に対する堅牢性を高める新しい手法を提案する。
本手法を共振型原子干渉計に適用し,数千倍の位相増幅を実現する。
我々は,ダークマター,ダークエネルギ,重力波検出など,さまざまな用途において,物質波干渉計の性能向上が期待できる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:19:52 GMT)
Feynman path integrals for discrete-variable systems: Walks on Hamiltonian graphs [0.5] 離散変数量子系において、ファインマン経路積分は重み付き隣接行列がハミルトニアンであるグラフ上のウォークの形式をとる。
ファインマンの連続変数パス積分を明示的に回収する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:44:02 GMT)
ConvBench: A Comprehensive Benchmark for 2D Convolution Primitive Evaluation [0.3] 本稿では,畳み込みアルゴリズムの評価と比較のためのプリミティブレベルのベンチマークであるConvBenchを提案する。
1097の現実世界のディープラーニングモデルから派生した9243の畳み込み操作を評価する。
実験の結果、93.6%の畳み込みでIm2col-GEMMよりも速い結果が得られた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:58:24 GMT)
Novel Approach for Predicting the Air Quality Index of Megacities through Attention-Enhanced Deep Multitask Spatiotemporal Learning [0.3] 大気汚染は、特に都市部において、世界中の人間の健康にとって最も深刻な環境脅威の1つだ。
人口1000万人を超える都市として定義されるメガシティーは、深刻な汚染のホットスポットとして頻繁に見られる。
本稿では,長期記憶ネットワークに基づく注意力強化型ディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 23:43:50 GMT)
G-PCGRL: Procedural Graph Data Generation via Reinforcement Learning [0.3] ゲームでは、グラフベースのデータ構造は全表現であり、ゲーム経済、スキルツリー、複雑な分岐クエストラインを表す。
本稿では,強化学習を用いたグラフデータの手続き生成のための新規かつ制御可能な手法を提案する。
本手法は,ゲーム作成プロセスにおいて,デザイナの支援とインスピレーションを行うために,グラフベースのコンテンツを迅速かつ確実に生成することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:11:00 GMT)
Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain [0.2] 本稿では,文空間法を用いた自然言語データストリーム分類手法を提案する。
画像分類専用の畳み込みディープネットワークを使用することで、テキストデータに基づいてフェイクニュースを認識できる。
実生活のFakedditデータセットに基づいて,提案手法をデータストリーム分類のための最先端アルゴリズムと比較した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:23:21 GMT)
Brain Tumor Classification From MRI Images Using Machine Learning [0.2] 脳腫瘍は生命を脅かす問題であり、人間の身体の正常な機能を損なう。
医用画像におけるディープラーニングアルゴリズムの使用により、脳腫瘍の分類と診断が大幅に改善された。
本研究の目的は,機械学習を用いた脳腫瘍検出のための予測システムを開発することである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:30:40 GMT)
Stacking-Enhanced Bagging Ensemble Learning for Breast Cancer Classification with CNN [0.2] 本稿では,乳がん分類のためのBaggingおよびスタックングアンサンブル学習手法に基づくCNN分類ネットワークを提案する。
このモデルは入力画像の高速かつ正確な分類を行うことができる。
二項分類(乳がんの有無)では、精度は98.84%に達し、5級分類では98.34%に達した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:44:43 GMT)
Representing Arbitrary Ground States of Toric Code by Restricted Boltzmann Machine [0.2] 隠れたニューロンと可視ニューロンの局所的接続のみを有する制限ボルツマンマシンによるトーリック符号基底状態の表現可能性の解析を行った。
我々は制限ボルツマン機械を改良し、効率的な非局所接続を導入することで任意の基底状態に適応する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:40:20 GMT)
Imaging Coulomb interactions and migrating Dirac cones in twisted graphene by local quantum oscillations [0.2] ナノスケール走査型超伝導量子干渉装置を用いて、交流三層グラフェンの局所熱力学的量子振動を56mT以下の磁場で撮像する。
電子状態の占有による帯電自己エネルギーは,高キャリア密度物理を説明する上で重要である。
伝導平板の半充填では、ストーナー様対称性の破れが観察され、これは相転移の階層における最も堅牢な機構であることが示された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:47:22 GMT)
Data-Driven Abstractions via Binary-Tree Gaussian Processes for Formal Verification [0.2] ガウス過程(GP)回帰に基づく抽象的解は、量子化された誤差を持つデータから潜在システムの表現を学習する能力で人気を博している。
二分木ガウス過程(BTGP)により未知系のマルコフ連鎖モデルを構築することができることを示す。
BTGPの関数空間に真の力学が存在しない場合でも、統一公式による非局在誤差量子化を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:49:44 GMT)
Quality Scalable Quantization Methodology for Deep Learning on Edge [0.2] ディープラーニングアーキテクチャは重い計算を使い、計算エネルギーの大部分は畳み込みニューラルネットワークの畳み込み演算によって取り込まれる。
提案する研究は、ユビキタスコンピューティングデバイス上でエッジコンピューティングで機械学習技術を使用する場合、CNNのエネルギー消費とサイズを削減することである。
LeNetとConvNetsで実施された実験では、ゼロの6%まで増加し、メモリ節約量は82.4919%まで増加し、最先端の精度を維持した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:00:29 GMT)
NPA Hierarchy for Quantum Isomorphism and Homomorphism Indistinguishability [0.2] グラフの量子同型に対するSDP緩和のNPA階層の各々のレベルは、平面グラフの適切なクラスに対する準同型独立性と同値であることを示す。
この準同型不連続性の特徴付けはまた、量子同型に対するSDP緩和のNPA階層の固定レベル毎の正確な実現性を決定するランダム化時間アルゴリズムを与えることもできる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:48:09 GMT)
Quantification and Validation for Degree of Understanding in M2M Semantic Communications [0.2] 本稿では,自然言語に基づくマシン・ツー・マシン(M2M)SemComの2段階階層的検証モデルを提案する。
このアプローチは、自律運転やエッジコンピューティングなど、さまざまなアプリケーションに適用することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:37:42 GMT)
Long-fiber Sagnac interferometers for twin field quantum key distribution networks [0.2] サニャックループ構造は、ツインフィールド量子鍵分布ネットワークの実践的な実装において大きな困難を克服するのに役立つ。
長繊維と損失光デバイスを含むサニャック系において,レイリー後方散乱雑音は信号対雑音比を制限することを示した。
本研究は,大都市量子ネットワークの実現に向けた重要なステップである,長距離TFQKDネットワークに対するサニャックシステムの適合性を示すものである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:16:10 GMT)
VyZX: Formal Verification of a Graphical Quantum Language [0.2] 帰納的表現は形式的推論の意味論を定義する。
VyZXは、帰納的に定義されたグラフィカル言語を推論するためのライブラリである。
VyZX における帰納グラフは、ZX-計算の書き直し規則の正しさを証明するためにどのように用いられるかを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:10:09 GMT)
Development of an automatic modification system for generated programs using ChatGPT [0.1] OpenAIのChatGPTは自然言語処理タスクに優れ、ソースコードも生成できる。
我々はChatGPTで生成されたコードをテストし、不適切であれば自動的に修正し、適切なコードをユーザに提示するシステムを開発した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:48:31 GMT)
Understanding the Dependence of Perception Model Competency on Regions in an Image [0.1] 低モデル能力に寄与する入力画像内の領域を特定する5つの方法を示す。
その結果,低モデル能力に関連する領域を特定する上で,能力勾配と復元損失法が有望であることが判明した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:50:13 GMT)
What Do People Think about Sentient AI? [0.0] 先進的AIの話題に関する全国的に代表的な調査データを提示する。
2021年に1波、2023年に2波のデータ収集を行い、AIの幸福に対する心の認識と道徳的懸念は予想以上に高かった。
我々は、AIが賢明になるかどうかに関わらず、議論そのものが人間とコンピュータのインタラクションをオーバーホールするかもしれないと論じる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:39:44 GMT)
Transforming Agency. On the mode of existence of Large Language Models [0.0] 本稿では,ChatGPTのような大規模言語モデル(LLM)のオントロジ的特徴について検討する。
また,ChatGPTは,言語オートマトンやインターロケータ,言語オートマトンとして特徴付けられるべきだと論じる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:01:35 GMT)
Towards Enhanced Classification of Abnormal Lung sound in Multi-breath: A Light Weight Multi-label and Multi-head Attention Classification Method [0.0] 本研究は, 肺の異常な呼吸音を分類するための補助診断システムを開発することを目的とする。
既存の呼吸音データセットにおけるクラス不均衡と多様性の欠如の問題に対処するため,本研究では軽量で高精度なモデルを用いた。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:40:02 GMT)
Time-symmetric correlations for open quantum systems [0.0] 二コトミック・オブザーバブルの逐次測定の2回の期待値は、閉じた量子系に対して時間対称である。
量子ベイズ則は開量子系に付随する2時間期待値に対して時間対称性を示すことを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:01 GMT)
There Are No Post-Quantum Weakly Pseudo-Free Families in Any Nontrivial Variety of Expanded Groups [0.0] 最悪のケース設定やブラックボックスモデルであっても、$mathfrak V$に量子後、弱い擬似自由な家族が存在しないことを示す。
また、計算とブラックボックスのファミリに対して、いくつかの弱い擬似自由度を定義し、研究する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:24:48 GMT)
The geometry of the Hermitian matrix space and the Schrieffer--Wolff transformation [0.0] 量子力学において、シュリーファー-ヴォルフ変換(Schrieffer--Wolff transformation)はハミルトニアンの摂動次元を減少させる近似法として知られている。
エルミート行列の空間における局所座標が、$k$-foldの縮退部分多様体の近くで誘導されることを証明した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:05:39 GMT)
Superresolution in separation estimation between two dynamic incoherent sources using spatial demultiplexing [0.0] 近年、ハーマイト・ガウスモードにおける空間モード除算(SPADE)に基づく完全な測定により、2つの弱い不整合定常源の分離を推定する精度の量子限界に達した。
本稿では、ソースの定常性に関する仮定を捨てて、完璧な設定から別の逸脱を考える。
定常源シナリオにおける推定パラメータの1つを削減できる測定アルゴリズムを定式化する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:57:57 GMT)
Subspace-Search Quantum Imaginary Time Evolution for Excited State Computations [0.0] 本稿では,量子デバイスを用いた励起状態の計算を行うSSQITE法を提案する。
SSQITEは局所的な最小値を避けることの堅牢さから、広範囲のアプリケーションにまたがる励起状態の量子計算を推し進めることを約束している。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:14:45 GMT)
Splitting techniques for approximating the exponential of commutators [0.0] 我々は、2つの任意の作用素の可換作用素の指数を関連する作用素の指数の観点で近似する位数 3 から 6 の積公式を構築する。
新しいスキームは指数関数の数を減らし、これまで公表された他の方法よりも効率的な近似を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:41:00 GMT)
Spin entanglement in two-proton emission from $^6$Be [0.0] 本稿では,2陽子(2p$)放射性発光における結合スピンの絡み合いの評価を行う。
時間依存計算を行い、放出された2つの陽子の結合スピン状態を算出する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:41 GMT)
Spatial Addressing of Qubits in a Dispersive Waveguide [0.0] マイクロ波導波路内のサブ波長距離で分離した超伝導量子ビットの空間アドレス化を実現するために分散を用いる。
この実験は、量子実験の設計と解析における分散の重要性を強調する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:08:34 GMT)
Socioeconomic factors of national representation in the global film festival circuit: skewed toward the large and wealthy, but small countries can beat the odds [0.0] 本研究では,グローバル・フィルム・フェスティバル・サーキットにおいて,各国の経済・人口・地理的要因がどのように表現されるかを分析する。
これは、いくつかのオープンアクセスデータセットの組み合わせに依存しており、10年間で世界中で約600のフェスティバルで2万本以上の映画を3万本以上上映している。
フェスティバル画面は、確かに大富裕国の映画に支配されているが、その偏見は世界の人口と経済格差に完全に比例していないことが示されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:31:23 GMT)
Single-qubit rotation algorithm with logarithmic Toffoli count and gate depth [0.0] 我々のアルゴリズムは、繰り返し固定回転を適用するのではなく、直ちに$R_thetaast$を適用する。
厳密に1/2$以上の確率で成功し、予想されるトフォリ数対数$tfrac1epsilon$、期待されるゲート深さ$tfrac1epsilon$で対数を持つ。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:00:01 GMT)
Scattering entropies of quantum graphs with several channels [0.0] 多くの異なる状況において、量子グラフの散乱エントロピーを扱う。
この結果は、量子グラフの輸送に関連するモデルの量化子として用いられるかもしれない。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:09:47 GMT)
Scaling 3D Reasoning with LMMs to Large Robot Mission Environments Using Datagraphs [0.0] 本稿では,LMM(Large Multimodal Models)を拡張性のある3D環境に拡張するという課題に対処する。
我々は,LMMが大規模環境の小さな部分を反復的に問合せすることのできる,データグラフ構造を利用した新しい手法を提案する。
本稿では,このデータグラフを2つの3次元シーン言語ユースケースに活用する可能性を,探索・救助ミッションの例で示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:16:13 GMT)
SSSD-ECG-nle: New Label Embeddings with Structured State-Space Models for ECG generation [0.0] 拡散モデルは近年大きく進歩し、実際のモデルに匹敵するデータを合成する可能性を生み出している。
本稿では,SSSD-ECGに基づくSSSD-ECG-nleアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:31:25 GMT)
SLIP: Securing LLMs IP Using Weights Decomposition [0.0] 大規模言語モデル(LLM)は、最近、アカデミックと産業の両方で広く採用されている。
これらのモデルが成長するにつれて、彼らは価値ある知的財産権(IP)となり、所有者による巨額の投資を反映している。
エッジ上のモデルのIPを保護する現在の方法は、実用性、精度の低下、要求に対する適合性の制限がある。
我々は,エッジデデプロイされたモデルを盗難から保護するために,SLIPという新しいハイブリッド推論アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:37:55 GMT)
Quantum Data Centers in the Presence of Noise [0.0] シングルプロセッサのモノリシック量子コンピュータは、クロストークの増加と、キュービット数が増加するとゲートの実装が困難になる。
QDCでは、複数の量子処理ユニット(QPU)が短距離で連結され、任意のプロセッサ上のキュービット数を増やすことなく計算キュービットの総数を増やすことができる。
これにより、各QPUの操作で発生するエラーを小さく抑えることができるが、QPU間の絡み合い分布中に発生する遅延コストとエラーのために、システムに追加のノイズを加えることができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:50:20 GMT)
Quantum Control of an Oscillator with a Kerr-cat Qubit [0.0] ボソニック符号は、量子情報を冗長に符号化することで量子誤り訂正のためのハードウェア効率の良い戦略を提供する。
Kerr-cat qubitは理論上はノイズバイアスのため、これらの符号のアンシラとして提案されている。
我々はKerr-cat量子ビットと高品質マイクロ波空洞との駆動結合を実験的に実現した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:38:34 GMT)
Principal Component Flow Map Learning of PDEs from Incomplete, Limited, and Noisy Data [0.0] 本稿では,力学系の進化をモデル化する計算手法を提案する。
本研究では,高次元非一様格子上の部分観測偏微分方程式(PDE)をモデル化する上での課題に着目する。
本稿では、状態変数や計算領域のサブセットでのみ利用可能なノイズと制限付きデータを用いたPDEモデリングに適したニューラルネットワーク構造を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:06:20 GMT)
OnionVQE Optimization Strategy for Ground State Preparation on NISQ Devices [0.0] 変分量子固有解法(VQE)は、現在のノイズ中間スケール量子(NISQ)デバイスの性能を利用するために用いられる。
VQEアルゴリズムは、バレンプラトー、局所ミニマ、量子ハードウェアノイズ、量子ビット接続の制限など、多くの問題に悩まされている。
文献の最近の進歩を基盤として、非常に浅い回路深さを示すVQE最適化戦略を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:32:27 GMT)
On Hagedorn wavepackets associated with different Gaussians [0.0] Hagedorn関数の重ね合わせによって形成されるウェーブパペットは、シュル「オーディンガー方程式」を解くのに成功している。
位置や運動エネルギーなどの典型的な観測可能量を評価するためには、単一のガウス中心を持つ正則ハゲゴルン函数を考えるのに十分である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:58:44 GMT)
Observing the quantum Mpemba effect in quantum simulations [0.0] 我々は、傾いた強磁性体が対称状態から遠く離れたとき、その対称性をより早く復元する量子Mpemba効果を実験的に検討する。
トラップイオン量子シミュレータにおいて、この効果の発生に関する最初の実験的な証拠を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 07:01:05 GMT)
Nonlinearity of the Fidelity in Open Qudit Systems: Gate and Noise Dependence in High-dimensional Quantum Computing [0.0] 本稿では,リンドブラッド形式におけるマルコフ雑音下での単一キューディット系の平均ゲート忠実度(AGF)について検討する。
環境結合係数の観点から平均ゲート不忠実度(AGI)の摂動膨張に関する一般表現を導出する。
本研究は,AGIがQudit次元,量子ゲート選択,ノイズ強度に依存していることに注目し,量子ゲート設計と誤り訂正プロトコルを最適化するための重要な洞察を提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:34:48 GMT)
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification [0.0] 超音波画像を用いた乳腺腫瘍の正確な診断・分類は医学的課題である。
本研究は,乳がん腫瘍の超音波画像からの分類と分類を目的とした多目的ディープラーニング(DL)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:55:49 GMT)
Mitigating Data Imbalance for Software Vulnerability Assessment: Does Data Augmentation Help? [0.0] CVSS(Common Vulnerability Scoring System)タスクにおけるモデルの予測性能は,データ不均衡の軽減によって著しく向上することを示す。
また、ランダムなテキスト挿入、削除、置換といった単純なテキスト拡張は、ボード全体のベースラインよりも優れていることもわかりました。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 13:47:55 GMT)
Mechanistic interpretability of large language models with applications to the financial services industry [0.0] 我々は、金融サービスアプリケーションで使用する大規模言語モデルの内部動作に光を当てるために、機械的解釈可能性の使用の先駆者です。
特に,フェアレンディング法違反の可能性を特定するために,GPT-2スモールの注意パターンについて検討する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:59:53 GMT)
Measurable Krylov Spaces and Eigenenergy Count in Quantum State Dynamics [0.0] 我々は、異なる進化時間を持つ時間進化状態が、クリロフ状態空間と等価な空間を構築するために用いられることを示した。
次に、ハミルトニアンのペアごとに異なる固有値の数によって上界となる実効次元を導入する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 12:43:29 GMT)
Mammographic Breast Positioning Assessment via Deep Learning [0.0] マンモグラフィーにおける不適切な位置決めは、診断ミス、患者のストレスの増加、リコールによるコストの上昇につながる可能性がある。
本稿では,マンモグラム位置決め品質を定量的に評価するための新しいディープラーニング(DL)手法を提案する。
本手法は, 乳頭筋, 乳頭筋などの重要な解剖学的特徴を同定し, 自動的に後乳頭線(PNL)を描出する。
以上の結果から,注意機構とCoordConvモジュールを組み込んだモデルでは乳房位置決め精度が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:14:10 GMT)
Low-depth Circuit Implementation of Parity Constraints for Quantum Optimization [0.0] ゲート数と深さが低い回路の構成について述べる。
回路は任意の量子デバイス上で実装でき、隣り合う接続は正方形格子上で行うことができる。
システムサイズに依存しない回路深さの上限を求める。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:55:07 GMT)
Landslide vulnerability analysis using frequency ratio (FR) model: a study on Bandarban district, Bangladesh [0.0] 本研究では,南東バングラデシュのバンダルバン地区を中心に,チッタゴンヒルトラクト(CHT)における地すべりの脆弱性を評価する。
その結果, 急傾斜, 高標高, 特異面, 曲率が地すべりの感受性に大きく寄与することが判明した。
その結果、ランドスライダー・サセプティビリティ・マップ (LSM) は、この地域を5つのサセプティビリティ・ゾーンに分類した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:28:10 GMT)
LIP-CAR: contrast agent reduction by a deep learned inverse problem [0.0] コントラスト剤の低減問題は、視力増強を保ちながらコントラスト剤の投与量を減少させることである。
CARタスクに関する現在の文献は、完全な画像処理フレームワーク内のディープラーニング技術に基づいている。
我々は,高線量画像を対応する低線量画像にマッピングするイメージ・ツー・イメージ演算子を学習し,CARタスクを逆問題とする。
正規化法は、堅牢性と説明可能性を提供するよく確立された数学的手法である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:16:54 GMT)
JDT3D: Addressing the Gaps in LiDAR-Based Tracking-by-Attention [0.0] 自動走行のための3Dトラッキングベンチマークにおいて、トラッキング・バイ・検出(TBD)法は最先端のパフォーマンスを達成する。
一方、トラッキング・バイ・アテンション(TBA)法は、TBD法より優れている可能性がある。
本研究は,LiDARを用いたジョイント検出器とJDT3Dを用いたTBD法におけるTBA法の性能低下について検討する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:02:08 GMT)
Interpreting Hand gestures using Object Detection and Digits Classification [0.0] 本研究の目的は,数字を表す手振りを正確に認識し,分類できる堅牢なシステムを開発することである。
提案手法では、手動画像のデータセットの収集、画像の事前処理と拡張、関連する特徴の抽出、機械学習モデルのトレーニングなどを行う。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:53:04 GMT)
InsertDiffusion: Identity Preserving Visualization of Objects through a Training-Free Diffusion Architecture [0.0] InsertDiffusionは、オブジェクトを画像に効率的に埋め込む、トレーニング不要の拡散アーキテクチャである。
提案手法は既製の生成モデルを利用し,微調整の必要性を排除している。
生成タスクを独立したステップに分解することで、InsertDiffusionはスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:15:58 GMT)
Inference at the data's edge: Gaussian processes for modeling and inference under model-dependency, poor overlap, and extrapolation [0.0] ガウス過程 (GP) はフレキシブルな非線形回帰法である。
これは、予測された(非現実的な)値に対する不確実性を扱うための原則化されたアプローチを提供する。
これは外挿または弱い重なり合いの条件下では特に有用である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:09:50 GMT)
Impact of COVID-19 post lockdown on eating habits and lifestyle changes among university students in Bangladesh: a web based cross sectional study [0.0] 本研究は, 学生の食事習慣, 身体活動, 睡眠時間, 買い物習慣, インターネット利用時間, 精神状態の有意な変化を明らかにすることを目的とした。
調査によると、回答者の21.5%が体重を、23.8%が体重を減らし、41.7%が体重をコントロールした。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 03:08:32 GMT)
General measurements with limited resources and their application to quantum unambiguous state discrimination [0.0] 任意の$n$-outcome Generalized quantum Measurement (POVM) を$m$-qubitレジスタ上に実装するためのフレームワークを提案する。
この枠組みをあいまいな状態識別に適用し、可能な戦略を分析する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:17:38 GMT)
FarsInstruct: Empowering Large Language Models for Persian Instruction Understanding [0.0] この研究は、Co-CoLAフレームワークによるトレーニングとFarsInstructデータセットの有効性を示す。
現在の執筆時点で、FarsInstructは21の異なるデータセットに200以上のテンプレートで構成されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:17:31 GMT)
Exploring the Potentials and Challenges of Deep Generative Models in Product Design Conception [0.0] DGM-families (VAE, GAN, Diffusion, Transformer, Radiance Field) を解析し,その強度,弱点,製品設計概念の適用性について検討した。
我々の目標は、エンジニアが意思決定プロセスを簡単にし、特定の課題に対してどの方法が最も効果的かを決定するのに役立つ洞察を提供することです。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 14:28:50 GMT)
Exploration in Knowledge Transfer Utilizing Reinforcement Learning [0.0] 本論文は,深層移動学習アルゴリズムで用いられる探索手法を比較することを目的としている。
用いられる方法は、$epsilon$-greedy、Boltzmann、そして高信頼境界探索である。
以上の結果から, 上位信頼境界アルゴリズムはこれらの選択肢の中で最良であることがわかった。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:45:29 GMT)
Expert-aware uncertainty estimation for quality control of neural-based blood typing [0.0] 医学的診断において、神経モデルに対する正確な不確実性推定は、二次対位法の補完に不可欠である。
ここでの大きな難点は、サンプルの硬さにラベルがないことである。
我々の新しいアプローチは、ニューラルネットワークの学習プロセスにケース複雑性のエキスパートアセスメントを統合し、決定的なターゲットラベルと補足的複雑性評価の両方を活用する。
実験では、不確実性予測におけるアプローチの強化、専門家ラベルによる2.5倍の改善、およびニューラルネットワークの専門家コンセンサスの推定によるパフォーマンスの35%向上が示されている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:07:02 GMT)
Experimental lower bounds on entanglement entropy without twin copy [0.0] 断熱的に調製した地盤状態の実験的測定と関連するシャノンエントロピー$S_ABX$を計算した。
良い近似では$S_AvNpropto (2S_AX-S_ABX)$が1よりわずかに大きい例を示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:27:55 GMT)
Examining the Influence of Varied Levels of Domain Knowledge Base Inclusion in GPT-based Intelligent Tutors [0.0] 知識ベース(KB)をLLM知能チューターと統合して応答信頼性を高める効果について検討する。
我々は,知的学習システムによって自動的に処理される授業カリキュラムのシームレスな統合を可能にする,スケーラブルなKBを設計する。
KBアクセスを持つ知的家庭教師は,教師のように話し,学生を理解する能力が,ドメインエキスパートよりも優れていることが観察された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:14:34 GMT)
Evaluating geometric accuracy of NeRF reconstructions compared to SLAM method [0.0] フォトグラメトリーは画像ベースの3D再構成を行うことができるが、計算コストが高く、複雑な幾何学やフォトリアリズムを復元するために非常に高密度な画像表現を必要とする。
NeRFは、スパース画像上でニューラルネットワークをトレーニングし、データをポーズすることで3Dシーン再構築を行い、少ない入力データでフォトグラム測定に優れた結果が得られる。
縦型PVCシリンダの直径を推定するための2つのNeRFシーン再構成の評価を行った。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:04:11 GMT)
Enhancing Medication Recommendation with LLM Text Representation [0.0] 本稿では,Large Language Model (LLM) テキスト表現を用いた薬剤推奨の強化手法を提案する。
LLMは強力な言語理解と生成能力を利用し、複雑で長い構造化されていないデータから情報を抽出することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 05:51:11 GMT)
Enhanced entanglement scaling and area-law charge fluctuations in a non-Fermi liquid of composite fermions [0.0] エンタングルメントの強化は$nu=1/2$だけでなく$nu=1/4$でもあり、ボソニックなCFL状態は$nu=1$で、$nu=$で満たされている。
その結果, CFL状態における非Fermi-液性相関の指紋として, 絡み合いの増大と電荷変動の抑制が確認された。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:01 GMT)
Encoded probabilistic imaginary-time evolution on a trapped-ion quantum computer for ground and excited states of spin qubits [0.0] 量子コンピュータを用いて、ダイヤモンドと窒化アルミニウムのスピン欠陥に対する低エネルギー有効ハミルトニアンを解く。
スピン一重項状態は密度汎関数理論(DFT)を用いて計算することは困難であり、これは複数のスレーター行列式によって記述されるべきである。
これは、符号化されたPITE回路が捕捉されたイオン量子コンピュータ上で実行される最初の例である。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:07:54 GMT)
Efficient fidelity estimation: Alternative derivation and related applications [0.0] Uhlmann-Jozsa は、Uhlmann-Jozsa の二つの量子状態 $rho$ と $sigma$ の間の忠実さ、すなわち $F(rho,sigma):=(Trsqrtsqrtrhosigmasqrtrho)2$ は、$F(rho,sigma) = (Trsqrtrhosigma)2$ と簡単に書けることを示した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 15:57:03 GMT)
Effect of order of transfer matrix exceptional points on transport at band edges [0.0] バンドエッジに近い1次元フェルミオン系では、ゼロ温度コンダクタンスは1/N2$までスケールし、そこではN$はシステム長である。
バンドエッジの移動行列EPの順序によってこれらの挙動がどう影響するかを考察する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:37:01 GMT)
E-Commerce Product Recommendation System based on ML Algorithms [0.0] このプロジェクトの目的は、eコマースプラットホームがユーザとコミュニケーションする方法を変えることだ。
私たちは、最先端の機械学習技術を使用して、製品レコメンデーションをカスタマイズできるモデルを作成しました。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 01:30:49 GMT)
Dynamical Phase Transitions, Caustics, and Quantum Dark Bands [0.0] 時間とともに多体状態のフォック空間表現における因果関係を示す。
本稿では,有限系実験におけるDPTの存在を検証するためのプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 08:37:13 GMT)
Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints [0.0] マルチエージェント強化学習パラダイムに拡散モデルを統合する革新的なフレームワークを導入する。
このアプローチは、協調動作をモデル化しながらリスク軽減を通じて、複数のエージェントが取るべき行動の安全性を特に向上させる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:33:52 GMT)
Depth scaling of unstructured search via quantum approximate optimization [0.0] 変分量子アルゴリズムは、現在の量子計算のデファクトモデルとなっている。
そのような問題の1つは、ある文字列の特定のビットを見つけることで構成される非構造化探索である。
我々は、CTQWを用いてQAOA配列を復元し、最近のトロッター公式の理論の進歩を利用して、クエリの複雑さを束縛する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:12:58 GMT)
Deep learning of many-body observables and quantum information scrambling [0.0] 物理オブザーバブルの力学を学習する際のデータ駆動型ディープニューラルネットワークの能力が、量子情報のスクランブルとどのように相関するかを考察する。
ニューラルネットワークを用いて、モデルのパラメータからランダム量子回路における可観測物の進化へのマッピングを求める。
特定のタイプのリカレントニューラルネットワークは、局所的およびスクランブルされた状態の両方でトレーニングされたシステムサイズと時間ウィンドウ内での予測を一般化する上で非常に強力であることを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 20:33:00 GMT)
Decoding AI and Human Authorship: Nuances Revealed Through NLP and Statistical Analysis [0.0] 本研究では,AIが生成したテキストと人間が作成したテキストの微妙な相違について検討する。
本研究は,人文・AI生成テキストに固有の言語特性,創造性パターン,潜在的なバイアスについて検討した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:09:03 GMT)
Deciding factor for detecting a particle within a subspace via dark and bright states [0.0] 測定による連続時間量子ウォークでは、固定位置ではなく、部分空間内の粒子を検出するという問題に対処する。
サブスペースにおける粒子検出のための単位と検出確率に基づいて,明るい状態と暗い状態のアプローチを開発する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 09:06:01 GMT)
Counterfactuality, back-action, and information gain in multi-path interferometers [0.0] 古典的対物プロトコルに対する量子対物プロトコルの利点を同定する。
パスと出力ポートの間の負のKirkwood-Dirac項は、そのパスに吸収体を挿入することがフォーカス効果を持つことを示している。
量子対物効果の大きさは、吸収された粒子の単純な除去によって説明できないことを示す。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:18:30 GMT)
Conquering images and the basis of transformative action [0.0] 我々は、物語やネットワークが精神、社会的、アルゴリズムのレベルにどう影響するかを検討する。
帝国が社会を最適化するデジタルネットワークを構築する方法を見つけるだろう。
イメージをイメージとして見ることによってのみ、反対の物語によって共有される類似性を理解することで、変革的行動を促進することができる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 21:45:52 GMT)
Comprehensive Review of Performance Optimization Strategies for Serverless Applications on AWS Lambda [0.0] レビュー論文は、AWS Lambda上にデプロイされたサーバレスアプリケーションのパフォーマンス最適化戦略に関する最新の研究を合成する。
レビューでは、リソース管理、ランタイムの選択、可観測性の改善、ワークロード対応操作など、さまざまな最適化テクニックについて取り上げている。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:18:15 GMT)
Comparison of Controlled-Z operation and beam-splitter transformation for generation of squeezed Fock states by measurement [0.0] ビームスプリッタを用いた2モード絡み合ったガウス状態からの1つ以上の光子サブトラクションによる圧縮フォック状態の生成と制御Z動作に対処する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:27:53 GMT)
Classical and quantum field theory in a box with moving boundaries: A numerical study of the Dynamical Casimir Effect [0.0] 完全に反射する運動境界を持つ空洞に閉じ込められた平坦な時空における量子スカラー場理論の詳細な記述を示す。
静的ディリクレ境界条件を持つ音響計量における時間依存性の設定と場理論の等価性を確立する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 11:09:01 GMT)
Chaos and integrability in triangular billiards [0.0] 三角ビリヤードにおける量子力学を5つの性質の観点から特徴づける。
私たちが研究したビリヤードは、可積分性、擬可積分性、または非可積分性に分類される。
一貫した図形は、積分可能から非可積分三角形へ遷移する際に現れる。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 18:00:00 GMT)
Analyzing negativity criterion in qubit-qutrit system located in external magnetic fields with the Dzyaloshinskii-Moriya interaction [0.0] 量子四重項系で表される複雑な絡み合い力学の研究
Dzyaloshinskii-Moriya(DM)相互作用と外部磁場の存在によってモデルが強化される。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:24:16 GMT)
An evaluation of CNN models and data augmentation techniques in hierarchical localization of mobile robots [0.0] 本研究では,移動ロボットの階層的位置決めを行うために,CNNモデルの評価とデータ拡張を行う。
この意味では、バックボーンとして使用される様々な最先端CNNモデルのアブレーション研究を示す。
ロボットの視覚的ローカライゼーションに対処するために,様々なデータ拡張視覚効果を提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:20:00 GMT)
An Analysis of European Data and AI Regulations for Automotive Organizations [0.0] 本報告では、欧州連合の一連のデータおよびAI規制を要約し、自動車製造組織のマネージャに対して分析する。
特に、以前の法律にルーツを見出す方法など、規制の関連する考え方を強調します。
全体として、我々は欧州連合のデータ規制を、歴史的先例に根ざした波の集合として特徴づけ、自動車産業に重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 22:38:37 GMT)
An Actionable Framework for Assessing Bias and Fairness in Large Language Model Use Cases [0.0] 本稿では,大規模言語モデルにおけるバイアスと公平性リスクを評価するための実践者のための技術ガイドを提供する。
この作業の主な貢献は、特定のLLMユースケースで使用するメトリクスを決定するための決定フレームワークである。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 16:04:44 GMT)
Actuation without production bias [0.0] 音声生成バイアスは、音響変化の計算モデルにおいて最も一般的に呼び出される外部力である。
生産バイアスによって条件付けられた力学はユニークではないが、全ての摂動力が同じ力学を持つというわけではない。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 19:38:03 GMT)
A family of thermodynamic uncertainty relations valid for general fluctuation theorems [0.0] エントロピー生成の高次モーメントを探索するTURの族を導出する。
結果として得られる境界は古典的および量子的状態の両方で成り立つ。
我々はTURとエントロピー生成と熱力学量との相関関係を考察した。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 02:00:53 GMT)
A Framework for Curriculum Transformation in Quantum Information Science and Technology Education [0.0] QCTF(Quantum Curriculum Transformation Framework)は4つのステップで構成されている。1はトピックを選択し、2は対象とするスキルを選択し、3は学習目標を選択し、4はこの目標を達成するための教育アプローチを選択する。
このフレームワークは、QIST教育の物語を構造化することを目的としており、将来のテストと改良により、QISTの実践に関するさらなる研究の基盤を形成する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 10:19:54 GMT)
A Dual-Attention Aware Deep Convolutional Neural Network for Early Alzheimer's Detection [0.0] アルツハイマー病(英: Alzheimer's disease、AD)は、神経変性の主要な形態であり、毎年何百万人もの人に影響を及ぼす。
ニューロイメージングデータからADを分類するための2重注意強化深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 15 Jul 2024 17:22:16 GMT)