Learning Spatial Adaptation and Temporal Coherence in Diffusion Models for Video Super-Resolution [151.1] ビデオ超解像のための空間適応と時間コヒーレンス(SATeCo)を追求する新しい手法を提案する。
SATeCoは低解像度ビデオから時空間ガイダンスを学習し、潜時空間高解像度ビデオデノイングとピクセル空間ビデオ再構成の両方を校正する。
REDS4データセットとVid4データセットを用いて行った実験は、我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:26 GMT)
Generating Potent Poisons and Backdoors from Scratch with Guided Diffusion [146.1] 現代のニューラルネットワークは、人間の最小限の検査でウェブスクラップされた大量のデータセットで訓練されることが多い。
本研究では, 誘導拡散法を用いて, スクラッチから塩基サンプルを合成し, より強力な毒性やバックドアを発生させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:03:38 GMT)
Composed Video Retrieval via Enriched Context and Discriminative Embeddings [118.7] コンポジションビデオ検索(CoVR)はコンピュータビジョンにおいて難しい問題である。
本稿では,クエリ固有のコンテキスト情報を明示的にエンコードするために,詳細な言語記述を活用する新しいCoVRフレームワークを提案する。
我々の手法はリコール@K=1のスコアで7%の上昇を達成した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:03 GMT)
Improving White-box Robustness of Pre-processing Defenses via Joint Adversarial Training [106.3] 対向騒音の干渉を軽減するため,様々な対向防御技術が提案されている。
プレプロセス法は、ロバストネス劣化効果に悩まされることがある。
この負の効果の潜在的な原因は、敵の訓練例が静的であり、前処理モデルとは独立していることである。
本稿では,JATP(Joint Adversarial Training Based Pre-processing)防衛法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:00:38 GMT)
Reinforcement Learning with Options and State Representation [105.8] この論文は、強化学習分野を探求し、改良された手法を構築することを目的としている。
階層的強化学習(Hierarchical Reinforcement Learning)として知られる階層的な方法で学習タスクを分解することで、そのような目標に対処する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:07:24 GMT)
A Survey on Large Language Model based Autonomous Agents [105.3] 大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:56:58 GMT)
HalluciDoctor: Mitigating Hallucinatory Toxicity in Visual Instruction Data [102.6] 機械生成データに固有の幻覚は未発見のままである。
本稿では,クロスチェックパラダイムに基づく新しい幻覚検出・除去フレームワークであるHaluciDoctorを提案する。
LLaVAに比べて44.6%の幻覚を緩和し,競争性能を維持した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:39:45 GMT)
SD-DiT: Unleashing the Power of Self-supervised Discrimination in Diffusion Transformer [102.4] 拡散変換器(DiT)は画像生成における生成拡散モデルの新たなトレンドとして登場した。
最近のブレークスルーは、画像内文脈学習を追加することで、DiTのトレーニング効率を大幅に改善するマスク戦略によって推進されている。
本研究は,DiTトレーニングを促進するための自己監督的識別知識を新たに開放することで,これらの制約に対処する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:35 GMT)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.4] グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:39:10 GMT)
VP3D: Unleashing 2D Visual Prompt for Text-to-3D Generation [96.6] 視覚プロンプト誘導型3次元拡散モデル(VP3D)を提案する。
VP3Dは、テキストから3D生成を促進するために、2D視覚プロンプトの視覚的外観知識を明示的に解放する。
実験の結果,VP3Dの2次元視覚プロンプトは3次元モデルの視覚的外観の学習を著しく容易にすることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:31 GMT)
Text-Conditioned Resampler For Long Form Video Understanding [94.8] トレーニング済みのビジュアルエンコーダと大言語モデル(LLM)を用いたテキストコンディショニングビデオリサンプラー(TCR)モジュールを提案する。
TCRは、最適化された実装なしで、平易な注意で一度に100フレーム以上を処理できる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:15:22 GMT)
TRIP: Temporal Residual Learning with Image Noise Prior for Image-to-Video Diffusion Models [94.2] TRIPは画像間拡散パラダイムの新しいレシピである。
静的画像から派生した画像ノイズをピボットして、フレーム間の関係推論を共同でトリガーする。
WebVid-10M、DTDB、MSR-VTTデータセットに関する大規模な実験は、TRIPの有効性を示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:40 GMT)
FocusCLIP: Multimodal Subject-Level Guidance for Zero-Shot Transfer in Human-Centric Tasks [89.2] FocusCLIPは、人中心タスクにおけるゼロショット転送を改善するために、主題レベルのガイダンスをCLIPフレームワークに統合する。
人間中心のタスクでは、FocusCLIPはMPII Human Poseデータセットの画像でトレーニングされる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:45:37 GMT)
Point Transformer V3: Simpler, Faster, Stronger [88.8] 本稿では,ポイントクラウド処理における精度と効率のトレードオフを克服することに焦点を当てる。
本稿では,特定のメカニズムの精度よりもシンプルさと効率を優先するポイントトランスフォーマーV3(PTv3)を提案する。
PTv3は、屋内と屋外の両方のシナリオにまたがる20以上の下流タスクで最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:00:01 GMT)
Benchmarks and Challenges in Pose Estimation for Egocentric Hand Interactions with Objects [88.3] ロボティクス、AR/VR、アクション認識、モーション生成といったタスクにおいて、エゴセントリックな視点からのインタラクションの総合的な3D理解が重要である。
我々は、AmblyHandsとARCTICデータセットに基づいたHANDS23チャレンジを、慎重に設計されたトレーニングとテストの分割に基づいて設計する。
提案手法の結果と近年のリーダーボードのベースラインに基づいて,3Dハンド(オブジェクト)再構成タスクの徹底的な解析を行う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:12:21 GMT)
Language Models (Mostly) Do Not Consider Emotion Triggers When Predicting Emotion [87.2] 人間の感情が感情の予測において有意であると考えられる特徴とどのように相関するかを検討する。
EmoTriggerを用いて、感情のトリガーを識別する大規模言語モデルの能力を評価する。
分析の結果、感情のトリガーは感情予測モデルにとって健全な特徴ではなく、様々な特徴と感情検出のタスクの間に複雑な相互作用があることが判明した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:42:57 GMT)
A Survey of Confidence Estimation and Calibration in Large Language Models [86.7] 大規模言語モデル(LLM)は、様々な領域において幅広いタスクにまたがる顕著な機能を示している。
印象的なパフォーマンスにもかかわらず、彼らは世代内の事実上の誤りのために信頼できない。
信頼度を評価し、異なるタスクで調整することで、リスクを軽減し、LLMがより良い世代を創出できるようになります。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:01:49 GMT)
Energy control in a quantum oscillator using coherent control and engineered environment [83.9] 我々は、コヒーレント、電磁、電場、非コヒーレント制御を用いて、量子調和振動子におけるエネルギーの新たな操作法を開発し、解析する。
速度勾配アルゴリズムに基づくコヒーレントかつ非コヒーレントな制御設計手法を提案する。
また, 速度勾配制御アルゴリズムの差分法も提案した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:44:46 GMT)
Generative Pre-training for Speech with Flow Matching [81.6] 我々は,フローマッチングとマスク条件を併用した60k時間の無転写音声に対して,SpeechFlowという生成モデルを事前学習した。
実験結果から,事前学習した生成モデルをタスク固有のデータで微調整し,音声強調,分離,合成に関する既存の専門家モデルに適合または超えることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:18:40 GMT)
DriveCoT: Integrating Chain-of-Thought Reasoning with End-to-End Driving [81.0] 本稿では,DriveCoTというエンド・ツー・エンドの運転データセットを総合的に収集する。
センサーデータ、制御決定、および推論プロセスを示すチェーン・オブ・シークレット・ラベルが含まれている。
我々は,私たちのデータセットに基づいてトレーニングされたDriveCoT-Agentと呼ばれるベースラインモデルを提案し,連鎖予測と最終決定を生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:01 GMT)
Distilling Semantic Priors from SAM to Efficient Image Restoration Models [80.8] 画像復元(IR)では、セグメンテーションモデルからセグメンテーションの事前情報を活用することが、性能向上のための一般的なアプローチである。
近年のセグメンテーション・アズ・モデル (SAM) は、IRタスクを強化するために先進的なセグメンテーション先行を抽出する強力なツールとして登場した。
本稿では,SAMのセマンティック知識を抽出し,推論プロセスに干渉することなく,IRモデルからの撤退を促進するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:17:20 GMT)
Telling Left from Right: Identifying Geometry-Aware Semantic Correspondence [80.7] 本稿では,意味的対応のための幾何学的認識の重要性を明らかにする。
この情報を活用することで,意味的対応性能が著しく向上することを示す。
提案手法は,SPair-71kデータセット上で,65.4(ゼロショット)と85.6(教師)のPCK@0.10スコアを達成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:21:18 GMT)
Quality-Aware Translation Models: Efficient Generation and Quality Estimation in a Single Model [77.2] そこで我々は,ニューラルネットワーク翻訳(NMT)モデルを用いて,その品質を学習し,その品質を推定する手法を提案する。
我々は、単一パスの復号化の効率性よりも、品質向上や品質改善のアプローチよりも優れた品質向上を得る。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:27:16 GMT)
LOCOST: State-Space Models for Long Document Abstractive Summarization [76.3] 長いコンテキスト入力を持つ条件付きテキスト生成のための状態空間モデルに基づくエンコーダデコーダアーキテクチャであるLOCOSTを提案する。
計算複雑性が$O(L log L)$の場合、このアーキテクチャは疎注意パターンに基づく最先端モデルよりもはるかに長いシーケンスを処理できる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:52:42 GMT)
The Strong Pull of Prior Knowledge in Large Language Models and Its Impact on Emotion Recognition [74.0] In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理のための強力なパラダイムとして登場した。
LLMには、感情認識において強いが矛盾する先行性があり、その予測に影響を及ぼすことが示される。
以上の結果から,ICLをより大きなLCMで事前学習領域外の情動中心タスクに使用する場合,注意が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:07:32 GMT)
Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.6] マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:48:22 GMT)
AnimateMe: 4D Facial Expressions via Diffusion Models [72.6] 拡散モデルの最近の進歩により、2次元アニメーションにおける生成モデルの能力が向上した。
グラフニューラルネットワーク(GNN)は,メッシュ空間上で直接拡散過程を定式化し,新しい手法で拡散モデルを記述する。
これにより、メッシュ拡散モデルによる顔の変形の発生が容易になる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:40:44 GMT)
Little Red Riding Hood Goes Around the Globe:Crosslingual Story Planning and Generation with Large Language Models [69.6] 以前の研究は、主に英語に焦点を当てた単言語設定でのみストーリー生成の計画の有効性を実証してきた。
本稿では,言語横断型ストーリ生成の新たな課題を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:54:21 GMT)
HallusionBench: An Advanced Diagnostic Suite for Entangled Language Hallucination and Visual Illusion in Large Vision-Language Models [69.5] 本稿では,画像コンテキスト推論評価のためのベンチマークであるHalusionBenchを紹介する。
このベンチマークは、1129の質問と組み合わせた346の画像で構成されており、すべて人間の専門家によって細心の注意を払って作成されている。
HallusionBenchの評価では、15種類のモデルをベンチマークし、最先端のGPT-4Vによって達成された31.42%の質問対精度を強調した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:05:24 GMT)
SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.4] 我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:30:22 GMT)
SignSGD with Federated Voting [69.1] SignSGD with majority voting (signSGD-MV) は1ビット量子化により通信コストを大幅に削減できる効果的な分散学習アルゴリズムである。
我々は、テキストフェデレート投票(signSGD-FV)を用いた新しいサインSGDを提案する。
連合投票の考え方は、学習可能な重量を利用して多数決を行うことである。
提案手法は, エッジデバイスが不均一なミニバッチサイズを使用する場合でも, 理論的収束を保証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:32:43 GMT)
Creating a Digital Twin of Spinal Surgery: A Proof of Concept [68.4] 手術デジタル化は、外科デジタルツイン(SDT)とも呼ばれる現実世界の手術の仮想レプリカを作成する過程である。
現実的な条件下での脊髄手術に応用した手術デジタル化のための概念実証(PoC)を提案する。
5台のRGB-Dカメラを外科医の動的3D再構成に、ハイエンドカメラを解剖学の3D再構成に、赤外線ステレオカメラを手術器具追跡に、レーザースキャナーを手術室の3D再構成とデータ融合に使用した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:09:40 GMT)
Geometric Prior Based Deep Human Point Cloud Geometry Compression [67.5] 我々は、点雲の幾何学的冗長性除去に先立って、人間の幾何学的手法を利用する。
高分解能な人点雲を幾何学的先行と構造的偏差の組み合わせとして考えることができる。
提案フレームワークは,既存の学習ベースポイントクラウド圧縮手法を用いて,プレイ・アンド・プラグ方式で動作可能である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:53:54 GMT)
CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.8] スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:56:17 GMT)
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models [65.4] 視覚的トークンに対する注意計算は,LVLMの深い層において極めて非効率であることがわかった。
本稿では,計算効率の最適化を目的とした多用途プラグアンドプレイ方式であるFastVを紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:29:30 GMT)
VURF: A General-purpose Reasoning and Self-refinement Framework for Video Understanding [65.1] 本稿では,Large Language Models (LLM) の推論能力に基づくビデオ理解・推論フレームワーク (VURF) を提案する。
ビデオタスクの文脈でLLMの実用性を拡張するための新しいアプローチである。
我々は,その文脈学習能力を利用して,映像理解のための実行可能な視覚プログラムを生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:18:37 GMT)
Offline Reinforcement Learning: Role of State Aggregation and Trajectory Data [64.9] 我々は,ベルマンを使わずに,値関数を実現可能なオフライン強化学習の問題を再考する。
Xie と Jiang (2021) と Foster et al. (2022) による以前の研究は、軌道に基づくオフラインデータとともに集中係数が有界標本複雑性を統一するかどうかという疑問を解き放った。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:28:45 GMT)
HiFi-123: Towards High-fidelity One Image to 3D Content Generation [64.8] HiFi-123は高忠実で多視点で一貫した3D生成のために設計された手法である。
本稿では,拡散型ゼロショットノベルビュー合成法の忠実度を大幅に向上する参照ガイド型新規ビュー拡張(RGNV)技術を提案する。
また,新たにRGSD(Reference-Guided State Distillation)を施行した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:35:55 GMT)
Clustering Propagation for Universal Medical Image Segmentation [63.4] 医用画像のセグメンテーションのための卓越したソリューションは、通常、自動的またはインタラクティブな設定のために調整される。
クラスタリングベースのセグメンテーション技術にインスパイアされたS2VNetは、データのスライスワイズ構造をフル活用する。
S2VNetは、一般的な3Dソリューションに比べて高速な推論速度とメモリ消費の削減により、自分自身を区別する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:32:05 GMT)
Multi-modal Instruction Tuned LLMs with Fine-grained Visual Perception [63.0] マルチモーダル参照から画素単位のオブジェクト認識と自然言語記述を生成できる汎用MLLMモデルであるbfAnyRefを提案する。
本モデルでは,領域レベルの参照表現生成とセグメンテーションの多様さを含む,複数のベンチマークにおける最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:45:03 GMT)
Is There a One-Model-Fits-All Approach to Information Extraction? Revisiting Task Definition Biases [62.8] 定義バイアスは、モデルを誤解させる可能性のある負の現象である。
IEでは、情報抽出データセット間のバイアスと、情報抽出データセットとインストラクションチューニングデータセット間のバイアスの2つの定義バイアスを識別する。
本稿では, 定義バイアス測定, バイアス対応微調整, タスク固有バイアス緩和からなる多段階フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:19:20 GMT)
LightIt: Illumination Modeling and Control for Diffusion Models [61.8] 我々は、画像生成のための明示的な照明制御方法であるLightItを紹介する。
最近の生成法では照明制御が欠如しており、画像生成の多くの芸術的側面に不可欠である。
本手法は、制御可能で一貫した照明による画像生成を可能にする最初の方法である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:42:13 GMT)
Be Yourself: Bounded Attention for Multi-Subject Text-to-Image Generation [60.9] 本稿では,サンプリングプロセスにおける情報フローをバウンドする訓練不要な手法である境界注意法を紹介する。
提案手法は,与えられたプロンプトとレイアウトの整合性を向上する複数の主題の生成に有効であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:52:07 GMT)
The Role of $n$-gram Smoothing in the Age of Neural Networks [60.2] 本稿では,ニューラルネットワークモデルの時代において,古典的な$n$-gram平滑化技術が果たす役割を再オープン化する。
我々は,幻想的な$n$-gram平滑化手法をニューラルネットワークモデルと互換性のある正規化器に変換するためのフレームワークを考案した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:42:19 GMT)
FlashFace: Human Image Personalization with High-fidelity Identity Preservation [59.8] FlashFaceを使うと、ユーザーは自分の写真を簡単にパーソナライズできる。
我々のアプローチは、高忠実度ID保存とより良い指示に従うことによって、既存の人間の写真カスタマイズ方法と区別できる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:57 GMT)
LLMs Are Few-Shot In-Context Low-Resource Language Learners [59.7] In-context Learning (ICL) は、大規模言語モデル(LLM)に、表現不足の言語で多様なタスクを実行する権限を与える。
ICLとその言語間変動(X-ICL)を25の低リソース言語と7の比較的高リソース言語で検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:55:29 GMT)
Towards large-scale quantum optimization solvers with few qubits [59.6] 我々は、$m=mathcalO(nk)$バイナリ変数を$n$ qubitsだけを使って最適化するために、$k>1$で可変量子ソルバを導入する。
我々は,特定の量子ビット効率の符号化が,バレン高原の超ポリノミウム緩和を内蔵特徴としてもたらすことを解析的に証明した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:43:00 GMT)
Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation [59.1] 本稿では,関係学習用データセットの言語的スキューと視覚的スクリューの両方を定量化する統計指標を提案する。
系統的に制御されたメトリクスは、一般化性能を強く予測できることを示す。
この研究は、データの多様性やバランスを向上し、絶対的なサイズをスケールアップするための重要な方向を示します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:18:39 GMT)
Few-Shot Class Incremental Learning with Attention-Aware Self-Adaptive Prompt [58.9] ASP(Attention-Aware Self-Adaptive Prompt)という新しいフレームワークを提案する。
ASP.NETはタスク不変のプロンプトを奨励し、注意点から特定の情報を減らすことで共有知識をキャプチャする。
要約すると、ASPはベースタスクの過度な適合を防ぎ、数秒のインクリメンタルタスクで膨大なデータを必要としない。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:08:07 GMT)
V2X-PC: Vehicle-to-everything Collaborative Perception via Point Cluster [58.8] 我々は,低レベル構造情報と高レベル意味情報を組み合わせて,シーンを疎結合に表現する新しいメッセージユニット,すなわちポイントクラスタを導入する。
このフレームワークには、オブジェクトの機能を維持し、帯域幅を管理するためのポイントクラスタパッキング(PCP)モジュールが含まれている。
2つの広く認識されている協調認識ベンチマークの実験は、従来の最先端の手法と比較して、我々の手法の優れた性能を示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:24:02 GMT)
ExtremeCast: Boosting Extreme Value Prediction for Global Weather Forecast [57.7] 非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,ExEnsembleという名称のトレーニングフリーな極値拡張戦略を導入し,画素値のばらつきを増大させ,予測ロバスト性を向上させる。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:17:45 GMT)
TACTiS-2: Better, Faster, Simpler Attentional Copulas for Multivariate Time Series [57.4] パウラ理論に基づいて,最近導入されたトランスフォーマーに基づく注目パウラ(TACTiS)の簡易な目的を提案する。
結果から,実世界の予測タスクにまたがって,このモデルのトレーニング性能が大幅に向上し,最先端のパフォーマンスが達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:55:22 GMT)
EMAGE: Towards Unified Holistic Co-Speech Gesture Generation via Expressive Masked Audio Gesture Modeling [57.1] 音声とマスクによるジェスチャーから全身の人間のジェスチャーを生成するためのフレームワークEMAGEを提案する。
まずBEAT2(BEAT-SMPLX-FLAME)というメッシュレベルの音声合成データセットを紹介した。
EmAGEは、最先端のパフォーマンスで全体的なジェスチャーを生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:01:27 GMT)
Don't Judge by the Look: Towards Motion Coherent Video Representation [56.1] Motion Coherent Augmentation (MCA)は、ビデオ理解のためのデータ拡張手法である。
MCAはビデオの外観変化を導入し、静的な外観ではなく、モデルに動きのパターンを優先するよう暗黙的に促す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:45:35 GMT)
Data Mixing Laws: Optimizing Data Mixtures by Predicting Language Modeling Performance [55.9] 本研究では,関数形式の混合比に関するモデル性能の予測可能性について検討する。
トレーニングステップのスケーリング法則,モデルサイズ,データ混合法則のネスト利用を提案する。
提案手法は,RedPajamaにおける100Bトークンをトレーニングした1Bモデルのトレーニング混合物を効果的に最適化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:14:00 GMT)
Discovering modular solutions that generalize compositionally [55.5] 実演から純粋に線形変換までを識別することは、指数関数的な数の加群の組み合わせを学習することなく可能であることを示す。
さらに, 有限データからのメタラーニングにより, 多くの複雑な環境において, 構成を一般化するモジュラーポリシが発見可能であることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:01:08 GMT)
Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding [55.3] Calib3Dは3Dシーン理解モデルの信頼性をベンチマークし精査する先駆的な試みである。
10種類の3Dデータセットにわたる28の最先端モデルを評価した。
本稿では,3次元モデルのキャリブレーション向上を目的とした,深度対応のスケーリング手法であるDeptSを紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:59 GMT)
An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing [55.3] Expert-Token-Routing は、メタ LLM の語彙内の特別な専門家トークンとして、専門家 LLM を表現している。
既存の命令データセットから専門家のLSMの暗黙の専門知識を学ぶのをサポートする。
また、ユーザの視点から詳細なコラボレーションプロセスを隠蔽し、独特なLLMのように対話を容易にする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:17:05 GMT)
Self-STORM: Deep Unrolled Self-Supervised Learning for Super-Resolution Microscopy [55.2] 我々は、シーケンス固有のモデルベースのオートエンコーダをトレーニングすることで、そのようなデータの必要性を軽減する、深層無学習の自己教師付き学習を導入する。
提案手法は, 監視対象の性能を超過する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:40:32 GMT)
Situated Natural Language Explanations [54.1] 自然言語の説明(NLE)は、人間に意思決定を説明する最もアクセスしやすいツールである。
既存のNLE研究の視点は、観客を考慮に入れない。
Situated NLEは視点を提供し、説明の生成と評価に関するさらなる研究を促進する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:54:48 GMT)
Task-Agnostic Detector for Insertion-Based Backdoor Attacks [53.8] 本稿では,バックドア検出の先駆的手法であるTABDet(Task-Agnostic Backdoor Detector)を紹介する。
TABDetは、最終層ロジットと効率的なプーリング技術を組み合わせて、3つの著名なNLPタスクをまたいだ統一ロジット表現を可能にする。
TABDetは多様なタスク特化モデルから共同で学習し、従来のタスク特化手法よりも優れた検出効率を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:12:02 GMT)
Bridging the Sim-to-Real Gap with Bayesian Inference [53.6] データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:29:32 GMT)
Language Rectified Flow: Advancing Diffusion Language Generation with Probabilistic Flows [53.3] 本稿では,言語認識フロー (ours) を提案する。
本手法は, 標準確率流モデルの再構成に基づく。
実験およびアブレーション実験により,本手法は多くのNLPタスクに対して汎用的,効果的,有益であることが示されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:58:22 GMT)
SCHEME: Scalable Channer Mixer for Vision Transformers [52.6] 視覚変換器は多くの視覚タスクにおける印象的な性能のために大きな注目を集めている。
特徴混合が高密度接続に取って代わり,これをブロック対角構造で確認できるかどうかを検討した。
SCHEMEformerの新しいモデル群は、FLOPS、精度、モデルサイズ、精度、スループットの新たなフロンティアを確立する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:40:29 GMT)
REFRAME: Reflective Surface Real-Time Rendering for Mobile Devices [52.0] 本研究は,様々な場面でリアルタイムな新規ビュー合成を実現するための課題に取り組む。
既存のリアルタイムレンダリング手法、特にメッシュに基づくレンダリングは、リッチなビュー依存の外観を持つモデリングサーフェスにおいて、サブパーパフォーマンスを持つことが多い。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:07:50 GMT)
SeMoLi: What Moves Together Belongs Together [51.7] 動作手がかりに基づく半教師付き物体検出に挑戦する。
近年,移動物体の擬似ラベルインスタンスに対して,動きに基づくクラスタリング手法が適用可能であることが示唆された。
我々は、このアプローチを再考し、オブジェクト検出とモーションインスパイアされた擬似ラベルの両方が、データ駆動方式で取り組めることを示唆する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:27:03 GMT)
UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.3] 計画プロセスにおける重要なステップである1段階のレトロシンセプション予測は、近年の関心の高まりを目撃している。
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:23:03 GMT)
Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [51.3] 本稿では, 抗原特異的抗体設計をタンパク質配列構造共設計問題として, 合理的性と機能性の両面から検討する。
そこで本研究では,有理構造と抗原への結合親和性の両方を有する抗体の生成を誘導する,直接エネルギーに基づく選好最適化を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:41:49 GMT)
SEA: Sparse Linear Attention with Estimated Attention Mask [51.2] 長い連続性は、注意操作の二次的な複雑さのために問題を引き起こす。
従来の研究は、注意行列をスパース化または線形に近似することで複雑さを低下させることを目的としていた。
推定アテンションマスクを用いたSparse linear attentionを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:04:05 GMT)
Visually Guided Generative Text-Layout Pre-training for Document Intelligence [51.1] 視覚誘導型生成テキスト事前学習(ViTLP)を提案する。
文書画像が与えられた場合、モデルは階層言語とレイアウトモデリングの目的を最適化し、インターリーブされたテキストとレイアウトシーケンスを生成する。
ViTLPは、文書画像のテキストをローカライズし、認識するためのネイティブなOCRモデルとして機能する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:00:43 GMT)
Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.1] 本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:54:41 GMT)
Enabling Uncertainty Estimation in Iterative Neural Networks [49.6] 本研究では,アンサンブルのような手法よりもはるかに低い計算コストで最先端の見積もりを提供する不確実性推定手法を開発する。
航空画像における道路検出と2次元および3次元形状の空力特性の推定という2つの応用領域に組み込むことで,その実用的価値を実証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:06:31 GMT)
Deep Reinforcement Learning and Mean-Variance Strategies for Responsible Portfolio Optimization [49.4] 本研究では,ESG状態と目的を取り入れたポートフォリオ最適化のための深層強化学習について検討する。
以上の結果から,ポートフォリオアロケーションに対する平均分散アプローチに対して,深層強化学習政策が競争力を発揮する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:04:03 GMT)
Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.4] No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:27:57 GMT)
OFA: A Framework of Initializing Unseen Subword Embeddings for Efficient Large-scale Multilingual Continued Pretraining [49.2] 言語モデルをスクラッチから事前学習する代わりに、既存の事前学習言語モデル(PLM)を語彙拡張と継続事前学習を通じて新しい言語に適応させることがより効率的な方法である。
我々は、新しいフレームワークを提案する: $textbfO$ne $textbfF$or $textbfA$ll。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:49:53 GMT)
LOTUS: Evasive and Resilient Backdoor Attacks through Sub-Partitioning [49.2] バックドア攻撃は、ディープラーニングアプリケーションに重大なセキュリティ脅威をもたらす。
近年の研究では、特殊な変換機能によって作られたサンプル特異的に見えないトリガーを用いた攻撃が導入されている。
我々は、回避性とレジリエンスの両方に対処するために、新しいバックドアアタックLOTUSを導入する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:01:29 GMT)
VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.2] ポースグラフ最適化手法を拡張する新しい手法を提案する。
我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。
我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:47:03 GMT)
LongHeads: Multi-Head Attention is Secretly a Long Context Processor [49.2] LongHeadsは、大規模な言語モデルの長いコンテキスト能力を強化する、トレーニング不要のフレームワークである。
それぞれの頭が全文に参加できるようにする代わりに、各頭がコンテキストチャンクを選択して参加することで、分配長を処理できるようにします。
LongHeadsは、パスキー検索タスクにおいて、128kの長さで100%精度を達成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:50:32 GMT)
SynFog: A Photo-realistic Synthetic Fog Dataset based on End-to-end Imaging Simulation for Advancing Real-World Defogging in Autonomous Driving [48.3] フォトリアリスティックな霧画像を生成するために,エンド・ツー・エンドのシミュレーションパイプラインを導入する。
我々は、スカイライトとアクティブな照明条件の両方を特徴とするSynFogという新しい合成霧データセットを提案する。
実験の結果,SynFogで訓練したモデルでは,視覚知覚と検出精度が優れていた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:32:41 GMT)
Few-shot Named Entity Recognition via Superposition Concept Discrimination [47.9] Few-shot NERは、限られた数のイラストレーターインスタンスでターゲット型のエンティティを識別することを目的としている。
本稿では,上述の課題を能動的学習パラダイムを用いて解決する重ね合わせ概念判別器(SuperCD)を提案する。
実験の結果、SuperCDはイラストレーターインスタンスから重ね合わせの概念を効果的に識別し、大規模コーパスから重ね合わせインスタンスを検索し、最小限の追加努力で数発のNER性能を大幅に改善できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:45:09 GMT)
Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.8] 現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:48:40 GMT)
ReAct Meets ActRe: Autonomous Annotation of Agent Trajectories for Contrastive Self-Training [47.4] A$3$TはAutonomousを実現するフレームワークである。
法律の様式における代理人軌道の
AlfWorldでは、A$3$Tで訓練されたエージェントが1発成功率96%、100%成功率4回を達成している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:45:35 GMT)
Towards Human-AI Deliberation: Design and Evaluation of LLM-Empowered Deliberative AI for AI-Assisted Decision-Making [47.3] AIによる意思決定において、人間はしばしばAIの提案を受動的にレビューし、それを受け入れるか拒否するかを決定する。
意思決定における人間-AIの意見の対立に関する議論と人間のリフレクションを促進する新しい枠組みであるHuman-AI Deliberationを提案する。
人間の熟考の理論に基づいて、この枠組みは人間とAIを次元レベルの意見の引用、熟考的議論、意思決定の更新に携わる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:34:06 GMT)
Self-Adaptive Reality-Guided Diffusion for Artifact-Free Super-Resolution [47.3] アーティファクトフリー・スーパーレゾリューション(SR)は、低解像度画像を、オリジナルコンテンツの厳密な整合性のある高解像度画像に変換することを目的としている。
従来の拡散型SR技術は反復的な手順でアーティファクトを導入する傾向にある。
本稿では,自己適応型現実誘導拡散(Self-Adaptive Reality-Guided Diffusion)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:29:19 GMT)
HPL-ESS: Hybrid Pseudo-Labeling for Unsupervised Event-based Semantic Segmentation [47.3] 本稿では,教師なしイベントベースセマンティックセマンティックセグメンテーション(HPL-ESS)のためのハイブリッド擬似ラベルフレームワークを提案する。
提案手法は,DSEC-Semanticデータセットにおいて,既存の最先端手法よりも高い性能を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:02:33 GMT)
MambaIR: A Simple Baseline for Image Restoration with State-Space Model [46.8] 我々は,バニラ・マンバを改善するために,局部増強とチャンネルアテンションを導入するMambaIRを紹介した。
本手法は,画像SR上でSwinIRを最大0.45dB向上させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:27:26 GMT)
URS-NeRF: Unordered Rolling Shutter Bundle Adjustment for Neural Radiance Fields [46.2] ニューラルレイディアンスフィールド(NeRF)のための新しいローリングシャッター束調整法を提案する。
我々は、無秩序なローリングシャッター(RS)画像を用いて、暗黙の3D表現を得る。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:08:14 GMT)
Discrete Latent Graph Generative Modeling with Diffusion Bridges [44.9] GLADを潜在空間グラフ生成モデルとして提示する。
従来のラテント空間グラフ生成モデルとは異なり、GLADは離散ラテント空間で動作する。
GLADは競争性能を持つ最初の潜在空間グラフ生成モデルであることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:53:32 GMT)
Understanding Long Videos in One Multimodal Language Model Pass [44.8] LLM(Large Language Models)は、世界の知識を強く認識することで知られる。
自己回帰 LLM における高速な推論を実現する手法である Likelihood Selection を提案する。
得られたMultimodal Video Understandingフレームワークは、長ビデオおよびきめ細かいアクション認識ベンチマークにおける最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:09 GMT)
Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment [44.2] ビデオシーケンスは、アクションの速度、時間的位置、主題のポーズの顕著な変化(望ましくない効果)を示す。
本稿では,シーケンス対に対する共用tEmporalとcAmera viewpoiNt alIgnmEnt(JEANIE)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:30:37 GMT)
DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization [43.7] Source-Free Domain Generalizationは、ソースドメインに頼ることなく、未確認のターゲットドメインに対して機能するモデルを開発することを目的としている。
最近の研究であるPromptStylerは、共同視覚言語空間における異なる分布シフトをシミュレートするためにテキストプロンプトを使用している。
本稿では,動的PromptStyler(DPStyler)について紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:31:01 GMT)
Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback [43.5] 本稿では,RLHFに適したシステム実装であるUni-RLHFを紹介する。
Uni-RLHFには,1)ユニバーサルなマルチフィードバックアノテーションプラットフォーム,2)大規模なクラウドソースフィードバックデータセット,3)モジュール化されたオフラインRLHFベースライン実装の3つのパッケージが含まれている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:20:46 GMT)
CADTalk: An Algorithm and Benchmark for Semantic Commenting of CAD Programs [43.4] 本稿では,CADプログラムのセマンティックコメント問題を紹介する。
目標は、入力プログラムを意味論的に意味のある形状の部分に対応するコードブロックに分割することである。
プログラム解析とビジュアル・セマンティック・アナリティクスを組み合わせることでこの問題を解決する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:03:41 GMT)
CLHA: A Simple yet Effective Contrastive Learning Framework for Human Alignment [42.7] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好を整合させる重要な手法である。
本稿では,LLMと人間の嗜好を直接整合させるために,CLHA(Contrastive Learning Framework for Human Alignment)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:37:15 GMT)
Mask Grounding for Referring Image Segmentation [42.7] Referring Image(RIS)は、自由形式の言語表現によって参照されるオブジェクトをセグメントするアルゴリズムを必要とする難しいタスクである。
最先端のSOTA(State-of-the-art)手法の多くは、画素やワードレベルでの言語・画像のモダリティのギャップを被っている。
本稿では,言語機能内の視覚的グラウンド化を大幅に改善する,新しいマスクグラウンド化補助タスクを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:04:04 GMT)
DreamLIP: Language-Image Pre-training with Long Captions [42.4] MLLM(Multi-modality Large Language Model)を用いた詳細な記述を伴う30M画像の再キャプチャ
そこで本研究では,テキストラベルからサブキャプションを動的にサンプリングし,複数の正のペアを構築することを提案する。
画像テキスト検索とセマンティックセグメンテーションのタスクでは,30万のイメージテキストペアでトレーニングしたモデルが,4億のペアでトレーニングしたCLIPよりも同等あるいはそれ以上のパフォーマンスを実現している点が注目に値する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:42 GMT)
Graph Protection under Multiple Simultaneous Attacks: A Heuristic Approach [41.9] この研究は、グラフを用いてモデル化されたネットワークのノードに対する同時攻撃から保護するための効果的なメタヒューリスティックなアプローチの開発に焦点を当てる。
具体的には、グラフ上のよく知られたローマ支配問題の一般化である$k$-strong Roman支配問題に焦点を当てる。
本稿では,準実現可能性の概念を導入して,その実現可能性を確認する可変近傍探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:46:13 GMT)
CRS-Diff: Controllable Generative Remote Sensing Foundation Model [41.7] 本稿では,リモートセンシング画像の生成に適した拡散モデリングフレームワークであるCRS-Diffを提案する。
このモデルはグローバルな制御入力とローカルな制御入力を統合し、生成条件を正確に組み合わせて生成プロセスを洗練させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:23:07 GMT)
BiTT: Bi-directional Texture Reconstruction of Interacting Two Hands from a Single Image [41.5] BiTTは、2つの相互作用する手の位置を再現し、面白く、ポーズのないテクスチャを再構築するための、最初のエンドツーエンドのトレーニング方法である。
In experiment using InterHand2.6M and RGB2Hands datasets, we method significantlyforms state-of-the-the-art hand texture reconstruction method。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:29:52 GMT)
MiLe Loss: a New Loss for Mitigating the Bias of Learning Difficulties in Generative Language Models [41.0] トークンによる学習難易度を緩和するMiLe Loss関数を提案する。
我々は468M,1.2B,6.7Bパラメータの異なるスケールで生成言語モデルを訓練する。
実験により、提案されたMiLe Lossを組み込んだモデルが下流ベンチマークで一貫したパフォーマンス向上を達成できることが明らかになった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:46:58 GMT)
Visual CoT: Unleashing Chain-of-Thought Reasoning in Multi-Modal Language Models [41.0] 本稿では,マルチモーダル大規模言語モデル (MLLM) の推論機能を利用した新しいパイプラインである Visual CoT について述べる。
373k の質問応答対からなる Visual CoT データセットを収集,導入した。
実験では、我々のフレームワークの有効性を実証し、より良い推論戦略に光を当てました。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:23 GMT)
Accelerating Federated Learning by Selecting Beneficial Herd of Local Gradients [40.8] Federated Learning (FL) は、通信ネットワークシステムにおける分散機械学習フレームワークである。
非独立分散(Non-IID)データは、大域モデルの収束効率に悪影響を及ぼす。
FLモデルの収束を加速するために,局所勾配の有利な群を選別するBHerd戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:16:59 GMT)
Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing [40.7] 本稿では,マルチモーダルなファッション画像編集の課題に取り組む。
本研究の目的は,テキスト,人体ポーズ,衣料品スケッチ,布地テクスチャなど,マルチモーダルなプロンプトでガイドされた人中心のファッションイメージを作成することである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:12:46 GMT)
Nonlinear dynamics as a ground-state solution on quantum computers [39.6] 量子ビットレジスタにおける空間と時間の両方を符号化する変分量子アルゴリズム(VQA)を提案する。
時空符号化により、1つの基底状態計算から全時間進化を得ることができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:06:18 GMT)
A Quantum Theory of Temporally Mismatched Homodyne Measurements with Applications to Optical Frequency Comb Metrology [39.6] 任意のモード重なりを持つホモダイン検出のための測定演算子を導出する。
これらの演算子は周波数コム干渉法を幅広いシナリオに拡張する基盤を確立する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:27:25 GMT)
QKFormer: Hierarchical Spiking Transformer using Q-K Attention [39.6] スパイキングトランスフォーマーは、スパイキングニューラルネットワーク(SNN)とトランスフォーマーアーキテクチャを統合する。
既存のモデルの性能を改善するために、いくつかの革新を紹介します。
直接学習によるQ-K注意に基づく階層型スパイキングトランスであるQKFormerを開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:57:27 GMT)
Dispersed Structured Light for Hyperspectral 3D Imaging [39.2] 分散構造光(DSL)は、高精度なハイパースペクトル3次元イメージングのためのコスト効率が高くコンパクトな方法である。
DSLは18.8nmの半ミリのスペクトル精度と1mmの深さ誤差を達成している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:34:58 GMT)
Universal NER: A Gold-Standard Multilingual Named Entity Recognition Benchmark [39.0] オープンなコミュニティ主導プロジェクトであるUniversal NER(UNER)を紹介し,多くの言語でゴールドスタンダードなNERベンチマークを開発する。
UNER v1には、12の異なる言語にまたがる言語間一貫性のあるスキーマで、名前付きエンティティで注釈付けされた18のデータセットが含まれている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:14:35 GMT)
Make-It-Vivid: Dressing Your Animatable Biped Cartoon Characters from Text [38.6] 入力命令に基づく漫画文字の自動テクスチャ設計に着目する。
これはドメイン固有の要件と高品質なデータの欠如にとって難しい。
UVテキストから高品質なテクスチャ生成を可能にする最初の試みとして,Make-ItViviを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:08:04 GMT)
MEDPSeg: Hierarchical polymorphic multitask learning for the segmentation of ground-glass opacities, consolidation, and pulmonary structures on computed tomography [37.1] MEDPSegは階層型多形マルチタスク学習(HPML)を通して異種胸部CTターゲットから学習する
本稿では,GGOと統合セグメンテーションタスクの最先端性能を実現するPMLについて述べる。
さらに、MEDPSegは肺発作、気道、肺動脈、肺病変の分節を同時に行う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:52:15 GMT)
Dyna-LfLH: Learning Agile Navigation in Dynamic Environments from Learned Hallucination [37.1] 本稿では,地上ロボットが動的障害物を伴って環境をナビゲートするための運動プランナを安全に学習するための自己指導型学習手法を提案する。
新たに開発したDynamic Learning from Learned Hallucination (Dyna-LfLH)では,新しい潜伏分布の設計と学習を行い,そこから動的障害を抽出する。
Dyna-LfLHは、シミュレーションされた環境と物理的環境の両方において地上ロボット上で評価され、ベースラインと比較して最大25%高い成功率を達成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:17:51 GMT)
RadioGAT: A Joint Model-based and Data-driven Framework for Multi-band Radiomap Reconstruction via Graph Attention Networks [36.8] マルチバンド無線マップ再構成(MB-RMR)は、スペクトル管理やネットワーク計画といったタスクのための無線通信において重要な要素である。
シミュレーションデータに大きく依存する従来の機械学習ベースのMB-RMRメソッドは、重要なデプロイメント課題に直面している。
本研究では,単一領域におけるMB-RMRに適したグラフ注意ネットワーク(GAT)に基づく新しいフレームワークであるRadioGATを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:23:10 GMT)
A Survey on Long Video Generation: Challenges, Methods, and Prospects [36.6] 本稿では,近年の長編ビデオ生成の進歩に関する最初の調査について述べる。
それらを2つの重要なパラダイム、すなわち時間的自己回帰の分割と征服にまとめる。
本稿では,長期ビデオ生成研究の進展に欠かせないデータセットと評価指標の包括的概要と分類について述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:47:53 GMT)
VoiceCraft: Zero-Shot Speech Editing and Text-to-Speech in the Wild [36.3] 本稿では,音声編集とゼロショット音声タスクの両方で最先端のパフォーマンスを実現する,トークンを埋め込んだニューラルネットワークモデルであるVoiceCraftを紹介する。
音声編集タスクでは、ボイスクラフトは自然性の観点から未編集の録音とほとんど区別できない編集された音声を生成する。
ゼロショットTSでは、VALLEや一般的な商用モデルであるXTTS-v2など、従来のSotAモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:38:32 GMT)
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models [35.9] 大規模マルチモーダルモデル(LMM)は、視覚エンコーダと大規模言語モデルとを接続することで、重要な推論能力を示している。
近年のLMMには、高解像度の画像やビデオなど、より複雑な視覚入力が組み込まれており、視覚トークンの数が大幅に増加する。
そこで我々はPruMergeを提案する。PruMergeは適応型視覚トークン削減手法で、比較モデルの性能を維持しながら、視覚トークンの数を大幅に削減する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:55 GMT)
W-HMR: Human Mesh Recovery in World Space with Weak-supervised Camera Calibration and Orientation Correction [35.4] 我々は,W-HMRを提案する。W-HMRは,大域的な身体回復をカメラキャリブレーション,局所的な身体回復,大域的な身体配向補正に分解する。
我々は、焦点距離ラベルへの依存をなくし、身体歪みを補正する第1の弱教師付きカメラキャリブレーション法を設計する。
本研究では,再建された人体が世界空間で正常に保たれるような新しい配向補正モジュールを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:21:39 GMT)
Investigating and Mitigating the Side Effects of Noisy Views for Self-Supervised Clustering Algorithms in Practical Multi-View Scenarios [35.3] マルチビュークラスタリング(MVC)は,マルチビューデータのカテゴリ構造を自己管理的に探索することを目的としている。
ノイズの多いビューは、実際のマルチビューシナリオでビューがノイズの多いときに、深刻な縮退する可能性がある。
この問題に対処するために理論的に基礎をおくディープMVC法(別名MVCAN)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:20:02 GMT)
InstUPR : Instruction-based Unsupervised Passage Reranking with Large Language Models [35.1] InstUPRは、大規模言語モデル(LLM)に基づく教師なしパスのランク付け手法である。
ソフトスコアアグリゲーション手法を導入し、教師なしパスの再ランクにペアワイズ・リランクを採用する。
BEIRベンチマークの実験では、InstUPRは教師なしベースラインと命令調整されたリランカよりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:31:22 GMT)
A Poincaré Inequality and Consistency Results for Signal Sampling on Large Graphs [35.0] グラフ制限の一種であるグラフオンに対する信号サンプリング理論を導入する。
収束グラフ列上の一意なサンプリング集合は、グラフオン上の一意なサンプリング集合に収束することを示す。
そこで我々は,大規模グラフに対する関連するグラフ信号サンプリングアルゴリズムを提案し,グラフ機械学習タスクにおいて,その優れた経験的性能を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:05:04 GMT)
Early Neuron Alignment in Two-layer ReLU Networks with Small Initialization [34.8] 入力ベクトルを適切に分離したトレーニングデータセットについて検討する。
同じラベルを持つ任意の入力データは正に相関し、異なるラベルを持つ任意のペアは負に相関する。
我々の分析は、トレーニングの初期段階において、第1層のニューロンが正のデータまたは負のデータと整合しようとすることを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:48:55 GMT)
DiffusionAct: Controllable Diffusion Autoencoder for One-shot Face Reenactment [34.8] ビデオ駆動型ニューラルフェイスの再現は、元の顔のアイデンティティと外観をうまく保存する現実的な顔画像を合成することを目的としている。
拡散確率モデル(DPM)の最近の進歩は、高品質な現実画像の生成を可能にする。
本稿では,拡散モデルのフォトリアリスティック画像生成を利用して,ニューラルフェイスの再現を行う新しい手法であるDiffusionを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:46:53 GMT)
Synthetic Data Generation and Joint Learning for Robust Code-Mixed Translation [34.6] 我々は、英語機械翻訳にコード混在(ヒングリッシュとベンガル語)の問題に取り組む。
実世界のコードミキシングテキストのノイズ処理を学習する,頑健な摂動に基づく共同学習モデルRCMTを提案する。
提案手法の評価と総合解析により,最先端のコード混合・ロバスト翻訳法よりもRCMTの方が優れていることが示された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:50:11 GMT)
Counterfactual Learning on Graphs: A Survey [34.5] グラフニューラルネットワーク(GNN)は,グラフ上での表現学習において大きな成功を収めている。
グラフ上のカウンターファクトラーニングは、これらの欠点を緩和する有望な結果を示している。
グラフ上の反ファクトフェアネス、説明可能性、リンク予測など、様々な手法が提案されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:55:36 GMT)
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity [34.4] CrossQはサンプル効率の点で現在の最先端の手法と一致または超えている。
これはREDQやDroQに比べて計算コストを大幅に削減する。
SAC上にわずか数行のコードを必要とするため、実装が容易である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:20:18 GMT)
RU22Fact: Optimizing Evidence for Multilingual Explainable Fact-Checking on Russia-Ukraine Conflict [34.3] 高品質な証拠は、ファクトチェックシステムを強化する上で重要な役割を担っている。
本稿では,Webから証拠を自動的に抽出・要約する大規模言語モデルを提案する。
RU22Factは、ロシアとウクライナの紛争に関する説明可能な事実チェックデータセットであり、16Kサンプルのうち2022年に構築された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:56:29 GMT)
Learning Disentangled Identifiers for Action-Customized Text-to-Image Generation [34.1] 本研究では,テキスト・ツー・イメージ(T2I)生成における新しいタスク,すなわちアクション・カスタマイズに焦点を当てた。
この課題の目的は、限られたデータから既存の行動を学び、それを見えない人間や動物に一般化することである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:17:31 GMT)
Unsupervised Template-assisted Point Cloud Shape Correspondence Network [33.6] 教師なしの点雲形状対応は、ソースとターゲットの点雲の間の点幅対応を確立することを目的としている。
非剛体物体は強い変形性と特異な形状を有しており、点雲間の対応を直接確立することが長年の課題である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:14:07 GMT)
Make-Your-Anchor: A Diffusion-based 2D Avatar Generation Framework [33.5] Make-Your-Anchorは、トレーニングのために個人の1分間のビデオクリップだけを必要とするシステムである。
入力ビデオ上に構造誘導拡散モデルを用いて3次元メッシュ条件を人間の外見に表現する。
出力ビデオにおける顔領域の視覚的品質を改善するために、新しい識別特異的顔強調モジュールが導入された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:54:18 GMT)
Attribute First, then Generate: Locally-attributable Grounded Text Generation [33.4] 本稿では,簡潔な属性を優先する局所帰属型テキスト生成手法を提案する。
我々の手法はAttribute First, then Generate' と呼ばれ、従来のエンドツーエンド生成プロセスを3つの直感的なステップに分解する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:41:47 GMT)
Semantic Ranking for Automated Adversarial Technique Annotation in Security Text [33.3] 本稿では,脅威知能テキストから構造化された脅威行動を抽出する新しい手法を提案する。
提案手法は,効率と効率性を最適化する多段階ランキングアーキテクチャに基づく。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:03:58 GMT)
CodeS: Natural Language to Code Repository via Multi-Layer Sketch [33.3] コードリポジトリ(NL2Repo)に自然言語という新しいソフトウェアエンジニアリングタスクを導入する。
このタスクは、自然言語要求からコードリポジトリ全体を生成することを目的としている。
多層スケッチによりNL2Repoを複数のサブタスクに分解する,シンプルで効果的なフレームワークCodeSを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:09:55 GMT)
Demonstrating efficient and robust bosonic state reconstruction via optimized excitation counting [33.1] 励起数サンプリング(ORENS)に基づく効率的でロバストな再構成手法を提案する。
我々の研究は、ボソニックモードを用いた実用的な量子情報処理のための重要かつ価値のあるプリミティブを提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:13:28 GMT)
RCBEVDet: Radar-camera Fusion in Bird's Eye View for 3D Object Detection [33.1] 3次元物体検出は、自律運転における重要なタスクの1つである。
カメラのみに頼って高度に正確で頑丈な3Dオブジェクト検出を実現するのは難しい。
鳥眼ビュー(BEV)におけるレーダーカメラ融合3次元物体検出法
RadarBEVNetはデュアルストリームのレーダーバックボーンとRadar Cross-Section (RC)対応のBEVエンコーダで構成されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:02:05 GMT)
Point-DETR3D: Leveraging Imagery Data with Spatial Point Prior for Weakly Semi-supervised 3D Object Detection [32.9] 本稿では,弱半教師付き3D検出のための教師支援フレームワークであるPoint-DETR3Dを紹介する。
ラベル付きデータの5%しか持たないPoint-DETR3Dは、完全な教師付きデータのパフォーマンスを90%以上達成している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:45:41 GMT)
MMA-Diffusion: MultiModal Attack on Diffusion Models [32.7] MMA-Diffusionは、T2Iモデルのセキュリティに顕著で現実的な脅威をもたらす。
オープンソースモデルと商用オンラインサービスの両方において、現在の防御措置を回避している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:55:03 GMT)
New Intent Discovery with Attracting and Dispersing Prototype [32.6] New Intent Discovery (NID)は、ラベル付きと大規模にラベル付けされていないデータの助けを借りて、新しい意図のカテゴリを認識し、推論することを目的としている。
本稿では,ロバスト・適応型学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:31:55 GMT)
DOrA: 3D Visual Grounding with Order-Aware Referring [32.0] 3Dビジュアルグラウンドティングは、自然言語記述によって参照される3Dポイントクラウドシーン内でターゲットオブジェクトを特定することを目的としている。
本稿では,DOrAについて紹介する。DOrAは,オーダー・アウェアが参照する新しい3次元視覚基盤フレームワークである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:31:14 GMT)
Who is bragging more online? A large scale analysis of bragging in social media [31.8] 本稿では,Twitter(米国)におけるブラッグ行動の大規模研究を行うために,計算社会言語学的手法を用いる。
本研究は,同一利用者内でのブラッグの頻度が時間の経過とともに低下していることを示す。
さらに、米国の若い、より教育を受け、人気のあるユーザーは、より自慢する傾向にある。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:07:21 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.8] SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、形状の平滑化、彩度の過飽和、結果の多様性の制限、収束の遅さといった課題に取り組む。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:24:45 GMT)
CacheGen: KV Cache Compression and Streaming for Fast Language Model Serving [31.8] CacheGenは、大きな言語モデル(LLM)のための高速なコンテキストローディングモジュールである
KVキャッシュを符号化/復号のオーバーヘッドを無視して、よりコンパクトなビットストリーム表現にエンコードする。
ストリーミング戦略を適用して、利用可能な帯域幅の変化に対処する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:49:18 GMT)
Provably Robust Score-Based Diffusion Posterior Sampling for Plug-and-Play Image Reconstruction [31.5] 科学と工学において、ゴールは、既知のフォワードモデルから収集された少数の測定値から未知の画像を推測することである。
スコアベースの拡散モデルは、その印象的な経験的成功により、画像に現れる表現の正規候補として現れている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:58:26 GMT)
MetaAligner: Conditional Weak-to-Strong Correction for Generalizable Multi-Objective Alignment of Language Models [31.5] 実験結果から,MetaAlignerは最大63倍のパラメータを持つ11のポリシーモデルに対して,多目的アライメントにおける有意かつバランスの取れた改善を実現していることがわかった。
このモデルはまた、目に見えない目的と正確に一致し、一般化可能な多目的の選好アライメントへの第一歩をマークしている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:28:10 GMT)
Training Generative Adversarial Network-Based Vocoder with Limited Data Using Augmentation-Conditional Discriminator [31.0] GAN(Generative Adversarial Network)ベースのボコーダは、その高速で軽量で高品質な特徴から、音声合成に一般的に用いられている。
本稿では,音声に加え,拡張状態を入力として受信する拡張条件判別器(AugCondD)を提案する。
実験結果から,AugCondDは十分なデータ条件下では同等の音声品質を達成しつつ,限られたデータ条件下での音声品質を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:46:27 GMT)
Graph Augmentation for Recommendation [30.8] コントラスト学習によるグラフ強化はレコメンデーションシステム分野において大きな注目を集めている。
本稿では,自己教師付き信号を生成し,レコメンダシステムを強化したGraphAugというフレームワークを提案する。
GraphAugフレームワークはグラフ情報ボトルネック(GIB)の正規化拡張パラダイムを取り入れており、情報的自己超越情報を自動で抽出する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:47:53 GMT)
A gate tunable transmon qubit in planar Ge [30.4] 半導体ジョセフソン接合を用いたゲート可変トランスモン(ゲートモン)は、ハイブリッド量子回路のビルディングブロックとして出現している。
我々は平面ゲルマニウムで作られた門門を提示する。
共振器と2トーン分光器を併用した広周波数帯における量子ビット可変性を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:52:05 GMT)
Do LLM Agents Have Regret? A Case Study in Online Learning and Games [30.4] 大規模言語モデル(LLM)は(対話的な)意思決定にますます採用されている。
オンライン学習とゲーム理論のベンチマーク決定設定において,それらの相互作用について検討する。
本稿では,教師付きプレトレーニングの損失とは対照的に,教師付き行動のラベルを必要としない新しいインフントレーニングの損失を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:04:11 GMT)
Producing and Leveraging Online Map Uncertainty in Trajectory Prediction [30.2] 我々は、現在最先端のオンラインマップ推定手法を拡張し、不確実性をさらに見積もる。
その結果,不確実性の導入によってトレーニングの収束が最大50%速くなり,予測性能が最大15%向上することがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:58:33 GMT)
Model-less Is the Best Model: Generating Pure Code Implementations to Replace On-Device DL Models [29.6] ディープラーニング(DL)モデルは、攻撃者によって現実世界のアプリケーションやデバイスから容易に抽出でき、敵攻撃のようなさまざまな攻撃を生成することができる。
従来のソフトウェア保護技術は広く研究されており、デバイス上のモデルがC++のような純粋なコードを使って実装できれば、既存のソフトウェア保護テクニックを再利用する可能性が開ける。
デバイス上のモデル情報を自動的に抽出し,広範囲のDLモデルに対してカスタマイズ可能なプログラムを合成する新しい方法であるCustomDLCoderを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:06:53 GMT)
When your Cousin has the Right Connections: Unsupervised Bilingual Lexicon Induction for Related Data-Imbalanced Languages [29.3] 非教師付きバイリンガルレキシコン誘導は、大規模なデータセットが利用できない低リソース言語にとって最も有用である。
文献における最先端のBLI手法は,データ不均衡な言語ペアに対してほぼゼロに近い性能を示す。
本稿では,関連するLRLとHRLの間には,HRLのマスキング言語モデルに対してのみ推論を必要とする,教師なしBLIの新たな手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:51:40 GMT)
Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler Feedback [29.1] 大規模言語モデル(LLM)は、コードの自動生成において顕著な進歩を示している。
しかし、LLMベースのコード生成を実際のソフトウェアプロジェクトに組み込むことが課題となっている。
本稿では,プロジェクトレベルのコードコンテキストを反復的に洗練するProCoderという新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:07:27 GMT)
Extracting Social Support and Social Isolation Information from Clinical Psychiatry Notes: Comparing a Rule-based NLP System and a Large Language Model [28.8] 社会的支援と社会的孤立は健康の社会的決定要因である。
マウント・シナイ・ヘルス・システムとウェル・コーネル・メディカルの精神医学的出会いノートに注釈が付され、ゴールド・スタンダード・コーパスが確立された。
FLAN-T5-XLを用いたレキシコンと大規模言語モデル(LLM)を用いたルールベースシステム(RBS)を開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:19:50 GMT)
On the Intersection of Signal Processing and Machine Learning: A Use Case-Driven Analysis Approach [28.6] この研究は、アプリケーションに依存しないレビューを提供し、特徴抽出技術のための新しい分類分類を導入している。
理論的概念と実践的応用を結びつけることを目的としており、2つの特定のユースケースを通じてこれを実証している。
理論的貢献に加えて、この研究は、関連するPythonおよびPythonベースの信号処理コードの公開リポジトリを提供することで、共同研究文化を促進する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:47:10 GMT)
FlashEval: Towards Fast and Accurate Evaluation of Text-to-image Diffusion Generative Models [28.4] テキストから画像への生成モデルの評価は、開発プロセスにおける重要なステップである。
データ選択の評価に適した反復探索アルゴリズムであるFlashEvalを提案する。
検索した50-itemサブセットは,COCOアノテーションのランダムサンプリング500-itemサブセットに匹敵する評価精度が得られた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:53:32 GMT)
Towards Precise 3D Human Pose Estimation with Multi-Perspective Spatial-Temporal Relational Transformers [28.4] 人間のポーズ検出のための3次元シーケンス・ツー・シーケンス(seq2seq)フレームワークを提案する。
まず、空間モジュールは人物のポーズ特徴を画像内コンテンツで表現し、フレーム・イメージ関係モジュールは時間的関係を抽出する。
提案手法は,一般的な3次元ポーズ検出データセットであるHuman3.6Mを用いて評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:33:51 GMT)
Self-Supervised Learning for Medical Image Data with Anatomy-Oriented Imaging Planes [28.3] 医用画像データに対する2つの補完的前提課題を提案する。
1つ目は、画像平面間の相対的な向きを学習し、交差する線を後退させるように実装することである。
2つ目は、平行イメージングプレーンを利用して、スタック内の相対的なスライス位置を後退させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:34:06 GMT)
A note on generalization bounds for losses with finite moments [28.1] 本論文は,有界分散を有する損失に対して高確率PAC-Bayesを導出する。
結果は、期待と単線PAC-Bayesの保証にまで拡張される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:15:55 GMT)
Othering and low status framing of immigrant cuisines in US restaurant reviews and large language models [27.9] 移民料理は、社会的に構築された真正さの枠組みにより、異質になりがちである。
非ヨーロッパ料理は、価格を抑えつつも、安価で汚いと表現されることが多い。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:52:34 GMT)
Towards Algorithmic Fidelity: Mental Health Representation across Demographics in Synthetic vs. Human-generated Data [27.1] HEADROOMは,抑うつ性ストレス因子に関する3,120のポストからなる合成データセットである。
本研究は,各人口集団の主ストレス要因を特定するために,意味的および語彙的分析を行う。
本稿では,GPT-3を用いた抑うつデータ作成のためのクエリ生成手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:21:25 GMT)
Ontology Completion with Natural Language Inference and Concept Embeddings: An Analysis [26.9] 本研究では,特定のオントロジーから欠落する有能な知識の発見という課題を,よく研究された分類学拡張タスクの一般化として考察する。
1行の作業は、このタスクを自然言語推論(NLI)問題として扱い、不足した知識を特定するために言語モデルによって取得された知識に依存します。
別の研究の行では、概念埋め込みを使用して、カテゴリベースの帰納のための認知モデルからインスピレーションを得て、異なる概念が共通しているものを特定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:46:35 GMT)
Text-IF: Leveraging Semantic Text Guidance for Degradation-Aware and Interactive Image Fusion [26.8] そこで本研究では,テキストIF(Text-IF)と呼ばれる画像融合タスクにおいて,意味的テキスト誘導画像融合モデルを活用する新しい手法を提案する。
テキストIFは、オールインワンの赤外線および可視画像劣化認識処理およびインタラクティブなフレキシブル融合結果にアクセスできる。
このように、Text-IFはマルチモーダル画像融合だけでなく、マルチモーダル情報融合も実現している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:06:45 GMT)
UrbanVLP: A Multi-Granularity Vision-Language Pre-Trained Foundation Model for Urban Indicator Prediction [26.7] 都市指標予測は、データ駆動手法を用いて、多様な都市景観における社会経済指標を推定することを目的としている。
事前訓練されたモデル、特に衛星画像に依存しているモデルは、二重課題に直面している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:57:18 GMT)
Animal Avatars: Reconstructing Animatable 3D Animals from Casual Videos [26.7] モノクロビデオからアニマタブルな犬用アバターを構築する方法を提案する。
動物は様々な(予測不可能な)非剛体運動を示し、外観の詳細を持っているため、これは難しい。
我々は,動物のポーズの変化と外観を共同で解決する4Dソリューションを用いて,映像フレームをリンクする手法を開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:41:43 GMT)
Domain Adaptive Detection of MAVs: A Benchmark and Noise Suppression Network [26.3] MAV検出の方法は、トレーニングセットとテストセットが同じ分布を持つと仮定する。
提案したデータセットに基づいて,クロスドメインMAV検出のための新しいベンチマークを提案する。
擬似ラベルの枠組みと大規模から小規模の訓練手順に基づく騒音抑制ネットワーク(NSN)
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:07:24 GMT)
Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation [25.9] 本稿では,都市知識伝達を伴う複雑な数ショット学習のための新しい生成事前学習フレームワークであるGPDを提案する。
我々は、プロンプトで導かれる調整されたニューラルネットワークを生成する生成拡散モデルを再放送する。
GPDは、トラフィック速度予測やクラウドフロー予測といったタスクのデータセットにおける最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:39:57 GMT)
LEOD: Label-Efficient Object Detection for Event Cameras [25.8] イベントカメラによるオブジェクト検出は、センサーの低レイテンシと高ダイナミックレンジの恩恵を受ける。
時間分解能が高いため、教師付きトレーニングのためにイベントストリームを完全にラベル付けするのはコストがかかる。
本稿では,ラベル効率の高いイベントベース検出手法LEODを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:05:04 GMT)
Exploring the Adversarial Capabilities of Large Language Models [25.8] 大きな言語モデル(LLM)は、良心的なサンプルから敵の例を作れば、既存の安全なレールを騙すことができる。
我々の実験は、ヘイトスピーチ検出に焦点をあて、LLMが敵の摂動を見つけることに成功し、ヘイトスピーチ検出システムを効果的に損なうことを示した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:46:02 GMT)
Mipha: A Comprehensive Overhaul of Multimodal Assistant with Small Language Models [25.7] マルチモーダル小言語モデル(Multimodal Small Language Models, MLM)の設計側面について検討し, Mipha という名前の効率的なマルチモーダルアシスタントを提案する。
私たちのMipha-3Bは、最先端の大規模MLLM、特にLLaVA-1.5-13Bを複数のベンチマークで上回ります。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:36:56 GMT)
Boosting Adversarial Transferability by Block Shuffle and Rotation [25.6] ブロックシャッフル・アンド・ローテーション(BSR)と呼ばれる新しい入力変換に基づく攻撃を提案する。
BSRは入力画像を複数のブロックに分割し、次にランダムにシャッフルし、これらのブロックを回転させ、勾配計算のための新しい画像群を構築する。
ImageNetデータセットの実験的評価により、BSRは既存の入力変換に基づく手法よりもはるかに優れた転送性が得られることが示された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:04:41 GMT)
Modelling Commonsense Commonalities with Multi-Facet Concept Embeddings [25.5] 概念埋め込みは興味のある性質を共有する概念を識別する。
標準埋め込みは基本的な分類学的カテゴリーを反映しており、より特定の側面を参照する共通点を見つけるのに適さない。
これは、より多様なコモンセンス特性をキャプチャし、下流タスクの結果を継続的に改善する埋め込みにつながることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:44:45 GMT)
Evaluating Large Language Models with Runtime Behavior of Program Execution [25.5] コードのための大規模な言語モデル(LLM)は、強力なコード理解と生成能力を示している。
コード推論は、コードLLMの最も重要な能力の1つである。
本稿では,コードの推論能力とLLMの整合性を評価するためのフレームワークであるRevalを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:37:16 GMT)
DreamPolisher: Towards High-Quality Text-to-3D Generation via Geometric Diffusion [25.4] 幾何学的ガイダンスを用いた新しいガウス分割法であるDreamPolisherを提案する。
我々は、テキスト記述から、横断的な一貫性と複雑な詳細を学びます。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:34:05 GMT)
Grounding Language Plans in Demonstrations Through Counterfactual Perturbations [25.2] 物理領域における大規模言語モデルの常識的推論を基礎づけることは、AIを具現化するための重要な問題でありながら未解決である。
提案手法は,2次元ナビゲーションによる模倣学習の解釈性と反応性を向上し,シミュレーションおよび実ロボット操作タスクを実現する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:04:59 GMT)
DISN: Deep Implicit Surface Network for High-quality Single-view 3D Reconstruction [24.9] シングルビュー画像から3次元形状を再構成することは、長年にわたる研究課題である。
2次元画像から高品質のディテールリッチな3Dメッシュを生成するディープインプリシト・サーフェス・ネットワークであるdisNを提案する。
我々の知る限りでは、DINは1枚の画像から3次元形状に存在する穴や細い構造などの細部を常にキャプチャする最初の方法である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:10:45 GMT)
Spike-NeRF: Neural Radiance Field Based On Spike Camera [24.8] スパイクデータから導出した最初のニューラルレーダランス場であるSpike-NeRFを提案する。
NeRFと同時に撮影されたマルチビュー画像の代わりに、Spike-NeRFの入力は、非常に短時間で動くスパイクカメラによってキャプチャされた連続的なスパイクストリームである。
その結果,Spike-NeRFは既存の手法や高速シーンで提案したベースラインよりも視覚的に魅力的な結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:05:23 GMT)
Causal Discovery from Poisson Branching Structural Causal Model Using High-Order Cumulant with Path Analysis [24.8] カウントデータの最も一般的な特徴の1つは、二項化演算子によって記述される固有の分岐構造である。
単一の因果対はマルコフ同値、すなわち$Xrightarrow Y$ と $Yrightarrow X$ は分散同値である。
本稿では,ポアソン分岐構造因果モデル(PB-SCM)を提案し,高次累積を用いたPB-SCMの経路解析を行う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:06:08 GMT)
Efficient Dataset Distillation via Minimax Diffusion [24.8] 本稿では,これらの基準を対象とする拡散過程の柔軟性を示す階層的拡散制御として,プロセスの理論モデルを提案する。
ImageWoofの100-IPC設定では,従来手法の蒸留時間は20分の1以下であったが,性能は向上した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:52:44 GMT)
Utilizing Synthetic Data in Supervised Learning for Robust 5-DoF Magnetic Marker Localization [24.5] 受動的磁気マーカーの追跡は、医療やロボット工学の進歩において重要な役割を担い、システムの精度と効率を大幅に向上させる可能性がある。
伝統的に、繰り返し最適化手順を必要とするため、磁気マーカーの追跡は計算コストがかかる。
本稿では,これらの制限を回避し,マーカーの位置と向きを直接推定し,磁石の5DoFを正確に決定する,新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:11:56 GMT)
Exploiting Priors from 3D Diffusion Models for RGB-Based One-Shot View Planning [24.4] 本稿では,拡散モデルの強力な3次元生成能力を先行として活用したワンショットビュー計画手法を提案する。
提案手法は, オブジェクト再構成の品質と移動コストのバランスが良好である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:21:49 GMT)
A Forward and Backward Compatible Framework for Few-shot Class-incremental Pill Recognition [24.2] 本稿では,最初の数発のクラスインクリメンタル・ピル認識フレームワークを紹介する。
前方互換と後方互換の学習コンポーネントを含んでいる。
実験の結果,我々のフレームワークは既存の最先端(SOTA)メソッドを超越していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:15:41 GMT)
Efficient Information Extraction in Few-Shot Relation Classification through Contrastive Representation Learning [24.0] 本稿では,複数文表現とコントラスト学習を組み合わせた情報抽出手法を提案する。
本手法では,これらの表現から相補的識別情報を抽出するために,コントラスト学習を用いる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:36:06 GMT)
Unveiling the Blind Spots: A Critical Examination of Fairness in Autonomous Driving Systems [23.5] 人口集団間で広く研究されている8つのディープラーニングに基づく歩行者検出器の公平性を評価する。
以上の結果から, 年齢にかかわる有意な公平性が示唆された。
このバイアスは、低明度と低コントラストに対して、子供や女性にとってさらに悪化する可能性がある。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:45:58 GMT)
Visual Whole-Body Control for Legged Loco-Manipulation [23.5] そこで本研究では,ロボットアームを用いた移動操作の問題点について検討する。
視覚的観察により全身制御を自律的に行うことのできる枠組みを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:26:08 GMT)
Effective Distillation of Table-based Reasoning Ability from LLMs [23.4] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクにおいて顕著な性能を示している。
その膨大なパラメータサイズと計算能力に対する非常に高い要求は、その実践的な展開に挑戦する。
近年の研究では、LLMの特定の機能、例えば数値的推論は蒸留によってより小さなモデルに移行できることが明らかになっている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:49:16 GMT)
Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation [23.2] セッションベースレコメンデーション(SBR)を強化するための有望なアプローチとして,大規模言語モデル(LLM)が登場している。
本稿では,SBR用アンダーライン強化アンダーラインモデル(Re2LLM)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:12:18 GMT)
Check, Locate, Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation [23.0] そこで本研究では,フライ時の生成過程に介入する,トレーニング不要なレイアウト校正システムSimMを提案する。
具体的には、"チェック位置修正"パイプラインに従って、システムはまずターゲットレイアウトを生成するプロンプトを分析し、中間出力と比較してエラーを自動的に検出する。
そして、位置したアクティベーションを移動させ、マップ内およびマップ間調整を行うことで、補正処理を無視可能な計算オーバーヘッドで行うことができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:41:23 GMT)
Measuring Spectral Form Factor in Many-Body Chaotic and Localized Phases of Quantum Processors [23.0] 量子多体系におけるカオスの有無を探索するために,スペクトル形状因子(SFF)を実験的に測定した。
この研究は、量子デバイスにおける多体量子カオスの普遍的なシグネチャを、固有エネルギーと固有状態の相関を探索することによって抽出する新しい方法を明らかにする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:59:00 GMT)
PropTest: Automatic Property Testing for Improved Visual Programming [22.8] 提案手法の最初のラウンドで視覚特性をテストするコードを生成するために,LLMを用いて視覚プログラミングを改善する手法であるPropTestを提案する。
提案手法は,より小型で一般公開のLCMを用いて,最先端の手法に匹敵する性能を実現している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:39:15 GMT)
Developing and Deploying Industry Standards for Artificial Intelligence in Education (AIED): Challenges, Strategies, and Future Directions [22.7] AIED(Artificial Intelligence in Education)は、教育実践に革命をもたらすことを約束している。
AIEDソリューションの開発とデプロイにおける標準化されたプラクティスの欠如は、断片化されたエコシステムにつながった。
この記事では、AIEDにおける業界標準の開発と実装に関する重要なニーズに対処することを目的としている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:21:13 GMT)
High-Temperature Gibbs States are Unentangled and Efficiently Preparable [22.4] 局所ハミルトンの熱状態は一定温度以上で分離可能であることを示す。
この熱的絡み合いの突然の死は、ギブス状態における短距離量子相関の存在に関する従来の知恵を裏付ける。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:11:26 GMT)
GoodSAM: Bridging Domain and Capacity Gaps via Segment Anything Model for Distortion-aware Panoramic Semantic Segmentation [22.3] 本稿では,新しい課題に取り組み,新たなセグメンテーションモデル(SAM)から知識を伝達する方法について述べる。
そこで我々は,サンブルロジットを生成するためにSAMと統合された意味情報を提供する教師アシスタント(TA)を導入したGoodSAMというフレームワークを提案する。
2つのベンチマーク実験により、我々のGoodSAMは最先端(SOTA)ドメイン適応法よりも3.75%のmIoU改善を実現していることが示された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:30:32 GMT)
Dial-MAE: ConTextual Masked Auto-Encoder for Retrieval-based Dialogue Systems [22.3] Dial-MAEは、対話応答選択における高密度エンコーダに適した、単純で効果的なポストトレーニング手法である。
実験の結果,Dial-MAEは高い有効性を示し,評価された2つのベンチマークで最先端の性能を実現することができた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:54:10 GMT)
V4D: Voxel for 4D Novel View Synthesis [22.0] 我々は、V4Dと略される4次元神経放射場をモデル化するために3D Voxelを使用し、3Dvoxelは2つのフォーマットを持つ。
提案した LUTs ベースの改良モジュールは,計算コストの少ない性能向上を実現する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:53:30 GMT)
World Models via Policy-Guided Trajectory Diffusion [21.9] 既存の世界モデルは、次の状態を予測するために、ポリシーから次のアクションをサンプリングする、自己回帰的である。
本稿では, 自己回帰的でない新しい世界モデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:09:21 GMT)
CiPR: An Efficient Framework with Cross-instance Positive Relations for Generalized Category Discovery [21.4] 一般化圏発見(GCD)は、部分的にラベル付けされたデータセットを自動的にクラスタリングするオープンワールドの問題を考える。
本稿では,非競合データに対する未知のカテゴリ数を用いて,GCD問題に対処する。
我々はCiPRというフレームワークを提案し、クロスインスタンスポジティヴリレーションを利用して表現をブートストラップする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:40:19 GMT)
Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions [21.4] 一般に使われているトークンレベルのCLIPテキスト埋め込みには,テキスト・ツー・イメージ・モデルにおける高レベル属性の微粒な主観的制御を可能にする方向が存在することを示す。
コントラッシブテキストプロンプトから特定の属性に対するこれらの方向を識別する,効率的な最適化自由度とロバストな最適化ベース手法を1つ導入する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:00:42 GMT)
FedAC: A Adaptive Clustered Federated Learning Framework for Heterogeneous Data [21.3] クラスタ化フェデレーション学習(CFL)は、データ不均一性から生じる性能劣化を軽減するために提案される。
我々は,グローバル知識をクラスタ内学習に効率的に統合する適応型CFLフレームワークFedACを提案する。
実験の結果、FedACは試験精度が1.82%、12.67%向上した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:43:28 GMT)
Applying statistical learning theory to deep learning [21.2] これらの講義の目的は、深層学習を理解しようとするときに生じる主な疑問の概要を提供することである。
良心過剰の文脈における暗黙の偏見について論じる。
本稿では, 線形対角線ネットワーク上での勾配降下の暗黙的バイアスを, 様々な回帰タスクに対して詳細に検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:55:43 GMT)
Symmetric Basis Convolutions for Learning Lagrangian Fluid Mechanics [21.1] 本稿では,分割可能な基底関数を既存手法のスーパーセットとして用いた連続畳み込みの一般的な定式化を提案する。
基本関数に含まれる偶数および奇数対称性が安定性と精度の重要な側面であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:15:47 GMT)
Making Sentence Embeddings Robust to User-Generated Content [20.6] データへの文埋め込みモデルであるLASERの堅牢性に注目した。
埋め込み空間において、非標準文とその標準文を互いに近接して表現するLASERの能力により、このロバスト性を評価する。
標準データと合成データのみをトレーニングすることにより、RoLASERは2倍と11倍のスコアを達成して、自然データと人工データの両方に対するLASERの堅牢性を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:48:36 GMT)
Decoding the visual attention of pathologists to reveal their level of expertise [20.6] 本研究は, がん検診における注意の配分方法に基づいて, 病理医の専門知識を分類する手法を提案する。
読み上げ中の病理学者の注意のみに基づいて、我々のモデルは75.3%、56.1%、77.2%の精度で彼らの専門知識のレベルを予測することができた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:03:51 GMT)
Rethinking the Representation in Federated Unsupervised Learning with Non-IID Data [20.4] フェデレーション学習は、分散データのモデリングにおいて効果的なパフォーマンスを達成する。
実際には、クライアントデータは十分にラベル付けされていないため、非IIDデータとの非教師なし学習(FUSL)の可能性を秘めている。
非IIDデータを用いたFUSLにおける一様および一様表現を生成するFedU2を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:26:01 GMT)
Mind's Mirror: Distilling Self-Evaluation Capability and Comprehensive Thinking from Large Language Models [20.3] 大規模言語モデル (LLM) は自然言語処理において顕著な進歩を遂げている。
これらのモデルの大規模かつ計算的な要求は、資源に制約のある環境での実践的展開を考えると、大きな課題となる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:52:30 GMT)
GSDF: 3DGS Meets SDF for Improved Rendering and Reconstruction [20.2] フレキシブルで効率的な3次元ガウス分割表現とニューラルサイン付き距離場(SDF)の利点を組み合わせた新しいデュアルブランチアーキテクチャを提案する。
我々のデザインがより正確で詳細な表面再構成の可能性を解き放つ多様なシーンを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:22:11 GMT)
Evaluating Large Language Models as Generative User Simulators for Conversational Recommendation [20.2] 本稿では,言語モデルが対話的推薦において人間の行動を正確にエミュレートできる程度を測定するための新しいプロトコルを提案する。
これらのタスクは、人間の行動から言語モデルの逸脱を効果的に明らかにし、モデル選択と促進戦略による逸脱を減らす方法についての洞察を提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:53:01 GMT)
Cell Tracking according to Biological Needs -- Strong Mitosis-aware Random-finite Sets Tracker with Aleatoric Uncertainty [20.0] 本稿では,ニューラルトラッキング・バイ・レグレス・フレームワークに対する不確実性推定手法を提案する。
我々の不確実性推定は、高い性能のトラッキング・バイ・レグレッション法における不確実な関連を識別する。
我々のトラッカーは、長期にわたる対立から生じる偽の関連と有糸分裂の検出を解消する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:50:47 GMT)
Word4Per: Zero-shot Composed Person Retrieval [19.9] CPR(Composeed Person Retrieval)と呼ばれる新しいタスクが提案され、画像情報とテキスト情報を併用して対象人物の検索を行う。
管理されたCPRには、非常にコストのかかる手動のアノテーションデータセットが必要ですが、現在利用可能なリソースはありません。
本稿では,2段階学習フレームワークであるWord4Perを提案する。このフレームワークでは,軽量テキスト変換ネットワーク(TINet)と微調整コントラスト言語-画像事前学習(CLIP)ネットワークに基づくテキストベースの人物検索モデルが学習される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:01:59 GMT)
A Closer Look at the Few-Shot Adaptation of Large Vision-Language Models [19.2] 現状のArtETLアプローチは、狭義の実験的な設定でのみ強力な性能を示すことを示す。
一般化されたラグランジアン法を適応させることにより,バランス項を最適化したCLAP(CLass-Adaptive linear Probe)の目的を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:49:52 GMT)
Camera-aware Label Refinement for Unsupervised Person Re-identification [19.1] 教師なしの人物再識別は、特定人物のイメージを識別ラベルなしで検索することを目的としている。
最近の教師なしRe-IDアプローチでは、クラスタリングをベースとして、クロスカメラの特徴的類似性を測定する手法が採用されている。
我々は、カメラ内類似性をクラスタリングすることで、カメラの差を小さくするtextbfCamera-textbfAware textbfLabel textbfRefinement(CALR)フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:22:27 GMT)
Active Learning of Dynamics Using Prior Domain Knowledge in the Sampling Process [18.4] 本稿では,事前知識をサンプリングプロセスに明示的に組み込むことで,側面情報を活用する動的学習のための能動的学習アルゴリズムを提案する。
提案アルゴリズムは,観測データと側情報から導出される力学の非完全先行モデルとの間に高い経験的差を示す領域への探索を導く。
我々は,我々の能動学習アルゴリズムが,最大予測分散に対する明確な収束率を提供することで,基礎となる力学の一貫性のある推定値が得られることを厳密に証明する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:20:45 GMT)
Enabling Physical Localization of Uncooperative Cellular Devices [18.4] 本研究では,実世界の課題が細胞局在に与える影響について検討する。
我々はこれらの課題に対処する非協調的多角的攻撃(UMA)を提案する。
UMAは, デバイスがローカライゼーションに協力的でない場合に, 現実環境における課題を効果的に解決することを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:18:28 GMT)
Identification of Energy Management Configuration Concepts from a Set of Pareto-optimal Solutions [18.4] 本研究は,エネルギー管理形態の特定のための概念識別技術を活用することに焦点を当てる。
目的とパラメータの分割という記述空間の選択が、抽出可能な情報のタイプにどのように影響するかを分析する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:06:34 GMT)
Enhancing Visual Place Recognition via Fast and Slow Adaptive Biasing in Event Cameras [18.3] イベントカメラは、低レイテンシ、エネルギー効率、高ダイナミックレンジなどの利点があるため、ロボット工学でますます人気がある。
これらのパラメータは、イベントをトリガーするために必要な光強度の変化を規制する。
本稿では,2つのインタラクション手法を用いて,バイアスパラメータを自動的に調整するフィードバック制御アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:10:34 GMT)
Predictive Inference in Multi-environment Scenarios [18.3] 有効な信頼区間を構築するという課題に対処し、複数の環境にまたがる予測の問題に対処する。
我々は、非伝統的で階層的なデータ生成シナリオにおいて、分散のないカバレッジを得る方法を示すために、Jackknifeとsplit-conformalメソッドを拡張した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:21:34 GMT)
Learning Action-based Representations Using Invariance [18.2] 我々は,制御に関係のある遠隔状態の特徴を割引する多段階制御可能性指標を学習するアクションビシミュレーション符号化を導入する。
我々は,報酬のない一様ランダムなデータに基づく行動ビシミュレーション事前学習が,複数の環境におけるサンプル効率を向上させることを実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:17:54 GMT)
An Intermediate Fusion ViT Enables Efficient Text-Image Alignment in Diffusion Models [18.2] 異なる融合戦略が視覚言語アライメントにどのように影響するかを検討する。
特別に設計された中間融合により、テキストと画像のアライメントが向上し、生成品質が向上する。
このモデルでは, FLOPを20%削減し, トレーニング速度を50%向上させるとともに, より高いCLIPスコアと低いFIDを実現する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:16:06 GMT)
Unraveling Instance Associations: A Closer Look for Audio-Visual Segmentation [18.0] オーディオ視覚セグメント化(AVS)は、音声視覚キューに基づいて、正確に音を分割する作業である。
我々は,難易度と比較的偏りのない高画質な視覚的セグメンテーション・ベンチマークを構築するための新たなコスト効率戦略を提案する。
既存のAVSデータセットおよび我々の新しいベンチマークで行った実験により、我々の手法は最先端(SOTA)セグメンテーションの精度を達成できた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:50:42 GMT)
Deciphering the Interplay between Local Differential Privacy, Average Bayesian Privacy, and Maximum Bayesian Privacy [17.9] ベイジアン・プライバシを導入し、地元のディファレンシャル・プライバシとベイジアン・プライバシの関係を掘り下げる。
攻撃戦略と防衛戦略の両方をカプセル化したフレームワークを導入し,その相互作用と有効性を強調した。
私たちの仕事は、ユーティリティーに妥協しないプライバシー保護アルゴリズムの設計を強化することを約束します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:06:45 GMT)
Knowledge Distillation for Road Detection based on cross-model Semi-Supervised Learning [17.7] 本稿では,知識蒸留と半教師付き学習手法を組み合わせた統合的アプローチを提案する。
このハイブリッドアプローチは、大規模モデルのロバストな機能を活用して、大規模な未ラベルデータを効果的に活用する。
半教師付き学習に基づく知識蒸留(SSLKD)アプローチは,学生モデルの性能向上を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:48:27 GMT)
A Meta-Learning Perspective on Transformers for Causal Language Modeling [17.3] Transformerアーキテクチャは、大規模な因果言語モデルの開発において顕著になっている。
因果言語モデリングタスクのトレーニングにおいて,トランスフォーマーアーキテクチャのメタラーニングビューを確立する。
内部最適化では,Transformerに基づく因果言語モデルにおいて,学習トークン表現のノルムの特別な特徴を発見し,理論的に解析する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:58:36 GMT)
PathoTune: Adapting Visual Foundation Model to Pathological Specialists [17.3] PathoTuneは、病理学的または視覚的基礎モデルから病理学固有のタスクに効率的に適応するように設計されたフレームワークである。
パッチレベルとWSIレベルの複数のデータセットにまたがる結果は、単一モードのプロンプトチューニングアプローチよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:29:18 GMT)
A unified front-end framework for English text-to-speech synthesis [17.3] フロントエンドは英語のテキスト音声システムにおいて重要なコンポーネントである。
フロントエンドは通常、テキスト正規化(TN)モジュール、韻律語韻律句(PWPP)モジュール、G2Pモジュールで構成される。
本稿では、英語のTSフロントエンドモジュール間の依存関係をキャプチャする統合フロントエンドフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:59:04 GMT)
BigVSAN: Enhancing GAN-based Neural Vocoders with Slicing Adversarial Network [17.0] 高忠実度音声波形をリアルタイムより高速に合成できるGANベースのボコーダの研究が盛んに行われている。
ほとんどのGANは、特徴空間における実データと偽データとを識別する最適なプロジェクションを得ることができない。
本稿では,ほとんどのGANベースのボコーダが採用している最小二乗GANを,損失関数がSANの要求を満たすように修正する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:17:30 GMT)
Let Real Images be as a Judger, Spotting Fake Images Synthesized with Generative Models [16.9] 異なる生成モデルにより合成された偽画像のアーティファクトパターンについて検討した。
本稿では,実画像でのみ共有される自然なトレースを,検出器内の新たな予測対象として採用する。
提案手法では,96.1%のmAPがベースラインを著しく上回っている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:58:58 GMT)
Learning To Guide Human Decision Makers With Vision-Language Models [16.8] 本稿では,機械が意思決定に有用なテキスト案内を行うためのフレームワークであるテキスト学習 to guide (LTG)を紹介する。
我々はまた,テクティタニー視覚言語モデルをテキストガイダンスの有能な生成元に変換する手法を開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:34:42 GMT)
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning [16.8] グラディエントベースメタRL(GMRL)は、2段階の最適化手順を維持する手法である。
GMRLで採用されている既存のメタグラディエント推定器は、実際にテキストバイアスを受けていることを示す。
我々は,刑法外学習や低バイアス推定器などの他の手法が一般のGMRLアルゴリズムの勾配バイアスの解消にどのように役立つかを示すため,Iterated Prisoner's Dilemma と Atari のゲームで実験を行った。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:22:53 GMT)
Dual Box Embeddings for the Description Logic EL++ [16.7] 知識グラフ(KG)と同様に、知識グラフはしばしば不完全であり、それらの維持と構築は困難であることが証明された。
KGsと同様に、有望なアプローチは、潜在ベクトル空間への埋め込みを学習し、基礎となるDLのセマンティクスに固執することである。
そこで本研究では,概念と役割をボックスとして表現した,DL EL++用のBox$2$ELという新しいオントロジー埋め込み手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:10:57 GMT)
Solving Data-centric Tasks using Large Language Models [16.5] 大きな言語モデル(LLM)は、StackOverflowのようなヘルプフォーラムを急速に置き換えている。
本稿では,どのデータがプロンプトに含まれるべきか,という質問に対する回答に2つの貢献をする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:23:01 GMT)
OpenFMNav: Towards Open-Set Zero-Shot Object Navigation via Vision-Language Foundation Models [16.5] ゼロショットオブジェクトナビゲーションのためのオープンセットファウンデーションモデルベースのフレームワークであるOpenFMNavを提案する。
まず,大規模言語モデルの推論能力を解き明かし,提案するオブジェクトを自然言語命令から抽出する。
次に、大規模視覚言語モデルの一般化可能性を活用して、シーンから候補対象を積極的に発見し、検出する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:52:43 GMT)
Deja vu: Contrastive Historical Modeling with Prefix-tuning for Temporal Knowledge Graph Reasoning [16.4] ChapTERは、テンポラル推論のためのプレフィックスチューニングを備えたコントラスト歴史モデリングフレームワークである。
我々は4つのトランスダクティブと3つの数ショットインダクティブTKGRベンチマークでChapTERを評価した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:25:40 GMT)
Pre-Trained Masked Image Model for Mobile Robot Navigation [16.3] 2Dトップダウンマップは、未知の領域を通る移動ロボットのナビゲーションと探索に一般的に使用される。
近年の研究では、学習に基づくアプローチによって環境の構造パターンを予測することにより、タスク効率が大幅に向上することが示されている。
既存の基盤ビジョンネットワークは微調整なしで同じことを実現できることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:46:25 GMT)
RepairAgent: An Autonomous, LLM-Based Agent for Program Repair [16.1] 本稿では,大規模言語モデル(LLM)に基づく自律型エージェントによるプログラム修復問題に対処する最初の取り組みであるReleaseAgentを紹介する。
repairAgentの主要なコントリビューションには、プログラムの修復に有用なツールセット、動的に更新されたプロンプトフォーマット、ツールを呼び出すエージェントを誘導する有限状態マシンが含まれている。
一般的なDefects4Jデータセットに対する評価は、以前の手法では修正されなかった39のバグを含む164のバグを自律的に修復するAgentの有効性を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:17:43 GMT)
Optimizing Crowd-Aware Multi-Agent Path Finding through Local Broadcasting with Graph Neural Networks [15.9] 混在環境におけるマルチエージェントパス探索 (MAPF) は, 移動計画において困難な問題となる。
本稿では,この問題を解決するために,クラウド対応の分散強化学習手法であるCRAMPを紹介する。
CRAMPは, メースパンと衝突数で測定された溶液品質を最大59%改善し, 従来の方法と比較して最大35%改善した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:28:22 GMT)
Towards Trustworthy Automated Driving through Qualitative Scene Understanding and Explanations [15.8] 質的説明可能なグラフ(QXG)は、都市移動におけるシーン理解のための統一的な象徴的、質的表現である。
QXGはリアルタイムで構築することができ、様々なセンサータイプにわたる車内説明のための汎用的なツールである。
これらの説明は、乗客や信頼できるユーザーに通知することから、過去の行動のポストホック分析を可能にすることまで、様々な目的に役立てることができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:19:33 GMT)
Deep Learning Based Sphere Decoding [15.8] 深層ニューラルネットワーク(DNN)により,超球面の半径を学習する深層学習(DL)に基づく球面復号アルゴリズムを提案する。
提案アルゴリズムによって達成された性能は、幅広い信号-雑音比(SNR)に対して最適極大復号法(MLD)に非常に近い。
計算複雑性は、既存の球デコード変種と比較して大幅に減少している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:13:42 GMT)
Towards Automatic Evaluation for LLMs' Clinical Capabilities: Metric, Data, and Algorithm [15.6] 大規模言語モデル (LLMs) は, 臨床診断の効率向上への関心が高まっている。
臨床サービス提供におけるLCMの能力を評価するための自動評価パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:17:54 GMT)
BatteryML:An Open-source platform for Machine Learning on Battery Degradation [15.5] BatteryML - データ前処理、機能抽出、そして従来のモデルと最先端モデルの両方の実装を統合するために設計された、ワンステップで全エンコンパス、オープンソースプラットフォームを提供する。
この合理化されたアプローチは、研究アプリケーションの実用性と効率を高めることを約束する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:58:39 GMT)
FedFixer: Mitigating Heterogeneous Label Noise in Federated Learning [15.4] フェデレートラーニング(FL)はその性能のラベル品質に大きく依存する。
異種ラベルノイズにおけるクライアント固有のサンプルによる高い損失は、クライアント固有のサンプルとノイズのあるラベルのサンプルを区別する上での課題となる。
我々はFedFixerを提案し、そこでパーソナライズされたモデルがグローバルモデルと協調してクライアント固有のクリーンなサンプルを効果的に選択する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:24:05 GMT)
Tight Convergence Rate Bounds for Optimization Under Power Law Spectral Conditions [15.3] スペクトルの所定の形状に対して、最適に加速された方法、そのスケジュール、収束上限が統一的に得られるかを示す。
実験により、得られた収束境界と加速度戦略は、正確に2次最適化問題に関係しているだけでなく、ニューラルネットワークのトレーニングに適用した場合にもかなり正確であることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:31:05 GMT)
RL for Consistency Models: Faster Reward Guided Text-to-Image Generation [15.2] 強化学習(RL)を用いた微調整一貫性モデルのためのフレームワークを提案する。
RLCM(Reinforcement Learning for Consistency Model)と呼ばれる我々のフレームワークは、一貫性モデルの反復推論プロセスをRLプロシージャとしてフレーム化します。
RL微調整拡散モデルと比較して、RCCMの列車は大幅に高速で、報奨目標に基づいて測定された生成の質を向上し、2段階の推論ステップで高品質な画像を生成することにより推論手順を高速化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:40:22 GMT)
Counting-Stars: A Simple, Efficient, and Reasonable Strategy for Evaluating Long-Context Large Language Models [14.9] GPT-4 TurboとKimi Chatは、4Kから128Kまでの長いコンテキストで大きなパフォーマンスを実現している。
我々は,長文LLMを新しいベンチマークとして,Counting-Stars(カウンティング・スターズ)という,シンプルで効率的かつ合理的な評価手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:58:41 GMT)
Multiple Object Tracking as ID Prediction [14.9] マルチプルオブジェクトトラッキング(MOT)では、トラッキング・バイ・検出の手法が長い間テストされてきた。
シングルフレーム検出器を活用し、手作りのアルゴリズムとサロゲートタスクを通じてオブジェクト関連を後処理のステップとして扱う。
しかし、テクニックの性質は、トレーニングデータのエンドツーエンドの活用を妨げるため、ますます面倒で困難な手作業の修正につながる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:09:54 GMT)
PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models [14.7] PIAは、条件画像との整合性、テキストによる動作制御性、および特定のチューニングなしで様々なパーソナライズされたT2Iモデルとの互換性に優れる。
PIAのキーコンポーネントは条件モジュールの導入であり、入力として条件フレームとフレーム間の親和性を利用する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:18:04 GMT)
How Reliable is Your Simulator? Analysis on the Limitations of Current LLM-based User Simulators for Conversational Recommendation [14.6] 本稿では,対話型レコメンダシステムのためのユーザシミュレータ構築におけるLarge Language Modelsの使用制限について分析する。
会話履歴やユーザシミュレータの応答で発生するデータ漏洩は,評価結果を膨らませる結果となる。
そこで我々はSimpleUserSimを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:21:06 GMT)
On Policy Reuse: An Expressive Language for Representing and Executing General Policies that Call Other Policies [14.6] 単純だが強力な言語は、一連の数値的特徴に対して定義された規則の観点で導入された。
この言語の3つの拡張は、ポリシーとスケッチをより柔軟で再利用可能なものにすることを目的としている。
ポリシーとスケッチの結果として得られる言語の表現力は、いくつかの例で説明されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:48:54 GMT)
To share or not to share: What risks would laypeople accept to give sensitive data to differentially-private NLP systems? [14.6] 私たちは、$varepsilon$の値を決定することは、研究者やシステム開発者の手だけにすべきではない、と論じています。
我々は,不確実な意思決定状況における人々の行動を研究するために,行動実験(311名)を実施している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:44:53 GMT)
On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance [14.1] この研究は、異なるEdge AIデプロイメント戦略の精度と推論時間のトレードオフを実証的に評価することを目的としている。
3つのデプロイメントオペレータ(パーティショニング、量子化、アーリーエグジット)と3つのデプロイメント層(モバイル、エッジ、クラウド)を含む推論実験を行います。
以上の結果から,ハイブリッドなQuantization+Early Exit演算子を用いたエッジ配置が非ハイブリッド演算子よりも望ましいことが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:09:46 GMT)
Leveraging Large Language Model to Generate a Novel Metaheuristic Algorithm with CRISPE Framework [14.1] 我々は,大言語モデル (LLM) ChatGPT-3.5 を借りて,少量の入力しか持たない新しいメタヒューリスティックアルゴリズム (MA) を自動かつ迅速に設計する。
動物にインスパイアされた新しい動物探索最適化(ZSO)は、継続的な最適化問題を解決するための動物の集団行動からインスピレーションを得ている。
CEC2014ベンチマーク関数,CEC2022ベンチマーク関数,および6つのエンジニアリング最適化問題に対するZSO処理アルゴリズムの性能について検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:34:20 GMT)
When Semantic Segmentation Meets Frequency Aliasing [14.1] 我々は、ハードピクセルエラーを包括的に分析し、それらを偽応答、マージミス、変位の3つのタイプに分類する。
その結果, ダウンサンプリング中のフーリエ領域の周波数成分の重なりによる歪みが, ハードピクセルとエイリアシングの定量的な関連性を示した。
本稿では,Nyquist周波数よりも高い周波数を正確に除去・調整することにより,エイリアスを緩和する2つの新しいデエイリアスフィルタ (DAF) と周波数混合 (FreqMix) モジュールを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:04:44 GMT)
Dynamic Relative Representations for Goal-Oriented Semantic Communications [14.0] 通信のセマンティクスと有効性は6G無線ネットワークにおいて基本的な役割を果たす。
潜時空間通信において、この課題は、ディープニューラルネットワークがデータをエンコードする高次元表現における誤調整として現れる。
本稿では,相対表現を利用して意味ミスマッチを緩和する,ゴール指向のセマンティックコミュニケーションのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:48:06 GMT)
Federated Learning Using Three-Operator ADMM [13.9] フェデレートラーニング(FL)は、ユーザの側で生成されたデータの送信を避ける。
本稿では,エッジサーバ上のスムーズなコスト関数を利用したFedTOP-ADMMを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:50:12 GMT)
MBR and QE Finetuning: Training-time Distillation of the Best and Most Expensive Decoding Methods [13.6] モデルパープレキシティとvs品質のミスマッチを軽減するために、ファインタニングとQEファインタニングを提案する。
自己学習においても,これらのファインタニング手法はベースモデルよりも有意に優れていることを示す。
これらの結果は、モノリンガルデータを活用する新たな方法が、人間の計算データと同等かそれ以上のモデル品質の向上を実現することを示唆している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:30:19 GMT)
Zero-BEV: Zero-shot Projection of Any First-Person Modality to BEV Maps [13.5] 本稿では,対応するBEVマップに対して,一人称視点で利用可能な任意のモダリティをゼロショット投影できる新しいモデルを提案する。
本研究では,本モデルが競合手法,特に単眼深度推定に広く用いられているベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:45:53 GMT)
Diff-Def: Diffusion-Generated Deformation Fields for Conditional Atlases [13.4] 条件付きアトラスは、微細な解剖学的差異を調査することができる。
我々は、潜在拡散モデルを用いて変形場を生成し、一般集団アトラスを特定のサブ集団に変換する。
本手法を、5000個の脳とUK Biobankの全身MR画像を用いた実験で、最先端のアトラス生成法と比較した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:52:48 GMT)
$\textit{LinkPrompt}$: Natural and Universal Adversarial Attacks on Prompt-based Language Models [13.4] Promptベースの学習は、事前訓練された言語モデル(PLM)を下流タスクに適用する。
敵のトリガーは、ターゲットのPLMの予測を変更するために生成される。
本研究では,UATを生成する逆攻撃アルゴリズムであるtextitLinkPrompt$を開発する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:27:35 GMT)
An LLM-Based Digital Twin for Optimizing Human-in-the Loop Systems [13.4] 本稿では,ショッピングモールにおける多様な集団の行動と熱的嗜好を模倣するために,大規模言語モデル(LLM)を用いたケーススタディを提案する。
集約された熱嗜好は、エージェント・イン・ザ・ループに基づく強化学習アルゴリズムであるAitL-RLに統合される。
以上の結果から,LLMは大規模オープンスペース内での複雑な人口移動をシミュレートできることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:32:28 GMT)
Learning from Reduced Labels for Long-Tailed Data [13.3] 長い尾のデータは現実世界の分類タスクで一般的であり、教師付き情報に大きく依存している。
そこで我々は、Reduced Labelと呼ばれる弱教師付きラベル設定を導入する。
提案したラベリング設定は、テールサンプルの監視情報の減少を回避するだけでなく、ロングテールデータに関連するラベリングコストを低減させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:50:25 GMT)
RSTAR: Rotational Streak Artifact Reduction in 4D CBCT using Separable and Circular Convolutions [13.1] 動的画像の特徴を符号化し、4次元CBCT画像の復元を容易にするRSTAR-Netを提案する。
ストリークアーティファクトは,患者の呼吸とともに周期的な回転運動を示す。
このユニークなパターンは、時間領域における望ましい解剖学的構造とアーティファクトを区別するきっかけになります。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:54:57 GMT)
Concurrent Linguistic Error Detection (CLED) for Large Language Models [13.0] 大規模言語モデル(LLM)に対する同時言語誤り検出(CLED)を提案する。
CLEDはLLMによって生成されたテキストの言語的特徴を抽出し、エラーを検出する同時分類器に供給する。
提案手法は,ニュース要約時にT5モデル,翻訳時にOPUS-MTモデルで評価されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:17:27 GMT)
RTSUM: Relation Triple-based Interpretable Summarization with Multi-level Salience Visualization [12.9] 本稿では、関係三重項を要約の基本単位として利用する教師なし要約フレームワークRTSUMを提案する。
また,解釈可能な要約ツールのWebデモも開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:41:32 GMT)
Node-Aligned Graph-to-Graph (NAG2G): Elevating Template-Free Deep Learning Approaches in Single-Step Retrosynthesis [12.7] 有機化学における一段階の逆合成(SSR)は、コンピュータ合成設計における深層学習(DL)技術の恩恵を受けている。
テンプレート支援型DLモデルは、レトロシンセシス予測に柔軟で有望であるが、重要な2次元分子情報を無視し、ノード生成のための原子アライメントに苦慮することが多い。
変換器ベースのテンプレートフリーDLモデルであるNode-Aligned Graph-to-Graph (NAG2G)を紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:09:26 GMT)
Tricking LLMs into Disobedience: Formalizing, Analyzing, and Detecting Jailbreaks [12.5] 我々は、既知の(そして可能な)ジェイルブレイクの形式主義と分類法を提案する。
私たちは3700のjailbreakプロンプトにまたがるモデル出力のデータセットを4つのタスクでリリースしています。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:18:06 GMT)
Determined Multi-Label Learning via Similarity-Based Prompt [12.4] マルチラベル分類では、各トレーニングインスタンスは複数のクラスラベルに同時に関連付けられている。
この問題を軽減するために,textitDetermined Multi-Label Learning (DMLL) と呼ばれる新しいラベル設定を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:08:01 GMT)
Synapse: Learning Preferential Concepts from Visual Demonstrations [12.3] 本稿では,視覚的入力からユーザ固有の嗜好を学習することを目的とした,嗜好学習の課題に対処する。
事実概念の学習に類似しているにもかかわらず、嗜好学習はその主観的な性質と個人固有のトレーニングデータの質のために根本的に難しい問題である。
この問題は、限定的なデモンストレーションから優先概念を効率的に学習するために設計された、ニューロシンボリックなアプローチであるSynapseと呼ばれる新しいフレームワークを用いて解決する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:23:39 GMT)
Hierarchical Recurrent Adapters for Efficient Multi-Task Adaptation of Large Speech Models [12.2] 本稿では,大規模マルチタスク適応シナリオにおいて,より効率的なアダプタモジュールを提案する。
アダプタは単一の共有コントローラネットワークと複数のタスクレベルのアダプタヘッドで構成されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:21:56 GMT)
Block Selective Reprogramming for On-device Training of Vision Transformers [12.1] 本稿では,事前学習したモデルのブロック全体のごく一部のみを微調整するブロック選択型再プログラミング(BSR)を提案する。
既存の代替手法と比較して、トレーニングメモリを最大1.4倍、計算コストを最大2倍に削減する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:41:01 GMT)
Graphs Generalization under Distribution Shifts [12.0] グラフ学習不変領域ジェネレーション(GLIDER)という新しいフレームワークを導入する。
本モデルでは,ノード特徴量と位相構造量の分布シフトを同時に行う場合,ノードレベルのOOD一般化に基づくベースライン手法よりも優れる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:15:34 GMT)
Benchmarking Video Frame Interpolation [11.9] 提案手法は,提案するWebサイトを利用して,一貫したエラーメトリクスを確立するベンチマークである。
また、合成データを利用して線形性の仮定に忠実なテストセットを提案し、コヒーレントな方法で計算効率を評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:13:12 GMT)
ProIn: Learning to Predict Trajectory Based on Progressive Interactions for Autonomous Driving [11.9] プログレッシブ・インタラクション・ネットワークが提案され、エージェントの特徴が関係する地図に徐々に焦点を合わせることができる。
このネットワークは、グラフ畳み込みを通じて、地図制約の複雑な影響をエージェントの特徴に徐々にエンコードする。
実験は、既存の1段階の相互作用に対する進歩的相互作用の優越性を検証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:38:34 GMT)
PE: A Poincare Explanation Method for Fast Text Hierarchy Generation [11.9] 我々は,O(n2logn)$時間複雑性における双曲空間を用いた特徴量相互作用をモデル化するための新しい手法,すなわち Poincar'e Explanation (PE) を導入する。
Poincarのモデルに触発されて、双曲空間への埋め込みを投影するフレームワークを提案し、構文やセマンティック階層構造に対してより優れた帰納バイアスを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:04:14 GMT)
Belief Samples Are All You Need For Social Learning [11.7] ソーシャルネットワークに埋め込まれたエージェント集団が、世界の根底にある状態を学習することに興味を持つ社会学習の問題を考える。
エージェントが彼らの信念からサンプルを伝達することしか許されていない場合、確率で学ぶことは依然として達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:43:17 GMT)
A Huber Loss Minimization Approach to Byzantine Robust Federated Learning [11.5] フェデレートされた学習システムは、敵対的な攻撃を受けやすい。
本稿では,ハマー損失最小化に基づく新しいアグリゲータを提案する。
次に、クライアントがわずかに異なる分布を持つような非i-i-dデータを含むように分析を拡張します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:58:04 GMT)
Bayesian Methods for Trust in Collaborative Multi-Agent Autonomy [11.2] 安全クリティカルで競争の激しい環境では、敵は多数のエージェントに侵入し、妥協することがある。
我々は、この妥協されたエージェント脅威モデルの下で、アートマルチターゲット追跡アルゴリズムの状態を解析する。
階層的ベイズ更新を用いた信頼度推定フレームワークを設計する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:17:35 GMT)
ChebMixer: Efficient Graph Representation Learning with MLP Mixer [11.2] Graph Transformerはノードをトークンとして扱う。
このグラフMixerは、コンピュータビジョンからの効率的なMixerテクニックを使用して、この問題に対処する。
我々は,高速なChebyshevsに基づくスペクトルフィルタリングを用いてトークン列を抽出するChebMixerという新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:44:34 GMT)
Manufacturing Service Capability Prediction with Graph Neural Networks [11.2] 本研究では,知識グラフ上でのサービス機能識別のためのグラフニューラルネットワークを用いた手法を提案する。
識別性能を向上させるために,グラフノードの近傍から情報を集約する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:39:47 GMT)
AgentFL: Scaling LLM-based Fault Localization to Project-Level Context [11.1] 本稿では,ChatGPTに基づくマルチエージェントシステムであるAgentFLについて述べる。
人間の開発者の振る舞いをシミュレートすることで、AgentFLはFLタスクを3段階のプロセスとしてモデル化する。
広く使用されているDefects4J-V1.2.0ベンチマークの評価は、AgentFLがTop-1内の395のバグのうち157をローカライズできることを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:58:19 GMT)
SPLICE: A Singleton-Enhanced PipeLIne for Coreference REsolution [11.1] シングルトンは、つまりテキストの中で一度だけ言及される不明瞭さは、理論的な観点から人間が言論を理解する方法において重要であると言及している。
OntoNotesベンチマークでシングルトン参照スパンが欠如しているため、英語のエンドツーエンドのニューラルコア参照解決にそれらの検出を組み込もうとする以前の試みは妨げられていた。
本稿では,既存のネストネストNERシステムとOntoNotes構文木から派生した特徴を組み合わせることで,この制限に対処する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:46:16 GMT)
VMRNN: Integrating Vision Mamba and LSTM for Efficient and Accurate Spatiotemporal Forecasting [11.1] 時間的予測のためのRNNを持つVTやCNNは、時間的・空間的ダイナミクスを予測するのに相容れない結果をもたらす。
最近のMambaベースのアーキテクチャは、非常に長いシーケンスモデリング能力に熱中している。
本稿では,ビジョンマンバブロックの強度をLSTMと統合した再帰ユニットであるVMRNNセルを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:26:42 GMT)
Elysium: Exploring Object-level Perception in Videos via MLLM [11.0] MLLM(Multi-modal Large Language Models)は静止画像中の物体を知覚する能力を示した。
しかし,物体追跡などの映像関連タスクへの応用はいまだ検討されていない。
本稿では,ビデオにおけるオブジェクトレベルのタスクを,追加のプラグインやエキスパートモデルを必要としない,エンドツーエンドのトレーニング可能なMLLMを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:17:15 GMT)
Entropy-MCMC: Sampling from Flat Basins with Ease [10.8] 我々は, シャープモードから解放された円滑な後円板に類似した定常分布である補助誘導変数を導入し, MCMC試料を平らな盆地に導出する。
この導出変数をモデルパラメータと統合することにより、計算オーバーヘッドを最小限に抑えた効率的なサンプリングを可能にする、単純なジョイント分布を作成する。
実験により,提案手法は後方の平らな盆地から試料を採取し,比較したベースラインを複数ベンチマークで比較した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:07:22 GMT)
GreeDy and CoDy: Counterfactual Explainers for Dynamic Graphs [10.7] 時間的グラフニューラルネットワーク(TGNN)は、時間的相互作用を伴う動的グラフのモデリングに不可欠である。
モデル決定を理解するためには、カウンターファクトな説明が不可欠だ。
本稿では,TGNNに対する2つの新しい非現実的説明手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:07:50 GMT)
CT-Bound: Fast Boundary Estimation From Noisy Images Via Hybrid Convolution and Transformer Neural Networks [10.6] 本稿では,ハイブリッド畳み込みとトランスフォーマーニューラルネットワークを用いた雑音画像の高速境界推定法であるCT-Boundを提案する。
従来の最高精度の方法と比較すると、CT-Boundは100倍高速で、比較可能な精度、高品質な境界線、カラーマップを生成する。
また、CT-Boundは、追加の微調整やリアルタイム境界マップやカラーマップを毎秒10フレームで作成することなく、実撮影画像上で境界マップとカラーマップを作成できることを実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:22:22 GMT)
Outcome-Constrained Large Language Models for Countering Hate Speech [10.4] ヘイトスピーチへの挑戦や対応は、ヘイトスピーチのネガティブな影響を緩和し、生産的なオンラインコミュニケーションを促進する代替手段として見なされてきた。
既存の研究は、礼儀正しさ、情報的、意図駆動といった特定の言語的特性を持つ対音声の生成に焦点を当てている。
まず,大きな言語モデル(LLM)を用いて,潜在的な会話結果に制約された反音声を生成する手法について検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:44:06 GMT)
Accelerating Graph Neural Networks on Real Processing-In-Memory Systems [10.3] 実PIMシステム上でグラフニューラルネットワークを高速化する,効率的なMLフレームワークであるPyGimを紹介する。
我々は、プロセッサ中心およびメモリ中心のコンピューティングシステムにおいて、計算集約型およびメモリ集約型のカーネルが実行されるハイブリッドGNN実行を提供する。
我々は、1992年のPIMコアを持つ実世界のPIMシステム上で、新しいGNNモデルを用いてPyGimを広範囲に評価し、Intel Xeonの最先端CPUを平均3.04倍に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:51:02 GMT)
Resource and Mobility Management in Hybrid LiFi and WiFi Networks: A User-Centric Learning Approach [10.3] ハイブリッド光ファイバー(LiFi)と無線通信ネットワーク(HLWNet)は、新興の屋内無線通信パラダイムである。
既存のロードバランシング(LB)メソッドは、主にネットワーク中心であり、ユーザー全員にソリューションを提供するために中央ユニットに依存している。
そこで本研究では,ユーザが異なるペースでソリューションを更新できるユーザ中心のLBについて検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:48:00 GMT)
Towards Balanced RGB-TSDF Fusion for Consistent Semantic Scene Completion by 3D RGB Feature Completion and a Classwise Entropy Loss Function [10.2] RGB-TSDF 融合は非自明なものと考えられており、一般的に使用されるナイーブ付加は矛盾する結果をもたらす。
本稿では、3D RGB機能補完モジュールを備えた2段階ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:56:51 GMT)
Covariance-Aware Private Mean Estimation Without Private Covariance Estimation [10.0] 2つのサンプル係数差分プライベート平均推定器を$d$-dimensional(sub)Gaussian分布に対して提案する。
我々の推定子は、$| tildemu - mu |_Sigma leq alpha$, where $| cdot |_Sigma$がマハラノビス距離であるような$tildemu$を出力します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:11:44 GMT)
Multiple-Source Localization from a Single-Snapshot Observation Using Graph Bayesian Optimization [10.0] 単一スナップショット観測によるマルチソースのローカライゼーションは、その頻度が原因で特に重要となる。
現在の方法は典型的には欲求選択を利用しており、通常は1つの拡散モデルと結合する。
そこで本研究では,BOSouLというシミュレーション手法を用いて,サンプル効率を近似する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:46:24 GMT)
On the rates of convergence for learning with convolutional neural networks [9.8] 畳み込みニューラルネットワーク(CNN)の近似と学習能力に関する研究
多くの学習問題におけるCNNに基づく推定器の収束率を導出する。
また、得られたレートは、いくつかの設定でミニマックス最適であることが示されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:42:02 GMT)
Calibrating Bayesian UNet++ for Sub-Seasonal Forecasting [9.8] 季節予測は、気候変動による極端な暑さや寒さを検出する上で重要な課題である。
1年間の気温の上昇が世界に大きな影響を与えるため、予測の信頼性は信頼されるべきだ」と述べた。
予測誤差と校正誤差との多少のトレードオフにより、より信頼性が高く、よりシャープな予測が得られることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:42:48 GMT)
Machine Learning on Blockchain Data: A Systematic Mapping Study [9.7] 技術は文学や実践において注目を集めている。
本稿では,ブロックチェーンデータに適用された機械学習技術の現状を概観する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:12:16 GMT)
Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints [9.5] 我々は,マルコフ音源の遠隔推定のための意味認識通信について,損失・速度制約のあるチャネル上で検討した。
送信周波数制約下での予測誤差の長期的状態依存コストを最小限に抑える最適スケジューリングポリシーを見いだす。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:18:23 GMT)
A Study in Dataset Pruning for Image Super-Resolution [9.5] 損失値に基づいて選択したトレーニングサンプルのコアセットにデータセットを還元する,新たなアプローチを導入する。
データセット全体のトレーニングで得られた結果に匹敵する、あるいは超える結果が得られます。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:16:34 GMT)
Understanding the Functional Roles of Modelling Components in Spiking Neural Networks [9.4] スパイキングニューラルネットワーク(SNN)は、生物学的忠実さで高い計算効率を達成することを約束している。
LIFに基づくSNNにおけるキーモデリングコンポーネント,リーク,リセット,再起動の機能的役割について検討する。
具体的には、メモリ保持とロバスト性のバランスにおいてリークが重要な役割を担い、リセット機構は未中断の時間的処理と計算効率に不可欠であり、リセットは、ロバストネス劣化を犠牲にして複雑なダイナミクスをモデル化する能力を強化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:13:20 GMT)
EVOTER: Evolution of Transparent Explainable Rule-sets [9.4] 本稿では,まずモデルが透明で説明しやすいアプローチを提唱する。
このアプローチは、いくつかの予測/分類と処方/政治検索ドメインで評価される。
ブラックボックスモデルと同様に機能する有意義なルールセットを発見することが示されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:37:09 GMT)
From Two Stream to One Stream: Efficient RGB-T Tracking via Mutual Prompt Learning and Knowledge Distillation [9.4] 視覚的プロンプト学習にインスパイアされた我々は,相互学習に基づく新しい2ストリームRGB-T追跡アーキテクチャを設計した。
設計した教師モデルが最も精度が高く,教師モデルに匹敵する精度の学生モデルは,教師モデルよりも3倍以上高速な推論速度を実現した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:57:29 GMT)
A Comprehensive Study of the Capabilities of Large Language Models for Vulnerability Detection [9.4] 大規模言語モデル(LLM)は、コード生成やその他のソフトウェアエンジニアリングタスクに大きな可能性を実証しています。
脆弱性検出は、ソフトウェアシステムのセキュリティ、完全性、信頼性を維持する上で非常に重要である。
最近の研究は、ジェネリックプロンプト技術を用いた脆弱性検出にLLMを適用しているが、このタスクの能力とそれらが犯すエラーの種類は未だ不明である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:47:36 GMT)
Knowledge-augmented Graph Neural Networks with Concept-aware Attention for Adverse Drug Event Detection [9.3] 副作用薬物イベント(ADEs)は、薬物の安全性の重要な側面である。
さまざまな文献にはADEに関する豊富な情報が含まれている。
近年,テキストからのADE検出を自動化するために,単語埋め込みとディープラーニングに基づく自然言語処理を適用している。
本稿では,グラフ内のノードの種類によって異なる特徴を学習する,概念認識型アテンション機構を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:55:20 GMT)
Fidelity of Wormhole Teleportation in Finite-qubit Systems [9.3] ホログラフィーの双対性は、重力と時空が強く相互作用する系から現れることを記述し、重力物理学の実験的な研究のための自然な道のりを提供する。
顕著な例はワームホールテレポーテーションプロトコルによるワームホールのシミュレーションである。
我々は、$N$-qubitシステムにおけるワームホールテレポーテーションの忠実度を計算するための理論的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:11:59 GMT)
Open-Set Recognition in the Age of Vision-Language Models [9.3] オープンセット認識のための視覚言語モデル(VLM)を評価する。
クエリーセットに含まれていないオブジェクトをしばしば誤って分類する。
我々は,VLM時代のオープンセット問題について,再定義する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:14:22 GMT)
Resolution Limit of Single-Photon LiDAR [9.3] レーザー送信機によってシーン全体に生じる一定の量のフラックスが与えられると、単位空間により多くのピクセルを詰め込むと、SNR(Philipal-to-Noise Ratio)が減少する。
これにより、センサアレイの空間分解能と各画素で受信されるSNRとの間には、根本的なトレードオフが生じる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:21:26 GMT)
Plaintext-Free Deep Learning for Privacy-Preserving Medical Image Analysis via Frequency Information Embedding [9.2] 本稿では,サロゲート画像を解析に用いる新しいフレームワークを提案する。
このフレームワークは、周波数領域交換スタイル融合(FESF)と呼ばれる。
本フレームワークは,医療画像のプライバシを効果的に保ち,DLモデルの診断精度を比較的高いレベルで維持し,各種データセットやDLベースモデルに対して有効性を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:56:38 GMT)
If CLIP Could Talk: Understanding Vision-Language Model Representations Through Their Preferred Concept Descriptions [9.2] 視覚言語モデル(VLM)の表現は、しばしば形状のような視覚的属性に基づいている。
本稿では,重要なテキスト特徴を特徴付ける新しい手法であるExtract and Explore (EX2)を提案する。
VLMは画像とシーン記述とを単純に一致させるのではなく、視覚的でない、あるいは刺激的でない記述がそれらの表現に大きな影響を与えていることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:05:50 GMT)
Graph Bayesian Optimization for Multiplex Influence Maximization [9.2] インフルエンス(IM)とは、ソーシャルネットワーク内の初期影響力のあるユーザ数を限定的に特定し、影響力のあるユーザ数を最大化する問題である。
これまでの研究は主に、複数の情報項目の同時的かつインタラクティブな拡散を無視して、個々の情報伝達に焦点を当ててきた。
本稿では,情報関連機構を持つ拡散モデルを用いて,まず多重化最大化(Multi-IM)問題を定式化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:50:01 GMT)
Generation of $γ$-photons and pairs with transverse orbital angular momentum via spatiotemporal optical vortex pulse [9.1] 我々は、本質的横軌道運動量(TOAM)を持つ、よく加工された$-photonsとペアの生成を提示する。
STOVパルスのTOAMはほとんど変化せず、TOAMはCMF(Central-of-mass frame)に保存されている。
高エネルギー電子の初期エネルギーの増加は、両方のフレームにおける$gamma$-photons と positrons の両方に対するTOAMの増強につながる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:17:31 GMT)
Investigating Robustness in Cyber-Physical Systems: Specification-Centric Analysis in the face of System Deviations [8.9] サイバー物理システム(CPS)の重要属性は堅牢性であり、安全に運用する能力を示している。
本稿では,特定のシステム要件を満たす上でのコントローラの有効性を特徴付ける,仕様に基づく新しいロバスト性を提案する。
本稿では, 微妙な堅牢性違反を識別するための2層シミュレーションに基づく解析フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:02:47 GMT)
CMViM: Contrastive Masked Vim Autoencoder for 3D Multi-modal Representation Learning for AD classification [8.8] アルツハイマー病(英語: Alzheimer's disease, AD)は、認知機能低下につながる神経変性疾患である。
本稿では,3次元マルチモーダルデータに適した最初の効率的な表現学習法であるContrastive Masked Vim Autoencoder (CMViM)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:02:41 GMT)
Exploring the Impact of the Output Format on the Evaluation of Large Language Models for Code Translation [8.8] 我々は、11の人気のある命令付き大規模言語モデル(LLM)の出力を経験的に分析する。
この結果から,プロンプトエンジニアリングと正規表現の戦略的組み合わせにより,モデル生成出力からソースコードを効果的に抽出できることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:41:31 GMT)
Concerned with Data Contamination? Assessing Countermeasures in Code Language Model [8.8] SEタスクのコード言語モデル(CLM)の機能を活用するために、さまざまなテクニックが提案されている。
データ汚染の脅威を軽減するために、さまざまな対策が提案されている。
汚染データと浄化データに対するCLMの性能差を調べた結果,これらの対策の効果について検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:10:25 GMT)
ProCQA: A Large-scale Community-based Programming Question Answering Dataset for Code Search [8.7] 本稿では,StackOverflowコミュニティから抽出した大規模プログラミング質問応答データセットProCQAを紹介する。
そこで本研究では,既存の言語モデルのテキストとコード表現のアライメントを改善するために,モダリティに依存しないコントラスト付き事前学習手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:34:33 GMT)
Diffusion-based Negative Sampling on Graphs for Link Prediction [8.7] リンク予測は、ソーシャルネットワーク分析やレコメンデーションシステムなど、Web上の重要なアプリケーションを用いたグラフ解析の基本的なタスクである。
本稿では,潜在空間からフレキシブルかつ制御可能な硬さのレベルを持つ負ノード生成を可能にする,マルチレベル負サンプリングの新しい手法を提案する。
条件拡散に基づくマルチレベル負サンプリング (DMNS) と呼ばれる本手法は, 拡散モデルのマルコフ連鎖特性を利用して, 可変硬度の複数レベルにおいて負のノードを生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:07:31 GMT)
Can Machine Translation Bridge Multilingual Pretraining and Cross-lingual Transfer Learning? [8.6] 本稿では,機械翻訳を言語表現学習の強化を目的とした継続的な学習目的として活用する可能性について検討する。
この結果から,機械翻訳の継続学習が言語間表現学習の強化に失敗することが明らかとなった。
言語横断シナリオにおける明示的な文レベルのアライメントは、言語間移動事前学習に有害である、と結論付けた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:53:04 GMT)
Differentially Private Online Federated Learning with Correlated Noise [8.3] 本稿では,時間的相関雑音を用いたオンラインフェデレーション学習のための新しい微分プライベートアルゴリズムを提案する。
本研究では,局所更新によるドリフト誤差を準強凸条件下で効果的に管理できることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:35:19 GMT)
Less Is More - On the Importance of Sparsification for Transformers and Graph Neural Networks for TSP [8.3] 本稿では,旅行セールスマン問題(TSP)の最も関連性の高い部分のみにエンコーダを集中させるデータ前処理手法を提案する。
本稿では,GNNの適切なスパーシフィケーションとアンサンブルによって,アーキテクチャ全体の性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:16:16 GMT)
Optimizing LiDAR Placements for Robust Driving Perception in Adverse Conditions [8.2] 前例のない状況下での運転認識システムの堅牢性は、安全クリティカルな使用に不可欠である。
そこで我々は,LiDAR配置最適化,データ生成,下流評価を含む全サイクルパイプラインであるPlace3Dを提案する。
各種悪天候およびセンサ故障条件下での3Dオブジェクト検出とLiDARセマンティックセマンティックセグメンテーションの両タスクにおいて,顕著なロバスト性を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:59:58 GMT)
Measuring Compliance with the California Consumer Privacy Act Over Space and Time [8.0] カリフォルニア州消費者プライバシ法(CCPA)は、オンラインビジネスが消費者に個人情報の販売と共有をオプトアウトするオプションを提供することを義務付けている。
私たちの研究は、カリフォルニア州プライバシー法(CPRA)が施行された後、複数の州にまたがってオプトアウトリンクの存在を自動的に追跡します。
調査対象のすべての州でオプトアウトリンクを早期に実装するWebサイトは多数存在するが,CCPAが有効である場合でもオプトアウトメソッドを提供しないCCPAサブジェクトWebサイトも多数存在する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:57:31 GMT)
Multi-Objective Quality-Diversity for Crystal Structure Prediction [7.9] 結晶構造は、電池から太陽電池まで、さまざまな領域で必須である。
結晶構造予測法は、エネルギー関数の世界の最小値にある最も安定な解を特定することに重点を置いている。
品質多様性アルゴリズムは、様々な特性を持つ高性能なソリューションの集合を見つけることを目的として、結晶構造予測のための有望な道を提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:29:04 GMT)
Ensemble Adversarial Defense via Integration of Multiple Dispersed Low Curvature Models [7.8] 本研究では,攻撃伝達性を低減し,アンサンブルの多様性を高めることを目的とする。
損失曲率を表す2階勾配を, 対向的強靭性の重要な要因として同定する。
本稿では,複数変数の低曲率ネットワークモデルをトレーニングするための新しい正規化器を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:44:36 GMT)
ContextSeg: Sketch Semantic Segmentation by Querying the Context with Attention [7.8] 本稿では、この問題を2段階に分けて扱うための、シンプルかつ高効率なアプローチであるContextSegについて述べる。
第1段階では、ストロークの形状と位置情報をよりよく符号化するために、オートエンコーダネットワークにおける余分な密度距離場を予測することを提案する。
第2段階では、全ストロークを単一のエンティティとして扱い、デフォルトのアテンション機構を備えた自動回帰変換器を用いて、同じ意味部分内でストロークのグループをラベル付けする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:54:18 GMT)
TwoStep: Multi-agent Task Planning using Classical Planners and Large Language Models [7.7] 2エージェント計画目標分解は、マルチエージェントPDDL問題を直接解決するよりも、計画時間の短縮につながる。
LLMに基づくサブゴールの近似は、人間の専門家が指定したものと同じようなマルチエージェント実行ステップを達成できることが判明した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:47:13 GMT)
Exploring ChatGPT and its Impact on Society [7.7] ChatGPTは大きな言語モデルであり、会話の文脈で人間のような応答を生成することができる。
それは、さまざまな産業に革命をもたらす可能性があり、テクノロジーとの対話の仕方を変革する。
しかし、ChatGPTの使用は、倫理的、社会的、雇用上の問題など、いくつかの懸念を提起している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:35:12 GMT)
Guided Distant Supervision for Multilingual Relation Extraction Data: Adapting to a New Language [7.6] 本稿では,ドイツにおける大規模生物関係抽出データセットの作成のために,遠距離監視法を適用した。
我々のデータセットは,9種類の関係型に対して80,000以上のインスタンスで構成されており,ドイツで最大規模の関係抽出データセットである。
私たちは、自動生成されたデータセット上に、最先端の機械学習モデルをトレーニングし、それらもリリースします。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:40:26 GMT)
STRUM-LLM: Attributed and Structured Contrastive Summarization [7.6] STRUM-LLMは2つのオプションが大きく異なり、ユーザの判断に最も影響を与える可能性のある属性を識別する。
我々の技術はドメインに依存しないものであり、人間のデータや固定属性リストを監督する必要がない。
STRUM-LLM Distilledは100倍のスループットを持ち、性能は10倍小さい。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:32:44 GMT)
Estimating Uncertainty in Landslide Segmentation Models [7.5] 地すべりは、繰り返し発生し、広範囲にわたる危険である。準備と緩和の努力は、世界規模でリスクの高い地域をカバーする高品質で大規模なデータセットによって助けられる。
近年,衛星画像からの地すべりセグメンテーションのためのディープラーニングモデルに焦点が当てられている。
高精度でロバストな不確実性推定は、自動生成した地すべりデータベースの低コストな監視を可能にし、エラーを解決し、厳しい負の例を特定し、ラベル付きトレーニングデータのサイズを増やすことができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:10:20 GMT)
DOCTR: Disentangled Object-Centric Transformer for Point Scene Understanding [7.5] ポイントシーン理解は、現実世界のシーンポイントクラウドを処理する上で難しいタスクです。
最近の最先端の手法はまず各オブジェクトを分割し、次に異なるサブタスクの複数のステージで独立に処理する。
本稿では,オブジェクト中心表現を探索するDECTR(Disentangled Object-Centric TRansformer)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:22:34 GMT)
CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation [7.5] CurbNetは検出を抑えるための新しいフレームワークで、ポイントクラウドセグメンテーションを利用している。
我々は7,100フレームからなる3D-Curbデータセットを開発した。
CurbNetは、わずか0.15mの許容率で0.95以上の例外的な平均値を達成したため、新しいベンチマークが確立された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:13:09 GMT)
Unleashing the Power of Self-Supervised Image Denoising: A Comprehensive Review [7.4] ディープラーニングの出現は、画像装飾技術に革命的変革をもたらした。
実世界のシナリオにおける教師付き手法のためのノイズクリーンなペアの獲得という永続的な課題は、いまだに厳しいままである。
本稿では,効率的な解決策を提供する自己教師型画像認識手法に焦点を当てる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:34:15 GMT)
denoiSplit: a method for joint image splitting and unsupervised denoising [7.4] denoiSplitは、共同セマンティックイメージ分割と教師なし denoising の課題に取り組む方法である。
画像分割は、イメージを識別可能なセマンティック構造に分割することを含む。
この課題に対する現在の最先端の手法は、画像ノイズの存在に苦慮していることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:54:33 GMT)
XAIport: A Service Framework for the Early Adoption of XAI in AI Model Development [7.2] 本稿では、説明可能なAI(XAI)の早期導入について、3つの特性に焦点をあてて提案する。
我々は、XAIのフレームワークであるXAIportをOpen APIにカプセル化し、モデル品質保証を学習するための観察として初期の説明を提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:22:06 GMT)
MetaSegNet: Metadata-collaborative Vision-Language Representation Learning for Semantic Segmentation of Remote Sensing Images [7.2] リモートセンシング画像の意味的セグメンテーションのためのメタデータ協調型マルチモーダルセグメンテーションネットワーク(MetaSegNet)を提案する。
一元的視覚データのみを使用する一般的なモデル構造とは異なり、自由なリモートセンシング画像メタデータから重要な特徴を抽出する。
画像エンコーダ,テキストエンコーダ,モーダルアテンション融合サブネットワークを構築し,画像とテキストの特徴を抽出し,画像とテキストのインタラクションを適用する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:25:35 GMT)
The Sample Complexity of Simple Binary Hypothesis Testing [7.1] 単純な二項仮説テストのサンプルの複雑さは、いずれの設定でも$p$と$q$の2つの分布を区別するのに必要となる最小のi.d.サンプルである。
この問題は、$alpha = beta$ (prior-free) または $alpha = 1/2$ (Bayesian) でのみ研究されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:42:32 GMT)
Neural Image Compression with Quantization Rectifier [7.1] 我々は,画像特徴相関を利用した画像圧縮のための新しい量子化法(QR)を開発し,量子化の影響を緩和する。
提案手法は,量子化された特徴量から未知の特徴量を予測するニューラルネットワークアーキテクチャを設計する。
評価では、QRを最先端のニューラルイメージコーデックに統合し、広く使用されているKodakベンチマークの強化モデルとベースラインを比較する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:26:09 GMT)
Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art [7.1] 意思決定タスクにおける基礎モデルの現状について論じる。
我々は、モデル決定の確実性を定量化できるシステムを後退して同時に設計する必要があると主張している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:11:02 GMT)
Uncertainty Quantification for Gradient-based Explanations in Neural Networks [6.9] ニューラルネットワークの説明の不確実性を確認するパイプラインを提案する。
このパイプラインを使用して、CIFAR-10、FER+、California Housingデータセットの説明分布を生成する。
修正画素挿入/削除のメトリクスを計算し、生成した説明の質を評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:56:02 GMT)
Sanity Checks for Explanation Uncertainty [6.9] 機械学習モデルの説明は解釈し難いり、間違っていたりすることがある。
本研究では,不確実性のある説明のために,重みとデータランダム化テストを定義した不確実性説明のための正当性チェックを提案する。
CIFAR10およびCalifornia Housingデータセットにおけるこれらの試験の有効性と有効性について実験的に検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:39:33 GMT)
Strategies to Improve Real-World Applicability of Laparoscopic Anatomy Segmentation Models [6.9] 腹腔鏡下手術データにおける画像分割モデルの現実的適用性向上戦略を提案する。
我々は,8つのセグメンテーション指標に対する,クラス特性(臓器の大きさの違い),トレーニングとテストデータ構成(正および負の例の表現),モデリングパラメータ(前景と背景のクラス重量)の影響を分析する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:08:26 GMT)
Can Large Language Models (or Humans) Distill Text? [6.9] テキストを蒸留するために,多種多様な言語モデル (LLM) を用いる。
感情を除去する強力なテストでは、処理されたテキストと感情の統計的関連性は、まだ明らかである。
また、人間のアノテータは、他のセマンティックコンテンツを保存しながら感情を蒸留するのにも苦労していることもわかりました。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:51:54 GMT)
Behind the Counter: Exploring the Motivations and Barriers of Online Counterspeech Writing [6.8] オンラインヘイトを標的にしていたことは、オンラインの反響行為を頻繁に起こす重要な要因だ。
人々は、異なる人口集団でオンラインのカウンタースピーチに参加するためのモチベーションと障壁が異なる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:56:35 GMT)
FOOL: Addressing the Downlink Bottleneck in Satellite Computing with Neural Feature Compression [6.8] 予測性能を保ったOECネイティブ・タスクに依存しない特徴圧縮手法を提案する。
FOOLはスループットを最大化するために高解像度の衛星画像を分割する。
低地球軌道における断続的に利用可能なネットワーク接続の特異性を含むことによって、転送コストの削減を広範囲に評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:14:48 GMT)
Exploring CausalWorld: Enhancing robotic manipulation via knowledge transfer and curriculum learning [6.7] 本研究では,指間の複雑な動きと協調を必要とする,学習に基づく三指ロボットアーム操作タスクについて検討する。
強化学習を利用することで、エージェントに熟練した操作に必要なスキルを習得するよう訓練する。
微調整とカリキュラム学習という2つの知識伝達戦略を,ソフトアクター・クリティカルなアーキテクチャで活用した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:19:19 GMT)
NSINA: A News Corpus for Sinhala [6.5] NSINAは、人気のあるシンハラのニュースサイトから50万記事の総合ニュースコーパスである。
NSINAはシンハラ最大のニュースコーパスで、現在まで利用可能である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:36:51 GMT)
Impact of Video Compression Artifacts on Fisheye Camera Visual Perception Tasks [6.5] 広視野の魚眼カメラ画像に標準映像圧縮が与える影響を初めて分析する。
魚眼画像のアーチファクトの性能を評価するために,放射状歪みを意識した地域計量法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:24:10 GMT)
Convergence of a model-free entropy-regularized inverse reinforcement learning algorithm [6.5] 逆強化学習(IRL)は、専門家が最適である報酬を回復することを目的としている。
本研究では,エントロピー規則化IRL問題を解くためのモデルフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:54:42 GMT)
Conformal Off-Policy Prediction for Multi-Agent Systems [6.3] マルチエージェントシステムに関わるOPP問題を解くための最初の共形予測手法であるMA-COPPを紹介する。
MA-COPPの重要な貢献は、エージェント軌道の出力空間の列挙や徹底的な探索を避けることである。
我々は,PetttingZooライブラリとF1TENTH自律走行環境のマルチエージェントシステムにおけるMA-COPPの有効性を評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:37:43 GMT)
SO(2)-Equivariant Downwash Models for Close Proximity Flight [6.3] 本稿では,この問題に潜伏する測地(対称性)を生かした下水力のモデリングのための,学習に基づく新しいアプローチを提案する。
実世界のフライトデータをわずか5分でトレーニングした場合、我々の幾何学的認識モデルは15分以上のデータでトレーニングされた最先端のベースラインモデルよりも優れていることを実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:21:25 GMT)
Effective Field Theories and Finite-temperature Properties of Zero-dimensional Superradiant Quantum Phase Transitions [6.2] 我々は,光物質相互作用系の実効場理論と有限温度特性を示す。
我々はまず、超ラジカル量子相転移をホストする最小モデルであるRabiモデルに焦点を当てる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:36:59 GMT)
Linear Cross-document Event Coreference Resolution with X-AMR [6.2] Event Coreference Resolution (ECR) は、自動システムや手動アノテーションに費用がかかる。
本稿では,イベントのグラフィカルな表現であるX-AMRを提案する。
次に、イベントグラフ上の新しいマルチホップコア参照アルゴリズムを用いて、ECRを線形化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:49:06 GMT)
ModeTv2: GPU-accelerated Motion Decomposition Transformer for Pairwise Optimization in Medical Image Registration [6.2] 変形可能な画像登録は、疾患の診断と画像誘導の介入を支援する医療画像において重要な役割を担っている。
従来の反復的手法は遅いが、ディープラーニング(DL)はソリューションを加速するが、ユーザビリティと精度の課題に直面している。
本研究では,従来の手法に類似した優れたペアワイズ最適化(PO)を示す改良型モーショントランスフォーマー(ModeTv2)演算子を用いたピラミッドネットワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:09:22 GMT)
Cell Variational Information Bottleneck Network [6.2] 本稿では,最新のフィードフォワードネットワークアーキテクチャと組み合わせることができる情報ボトルネック機構を用いた畳み込みニューラルネットワークを提案する。
セル変動情報ボトルネックネットワークは、不確実性のある特徴マップを生成するVIBセルを積み重ねて構築される。
より複雑な表現学習タスクである顔認識では、ネットワーク構造も非常に競争力のある結果を得た。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:50:07 GMT)
Bi-objective Optimization in Role Mining [6.1] ロールマイニング(Role mining)は、既存のポリシーからロールベースの認証ポリシーを導出する技術である。
まず、一般化ノイズロールマイニング問題(GNRM)を紹介する。
GNRM はパラメータ $r + k$ で固定パラメータ tractable であることを示し、$r$ はソリューション内のロールの数である。
次に、整数計画解法であるGurobiを用いてBO-GNRMの問題を解く実験結果について報告する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:36:20 GMT)
Optimal convex $M$-estimation via score matching [6.1] 実験的リスク最小化が回帰係数の下流推定における最適分散をもたらすデータ駆動凸損失関数を構築した。
半パラメトリック手法は、雑音分布の対数密度の導関数の導関数の最も少ない近似を目標とする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:23:19 GMT)
HAIFIT: Human-Centered AI for Fashion Image Translation [6.0] 本稿では,スケッチを高忠実なライフスタイルの衣料品画像に変換する新しいアプローチであるHAIFITを紹介する。
本手法は, ファッションデザインに欠かせない, 独特のスタイルの保存に優れ, 細部が複雑である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:41:07 GMT)
Investigation of the effectiveness of applying ChatGPT in Dialogic Teaching Using Electroencephalography [6.0] 大規模言語モデル(LLM)には、知識を解釈し、質問に答え、文脈を考える能力がある。
この研究は、34人の大学生を参加者として募集し、ランダムに2つのグループに分けられた。
実験群はChatGPTを用いて対話型指導を行い,コントロール群は人間教師と対話した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:23:12 GMT)
Evaluating Shortest Edit Script Methods for Contextual Lemmatization [6.0] 現代の文脈補綴器は、単語の形式を補題に変換するために、しばしば自動的に誘導された短い編集スクリプト(SES)に依存している。
これまでの研究では,SESが最終補修性能にどのような影響を及ぼすかは調査されていない。
ケーシング操作と編集操作を別々に計算することは、全体として有益であるが、高機能な形態を持つ言語には、より明確に有用であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:28:24 GMT)
Hyperspherical Classification with Dynamic Label-to-Prototype Assignment [6.0] トレーニング中に各プロトタイプに割り当てられたカテゴリを最適化する,シンプルで効果的な手法を提案する。
この最適化は、勾配降下とバイパルチドマッチングの逐次組み合わせを用いて解決する。
CIFAR-100では1.22%の精度で、ImageNet-200では2.15%の精度で競合他社よりも優れています。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:01:34 GMT)
Weak Convergence Analysis of Online Neural Actor-Critic Algorithms [5.8] オンラインアクター批判アルゴリズムでは、モデルの更新に伴ってデータサンプルの分布が動的に変化する。
本研究では,アクターニューラルネットワークと批評家ニューラルネットワークが,ランダムな初期条件を持つODEシステムの解に収束していることを証明する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:49:01 GMT)
Convert laser light into single photons via interference [5.8] レーザー光を単一光子に変換するエレガントな経路は、強い結合状態にある単一の原子を持つキャビティ内の光子遮断に基づいている。
本稿では、共振器結合から単一量子エミッタに放出される弱いが超束縛された非コヒーレント場と破壊的に干渉することにより、レーザ光を単一光子に変換する干渉ベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:58:48 GMT)
CADGL: Context-Aware Deep Graph Learning for Predicting Drug-Drug Interactions [5.6] 薬物・薬物相互作用(DDIs)は、薬物開発における重要な要素である。
我々は,CADGLという新しいフレームワークを導入することで,文脈認識深層グラフ学習の有効性を活用することで,課題に対処することを目指している。
カスタマイズされた変分グラフオートエンコーダ (VGAE) に基づいて, 重要な構造および物理化学的情報を取得する。
我々は厳格なケーススタディで支援された,臨床的に価値のある新規DDIの予測に長けている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:37:31 GMT)
INPC: Implicit Neural Point Clouds for Radiance Field Rendering [5.6] 現実世界のシーンを再現し、新しい視点で合成するための新しいアプローチを提案する。
本研究では,連続オクツリー型確率場とマルチ解像度ハッシュグリッドにおける点雲を暗黙的に符号化するハイブリッドシーン表現を提案する。
本手法は,対話的なフレームレートで高速な推論を実現し,さらに性能を高めるために露骨な点雲を抽出することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:26:32 GMT)
OffLanDat: A Community Based Implicit Offensive Language Dataset Generated by Large Language Model Through Prompt Engineering [5.6] OffLanDatはコミュニティベースの暗黙的な攻撃的な言語データセットである。
本稿では、暗黙の攻撃的言語を効果的に生成するプロンプトベースのアプローチを提案する。
他の研究者のために、コードとデータセットを公開します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:09:58 GMT)
Enhancing Graph Representation Learning with Attention-Driven Spiking Neural Networks [5.6] グラフ学習タスクのための従来のニューラルネットワークに代わる有望な代替手段として、スパイキングニューラルネットワーク(SNN)が登場している。
グラフ表現学習を改善するために,注意機構をSNNと統合した新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:15:10 GMT)
Elite360D: Towards Efficient 360 Depth Estimation via Semantic- and Distance-Aware Bi-Projection Fusion [5.6] 360度深度推定は全方位視野(FoV)による3次元再構成で注目されている。
最近のアプローチは、主に幾何学に基づく再射との相互射影融合に焦点を当てている。
本研究では,ERP画像とICOSAP(ICOSAP)点集合を非歪かつ空間連続的に入力する新しいフレームワークであるElite360Dを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:46:57 GMT)
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation [5.6] 視覚テキストを生成する能力は重要であり、学術的関心と幅広い実践的応用の両方を提供する。
我々はLenCom-Evalというベンチマークを導入し、Lengthy と Complex Visual Text を用いて画像を生成するモデルの性能をテストする。
ここでは,CLIPSスコア,OCR精度,リコール,F1スコア,精度,距離スコアの編集など,様々な評価指標に対する顕著な改善点を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:54:49 GMT)
Improving Diffusion Models's Data-Corruption Resistance using Scheduled Pseudo-Huber Loss [5.5] 本稿では,アウトレーヤに頑健でありながら,生成したデータの高品質な保存が可能な拡散損失関数を提案する。
時間依存パラメータによる擬似ハッカ損失は、画像領域と音声領域の両方で劣化したデータセットに対してより良い性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:02:43 GMT)
Variational Bayes image restoration with compressive autoencoders [5.5] 逆問題の正規化は、計算イメージングにおいて最重要となる。
最先端のプラグアンドプレイ法は、ニューラルデノイザによって提供される暗黙の正規化に依存している。
本稿では,潜時推定を行う変分ベイズ潜時推定(VBLE)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:04:17 GMT)
Explaining CLIP's performance disparities on data from blind/low vision users [5.5] 大型マルチモーダルモデル(LMM)は、視覚障害者(BLV)のための視覚支援の新たな時代を後押しする可能性を秘めている
しかし、これらのモデルはBLVユーザーが取得したデータに基づいて体系的に評価されていない。
ゼロショット分類タスクにおいて25のCLIP変種をテストし、その精度がWebcrawled画像よりもBLVユーザが取得した画像の平均15パーセント低いことを確認する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:51:14 GMT)
Enhanced Facet Generation with LLM Editing [5.4] 情報検索においては,ユーザクエリのファセット識別が重要な課題である。
従来の研究は,検索によって得られた検索文書や関連クエリを活用することで,ファセット予測を強化することができる。
しかし、検索エンジンがモデルの一部として動作する場合、他のアプリケーションに拡張することは困難である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:43:44 GMT)
Learning Transfers over Several Programming Languages [5.4] 言語間転送は、ソース言語からのデータを使用して、ターゲット言語でのモデルパフォーマンスを改善する。
本稿では,変圧器を用いた大規模言語モデルと11から41のプログラミング言語を用いた4つのタスクに関する広範な実験を報告する。
学習は、複数のプログラミング言語間でうまく伝達される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:14:07 GMT)
Policy Optimization finds Nash Equilibrium in Regularized General-Sum LQ Games [5.3] 本稿では,ジェネラルサム$N$エージェントゲームのナッシュ平衡に対する相対エントロピー正規化の導入の影響について検討する。
ゲーム内のNEの特異性に対して、エントロピー正則化の妥当性に基づいて十分な条件を導出する。
エントロピー正規化が不十分なシナリオでは,ゲーム内での$epsilon$-NEの達成を促進する$delta$-augmentation手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:45:28 GMT)
In the Search for Optimal Multi-view Learning Models for Crop Classification with Global Remote Sensing Data [5.1] 核融合戦略とエンコーダアーキテクチャの同時選択が地球規模の農地および作物タイプ分類に与える影響について検討した。
我々は5つの融合戦略(入力、特徴、決定、アンサンブル、ハイブリッド)と5つの時間エンコーダアーキテクチャ(LSTM、GRU、TempCNN、TAE、L-TAE)を可能なMVLモデル構成として使用する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:49:42 GMT)
ASDF: Assembly State Detection Utilizing Late Fusion by Integrating 6D Pose Estimation [5.1] アセンブリシナリオは、インサイトARビジュアライゼーションの恩恵を受け、ガイダンスを提供し、アセンブリ時間を短縮し、エラーを最小限にする。
我々は,リアルタイム能動オブジェクト検出フレームワークであるYOLOv8の長所の上に構築し,アセンブリ状態検出と組み合わせて6次元ポーズ推定の課題に対処する。
我々の評価は、Pose2Stateモジュールがアセンブリ状態の検出を改善し、アセンブリ状態の改善により、より堅牢な6Dポーズ推定がもたらされることを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:30:37 GMT)
HealthFC: Verifying Health Claims with Evidence-Based Medical Fact-Checking [5.1] HealthFCは、ドイツ語と英語で750件の健康関連クレームのデータセットで、医療専門家による正確さをラベル付けしている。
データセットの分析を行い、その特性と課題を強調します。
データセットは、将来の使用の可能性が高い、挑戦的なテストベッドであることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:33:37 GMT)
Advancing Speech Translation: A Corpus of Mandarin-English Conversational Telephone Speech [4.9] 本稿では,CallHome Mandarin 中国語データとHKUST Mandarin 中国語音声データの123時間サブセットに対する英訳について紹介する。
マンダリン英会話音声訓練セットに汎用翻訳モデルを微調整することで,目標領域BLEUを8点以上改善できることを実証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:08:06 GMT)
LSTTN: A Long-Short Term Transformer-based Spatio-temporal Neural Network for Traffic Flow Forecasting [4.9] 交通流の長期的・短期的表現を学習するためにLSTTN(Long-term Transformer-based Network)を提案する。
LSTTNは、予測結果を得るために、長期的傾向、周期的特徴、短期的特徴を融合する。
実験では、LSTTNは最低5.63%の改善を達成し、ベースラインモデルよりも最大16.78%改善した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:23:23 GMT)
NUMTEMP: A real-world benchmark to verify claims with statistical and temporal expressions [4.9] Numtempは数値的なクレームに特化したデータセットです。
我々は,数値クレームの検証作業において,既存の解の限界を評価し,定量化する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:36:03 GMT)
Proprioception Is All You Need: Terrain Classification for Boreal Forests [4.7] BorealTCはプロプリセプティブ・ベースの地形分類(TC)のための公開データセットである
Husky A200で記録されたデータセットには、慣性測定ユニット(IMU)の116分間、モータ電流、車輪の計測データが含まれています。
2つのTCデータセットの組み合わせは、地形の特性で解釈できる潜在空間が得られることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:42:09 GMT)
LAENeRF: Local Appearance Editing for Neural Radiance Fields [4.7] LAENeRFは、NeRFのフォトリアリスティックおよびノンフォトリアリスティックな外観編集のためのフレームワークである。
我々は、予想される線量から最終的な出力色へのマッピングを学習し、スタイルロスによって教師できる。
マッピングのために1光線当たりの1点を頼りにすることで、メモリ要件を制限し、高速な最適化を可能にします。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:09:09 GMT)
Frequency-dependent squeezing for gravitational-wave detection through quantum teleportation [4.6] 地中干渉計による重力波検出器は、弱い力に対する高精度なセンサーである。
現在の機器と将来の機器は、周波数依存の圧縮真空を検知ポートに注入することで、この制限に対処する。
本研究は、量子テレポーテーションと光の絡み合った状態の原理を用いた新しいスキームを紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:10:53 GMT)
Novel one-shot inner bounds for unassisted fully quantum channels via rate splitting [4.6] 本研究では,非アシスト型2値型量子多重アクセスチャネル(QMAC)と非アシスト型2値型2値型量子干渉チャネル(QIC)との絡み合いに量子情報を送信するための,最初の非自明な1ショット内界を証明した。
従来の研究は、iid制限として知られるチャネルの独立した多くの同一使用の限界において、非支援QMACについてのみ研究し、非支援QICについては全く研究しなかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:10:51 GMT)
Dia-LLaMA: Towards Large Language Model-driven CT Report Generation [4.6] 診断情報をガイダンスとして組み込むことで,CTレポート生成にLLaMA2-7Bを適用するためのフレームワークであるDia-LLaMAを提案する。
我々は,CTの高次元を考慮し,事前学習したVT3Dと知覚器を併用して視覚情報を抽出する。
報告生成のためのLCMを調整し,異常を強調するため,病原体記憶バンクを参照して,追加の診断情報を抽出する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:02:51 GMT)
Medical Image Registration and Its Application in Retinal Images: A Review [4.6] 本稿では,従来型および深層学習に基づく医用画像登録手法の総合的なレビューを行う。
また、網膜画像登録の現在の課題についても論じ、今後の研究への洞察と展望を提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:35:28 GMT)
SCOD: From Heuristics to Theory [4.5] 本稿では,不確かさやアウト・オブ・ディストリビューション・サンプルに直面する場合の予測を無視する信頼性のある予測モデルを設計する上での問題に対処する。
SCOD(Out-of-Distribution Data)の存在下では,選択分類に3つの重要な貢献をしている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:36:13 GMT)
A neural network approach for two-body systems with spin and isospin degrees of freedom [4.5] 本研究では,2体システムの基底状態を計算するための強化された機械学習手法を提案する。
この方法の妥当性は、重陽子の一意な有界状態を計算することによって検証される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:46:49 GMT)
Remote Cooling of Spin-ensembles Coupled to a Spin-mechanical Hybrid Interface [4.4] 本稿では,スピンアンサンブル,発振器,単一プローブスピンからなるハイブリッド量子系の基底状態冷却プロトコルを提案する。
本研究は, 大きなスピンアンサンブルを冷却・分極する実用的なソリューションの開発に寄与する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:01:28 GMT)
GOLF: Goal-Oriented Long-term liFe tasks supported by human-AI collaboration [4.4] ChatGPTと類似の大規模言語モデル(LLM)は、人間とAIの相互作用と情報探索プロセスに革命をもたらした。
本研究は,LLM機能の範囲を日常的なタスク自動化を超えて拡張し,長期的,重要なライフタスクのユーザを支援する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:25:10 GMT)
Distributed collaborative anomalous sound detection by embedding sharing [4.3] 本稿では,複数のクライアントが協調して異常音検出モデルを学習する手法について検討する。
提案手法では,各クライアントが音響データ分類のために開発した共通事前学習モデルを用いて埋め込みを計算する。
実験の結果,提案手法は異常音検出のAUCを平均6.8%改善することがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:40:04 GMT)
Bridging the Novice-Expert Gap via Models of Decision-Making: A Case Study on Remediating Math Mistakes [4.2] 我々は、認知タスク分析を用いて、専門家の潜在思考プロセスを、修復のための意思決定モデルに変換する。
これには、(A) 学生の誤り、(B) 修復戦略、(C) 反応を生成する前の意図を特定する専門家が含まれる。
我々は,700件の実際の学習談話のデータセットを構築し,その判断に専門家が注釈を付けた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:56:39 GMT)
Time-Efficient and Identity-Consistent Virtual Try-On Using A Variant of Altered Diffusion Models [4.0] 本研究は, 多様なシナリオにおいて, 複雑なテクスチャの詳細と, 対象者と衣服の特徴的な特徴を保存することの課題を強調した。
様々な既存アプローチが検討され、制限と未解決の側面を強調している。
次に,仮想試行中にテクスチャのテクスチャ保存とユーザアイデンティティ保持に対処する,新しい拡散型ソリューションを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:48:28 GMT)
Enhancing Industrial Transfer Learning with Style Filter: Cost Reduction and Defect-Focus [4.0] スタイルフィルタ(Style Filter)は、産業の文脈に合わせた方法論である。
ラベルのない操作、事前知識への依存の最小化、特定のモデルからの独立、再活用を提供する。
実世界の産業応用におけるスタイルフィルタの有効性を実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:38:17 GMT)
Multi-attention Associate Prediction Network for Visual Tracking [4.0] 分類回帰予測ネットワークは、いくつかの現代のディープトラッカーにおいて驚くべき成功を収めている。
分類と回帰タスクには固有の違いがあるため、特徴マッチングの要求にも反対の要求がある。
上記の問題に対処するために,マルチアテンションアソシエイト予測ネットワーク(MAPNet)を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:18:58 GMT)
Time Series Compression using Quaternion Valued Neural Networks and Quaternion Backpropagation [3.9] 本稿では,長い時系列をデータセグメントに分割する4元時間時系列圧縮手法を提案する。
我々は,これらのチャンクのミン,マックス,平均,標準偏差を代表的特徴として抽出し,四元数でカプセル化する。
この時系列は、四重項値ニューラルネットワーク層を用いて処理される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:34:40 GMT)
Conversational Grounding: Annotation and Analysis of Grounding Acts and Grounding Units [3.8] 本稿では, 接地法, 接地法, 接地単位を用いた2つの対話コーパスのアノテーションと, それらの接地度を測る尺度について述べる。
我々の研究は、日常の対話において機械との会話をよりよく理解し、信頼性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:39:18 GMT)
ToXCL: A Unified Framework for Toxic Speech Detection and Explanation [3.8] ToXCLは暗黙の有毒音声の検出と説明のための統合されたフレームワークである。
ToXCLは、新しい最先端の有効性を実現し、ベースラインを大幅に上回る。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:21:38 GMT)
A Novel Loss Function-based Support Vector Machine for Binary Classification [3.8] サポートベクトルマシン分類器($ell_s$-SVM)を構築するための新しいスライド損失関数(ell_s$)を提案する。
近似定常点の概念を導入し、リプシッツ連続性の性質を利用することにより、$ell_s$-SVM に対する一階最適条件を導出する。
我々は, $ell_s$-SVM を効率的に処理するために, 演算セットと乗算器の高速交互方向法を考案した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:42:01 GMT)
Automatic Construction of a Large-Scale Corpus for Geoparsing Using Wikipedia Hyperlinks [3.8] 本稿では,ウィキペディアの記事からジオパーシングのための大規模コーパスを構築するための新しい手法であるウィキペディアハイパーリンクベースの位置情報リンク(WHLL)を提案する。
WHLLコーパスは1.3Mの記事で構成され、それぞれ7.8のユニークな位置表現を含んでいる。
位置表現の45.6%は曖昧であり、同じ表記の複数の位置を指す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:08:13 GMT)
Align-to-Distill: Trainable Attention Alignment for Knowledge Distillation in Neural Machine Translation [3.8] 本稿では,機能マッピング問題に対処するためのA2D(Align-to-Distill)戦略を紹介する。
実験の結果,WMT-2022->DsbおよびWMT-2014 En->Deに対して,最大3.61点,+0.63点のBLEU値が得られた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:46:15 GMT)
Speeding Up Path Planning via Reinforcement Learning in MCTS for Automated Parking [3.8] 本稿では,モンテカルロ木探索を用いた強化学習パイプラインを提案する。
状態の価値を反復的に学習することにより、与えられた状態に対する値推定器とポリシー生成器をモデル化することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:21:23 GMT)
SeSaMe: A Framework to Simulate Self-Reported Ground Truth for Mental Health Sensing Studies [3.7] メンタルモデル (SeSaMe) は、デジタルメンタルヘルス研究における参加者の負担を軽減する枠組みである。
事前訓練された大規模言語モデル(LLM)を活用することで、SeSaMeは参加者の心理的尺度に対する反応のシミュレーションを可能にする。
本稿では,GPT-4を用いて1つのスケールで応答をシミュレートするSeSaMeの応用例を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:48:22 GMT)
Encoding of lexical tone in self-supervised models of spoken language [3.7] 本稿では,音声言語モデル(SLM)のトーン符号化機能の解析を目的とした。
SLMは、非音節言語からのデータに基づいて訓練された場合でも、語彙のトーンをかなりの程度にエンコードすることを示す。
SLMは音色や子音の知覚研究において、母国人や非母国人と同様に振る舞う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:28:38 GMT)
Preference as Reward, Maximum Preference Optimization with Importance Sampling [3.7] 我々は、重要サンプリングの観点から、単純で直感的な非政治的選好最適化アルゴリズムを提案し、これを最大選好最適化(MPO)と呼ぶ。
MPOは、RLHFとIPOの目的を、独占的アルゴリズムであると同時に組み合わせることで、両方の世界のベストを達成している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:32:49 GMT)
Semantically Enriched Cross-Lingual Sentence Embeddings for Crisis-related Social Media Texts [3.7] 危機関連ソーシャルメディアテキストのセマンティック検索やクラスタリングなどのタスクは、危機談話の理解を深める。
事前訓練された言語モデルは危機情報学において高度な性能を持つが、文脈埋め込みには意味のある意味が欠けている。
本稿では,危機関連ソーシャルメディアテキストを50以上の言語に埋め込んだ多言語文エンコーダを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:44:38 GMT)
Geometric Generative Models based on Morphological Equivariant PDEs and GANs [3.6] 群畳み込みニューラルネットワーク(G-CNN)のための等変偏微分方程式(PDE)に基づく幾何学的生成モデルを提案する。
提案手法は, PDE-G-CNNにおける形態的同変畳み込みを用いて, GM-GAN (Geological morphological GAN) を求める。
予備的な結果は、GM-GANモデルが古典的GANより優れていることを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:46:03 GMT)
An Experiment with the Use of ChatGPT for LCSH Subject Assignment on Electronic Theses and Dissertations [3.6] この研究は、学術図書館でカタログ化を待っている項目のバックログに対して、LLM(Large Language Models)が戦略的に応答できることを示した。
LLMによるLCSHの妥当性, 徹底性, 特異性を検証し, 向上するためには, ヒトカタログは依然として不可欠である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:04:52 GMT)
InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents [3.5] IPI攻撃に対するツール統合LDMエージェントの脆弱性を評価するためのベンチマークであるInjecAgentを紹介する。
InjecAgentは17の異なるユーザーツールと62の攻撃ツールをカバーする1,054のテストケースで構成されている。
エージェントはIPI攻撃に対して脆弱であり、ReAct-prompted GPT-4は24%の時間攻撃に対して脆弱である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:25:10 GMT)
3D-EffiViTCaps: 3D Efficient Vision Transformer with Capsule for Medical Image Segmentation [3.4] 本稿では,U字型3Dエンコーダデコーダネットワークである3D-EffiViTCapsを提案する。
エンコーダはカプセルブロックとEfficientViTブロックを使用して局所的およびグローバルなセマンティック情報を共同でキャプチャする。
我々のデコーダはCNNブロックとEfficientViTブロックを使用してセグメンテーションのフナーの詳細をキャッチします。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:59:35 GMT)
State Space Models as Foundation Models: A Control Theoretic Overview [3.3] 近年、ディープニューラルネットワークアーキテクチャにおける線形状態空間モデル(SSM)の統合への関心が高まっている。
本論文は、制御理論者のためのSSMベースのアーキテクチャの穏やかな導入を目的としたものである。
もっとも成功したSSM提案の体系的なレビューを提供し、コントロール理論の観点から主要な特徴を強調している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:10:47 GMT)
A Hybrid Approach To Aspect Based Sentiment Analysis Using Transfer Learning [3.3] 本稿では,移動学習を用いたアスペクトベース感性分析のためのハイブリッド手法を提案する。
このアプローチは、大きな言語モデル(LLM)と従来の構文的依存関係の両方の長所を利用して、弱い教師付きアノテーションを生成することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:02:33 GMT)
"It is there, and you need it, so why do you not use it?" Achieving better adoption of AI systems by domain experts, in the case study of natural science research [3.3] 人工知能(AI)は、医学や自然科学研究などの分野で普及しつつある。
しかし、実際にAIシステムが実装されている場合、ドメインの専門家はそれを拒否することが多い。
自然科学研究において、科学者によるAI対応システムの非効果的な使用は、データを分析して研究を進めるのを妨げる可能性がある。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:06:31 GMT)
A Comparative Analysis of Visual Odometry in Virtual and Real-World Railways Environments [3.3] 本稿では,仮想合成環境と実世界のシナリオの両方に適用したSLAMアルゴリズムの性能の比較分析を行う。
その結果,鉄道領域における認識タスクの促進に向けたグラフィックシミュレーションの可能性と可能性を強調した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:18:12 GMT)
Harnessing the power of LLMs for normative reasoning in MASs [3.2] 大きな言語モデル(LLM)は、標準に対してリッチで表現力豊かな語彙を提供する。
LLMはノルム発見、規範的推論、意思決定といった様々なタスクを実行できる。
本研究の目的は,MAS,NLP,LLM研究者の協力を得て,規範的エージェントの分野を推し進めることである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:09:01 GMT)
Real-time Adaptation for Condition Monitoring Signal Prediction using Label-aware Neural Processes [3.1] リアルタイム状態監視(CM)信号に迅速に適応する予測モデルの構築は、エンジニアリングシステムやユニットにとって重要である。
現在の手法は、オンライン設定における表現力とアジリティのトレードオフに悩まされている。
このトレードオフに対処するニューラルプロセスベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:47:29 GMT)
DeepMachining: Online Prediction of Machining Errors of Lathe Machines [3.1] 深層学習に基づくAIシステムDeepMachiningについて述べる。
我々の知る限りでは、この研究は、学習済みの深層学習モデルを用いて、機械の加工誤差を予測する最初の工場実験の1つである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:30:54 GMT)
Exploring the Generalization of Cancer Clinical Trial Eligibility Classifiers Across Diseases [3.1] 本研究は, 幅広い臨床試験範囲において, 資格分類の一般化可能性を評価することを目的とする。
本研究は,(1)第3相臨床試験,(2)第1相臨床試験,(2)第2相臨床試験,(3)心臓病臨床試験,(4)第2型糖尿病臨床試験,(5)任意の疾患に対する観察試験の5種類の検査基準データをまとめた。
以上の結果から, がんデータセットに基づいてトレーニングしたモデルでは, 自己免疫疾患などの非がん臨床試験で一般的に見られる基準を効果的に扱えることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:17:59 GMT)
Enhancing UAV Security Through Zero Trust Architecture: An Advanced Deep Learning and Explainable AI Analysis [3.1] 本研究は,無人航空機(UAV)の安全性を高めるため,ゼロトラストアーキテクチャ(ZTA)を実装する必要性を強調した。
無人航空機(UAV)の検出・同定における手法の精度は84.59%である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:32:22 GMT)
Reflecting the Male Gaze: Quantifying Female Objectification in 19th and 20th Century Novels [3.1] 本稿では,性別の偏見を女性客観化の観点から分析する枠組みを提案する。
我々の枠組みは2つの軸に沿って女性の客観性を測定する。
私たちの枠組みを19世紀と20世紀の小説に適用すると、女性の客観化の証拠が明らかになる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:16:14 GMT)
Design Patterns for Multilevel Modeling and Simulation [3.0] マルチレベルモデリングとシミュレーション(M&S)は、この方法論がもたらす利点により、ますます関連性が高まっている。
本稿では,多段階モデルの設計と実装のための体系的なアプローチを提供する設計パターンの集合について述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:51:22 GMT)
TEI2GO: A Multilingual Approach for Fast Temporal Expression Identification [2.9] TEI2GOモデルを導入し、HeidelTimeの有効性に匹敵するが、実行時間を大幅に改善した。
TEI2GOモデルをトレーニングするために,手動で注釈付けされた参照コーパスと,HeidelTimeに注釈付けされたニューステキストの包括的弱ラベル付きコーパスであるHeidelTime''を開発した。
コード、アノテーション、モデルは、コミュニティの探索と使用のために公開されています。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:23:03 GMT)
Carbon Footprint Reduction for Sustainable Data Centers in Real-Time [2.8] 本稿では, 炭素フットプリント削減, エネルギー消費, エネルギーコストの目的のために, データセンターを最適化するための多エージェント強化学習(MARL)フレームワークを提案する。
その結果,DC-CFR MARLエージェントは実世界の動的気象条件やグリッド炭素強度条件下での様々な場所での冷却,負荷シフト,エネルギー貯蔵の最適化において,複雑な相互依存性を効果的に解決した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:49:07 GMT)
Dissolution of the non-Hermitian skin effect in one-dimensional lattices with linearly varying nonreciprocal hopping [2.8] 線形に異なる非相互ホッピングを持つ一次元非エルミート格子について検討する。
非ヘルミチアン皮膚効果(NHSE)は非相反性の強さが増加するにつれて徐々に溶解する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:36:00 GMT)
BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis [2.7] BioNeRFは3D表現でシーンをモデル化し、放射場を通して新しいビューを合成する生物学的にもっともらしいアーキテクチャである。
BioNeRFは、複数のソースからの入力をメモリのような構造に融合させる、認知にインスパイアされたメカニズムを実装している。
実験の結果,BioNeRFは人間の知覚を符号化する品質指標に関して,最先端の結果よりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:58:45 GMT)
Holographic Gaussian Boson Sampling with Matrix Product States on 3D cQED Processors [2.7] 3D cQEDプロセッサ上でのマルチモード状態ベクトルのシミュレーションのための量子回路を導入する。
モード数が少ないcQEDデバイスはマルチモードシステムのシミュレートに使用できることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:32:40 GMT)
Spectral clustering in the Gaussian mixture block model [2.7] 本研究では,高次元ガウス混合ブロックモデルから得られたクラスタリングと埋め込みグラフについて検討する。
このようなグラフに対する標準スペクトルクラスタリングと埋め込みアルゴリズムの性能を解析する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:47:57 GMT)
Joint chest X-ray diagnosis and clinical visual attention prediction with multi-stage cooperative learning: enhancing interpretability [2.6] 胸部X線検査における関節疾患診断のための新しい深層学習フレームワークと対応する視力マップの予測について紹介する。
具体的には、DenseNet201バックボーンとResidualおよびSqueeze-and-Excitationブロックベースのエンコーダの両方を活用する、新しいデュアルエンコーダマルチタスクUNetを設計した。
実験の結果,提案手法は胸部X線診断や視力マップの精度に優れていた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:31:12 GMT)
Return to Tradition: Learning Reliable Heuristics with Classical Machine Learning [2.6] 持ち上げ計画タスクのグラフ表現を新たに構築し,WLアルゴリズムを用いて特徴量を生成する。
我々の新しいアプローチであるWL-GOOSEは、論理をスクラッチから確実に学習し、公正な競争条件で$htextFF$を上回ります。
LAMAは10ドメイン中4ドメイン、プラン品質では10ドメイン中7ドメインでパフォーマンスや関連性も優れています。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:47:52 GMT)
The Implications of Decentralization in Blockchained Federated Learning: Evaluating the Impact of Model Staleness and Inconsistencies [2.6] ブロックチェーンのような民主的な環境にフェデレートされた学習のオーケストレーションをアウトソーシングすることの実践的意義について検討する。
シミュレーションを用いて、よく知られたMNISTとCIFAR-10データセットに2つの異なるMLモデルを適用することにより、ブロックチェーンFL動作を評価する。
以上の結果から,モデルの不整合がモデルの精度に及ぼす影響(予測精度の最大35%低下)が示唆された。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:07:13 GMT)
A Second Look on BASS -- Boosting Abstractive Summarization with Unified Semantic Graphs -- A Replication Study [2.6] 本稿では,統一意味グラフの概念に基づく抽象的な要約システムであるBASSフレームワークの詳細な複製について述べる。
本研究は、キーコンポーネントの複製における課題と、新しいコンポーネントの複製に根ざしたエラーソースを系統的に分離するアブレーション研究を含む。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:07:13 GMT)
DeepKnowledge: Generalisation-Driven Deep Learning Testing [2.5] DeepKnowledgeは、DNNベースのシステムの体系的なテスト手法である。
堅牢性を高め、'ブラックボックス'モデルの残留リスクを低減することを目的としている。
本報告では, 対人攻撃検出のための最先端のサーベイ基準に対して, 最大10ポイントの改善を報告した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:46:09 GMT)
Revisiting the Mapping of Quantum Circuits: Entering the Multi-Core Era [2.5] 本稿では,コア間通信の削減を目的として,コアへのキュービット割り当てを最適化するために設計されたマルチコアマッピングアルゴリズムである,ハンガリークビット割り当て(HQA)アルゴリズムを紹介する。
モジュラーアーキテクチャの最先端回路マッピングアルゴリズムに対するHQAの評価では、実行時間と非ローカル通信の点で4.9times$と1.6times$の改善が示されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:31:39 GMT)
Towards a Formalisation of Value-based Actions and Consequentialist Ethics [2.5] 本稿ではSTRIPSの形式化に基づくアクション・フレームワークを提案する。
技術的には、コントリビューションは価値に基づく形式推論の観点でアクションを表現する。
この貢献は、連続主義倫理の形式のための計算フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:56:48 GMT)
Engagement Measurement Based on Facial Landmarks and Spatial-Temporal Graph Convolutional Networks [2.4] 本稿では,ビデオからのエンゲージメント測定のための新しいプライバシ保護手法を提案する。
MediaPipeのディープラーニングソリューションを通じてビデオから抽出された、個人識別可能な情報を持たない顔のランドマークを使用している。
提案するアプローチは、仮想学習プラットフォームにデプロイされ、リアルタイムでエンゲージメントを測定することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:43:23 GMT)
Fix-Con: Automatic Fault Localization and Repair of Deep Learning Model Conversions between Frameworks [2.4] 本稿では,ディープラーニングフレームワーク間のモデル変換において,フォールトローカライズと修正のための自動アプローチであるFix-Conを提案する。
Fix-Conは、変換中にモデル入力、パラメータ、ハイパーパラメータ、モデルグラフに導入された障害を検出し、修正することができる。
本研究では,4つのディープラーニングフレームワーク間で変換された3つの画像認識モデルのモデル変換バグの修正におけるFix-Conの有効性を評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:13:44 GMT)
Fault Localization for Buggy Deep Learning Framework Conversions in Image Recognition [2.4] 本稿では,バグの多いディープラーニングフレームワーク変換のフォールトローカライズと修復に向けて,新しいアプローチを提案する。
我々は,Apache TVMディープラーニングコンパイラ上で,InceptionV3のTFからTFLiteへの変換のための予備的なフォールトローカライズ解析を行うことにより,本手法を実装した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:23:11 GMT)
DeltaNN: Assessing the Impact of Computational Environment Parameters on the Performance of Image Recognition Models [2.4] リアルタイム画像認識タスクの失敗は、ハードウェアアクセラレーターのサブ最適マッピングによって起こりうる。
差分テストフレームワーク DeltaNN を用いて,異なる計算環境パラメータが画像認識モデルの性能に与える影響を評価する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:08:25 GMT)
Deep fused flow and topology features for botnet detection basing on pretrained GCN [2.3] グラフ畳み込みネットワーク(GCN)を用いてフロー特徴とトポロジー特徴を融合するボットネット検出モデルを提案する。
我々の手法では、C2ボットネットでは92.90%、F1スコアは92.76%、リコールレートは94.66%、F1スコアは92.35%である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:05:36 GMT)
Rank, Pack, or Approve: Voting Methods in Participatory Budgeting [2.3] スタンフォード参加予算プラットフォームは、150以上の予算プロセスで住民を巻き込むために使われてきた。
ここでは,K-approval,K- rank,knapsackプライマリ・バロットを用いて,これらのプロセスから匿名化された予算意見のデータセットを提示する。
投票方法が異なる投票方法を用いた投票ペアを用いて,選択したプロジェクトのコストに対する投票方法の効果を分析する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:18:45 GMT)
A Mixed Method Study of DevOps Challenges [2.3] DevOpsに関する議論を含む174K SOポストにトピックモデリングを適用することで、実証的研究を行う。
次に、専門家のDevOps実践者21人を対象に、実証的研究結果の検証と拡張を行いました。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:35:40 GMT)
A Call to Reflect on Evaluation Practices for Age Estimation: Comparative Analysis of the State-of-the-Art and a Unified Benchmark [2.2] 我々は、最先端の顔年齢推定法について、広範囲に比較分析を行う。
その結果,他の要因と比較すると,手法間の性能差は無視できることがわかった。
バックボーンモデルとしてFaRLを用い,すべての公開データセット上での有効性を実証する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:31:33 GMT)
Real-time Neuron Segmentation for Voltage Imaging [2.2] 画像サイズが制限された1分間の録音では、数万のフレームからなるビデオデータのギガバイトが生成されるため、処理に時間がかかる。
ノイズの多いビデオフレームから複数重重なりうるスパイクニューロンを検出できる高速ニューロン分割法を提案する。
我々のパイプラインは、散らばったデータセットから、人間のアノテーションによく一致するニューロンのフットプリントを抽出し、単一のデスクトップコンピュータ上で、電圧画像データのリアルタイム処理を初めて示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:46:06 GMT)
TrustAI at SemEval-2024 Task 8: A Comprehensive Analysis of Multi-domain Machine Generated Text Detection Techniques [2.1] 大規模言語モデル(LLM)は、幅広いユーザクエリにまたがる流動的なコンテンツを生成する。
この能力は、誤情報や個人情報の漏洩に関する懸念を引き起こしている。
本稿では,SemEval2024 Task8に対する提案手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:09:03 GMT)
AI-Generated Video Detection via Spatio-Temporal Anomaly Learning [2.1] ユーザは、偽情報を拡散するために、既存のないビデオを簡単に作成できる。
モデルトレーニングと評価のためのベンチマークとして,大規模ビデオデータセット(GVD)を構築した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:26:18 GMT)
Revealing Vulnerabilities of Neural Networks in Parameter Learning and Defense Against Explanation-Aware Backdoors [2.1] ブラディング攻撃は、機械学習アルゴリズムの予測と説明を大きく変える可能性がある。
我々は統計的解析を利用して、目隠し攻撃後のCNN内のCNN重みの変化を明らかにする。
本研究では,評価段階における攻撃の有効性を限定する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:36:10 GMT)
Backpropagation through space, time, and the brain [2.1] 機械学習において、この解答は、空間(BP)と時間(BPTT)の両方を通して、ほぼ普遍的に誤差のバックプロパゲーション随伴によって与えられる。
我々は、ニューロンの物理的、動的ネットワークにおける完全局所的時間的クレジット割り当てのための計算フレームワークであるGeneral Latent Equilibrium (GLE)を紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:57:02 GMT)
Quantum mechanical modeling of the multi-stage Stern$\unicode{x2013}$Gerlach experiment conducted by Frisch and Segrè [2.1] フリッシュとセグレの実験は、核効果のないラビアナによって分析的にモデル化され、その後、超微粒子相互作用によって修正された。
我々は、スピンの超微細相互作用時間を含むフォン・ノイマン方程式を用いて、標準的な量子力学モデルを解く。
一致を改善する非標準変種を議論するために検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:03:16 GMT)
All Artificial, Less Intelligence: GenAI through the Lens of Formal Verification [2.0] 本稿では,現代のハードウェア設計における共通弱さ(CWE)の形式的検証に焦点を当てる。
ハードウェア設計を脆弱性またはCWEフリーに分類するために,形式検証を適用する。
我々は、識別された脆弱性を、6万の生成したSystemVerilog Register Transfer Level (RTL)コードに対してCWE番号に関連付けている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:23:24 GMT)
Multimodal Physical Fitness Monitoring (PFM) Framework Based on TimeMAE-PFM in Wearable Scenarios [2.0] 本稿では,改良されたTimeMAEに基づくマルチモーダルPFMフレームワークを提案する。
時系列データを低次元の潜在空間に圧縮し、自己強調型アテンションモジュールを統合する。
その結果、70.6%の精度と82.20%のAUCが、他の最先端の時系列分類モデルを上回った。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:23:43 GMT)
An Undergraduate Consortium for Addressing the Leaky Pipeline to Computing Research [1.9] この経験報告では、最初の学生コンソーシアム(UC)について記述する。
UCは、特に歴史的に疎外されたグループの学生を募集することで、AI研究コミュニティへの参加を広げることを目指している。
本稿では,エビデンスに基づく実践の豊富なセットにインスパイアされたプログラム設計と,UCが望む成果の多くを達成していることを示す初年度の予備的評価について述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:43:43 GMT)
On the resilience of Collaborative Learning-based Recommender Systems Against Community Detection Attack [1.9] フェデレートラーニング(FL)やゴシップラーニング(GL)といった協調学習技術の成功により、協調学習に基づく推薦システムが登場した。
これらのシステムでは、ユーザはデバイス上で消費されたアイテムの履歴を維持しながらレコメンデーションシステムのトレーニングに参加します。
最近の研究で、協調学習は様々なプライバシー攻撃に弱いことが判明している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:00:38 GMT)
Temporal and Semantic Evaluation Metrics for Foundation Models in Post-Hoc Analysis of Robotic Sub-tasks [1.8] 本稿では,トラジェクトリデータを時間的境界と自然言語に基づく記述サブタスクに分解するフレームワークを提案する。
我々のフレームワークは、全軌道を構成する低レベルのサブタスクに対して、時間ベースの記述と言語ベースの記述の両方を提供する。
この尺度は2つのサブタスク分解の間の言語記述の時間的アライメントと意味的忠実度を測定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:39:20 GMT)
Triple-CFN: Restructuring Conceptual Spaces for Enhancing Abstract Reasoning process [1.8] 抽象推論問題は人工知能アルゴリズムに重大な課題をもたらす。
本研究は、ボンガード・ローゴ問題に取り組むためのトリプル-CFNアプローチを紹介する。
また,問題空間を明示的に構成するMeta Triple-CFNネットワークを開発した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:40:39 GMT)
Solving the bongard-logo problem by modeling a probabilistic model [1.8] 抽象推論問題は、AIアルゴリズムの知覚的および認知的能力に挑戦する。
本研究は、ボンガード・ローゴ問題に適した確率モデルであるPMoCを紹介する。
また、複雑な抽象的推論タスクのための拡張Transformer-EncoderであるPose-Transformerを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:42:22 GMT)
D4C glove-train: solving the RPM and Bongard-logo problem by distributing and Circumscribing concepts [1.8] 本稿では,RPM問題を解決する新しいベースラインモデルLico-Netを紹介する。
我々は、分布を通して抽象的推論問題において基礎となる概念を提唱するD3Cアプローチを推進している。
D3Cの計算効率を高めるために,D3C-cos変種を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:38:42 GMT)
From Words and Exercises to Wellness: Farsi Chatbot for Self-Attachment Technique [1.8] 私たちはFarsiでセルフアタッチメント(SAT)を通じてユーザを誘導する音声対応ロボットを開発した。
6000以上の発話のデータセットを収集し、ユーザー感情を12クラスに分類する新しい感情分析モジュールを開発し、精度は92%以上である。
当社のプラットフォームは,ほとんどのユーザ(75%),72%がインタラクションの後に気分が良くなり,74%がSAT Teacherのパフォーマンスに満足していた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:08:53 GMT)
EDUE: Expert Disagreement-Guided One-Pass Uncertainty Estimation for Medical Image Segmentation [1.8] 本稿では,医用画像分割のためのエキスパート診断誘導不確実性推定(EDUE)を提案する。
複数のラッカーからの接地構文アノテーションの可変性を活用することにより、トレーニング中のモデルをガイドし、ランダムサンプリングに基づく戦略を取り入れ、校正信頼性を高める。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:13:52 GMT)
An End-to-End Structure with Novel Position Mechanism and Improved EMD for Stock Forecasting [1.7] 既存の研究は主に個々の株式情報に焦点を当てているが、株価情報や株価データの高ノイズを無視している。
本稿では,株式情報と個別株式情報の両方を考慮に入れた注目機構を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:23:22 GMT)
A Transfer Attack to Image Watermarks [1.7] 本研究では,Non-box設定における画像透かしに対する新しい転送回避攻撃を提案する。
私たちの主な貢献は、理論的にも経験的にも、透かしベースのAI生成画像検出器は、回避攻撃に対して堅牢ではないことを示すことです。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:06:08 GMT)
Co-Occurring of Object Detection and Identification towards unlabeled object discovery [1.6] 本稿では,複数ラベルオブジェクトカテゴリのベースオブジェクトと協調して生成するオブジェクトを同定するための,新しいディープラーニングに基づくアプローチを提案する。
我々はPascal VOCとMS-COCOの2つの公開データセットで実験を行った。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:53:36 GMT)
FLIGAN: Enhancing Federated Learning with Incomplete Data using GAN [1.6] Federated Learning (FL)は、ネットワークデバイス上での機械学習モデルの分散トレーニングのためのプライバシ保護メカニズムを提供する。
本稿では,FLにおけるデータ不完全性問題に対処する新しいアプローチであるFLIGANを提案する。
本手法はFLのプライバシ要件に則り,プロセス内の実際のデータを共有せずに合成データをフェデレートした方法で生成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:49:38 GMT)
MEDDAP: Medical Dataset Enhancement via Diversified Augmentation Pipeline [1.5] 我々はMEDDAPと呼ばれる新しいパイプラインを導入し、新しい情報付きラベル付きサンプルを自動生成することで、既存の小さなデータセットを拡張する。
USLoRAはSD内の重量を選択的に微調整することができ、SDのUNet部分のみを完全微調整するのに対し、パラメータは0.1%未満である。
このアプローチは、乳がんに関する臨床医の意思決定プロセスに触発され、腫瘍の形状が強度よりも重要な役割を担っていることが多い。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:17:43 GMT)
Brain Stroke Segmentation Using Deep Learning Models: A Comparative Study [1.5] ストロークセグメンテーションは脳卒中患者の診断と治療において重要な役割を担っている。
一般的な医用画像分割のためのディープモデルが導入された。
本研究では,最近提案された4種類の深部モデルを選択し,脳卒中セグメンテーションの性能評価を行った。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:44:01 GMT)
Sandra -- A Neuro-Symbolic Reasoner Based On Descriptions And Situations [1.4] サンドラ(Sandra)は、ベクトル表現と導出的推論を組み合わせた神経象徴的推論である。
SandraはDnS(Description and situation)オントロジー設計パターンに基づいている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:52:20 GMT)
Histogram Layers for Neural Engineered Features [1.4] 局所的なバイナリパターンとエッジヒストグラム記述子は、様々なコンピュータビジョンタスクにおいて有益な特徴であることが示されている。
本稿では,ニューラルネットワークに埋め込まれたヒストグラム層を用いて,これらの特徴が学べるかどうかを考察する。
本稿では,特徴表現を協調的に改善し,画像分類を行う,局所的バイナリパターンとエッジヒストグラム記述子のニューラルバージョンを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:43:48 GMT)
Nonlinear Quantum Dynamics in Superconducting NISQ Processors [1.4] 最近提案された変分量子アルゴリズムは、変分量子コンピューティングの地平線を非線形物理学や流体力学に拡張した。
このアルゴリズムを用いて、二次ポテンシャルを持つ非線形シュリンガー方程式の基底状態を見つけ、クラウド超伝導量子プロセッサに実装する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:11:04 GMT)
Greedy Perspectives: Multi-Drone View Planning for Collaborative Perception in Cluttered Environments [1.3] 我々は,グループを撮影する目的を意識したマルチロボット・マルチアクター・ビュー・プランナーを開発した。
フォーメーションプランナーと比較して、連続プランナーは3つのシナリオに対してアクターよりも14%大きなビュー報酬を生成する。
また、ロボット間衝突の制約を伴わずに連続的な計画を行う場合、ほぼ同一のビュー報酬も観測する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:46:28 GMT)
Grappa -- A Machine Learned Molecular Mechanics Force Field [1.3] 本稿では,分子グラフから分子パラメータを予測する機械学習アーキテクチャを提案する。
結果として得られる力場であるGrappaは、同じ計算効率で精度で確立された他の機械学習MM力場よりも優れる。
我々の力場は、化学精度に近い生体分子シミュレーションの段階を定式化されたタンパク質力場と同じ計算コストで設定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:11:15 GMT)
GPT-4 Understands Discourse at Least as Well as Humans Do [1.3] GPT-4は、非常に高いレベルの人的性能を与えられたヒトよりも、わずかに、統計的に有意ではない。
GPT-4と人間は共に、物語に明記されていない情報について推論する強力な能力を示しており、これは理解の批判的なテストである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:17:14 GMT)
Advancing Extrapolative Predictions of Material Properties through Learning to Learn [1.3] 我々は、ニューラルネットワークの注意に基づくアーキテクチャとメタ学習アルゴリズムを用いて、外挿的一般化能力を取得する。
このような外挿訓練されたモデルの可能性、特に目に見えない物質ドメインに迅速に適応する能力を強調します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:30:19 GMT)
The Anatomy of Adversarial Attacks: Concept-based XAI Dissection [1.3] XAI技術を用いた畳み込みニューラルネットワーク(CNN)で学習した概念に対するAAの影響について検討する。
AAsは機能空間における概念構成の大幅な変更を誘発し、新しい概念を導入したり、既存の概念を変更したりする。
我々の発見は、より堅牢で解釈可能なディープラーニングモデルを開発するための道を開いた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:57:45 GMT)
SegICL: A Universal In-context Learning Framework for Enhanced Segmentation in Medical Imaging [1.3] In-Context Learning (ICL) を利用した画像セグメンテーション手法であるSegICLを紹介する。
SegICLはテキスト誘導セグメンテーションを採用し、少量のイメージマスクペアでテキスト内学習を行うことができる。
私たちのコードはまもなくリリースされるでしょう。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:43:56 GMT)
TwinLiteNetPlus: A Stronger Model for Real-time Drivable Area and Lane Segmentation [1.1] 本稿では,現在最先端(SOTA)モデルの高計算コストに対応するため,TwinLiteNetPlusを提案する。
TwinLiteNetPlusは、標準および深さ的に分離可能な拡張畳み込みを導入し、高い精度を維持しながら複雑さを低減している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:17:45 GMT)
Enhancing End-to-End Multi-Task Dialogue Systems: A Study on Intrinsic Motivation Reinforcement Learning Algorithms for Improved Training and Adaptability [1.1] 本研究の目的は,本研究の本質的な動機づけ強化学習アルゴリズムを検討することである。
我々は,ランダムなネットワーク蒸留と好奇心駆動型強化学習に適応して,国家訪問頻度を測定する。
不均質なデータセットであるMultiWOZの実験結果は、本質的なモチベーションに基づく議論システムは、外生的なインセンティブに依存する政策より優れていることを示している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:03:58 GMT)
Data driven modeling for self-similar dynamics [1.1] 本稿では,自己相似性を先行知識として組み込んだマルチスケールニューラルネットワークフレームワークを提案する。
決定論的ダイナミクスの場合、我々のフレームワークは力学が自己相似かどうかを識別できる。
本手法は,自己相似システムにおける電力法指数を同定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:21:37 GMT)
Investigating the Readability of Test Code: Combining Scientific and Practical Views [1.1] ソースコードの可読性は、ソフトウェアシステムやテストを理解し維持するために重要です。
いくつかの研究はソースコードの可読性について研究しているが、テストコードの可読性および関連する影響要因について限定的な研究がなされている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:28:37 GMT)
The pretty bad measurement [1.0] かなり良い測定値とかなり悪い測定値の両方が、それぞれのタスクについて盲目で推測するよりも、常に悪いことであることを示す。
応用として、量子状態異常検出問題にかなり悪い測定を適用し、かなり悪い量子ビットを避ける方法を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:57:15 GMT)
Multi-Scale Texture Loss for CT denoising with GANs [0.9] GAN(Generative Adversarial Networks)は、医療画像の応用を認知するための強力なフレームワークとして証明されている。
本研究は,Gray-Level-Co-occurrence Matrix (GLCM) の内在的マルチスケール特性を利用した損失関数を提案する。
また,画像から抽出したマルチスケールテクスチャ情報を動的に集約する自己認識層を導入する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:28:52 GMT)
Multi-Agent Optimization for Safety Analysis of Cyber-Physical Systems: Position Paper [0.9] フェールモード、エフェクト、クリティカルリティ分析(FMECA)は、ほとんどの国際標準で推奨される安全分析手法の1つである。
最適解を提供するための古典的FMECAを拡張したマルチエージェントに基づく最適化手法について述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:14:45 GMT)
Can ChatGPT predict article retraction based on Twitter mentions? [0.9] 本研究は、Twitterがリトラクション記事に言及していることがリトラクション記事の潜在的な問題を引き起こすかどうかを調査する。
記事のリトラクションの予測におけるTwitterの言及の有効性は,4つの予測方法によって評価される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:15:09 GMT)
Physics-informed RL for Maximal Safety Probability Estimation [0.8] 本研究では,リスクのある状態や長期軌道からのサンプルを十分にカバーすることなく,最大安全行動の長期安全確率を推定する方法を検討する。
提案手法は,短期サンプルを用いて長期リスクを推定し,未サンプリング状態のリスクを推定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:13:56 GMT)
Fusing Domain-Specific Content from Large Language Models into Knowledge Graphs for Enhanced Zero Shot Object State Classification [0.8] 本研究では,Large Language Models (LLMs) のドメイン固有情報の生成と提供における可能性について検討する。
これを実現するために、LLMは知識グラフと事前訓練されたセマンティックベクターを利用するパイプラインに統合される。
その結果,LLMをベースとした組込みと汎用的な事前学習型組込みを組み合わせることで,大幅な性能向上が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:50:06 GMT)
Device-independent quantum key distribution with arbitrarily small nonlocality [0.8] デバイス非依存の量子キー分散(DIQKD)により、2人のユーザが使用する量子デバイスを信頼することなく、共有暗号キーをセットアップできる。
ここではそのような境界が存在しないことを示し、局所集合に任意に近い相関を持つ鍵を与えるスキームを与える。
我々の構成のいくつかは、一対の絡み合った量子ビットに対して最大1ビットの鍵を達成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:57:23 GMT)
What is computable and non-computable in the quantum domain: 7 statements and 3 conjectures [0.8] 量子コンピュータがスピードアップできる問題の範囲を定義するのに役立つ普遍的なアプローチは存在しない。
一方、量子コンピューティングに関心を持つ量子状態のクラスは複雑であるべきである。
一方、そのような量子状態は実用的な量子コンピュータ上で到達可能であるべきである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:47:35 GMT)
Seeking Enlightenment: Incorporating Evidence-Based Practice Techniques in a Research Software Engineering Team [0.7] ソフトウェア工学におけるエビデンスベースの実践(EBP)は、実践者の専門的判断と研究の質の高い証拠を補完することにより、ソフトウェア開発における意思決定を改善することを目的としている。
EBP技術の使用は、ソフトウェア工学のベストプラクティスを科学ソフトウェア開発にもたらすために、研究ソフトウェアエンジニア(RSE)にとって有用であると考えています。
本報告では、サンディア国立研究所の RSE チーム内で、特定の EBP 技術の使用経験報告、迅速なレビュー、および RSE コミュニティにおける EBP 導入の障壁に対処するための実践的勧告について述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:52:18 GMT)
Spectral methods for Neural Integral Equations [0.7] 本稿では,スペクトル法に基づくニューラル積分方程式の枠組みを提案する。
モデルの近似能力に関する様々な理論的保証を示す。
得られたモデルの有効性を示す数値実験を行う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:32:19 GMT)
Generation of Asset Administration Shell with Large Language Model Agents: Interoperability in Digital Twins with Semantic Node [0.7] 本研究では,デジタル双対モデリングのためのアセット管理シェル(AAS)インスタンス作成を支援する新しいアプローチを提案する。
テキストデータのセマンティックな意味を捉えるために「意味ノード」データ構造を構築した。
大規模言語モデルを用いたシステムは、"セマンティックノード"を処理し、AASインスタンスモデルを生成するように設計され、実装されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:37:30 GMT)
Testing MediaPipe Holistic for Linguistic Analysis of Nonmanual Markers in Sign Languages [0.7] 我々はMediaPipe Holistic(MPH)と古いソリューション(OpenFace, OF)を比較する。
MPHは眼球運動の言語学的解析には不十分である。
我々は、これらの制限を克服するために追加の修正モデルをトレーニングする以前の提案を再検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:33:01 GMT)
Toulouse Hyperspectral Data Set: a benchmark data set to assess semi-supervised spectral representation learning and pixel-wise classification techniques [0.6] 本稿では,大規模ハイパースペクトル画像に対するスペクトル表現学習と分類において重要な課題に対処するToulouse Hyperspectral Data Setについて述べる。
我々は,Masked Autoencoderを含むスペクトル表現学習のための自己指導的手法を議論し,また,総合精度85%,F1スコア77%を達成できる画素単位の分類基準を確立する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:05:16 GMT)
Localization, fractality, and ergodicity in a monitored qubit [0.6] 反復的アンシラ測定を対象とする1つの2段階系(量子ビット)の統計特性について検討した。
このセットアップは、システムのユニタリダイナミクスと量子測定によって導入された非ユニタリ性の間の相互作用を探索するための基本的な最小限のモデルである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:30:49 GMT)
Parity-sensitive inhomogeneous dephasing of macroscopic spin ensembles [0.6] 近年の研究では、スピン猫状態を利用して論理量子情報を符号化する方法が提案されている。
非均質拡大下でのスピン猫状態のダイナミクスについて検討した。
我々の発見は、量子技術の進歩に重要な集合スピン状態の安定性に光を当てた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:20:57 GMT)
Comprehensive evaluation of Mal-API-2019 dataset by machine learning in malware detection [0.5] 本研究では,機械学習技術を用いたマルウェア検出の徹底的な検討を行う。
その目的は、脅威をより効果的に識別し緩和することで、サイバーセキュリティの能力を向上させることである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:33:18 GMT)
Quantum enhanced distributed phase sensing with a truncated SU(1,1) interferometer [0.4] 絡み合ったセンサーのネットワークは、ショットノイズ限界を超えて感度を向上させることができ、センサーの数に応じてハイゼンベルクのスケーリングを可能にする。
我々は、分離可能なセンシング手法による1.7dBの量子ノイズ低減と古典的な3dB信号-雑音比の改善を実験的に実証した。
本研究は, 量子化センサネットワークの開発において, エンタングルメント強化感度を実現する方法である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:00:21 GMT)
Review Ecosystems to access Educational XR Experiences: a Scoping Review [0.4] 本稿では,新たなレビューエコシステムを構築するためのベストプラクティスを明らかにする。
これは、これらのレビューの形式と形式、および経験に関する情報を共有するメカニズムに焦点を当てている。
教育用XR(eduXR)レビューエコシステムを開発するための戦略と機会には、品質指標などの特性を測定する方法が含まれる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:44:28 GMT)
ChatGPT Incorrectness Detection in Software Reviews [0.4] そこで我々は,ChatGPT応答における誤りを自動的に検出するCID(ChatGPT Incorrectness Detector)というツールを開発した。
ライブラリ選択のベンチマーク研究において、CIDはF1スコア0.74~0.75でChatGPTからの誤った応答を検出できることを示した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:50:27 GMT)
Tensor network formulation of symmetry protected topological phases in mixed states [0.4] 我々は、密度行列のテンソルネットワーク定式化に基づいて、対称性保護位相(SPT)位相を混合状態で定義し、分類する。
強い射影行列積密度作用素を双対ヒルベルト空間の純粋状態に写像する。
我々は,強い半射影テンソルネットワーク密度演算子によって記述された2次元混合状態にまで結果を拡張した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:04:29 GMT)
Design-Space Exploration of SNN Models using Application-Specific Multi-Core Architectures [0.4] RAVSimは最先端のSNNシミュレータであり、彼らのウェブサイトで公式モジュールとして公開されている。
RAVSimは、ユーザがモデルと対話し、出力集中の振る舞いを観察し、シミュレーション実行中いつでもパラメトリック値のセットを変更することができる実行時仮想シミュレーション環境である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:50:42 GMT)
Towards Secure and Trusted-by-Design Smart Contracts [0.3] 証拠取引には、金銭、出生証明書、ビザ、チケットなど、あらゆる形の物的証拠の交換が含まれる。
多くの場合、明らかなトランザクションは、物理的なエージェントの間で、明らかなプロトコルと呼ばれる複雑な手続きの文脈で発生する。
ブロックチェーンはエビデンスを転送するメカニズムを提供し、スマートコントラクトはブロックチェーン上にエビデンシャルプロトコルをエンコードすることを可能にする。
スマートコントラクトは信頼できるサードパーティを先導し、匿名で複数のマシン上で動作するため、セキュアで信頼性の高い設計のプログラムを構成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:14:22 GMT)
Causal Question Answering with Reinforcement Learning [0.3] 因果質問は、異なる事象や現象の間の因果関係について問う。
本稿では,因果グラフを用いて因果質問に回答することを目的とする。
本稿では,因果的疑問に答えるために,グラフを探索するアクタ・クリティカル・エージェントを提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:57:47 GMT)
On the Relationship between Skill Neurons and Robustness in Prompt Tuning [0.3] 我々は、プロンプトチューニングの「スキルニューロン」との関連性について研究する。
特定のタスクに調整されたプロンプトは、同じタイプのタスクに転送可能であるが、敵データに対してあまり堅牢ではないことを示す。
我々は,高次対向ロバスト性は,モデルが関連するスキルニューロンを敵データ上で一貫して活性化する能力に関係していると結論づける。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:52:14 GMT)
SPACE-IDEAS: A Dataset for Salient Information Detection in Space Innovation [0.3] 本研究では,空間領域に関連するイノベーションのアイデアから情報を検出するためのデータセットであるSPACE-IDEASを紹介する。
SPACE-IDEASのテキストは大きく異なり、非公式、技術的、学術的、ビジネス指向の書き込みスタイルを含んでいる。
手動でアノテートしたデータセットに加えて、大きな生成言語モデルを使ってアノテートされた拡張バージョンをリリースします。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:04:02 GMT)
Practical trainable temporal post-processor for multi-state quantum measurement [0.3] 我々は、トレーニング可能な時間後プロセッサ(TPP)を開発し、実証する。
TPPは、単純だが汎用的な機械学習アルゴリズムを利用して、量子計測データの最適な処理を提供する。
TPPは効率的に、自律的に、そして測定データに基づいて確実に訓練することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:35:43 GMT)
Photon Transitions in Arbitrary Time-Varying Metamaterials [0.3] 任意の時間変化を持つメタマテリアルにおける光子の遷移を計算するための一般的な理論を提案する。
ここでは、これらの作用素の時間的進化と関連する遷移確率を示す。
この理論は任意の時空変調の可能性があるため、いくつかの新しい量子効果や応用をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:27:42 GMT)
Achieving Quantum Limits of Exoplanet Detection and Localization [0.2] 本稿では,Quantum Chernoff Exponent (QCE) とQuantum Fisher Information Matrix (QFIM) によって定義された外惑星検出と局在の量子情報限界について報告する。
我々は、高次モードを減衰させることなく望遠鏡の基本モードを排他的に排除するシステムは、高い恒星-惑星のコントラストの体制において量子最適であることを示した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:51:05 GMT)
Understanding the Effects of Noise in Text-to-SQL: An Examination of the BIRD-Bench Benchmark [0.2] 本研究では,広範に使用されているBIRD-Benchベンチマークにおいて,ノイズの分布と種類を詳細に解析する。
質問やゴールドクエリのノイズがデータセットに広まっており、ドメイン毎にさまざまな量があることがわかった。
誤ったゴールドクエリの存在は、誤ったゴールド回答を発生させ、ベンチマークの信頼性に大きな影響を及ぼす。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:48:16 GMT)
Information-theoretic derivation of energy and speed bounds [0.2] 力学が情報非平衡状態から生じるモデルを提供する。
量子論におけるエネルギーの主な特徴を捉えるエネルギーの概念を導出する。
この結果は、量子進化の速度に依存するマンデルスタム・タムを情報理論で再構築するものである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:02:39 GMT)
Convolutional Spiking Neural Networks for Detecting Anticipatory Brain Potentials Using Electroencephalogram [0.2] スパイキングニューラルネットワーク(SNN)は、生体系におけるシナプス接続を模倣しスパイクトレインを発生させるため、注目を集めている。
近年,畳み込みネットワークの特徴抽出能力とSNNの計算効率を組み合わせた畳み込み層が導入された。
本稿では、畳み込みスパイクニューラルネットワーク(CSNN)を用いて、予測速度の遅い大脳皮質電位を検出することの実現可能性について検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:28:12 GMT)
Unveiling clean two-dimensional discrete time quasicrystals on a digital quantum computer [0.2] キックしたイジングモデルにおける周期運転時の初期生成物状態の緩和ダイナミクスについて検討した。
Floquetサイクルの2倍の周期で磁化測定によって特徴づけられる予熱状態の存在を同定する。
本結果は,2次元システムにおける周期共振DTCの実現を裏付ける証拠となる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:56:13 GMT)
Looking back and forward: A retrospective and future directions on Software Engineering for systems-of-systems [0.1] The International Workshop on Software Engineering for Systems-of-Systems (SESoS)シリーズは、ソフトウェア工学の観点からSoSに対処する科学フォーラムのギャップを埋めるために2013年に始まった。
本稿では、SESOSワークショップ(2013-2023)の11版にわたる57の論文をもとに、SoSのためのソフトウェアエンジニアリングの進化と将来の軌跡について概説する。
この研究は、スコーピングレビューとサイエントメトリック分析法を組み合わせて、時間的および地理的分布、関心のトピック、採用された研究方法論、応用ドメイン、研究影響に関する研究貢献を分類、分析した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:12:39 GMT)
CYGENT: A cybersecurity conversational agent with log summarization powered by GPT-3 [0.1] CYGENTは、GPT-3.5ターボモデルを搭載した対話エージェントフレームワークである。
サイバーセキュリティ情報を提供し、アップロードされたログファイルを分析し、要約し、特定のイベントを検出し、必須の指示を与える。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:17:04 GMT)
Sample compression schemes for balls in graphs [0.0] 機械学習におけるオープンな問題の1つは、VC次元$d$のセットファミリーが、サイズ$O(d)$のサンプル圧縮スキームを認めるかどうかである。
本稿では,グラフ内の球に対するこの問題について検討する。
任意の半径$r$の球に対して、木に2ドル、サイクルに3ドル、インターバルグラフに4ドル、サイクルに6ドル、キューブのない中央値グラフに22ドルという適切なラベル付きサンプル圧縮スキームを設計する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:09:32 GMT)
With Greater Text Comes Greater Necessity: Inference-Time Training Helps Long Text Generation [0.0] 長文生成は、現在の言語モデルに重大な課題をもたらす。
提案手法であるTemp-Loraは代替概念を提案する。
長いテキスト生成の過程で、このモジュールは、以前に生成されたテキストで徐々に訓練される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:16:06 GMT)
What is Entanglement? [0.0] アインシュタインの時代からのパズルである絡み合いは、量子計算の台頭によってますます重要になっている。
本稿では,絡み合った状態の4つの相互接続定義について検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:27:11 GMT)
Vector Ising Spin Annealer for Minimizing Ising Hamiltonians [0.0] スピンハミルトニアンで符号化された複雑な最適化問題を解くために光物質相互作用を利用するゲインベースコンピューティングのフレームワークであるベクトルイジングスピンアニール(VISA)を紹介する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:38:55 GMT)
Useful variants and perturbations of completely entangled subspaces and spans of unextendible product bases [0.0] 我々は、ある拡張不可能な製品基底の線形スパンの変分と摂動の方法と理論を開発する。
無限に多くの純積状態を持つ摂動の例を示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:11:17 GMT)
Universality of almost periodicity in bounded discrete time series [0.0] 任意の有界離散時系列を考える。
フーリエ変換を使わずに、対応する時系列を適切に特徴づける概周期関数を求める。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:07:23 GMT)
Towards White Box Deep Learning [0.0] 本稿では、本質的に解釈可能なニューラルネットワークを構築するための概念的枠組みとして意味的特徴を紹介する。
MNISTの情報的サブプロブレムの概念モデルの証明は、合計5Kの学習可能なパラメータを持つ4つの層から構成される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:55:25 GMT)
The thermodynamics of the quantum Mpemba effect [0.0] エネルギー固有基底において、状態が対角状態に変換された場合、指数的な平衡へのスピードアップが常に起こることを示す。
変換状態がより高い非平衡自由エネルギーを持つとき、熱力学的推論を用いて、これはテクスチゲヌイン量子Mpemba効果であると主張する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:18:23 GMT)
The spectral continuum in the Rabi-Stark model [0.0] スペクトルがしきい値から無限大まで連続的に広がることを示す。
一連の正規化可能な状態が連続体に埋め込まれ、原子のスターク効果と予期せぬ類似性を持つ。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:37:19 GMT)
The c-d conjecture [0.0] 局所的近傍臨界ハミルトニアンの1次元における局所次元$d$と最大中心電荷$c_textmax$の関係を予想する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:44:15 GMT)
The autoregressive neural network architecture of the Boltzmann distribution of pairwise interacting spins systems [0.0] Generative Autoregressive Neural Networks (ARNN) は画像および言語生成タスクにおいて例外的な結果を示した。
この研究は、二対対相互作用系のボルツマン分布を自己回帰形式に正確にマッピングする。
得られたARNNアーキテクチャは、ハミルトンのカップリングと外部フィールドに対応する第1層の重みとバイアスを持つ。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:18:39 GMT)
The AI Assessment Scale (AIAS) in action: A pilot implementation of GenAI supported assessment [0.0] 高等教育におけるジェネレーティブ・人工知能(GenAI)技術の急速な採用は、学術的完全性、評価の実践、学生の学習に関する懸念を引き起こしている。
本稿では,イギリス大学ベトナム校(BUV)でAIAS(Artificial Intelligence Assessment Scale)の実施を探求するパイロット研究の成果を報告する。
AIASは「No AI」から「Full AI」までの5つのレベルから構成されており、教育者は人間の入力と批判的思考を必要とする領域に焦点を当てたアセスメントを設計できる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:47:10 GMT)
Synthesize Step-by-Step: Tools, Templates and LLMs as Data Generators for Reasoning-Based Chart VQA [0.0] 我々は,推論能力の強い大規模言語モデル(LLM)を自動データアノテータとして活用する。
私たちの方法における重要な革新は、Synthesize Step-by-Step戦略にあります。
我々は、チャートVQAモデルを大幅に強化し、ChartQAおよびPlotQAデータセットの最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 03:02:27 GMT)
Subwavelength resolution using the near field of quantum emitters [0.0] 本稿では,量子光学と近接場光学を組み合わせた超高分解能光学画像へのアプローチを提案する。
単一光子エミッタの量子干渉効果は, 近接場とともに, 量子化あるいは近接場化のみによるシステムよりも, サブ波長構造が高分解能化されることを実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:19:26 GMT)
Steady state in strong system-bath coupling: mean force Gibbs state versus reaction coordinate [0.0] 強結合状態の定常状態を得るために現在使われている2つの戦略を分析し比較する。
期待され,期待されているように,これらの2つの戦略の予測は,いくつかのパラメータ領域で一致していることを示す。
両戦略の極めて単純な妥当性基準を導入し,検証に成功し,妥当性範囲の問題に対する回答を得た。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:45:27 GMT)
Solving lattice gauge theories using the quantum Krylov algorithm and qubitization [0.0] 量子部分空間展開アルゴリズムを用いてシュウィンガーモデルの基底状態を計算する。
量子化を用いた量子アルゴリズムを用いて,LGT真空状態の計算に必要な資源の完全な分析を行う。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:09:49 GMT)
Scaling tunnelling noise in the fractional quantum Hall effect tells about renormalization and breakdown of chiral Luttinger liquid [0.0] 量子ホール状態におけるエッジモード間のトンネルについて, 充填係数$nu=1/3$で検討した。
我々の分析は、あるエネルギースケールを超えるCLL崩壊の明確な証拠を示している。
その結果、何十年も前からある実験には、これまで見過ごされていた情報が数多く含まれていることがわかった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:34:13 GMT)
Samplet basis pursuit: Multiresolution scattered data approximation with sparsity constraints [0.0] 我々は,$ell_1$-regularization を用いたサンプルト座標における分散データ近似について検討する。
Riesz isometry を用いて、標本を再現されたカーネルヒルベルト空間に埋め込む。
組込みサンプルベースに関してスパースな信号のクラスは、カーネルベースに関してスパースな信号のクラスよりもかなり大きいと我々は主張する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:02:27 GMT)
SLIMBRAIN: Augmented Reality Real-Time Acquisition and Processing System For Hyperspectral Classification Mapping with Depth Information for In-Vivo Surgical Procedures [0.0] 本稿では,高スペクトル(HS)情報から脳腫瘍組織を分類・表示するのに適したリアルタイム取得・処理ARシステムであるSLIMBRAINを提案する。
このシステムは、腫瘍切除手術中に、HS画像を毎秒14フレーム(FPS)でキャプチャして処理し、ニューロサージョンの手術と同時に癌組織を検出し、切り離す。
結果はARビジュアライゼーションで表現され、分類結果はLiDARカメラで捉えたRGBポイントクラウドと重なる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:10:49 GMT)
SIP: Autotuning GPU Native Schedules via Stochastic Instruction Perturbation [0.0] 大型言語モデル(LLM)はその出現以来、重要なワークロードとなっている。
また、数十億のパラメータを持ち、大量のデータで訓練されているため、計算コストも高い。
近年、LLMのトレーニングと推論のための専用カーネルが開発されているため、ハードウェアリソースは可能な限り十分に活用されている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:26:50 GMT)
Revisiting the Sleeping Beauty problem [0.0] 眠れる美」問題は、20年以上にわたって明確な解決策がなかった確率的な謎である。
この問題には、ハーフ・アプローチとサード・アプローチの2つの主要な競合する解決策がある。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:01:27 GMT)
Revisiting The Classics: A Study on Identifying and Rectifying Gender Stereotypes in Rhymes and Poems [0.0] この研究は、男女のステレオタイプを特定するために韻文と詩のデータセットを集め、性別バイアスを特定するために97%の精度のモデルを提案することで貢献する。
ジェンダーのステレオタイプをLarge Language Model (LLM) を用いて修正し、その効果を人間の教育者に対する比較調査で評価した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:33:12 GMT)
Rate-fidelity trade-off in cavity-based remote entanglement generation [0.0] 量子コンピューティングモジュール間のフォトニック相互接続は、量子ビットスケーラビリティ問題に対する解決策を提供する。
光子発生に使用するポンプパルスの波形と自然放出による絡み合いについて検討した。
本稿では, 一般多部構造における絡み合い分布に解析を拡張し, 両部構造解析が直接適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:55:02 GMT)
RSA+: An RSA variant [0.0] 本稿では,有名なRSA暗号とRabin暗号の主成分を組み合わせた,確率的公開鍵暗号システムを提案する。
我々は,新方式の安全性と性能について,他の2つと比較して検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:25:14 GMT)
Quasiprobabilities in quantum thermodynamics and many-body systems: A tutorial [0.0] 文献で知られている主準確率の定義、解釈、性質について述べる。
量子熱力学における準確率の利用について、仕事と熱の量子統計を記述する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:22:57 GMT)
Quantum random access memory architectures using superconducting cavities [0.0] 高コヒーレンス超伝導共振器を用いた2つのバケットブリガドQRAMアーキテクチャを提案する。
ボソニック量子ビットのシングルレールとデュアルレールの実装を解析する。
利害関係のパラメータについて、二重レールアーキテクチャにおけるQRAMクエリのポストセレクト不完全性は、単一レールアーキテクチャにおける対応するクエリの桁違いである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:43:59 GMT)
Quantum State Preparation for Probability Distributions with Mirror Symmetry Using Matrix Product States [0.0] 確率分布を量子状態にロードするための量子回路は、物理学、金融工学、機械学習で使われる量子アルゴリズムにおいて必須のサブルーチンである。
行列積状態を用いたミラー対称性を持つ確率分布のための新しい量子状態生成法を提案する。
本手法は,確率分布の絡み合いを低減し,行列積状態による近似の精度を向上させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:03:35 GMT)
Quantum Networks Enhanced by Distributed Quantum Memories [0.0] 量子通信ネットワークに分散した量子メモリのネットワーク全体での相乗的利用が根本的な優位性をもたらすことを示す。
まず、局所記憶を用いた量子通信の問題を古典的連続体パーコレーションモデルにマッピングする。
この改良された写像は、乱れた量子磁石の再正規化群処理のデシミネーション規則に類似したグラフマージ規則で定式化することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:16:25 GMT)
Quantics Tensor Cross Interpolation for High-Resolution, Parsimonious Representations of Multivariate Functions in Physics and Beyond [0.0] 両スキームの利点を組み合わせた戦略である量子TCI(QTCI)を提案する。
凝縮物質物理学の応用でその可能性を説明する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:20:31 GMT)
Prompting the E-Brushes: Users as Authors in Generative AI [0.0] 著作権庁は2023年3月のガイダンスで、ジェネレーティブAIのユーザーが著作権保護を受ける権利を主張している。
本稿では,これらのツールを創造的努力に取り入れた生成型AIユーザの認識を提唱する。
この条は、AIが生み出した貢献を排除するのではなく、単純化され、合理化された登録プロセスを示唆している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 02:20:14 GMT)
Probing the Schroedinger-Newton equation in a Stern-Gerlach interferometer [0.0] いわゆるシュレーディンガー・ニュートン方程式によって支配される重力的な自己相互作用のメカニズムは、その上に光を放つことを目的とした提案の一つである。
ここでは、簡単なStern-Gerlachのような実験を試す。
シュレーディンガー・ニュートン方程式は、特定の適切な条件下で解析的に解き、重力自己相互作用ポテンシャルによって引き起こされる脱落効果を計算することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:45:54 GMT)
Polar Duality and the Reconstruction of Quantum Covariance Matrices from Partial Data [0.0] 我々はこの構成をガウス量子状態に適用し、パウリの再構成問題を非自明に一般化する。
このような状態の簡単なトモグラフィー的特徴を述べる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:40:29 GMT)
Pairing dome from an emergent Feshbach resonance in a strongly repulsive bilayer model [0.0] 従来の超伝導を理解する鍵は、ドープ反強磁性体における移動体電荷キャリアのペアリング機構の解明にある。
ここでは、ロバストな結合エネルギーを特徴とする混合次元(mixD)$t-J$モデルでペアリングを研究する。
我々の研究は、二層超伝導体、Ni系超伝導体と密接な関係を持つ支配的な反発を持つドープ混合D系におけるペアリングの顕微鏡理論を提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:55:56 GMT)
Navigating the EU AI Act: A Methodological Approach to Compliance for Safety-critical Products [0.0] 本稿では,リスクの高いAIシステムに対するEU AI Act要件を解釈するための方法論を提案する。
まず,AIシステムに対する製品品質モデルの拡張を提案し,現行の品質モデルではカバーされない法に関する属性を取り入れた。
次に、ステークホルダーレベルで技術的要件を導出するための契約ベースのアプローチを提案します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:32:18 GMT)
Multi-agent reinforcement learning using echo-state network and its application to pedestrian dynamics [0.0] 本研究は, グリッドワールド環境における道路を考察し, エコー状態ネットワークと最小二乗ポリシー反復法を用いて歩行者をMARLエージェントとして実装した。
この環境下では、これらのエージェントが他のエージェントを避けて前進することを学ぶ能力について検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:00:29 GMT)
Manipulating the direction of one-way steering in an optomechanical ring cavity [0.0] 量子ステアリング(英: Quantum steering)とは、局所的な測定によって観測者の量子状態にリモートで影響を及ぼすために、非分離的な量子相関を利用することの可能性である。
ここでは,2つのメカニカルモード間のガウス量子ステアリングについて検討する。
両モードの状態を両方向ステアリングと一方方向ステアリングで表すことができることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 00:44:56 GMT)
Magnon-microwave backaction noise evasion in cavity magnomechanics [0.0] キャビティマグノメカニカルシステムのメカニカルモードに導入されたノイズをワントーン駆動方式で検討する。
提案手法は,2つの音をフォノン周波数の2倍の周波数で分離したマイクロ波空洞を駆動することからなる。
三重共振方式では、低周波マグノン-マイクロ波偏光子を中心とする駆動が、測定において最小のインプレクションノイズを付加することを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:53:21 GMT)
Machine learning for moduli space of genus two curves and an application to post-quantum cryptography [0.0] 我々は機械学習を用いて、$(n, n)$-split Jacobianを持つ属2曲線のlocus $mathcal L_n$を研究する。
このような曲線は同種暗号において重要である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 22:52:50 GMT)
Loss-tolerant architecture for quantum computing with quantum emitters [0.0] 我々は、フォトニック量子エミッタを用いた計測に基づく量子コンピューティングのためのアーキテクチャを開発する。
我々は、スピン-光子絡み合いを資源状態と標準ベル測定として利用し、それらを大きなスピン-量子クラスター状態に融合させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:10:16 GMT)
LitSumm: Large language models for literature summarisation of non-coding RNAs [0.0] 生命科学における文学のカリキュラムは、ますます困難になっている。
関連する文献全体にスケールするリソースを持つナレッジベースは少ない。
非コードRNAのための文献の要約を生成することにより、RNA科学におけるキュレーター時間の欠如を緩和する第一歩を踏み出した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:00:57 GMT)
LARA: Linguistic-Adaptive Retrieval-Augmented LLMs for Multi-Turn Intent Classification [0.0] LARA(Linguistic-Adaptive Retrieval-Augmented Language Models)を導入し、6言語にわたるマルチターン分類タスクの精度を向上させる。
LARAは、微調整された小さなモデルと検索拡張機構を組み合わせることで、大きな言語モデルのアーキテクチャに組み込まれる。
総合的な実験により、LARAはマルチターン意図分類タスクにおいて最先端のパフォーマンスを達成し、既存の手法と比較して平均精度を3.67%向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:38:40 GMT)
KIT-19: A Comprehensive Korean Instruction Toolkit on 19 Tasks for Fine-Tuning Korean Large Language Models [0.0] textitKIT-19は、韓国のNLPタスクのための19の既存のオープンソースデータセットからなる、命令フォーマットで作成されたデータセットである。
実験の結果,textitKIT-19で訓練したモデルは,既存の韓国のLLMよりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:15:21 GMT)
Iso-Diffusion: Improving Diffusion Probabilistic Models Using the Isotropy of the Additive Gaussian Noise [0.0] 加算音と予測音との平均二乗誤差を最小化することは、予測音に等方性を持つような制約を課すものではない。
我々は、DDPMの忠実度を高めるために、目的関数の制約として添加音の等方性を利用する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 14:05:52 GMT)
Infinite Grassmann Time-Evolving Matrix Product Operator Method in the Steady State [0.0] この手法は、最近開発されたGTEMPO法で確立された無限行列積状態のアルゴリズムを取り入れている。
サイン問題なく任意の温度に適用でき、入浴数に応じてスケールしない。
この方法は定常量子輸送の研究に最適であり、効率的なリアルタイム不純物解法として容易に利用することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:33:32 GMT)
Improving the forecast accuracy of wind power by leveraging multiple hierarchical structure [0.0] 和解による階層予測の最近の進歩は,短期的な風力エネルギー予測の質を著しく向上させた。
本研究では,風力発電所におけるタービンの断面的・時間的階層構造を活用し,その統合された断面的・時間的次元が,風力発電所における予測精度にどのように価値をもたらすかを検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:58:22 GMT)
Implementing any Linear Combination of Unitaries on Intermediate-term Quantum Computers [0.0] 我々はLCU(Linear Combination of Unitary)を実装するための3つの新しい手法を開発した。
第1の方法は、LCUプロシージャによって作成された任意の量子状態に対して可観測物の期待値を推定する。
第二のアプローチは、単純で物理的に動機づけられたLCUの連続時間アナログであり、ハイブリッド量子モードシステムに適合する。
第3の手法(アンシラフリーLCU)は、アシラ量子ビットを全く必要とせず、量子状態の射影に興味がある場合に有用である。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:28:17 GMT)
Human Understanding AI Paper Challenge 2024 -- Dataset Design [0.0] 2024年には、人間の日常生活を理解する人工知能技術の研究・開発のための研究論文コンテスト(第3回人間理解AI論文コンテスト)を開催します。
この文書では、コンペの参加者に提供されるデータセットを紹介し、データ処理と学習モデル開発において考慮すべき問題を要約する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:48:34 GMT)
Hot electrons and dark excitons modulate strong-coupling conditions in metal-organic optical microcavities [0.0] ポラリトンは、有機太陽電池、光論理ゲート、量子ビットなどの重要な応用に期待されている。
低Qマイクロキャビティでは、強いハイブリッド化光子とフレンケル励起子の分極性シグネチャが暗黒励起子とともに崩壊することが以前に見いだされた。
ここでは、有機および金属層上での分極子の非局在化により、暗い励起子と熱電子の両方に敏感であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 10:07:00 GMT)
Hearing the shape of an arena with spectral swarm robotics [0.0] ロボットが隣人に情報を拡散してラプラシアン演算子をエミュレートするスペクトルスウォームロボットを紹介した。
本研究では,アリーナ形状のワンショット分類による課題条件下でのスペクトルスウォームロボティクスの検証を行った。
スペクトル法はロボティクスを超えて、交通や群衆といった様々な性質のエージェントの群れを分析し、調整することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:50:07 GMT)
Guidelines for Public and Patient Involvement in Neurotechnology in the United Kingdom [0.0] 技術開発ライフサイクルにエンドユーザを巻き込むという概念を明確にするための用語やフレームワークは、さまざまな種類があります。
神経テクノロジーに堅牢なPPIEプロセスを実装するための明確なガイドラインが欠けている。
ここでは、イギリスの研究者や技術者が神経テクノロジーのPPIを行うためのガイダンスを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:43:20 GMT)
Grammatical vs Spelling Error Correction: An Investigation into the Responsiveness of Transformer-based Language Models using BART and MarianMT [0.0] 本研究の目的は,テキスト中の異なる種類のエラーを解析することである。
この研究は、2つの高度なディープニューラルネットワークベースの言語モデル、すなわちBARTとMarianMTを使用して、テキストに存在する異常を修正している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:45:21 GMT)
Generation of genuine multipartite entangled states via indistinguishability of identical particles [0.0] 同一粒子の識別不可能性は、量子情報処理の資源である。
純積状態の$N$ qubitsから絡み合いを生成することができる制御可能なスキームを提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:37:54 GMT)
Fuzzy Gauge Theory for Quantum Computers [0.0] 連続ゲージ理論は無限次元局所ヒルベルト空間を持つ。
ファジィゲージ理論」というゲージ理論の新しい量子化法を提案する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:51:24 GMT)
Fully automated workflow for the design of patient-specific orthopaedic implants: application to total knee arthroplasty [0.0] 提案したワークフローは、患者のCT画像から直接、高速で信頼性の高い膝インプラントのパーソナライズを可能にする。
TKAの患者固有の事前手術計画を極めて短期間で確立し、すべての患者に容易に利用できるようにする。
このソリューションは、合併症を減らし、患者の満足度を高めながら、関節形成の増大に答えるのに役立つ。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:36:42 GMT)
From Non-Markovian Dissipation to Spatiotemporal Control of Quantum Nanodevices [0.0] 環境に放出されるエネルギーを遠隔で回収して過渡的な励起・反応性状態を作り出す方法について検討する。
また、システム励起によって引き起こされる再組織が、機能的量子系の下流の運動論を質的かつ可逆的に変化させることができるかを特定する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:57:10 GMT)
Exposing the hidden layers and interplay in the quantum software stack [0.0] 現在の量子コンピュータと近未来の量子コンピュータは、ノイズと低量子ビット数によるリソース制限に直面している。
本稿では,量子ソフトウェアスタックの層間における隠れた相互作用を明らかにする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 08:40:43 GMT)
Exploring the potential of prototype-based soft-labels data distillation for imbalanced data classification [0.0] 主な目的は、分類精度の観点からプロトタイプベースの軟質ラベル蒸留の性能を高めることである。
実験的研究は、この方法でデータを蒸留する能力だけでなく、増量法として機能する機会も追求している。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:15:19 GMT)
Explanation of the Generalizations of Uncertainty Principle from Coordinate and Momentum Space Periodicity [0.0] 座標 $x$-momentum $p_x$ Uncertainty Principle, with $Delta x$ and $Delta p_x$ の一般化は、量子重力に対する貧しい人のアプローチとして豊富な配当を提供した。
これらの一般化された不確実性原理は、正準量子力学において、完全に自然な方法で現れる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:05:05 GMT)
Exact block encoding of imaginary time evolution with universal quantum neural networks [0.0] 我々は、多体量子ビットハミルトニアンの正確な熱状態を表現できる量子ニューラルネットワークを生成する。
ネットワークは補助量子ビットの中間回路測定によって量子ハードウェア上で容易に実装できる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 23:35:04 GMT)
Event-Horizon-Like Singularities and Quantum Phase Transitions [0.0] 量子系が連続パラメータに依存する場合、創発的進化次元を誘導することができる。
本研究では、これらの特異点が量子相転移の指標であることを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 07:37:42 GMT)
Entanglement in Cosmology [0.0] 球状領域内の無質量場における絡み合いエントロピーの進化を、インフレ期とその後の放射線支配の時代を通じて計算する。
我々の結果は、インフレーション中にテンソルモードから生じる重力波のような弱い相互作用する場の量子的性質が、今日の宇宙で検出できる可能性を高める。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:36:59 GMT)
Emergence of multiphoton quantum coherence by light propagation [0.0] 自由空間における多光子系の量子コヒーレンスの変化
これらのプロセスは、サブショットノイズ量子特性を持つ多光子系に導かれることを示す。
我々は、線形伝播を通じてコヒーレンスの性質を改変した量子系を創出できる可能性は、様々な量子技術に劇的な影響をもたらすと信じている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 21:21:50 GMT)
Dynamics of a quantum system interacting with white non-Gaussian baths: Poisson noise master equation [0.0] 浴槽のポアソンノイズ特性に影響を受ける量子散逸系を記述する理論を考案する。
得られたマスター方程式は、ホワイトノイズ状態における非ガウス浴効果を明らかにする。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:15:18 GMT)
DeepGleason: a System for Automated Gleason Grading of Prostate Cancer using Deep Neural Networks [0.0] DeepGleasonはオープンソースのディープニューラルネットワークベースの画像分類システムで、Gleasonの自動グレーティングを行う。
マクロ平均F1スコアは0.806、AUCは0.991、精度は0.974である。
我々のツールは、研究コミュニティにおけるAIベースのGleasonグレーディングの普及に寄与します。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:15:42 GMT)
Conserved photon current [0.0] 光子電流は、電磁四ポテンシャルおよび場テンソル演算子によって満たされる可換関係から導かれる。
密度は正および負の周波数項に対する和であり、どちらも正の数密度に寄与し、共通の方向に伝播する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:38:03 GMT)
CipherFormer: Efficient Transformer Private Inference with Low Round Complexity [0.0] 本稿では,同相暗号とガーブロード回路を用いた変圧器プライベート推論方式であるCipherFormerを提案する。
テキスト分類タスクにおける高度な同型暗号方式と比較して、我々のモデルは7.7x-11.9倍の高速化でプライベート推論を行い、精度を3%から11%向上させる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 15:24:57 GMT)
Chitchat as Interference: Adding User Backstories to Task-Oriented Dialogues [0.0] Llama-2-70Bを用いて,ユーザバックストリーによるMultiWOZデータセットの強化を行う。
私たちは2つのモデルをテストします。1つはTODのみを訓練し、もう1つはTODを予備的な整合相互作用で訓練しました。
我々のデータセットは、トレーニング目的に効果的に使用することができ、システムはユーザーの背景を一貫して認識することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:36:54 GMT)
ChatDBG: An AI-Powered Debugging Assistant [0.0] ChatDBGはプログラマがデバッガとの共同対話を行うことを可能にする。
根本原因を分析し、バグを説明し、広範囲の現実世界のエラーに対する正確な修正を生成することができる。
ChatDBGは急速に普及しており、すでに3万回近くダウンロードされている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 01:12:57 GMT)
Certifiable lower bounds of Wigner negativity volume and non-Gaussian entanglement with conditional displacement gates [0.0] 本稿では,ECDゲートとキュービットリードアウトのみを用いて,キャビティ間の非ガウス的絡み合いを認証する手法を提案する。
ある種の共通状態の非ガウス的絡み合いは、特性関数の4点までの測定によって検出することができる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:02:20 GMT)
Can AI and humans genuinely communicate? [0.0] 本稿では,「メンタル・ビヘイビア・方法論」と呼ぶ問いに答える方法を探る。
この方法論は以下の3つのステップに従っている。
最初の2つのステップが成功し、AIが人間のような結果でテストに合格すれば、このAIと人間が真にコミュニケーションできる証拠となる。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 16:32:44 GMT)
Boson Sampling from Non-Gaussian States [0.0] このような状態を生成するスキームを用いて、一般的な単一モード状態からのボソンサンプリングについて検討する。
線形干渉計を通った後、これらの状態の出力光子数確率を計算するのに使用できる公式を導出する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:49:19 GMT)
Beyond unital noise in variational quantum algorithms: noise-induced barren plateaus and fixed points [0.0] 変分量子アルゴリズム(VQA)は、多くの可能性を秘めているが、指数的に小さな勾配の挑戦に直面している。
ノイズ誘起バレン高原(NIBPs)は、開放系効果によって生じる避けられないBPの一種である。
本稿では,VQAコスト関数の雑音誘起定点(NIFP)の関連現象を同定し,その存在を一元的および非一元的ノイズマップで証明する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:48:15 GMT)
Assessing the Performance of Deep Learning for Automated Gleason Grading in Prostate Cancer [0.0] 本研究は前立腺癌におけるGleason gradingの自動化のための11のディープニューラルネットワークアーキテクチャの可能性について検討した。
AUCMEDIフレームワークに基づく標準化された画像分類パイプラインは、堅牢な評価を容易にする。
より新しいアーキテクチャは、密接に関連するGleasonグレードの差別化の難しさにもかかわらず、優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:26:32 GMT)
As Good As A Coin Toss Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0] 合成メディアによる誤解に対する主な防御は、人間の観察者が実物と偽物とを視覚的に聴覚的に識別する能力に依存する。
被験者1276名を対象に, 合成画像, 音声のみ, ビデオのみ, 映像のみ, 音声視覚刺激を正当性から識別する能力について検討した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 13:39:33 GMT)
Approximation with Random Shallow ReLU Networks with Applications to Model Reference Adaptive Control [0.0] ランダムに生成される重みとバイアスを持つReLUネットワークは、高い確率で$O(m-1/2)$の誤りを生じることを示す。
本稿では,モデル参照適応制御アプリケーションにおいて,必要な精度を近似するために,その結果をどのように利用できるかを示す。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 19:39:17 GMT)
Applicability of mean-field theory for time-dependent open quantum systems with infinite-range interactions [0.0] 平均場理論は時間依存無限範囲相互作用系に適用可能であることを示す。
有限サイズ効果のバウンダリと,その進化時間依存性について検討する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 20:24:30 GMT)
An incremental MaxSAT-based model to learn balanced rules [0.0] 本研究は,MaxSATに基づく解釈可能かつバランスの取れたルールを学習するための漸進的モデルを提案することを目的とする。
MaxSATをベースとしたアプローチは、IMLIと呼ばれ、データセットにモデルを漸進的に適用することで一連のルールを学習するパフォーマンスを向上させるテクニックを提供する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 04:43:47 GMT)
An exactly solvable relativistic quantum Otto engine [0.0] 本研究では, 作業媒体が熱浴中を一定相対論的速度で移動している場合に, 機械から抽出できる作業量に及ぼす運動の影響について検討した。
速度と抽出された作業の間の非単調な依存は、テーブルトップ実験における熱力学過程の強化に相対論的効果を利用するという興味深い可能性を高める。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 09:25:22 GMT)
An Analysis of Linear Time Series Forecasting Models [0.0] 時系列予測のための線形モデルの一般的な変種は、標準の非制約線形回帰と等価であり、機能的に区別できない。
検査対象のモデルがほぼ同じ解を学習していることを示す実験的な証拠を提示し, 最終的に, より単純なクローズドフォームソリューションが, テスト設定の72%にまたがる優れた予測器であることを実証した。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 12:00:19 GMT)
AI Consciousness is Inevitable: A Theoretical Computer Science Perspective [0.0] 我々は意識のための正式な機械モデルを開発する。
このモデルはアラン・チューリングの単純だが強力な計算モデルとバーナード・ベアーズの意識の劇場モデルにインスパイアされている。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:38:54 GMT)
A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0] 我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 18:14:54 GMT)
A comparison of Human, GPT-3.5, and GPT-4 Performance in a University-Level Coding Course [0.0] そこで本研究では,学習者のみに対するChatGPT変種であるGPT-3.5とGPT-4の性能評価を行った。
学生の平均は91.9%(SE:0.4)で、AI応募の最高水準、即興エンジニアリングのGPT-4を上回り、81.1%(SE:0.8)と統計的に有意な差(p = 2.482×10-10$)を示した。
盲目マーカーは、Definitely の 4-point Likert スケールで、提出書の著者を推測する作業であった。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 17:41:02 GMT)
A comparative analysis of embedding models for patent similarity [0.0] 本稿では,テキストに基づく特許類似性の分野に2つの貢献をする。
これは、異なる種類の特許固有の事前訓練された埋め込みモデルの性能を比較する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 11:20:23 GMT)
A Study on How Attention Scores in the BERT Model are Aware of Lexical Categories in Syntactic and Semantic Tasks on the GLUE Benchmark [0.0] 本研究では,下流タスクの微調整過程において,BERTモデルのトークン間の注意スコアが語彙カテゴリによって大きく異なるかを検討する。
本仮説は, 意味情報を優先する下流作業においては, 内容語を中心とした注意スコアが強化され, 統語的情報を重視する場合には, 機能語を中心とした注意スコアが強化されることを示唆する。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 06:18:18 GMT)
A Knowledge Engineering Primer [0.0] このプライマーの目的は、知識工学の主題を簡潔で合成的な方法で導入し、その領域に関する読者の直感を発達させることである。
論文参考訳(メタデータ) (Mon, 25 Mar 2024 05:50:33 GMT)