Deep Reinforcement Learning with Hierarchical Reward Modeling [133.5] 本稿では,特定の構造を利用することにより,報酬設計プロセスの容易性を示す。
シナリオのための階層的な報酬モデリングフレームワーク -- HERONを提案する。 (I) フィードバック信号は自然に階層構造を呈し、 (II) 報酬は希少であるが、政策学習を支援するためにあまり重要でないサロゲートフィードバックを持つ。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:15:09 GMT)
Multi-Modal Hallucination Control by Visual Information Grounding [121.7] 本稿では,VLM(Generative Vision-Language Models)が,入力画像に常に接するとは限らない,可聴性のあるテキスト応答を生成する傾向があることを示す。
即時増幅のための新しいサンプリング手法であるM3ID(Multi-Modal Mutual-Information Decoding)を導入する。
M3IDは、言語に対する参照画像の影響を増幅し、視覚的プロンプトと高い相互情報を持つトークンの生成を優先する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:05:18 GMT)
You'll Never Walk Alone: A Sketch and Text Duet for Fine-Grained Image Retrieval [120.5] 事前学習したCLIPモデルを用いて,スケッチとテキストを効果的に組み合わせた新しい構成性フレームワークを提案する。
我々のシステムは、合成画像検索、ドメイン転送、きめ細かい生成における新しい応用にまで拡張する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:25:38 GMT)
Text-to-Image Diffusion Models are Great Sketch-Photo Matchmakers [120.5] 本稿では,ゼロショットスケッチに基づく画像検索(ZS-SBIR)のためのテキスト・画像拡散モデルについて検討する。
スケッチと写真の間のギャップをシームレスに埋めるテキストと画像の拡散モデルの能力。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:27:27 GMT)
How to Handle Sketch-Abstraction in Sketch-Based Image Retrieval? [120.5] スケッチの抽象化を様々なレベルで処理できるスケッチベース画像検索フレームワークを提案する。
粒度レベルの抽象理解のために、検索モデルはすべての抽象レベルを等しく扱ってはならないと規定する。
私たちのAcc.@qの損失は、評価がいかに厳格であるかという点で、スケッチが焦点を絞りたり壊したりできます。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:31:15 GMT)
It's All About Your Sketch: Democratising Sketch Control in Diffusion Models [114.7] 本稿では,拡散モデルにおけるスケッチの可能性を明らかにするとともに,生成型AIにおける直接スケッチ制御の詐欺的可能性に対処する。
私たちはこのプロセスを民主化し、アマチュアのスケッチが正確なイメージを生成できるようにします。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:23:17 GMT)
Training Small Multimodal Models to Bridge Biomedical Competency Gap: A Case Study in Radiology Imaging [113.2] バイオメディカル・コンピテンシー・ギャップを橋渡しするオープンソース小型マルチモーダル・モデル(SMM)の訓練について検討する。
LLaVA-Radは高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 23:31:22 GMT)
AdjointDPM: Adjoint Sensitivity Method for Gradient Backpropagation of Diffusion Probabilistic Models [103.4] 既存のカスタマイズ方法は、事前訓練された拡散確率モデルをユーザが提供する概念に合わせるために、複数の参照例にアクセスする必要がある。
本論文は、DPMカスタマイズの課題として、生成コンテンツ上で定義された差別化可能な指標が唯一利用可能な監督基準である場合に解決することを目的とする。
本稿では,拡散モデルから新しいサンプルを初めて生成するAdjointDPMを提案する。
次に、随伴感度法を用いて、損失の勾配をモデルのパラメータにバックプロパゲートする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:17:19 GMT)
RewardBench: Evaluating Reward Models for Language Modeling [100.3] 本稿では,報酬モデル評価のためのベンチマークデータセットとコードベースであるRewardBenchを紹介する。
RewardBenchデータセットは、チャット、推論、安全性にまたがる、プロンプト・ウィン・ローズ・トリオのコレクションである。
RewardBenchのリーダーボードでは、様々な方法で訓練された報酬モデルを評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:49:54 GMT)
AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [100.1] textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:00:14 GMT)
GaussNav: Gaussian Splatting for Visual Navigation [92.1] インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。
我々のフレームワークは3次元ガウススプラッティングに基づく新しい地図表現を構築する(3DGS)
我々のフレームワークは、Habitat-Matterport 3D(HM3D)データセットに挑戦するPath Length(SPL)が0.252から0.578に重み付けしたSuccessの増加によって証明された、パフォーマンスの著しい飛躍を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:01:58 GMT)
KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.2] KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:12:12 GMT)
RoleInteract: Evaluating the Social Interaction of Role-Playing Agents [85.7] 社会的相互作用の個人レベルとグループレベルの両方において、ロールプレイング・会話エージェントの社会的性を評価するために設計された最初のベンチマークを紹介する。
ベンチマークはさまざまなソースから構築され、500文字以上と6000以上の質問プロンプトをカバーする。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:38:36 GMT)
T-Pixel2Mesh: Combining Global and Local Transformer for 3D Mesh Generation from a Single Image [84.1] 本稿では,P2Mの粗大なアプローチにインスパイアされたトランスフォーマーブーストアーキテクチャT-Pixel2Meshを提案する。
具体的には,大域変換器を用いて局所的な形状を制御し,局所的な幾何学的詳細を洗練させる。
ShapeNetの実験では最先端の性能が実証され,実世界のデータでは一般化能力が示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:14:22 GMT)
RAR: Retrieving And Ranking Augmented MLLMs for Visual Recognition [79.0] MLLM(Multimodal Large Language Models)は、細粒度カテゴリの分類において優れている。
本稿では,MLLMの検索とランク付けのための拡張手法を提案する。
提案手法は, 微粒化認識における固有の限界に対処するだけでなく, モデルの包括的知識基盤も維持する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:55 GMT)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.3] 現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:58:03 GMT)
LLM3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning [78.2] 従来のタスク・アンド・モーション・プランニング(TAMP)アプローチは、シンボル的タスク・プランニングと連続的なモーション・ジェネレーションを結びつける手作業によるインタフェースに依存している。
本稿では,ドメインに依存しないインターフェースを備えたLarge Language Model (LLM) ベースの TAMP フレームワーク LLM3 を提案する。
具体的には、事前学習したLLMの強力な推論と計画能力を活用して、シンボル的なアクションシーケンスを提案し、動作計画のための連続的なアクションパラメータを選択する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:15:39 GMT)
A Large Language Model Enhanced Sequential Recommender for Joint Video and Comment Recommendation [77.4] 我々は、パーソナライズされたビデオとコメントのレコメンデーションを共同で行うLSVCRと呼ばれる新しいレコメンデーション手法を提案する。
提案手法は,逐次レコメンデーション(SR)モデルと補足型大規模言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。
特に、コメント視聴時間の4.13%が大幅に向上した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:14:29 GMT)
TrackDiffusion: Tracklet-Conditioned Video Generation via Diffusion Models [75.2] 微粒な軌跡条件の運動制御が可能な新しい映像生成フレームワークであるTrackDiffusionを提案する。
TrackDiffusionの重要なコンポーネントは、複数のオブジェクトのフレーム間の一貫性を明確に保証するインスタンスエンハンサーである。
TrackDiffusionによって生成されたビデオシーケンスは、視覚知覚モデルのトレーニングデータとして使用できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:28:02 GMT)
Consistent Diffusion Meets Tweedie: Training Exact Ambient Diffusion Models with Noisy Data [74.3] アンビエント拡散(アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散、アンビエント拡散
本稿では,ノイズの多い学習データのみを考慮し,故障のない分布から確実にサンプルを採取する拡散モデルのトレーニングのための最初のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:22:12 GMT)
MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.8] ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:17:22 GMT)
Magic-Me: Identity-Specific Video Customized Diffusion [72.1] 本稿では、VCD(Video Custom Diffusion)と呼ばれる、制御可能な被写体識別制御可能なビデオ生成フレームワークを提案する。
いくつかの画像によって定義された特定IDにより、VCDはアイデンティティ特性を強化し、安定したビデオ出力のためにフレームワイズ相関を注入する。
我々は、VCDがベースラインよりも優れたIDで安定した動画を生成可能であることを検証するために、広範囲な実験を行った。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:36:35 GMT)
Don't Blame the Annotator: Bias Already Starts in the Annotation Instructions [71.6] 我々は14のNLUベンチマークにおいて、命令バイアスと呼ばれるバイアスの形式を研究する。
提案手法は, クラウドワーカーが収集したデータに伝達する具体的なパターンを示すことが多いことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:23:11 GMT)
HyperLLaVA: Dynamic Visual and Language Expert Tuning for Multimodal Large Language Models [70.3] 本稿では,プロジェクタとLLMパラメータの適応的チューニングを含むHyperLLaVAと,動的ビジュアルエキスパートと言語エキスパートを紹介する。
MME,MMBench,SEED-Bench,LLaVA-Benchなど,既存のMLLMベンチマークではLLaVAを大きく上回っている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:42:43 GMT)
Tackling Noisy Labels with Network Parameter Additive Decomposition [69.9] ノイズラベルと戦うための暗記効果を利用した簡便で効果的な方法が、早期に停止している。
ネットワークパラメータに付加的な分解を行い、クリーンデータとラベルの誤りデータの記憶を分離する。
テストでは、一般化を強化するために$bmsigma$のみが使用される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:11:28 GMT)
PuzzleVQA: Diagnosing Multimodal Reasoning Challenges of Language Models with Abstract Visual Patterns [69.2] 基本概念に基づいた抽象パターンを用いた大規模マルチモーダルモデルの評価を行った。
単純な抽象パターンをうまく一般化できないことが分かりました。
系統解析の結果, GPT-4Vの主なボトルネックは視覚知覚の弱さと誘導的推論能力であることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:37:24 GMT)
LLatrieval: LLM-Verified Retrieval for Verifiable Generation [67.9] 検証可能な生成は、大きな言語モデル(LLM)がドキュメントをサポートするテキストを生成することを目的としている。
本稿では,LLatrieval (Large Language Model Verified Retrieval)を提案する。
実験により、LLatrievalは幅広いベースラインを著しく上回り、最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:04:06 GMT)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.8] 我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:51:30 GMT)
Information-Theoretic Distillation for Reference-less Summarization [67.5] 本稿では,要約のための情報理論的目的に基づいて,強力な要約器を蒸留する新しい枠組みを提案する。
我々は,教師モデルとしてPythia-2.8Bから出発する。
我々は,ChatGPTと競合する5億8800万のパラメータしか持たないコンパクトだが強力な要約器に到達した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:42:08 GMT)
Certified Human Trajectory Prediction [66.2] 交通予知は自動運転車に不可欠な役割を担っている。
本稿では,軌道予測作業に適した認証手法を提案する。
非有界出力や変異モダリティを含む、軌道予測に関連する固有の課題に対処する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:41:35 GMT)
Improved Baselines for Data-efficient Perceptual Augmentation of LLMs [66.1] コンピュータビジョンでは、画像キャプションや視覚的質問応答などの視覚言語タスクに、大きな言語モデル(LLM)を用いることができる。
複数のタスクにまたがる異なる対面機構を実験的に評価する。
異なるタスク間で(ほぼ)最適な結果をもたらす新しいインターフェース機構を同定し、トレーニング時間を4倍短縮する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:57:17 GMT)
Unraveling Privacy Risks of Individual Fairness in Graph Neural Networks [66.0] グラフニューラルネットワーク(GNN)は、その拡張現実の応用により、大きな注目を集めている。
信頼できるGNNを構築するためには、公平性とプライバシという2つの側面が重要な考慮事項として浮上している。
これまでの研究では、GNNの公平性とプライバシの側面を別々に検討し、GNNのパフォーマンスとのトレードオフを明らかにしている。
しかし、この2つの側面の相互作用は未解明のままである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:26:28 GMT)
BA-SAM: Scalable Bias-Mode Attention Mask for Segment Anything Model [65.9] 我々は,Segment Anything Model (SAM)における画像分解能変動の課題に対処する。
SAMはゼロショットの汎用性で知られており、さまざまな画像サイズを持つデータセットに直面するとパフォーマンスが低下する。
我々は、各トークンが隣り合う情報を優先順位付けできるバイアスモードのアテンションマスクを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:03:52 GMT)
Over-Reasoning and Redundant Calculation of Large Language Models [63.9] 大規模言語モデル(LLM)は、問題を段階的に解決することができる。
本稿では,手作業で構築した数学QAデータセットGSM8K-Zeroを用いて,LLMが冗長な計算と推論を生成する傾向があることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:08:22 GMT)
Genixer: Empowering Multimodal Large Language Models as a Powerful Data Generator [63.8] 我々は、高品質な命令チューニングデータを生成する革新的なデータ生成パイプライン、Genixerを開発した。
具体的には、Genixerはデータ生成の難しさを軽減するための4つの重要なステップを備えた統一されたソリューションを提供する。
Genixerの優れた定性的な結果は、現在のMLLMが強力なデータジェネレータに進化する強力な可能性を持っていることを示している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:00:39 GMT)
Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.6] 本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:06:43 GMT)
AutoMix: Automatically Mixing Language Models [62.5] 大規模言語モデル(LLM)は、さまざまなサイズと構成のクラウドAPIプロバイダから利用可能になった。
本稿では,より小さなLMからの出力の近似精度に基づいて,クエリを大規模LMに戦略的にルーティングする手法であるAutoMixを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:36:06 GMT)
Riemannian Multinomial Logistics Regression for SPD Neural Networks [60.1] 本稿では,Symmetric Positive Definite (SPD) 行列のための新しいタイプのディープニューラルネットワークを提案する。
我々のフレームワークは、既存のSPDネットワークで最も人気のあるLogEig分類器について、斬新な説明を提供する。
本手法の有効性は,レーダ認識,人行動認識,脳波分類(EEG)の3つの応用で実証された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:10:09 GMT)
Bridge the Modality and Capacity Gaps in Vision-Language Model Selection [60.0] 視覚言語モデル(VLM)は、画像とテキストのカテゴリ名とのペアリングによるゼロショット画像分類において優れている。
望まれるゼロショット画像分類戦略は、VLM動物園から最も適切な事前訓練VLMを選択することである。
本稿では,この言語のみのVLM選択において,VLMの能力を評価する上での2つの課題について分析する。
本稿では,これら2つのギャップの負の影響を軽減するために,gAp Bridging (SWAB)によるVLM選択を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:54:58 GMT)
Graph Attention Network-based Block Propagation with Optimal AoI and Reputation in Web 3.0 [59.9] 我々は、ブロックチェーン対応Web 3.0のための、グラフ注意ネットワーク(GAT)ベースの信頼できるブロック伝搬最適化フレームワークを設計する。
ブロック伝搬の信頼性を実現するために,主観的論理モデルに基づく評価機構を導入する。
グラフ構造化データの処理能力に優れたGATが存在することを考慮し、GATを強化学習に利用して最適なブロック伝搬軌道を得る。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:58:38 GMT)
AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.9] 本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:22:37 GMT)
Demonstrating a long-coherence dual-rail erasure qubit using tunable transmons [59.6] 共振結合された一対のトランスモンからなる「デュアルレール量子ビット」が高コヒーレントな消去量子ビットを形成することを示す。
我々は、チェック毎に0.1%$ dephasingエラーを導入しながら、消去エラーの中間回路検出を実演する。
この研究は、ハードウェア効率の量子誤り訂正のための魅力的なビルディングブロックとして、トランスモンベースのデュアルレールキュービットを確立する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:46:25 GMT)
Evaluating Frontier Models for Dangerous Capabilities [59.1] 危険な能力」の評価プログラムを導入し、Gemini 1.0モデルで試行する。
評価対象は,(1)説得と騙し,(2)サイバーセキュリティ,(3)自己増殖,(4)自己推論の4分野である。
我々の目標は、将来のモデルに備えて、危険な能力評価の厳格な科学を前進させることです。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:54:26 GMT)
A Unified and General Framework for Continual Learning [58.7] 継続学習(CL)は、以前取得した知識を維持しながら、動的かつ変化するデータ分布から学ぶことに焦点を当てている。
正規化ベース、ベイズベース、メモリ再生ベースなど、破滅的な忘れ込みの課題に対処する様々な手法が開発されている。
本研究の目的は,既存の方法論を包含し,整理する包括的かつ包括的な枠組みを導入することで,このギャップを埋めることである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:21:44 GMT)
Editing Massive Concepts in Text-to-Image Diffusion Models [58.6] 拡散モデル(EMCID)における大量概念を編集する2段階手法を提案する。
第1段階では、テキストアライメントの損失と拡散雑音予測の損失から2つの自己蒸留による各概念のメモリ最適化を行う。
第2段階では、多層クローズドフォームモデル編集による大規模な概念編集を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:57 GMT)
Multimodal Prompt Perceiver: Empower Adaptiveness, Generalizability and Fidelity for All-in-One Image Restoration [58.1] MPerceiverは、オールインワン画像復元のための適応性、一般化性、忠実性を高める新しいアプローチである。
MPerceiverは、オールインワンIRの9つのタスクでトレーニングされ、ほとんどのタスクで最先端のタスク固有のメソッドより優れています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:12:57 GMT)
Human Mesh Recovery from Arbitrary Multi-view Images [58.0] 任意の多視点画像からU-HMR(Unified Human Mesh Recovery)を分離・征服する枠組みを提案する。
特にU-HMRは、分離された構造と、カメラとボディーデカップリング(CBD)、カメラポーズ推定(CPE)、任意のビューフュージョン(AVF)の2つの主要コンポーネントから構成されている。
我々は、Human3.6M、MPI-INF-3DHP、TotalCaptureの3つの公開データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:04:21 GMT)
On Pretraining Data Diversity for Self-Supervised Learning [57.9] 我々は、より多様なデータセットを用いたトレーニングが、固定された計算予算の下での自己教師付き学習(SSL)のパフォーマンスに与える影響について検討する。
以上の結果から,事前学習データの多様性の増大はSSL性能を向上させるが,下流データへの分布距離が最小である場合に限る。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:58 GMT)
CoMo: Controllable Motion Generation through Language Guided Pose Code Editing [57.9] 本稿では,制御可能なモーション生成モデルであるCoMoについて紹介する。
CoMoは、動きを離散的で意味のあるポーズコードに分解する。
自動的にポーズコードのシーケンスを生成し、それを3Dモーションにデコードする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:11:10 GMT)
Mitigating Reversal Curse in Large Language Models via Semantic-aware Permutation Training [57.8] 我々は、大きな言語モデル(LLM)が「逆の呪い」に苦しむことを示す。
逆の呪いの根本原因は、訓練と推論の段階で異なる単語順にある。
この問題に対処するために,SPT(Semantic-Aware Permutation Training)を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:37:24 GMT)
FMM-Attack: A Flow-based Multi-modal Adversarial Attack on Video-based LLMs [57.6] 本稿では,ビデオベース大規模言語モデル (LLM) に適した最初の敵攻撃を提案する。
我々の攻撃は、ビデオに知覚不能な逆方向の摂動を加えると、ビデオベースのLCMを効果的に誘導し、誤った回答を発生させる。
我々のFMM-Attackは、モデル出力のギャンブルを誘導し、ビデオベースのLCMを幻覚させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:05:07 GMT)
Bidirectional End-to-End Learning of Retriever-Reader Paradigm for Entity Linking [57.4] RetrieverとReaderのための双方向エンドツーエンドトレーニングフレームワークであるBEER$2$を提案する。
設計した双方向のエンドツーエンドトレーニングを通じて、BEER$2$は、レトリバーとリーダーをガイドし、互いに学び、一緒に前進し、最終的にELパフォーマンスを改善する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:51:23 GMT)
Quantum control by the environment: Turing uncomputability, Optimization over Stiefel manifolds, Reachable sets, and Incoherent GRAPE [56.5] 多くの現実的な状況において、制御された量子系は環境と相互作用する。
本稿では,環境を資源として利用したオープン量子システムの制御に関するいくつかの結果について概説する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:09:13 GMT)
ManiPose: A Comprehensive Benchmark for Pose-aware Object Manipulation in Robotics [55.9] 本稿では,ポーズ変動操作タスクの研究を進めるための先駆的ベンチマークであるManiPoseを紹介する。
包括的データセットは、2936の現実世界のスキャンされた剛体オブジェクトと100の明瞭なオブジェクトに対して、幾何学的に一貫性があり、操作指向の6Dポーズラベルを備えている。
本ベンチマークは,ポーズ推定,ポーズ認識操作,実ロボットのスキル伝達における顕著な進歩を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:48:32 GMT)
Learning from Models and Data for Visual Grounding [55.2] データ駆動学習と様々な大規模事前学習モデルからの知識伝達を組み合わせたフレームワークであるSynGroundを紹介する。
マスク注意目的を最適化することにより、トレーニング済みの視覚・言語モデルをこのデータセット上に微調整する。
得られたモデルは、既成のビジョン・アンド・ランゲージモデルの接地能力を向上する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:43 GMT)
Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.0] 本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:12:12 GMT)
AutoDAN: Generating Stealthy Jailbreak Prompts on Aligned Large Language Models [55.0] 本稿では,大規模言語モデルに対する新たなジェイルブレイク攻撃であるAutoDANを紹介する。
AutoDANは、慎重に設計された階層型遺伝的アルゴリズムによって、ステルスなジェイルブレイクプロンプトを自動的に生成できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:34:56 GMT)
LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.9] 本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:19:41 GMT)
Genetic Auto-prompt Learning for Pre-trained Code Intelligence Language Models [54.6] コードインテリジェンスタスクにおける即時学習の有効性について検討する。
既存の自動プロンプト設計手法は、コードインテリジェンスタスクに限られている。
本稿では、精巧な遺伝的アルゴリズムを用いてプロンプトを自動設計する遺伝的オートプロンプト(GenAP)を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:37:00 GMT)
Diffusion Model for Data-Driven Black-Box Optimization [54.3] 我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:41:12 GMT)
Byzantine-resilient Federated Learning With Adaptivity to Data Heterogeneity [54.1] 本稿では、ビザンツの悪意ある攻撃データの存在下でのグラディエント・ラーニング(FL)を扱う。
Average Algorithm (RAGA) が提案され、ロバストネスアグリゲーションを活用してデータセットを選択することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:15:08 GMT)
Self-Supervised Class-Agnostic Motion Prediction with Spatial and Temporal Consistency Regularizations [53.8] クラスに依存しない動き予測法は点雲全体の動きを直接予測する。
既存のほとんどのメソッドは、完全に教師付き学習に依存しているが、ポイントクラウドデータの手作業によるラベル付けは、手間と時間を要する。
3つの簡単な空間的・時間的正則化損失を導入し,自己指導型学習プロセスの効率化を図る。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:58:45 GMT)
AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning [53.3] 連続学習は、モデルが逐次到着したデータから段階的に知識を学習できるようにすることを目的としている。
本稿では,新しいクラスやタスクの知識を段階的に抽出する,AttriCLIPという非インクリメンタル学習手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:44:50 GMT)
Bounding Box Stability against Feature Dropout Reflects Detector Generalization across Environments [52.7] 良い検出器は、位置があまり変化しない有界箱を出力する傾向があり、弱い検出器の有界箱は顕著な位置変化を受ける。
ボックス安定性スコア(BoSスコア)を計算して、この安定性を反映する。
各種試験環境における平均平均精度(mAP)を用いて測定した検出精度とBoSスコアが強い正の相関関係を持つことに寄与する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:16 GMT)
OSCaR: Object State Captioning and State Change Representation [52.1] 本稿では,OSCaR(Object State Captioning and State Change Representation)データセットとベンチマークを紹介する。
OSCaRは14,084の注釈付きビデオセグメントで構成され、様々なエゴセントリックなビデオコレクションから1,000近いユニークなオブジェクトが集められている。
マルチモーダル大言語モデル(MLLM)を評価するための新しいテストベッドを設定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:49:16 GMT)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [51.6] 本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:15:55 GMT)
A Dataset and Benchmark for Copyright Protection from Text-to-Image Diffusion Models [51.6] 安定した拡散によって生成されたコンテンツと著作権保護下のコンテンツの潜在的な相関性を評価する体系的な研究の欠如がある。
この作業は、著作権保護に関する最初の大規模標準化データセットとベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:45:13 GMT)
Surfer: Progressive Reasoning with World Models for Robotic Manipulation [51.3] 本稿では,新しいシンプルなロボット操作フレームワークであるSurferを紹介する。
Surferは、ロボット操作を視覚シーンの状態伝達として扱い、それをアクションとシーンという2つの部分に分割する。
これは世界モデルに基づいており、ロボット操作を視覚シーンの状態伝達として扱い、アクションとシーンの2つの部分に分けられる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:18:18 GMT)
Exploring the Privacy-Energy Consumption Tradeoff for Split Federated Learning [51.0] Split Federated Learning (SFL)は、最近、有望な分散学習技術として登場した。
SFLにおけるカット層の選択は、クライアントのエネルギー消費とプライバシに大きな影響を与える可能性がある。
本稿では、SFLプロセスの概要を概観し、エネルギー消費とプライバシを徹底的に分析する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:19:25 GMT)
CONLINE: Complex Code Generation and Refinement with Online Searching and Correctness Testing [51.0] 情報検索と自動正当性テストのためのオンライン検索を計画的に組み込むことで,コード生成を向上するCONLINEフレームワークを導入する。
CONLINEはDS-1000とClassEvalデータセットの厳密な実験を通じて検証される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:33:55 GMT)
What if...?: Counterfactual Inception to Mitigate Hallucination Effects in Large Multimodal Models [51.0] 本稿では,LMMに反現実的思考を埋め込む新しい手法である反現実的インセプションを紹介する。
この人間ライクな推論機構をLMMに適用することにより、幻覚効果を低減し、モデルの信頼性を向上させることを目指している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:27:20 GMT)
Prompt Highlighter: Interactive Control for Multi-Modal LLMs [50.8] 本研究では,マルチモーダル LLM (LLMs&VLMs) 推論における重要な側面として,明示的な制御可能なテキスト生成を目標とする。
本稿では,新しい推論手法であるPrompt Highlighterを導入し,ユーザが特定のプロンプトスパンをハイライトし,生成中のフォーカスをインタラクティブに制御できるようにする。
推論中、注意重みを通して強調されたトークンでモデルを導くことで、より望ましい出力が得られます。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 23:32:08 GMT)
View-Consistent 3D Editing with Gaussian Splatting [50.6] 3D Gaussian Splatting (3DGS)は、3D編集に革命をもたらした。
現在、拡散ベースの2D編集モデルを用いて、マルチビューレンダリング画像を修正し、3DGSモデルの編集をガイドしている。
画像編集プロセスに3DGSをシームレスに組み込む新しいフレームワークであるView-Consistent Editing (VcEdit)を導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:22:12 GMT)
DanceCamera3D: 3D Camera Movement Synthesis with Music and Dance [50.0] DCMは、カメラの動きとダンスモーションと音楽オーディオを組み合わせた、新しいマルチモーダルな3Dデータセットである。
このデータセットは、アニメコミュニティからのペアダンスカメラ音楽データの108のダンスシーケンス(3.2時間)を含む。
本研究では,新しいボディアテンション損失と条件分離戦略を組み込んだトランスフォーマーに基づく拡散モデルであるDanceCamera3Dを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:24:57 GMT)
Understanding the Factors Influencing Self-Managed Enterprises of Crowdworkers: A Comprehensive Review [49.6] 本稿では,クラウドソーシングの自己管理型クラウドワーカー企業(SMEC)への移行について検討する。
SMECの台頭を説明する重要な要因を特定することに焦点を当て、このシフトの基本的な側面を理解するために文献をレビューする。
この研究は、今後の研究を指導し、政策とプラットフォーム開発を指導することを目的としており、この発展途上の風景における公正な労働実践の重要性を強調している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:17:20 GMT)
Ground-A-Score: Scaling Up the Score Distillation for Multi-Attribute Editing [49.4] Ground-A-Scoreは、スコア蒸留時のグラウンド処理を取り入れた強力なモデル非依存画像編集法である。
新しいペナルティ係数とコントラスト損失を持つ選択的応用は、編集領域を正確にターゲットするのに役立つ。
質的評価と定量的分析の両方で、Ground-A-Scoreは拡張および多面的プロンプトの複雑な詳細に順応することを確認した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:40:32 GMT)
A non-hermitean momentum operator for the particle in a box [49.2] 無限かつ具体的な例として、対応するエルミートハミルトニアンを構築する方法を示す。
結果として生じるヒルベルト空間は、物理的および非物理的部分空間に分解することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:51:58 GMT)
SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.8] 本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:36:13 GMT)
HierCode: A Lightweight Hierarchical Codebook for Zero-shot Chinese Text Recognition [47.9] 我々は,漢字の自然的階層性を利用した,新規で軽量なコードブックであるHierCodeを提案する。
HierCodeは階層的なバイナリツリーエンコーディングとプロトタイプ学習を活用して、各文字に特徴的な情報表現を生成するマルチホットエンコーディング戦略を採用している。
このアプローチは、共有ラジカルと構造を利用してOOV文字のゼロショット認識を促進するだけでなく、視覚的特徴と類似性を計算することでラインレベルの認識タスクも優れている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:20:48 GMT)
Computational Models to Study Language Processing in the Human Brain: A Survey [47.8] 本稿では,脳研究における計算モデルの利用の取り組みを概観し,新たな傾向を浮き彫りにしている。
我々の分析によると、すべてのデータセットで他のモデルよりも優れているモデルはない。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:01:22 GMT)
RadSplat: Radiance Field-Informed Gaussian Splatting for Robust Real-Time Rendering with 900+ FPS [47.5] 本稿では,複雑なシーンをリアルタイムにレンダリングする軽量なRadSplatを提案する。
まず, 優先信号として放射場を用い, 点ベースシーン表現の最適化を行い, 品質の向上とロバストな最適化を実現した。
次に,高い品質を維持しつつ全体の点数を削減し,より高速な推論速度でより小型でコンパクトなシーン表現を実現する新しいプルーニング手法を開発した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:59:55 GMT)
Do Not Worry if You Do Not Have Data: Building Pretrained Language Models Using Translationese [47.5] 事前学習には大量のモノリンガルデータが必要であるが、ほとんど英語以外の言語では利用できない。
我々は、英語とIndic言語を例にとり、Webcrawled monolingual document (clean)を対象言語に翻訳する。
そして、この翻訳データに基づいて28Mと85Mのパラメータを含む言語モデルを訓練する(合成)。
下流の自然言語理解および生成タスクにおけるそれらのパフォーマンスは、クリーンデータで事前訓練されたLMよりも、NLUタスクで3.56%、NLGタスクで1.51%しか劣らない。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:41:01 GMT)
Meta-Point Learning and Refining for Category-Agnostic Pose Estimation [47.0] Category-Agnostic pose Estimation (CAPE) は、キーポイントを付加したいくつかのサポートイメージが与えられた場合、任意のクラスのキーポイントを予測することを目的としている。
このような潜在的なキーポイント(メタポイント)に基づくCAPEのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:54:33 GMT)
On Prompt Sensitivity of ChatGPT in Affective Computing [46.9] 本稿では,異なるプロンプトや生成パラメータに基づいて基礎モデルの性能評価と評価を行う手法を提案する。
感情分析, 毒性検出, 皮肉検出の3つの主要な問題に対して, 感情計算の範囲内でChatGPTの評価を行った。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:11:01 GMT)
The Power of Noise: Toward a Unified Multi-modal Knowledge Graph Representation Framework [46.7] マルチモーダルな知識グラフ(MMKG)表現学習フレームワークは,構造化された知識を大規模に多モーダルな言語モデル(LLM)に統合するために重要である。
モードレベルのノイズマスキングを備えたトランスフォーマーアーキテクチャを用いた新しいSNAG手法を提案する。
提案手法は,その堅牢性と汎用性を実証し,合計10データセットにわたるSOTA性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:02:54 GMT)
Deep Feature Consistent Variational Autoencoder [46.3] 本稿では,変分オートエンコーダ(VAE)構築のための新しい手法を提案する。
ピクセル・バイ・ピクセル・ロスを使用する代わりに、入力とVAEの出力の深い特徴一貫性を強制する。
また,本手法は,顔表現の意味情報をキャプチャする潜在ベクトルを生成できることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:41:19 GMT)
Pricing-driven Development and Operation of SaaS : Challenges and Opportunities [46.0] 本稿では,PetClinicをケーススタディとして,システムにおける価格駆動型開発・運用手法の意義を考察する。
私たちの議論は、この統合アプローチの複雑さをナビゲートする戦略的洞察を提供することを目的としています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:11:58 GMT)
Discover and Mitigate Multiple Biased Subgroups in Image Classifiers [46.0] 機械学習モデルは、分散データではうまく機能するが、トレーニングデータに不足している偏りのあるサブグループでは失敗することが多い。
この問題に対処するために,分解,解釈,緩和(DIM)を提案する。
提案手法では,画像特徴を複数のサブグループを表す複数のコンポーネントに分解する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:18:27 GMT)
Hub-aware Random Walk Graph Embedding Methods for Classification [45.0] ノード分類問題に特化して設計されたランダムウォークに基づく2つの新しいグラフ埋め込みアルゴリズムを提案する。
提案手法は,実世界のネットワークの埋め込みを訓練した3つの分類アルゴリズムの分類性能を解析して実験的に評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:44:15 GMT)
Be-Your-Outpainter: Mastering Video Outpainting through Input-Specific Adaptation [44.9] ビデオのアウトペイントは、入力されたビデオのビューポートの外でビデオコンテンツを生成することを目的とした、難しい作業である。
入力特化適応によるMOTIAマスタリングビデオアウトペイントについて紹介する。
MoTIAは入力特異的適応とパターン認識の露呈という2つの主要なフェーズから構成される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:53:45 GMT)
Agent Group Chat: An Interactive Group Chat Simulacra For Better Eliciting Collective Emergent Behavior [44.8] 我々は,マルチエージェント間の言語的相互作用をシミュレートするエージェントグループチャットシミュレーションを開発した。
4つの物語シナリオがエージェントグループチャットに統合され、多様なストーリーラインのサポートを評価する。
文字によって話される全ての内容のn-gramシャノンエントロピーを計算し、環境内の障害を評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:21:32 GMT)
Piecing Together Clues: A Benchmark for Evaluating the Detective Skills of Large Language Models [44.4] 検出者は、様々なケースで意思決定を行う際に、情報検出と推論を同時に行うことが多い。
我々は、キー情報検出とマルチホップ推論において、モデルが協調的に機能する能力を評価するために設計された読解理解データセットであるTectBenchを紹介する。
本手法は,モデルが推論の前にコンテキスト内で可能なすべての手がかりを識別することを奨励する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:56:52 GMT)
Rotary Position Embedding for Vision Transformer [44.3] 本研究では、視覚変換器(ViT)に適用した場合の回転位置埋め込み(RoPE)の包括的解析を提供する。
RoPEは印象的な補間性能、すなわち推論時の画像解像度を増大させながら精度を維持する。
最終的にImageNet-1k、COCO検出、ADE-20kセグメンテーションのパフォーマンスが向上した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:47:13 GMT)
Diversified and Personalized Multi-rater Medical Image Segmentation [43.5] 本稿ではD-Personaという2段階のフレームワークを提案する。
ステージIでは、複数のアノテーションを使って確率的U-Netモデルをトレーニングし、予測の多様性を改善するために制約付き損失を制限した。
ステージIIでは、複数の注意に基づく投影ヘッドを設計し、対応する専門家のプロンプトを共有潜在空間から適応的にクエリし、パーソナライズされた医用画像セグメンテーションを実行する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:00:19 GMT)
NetInfoF Framework: Measuring and Exploiting Network Usable Information [43.0] 我々はNetInfoF_ProbeとNetInfoF_Actを含むNetInfoFを提案する。
慎重に設計された合成データセットにおいて、NetInfoFはNUIの基礎的真実を正しく識別し、全てのグラフシナリオに対して堅牢である唯一の方法である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:30:41 GMT)
Pricing4SaaS: a suite of software libraries for pricing-driven feature toggling [42.9] 本稿では,プライシング4SaaSというソフトウェアライブラリ群を紹介する。
システムフロントエンドとバックエンドの両方で、価格駆動機能トグルの実装を容易にするように設計されている。
本稿では、人気の高いSpring PetClinicプロジェクトに基づくケーススタディを紹介し、このスイートをどのように活用して開発者の生産性を最適化するかを説明します。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:08:41 GMT)
Reverse Training to Nurse the Reversal Curse [42.8] 大型言語モデル (LLM) には驚くべき失敗がある: "A has a feature B" で訓練された場合、それらは "B is a feature of A" に一般化されるのではなく、"Reversal Curse" と呼ばれる。
この研究は、すべての単語を2回使用し、利用可能なトークンの量を2倍にする、リバーストレーニングと呼ばれる代替のトレーニングスキームを提案する。
我々は,データマッチング逆トレーニングモデルが標準タスクの標準モデルよりも優れた性能を示し,計算マッチング逆トレーニングモデルは逆タスクにおいてはるかに優れた性能を示し,逆の呪いの解決に役立てることを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:55:35 GMT)
MMICL: Empowering Vision-language Model with Multi-Modal In-Context Learning [42.7] 大規模言語モデル(LLM)によって強化された視覚言語モデル(VLM)は、急速に人気が高まっている。
マルチモーダル・インコンテキスト・ラーニング(MMICL)を用いた視覚言語モデルを導入し,VLMがマルチモーダル入力を効率的に処理できるようにする。
実験により,MMICLは多種多様な視覚言語タスクにおいて,最先端のゼロショット性能を実現することを確認した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:17:02 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [42.4] 本稿では,オープン語彙フレームワークを用いて複数のオブジェクトカテゴリを同時カウント可能な,より実用的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察を用いて、ユーザが指定したオブジェクトを数えることによって際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示しています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:57:26 GMT)
An Entropy-based Text Watermarking Detection Method [41.4] トークンエントロピーの影響は、透かし検出プロセスにおいて完全に考慮すべきである。
本研究では,透かし検出時に高いエントロピートークンを高い重みを与えるエントロピーベースの透かし検出(EWD)を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:40:01 GMT)
Learning Spatiotemporal Inconsistency via Thumbnail Layout for Face Deepfake Detection [41.4] 社会とサイバーセキュリティに対するディープフェイクの脅威は、重大な公衆の不安を引き起こしている。
本稿では,Thumbnail Layout(TALL)という,エレガントでシンプルだが効果的な戦略を紹介する。
TALLはビデオクリップを予め定義されたレイアウトに変換し、空間的および時間的依存関係の保存を実現する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:15:28 GMT)
ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems [40.8] 本稿では,Deep Recommender Systems(DRS)のためのフェースセレクションのための包括的bEnchmaRkであるERASEについて述べる。
ERASEは11種類の特徴選択手法を徹底的に評価し、従来のアプローチとディープラーニングアプローチの両方をカバーしている。
私たちのコードは簡単に再現できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:10:22 GMT)
BayesPrompt: Prompting Large-Scale Pre-Trained Language Models on Few-shot Inference via Debiased Domain Abstraction [40.2] 本稿では,プロンプトチューニング手法が特定のショットパターンに一般化できないことを示す。
ドメイン識別情報を含むプロンプトを学習するためにベイズプロンプトを提案する。
本手法は,ベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:52:42 GMT)
Teacher-Student Training for Debiasing: General Permutation Debiasing for Large Language Models [39.8] 大規模言語モデル(LLM)は、NLPタスクにおいて、印象的なゼロショット機能と汎用性を実証している。
特定のタスクに対して重要な不変性を維持するのに失敗することもある。
本稿では, 推定時の非効率性について述べる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:38:07 GMT)
Cutting a Wire with Non-Maximally Entangled States [39.8] 回路切断技術は、古典的な通信による量子計算の分配を可能にする。
量子テレポーテーションは、回路の実行を指数的に増加させることなく、量子計算の分配を可能にする。
本稿では、この最適なサンプリングオーバヘッドを実現するために、純非最大絡み状態を用いたワイヤ切断手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:37:15 GMT)
BOBA: Byzantine-Robust Federated Learning with Label Skewness [39.8] 連合学習において、既存のロバストアグリゲーションルール(AGR)は、IID設定でビザンツ攻撃と戦う。
ラベルスキューネス(ラベルスキューネス)は、より現実的で挑戦的な非IID設定であり、各クライアントはいくつかのデータクラスにしかアクセスできない。
この設定では、最先端のAGRは選択バイアスに悩まされ、特定のクラスのパフォーマンスが大幅に低下する。
これらの制約に対処するために,BOBAという2段階の効率的な手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:11:56 GMT)
Adversarial Attacks and Defenses in Automated Control Systems: A Comprehensive Benchmark [39.7] 機械学習をACS(Automated Control Systems)に統合することで、産業プロセス管理における意思決定が促進される。
これらの技術を広く採用する際の制限の1つは、敵の攻撃に対するニューラルネットワークの脆弱性である。
本研究では、テネシー・イーストマン・プロセス・データセットを用いて、ACSにおける障害診断のためのディープラーニングモデルをデプロイする際の脅威について検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:59:06 GMT)
Exploring semantic information in disease: Simple Data Augmentation Techniques for Chinese Disease Normalization [37.7] 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,病名固有の意味情報を活用するために,カスタマイズされたデータ拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:33:32 GMT)
Learning Adversarial MDPs with Stochastic Hard Constraints [37.2] 本研究では,制約付き意思決定プロセスにおけるオンライン学習問題について,対向的損失と厳しい制約を伴う検討を行った。
我々は,各エピソードの制約を高い確率で満たしながら,サブ線形後悔を実現するアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:50:24 GMT)
Enhancing Code Generation Performance of Smaller Models by Distilling the Reasoning Ability of LLMs [36.4] 我々は、LLMのコード生成推論機能をより小さなモデルに転送することを目的としたCodePLANフレームワークを提案する。
提案手法は,APPSベンチマークにおいて,より小さなモデルのコード生成性能を130%以上向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:09:54 GMT)
Analyzing and Improving the Training Dynamics of Diffusion Models [36.4] 一般的なADM拡散モデルアーキテクチャにおいて、不均一かつ非効率なトレーニングの原因をいくつか特定し、修正する。
この哲学の体系的な応用は、観測されたドリフトと不均衡を排除し、同じ計算複雑性でネットワークをかなり良くする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:58:14 GMT)
Quantum Chaos on Edge [36.1] 我々は、スパースの近縁物理学と密度のカオス系の近辺の2つの異なるクラスを識別する。
この区別は、系のランダムパラメータの数とヒルベルト空間次元の比にある。
2つの族は、レベル間隔に匹敵するエネルギースケールで同一のスペクトル相関を共有するが、状態の密度とエッジ付近のゆらぎは異なる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:31:51 GMT)
Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and Real-time Rendering [36.1] 周期振動ガウスモデル(PVG)を提案する。
PVGは、当初静的シーン表現のために設計された効率的な3Dガウススプラッティング技術に基づいている。
PVGは、最良の代替品よりも900倍の速度でレンダリングできる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:27:53 GMT)
Policy Bifurcation in Safe Reinforcement Learning [34.3] いくつかのシナリオでは、実行可能なポリシーは不連続または多値であり、不連続な局所最適性の間の補間は必然的に制約違反につながる。
我々は,このような現象の発生機構を最初に同定し,安全RLにおける分岐の存在を厳密に証明するためにトポロジカル解析を用いる。
本稿では,ガウス混合分布をポリシ出力として利用するマルチモーダルポリシ最適化(MUPO)と呼ばれる安全なRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:13:47 GMT)
EmotionIC: emotional inertia and contagion-driven dependency modeling for emotion recognition in conversation [34.2] 本稿では,ERCタスクに対する感情的慣性・伝染型依存性モデリング手法(EmotionIC)を提案する。
EmotionICは3つの主要コンポーネント、すなわちIDマスク付きマルチヘッド注意(IMMHA)、対話型Gated Recurrent Unit(DiaGRU)、Skip-chain Conditional Random Field(SkipCRF)から構成されている。
実験結果から,提案手法は4つのベンチマークデータセットにおいて,最先端のモデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:35:04 GMT)
ConGeo: Robust Cross-view Geo-localization across Ground View Variations [34.2] クロスビューなジオローカライゼーションは,地上レベルのクエリイメージを対応するジオレファレンスな空中ビューとマッチングすることで,ローカライズすることを目的としている。
既存の学習パイプラインはオリエンテーションに特化しているか、FoVに特化している。
本研究では,地域化のための単一・クロスモーダルなコントラスト手法であるConGeoを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:37:13 GMT)
Latent Field Discovery In Interacting Dynamical Systems With Neural Fields [34.0] 我々は、フィールドの発見に集中し、観察されたダイナミクスからのみそれらを推測する。
我々は、同変グラフネットワークと相互作用を結合し、場力を統合する新しいグラフネットワークにおいて、それらをニューラルネットワークと組み合わせる。
実験の結果,荷電粒子の設定,交通シーン,重力n体問題などの基礎となるフィールドを正確に発見できることが判明した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:05:03 GMT)
The LLM Surgeon [33.9] 我々は、スクラッチから小さなモデルをトレーニングする代替手段として、既存の事前訓練モデルのデータ駆動圧縮について検討する。
我々は、非構造的、半構造的、構造的プルーニングのための一般的なフレームワークを提供し、重み間の相関性を高めるために、重み更新を改善する。
提案手法では,OPTモデルとLlamav2-7Bの行と列を20%~30%削減できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:21:58 GMT)
A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization [33.8] 政策勾配(PG)を利用してリスク条件値(CVaR)を最適化する強化学習アルゴリズムは、サンプルの非効率性において重大な課題に直面している。
本稿では,リスクニュートラル政策と調整可能な政策を統合し,リスク・アバース政策を形成する簡易な混合政策パラメタライゼーションを提案する。
実験により、この混合パラメータ化は様々なベンチマーク領域で一意に有効であることが判明した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:38:58 GMT)
Weight-Inherited Distillation for Task-Agnostic BERT Compression [32.1] 本稿では,教師から直接知識を伝達するWID(Weight-Inherited Distillation)を提案する。
WIDは追加のアライメント損失を必要とせず、重みを継承することでコンパクトな学生を訓練する。
GLUEとSQuADのベンチマーク実験の結果、WIDは従来のKDベースのベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:41:07 GMT)
Analyzing User Engagement with TikTok's Short Format Video Recommendations using Data Donations [31.8] データ提供システムを通じて収集したデータを用いて、TikTok上のユーザエンゲージメントを分析する。
利用者の注意力は45%程度で安定しているのに対し,平均日使用時間は1日平均で1日当たり1時間以上上昇していることがわかった。
また、フォローしていない人よりもフォローしている人がアップロードしたビデオの方が多いこともわかりました。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:22:44 GMT)
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models [31.8] IDAdapterは、単一の顔画像からパーソナライズされた画像生成における多様性とアイデンティティの保存を強化する、チューニング不要なアプローチである。
トレーニング期間中、特定のアイデンティティの複数の参照画像から混合した特徴を取り入れ、アイデンティティ関連コンテンツの詳細を充実させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:13:04 GMT)
Isometric Neural Machine Translation using Phoneme Count Ratio Reward-based Reinforcement Learning [31.3] 本稿では,Reinforcement Learning (RL) を用いた等尺的NMTシステムの開発について述べる。
提案モデルを評価するため,長さコンプライアンス尺度であるPhonme Count Compliance(PCC)スコアを提案する。
提案手法は,英語-ヒンディー語対に適用した場合の最先端モデルと比較して,PCCスコアが約36%向上したことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:52:40 GMT)
Advancing Beyond Identification: Multi-bit Watermark for Large Language Models [31.1] 機械生成テキストの識別を超えて,大規模言語モデルの誤用に対処する可能性を示す。
言語モデル生成中にトレーサブルなマルチビット情報を埋め込んだ位置アロケーションによるマルチビット透かしを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:04:11 GMT)
Fast-Poly: A Fast Polyhedral Framework For 3D Multi-Object Tracking [31.1] 3D Multi-Object Tracking (MOT) は障害物を取り囲む安定かつ包括的な運動状態をキャプチャする。
Fast-Polyは、3D MOTのための高速かつ効果的なフィルタベースの手法である。
Fast-PolyはPythonを実装した2つの大規模トラッキングベンチマークで広くテストされている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:39:39 GMT)
A Sampling-based Framework for Hypothesis Testing on Large Attributed Graphs [31.1] 本研究では,属性グラフにおけるノード,エッジ,パス仮説を定式化する。
既存の仮説に依存しないグラフサンプリング手法に対応可能な,サンプリングベースの仮説テストフレームワークを開発した。
実データを用いた実験では,提案フレームワークが一般的なグラフサンプリング手法を仮説テストに活用できることが示されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:56:22 GMT)
m&m's: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks [31.0] 我々は、33のツールを含む4K以上のマルチステップマルチモーダルタスクを含むベンチマークであるm&m'sを紹介する。
これら各タスククエリに対して、この現実的なツールセットを使用して自動生成されたプランを提供する。
1,565のタスクプランの高品質なサブセットを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:35:15 GMT)
AVID: Any-Length Video Inpainting with Diffusion Model [30.9] 拡散モデルを用いたAVID(Any-Length Video Inpainting with Diffusion Model)を提案する。
本モデルは,固定長映像の描画に有効な動作モジュールと調整可能な構造ガイダンスを備える。
実験により,映像の持続時間帯の異なる様々なインパインティングタイプを,高品質で頑健に扱うことが可能であることが確認された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:20:01 GMT)
Do Language Models Know When They're Hallucinating References? [30.4] State-of-the-art Language Model (LM) は、幻覚情報を生成するのに非常に敏感である。
我々は、幻覚書や記事参照に焦点をあて、それらを言語モデル幻覚研究の「モデル」として提示する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:12:48 GMT)
The Expressive Power of Transformers with Chain of Thought [29.8] 実際には「思考の連鎖」や「スクラッチパッド」を使用することで、トランスフォーマーの推論を改善することができる。
答えは「イエス」だが、増加量は中間生成量に大きく依存する。
また, 線形ステップでは, コンテクストに敏感な言語に変換器デコーダを配置することが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:55:48 GMT)
Roto-translated Local Coordinate Frames For Interacting Dynamical Systems [29.8] 複雑な力学系のクラスは$textitgeometric graphs$, $textiti.e.$、ユークリッド空間に位置するノードを持つグラフに$textitarbitrally$選択されたグローバル座標系を与えることができる。
相互作用する力学系の幾何グラフに対するロト変換不変性を誘導するために,ノードオブジェクトごとの局所座標フレームを提案する。
交通シーンや3Dモーションキャプチャ、衝突粒子の実験では、提案手法が最近の最先端技術よりも快適に優れていることが示されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:45:00 GMT)
PanoDiffusion: 360-degree Panorama Outpainting via Diffusion [29.1] パノディフュージョンと呼ばれる潜在拡散モデル(LDM)を用いた360度室内RGB-Dパノラマ露光モデルを提案する。
トレーニング中にRGBと深度パノラマデータの両方を利用する新しいバイモーダル潜時拡散構造を導入する。
以上の結果から,RGB-Dパノラマにおけるパノ拡散法は,様々な種類のマスクに対して多種多様な構造を持つ結果が得られるだけでなく,高品質のパノラマを合成し,リアルな3次元室内モデルを提供することによって,最先端のパノラマ法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:43:27 GMT)
Motion Generation from Fine-grained Textual Descriptions [29.0] 我々は,ファインヒューマンML3Dという微細なテキスト記述を伴う大規模言語移動データセットを構築した。
我々は、きめ細かいテキスト情報をフル活用する新しいテキスト2モーションモデル、FineMotionDiffuseを設計する。
実験の結果,FinHumanML3Dで訓練したFinMotionDiffuseは定量的評価において良好な結果が得られることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:38:30 GMT)
AttackEval: How to Evaluate the Effectiveness of Jailbreak Attacking on Large Language Models [28.7] 我々は大規模言語モデル(LLM)に対するジェイルブレイク攻撃の有効性を評価するための新しいアプローチを開拓した。
本研究は,粗粒度評価と細粒度評価の2つの異なる評価フレームワークを紹介する。
我々は、ジェイルブレイクに特化された総合的な真実データセットを開発した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:08:39 GMT)
RoDia: A New Dataset for Romanian Dialect Identification from Speech [28.5] RoDiaはルーマニア語の方言識別のための最初のデータセットである。
ルーマニアの5つの異なる地域からの音声サンプルが含まれており、都市部と農村部の両方をカバーしている。
上位スコアモデルは、マクロF1スコアが59.83%、マイクロF1スコアが62.08%に達し、タスクが困難であることを示している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:57:51 GMT)
Correct Like Humans: Progressive Learning Framework for Chinese Text Error Correction [28.3] Chinese Text Error Correction (CTEC) は、入力テキスト中のエラーを検出し、修正することを目的としている。
最近のアプローチではCTECの解決にPLM(Pre-trained Language Models)を主に採用している。
本稿では,PLMをベースとしたCTECモデルを誘導し,人間のように修正する,モデルに依存しない新しいプログレッシブラーニングフレームワークProTECを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:53:37 GMT)
SAMCT: Segment Any CT Allowing Labor-Free Task-Indicator Prompts [28.2] 我々は、公開データセットから1.1MのCT画像と5Mのマスクからなる大規模なCTデータセットを構築した。
我々は、労働自由なプロンプトを可能にする強力な基盤モデルSAMCTを提案する。
SAMに基づいてSAMCTはさらに、CNNイメージエンコーダ、クロスブランチインタラクションモジュール、タスクインディケータプロンプトエンコーダを備えている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:39:15 GMT)
Compress3D: a Compressed Latent Space for 3D Generation from a Single Image [27.5] トリプレーンオートエンコーダは3次元モデルをコンパクトな3次元ラテント空間に符号化し、3次元幾何情報とテクスチャ情報の両方を圧縮する。
本稿では,低解像度の潜在表現を用いて高解像度の3D特徴量から特徴を問合せする3D対応のクロスアテンション機構を提案する。
われわれのアプローチでは、1つのA100 GPU上で7秒で高品質な3Dアセットを生成できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:51:04 GMT)
GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot [27.4] マルチタスクロボット学習は、多種多様な複雑なシナリオに取り組む上で重要な役割を担っている。
データ利用戦略を最適化するためのGERM(Generalist Robotic Model)を提案する。
我々は、マルチモーダル入力と出力動作を処理するために、トランスフォーマーベースのVLAネットワークを使用する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:36:43 GMT)
ShaDocFormer: A Shadow-Attentive Threshold Detector With Cascaded Fusion Refiner for Document Shadow Removal [26.9] 本稿では,文書陰影除去の問題に対処するために,従来の手法とディープラーニング技術を統合したTransformerベースのアーキテクチャを提案する。
ShaDocFormerアーキテクチャは、Shadow-attentive Threshold Detector (STD)とCascaded Fusion Refiner (CFR)の2つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:31:16 GMT)
USE: Dynamic User Modeling with Stateful Sequence Models [26.7] User Stateful Embedding (USE)は、徹底的な再処理を必要とせずに、ユーザ埋め込みを生成する。
我々は,次世代の予測の限界を超越するために,将来のW行動予測という新たな訓練目標を導入する。
静的(固定されたユーザ行動シーケンス)および動的(定期的に更新されたユーザ行動シーケンス)設定の両方で、Snapchatユーザーの行動ログを使用して、8つの下流タスクで実験を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:05:19 GMT)
Tackling the Singularities at the Endpoints of Time Intervals in Diffusion Models [26.7] 不適切な特異点の扱いは、アプリケーションにおける平均的な明るさの問題につながる。
理論的・実践的な両面から特異点に取り組むことに注力する。
本稿では,初期特異時間ステップサンプリングに対処する新しいプラグアンドプレイ方式SingDiffusionを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:41:07 GMT)
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data [26.5] 状態空間モデルに基づくMambaは、テキストシーケンスをモデル化するための同等のパフォーマンスを実現することが示されている。
本稿では,Mambaアーキテクチャを任意の多次元データに拡張した汎用設計であるMamba-NDを提案する。
我々は,Mamba-NDが,多次元ベンチマークにおける最先端技術と性能の競争力を示すことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:58:15 GMT)
Facilitating Pornographic Text Detection for Open-Domain Dialogue Systems via Knowledge Distillation of Large Language Models [26.4] 人間と機械の対話で発生するポルノコンテンツは、オープンドメインの対話システムにおいて、ユーザに深刻な副作用をもたらす可能性がある。
本稿では,対話セッションにポルノコンテンツが含まれているかどうかを検出するための対話監視データセットであるCensorChatを紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:29:09 GMT)
UWFormer: Underwater Image Enhancement via a Semi-Supervised Multi-Scale Transformer [26.2] 水中画像は、品質が悪く、色調が歪んだり、コントラストが低かったりすることが多い。
現在のディープラーニング手法は、マルチスケール拡張に欠けるニューラル畳み込みネットワーク(CNN)に依存している。
半教師付き学習によって複数の周波数の画像を拡張するためのマルチスケールトランスフォーマーベースネットワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:34:21 GMT)
LaserHuman: Language-guided Scene-aware Human Motion Generation in Free Environment [25.8] 我々は,Scene-Text-to-Motion研究に革命をもたらすために設計された,先駆的なデータセットであるLaserHumanを紹介する。
LaserHumanは、本物の人間の動きを3D環境に含めることで際立っている。
本稿では,既存のデータセット上での最先端性能を実現するための多条件拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:11:10 GMT)
DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation [25.8] 我々は,蒸留したデータセットの対角的堅牢性を統一的に評価する上で,これまでで最も広範囲なベンチマークを導入する。
TESLAやSRe2Lといった最新の進歩を取り入れることで,これまでの取り組みを大きく拡張する。
また, 蒸留したデータを元のデータセットのトレーニングバッチに組み込むことで, 堅牢性の向上が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:00:53 GMT)
Having Beer after Prayer? Measuring Cultural Bias in Large Language Models [25.7] 多言語およびアラビア語のモノリンガルLMは、西洋文化に関連する実体に対して偏見を示すことを示す。
アラブ文化と西洋文化を対比する8つのタイプにまたがる628個の自然発生プロンプトと20,368個のエンティティからなる新しい資源であるCAMeLを紹介した。
CAMeLを用いて、物語生成、NER、感情分析などのタスクにおいて、16の異なるLMのアラビア語における異文化間性能について検討した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:16:37 GMT)
Scaling Diffusion Models to Real-World 3D LiDAR Scene Completion [25.7] 3D LiDARセンサーは、通常、シーンからスパース3Dポイントの雲を収集するために使用される。
本稿では,1枚のLiDARスキャンからシーン完了を実現するために,画像の生成モデルとして拡散モデルを拡張することを提案する。
提案手法は,1つのLiDARスキャンを入力としてシーンを完了し,最先端のシーン補完手法と比較して,より詳細なシーンを生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:19:05 GMT)
Gaussian Splatting on the Move: Blur and Rolling Shutter Compensation for Natural Camera Motion [25.5] 本稿では,カメラの動きに適応し,手持ち映像データを用いた高品質なシーン再構成を実現する手法を提案する。
合成データと実データの両方を用いて、既存の手法よりもカメラの動きを軽減できる性能を示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:19:41 GMT)
Learning to Infer Generative Template Programs for Visual Concepts [25.3] 我々は、視覚概念をドメイン・ジェネラルな方法で捉えたプログラムを推論する方法を学ぶ。
筆者らのフレームワークは, 少数ショット生成や協調作業など, 概念関連タスクを複数サポートしている。
2Dレイアウト、Omniglot文字、そして3D形状です。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:29:58 GMT)
Data Acquisition via Experimental Design for Decentralized Data Markets [25.3] データ市場は、特に医療などのデータ不足領域において、データの供給を増やす手段を提供する。
このような市場におけるデータ買い手にとっての大きな課題は、データ売り手から最も価値のあるデータポイントを選択することだ。
本稿では,線形実験設計にインスパイアされたデータ選択問題に対するフェデレートされたアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:05:52 GMT)
Augmented Reality Demonstrations for Scalable Robot Imitation Learning [25.0] 本稿では,実証収集のためのAR支援フレームワークについて述べる。
我々は、HoloLens 2.0のようなデバイスを使って、ロボットILのデモを作ることができる非ロボティスティックなユーザーに力を与えます。
従来の3つのロボットのタスク(リーチ、プッシュ、ピック・アンド・プレイス)で、我々のアプローチを検証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:30:12 GMT)
Train & Constrain: Phonologically Informed Tongue-Twister Generation from Topics and Paraphrases [25.0] 本稿では,Large Language Models (LLMs) から音韻的に情報を得た舌のツイスターを生成するパイプラインを提案する。
また、生成されたデータセットに基づいて訓練された小型モデルの自動評価と人的評価の結果も提示する。
本稿では,任意の因果言語モデルに統合可能なPhoneme-Aware Constrained Decoding Module (PACD)を導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:13:17 GMT)
ABScribe: Rapid Exploration & Organization of Multiple Writing Variations in Human-AI Co-Writing Tasks using Large Language Models [24.8] ABScribeは、迅速かつ視覚的に構造化され、探索され、書込みのバリエーションの組織化をサポートするインタフェースである。
ABScribeでは、再利用可能なボタンに自動変換されるLSMプロンプトを使用して、変更を迅速に修正することができる。
変化はテキストフィールドに隣接して格納され、ポップアップツールバー上のマウスオーバーインタラクションを用いた高速なインプレース比較を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:26:12 GMT)
Is this the real life? Is this just fantasy? The Misleading Success of Simulating Social Interactions With LLMs [24.6] 大規模言語モデル(LLM)との社会的相互作用をシミュレートする評価フレームワークを開発した。
実験の結果,非正当性エージェントと比較して,相互行為者が社会的目標達成に成功していることが明らかとなった。
以上の結果から, 情報非対称性への対処は, LLMをベースとしたエージェントにとって依然として根本的な課題であることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:44:17 GMT)
IVAC-P2L: Leveraging Irregular Repetition Priors for Improving Video Action Counting [24.6] ビデオアクションカウント(VAC)は、ビデオ内の反復的なアクションを分析する上で重要である。
伝統的な手法は、割り込みや周期の変動など、アクション反復の複雑さを見落としてきた。
ビデオにおける不規則な反復パターンのモデル化を優先する不規則なビデオアクションカウント(IVAC)を導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:58:23 GMT)
Are Ensembles Getting Better all the Time? [24.4] アンサンブルが常に改善されていることは、考慮された損失関数が凸である場合に限る。
医用予測(ニューラルネットを用いたメラノーマ診断)と「魔法の群集」実験(今後の映画の評価)について概説する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:36:23 GMT)
EthioLLM: Multilingual Large Language Models for Ethiopian Languages with Task Evaluation [24.1] 本稿では,エチオピア語5言語(Amharic, Ge'ez, Afan Oromo, Somali, Tigrinya)と英語の多言語大言語モデルであるEthioLLMを紹介する。
我々は,5つの下流自然言語処理(NLP)タスクにおいて,これらのモデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:43:42 GMT)
An Aligning and Training Framework for Multimodal Recommendations [24.0] マルチモーダル・レコメンデーションは ユーザーインタラクションを超えて 豊かなコンテキストを活用できる
既存の手法では、主に多モーダル情報を補助的なものとみなし、それを用いてIDの特徴を学習する。
マルチモーダルコンテンツの特徴とIDの特徴の間にはセマンティックなギャップがあり、多モーダル情報を補助として使用すると、ユーザやアイテムの表現が不一致になる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:50:36 GMT)
BadEdit: Backdooring large language models by model editing [23.9] バックドアインジェクションを軽量な知識編集問題として定式化する。
BadEdit は LLM パラメータを直接変更して,効率的な編集テクニックでバックドアを組み込む。
実験の結果、BadEditフレームワークは、100%の成功率で、トレーニング済みのLLMを効率的に攻撃できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:34:18 GMT)
Towards Principled Representation Learning from Videos for Reinforcement Learning [23.9] ビデオデータを用いた意思決定のための事前学習表現について検討する。
我々は,ビデオデータを用いたMDPの潜在状態表現の学習に重点を置いている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:28:17 GMT)
An Image-based Typology for Visualization [23.7] 本稿では,画像からの視覚表現の質的解析結果について述べる。
定義群を10種類に分類した。
我々は、6,833枚のタグ付き画像のデータセットと、ラベル付き画像の大規模な集合を探索および分析するために使用できるオンラインツールを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:39:27 GMT)
MoST: Motion Style Transformer between Diverse Action Contents [23.6] そこで本研究では,コンテンツからスタイルを効果的に切り離し,ソースモーションから転送されたスタイルを持つ可視動作を生成する新しい動き変換器を提案する。
提案手法は既存の手法より優れており,特に異なる内容のモーションペアにおいて,後処理を必要とせず,非常に高品質であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:05:02 GMT)
On-the-fly Learning to Transfer Motion Style with Diffusion Models: A Semantic Guidance Approach [23.6] そこで本研究では,拡散モデルに基づく人間動画像のオンザフライ変換学習手法を提案する。
まず,提案したスタイルニュートラルモーションペア生成モジュールを用いて,対応するニュートラルモーションを生成する。
次に、生成した中性運動に雑音を加えて、スタイル伝達拡散モデルを微調整するスタイルの例に近づいたことを認知する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:52:11 GMT)
Adaptive Message Passing: A General Framework to Mitigate Oversmoothing, Oversquashing, and Underreaching [23.5] 長距離相互作用は、多くの科学分野における複雑なシステムの正しい記述に不可欠である。
ほとんどのディープグラフネットワークは、(同期)メッセージパッシングの固有の制限のため、実際には長距離依存をモデル化できません。
この研究は、これらの制限を緩和する一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:10:33 GMT)
Efficient Subgraph GNNs by Learning Effective Selection Policies [23.5] グラフGNN(Subgraph GNN)は、グラフ表現をグラフの集合から学習する、証明可能な表現可能なニューラルネットワークアーキテクチャである。
本稿では,データ駆動方式で可能な膨大なサブグラフのサブセットを選択することの難しさについて考察する。
我々は、反復的な方法でサブグラフの選択方法を学ぶ「ポリシーラーン」と呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:22:16 GMT)
Secure Query Processing with Linear Complexity [22.9] 我々は、セキュアなマルチパーティ計算モデル(MPC)の下で、線形複雑性(実行時間と通信の両方において)を持つ最初のプロトコルであるLINQを提示する。
また、リニアな複雑さを保ちながら、多くのセレクトジョイントクエリである、すべてのフリーコンネックスクエリをサポートするように拡張することもできる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:48:29 GMT)
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models [22.9] LlamaFactoryは、最先端の効率的なトレーニング方法を統合した統合フレームワークである。
これによってユーザは、内蔵のWeb UI LlamaBoardをコーディングすることなく、100以上のLLMの微調整を柔軟にカスタマイズできる。
言語モデリングとテキスト生成タスクにおけるフレームワークの有効性と有効性を実証的に検証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:08:54 GMT)
VL-Mamba: Exploring State Space Models for Multimodal Learning [22.7] 本研究では,状態空間モデルに基づく多モーダル大規模言語モデルであるVL-Mambaを提案する。
具体的には、まず、LLamaやVicunaのようなトランスフォーマーベースのバックボーン言語モデルを、事前訓練されたMamba言語モデルに置き換える。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:48:50 GMT)
A Unified Optimal Transport Framework for Cross-Modal Retrieval with Noisy Labels [22.3] クロスモーダル検索(CMR)は、異なるモーダル間の相互作用を確立することを目的としている。
本研究は,ロバスト・クロスモーダル検索のための最適輸送(OT)に基づく統一フレームワークであるUTT-RCLを提案する。
広範に使用されている3つのクロスモーダル検索データセットの実験は、我々のOT-RCLが最先端のアプローチを超越していることを示している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:34:40 GMT)
DepthFM: Fast Monocular Depth Estimation with Flow Matching [22.2] この問題に対する現在の差別的アプローチは、ぼやけた人工物のために限られている。
最先端の生成法は、SDEの性質上、サンプリングが遅い。
解空間を通した直線軌道は効率と高品質を提供するので,フローマッチングを用いて効果的にフレーム化することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:51:53 GMT)
A system capable of verifiably and privately screening global DNA synthesis [22.1] SecureDNAは、プライバシを保護し、完全に自動化されたシステムで、最新のハザードデータベースに対して、30以上の塩基対の全DNA合成順序を確実にスクリーニングすることができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:49:00 GMT)
What explains the success of cross-modal fine-tuning with ORCA? [22.1] ORCAは、クロスモーダル微調整、すなわち、トレーニングデータを超えるモダリティに事前訓練されたトランスフォーマーモデルを適用する技術である。
一連のアブリケーションを実行し、埋め込みトレーニングが2Dタスクにまったく役に立たないことを見つけます。
実験した6つのデータセットのうち4つで、最大の違いをもたらすのはモデル微調整です。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:14:54 GMT)
Dynamic Reward Adjustment in Multi-Reward Reinforcement Learning for Counselor Reflection Generation [22.0] 自然言語生成のための複数テキスト品質を協調的に最適化するマルチリワード強化学習の課題について検討する。
我々は,報酬をひとつの値に組み合わせ,同時に最適化するという広範な戦略を頼りに,DynaOpt と C-DynaOpt という2つの新しいバンドイット手法を紹介した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:24:41 GMT)
OrthCaps: An Orthogonal CapsNet with Sparse Attention Routing and Pruning [21.6] 冗長性はCapsule Networks(CapsNet)における永続的な課題である
本稿では,冗長性を低減し,ルーティング性能を改善し,パラメータ数を減少させるOrthogonal Capsule Network(OrthCaps)を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:25:24 GMT)
A Survey on Large Language Model (LLM) Security and Privacy: The Good, the Bad, and the Ugly [21.5] 大規模言語モデル(LLM)は、自然言語の理解と生成に革命をもたらした。
本稿では,LLMとセキュリティとプライバシの交わりについて考察する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:00:24 GMT)
Modality-missing RGBT Tracking: Invertible Prompt Learning and High-quality Benchmarks [21.1] モーダル情報は、熱センサーの自己校正やデータ伝送誤差などの要因によって見逃される可能性がある。
本稿では、コンテンツ保存プロンプトをよく訓練された追跡モデルに統合する、新しい非可逆的プロンプト学習手法を提案する。
提案手法は,最先端手法と比較して,大幅な性能向上を実現している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:50:19 GMT)
End-to-end Learned Visual Odometry with Events and Frames [20.7] 視覚オドメトリー(VO)は自律型ロボットナビゲーションに不可欠である。
近年のモデルベースVOシステムは,標準カメラとイベントベースカメラの組み合わせが始まっている。
本稿では,最初のエンドツーエンドの学習画像とイベントベースのVOシステムであるRAMP-VOを紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:35:08 GMT)
On the Privacy Effect of Data Enhancement via the Lens of Memorization [20.6] 我々は,記憶化という新たな視点からプライバシを調査することを提案する。
記憶のレンズを通して、以前デプロイされたMIAは、より高いプライバシーリスクを持つサンプルを特定する可能性が低いため、誤解を招く結果をもたらすことがわかった。
一般化ギャップとプライバシリークは, これまでの結果に比べて相関が低いことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:13:44 GMT)
PaD: Program-aided Distillation Can Teach Small Models Reasoning Better than Chain-of-thought Fine-tuning [20.6] 本稿では, 蒸留データの誤りを抑えるための推論プログラムを導入したPaD(Program-Aided Distillation)を提案する。
算術的推論,記号的推論,一般能力に基づいてPaDを評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:37:42 GMT)
Learning Algorithms for Verification of Markov Decision Processes [20.6] マルコフ決定過程(MDP)の検証に学習アルゴリズムを適用するための一般的な枠組みを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に重点を置いている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:34:37 GMT)
MIntRec2.0: A Large-scale Benchmark Dataset for Multimodal Intent Recognition and Out-of-scope Detection in Conversations [20.5] MIntRec2.0は、マルチパーティ会話におけるマルチモーダルインテント認識のための大規模なベンチマークデータセットである。
1,245の対話と15,040のサンプルがあり、それぞれが30のきめ細かいクラスからなる新しい意図的分類に注釈付けされている。
各発話における話者の包括的情報を提供し、多人数会話研究に活用する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:52:42 GMT)
Visually Grounded Speech Models have a Mutual Exclusivity Bias [20.5] 子どもが新しい単語を学ぶ際には、相互排他性(ME)バイアスのような制約を用いる。
このバイアスは計算学的に研究されてきたが、個々の単語表現を入力として使用するモデルでのみ研究されている。
自然画像と連続音声から学習する視覚的接地音声モデルの文脈におけるMEバイアスについて検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:49:59 GMT)
Capsule Neural Networks as Noise Stabilizer for Time Series Data [20.3] カプセルニューラルネットワークは、単一ベクトルにニューロンを結合し、位置同変の特徴を学習するカプセルを使用する。
本稿では,高感度でノイズの多い時系列センサデータの解析におけるCapsNetsの有効性について検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:17:49 GMT)
QUASAR: QUality and Aesthetics Scoring with Advanced Representations [20.2] 本稿では,画像品質と美学評価のための新しいデータ駆動非パラメトリック手法を提案する。
データに効率的な画像アンカーを提案することで、表現力のあるテキスト埋め込みの必要性を解消する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:19:52 GMT)
Mora: Enabling Generalist Video Generation via A Multi-Agent Framework [20.0] Soraは、社会全体で大きな注目を集めた最初の大規模ジェネラリストビデオ生成モデルである。
本稿では,複数の高度な視覚AIエージェントを組み込んだマルチエージェントフレームワークであるMoraを提案し,Soraがデモした汎用ビデオ生成を再現する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:19:21 GMT)
Assessing the Reasoning Abilities of ChatGPT in the Context of Claim Verification [19.9] GPT-3.5-Turbo と GPT-4 の推論能力について検討した。
我々の研究は、ChatGPTの推論プロセスが人間のような推論を反映する可能性が低いことを示唆する研究の組織に寄与する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:14:54 GMT)
Unifying Local and Global Multimodal Features for Place Recognition in Aliased and Low-Texture Environments [19.9] 本稿では,視覚とLiDARの機能間のクロスアテンションブロックによってマルチモーダル性を活用するUMFという新しいモデルを提案する。
実験では、特に惑星系で捕獲された配列について、UMFが以前のベースラインよりもかなり優れていたことが示されている。
我々の研究は、すべての状況においてSLAMの信頼性を高めることを目的としており、広く使用されているRobotCarデータセットのパフォーマンスについても検討している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:35:57 GMT)
Jaccard Metric Losses: Optimizing the Jaccard Index with Soft Labels [19.8] ユニオン(IoU)の損失に対するインターセクション(Intersection over Union)は、Jaccardインデックスを直接最適化するサロゲートである。
ハードラベルを用いた標準設定では,Jaccard Metric Losses (JML) はソフトなJaccard損失と同じだが,ソフトなラベルと完全に互換性がある。
実験の結果,4つのセマンティックセグメンテーションデータセット間のクロスエントロピー損失に対して一貫した改善が得られた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:50:25 GMT)
Towards Effective Multiple-in-One Image Restoration: A Sequential and Prompt Learning Strategy [19.7] 7つのIRタスクからなるMultiple-in-one (MiO) IR問題について詳細に検討する。
これらの課題に対処するために、我々は2つの単純かつ効果的な戦略を提示した。
19個のテストセットで評価することにより、逐次的および迅速な学習戦略がMiO性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:33:20 GMT)
LeanReasoner: Boosting Complex Logical Reasoning with Lean [19.5] 大規模言語モデル(LLM)は、論理的不整合とそのような推論の固有の難しさのために、複雑な論理的推論に苦しむことが多い。
これらの課題に対処するために、定理実証フレームワークであるLeanを使用します。
論理的推論問題をリーン内の定理にフォーマルにすることで、対応する定理を証明または証明することで、それらを解決することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:29:06 GMT)
Style Injection in Diffusion: A Training-free Approach for Adapting Large-scale Diffusion Models for Style Transfer [19.4] 本研究では,事前学習した大規模拡散モデルに基づく新たな芸術的スタイル伝達手法を提案する。
実験の結果,提案手法は従来の手法と拡散型方式の両方で最先端の手法を超越していることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:39:52 GMT)
From Bricks to Bridges: Product of Invariances to Enhance Latent Space Communication [19.3] 異なるニューラルネットワークによって学習された表現は、モデルが同様の誘導バイアスの下で訓練されたときに構造的類似性を隠蔽することが観察されている。
我々は,不変成分の積空間を潜在表現の上に構築し,その表現に不変量の集合を直接組み込む汎用的手法を導入する。
我々は,ゼロショット縫合設定において,一貫した遅延類似性および下流性能向上を観察し,分類および再構成タスクに対するソリューションの有効性を検証した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:33:50 GMT)
Camera Height Doesn't Change: Unsupervised Training for Metric Monocular Road-Scene Depth Estimation [19.2] 単分子深度ネットワークに絶対的なスケールを学習させ,道路シーン深度を推定する新たなトレーニング手法を提案する。
鍵となるアイデアは、道路で見つかった車をスケールの監督源として活用するだけでなく、トレーニングにしっかりと組み込むことだ。
我々は,StableCamHが様々なカメラ高さの混合データセットのトレーニングを可能にし,より大規模にトレーニングし,より高い一般化を実現することを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:12:21 GMT)
BlendScape: Enabling Unified and Personalized Video-Conferencing Environments through Generative AI [19.1] BlendScapeは、参加者がコラボレーションコンテキストに合わせてビデオ会議環境を構築するためのシステムである。
BlendScapeは、ユーザの物理的あるいは仮想的なバックグラウンドを統一された環境にブレンドすることで、タスク空間の柔軟な表現をサポートする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:41:05 GMT)
SC-Tune: Unleashing Self-Consistent Referential Comprehension in Large Vision Language Models [19.0] 自己整合性チューニング(SC-Tune)と呼ばれる新しい微調整パラダイムを導入する。
SC-Tuneは循環型記述子-ロケータシステムの相乗学習を特徴としている。
SC-Tuneは、オブジェクトレベルの視覚言語ベンチマークにおいて、性能を著しく向上させることを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:00:21 GMT)
Precipitation Downscaling with Spatiotemporal Video Diffusion [19.0] この研究は、最近のビデオ拡散モデルを拡張して、超解像を降水させる。
決定論的ダウンスケーラと時間条件付き拡散モデルを用いて雑音特性と高周波パターンを抽出する。
カリフォルニアとヒマラヤを用いたCRPS, MSE, 降水分布の把握, および定性的側面の解析により, データ駆動型降水ダウンスケーリングの新しい標準として本手法を確立した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:12:22 GMT)
MEDBind: Unifying Language and Multimodal Medical Data Embeddings [19.0] 我々は,CXR,ECG,医療用テキストにまたがる共同埋め込みを学習するMEDBind(Medical Electronic patient recorD)を提案する。
テキストデータを中央アンカーとして使用すると、MEDBindはトリモダリティバインディングを備え、トップK検索、ゼロショット、少数ショットベンチマークで競合的なパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:56:03 GMT)
Comprehensive Evaluation of GNN Training Systems: A Data Management Perspective [18.8] 多くのグラフニューラルネットワーク(GNN)トレーニングシステムが最近、効率的なGNNトレーニングをサポートするために登場した。
本稿では,データ管理の観点からGNNトレーニングをレビューし,代表的アプローチの総合的な分析と評価を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:25:36 GMT)
Llama meets EU: Investigating the European Political Spectrum through the Lens of LLMs [18.8] 我々は、Llama ChatをEU政治の文脈で監査し、モデルの政治的知識と文脈における推論能力を分析する。
我々は、欧州議会で議論された個々のユーロ党の演説に対して、さらなる微調整、すなわちラマ・チャット(Llama Chat)を適用して、その政治的傾向を再評価した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:42:57 GMT)
VSTAR: Generative Temporal Nursing for Longer Dynamic Video Synthesis [18.8] 本稿では,時間的ダイナミクスの制御を改善するために,時間的時間的看護(GTN, Generative Temporal Nursing, GTN)の概念を導入する。
提案手法が既存のオープンソースT2Vモデルよりも長めで視覚的に魅力的なビデオを生成する場合の優位性を実験的に示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:58:58 GMT)
Towards a Perceptual Evaluation Framework for Lighting Estimation [18.8] 本研究は,既存の画像品質評価(IQA)指標を用いて,照明推定の進歩を追跡した結果である。
これは合理的なアプローチのように見えるが、仮想シーンをリアルな写真にリライトするために推定照明を使用する場合、人間の嗜好と相関しないことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:11:07 GMT)
The Power of Few: Accelerating and Enhancing Data Reweighting with Coreset Selection [18.7] 再重み付けにコアサブセット選択を用いる新しい手法を提案する。
戦略的に選択されたコアセットに焦点を当てることで、我々のアプローチは堅牢な表現を提供する。
再校正された重みは、データセット全体に対してマッピングされ、伝播される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:27:44 GMT)
Diversity-aware Channel Pruning for StyleGAN Compression [18.7] StyleGANは無条件画像生成において顕著な性能を示した。
その高い計算コストは、実用的な応用に重大な課題をもたらす。
チャネルの様々な感度を潜在ベクトルに活用する新しいチャネルプルーニング法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:36:41 GMT)
Learning from Label Proportions: Bootstrapping Supervised Learners via Belief Propagation [18.6] LLP(Learning from Label Proportions)は、トレーニング中にバッグと呼ばれるインスタンスのグループに対して、アグリゲートレベルのラベルしか利用できない学習問題である。
この設定は、プライバシー上の配慮から、広告や医療などの領域で発生する。
本稿では,この問題に対して,反復的に2つの主要なステップを実行する新しいアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:23:32 GMT)
LNPT: Label-free Network Pruning and Training [18.5] トレーニング前のプルーニングは、ニューラルネットワークをスマートデバイスにデプロイすることを可能にする。
我々は,クラウド上の成熟したネットワークが,ラベルのないデータを持つスマートデバイス上でのネットワークプルーニングと学習のオンラインガイダンスを提供するための,新しい学習フレームワーク LNPT を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:06:34 GMT)
Grounding Spatial Relations in Text-Only Language Models [18.5] テキストのみの言語モデル(LM)は,対象の明示的な位置情報が提供される場合,空間的関係を基底として学習することができることを示す。
既製のオブジェクト検出器を用いて画像の言語化を行い,各オブジェクトラベルに位置トークンを付加し,それらの境界ボックスをテキスト形式で表現する。
そこで本研究では,テキストのみのLMがビジョン・アンド・ランゲージモデルより優れ,VSRデータセットの新たな最先端設定を行うことにより,位置が空間関係の接地を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:20:30 GMT)
Probabilistic Forecasting with Stochastic Interpolants and Föllmer Processes [18.3] 生成モデルに基づく動的システムの確率的予測のためのフレームワークを提案する。
このSDEのドリフトと拡散係数は訓練後に調整できることを示し、推定誤差の影響を最小限に抑える特定の選択がF"ollmerプロセスを与えることを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:33:06 GMT)
CLIPSwarm: Generating Drone Shows from Text Prompts with Vision-Language Models [18.2] 本稿では,自然言語に基づくSwarmドローン生成のモデリングを自動化するアルゴリズムであるCLIPSを紹介する。
このアルゴリズムは「探索」と「探索」の異なるステップを用いて、テキスト記述と整合するロボットの形成を反復的に洗練する。
実験結果から,自然言語記述からロボット生成を正確にモデル化するシステムの有効性が示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:17:39 GMT)
Controlling the Inductive Bias of Wide Neural Networks by Modifying the Kernel's Spectrum [18.1] 所望の固有値を持つカーネルに改良スペクトルカーネル(MSK)を導入する。
本研究では,勾配勾配の軌道を変化させる事前条件付き勾配降下法を提案する。
私たちの手法は計算効率が良く、実装も簡単です。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:49:41 GMT)
Weisfeiler and Leman Go Loopy: A New Hierarchy for Graph Representational Learning [17.6] グラフ同型テストの新しい階層構造と対応するGNNフレームワークである$r$-$ell$MPNNを導入し、最大長さ$r + 2$までサイクルをカウントできる。
特に、$r$-$ell$WL がサクタスグラフの準同型を数えることができることを示す。
提案した$r$-$ell$MPNNの複数の合成データセットに対する表現力とカウント力を実証的に検証し,様々な実世界のデータセットに対する最先端の予測性能を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:58:28 GMT)
View while Moving: Efficient Video Recognition in Long-untrimmed Videos [17.6] 本稿では,映像認識の効率化を目的とした新しい認識パラダイム"View while moving"を提案する。
2段階のパラダイムとは対照的に、我々のパラダイムは生のフレームに一度だけアクセスする必要がある。
提案手法は精度と効率の両面で最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:07:26 GMT)
SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning [17.5] Generalized Category Discovery (GCD) は、目に見えない画像と見えない画像の両方を分類することを目的としている。
SPTNetと呼ばれる2段階適応手法を導入し、モデルパラメータとデータパラメータを反復的に最適化する。
提案手法は,標準ベンチマークにおける既存のGCD法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:41:39 GMT)
Dynamic Resource Allocation for Virtual Machine Migration Optimization using Machine Learning [17.4] 段落は文法的に正確で論理的に一貫性がある。
これは、効率的なデータアクセスとストレージの必要性と、追加の時間遅延を防ぐためのクラウドコンピューティングマイグレーション技術の利用を強調している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:13:44 GMT)
FairSNA: Algorithmic Fairness in Social Network Analysis [17.4] ソーシャルネットワークの構造的バイアスが、さまざまな方法の公平性にどのように影響するかを強調します。
我々は、異なるSNA問題に対して、ネットワーク構造に基づくソリューションを提案しながら考慮すべき公平性について論じる。
フェアネスとSNAのギャップを埋めるために研究者の注意を必要とする様々なオープンな研究の方向性を強調した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:17:28 GMT)
Uncertainty-Aware Explanations Through Probabilistic Self-Explainable Neural Networks [17.2] プロトタイプベースの自己説明型ニューラルネットワークは、深いが透過的な設計アーキテクチャを提供する。
本稿では,PSENNの確率的再構成(Prob-PSENN)を導入する。
実験の結果, Prob-PSENN は確率的でないものよりも有意義でロバストな説明を提供することがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:47:28 GMT)
Polaris: A Safety-focused LLM Constellation Architecture for Healthcare [17.1] Polarisは、リアルタイムの患者とAIの医療会話のための、安全に焦点を当てた初めてのLLMコンステレーションだ。
当社のモデルは、プロプライエタリなデータ、臨床ケア計画、医療規制文書、医療マニュアル、その他の医学推論文書に基づいてトレーニングします。
我々は、このシステムのエンドツーエンドの会話評価を行うために、1100人以上の米国免許看護師と130人以上の米国医師を募集した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:34:03 GMT)
Closing the gap between SVRG and TD-SVRG with Gradient Splitting [17.1] 時間差(TD)学習は、分散還元法により性能を向上できる強化学習における政策評価である。
最近の研究は、TD学習の解釈を、適切に選択された関数の勾配の分割として利用し、アルゴリズムを簡素化し、SVRGとTDを融合させる。
本研究の主な成果は,1/8ドルの学習率を持つ幾何学的収束であり,凸条件下でSVRGが利用できる収束値と同一である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:04:19 GMT)
What Matters for Active Texture Recognition With Vision-Based Tactile Sensors [17.0] 触覚ファブリック認識の文脈におけるアクティブサンプリング問題を定式化する。
迅速かつ信頼性の高いテクスチャ認識には,どのコンポーネントが不可欠かを検討する。
われわれのベストアプローチは5タッチ未満で90.0%に達し、視覚ベースの触覚センサが布のテクスチャ認識に極めて有効であることを強調した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:06:01 GMT)
Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition [16.8] 本稿では,ビデオ表現学習のための新しいパラダイム"Align before Adapt"(ALT)を提案する。
我々は各フレームのエンティティ・ツー・リージョンのアライメントを利用して、領域認識画像の埋め込みをオフラインで構築したテキストコーパスにマッチングすることでアライメントを実現する。
ALTは計算コストを著しく低く保ちながら、競争性能を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:27:25 GMT)
RecMind: Large Language Model Powered Agent For Recommendation [16.7] RecMindは、ゼロショットパーソナライズされたレコメンデーションを慎重に計画する自律的なレコメンデーションエージェントである。
実験の結果,RecMind は既存のゼロ/フェーショット LLM ベースのレコメンデーションベースライン手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:13:10 GMT)
Real-Fake: Effective Training Data Synthesis Through Distribution Matching [16.5] 教師あり学習のためのトレーニングデータ合成の基礎となる原理を解析する。
画像分類タスクにおける合成データの有効性を実証する。
具体的には、画像Net1Kの70.9%のトップ1分類精度を、元の実データサイズである1 Xに相当する合成データでトレーニングする場合に達成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:52:10 GMT)
On Strong Converse Theorems for Quantum Hypothesis Testing and Channel Coding [16.2] 強い逆定理(英: strong converse theorems)は、情報理論における不可能な結果の研究を指す。
モソニと小川は、量子仮説テストのための一発の強い逆法を確立した。
測定されたR'enyi発散の変動表現は、H'olderの不等式による直接的な結果であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:34:23 GMT)
PsyChat: A Client-Centric Dialogue System for Mental Health Support [16.0] PsyChatは、オンラインチャットを通じて心理的サポートを提供するクライアント中心の対話システムである。
クライアントの振る舞い認識、カウンセラー戦略選択、入力パッカー、レスポンスジェネレータ、レスポンス選択の5つのモジュールで構成されている。
ケーススタディでは、対話システムはクライアントの振る舞いを予測し、適切なカウンセラー戦略を選択し、正確で適切な応答を生成することができることを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:59:39 GMT)
Reinforcement Learning for Online Testing of Autonomous Driving Systems: a Replication and Extension Study [15.9] 最近の研究では、Reinforcement Learningはディープニューラルネットワーク対応システムのオンラインテストの代替技術より優れていることが示されている。
この作品は、その経験的研究の再現と拡張である。
その結果、我々の新しいRLエージェントは、ランダムテストよりも優れた効果的なポリシーに収束できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:39:17 GMT)
Content-aware Masked Image Modeling Transformer for Stereo Image Compression [15.8] 本稿では,CAMSICというステレオ画像圧縮フレームワークを提案する。
CAMSICは各画像を潜在表現に変換し、強力なデコーダフリートランスフォーマーエントロピーモデルを用いる。
実験により,本フレームワークは2つのステレオ画像データセット上で,最先端の速度歪み性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:35:57 GMT)
Building Optimal Neural Architectures using Interpretable Knowledge [15.7] AutoBuildは、オペレーションとアーキテクチャモジュールの潜伏した埋め込みと、それらが現れるアーキテクチャの地味なパフォーマンスを整合させるスキームである。
比較的少数の評価済みアーキテクチャをマイニングすることで、AutoBuildは高品質なアーキテクチャを直接構築するか、あるいは検索スペースを減らして関連分野に集中できることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:18:38 GMT)
RL in Markov Games with Independent Function Approximation: Improved Sample Complexity Bound under the Local Access Model [15.6] シミュレータへの局所アクセスを伴う粗相関平衡(CCE)を学習するための新しいアルゴリズムLin-Confident-FTRLを導入する。
状態空間のサイズに対数的依存がある限り、Lin-Confident-FTRLは証明可能な最適精度で$O(epsilon-2)$で$epsilon$-CCEを学ぶ。
本分析は,単一エージェントのローカルプランニング文献における仮想ポリシー境界を一般化する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:22:11 GMT)
DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with Non-linear Prediction [15.5] 我々はDiffMOTというリアルタイム拡散に基づくMOT手法を提案し、複雑な非線形運動に対処する。
MOTトラッカーとして、DiffMOTは22.7FPSでリアルタイムであり、DanceTrackやSportsMOTのデータセットの最先端よりも優れている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:52:27 GMT)
PhotoBot: Reference-Guided Interactive Photography via Natural Language [15.5] PhotoBotは、ハイレベルな人間の言語指導とロボット写真家との相互作用に基づく、完全な自動写真取得のためのフレームワークである。
視覚言語モデル(VLM)とオブジェクトを利用して,テキスト記述による参照画像の特徴付けを行う。
テキストベースの推論により,ユーザの言語クエリに基づく参照画像の検索を行う。
われわれのユーザー調査によると、PhotoBotが撮影した写真は、人間のフィードバックによって測定された、ユーザー自身が撮影した写真よりも審美的に喜ぶことが多い。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:44:07 GMT)
Progressive trajectory matching for medical dataset distillation [15.1] プライバシーの問題から、医療画像データセットの共有は不可欠だが難しい。
医用画像データセットを合成データに凝縮する新しいデータセット蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:18:20 GMT)
Threats, Attacks, and Defenses in Machine Unlearning: A Survey [15.1] マシン・アンラーニング(MU)はAIの安全性を向上させる可能性に対して大きな注目を集めている。
この調査は、機械学習における脅威、攻撃、防衛に関する広範な研究のギャップを埋めようとしている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:40:18 GMT)
PathMMU: A Massive Multimodal Expert-Level Benchmark for Understanding and Reasoning in Pathology [14.9] 大規模マルチモーダルモデル(LMM)のための,最大かつ高品質なエキスパート検証型病理診断ベンチマークPathMMUを紹介する。
様々なソースから33,428のマルチモーダルなマルチチョイス質問と24,067のイメージで構成され、それぞれに正しい回答の説明が添えられている。
PathMMUの構築はGPT-4Vの高度な機能を活用し、3万以上の画像キャプチャペアを使用してキャプションを強化し、対応するQ&Aを生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:13:53 GMT)
Zero-Knowledge Proof of Distinct Identity: a Standard-compatible Sybil-resistant Pseudonym Extension for C-ITS [14.9] そこで本研究では,車両が局所的に別の偽名の所有者ではないことを証明できるゼロ知識証明(zk-PoDI)と呼ばれる新しいプロトコルを提案する。
我々は,zk-PoDIが実用型Sybil-Resistanceシステムに必要な全ての要件を満たすことを示し,低レイテンシ,調整可能な難易度,適度なオーバーヘッド,無視可能な通信コストを有することを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:41:15 GMT)
BubbleID: A Deep Learning Framework for Bubble Interface Dynamics Analysis [14.8] BubbleIDは、沸騰する画像におけるバブルの静的特性と動的特性の両方を識別する。
システムは、各バブルの位置、寸法、界面形状、寿命の速度を分析することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:17:43 GMT)
iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.7] コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:00:59 GMT)
Towards Architecture-Agnostic Untrained Network Priors for Image Reconstruction with Frequency Regularization [14.7] ディープイメージにインスパイアされた未学習のネットワークは、ノイズや部分的な測定から高品質なイメージを復元する有望な能力を示している。
本稿では,ネットワーク事前のより直接的な周波数制御のための,効率的かつアーキテクチャに依存しない手法を提案する。
正規化ネットワークの先行性は、MRIの再構成や画像の塗り替え作業における、現在の教師付きおよび自己監督的手法と好意的に比較される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:19:49 GMT)
IndiTag: An Online Media Bias Analysis and Annotation System Using Fine-Grained Bias Indicators [14.7] 本稿では,革新的なオンラインメディアバイアス分析・アノテーションシステムであるIndiTagについて述べる。
IndiTagは、バイアスを自動的に検出し解釈するために、大きな言語モデル、バイアスインジケータ、ベクトルデータベースを組み込むことによって、新しいアプローチを提供する。
我々は、メディアリテラシーの育成、ファクトチェックの取り組みの促進、デジタルメディアプラットフォームの透明性と説明責任の向上におけるIndiTagの潜在的な応用について論じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:42:29 GMT)
CalliRewrite: Recovering Handwriting Behaviors from Calligraphy Images without Supervision [14.7] CalliRewrite(カリリライト)は、ロボットアームが様々な筆跡画像から読みやすい文字の注文を発見し、回収する、粗大なアプローチである。
本研究では,未知の文字の完全性を保ちつつ,未知のフォントやスタイルの再現に成功していることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:12:02 GMT)
LingoQA: Video Question Answering for Autonomous Driving [14.6] 我々は、自動運転ビデオQAに特化したベンチマークであるLingoQAを紹介する。
LingoQAのトレーニング可能な計量は、人間の評価と0.95のスピアマン相関係数を示す。
ベースライン視覚言語モデルを構築し、その性能を理解するために広範囲にわたるアブレーション研究を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:23:39 GMT)
Interoperability of the Metaverse: A Digital Ecosystem Perspective Review [14.6] その重要な役割について意見が一致しているにもかかわらず、メタバースへの影響を探るには研究のギャップがある。
本研究は,Web of Science と Scopus データベースの文献とコンテンツ分析の体系的レビューを通じて,このギャップを埋めるものである。
本研究は,メタバース相互運用研究の複雑な分野をナビゲートし,今後の調査のためのベンチマークを確立することを目的とする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:05:20 GMT)
ChEDDAR: Student-ChatGPT Dialogue in EFL Writing Education [14.5] 教育における生成的AIの統合は拡大しているが、学生とAIシステムの間の大規模な実世界の相互作用に関する実証分析は依然として限られている。
本研究は,英語の212人の大学生を対象に,外国語Langauge (EFL) 書記講座を修了した。
ChEDDARには、会話ログ、発話レベルのエッセイ編集履歴、自己評価された満足度、学生の意図に加えて、彼らの目的と全体的な経験を文書化するセッションレベルの事前調査が含まれている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:16:14 GMT)
A New Massive Multilingual Dataset for High-Performance Language Technologies [14.4] HPLT言語リソースは、モノリンガルとバイリンガルのコーパスを含む、新しい大規模多言語データセットである。
我々のモノリンガルコレクションは、低から中程度の言語に焦点を合わせ、75言語をカバーし、合計5.6兆のワードトークンがドキュメントレベルで重複している。
私たちの英語中心のパラレルコーパスは、単言語対から派生したもので、18の言語対と、約140億の英語トークンを持つ96万の整列文対をカバーしています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:14:39 GMT)
Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use [14.3] 本稿では,人間のラベリングを自然言語操作に置き換えることで,手作業の軽減を図る新しいフレームワークを提案する。
当社のフレームワークは,クラウドソースアノテーションの必要性を排除している。
トレーニングされたモデルは、従来のアジャイルモデリングや最先端のゼロショット分類モデルよりも優れています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:56:57 GMT)
vid-TLDR: Training Free Token merging for Light-weight Video Transformer [14.1] ビデオトランスフォーマーは、ビデオフレーム全体にわたる大量のトークンによって引き起こされる計算コストに悩まされる。
軽量ビデオ変換器(vid-TLDR)のための学習自由トークンマージを提案する。
背景トークンをドロップし,オブジェクトスコアをシャープにすることで,サリエンシを意識したトークンマージ戦略を導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:15:22 GMT)
eRST: A Signaled Graph Theory of Discourse Relations and Organization [14.1] RST(Rhetorical Structure Theory)の拡張に基づく計算談話分析のための新しい理論枠組みを提案する。
このフレームワークは、木分割、非計画的、並行的な関係を持つ談話関係グラフと、分析に説明可能な有理性を与える暗黙的、明示的な信号を含む。
我々は,200K以上のトークンを持つ12の話し言葉および書き言葉のジャンルを含む,アノテートされた英語の無料コーパスを,我々の枠組みに従って提示し,評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:52:38 GMT)
SDA: Simple Discrete Augmentation for Contrastive Sentence Representation Learning [14.0] 我々は3つの単純かつ効果的な離散文拡張手法を開発した。
句句挿入、モーダル動詞、二重否定。
語彙レベルでは最小限のノイズとして機能し、多種多様な文を生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:06:16 GMT)
Moral Judgments in Narratives on Reddit: Investigating Moral Sparks via Social Commonsense and Linguistic Signals [14.0] 実生活の倫理的シナリオと人間の道徳的判断を理解するためのソーシャルメディアプラットフォームについて検討する。
われわれは、モラルの火花(moral sparks)と呼ぶ抜粋に焦点をあてる。
672以上の投稿と175988のコメントを調べることで、出来事に関連するネガティブな特徴(例えば、未熟で失礼な)が注意を引き、非難を刺激し、性格的特徴と道徳的価値の依存的関係を示唆することを発見した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:24:33 GMT)
Portrait4D-v2: Pseudo Multi-View Data Creates Better 4D Head Synthesizer [14.0] フィードフォワードワンショット4Dヘッドアバター合成のための新しい学習手法を提案する。
データ駆動方式で4Dヘッドシンセサイザーを学習するために擬似多視点ビデオを用いる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:09:54 GMT)
ZoDi: Zero-Shot Domain Adaptation with Diffusion-Based Image Transfer [14.0] 本稿では,ZoDiと呼ばれる拡散モデルに基づくゼロショット領域適応手法を提案する。
まず,原画像の領域を対象領域に転送することで,対象画像の合成にオフ・ザ・シェルフ拡散モデルを用いる。
次に、元の表現でソース画像と合成画像の両方を用いてモデルを訓練し、ドメイン・ロバスト表現を学習する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:58:09 GMT)
Self-supervised Representation Learning From Random Data Projectors [13.8] 本稿では,任意のデータモダリティとネットワークアーキテクチャに適用可能なSSRL手法を提案する。
ランダムなデータプロジェクションを再構築することで,高品質なデータ表現が学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:00:04 GMT)
A Pre-trained Data Deduplication Model based on Active Learning [13.5] 汚れたデータ"問題は、ビッグデータの効果的な適用を著しく制限することができる。
本研究では,能動学習に基づく事前学習型重複解法モデルを提案する。
提案モデルでは、重複データ識別のための従来のSOTA(State-of-the-art)よりも優れている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:29:15 GMT)
Auto-Vocabulary Semantic Segmentation [13.4] textitAuto-Vocabulary Semantics (AVS)を導入する。
本フレームワークは,拡張BLIP埋め込みを用いて,関連クラス名を自律的に識別する。
提案手法は,PASCAL VOCやContext,ADE20K,Cityscapes for AVSなどのデータセットに新たなベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:11:22 GMT)
A Causal Framework to Evaluate Racial Bias in Law Enforcement Systems [13.3] 犯罪を取り入れた多段階因果関係の枠組みを提案する。
空港のセキュリティのような設定では、人種に対する監視バイアスの主な原因は、人種の無実に対する法執行機関のバイアスである可能性が高い。
警察と市民の相互作用において、人種に対する観察された偏見の主な原因は、人種に対する法執行機関の偏見や、他の人種に対する報告における一般大衆からの偏見である可能性がある。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:32:00 GMT)
ReGround: Improving Textual and Spatial Grounding at No Cost [13.0] 空間的接地は、ゲートされた自己意図から横断的な意図への逐次的な流れによって、しばしばテキスト的接地よりも優れている。
このようなバイアスは、ネットワークアーキテクチャを単に書き換えることによって、どちらも精度を犠牲にすることなく、大幅に軽減できることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:37:29 GMT)
Kernel Multigrid: Accelerate Back-fitting via Sparse Gaussian Process Regression [12.6] 本稿では,加法GPをトレーニングするためのKernel Multigrid (KMG) アルゴリズムを提案する。
KMG は時間と空間の複雑さを保ちながら、必要な反復を $mathcalO(log n)$ に減らす。
数値的には、KMGは5回の反復で高次元目標の正確な近似を生成することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:57:27 GMT)
Working Backwards: Learning to Place by Picking [12.6] 我々は,課題の家族に対して,実世界の実演を自律的に収集する手法であるピッキング・バイ・ピッキング(PvP)を提案する。
対象の配置位置にある対象物の一連の把握シーケンスから実演を行う。
我々のシステムは、人間の介入なしに、接触制限された環境で何百ものデモを収集できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:57:24 GMT)
In Search of Truth: An Interrogation Approach to Hallucination Detection [12.4] 大きな言語モデル(LLM)は、現実的に聞こえる答えを発明するが、現実の真実から遠ざかる。
本稿では,大規模言語モデルにおける幻覚検出手法を提案する。
実験では,Llama-2の幻覚を最大62%観察し,外的知識に依存しない平衡精度(B-ACC)を87%の精度で達成した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:53:17 GMT)
Learning User Embeddings from Human Gaze for Personalised Saliency Prediction [12.4] 本稿では,自然画像のペアと対応する相性マップからユーザ埋め込みを抽出する新しい手法を提案する。
提案手法のコアとなるのは,異なるユーザのイメージと個人満足度マップのペアを対比することにより,ユーザの埋め込みを学習する,シームズ畳み込みニューラルエンコーダである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:58:40 GMT)
Deepfake Detection without Deepfakes: Generalization via Synthetic Frequency Patterns Injection [12.3] ディープフェイク検出器は、通常、大量のプリステインと生成された画像に基づいて訓練される。
ディープフェイク検出器は、トレーニング中に遭遇した方法によって生成されたディープフェイクを識別するのが得意だが、未知のテクニックによって生成されたディープフェイクと競合する。
本稿では,ディープフェイク検出器の一般化能力の向上を目的とした学習手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:33:10 GMT)
Just Add $100 More: Augmenting NeRF-based Pseudo-LiDAR Point Cloud for Resolving Class-imbalance Problem [12.3] 本稿では,小クラスのミニチュアや現実世界のオブジェクトのサラウンドビューをキャプチャしたビデオから生成された擬似LiDAR点雲を活用することを提案する。
Pseudo Ground Truth Aug (PGT-Aug) と呼ばれるこの手法は, (i) 2D-to-3Dビュー合成モデルを用いたボリューム3Dインスタンス再構成, (ii)LiDAR強度推定によるオブジェクトレベルドメインアライメント, (iii) 地上情報と地図情報からのコンテキスト認識配置のハイブリッド化という3つのステップから構成される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:13:48 GMT)
PAGE: Prototype-Based Model-Level Explanations for Graph Neural Networks [12.2] The Prototype-bAsed GNN-Explainer (Page) is a novel model-level explanation for graph classification。
Pageは、高いマッチングノードを反復的に検索することで、共通のサブグラフパターンを発見する。
6つのグラフ分類データセットを用いて、PAGEが最先端のモデルレベルの説明法よりも質的に定量的に優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:21:23 GMT)
Clinical information extraction for Low-resource languages with Few-shot learning using Pre-trained language models and Prompting [12.2] 臨床資料から医療情報を自動抽出することはいくつかの課題をもたらす。
ドメイン適応とプロンプト手法の最近の進歩は、最小限のトレーニングデータで有望な結果を示した。
軽量でドメイン適応型事前訓練モデルが20ショットでトリガーされ、従来の分類モデルを30.5%精度で上回っていることを実証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:01:33 GMT)
Metacognitive Prompting Improves Understanding in Large Language Models [12.1] メタ認知プロンプト(MP)は,人間の内省的推論プロセスにインスパイアされた戦略である。
我々は10の自然言語理解(NLU)データセットにまたがる4つの先行するLarge Language Model(LLM)の実験を行った。
MPは、一般的なNLUタスクとドメイン固有のNLUタスクの両方において、既存のプロンプトメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:37:17 GMT)
Jailbreaking is Best Solved by Definition [12.1] 言語モデルに対する「ジェイルブレイク」攻撃の台頭は、望ましくない応答の出力を防ぐための防衛策の急増につながった。
i) 安全でない出力を構成するものの定義と, (ii) 入力処理や微調整などの手法による定義の実施である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:53:56 GMT)
ProMamba: Prompt-Mamba for polyp segmentation [12.0] 本稿では,最新のVision-Mambaとプロンプト技術を組み合わせた,Prompt-Mambaに基づくセグメンテーションモデルを提案する。
我々は、最初にビジョン・マンバアーキテクチャをポリプセグメンテーションに適用し、最初にポリプセグメンテーションモデルでプロンプト技術を利用する。
本モデルでは,6つのデータセットに対して,従来の最先端手法を平均5%上回るセグメンテーションタスクを効率的に達成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:08:57 GMT)
Synthetic Data Applications in Finance [12.0] 本稿では、金融セクターにおける合成データの応用について概観する。
合成データは、プライバシー、公正性、説明可能性に関連する問題を扱うための潜在的アプローチである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:21:35 GMT)
Fostc3net:A Lightweight YOLOv5 Based On the Network Structure Optimization [12.0] 本稿では,モバイル機器向けにカスタマイズされた軽量YOLOv5技術を提案する。
提案モデルでは,検出精度が1%向上し,FLOPが13%減少し,既存のYOLOv5に比べてモデルパラメータが26%減少した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:07:04 GMT)
Calibrated Language Models Must Hallucinate [11.9] 最近の言語モデルでは、驚くほどの頻度で、偽のもっとも可聴なテキストを生成する。
この研究は、事前訓練された言語モデルがある種の事実を幻覚させる速度に固有の統計的下限が存在することを示している。
訓練データから真偽を判断できない「任意」事実に対して, 幻覚は言語モデルに対して一定の速度で発生しなければならないことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:21:20 GMT)
SALAD: Part-Level Latent Diffusion for 3D Shape Generation and Manipulation [11.8] 部分レベルの暗黙的3次元表現に基づくカスケード拡散モデルを提案する。
提案モデルでは,最先端の生成品質を実現し,条件付き設定での付加的なトレーニングを伴わずに,部分レベルの形状の編集と操作が可能となる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:47:38 GMT)
Normalizing flow-based deep variational Bayesian network for seismic multi-hazards and impacts estimation from InSAR imagery [11.8] インターフェロメトリ合成開口レーダ(InSAR)のデータは、迅速なハザード推定のために高解像度のオンサイト情報を提供する上で重要である。
InSAR画像のノイズによる影響と,複数の未観測障害の近接した後部から発生する流れの正規化による新しい変分推論を導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:23:20 GMT)
Dice Semimetric Losses: Optimizing the Dice Score with Soft Labels [11.7] 軟Dice損失(SDL)は、医療画像コミュニティにおける多くの自動セグメンテーションパイプラインにおいて重要な役割を担っている。
本研究では,Dice セミメトリック・ロス (DML) を導入し,ソフトラベルの設定に適用する。
一般向けQUBIQ, LiTS, KiTSベンチマークによる実験により, DMLとソフトラベルの相乗効果が確認できた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:52:49 GMT)
A Dual-Augmentor Framework for Domain Generalization in 3D Human Pose Estimation [11.5] 制御された実験室で収集された3D人間のポーズデータは、様々なシナリオにまたがって一般化されたポーズ推定装置の課題を示す。
本稿では,2つのポーズオーグメンタ,すなわち弱いポーズオーグメンタと強いオーグメンタを特徴とする新しいフレームワークを提案する。
提案手法は,様々なベンチマークデータセットの総合的な実験により,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:34:35 GMT)
Community Needs and Assets: A Computational Analysis of Community Conversations [11.5] Redditから3,511の会話からなるコミュニティのニーズと資産に関する最初のデータセットを紹介します。
このデータセットを用いて、感情分類と一般的な大言語モデルと比較して、発話レベルの分類モデルを評価する。
ニーズに関する会話には否定的な感情と感情があり、資産に関する会話は場所と実体に焦点を当てている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:14:54 GMT)
Learning to Produce Semi-dense Correspondences for Visual Localization [11.4] 本研究は,夜間シナリオ,悪天候,季節変化などの要求条件下で視覚的局所化を行うことの課題に対処する。
本稿では,高密度なキーポイントマッチングに基づいて,信頼性の高い半高密度2D-3Dマッチングポイントを抽出する手法を提案する。
ネットワークは幾何学的および視覚的な手がかりを用いて、観測されたキーポイントから観測されていないキーポイントの3D座標を効果的に推測する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:05:55 GMT)
Data-Efficient Contrastive Language-Image Pretraining: Prioritizing Data Quality over Quantity [11.4] 大規模な画像キャプチャデータセットを用いたコントラスト言語-画像事前学習は、目覚ましいゼロショットの一般化を実現するための表現を学ぶ。
ベストを確実に一般化するトレーニングデータの小さなサブセットは、未解決の問題のままである。
画像とキャプションの相互共分散を密に保存する部分集合は、より優れた一般化性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:46:13 GMT)
"This is not a data problem": Algorithms and Power in Public Higher Education in Canada [11.4] カナダのオンタリオ州にある公立大学で使われているデータ、アルゴリズム、そして結果を特定します。
アルゴリズム決定への依存度が高まると、学生の監視が増加し、既存の不平等が悪化し、教員-学生関係が自動化される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:46:41 GMT)
SeFFeC: Semantic Facial Feature Control for Fine-grained Face Editing [11.3] 本手法は,人間の理解し難い顔の特徴を操作できる。
顔のランドマークを使用することで、顔の特徴を正確に測定することができる。
SeFFeCは、顔の特徴の正確な値を決定論的に制御する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:47:53 GMT)
Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.2] リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:15:18 GMT)
MedCycle: Unpaired Medical Report Generation via Cycle-Consistency [11.2] 一貫性のあるラベリングスキーマを必要としない革新的なアプローチを導入する。
このアプローチは、画像埋め込みをレポート埋め込みに変換するサイクル一貫性マッピング関数に基づいている。
胸部X線所見の発生は、最先端の結果よりも優れており、言語と臨床の両方の指標の改善が示されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:40:11 GMT)
Defending Against Indirect Prompt Injection Attacks With Spotlighting [11.1] 一般的なアプリケーションでは、複数の入力は1つのテキストストリームにまとめることで処理できる。
間接的なプロンプトインジェクション攻撃は、ユーザコマンドと共に処理されている信頼できないデータに、敵命令を埋め込むことによって、この脆弱性を利用する。
我々は,複数の入力源を識別するLLMの能力を向上させるために,迅速なエンジニアリング技術群であるスポットライティングを紹介した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:26:23 GMT)
AdaTrans: Feature-wise and Sample-wise Adaptive Transfer Learning for High-dimensional Regression [11.0] 本研究では,高次元設定における伝達学習の問題について考察する。
本稿では,F-AdaTrans(F-AdaTrans)やS-AdaTrans(S-AdaTrans)の変換可能な構造を検出・集約できる適応型トランスファー学習法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:58:46 GMT)
Shortchanged: Uncovering and Analyzing Intimate Partner Financial Abuse in Consumer Complaints [10.7] デジタル金融サービスは、ユーザー、特に親密なパートナー金融悪用(IPFA)の生存者に新たなデジタル安全リスクをもたらすことができる
顧客270万件の苦情のデータセットから、言語モデリング技術と専門家による人間のレビューを利用してIPFAを記述した苦情を識別するbspokeワークフローを実装した。
我々の貢献は2つあり、我々はこの見落とされがちな害に対する最初の人間ラベル付きデータセットを提供し、IPFAの生存者のより良い支援と保護のための技術的実践、研究、設計に実践的な意味を提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:32:21 GMT)
Enhancing Gait Video Analysis in Neurodegenerative Diseases by Knowledge Augmentation in Vision Language Model [10.7] 本稿では,歩行映像から診断群と歩行障害を評価するための知識増強戦略を提案する。
大規模な事前学習型視覚言語モデル(VLM)に基づいて,患者の歩行映像の視覚的,テキスト的,数値的表現を学習し,改善する。
その結果、ビデオベース分類作業において、我々のモデルは最先端のSOTA(State-of-the-art)よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:03:38 GMT)
Specification Mining for Smart Contracts with Trace Slicing and Predicate Abstraction [10.7] 過去の取引履歴から契約仕様を推測するための仕様マイニング手法を提案する。
提案手法は,トランザクション履歴から統計的に推測されるプログラム不変量とともに,関数呼び出しの高レベルな挙動自動化を導出する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:39:51 GMT)
TimeRewind: Rewinding Time with Image-and-Events Video Diffusion [10.7] 本稿では,シャッターボタンが押される直前に欠落したフリーティングモーメントを回復するために,単一のキャプチャ画像からタイムを巻き戻すという,新たな課題について述べる。
我々は、時間分解能の高いモーション情報をキャプチャするニューロモルフィックイベントカメラの新興技術を活用することで、この課題を克服する。
提案フレームワークは,イベントカメラデータに基づくイベントモーションアダプタを導入し,この拡散モデルを用いて,キャプチャしたイベントに視覚的に整合性を持ち,物理的に接地した映像を生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:57:02 GMT)
The Unreasonable Effectiveness of Greedy Algorithms in Multi-Armed Bandit with Many Arms [10.7] 本研究は,Emphmany-armed regimeにおける$k$-armed bandit問題について考察する。
以上の結果から,多腕の環境下での強欲なアルゴリズムには,新たなエフェフリー探索法が有用であることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:15:32 GMT)
Unifews: Unified Entry-Wise Sparsification for Efficient Graph Neural Network [10.6] グラフニューラルネットワーク(GNN)は、様々なグラフ学習タスクにおいて有望な性能を示すが、リソース集約型計算のコストがかかる。
従来の研究では,グラフレベルやネットワークレベルのスペーシフィケーション技術を活用して,計算予算の削減を試みた。
個々の行列要素を考慮したエントリワイズ方式で2つの演算を統一するUnifewsを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:07:30 GMT)
AnyHome: Open-Vocabulary Generation of Structured and Textured 3D Homes [10.5] 我々はAnyHomeを紹介した。AnyHomeは、どんなテキストでもよく構造化された、テクスチャ化された屋内シーンに家庭スケールで翻訳するフレームワークだ。
提案手法は,大規模言語モデル (LLM) を設計テンプレートで促進することにより,提案した文章をアモーダルな構造化表現に変換する。
次に、スコア蒸留サンプリングプロセスを使用して幾何学を洗練させ、それにライフスタイルのテクスチャを付加するエゴセントリックな塗布プロセスが続く。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:58:05 GMT)
Federated reinforcement learning for robot motion planning with zero-shot generalization [10.2] 学習したポリシーが新しい環境にデプロイされるとき、データ収集やポリシーの適応は必要ない。
我々は,複数の学習者と中央サーバの協調学習を可能にする,連携型強化学習フレームワークを開発した。
各繰り返しにおいて、各学習者はローカル制御ポリシーと対応する推定正規化到着時刻をクラウドにアップロードする。
これにより、学習者のグローバルな最適度を計算し、学習者に最適なポリシーをブロードキャストする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:16:54 GMT)
The Runtime of Random Local Search on the Generalized Needle Problem [10.2] 我々は、C. Doerr と Krejca が与えられた上限を大幅に改善する期待ランタイムの正確な記述を導出する。
また、期待されるランタイムの推定についても記述する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:18:40 GMT)
An Ordering of Divergences for Variational Inference with Factorized Gaussian Approximations [10.1] 異なる発散は、その変動近似が不確実性の様々な尺度を誤って推定する量によってテクスチュアできることを示す。
また、これらの測度のうちの2つが分解近似によって同時に一致できないことを示す不合理性定理を導出する。
我々の分析では、KL の発散、R'enyi の発散、および $nablalog p$ と $nablalog q$ を比較したスコアベースの発散をカバーしている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:56:08 GMT)
Describe-and-Dissect: Interpreting Neurons in Vision Networks with Language Models [10.0] Describe-and-Dissect(DnD)は、視覚ネットワークにおける隠されたニューロンの役割を記述する新しい方法である。
DnDは、ラベル付きトレーニングデータや事前定義された概念セットを必要としない複雑な自然言語記述を生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:33:02 GMT)
Multimodal Fusion Method with Spatiotemporal Sequences and Relationship Learning for Valence-Arousal Estimation [9.9] 本稿では,ABA6コンペティションにおけるVA(Valence-Arousal)推定タスクに対するアプローチを提案する。
映像フレームと音声セグメントを前処理して視覚的・音声的特徴を抽出する包括的モデルを考案した。
我々は、Transformerエンコーダ構造を用いて長距離依存を学習し、モデルの性能と一般化能力を向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:56:56 GMT)
DiffImpute: Tabular Data Imputation With Denoising Diffusion Probabilistic Model [9.9] DiffImputeという新しい拡散確率モデル(DDPM)を提案する。
既存のデータの信頼性を損なうことなく、欠落したエントリに対して信頼できる警告を生成する。
Missing Completely At Random (MCAR) と Missing At Random (MAR) の様々な設定に適用できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:45:31 GMT)
EcoSense: Energy-Efficient Intelligent Sensing for In-Shore Ship Detection through Edge-Cloud Collaboration [9.8] 本稿では,タスクをオブジェクトの局所化ときめ細かい分類に分割する,エッジクラウド協調センシングシステムを提案する。
このフレームワークは、オブジェクトのローカライゼーション、分類、難易度推定のための低消費電力デバイス調整フロントエンドモデルと、微細な分類のためのトランスフォーマーグラフ畳み込みネットワークベースのバックエンドモデルから構成される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:52:34 GMT)
When Cars meet Drones: Hyperbolic Federated Learning for Source-Free Domain Adaptation in Adverse Weather [9.7] フェデレートラーニング(FL)では、複数のクライアントがプライベートデータを共有せずにグローバルモデルを共同でトレーニングする。
我々は、車とドローンの両方のクライアントが共存し協力する、新しいフェデレーションセマンティックセマンティックセグメンテーション・セグメンテーション・セグメンテーション・セッティングを導入する。
具体的には、バッチノーム気象対応戦略を利用して、異なる気象条件にモデルを動的に適応させる新しい手法を提案する。
最後に,航空車両の悪天候データを用いた最初のセマンティックセグメンテーションデータセットであるFLYAWAREを紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:20:48 GMT)
No more optimization rules: LLM-enabled policy-based multi-modal query optimizer (version 1) [9.4] 大規模言語モデル(LLM)は、機械学習とディープラーニングの分野で重要な瞬間となっている。
本稿では,LLM のクエリ最適化能力について検討し,新しい LLM とポリシーに基づくマルチモーダルクエリである LaPuda を設計する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:44:30 GMT)
Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction [9.3] キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:41:11 GMT)
SumTra: A Differentiable Pipeline for Few-Shot Cross-Lingual Summarization [9.0] 言語間要約(XLS)は、入力文書とは異なる言語で要約を生成する。
本稿では,要約と翻訳のパイプラインを再検討し,要約と翻訳のタスクをシーケンスで実行することを提案する。
このアプローチは、モノリンガル要約と翻訳のための多くの公開リソースを再利用し、非常に競争力のあるゼロショット性能を得る。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:04:42 GMT)
MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation [8.8] 本稿では,1枚のRGB画像から3次元コンピュータ支援デザイン(CAD)モデルを用いてオブジェクトの6-DoFポーズを決定するための単発アプローチを提案する。
まず、ポーズ分類を行い、3Dオブジェクトを分類されたポーズに描画する。
第2段階は、クラス内のきめ細かい残留ポーズを予測するために回帰を実行する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:38:56 GMT)
AUD-TGN: Advancing Action Unit Detection with Temporal Convolution and GPT-2 in Wild Audiovisual Contexts [8.8] 音声・視覚的マルチモーダルデータを利用した新しい手法を提案する。
本手法は,Mel Frequency Cepstral Coefficients (MFCC) とLog-Mel Spectrogram を,事前学習したVGGishネットワークと共に利用することにより,音声特徴抽出を強化する。
本手法は,データの時間的・文脈的ニュアンスを理解することにより,AU検出の精度を著しく向上させ,複雑なシナリオの理解における重要な進歩を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:37:19 GMT)
Six Levels of Privacy: A Framework for Financial Synthetic Data [8.7] 我々は、合成データ生成手法の分類に有用なレベルのプライバシー階層と、それらが提供する徐々に改善された保護方法を紹介します。
Financial Synthetic Dataの簡単な概要、使用方法、価値の評価方法、プライバシーリスク、プライバシ攻撃について。
これらの攻撃に対する防御を含む6つのレベルの詳細。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:41:26 GMT)
AdaViPro: Region-based Adaptive Visual Prompt for Large-Scale Models Adapting [8.7] 学習プロセスにプロンプトの「最適化」を組み込む領域ベースの適応型ビジュアルプロンプトAdaViProを提案する。
AdaViProは画像全体の地域化マスクマップを生成し、0と1で構成され、各領域にプロンプトを適用するか破棄するかを指定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:47:53 GMT)
ExMap: Leveraging Explainability Heatmaps for Unsupervised Group Robustness to Spurious Correlations [8.5] グループロバストネス戦略は、ディープラーニングモデルにおける学習バイアスを軽減することを目的としている。
既存の手法のほとんどは、グループのラベル分布へのアクセスに依存している。
従来の分類器におけるグループロバスト性を高めるために設計された,教師なし2段階の機構であるExMapを紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:47:28 GMT)
Multimodal Variational Autoencoder for Low-cost Cardiac Hemodynamics Instability Detection [8.5] 本稿では,低コスト胸部X線(CXR)と心電図(ECG)を事前トレーニングで統合する新しい変分オートエンコーダ(textCardioVAE_textX,G$)を提案する。
また,本モデルでは,臨床特徴に直接関連した予測の微妙な解釈が可能である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:06:49 GMT)
Creative and Correct: Requesting Diverse Code Solutions from AI Foundation Models [8.4] ソフトウェアエンジニアリングのタスクでは、多様性はデザインスペースを探索し、創造性を育む上で鍵となる。
本研究では,HumanEval タスクを用いた実験により,このトレードオフを系統的に検討した。
多様性と正しさの最適なバランスを打つパラメータと戦略の組み合わせを特定します。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:51:46 GMT)
How Knowledge Workers Think Generative AI Will (Not) Transform Their Industries [8.4] ジェネレーティブAIは、複数の知識産業に変革をもたらすことが期待されている。
我々は,7つの異なる産業を対象とした参加型研究ワークショップを実施し,米国3都市で54人の参加者を集めた。
生成的AIの影響に対する参加者の期待について述べる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:51:16 GMT)
Distributed Estimation and Inference for Semi-parametric Binary Response Models [8.3] 本稿では,分散コンピューティング環境下での半パラメトリック二値選択モデルの最大スコア推定について検討する。
直感的な分割・対数推定器は計算コストが高く、機械数に対する非正規制約によって制限される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:52:28 GMT)
Sparsification of the regularized magnetic Laplacian with multi-type spanning forests [8.3] 磁気ラプラシアン$Delta$,すなわち,エッジの少ない部分グラフに基づくスペクトル近似のスペーサーについて検討する。
ラプラシアン接続の自然推定器の選択に関する統計的保証を提供する。
本稿では,角度同期型ランキングとグラフに基づく半教師付き学習の2つの実用的応用について検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:44:53 GMT)
High-confidence pseudo-labels for domain adaptation in COVID-19 detection [8.3] 本報告では,第4回COV19Dコンペティションへの応募について概説する。
競技は2つの課題からなる。
1つ目は、COV19-CT-DBデータベースから1000以上のCTスキャンから新型コロナウイルスの存在を検出するために分類器を訓練することである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:12:57 GMT)
MELTing point: Mobile Evaluation of Language Transformers [8.2] 大規模言語モデル(LLM)のモバイル実行の現状について検討する。
我々は,デバイス上でのLLMのヘッドレス実行とベンチマークをサポートする,独自の自動化インフラストラクチャMELTを開発した。
我々は、一般的な命令の微調整 LLM を評価し、それぞれのフレームワークを用いてエンドツーエンドおよび粒度の性能を計測する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:06:08 GMT)
A multiplexed control architecture for superconducting qubits with row-column addressing [8.2] 本稿では,2種類の共有制御線,行線および列線を有する超伝導量子ビットに対する多重制御アーキテクチャを提案する。
このアーキテクチャは、量子エラー補正回路のような構造化量子回路の実行にスケーラブルである可能性がある。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:29:10 GMT)
IIDM: Image-to-Image Diffusion Model for Semantic Image Synthesis [8.1] 本稿では,セマンティック画像合成を画像認識タスクとして扱う。
スタイル参照はまずランダムノイズで汚染され、その後IIDMによって徐々に認知される。
改良,色変換,モデルアンサンブルの3つの手法が提案され,生成品質がさらに向上した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:21:00 GMT)
Bounce: Reliable High-Dimensional Bayesian Optimization for Combinatorial and Mixed Spaces [8.1] 高次元ブラックボックス関数は、混合空間と入力空間で最適化する必要がある。
バウンス(英: Bounce)は、様々な変数型の写像を次元が増加するネスト埋め込みに頼った新しいアルゴリズムである。
実験によると、バウンスは様々な高次元問題に対して最先端のパフォーマンスを達成し、しばしば改善する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:17:43 GMT)
MotorEase: Automated Detection of Motor Impairment Accessibility Issues in Mobile App UIs [8.1] MotorEaseは、モバイルアプリのUIにおけるアクセシビリティの問題を特定し、運動不足のユーザに影響を与える。
コンピュータビジョンとテキスト処理技術を適用して、アプリUI画面のセマンティック理解を可能にする。
違反を90%の精度で識別でき、偽陽性率は9%未満である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:53:07 GMT)
Learning Novel View Synthesis from Heterogeneous Low-light Captures [7.9] 我々は、不均一なビュー間で反射率が不変であるように、入力ビューから照明、反射、ノイズを分解することを提案する。
多視点にわたる異種輝度とノイズレベルに対処するために,照明の埋め込みを学習し,各ビューに対して個別にノイズマップを最適化する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:44:26 GMT)
Natural Language as Polices: Reasoning for Coordinate-Level Embodied Control with LLMs [7.7] ロボットの行動計画問題に対処するLLMによる実験結果を示す。
提案手法はタスクとシーンオブジェクトのテキスト記述を取得し,自然言語推論によるアクションプランニングを定式化する。
提案手法は,ロボット工学のスキルを既知のタスクからそれまで見つからなかったタスクに伝達する,自然言語記述の可能性を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:58:12 GMT)
CharPoet: A Chinese Classical Poetry Generation System Based on Token-free LLM [7.6] CharPoet(シャルポエ)は、中国の古典詩集である。
トークンフリーアーキテクチャは文字単位のキャラクタ方式で生成し,文字数を正確に制御する。
CharPoetが0.96以上のフォーマット精度を実現し、Juge-GPT-2(0.91)とGPT-4(0.38)を上回った
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:39:48 GMT)
Unimodal Aggregation for CTC-based Speech Recognition [7.6] 同じテキストトークンに属する特徴フレームをセグメント化し統合するために、UMA(unimodal aggregate)を提案する。
UMAはより優れた特徴表現を学習し、シーケンス長を短縮し、認識エラーと計算複雑性を低減させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:17:16 GMT)
Don't be a Fool: Pooling Strategies in Offensive Language Detection from User-Intended Adversarial Attacks [7.5] 悪意のあるユーザは、しばしばテキストノイズを伴ってフィルタリングシステムを避けようとする。
本稿では, 特別なシンボルを挿入したり, 韓国語の特徴を利用するユーザ意図の敵攻撃として, これらの回避策を提案する。
提案する攻撃に対する防御策として,単純かつ効果的なプール戦略をレイヤワイズで導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:28:09 GMT)
General-Purpose Retrieval-Enhanced Medical Prediction Model Using Near-Infinite History [7.4] このような課題に対処するために、検索型医療予測モデル(REMed)を提案する。
REMedは基本的に、無制限の臨床イベントを評価し、関連するイベントを選択し、予測する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:52:03 GMT)
Efficient scene text image super-resolution with semantic guidance [7.4] 本稿では,リソース制限されたプラットフォームへのデプロイを容易にするために,SGENetと呼ばれる効率的なフレームワークを提案する。
SGENetには、スーパーレゾリューションブランチとセマンティックガイダンスブランチの2つのブランチが含まれている。
そこで本研究では,テキスト情報の理解を高めるために,軽量な事前学習型認識器を意味抽出器として応用する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:20:54 GMT)
EC-IoU: Orienting Safety for Object Detectors via Ego-Centric Intersection-over-Union [7.4] 本稿では,新しいEgo-Centric Intersection-over-Union(EC-IoU)尺度による安全指向物体検出について述べる。
我々は,広範に使用されているIoU測度を改良する重み付け機構を提案し,エゴエージェントの観点から,接地構造体の近点をカバーする予測値に高いスコアを割り当てる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:25:49 GMT)
Enhancing Programming Education with ChatGPT: A Case Study on Student Perceptions and Interactions in a Python Course [7.2] 本稿では,8週間にわたる1年生向けのPythonプログラミングコースにおいて,ChatGPTが学習に与える影響について検討する。
調査,オープンエンド質問,学生-ChatGPTダイアログデータからの回答を分析して,ChatGPTの有用性を総合的に把握することを目的とする。
本研究は,ChatGPTに対する肯定的な反応を明らかにし,プログラミング教育経験の向上におけるChatGPTの役割について考察する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:47:28 GMT)
Pseudo-rigid body networks: learning interpretable deformable object dynamics from partial observations [6.8] 変形可能な線形オブジェクト(DLO)の正確な予測は、手作業で人間の解釈が可能であるが計算的に高速なモデルを必要とする場合、困難である。
本研究では、擬似剛体法(PRB)からインスピレーションを得て、動的ネットワークによって内部状態が経時的にアンロールされる剛体の直列鎖としてDLOをモデル化する。
このダイナミクスネットワークは、観測された運動変数をDLOの隠れ状態にマッピングする物理インフォームドエンコーダと共同で訓練されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:30:01 GMT)
P-Count: Persistence-based Counting of White Matter Hyperintensities in Brain MRI [6.7] 白色物質過敏症(WMH)は脳血管疾患と多発性硬化症の指標である。
病変の数はノイズやセグメンテーションミスに非常に敏感である。
永続ホモロジーに基づく代数的WMHカウントツールであるP-Countを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:52:02 GMT)
Self-Attention Based Semantic Decomposition in Vector Symbolic Architectures [6.5] 本稿では,反復探索問題における自己アテンションに基づく更新規則に基づく共振器ネットワークの新たな変種を提案する。
認識に基づくパターン認識,シーン分解,オブジェクト推論など,多くのタスクに応用できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:37:19 GMT)
Can It Edit? Evaluating the Ability of Large Language Models to Follow Code Editing Instructions [6.4] コード編集タスクのベンチマークを導入し、それをいくつかの最先端LCMの評価に利用する。
我々の評価は、最先端のオープンモデルとクローズドモデルの間の大きなギャップを露呈する。
我々は、自然言語命令と組み合わされたコード編集タスクの新しい、慎重にキュレートされ、パーミッシブにライセンスされたトレーニングデータセットを導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:59:00 GMT)
DOR3D-Net: Dense Ordinal Regression Network for 3D Hand Pose Estimation [6.3] 我々は高次回帰問題として3次元手ポーズ推定を再定式化する。
我々はDOR3D-Net(Dense Ordinal Regression 3D Pose Network)を提案する。
我々の設計はSOTA法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:47:51 GMT)
Detecting and Triaging Spoofing using Temporal Convolutional Networks [6.2] アルゴリズム取引と電子市場は 金融市場の状況を変え続けています
本稿では,市場操作を検出する領域において,様々な問題に容易に対応可能なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:17:12 GMT)
Accurately Predicting Probabilities of Safety-Critical Rare Events for Intelligent Systems [6.2] 本研究は,精度とリコール率を両立させる臨界予測モデルの構築を目的とする。
アプローチを検証するために,月面着陸機と二足歩行機という2つの事例で評価を行った。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:00:29 GMT)
ACDG-VTON: Accurate and Contained Diffusion Generation for Virtual Try-On [6.2] 本研究では,拡散の訓練範囲を制限する訓練手法を提案する。
提案手法は,マルチガーメント試行を1回の推論サイクルで実行し,高解像度でトレーニングすることなく高品質なズームイン世代をサポートする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:45:06 GMT)
Reading Users' Minds from What They Say: An Investigation into LLM-based Empathic Mental Inference [6.2] 人間中心の設計では、ユーザエクスペリエンスの包括的で詳細な理解を開発することが最重要である。
人間の大きな集団の 精神状態の正確な理解は 今も重要な課題です
本稿では,大規模言語モデル(LLM)を用いたメンタル推論タスクの実施について検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:57:32 GMT)
AFLoRA: Adaptive Freezing of Low Rank Adaptation in Parameter Efficient Fine-Tuning of Large Models [6.0] 私たちは小説を提示する。
-PEFT(Adaptive Freezing of Low Rank Adaptation)法
具体的には、トレーニング可能な低ランク行列の平行経路、すなわち、ダウンプロジェクションとアッププロジェクション行列を加え、それぞれに特徴変換ベクトルが続く。
実験結果から,GLUEベンチマークで評価した結果,平均値0.85%以上の改善を達成できることが確認された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:07:50 GMT)
Spatial Fairness: The Case for its Importance, Limitations of Existing Work, and Guidelines for Future Research [5.9] ロケーションは、住宅ローンや保険など、多くの敏感なドメインで使われている意思決定システムでますます使われている。
それにもかかわらず、非差別法で保護されていると見なされる特徴と位置の相関から生じる不公平さにはほとんど注意が払われていない。
本論では, 位置と保護特性との相関により, 継続する害を概説することにより, 位置に対する公平性を考える必要があることを論じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 23:36:06 GMT)
Non-Markovian quantum interconnect formed by a surface plasmon polariton waveguide [5.8] 量子相互接続(QI)は基本的には光物質界面であり、量子技術の構成要素として機能する。
金属導波路で支持される表面プラズモン偏光子(SPP)は、強い光-物質結合を探索するための理想的な界面を提供する。
金属ナノワイヤのSPPによって形成される非マルコフ的QIのスキームを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:19:35 GMT)
CoNeS: Conditional neural fields with shift modulation for multi-sequence MRI translation [5.7] マルチシーケンスMRI(Multi-sequence magnetic resonance imaging)は、現代の臨床研究とディープラーニング研究の両方に広く応用されている。
画像取得プロトコルの違いや、患者のコントラスト剤の禁忌が原因で、MRIの1つ以上の配列が欠落することがしばしば起こる。
1つの有望なアプローチは、生成モデルを利用して欠落したシーケンスを合成することであり、これはサロゲート獲得の役割を果たす。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:10:27 GMT)
An AI-Assisted Skincare Routine Recommendation System in XR [5.6] 本稿では,XRプラットフォームに統合されたAI支援スキンケアレコメンデーションシステムを提案する。
このシステムは、畳み込みニューラルネットワーク(CNN)を使用して、個人の皮膚型を分析し、パーソナライズされた皮膚ケア製品を推奨する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:16:40 GMT)
A Comparative Study of Machine Learning Models Predicting Energetics of Interacting Defects [5.6] 本稿では,相互作用する欠陥のあるシステムの自由エネルギー変化を予測する3つの方法の比較研究を行う。
その結果,この限られたデータセットであっても,クラスタ展開モデルによって正確なエネルギー予測が達成できることが示唆された。
本研究では,不完全な表面システムに機械学習を適用した予備評価を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:15:48 GMT)
EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.5] 意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:38:15 GMT)
Lightweight, error-tolerant edge detection using memristor-enabled stochastic logics [5.4] 本稿では,基本的な画像処理技術であるエッジ検出のための計算手法を提案する。
具体的には,メムリスタを論理回路に統合し,メムリスタの性質を利用して数値符号化と処理のためのコンパクトな論理を実現する。
その結果、軽量でエラーに耐性のあるエッジビジョンハードウェアやシステムを開発する上で、エッジ検出アプローチの大きな可能性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:05:55 GMT)
Sequential Modeling of Complex Marine Navigation: Case Study on a Passenger Vessel (Student Abstract) [5.3] 本稿では, 機械学習手法を用いて, 船舶の燃料消費量を削減する方法について検討する。
私たちは、カナダ西海岸のフェリーで2年間にわたって、現実世界のデータセットを活用しています。
時系列予測モデルの作成に重点を置いている。
船長の指導の下、フェリーの作戦の熟練度を評価するための評価ツールとして機能する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:29:55 GMT)
Different Tokenization Schemes Lead to Comparable Performance in Spanish Number Agreement [5.2] 異なるトークン化方式がスペイン語の複数形の数字合意にどのように影響するかを検討する。
形態的に整列したトークン化は他のトークン化方式と同様に機能する。
以上の結果から,形態的トークン化は性能に厳密には要求されないことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:01:56 GMT)
Machine-Made Media: Monitoring the Mobilization of Machine-Generated Articles on Misinformation and Mainstream News Websites [5.2] 私たちは、DeBERTaベースの合成ニュース検出器を訓練し、3,074の誤報とメインストリームのニュースサイトから156万記事以上を分類します。
2022年1月1日から2023年5月1日までの間に、メインストリームのウェブサイトでは、合成ニュース記事の相対数が57.3%増加し、誤情報サイトでは474%増加した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:58:34 GMT)
From Representational Harms to Quality-of-Service Harms: A Case Study on Llama 2 Safety Safeguards [5.0] 我々は、既に緩和されたバイアスのモデルを評価することにより、安全対策の有効性を検討する。
非有毒なプロンプトのセットを作成し、それをLlamaモデルの評価に用いる。
安全と健康のトレードオフは、サービス品質の害につながる可能性のある特定の人口集団にとってより顕著である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:22:38 GMT)
Impact of Synthetic Images on Morphing Attack Detection Using a Siamese Network [4.9] 本稿では,セミハードロス機能を有するシームズネットワークを用いて,合成画像がモーフィング攻撃検出(MAD)に与える影響を評価した。
この結果から, FERET, FRGCv2, FRLL からEfficientNetB0 をトレーニングしたMAD は SOTA と比較して誤差が低いことがわかった。
混合アプローチ(合成+デジタル)データベースは、MADを改善し、エラー率を低減するのに役立つかもしれない。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:09:42 GMT)
Safety-Aware Reinforcement Learning for Electric Vehicle Charging Station Management in Distribution Network [4.8] 電気自動車(EV)は、調整がない状態での配電系統の運用に重大なリスクをもたらす。
本稿では、EV充電ステーションの管理を目的とした安全対応強化学習(RL)アルゴリズムを提案する。
提案アルゴリズムは制約違反に対する明示的な罰則に依存しないため,ペナルティチューニング係数は不要である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:57:38 GMT)
Adaptive Critical Subgraph Mining for Cognitive Impairment Conversion Prediction with T1-MRI-based Brain Network [4.8] 早期認知症への転換の予測は、その進行を緩和するために重要である。
従来のT1強調MRI(T1-MRI)研究は、脳萎縮領域の同定に重点を置いている。
Brain-SubGNNは、T1-MRIに基づく重要なサブグラフをマイニングし、拡張するための新しいグラフ表現ネットワークである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:46:01 GMT)
Divide-Conquer Transformer Learning for Predicting Electric Vehicle Charging Events Using Smart Meter Data [4.8] 過去のスマートメーターデータを用いた家庭用充電予測手法を開発した。
我々は様々な予測時間で96.81%以上の精度を一貫して達成している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:17:16 GMT)
Quantum-Secure Certificate-Less Conditional Privacy-Preserving Authentication for VANET [4.8] 既存の格子ベースの認証方式は、マスターシークレットキーの漏洩とキーエスクロー問題の潜在的な問題に対処するには不十分である。
本稿では,システム全体の効率を保ちつつ,欠陥を解消する量子セキュア認証方式を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:50:36 GMT)
Data Augmentation for Time-Series Classification: An Extensive Empirical Study and Comprehensive Survey [4.5] データ拡張(DA)は時系列分類(TSC)において欠かせない戦略として登場した。
本研究は,TSC領域内におけるDA方法論の徹底的な解離について検討した。
我々の分類学は、学者にとって堅牢な航海支援として機能し、選択の明確さと方向性を提供すると約束している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:25:51 GMT)
M-HOF-Opt: Multi-Objective Hierarchical Output Feedback Optimization via Multiplier Induced Loss Landscape Scheduling [4.5] 結合モデルパラメータと乗算器進化過程のグラフモデル(PGM)を提案する。
次に、逐次決定過程としての対応するパラメータと乗算器の推定を最適制御問題にキャストする。
多目的降下ゴールは、一連の制約最適化サブプロブレムに階層的に送られる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:38:26 GMT)
Vehicle Dispatching and Routing of On-Demand Intercity Ride-Pooling Services: A Multi-Agent Hierarchical Reinforcement Learning Approach [4.4] 都市間配車サービスは、従来の都市間バスサービスをアップグレードする大きな可能性を秘めている。
オンラインオペレーションは、都市間の車両資源配分とプールドライド車両ルーティングの結合により、固有の複雑さに悩まされている。
本研究では,オンラインフリート管理を容易にするための2段階フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:43:00 GMT)
HyperFusion: A Hypernetwork Approach to Multimodal Integration of Tabular and Medical Imaging Data for Predictive Modeling [4.4] EHRの値と測定値に画像処理を条件付け,臨床画像と表層データを融合させるハイパーネットワークに基づく新しいフレームワークを提案する。
我々は, 単一モダリティモデルと最先端MRI-タブラルデータ融合法の両方に優れることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:50:04 GMT)
Chain-of-Interaction: Enhancing Large Language Models for Psychiatric Behavior Understanding by Dyadic Contexts [4.4] 本稿では,対話型対話による精神科的意思決定支援のための大規模言語モデルを文脈化するための,対話型連鎖促進手法を提案する。
このアプローチにより、大規模言語モデルでは、患者の行動コーディングのためのコーディングスキーム、患者の状態、およびドメイン知識を活用することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:47:49 GMT)
LogPrécis: Unleashing Language Models for Automated Shell Log Analysis [4.4] テキストのようなUnixシェル攻撃ログを自動的に解析するために、言語モデルにおける最先端の利点を示す。
約40,000のUnixシェル攻撃を含む2つの大きなデータセットの分析をサポートするLogPr'ecis機能を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:12:59 GMT)
An Empirical Study of Fault Localization in Python Programs [4.4] 本稿では,実環境におけるPythonプログラムと障害の局所化に関するマルチファミリー大規模実証的研究である。
我々は,本研究の基盤として,Javaにおける障害局所化に関するZau et al.の最近の大規模な実証研究を使用している。
結果は、PythonのJavaに関するいくつかの成果を再現し、Pythonの特異性が障害ローカライゼーションの能力に影響を及ぼすかどうかを明かした。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:45:19 GMT)
Interpretable Meta-Learning of Physical Systems [4.3] 最近のメタラーニング手法はブラックボックスニューラルネットワークに依存しており、計算コストが高く、解釈可能性も限られている。
我々は,学習課題に対するアフィン構造を持つ,より単純な学習モデルを用いて,マルチ環境の一般化を実現することができると論じる。
本稿では,物理系の最先端アルゴリズムと比較することにより,競合一般化性能と計算コストの低さを実証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:25:02 GMT)
Multi-criteria approach for selecting an explanation from the set of counterfactuals produced by an ensemble of explainers [4.2] そこで本研究では,マルチ基準解析に基づいて単一対実数を選択するマルチステージアンサンブル手法を提案する。
提案手法は、検討された品質指標の魅力的な妥協値を持つ、完全に実行可能な対策を生成できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:25:11 GMT)
Counting Network for Learning from Majority Label [4.2] 本稿では,LML(Learning from the Majority Label)と呼ばれるマルチクラスマルチインスタンス学習における新しい問題を提案する。
LMLは、バッグレベルのマジョリティクラスを使用してインスタンスを分類することを目的としている。
本稿では,各クラスのインスタンス数をカウントして推定したバッグレベルの過半数ラベルを生成するために訓練されたカウントネットワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:04:00 GMT)
Machine-learning optimized measurements of chaotic dynamical systems via the information bottleneck [4.2] 完璧な測定は、システムの進化によって生成された全ての情報を最小限の冗長性でキャプチャする。
最適な測定方法を見つけることは困難であり、一般的には、実行された少数のケースにおいて、ダイナミクスの詳細な知識を必要とする。
我々は、軌道データから効率的に情報を抽出する計測プロセスの最適化に機械学習を用いる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:42:25 GMT)
Tsirelson bounds for quantum correlations with indefinite causal order [4.2] 任意の因果不等式の違反を境界とする一般的な方法を提案する。
最大違反は一般に代数的最大値よりも小さいことを証明する。
驚くべきことに、任意の因果不等式の代数的最大化は、新しいタイプのプロセスによって達成できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:58:20 GMT)
Incentivizing News Consumption on Social Media Platforms Using Large Language Models and Realistic Bot Accounts [4.1] 本研究は,Twitter上での検証およびイデオロギー的にバランスの取れたニュースに対するユーザの露出とエンゲージメントを高める方法について検討する。
われわれは、スポーツ、エンターテイメント、ライフスタイルについてツイートするユーザーに対して、文脈対応で返信する28のボットを作った。
ロボットの性別による差分効果をテストするために、治療対象のユーザはランダムに、女性または男性として提示されたボットの応答を受信するように割り当てられた。
治療を受けたユーザーは、より多くのニュースアカウントをフォローし、女性のボット治療を受けたユーザーは、コントロールよりもニュースコンテンツを好む傾向にあった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:44:06 GMT)
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation [4.1] テキスト・ツー・イメージ(T2I)拡散モデルは画像生成において顕著な成功を収めた。
AGFSyncは、AIによる完全なアプローチで、DPO(Direct Preference Optimization)を通じてT2I拡散モデルを強化するフレームワークである。
AGFSyncのT2I拡散モデルの精製方法は、スケーラブルなアライメント手法の道を開く。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:31:07 GMT)
PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents [3.9] パラマヌ・アイン(Paramanu-Ayn)は、インド最高裁判所、インド憲法、インド刑法典の事例文書にのみ基づく言語モデルである。
我々のモデルはCPU上で動作し、42.46トークン/秒のCPU推論速度を達成した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:39:54 GMT)
Deep Reinforcement Learning: A Convex Optimization Approach [3.9] 本稿では,各エピソード毎に凸最適化を用いて,最適な$Q$関数の2層ニューラルネットワーク近似を求める。
安定な非線形系に対しては、アルゴリズムが収束し、トレーニングされたニューラルネットワークの収束パラメータを最適なニューラルネットワークパラメータに任意に近づけることができることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:34:27 GMT)
A quantum picture of light-suppressed photosynthetic charge transfer: Photo-blockade [3.8] 光環境の異なる植物における光化学の可逆的制御のための動的機構を提案する。
光励起直前の電荷供与者と電荷受容者との相関を考慮に入れた3レベル量子モデルを用いる。
光の定常的かつコヒーレントな駆動下では、電荷移動の効率は入射光の強度に逆比例し、それが光合成電子輸送の制限要因となるように厳しく抑制できることが示される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:30:46 GMT)
Energy-conserving equivariant GNN for elasticity of lattice architected metamaterials [3.8] 我々は、ストラットベースの格子に対する構造-プロパティ関係の大きなデータセットを生成する。
データセットはコミュニティで利用でき、物理的な原則に固定されたメソッドの開発を促進することができる。
このデータセットでトレーニングした高階GNNモデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:37:10 GMT)
FPGA-based Distributed Union-Find Decoder for Surface Codes [3.8] フォールトトレラントな量子コンピュータは、エラー訂正による指数的な減速を防ぐために、エラーの復号と修正を高速に行う必要がある。
並列計算資源を利用したUnion-Findデコーダの分散バージョンを報告する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:36:59 GMT)
DL2Fence: Integrating Deep Learning and Frame Fusion for Enhanced Detection and Localization of Refined Denial-of-Service in Large-Scale NoCs [3.7] DL2Fenceは、DoSの検出とローカライゼーションにDeep Learning (DL)とFrame Fusion (2F)を利用する新しいフレームワークである。
16x16メッシュNoCでは95.8%と91.7%の精度、98.5%と99.3%の精度を達成している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:56:40 GMT)
NELA-PS: A Dataset of Pink Slime News Articles for the Study of Local News Ecosystems [3.7] ピンクスリムなニュースメディアは、ローカル情報無効を悪用する可能性がある。
私たちは、2.5年以上にわたって1093個のピンクのスライムソースから790万以上の記事のデータセットを構築しました。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:03:49 GMT)
MC-DBN: A Deep Belief Network-Based Model for Modality Completion [3.7] 我々は、MC-DBN(Modality Completion Deep Belief Network Based Model)を提案する。
このアプローチは、完全なデータの暗黙的な特徴を利用して、それ自体と追加の不完全なデータの間のギャップを補う。
拡張されたマルチモーダルデータは、実世界のダイナミックな性質と密接に一致し、モデルの有効性を高める。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:50:46 GMT)
Robust image segmentation model based on binary level set [3.7] 本論文は、強度不均一画像における照明項をモデル化する。
ノイズの多い画像に対するモデルのロバスト性を高めるために,提案モデルにバイナリレベルセットモデルを組み込む。
変分演算子GLを導入することにより,ノイズの多い画像のセグメンテーション能力が向上することを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:33:40 GMT)
Practical End-to-End Optical Music Recognition for Pianoform Music [3.7] 私たちはLinearized MusicXMLと呼ばれるシーケンシャルなフォーマットを定義します。
我々は,OpenScore Lieder corpus に基づいて MusicXML をベースとしたベンチマーク型セット OMR を作成する。
データセットのベースラインとして機能し、TEDnメトリックを使用してモデルを評価するために、エンドツーエンドモデルをトレーニングし、微調整する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:26:22 GMT)
Building Energy Efficiency through Advanced Regression Models and Metaheuristic Techniques for Sustainable Management [3.7] この研究は、建設インフラからの広範な生データを活用して、エネルギー消費パターンを明らかにする。
ラッソ回帰, 決定木, ランダムフォレストモデルを用いて, 建物のエネルギー効率とコスト削減に影響を与える要因について検討した。
メタヒューリスティックな手法を用いて決定木アルゴリズムを改良し,予測精度を向上する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:29:53 GMT)
Integrating Large Language Models for Severity Classification in Traffic Incident Management: A Machine Learning Approach [3.7] 本研究では,大規模言語モデルが交通事故管理における機械学習プロセスの強化に与える影響を評価する。
最新の言語モデルによって生成された特徴が、インシデントの深刻度を分類する際の予測精度を向上するか、一致させるかを検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:33:51 GMT)
Superconducting processor design optimization for quantum error correction performance [3.7] ハミルトンおよび量子誤り訂正レベルの両方にまたがるマルチレベルシミュレーションフレームワークを提案する。
このツールセットは、量子メモリパフォーマンスなどの特定の目的に合わせて設計最適化を支援する。
我々はフラキソニウム量子ビットの多経路結合スキームによるアプローチを実証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:58:26 GMT)
Decentralized Federated Learning: Model Update Tracking Under Imperfect Information Sharing [3.7] 分散ノイズモデル更新追跡フェデレート学習アルゴリズム(FedNMUT)を提案する。
ノイズの多い通信チャネルの存在下で効率的に機能するように調整されている。
FedNMUTはノイズをパラメータに組み込んで、ノイズの多い通信チャネルの条件を模倣する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:17:47 GMT)
Analysis of singular subspaces under random perturbations [3.7] 私たちは、任意のユニタリ不変行列ノルムに適用できる、完全に一般化された方法でデイビス=カーン=ヴェーディンの定理を拡張する。
本稿では,ガウス混合モデルとサブマトリクス局所化問題の文脈において,これらの知見の実用的意義について考察する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:22:24 GMT)
Private Aggregate Queries to Untrusted Databases [3.6] プライベート情報検索(Private Information Search, PIR)は、プライバシ保護のための暗号ツールである。
ほとんどのPIRプロトコルは、クライアントが意図したデータベースアイテムの正確な行インデックスを知る必要がある。
我々は、ユーザが集約された結果を取得することができる新しい情報理論PIRフレームワークを構築した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:35:21 GMT)
Recursive Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition [3.6] ビデオから抽出した顔・声・テキストの融合に基づく次元的感情認識に焦点を当てた。
提案モデルでは,各モーダル間の交差重みを計算することにより,モーダル間の関係を効果的に捉えることができる。
ABAW6(Affective Behavior Analysis in-the-Wild 2024)コンペティションにおいて,提案した核融合モデルによりベースラインの大幅な改善が達成された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:08:43 GMT)
DBA-Fusion: Tightly Integrating Deep Dense Visual Bundle Adjustment with Multiple Sensors for Large-Scale Localization and Mapping [3.5] トレーニング可能な高密度バンドル調整(DBA)を因子グラフを通じて多センサ情報と密に統合する。
視覚-慣性統合のためのパイプラインが最初に開発され、メカニカルスケールのローカライゼーションとマッピングの最小限の能力を提供する。
その結果,大規模環境におけるリアルタイム高密度マッピングを実現する手法として,より優れたローカライゼーション性能が得られた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:20:54 GMT)
A Semantic Search Engine for Mathlib4 [3.5] 本稿では,非公式な問合せを受け付け,関連する定理を求めるMathlib4のセマンティック検索エンジンを提案する。
また,各種検索エンジンの性能評価のためのベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:23:09 GMT)
An Exploratory Study on Automatic Identification of Assumptions in the Development of Deep Learning Frameworks [3.5] 既存の仮定管理のためのアプローチとツールは通常、仮定のマニュアル識別に依存する。
手動で仮定を識別する問題を克服するため、GitHub上のリポジトリから収集された仮定の新しい最大データセット(AssuEval)を構築しました。
AlBERTは、AssuEvalデータセット上の仮定を特定する最高のパフォーマンス(f1スコア: 0.9584)を達成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:06:33 GMT)
Modality-aware Transformer for Financial Time series Forecasting [3.4] 我々は,textitModality-aware Transformer という,新しいマルチモーダルトランスモデルを提案する。
本モデルでは,対象とする時系列を効果的に予測するために,分類的テキストと数値的時系列の両方のパワーを探索することに長けている。
財務データセットに関する我々の実験は、Modality-aware Transformerが既存の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:48:05 GMT)
Cell Tracking in C. elegans with Cell Position Heatmap-Based Alignment and Pairwise Detection [3.4] 生体内の3D細胞追跡は、生きた細胞画像解析において重要な役割を担っている。
細胞検出は、触覚細胞と低コントラスト画像によって連続したフレームに矛盾することが多い。
本稿では,これらの問題に対処する細胞追跡手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:53:56 GMT)
Guaranteeing Control Requirements via Reward Shaping in Reinforcement Learning [3.0] 取得したポリシーが本質的な性能と安定性の基準を満たすことを保証することが要求されることが多い。
本稿では,最適ポリシーが所定の制御条件に整合したトラジェクトリを生成するための体系的な報酬形成手順を提案する。
提案手法はOpenAI Gymの2つの代表的な環境における総合的な数値実験により検証する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:30:31 GMT)
MCRAGE: Synthetic Healthcare Data for Fairness [3.0] そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。
MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。
この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:32:42 GMT)
Electron wave spin in a cavity [3.0] 電流密度は空洞の境界を越えて同心円状に循環し、エバネッセント波スピンの概念を描いている。
電荷とスピンの性質を単一のローレンツ共変体に統合することは、電子波が電子の基本的および決定論的現実を構成することを示唆している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:00:08 GMT)
REDS: Resource-Efficient Deep Subnetworks for Dynamic Resource Constraints [2.9] 最先端の機械学習パイプラインは、実行時に適応できないリソースに依存しないモデルを生成する。
本稿では,資源効率の高いDeep Subnetworks (REDS) を導入し,変動資源へのモデル適応に取り組む。
本稿では,サブモデルのテストセット精度の観点から,REDSの優れた性能を示す理論的結果と実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:21:34 GMT)
Insight Into the Collocation of Multi-Source Satellite Imagery for Multi-Scale Vessel Detection [2.9] 深層学習(DL)を用いた衛星画像からの船舶検出は、海上監視にとって必須のソリューションである。
1つのデータセットでトレーニングされたDLモデルを、空間分解能と放射能の特徴が異なる他のデータセットに適用するには、多くの調整が必要である。
本稿では、異なる光学画像とレーダと光学データの組み合わせからなるデータセットに基づいて訓練されたDLモデルに焦点を当てた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:03:01 GMT)
LISNeRF Mapping: LiDAR-based Implicit Mapping via Semantic Neural Fields for Large-Scale 3D Scenes [2.8] 大規模セマンティックマッピングは、屋外の自律エージェントが計画やナビゲーションといった高度なタスクを遂行するために不可欠である。
本稿では,提案するLiDAR測度のみでの暗黙的表現による大規模3次元意味再構築手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:45:17 GMT)
Walia-LLM: Enhancing Amharic-LLaMA by Integrating Task-Specific and Generative Datasets [2.8] タスク固有および生成データセットを統合することでLLaMA-2-Amharicモデルの強化に注力する。
我々はAmharic命令の微調整データセットとLLaMA-2-Amharicモデルをコンパイルする。
微調整されたモデルは、異なるNLPタスクで有望な結果を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:33:19 GMT)
Fast delivery of heralded atom-photon quantum correlation over 12km fiber through multiplexing enhancement [2.8] 12km繊維上での原子-光子量子相関の多重化を実験的に実現した。
原子-光子相関の隠蔽速度は 1.95kHz に達し、量子相関生成率とメモリデコヒーレンス率との比は 0.46 に向上できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:15:40 GMT)
Lossless Point Cloud Geometry and Attribute Compression Using a Learned Conditional Probability Model [2.7] 本稿では,テンソルに基づく深層ニューラルネットワークを用いて,点雲の幾何と色確率を学習する効率的な点雲圧縮法を提案する。
本手法は,異なるビット深さの3つの特徴を持つ点雲を統一表現で表現する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:00:15 GMT)
Uncertainty Driven Active Learning for Image Segmentation in Underwater Inspection [2.6] 水中インフラ検査作業における画像分割のための能動的学習の可能性について検討する。
フレームワークの有効性を評価するために、DenseNetとHyperSegは、アクティブラーニングを使用してCamVidデータセットでトレーニングされる。
パイプラインデータセットでは、アクティブな学習を持つHyperSegは、12.5%のデータを使用したIoU平均67.5%、同じランダムに選択された画像の61.4%を達成した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:03:40 GMT)
Noise-induced shallow circuits and absence of barren plateaus [2.5] まず、雑音がほとんどの量子回路を効果的に対数深度に切り離すことを示す。
次に,非単位雑音下での量子回路は,局所可観測物からなるコスト関数に対するバレンプラトーの欠如を証明した。
また、逆多項式加法誤差内でのパウリ予想値を推定する古典的アルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:00:49 GMT)
Hierarchical NeuroSymbolic Approach for Action Quality Assessment [2.5] 行動品質評価(AQA)は、人間の行動のパフォーマンスや実行を定量的に評価するためにコンピュータビジョンを適用する。
現在のアプローチはエンドツーエンドのニューラルモデルで、透明性が欠如し、主観的な人間の判断を地道として訓練する傾向がある。
本稿では、ニューラルネットワークを用いてビデオデータから解釈可能なシンボルを抽象化し、それらのシンボルに規則を適用することによって品質評価を行う、AQAのためのニューロシンボリックパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:55:21 GMT)
SAM-OCTA: Prompting Segment-Anything for OCTA Image Segmentation [2.5] OCTA画像の局所分割のためのSAM-OCTA法を提案する。
低ランク適応(LoRA)を用いたSAM(Pre-trained segment Any Model)の微調整法
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:42:18 GMT)
Probing Hilbert Space Fragmentation with Strongly Interacting Rydberg Atoms [2.3] ヒルベルト空間の断片化は閉多体系におけるエルゴディディティを破るメカニズムを提供する。
大規模デチューニング系におけるライドバーグイジングモデルは、一般化された折り畳みXXZモデルにマッピング可能であることを示す。
また、原子位置障害の役割についても検討し、対称性選択多体局在遷移を同定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:53:20 GMT)
Correlation Clustering of Organoid Images [2.2] 我々は、オルガノイド画像の関連付けとクラスタリングのためのモデルとアルゴリズムを採用する。
我々はこれらのモデルのパラメータを学習し、オルガノイド画像のクラスタリングを推論し、推論されたクラスタの精度を定量化する。
我々は,生物学者が手動で収集したオルガノイドの最先端の光顕微鏡画像に貢献する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:15:34 GMT)
A Pedestrian's Way to Baxter's Bethe Ansatz for the Periodic XYZ Chain [2.2] 固定数のキンクを持つキラルベクトルの集合を構築する。
ユニタリ条件の根の下では、ヒルベルト空間は不変部分空間を持つ。
カイラルベクトルに対するハミルトニアンの作用に基づくベーテアンサッツを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:41:55 GMT)
First Demonstration of 25λ x 10 Gb/s C+L Band Classical / DV-QKD Co-Existence Over Single Bidirectional Fiber Link [2.1] 古典的および量子的信号の共伝播は、新しい中空コアファイバの開発の恩恵を受ける。
25 x 10 Gb/sの古典チャネルが存在する場合、1538nmの量子チャネルに対して、セキュアな鍵レートが330bit/sであることを示す。
このことは、将来的なセキュアな通信ネットワークを実現するために、ホロウコアファイバとDV-QKDを併用して展開・統合するための重要なステップであると考えています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:00:03 GMT)
Topological magnon-polaron transport in a bilayer van der Waals magnet [2.1] 固有の磁気ファンデルワールス材料の積み重ねは、マグノンの調整可能な輸送効果を探索するための肥大したプラットフォームを提供する。
トポロジカルに非自明なマグノンは、探索の範囲をさらに広げることができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:42:54 GMT)
Next day fire prediction via semantic segmentation [2.1] 翌日の火災予報タスクは、ある地域において、ある日まで利用可能な情報を入力として受け取る学習モデルで構成される。
完全なパイプライン内に構築されたこの問題の定式化が,技術結果の状態を達成していることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:31:13 GMT)
A Signal Injection Attack Against Zero Involvement Pairing and Authentication for the Internet of Things [2.1] 本稿では,ZIPAシステムに対する最初のシグナル注入攻撃について述べる。
既存のZIPAシステムの多くは、安全でない外部空間から安全でない内部空間への影響が無視できると仮定している。
我々の攻撃は、この事実を利用して、人気のあるシュルマン&シッグアルゴリズムに対する信号注入攻撃を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:37:22 GMT)
Integrating Supervised Extractive and Generative Language Models for Suicide Risk Evidence Summarization [2.1] 本稿では,自殺リスクの証拠を提供するために,教師付き抽出言語モデルと生成言語モデルを統合する手法を提案する。
まず,文レベル自殺リスクと負の感情を推定するためのBERTモデルを構築した。
次に,自殺リスクと負の感情の両方の高い確率を強調することで,高い自殺リスクの文を正確に同定する。
最後に,MentaLLaMaフレームワークを用いた生成要約と,特定された自殺リスク文からの抽出要約と,自殺リスク単語の専門辞書を統合した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:16:10 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency and Usability in AI [2.1] モデルオープンネスフレームワーク(MOF)は,その完全性とオープン性に基づいて機械学習モデルを評価する分類システムである。
MOFは、適切なオープンライセンスの下で、モデル開発ライフサイクルの特定のコンポーネントを含め、リリースする必要がある。
このフレームワークは、オープンであると主張するモデルの誤表現を防止することを目的としており、研究者や開発者は、許容ライセンス下ですべてのモデルコンポーネントを提供することを指導し、企業、アカデミア、ホビイストが制限なく安全に採用できるモデルを識別する手助けをする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:47:08 GMT)
H-vmunet: High-order Vision Mamba UNet for Medical Image Segmentation [2.1] 医用画像分割のための高次視覚マンバUNet(H-vmunet)を提案する。
提案した高次2D選択的スキャン(H-SS2D)は、冗長情報の導入を徐々に削減する。
さらに,提案するLocal-SS2Dモジュールは,各操作順序におけるSS2Dの局所的特徴の学習能力を向上する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:49:52 GMT)
S2DM: Sector-Shaped Diffusion Models for Video Generation [2.0] ビデオ生成のためのセクタ型拡散モデル(S2DM)を提案する。
S2DMは、同じ意味と本質的な特徴を共有する本質的な関連データ群を生成することができる。
追加のトレーニングなしに、我々のモデルは、他の時間的条件と統合され、生成モデルは、既存の作業と同等のパフォーマンスを達成できることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:50:15 GMT)
Does Differentially Private Synthetic Data Lead to Synthetic Discoveries? [2.0] 微分プライバシー(DP)は現在、このトレードオフのバランスをとるための金の標準的アプローチと考えられている。
本研究は,DP合成バイオメディカルデータに対するMann-Whitney U試験を,I型およびII型エラーの観点から評価することを目的とする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:03:57 GMT)
Optimal Transport for Fairness: Archival Data Repair using Small Research Data Sets [2.0] 我々は保護属性(S$)と保護されていない属性(U$)の条件独立性の観点から公正性を定義する。
我々はこれらのデータのごく一部だけを用いて、アーカイブデータのトレントを修復する必要がある重要な設定(研究データ)に対処する(S|U$-labelled)。
我々の業績は、大量のオフサンプル、ラベル付き(アーキバル)データを効果的に修復できることを実証している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:23:20 GMT)
Leveraging feature communication in federated learning for remote sensing image classification [1.9] 本研究は,リモートセンシング画像分類に適用されたフェデレートラーニング(FL)のための革新的なコミュニケーション戦略を紹介し,評価する。
調査では,特徴中心のコミュニケーション,擬似重畳化,重みと特徴の両面を利用した組み合わせ手法について検討した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:20:05 GMT)
Towards an All-Silicon QKD Transmitter Sourced by a Ge-on-Si Light Emitter [1.9] 偏光符号化BB84プロトコルに基づく新しい量子鍵分布送信器を実証する。
我々は、Ge-on-Si光源が2.15kbit/sの生鍵レートを1GHzのシンボルレートで7.71%の量子ビット誤り比で達成し、量子鍵生成に有効であることを実験的に証明した。
本研究は,ゼロトラスト・イントラ・データセンター環境におけるショートリーチ適用の可能性について,その光源を含む完全集積シリコン量子鍵伝送装置の実現可能性を示すものである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:04:00 GMT)
Bridging scales in multiscale bubble growth dynamics with correlated fluctuations using neural operator learning [1.9] 本研究では, マイクロスケールおよびマクロスケールの非線型気泡力学解析を統一する合成ニューラル演算子モデルを構築した。
トレーニングデータと試験データは, 0.1マイクロメートルから1.5マイクロメートルの範囲の気泡半径を持つ非線形気泡動力学のmDPDおよびRPシミュレーションにより生成する。
その結果, トレーニングした複合型ニューラルオペレーターモデルは, 気泡半径の時間的評価に99%の精度で, スケールのバブルダイナミクスを正確に予測できることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:56:02 GMT)
A Hybrid Transformer-Sequencer approach for Age and Gender classification from in-wild facial images [1.8] 本稿では,年齢と性別の分類問題に対する自己意識とBiLSTMアプローチを組み合わせたハイブリッドモデルを提案する。
提案モデルでは, 年齢と性別の分類のための最先端実装に比べて, 約10%, 6%の改善が注目されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:56:29 GMT)
Statistical Confidence in Mining Power Estimates for PoW Blockchains [1.7] Proof of Work(PoW)ブロックチェーンでは、マイニングパワーの分散はブロックチェーンから直接読むことはできない。
中本係数の統計的不確かさを定量化する枠組みを導入する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:43:30 GMT)
Loss Regularizing Robotic Terrain Classification [1.6] 本稿では,脚ロボットの地形分類のための半教師付き手法を提案する。
提案手法は、新しい損失正規化を含む長期記憶アーキテクチャを積み重ねたものである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:57:44 GMT)
StyleHumanCLIP: Text-guided Garment Manipulation for StyleGAN-Human [1.5] 本論文は、フルボディの人体画像における衣服編集のためのスタイルGANのテキスト誘導制御に取り組む。
本稿では,注意に基づく潜在コードマッパーを用いたテキスト誘導フルボディ画像合成のためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 05:00:06 GMT)
Graph Edits for Counterfactual Explanations: A comparative study [1.5] 我々は,グラフ編集における過去の取り組みを,比較研究を行うことで,反現実的な説明として拡張する。
この目的のために、我々は入力データをグラフとして表現すべきかという重要な研究課題を提起する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:12:28 GMT)
Towards Learning Contrast Kinetics with Multi-Condition Latent Diffusion Models [1.5] DCE-MRI時間系列の時間条件画像合成が可能な潜時拡散モデルを提案する。
以上の結果から,本手法が現実的な多列性脂肪飽和乳房DCE-MRIを生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:01:57 GMT)
Classical and quantum cost of measurement strategies for quantum-enhanced auxiliary field Quantum Monte Carlo [1.4] 補助場量子モンテカルロ(QC-AFQMC)は、量子コンピュータからの出力を使用して、古典的な量子コンピュータの精度を高める。
本稿では,このアルゴリズムの適用性について,量子コンピュータから要求される測定数と,これらの測定を後処理する古典的コストの観点から検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:37:23 GMT)
Nellie: Automated organelle segmentation, tracking, and hierarchical feature extraction in 2D/3D live-cell microscopy [1.4] 我々は,様々な細胞内構造のセグメンテーション,追跡,特徴抽出のための,非バイアス自動パイプラインNellieを紹介した。
Nellieはイメージメタデータに適応し、ユーザの入力を排除します。
Nellieは、コードを使わない操作と視覚化を可能にするNapariベースのGUIを特徴としている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:23:42 GMT)
Towards a connection between the capacitated vehicle routing problem and the constrained centroid-based clustering [1.4] 実用的なランタイムにおける車両ルーティングの効率的な解決は、デリバリ管理企業にとって重要な課題である。
本稿では,CVRPとCCBC(Constrainedid-Based Clustering)の理論的および実験的関係について検討する。
提案するフレームワークは,3つの段階から構成される。第1段階では,制約付きセントロイドベースのクラスタリングアルゴリズムが,ユーザの実現可能なクラスタを生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:24:36 GMT)
Leveraging Neural Radiance Field in Descriptor Synthesis for Keypoints Scene Coordinate Regression [1.3] 本稿では,Neural Radiance Field (NeRF) を用いたキーポイント記述子合成のためのパイプラインを提案する。
新たなポーズを生成してトレーニングされたNeRFモデルに入力して新しいビューを生成することで、当社のアプローチは、データスカース環境でのKSCRの機能を強化します。
提案システムは,最大50%のローカライズ精度向上を実現し,データ合成に要するコストをわずかに抑えることができた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:34:27 GMT)
Prediction Error Estimation in Random Forests [1.3] 分類の場合、ランダムフォレストによる予測誤差の推定は、真の誤差率と平均的に近いことを示す。
さらに、我々の結果は、クロスバリデーション、バッグング、データ分割など、さまざまなエラー推定戦略にまたがっていることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:48:36 GMT)
Technical Report: Competition Solution For BetterMixture [1.2] 本稿では、大規模言語モデルの微調整データ混合に焦点を当てたBetterMixtureチャレンジのソリューションについて詳述する。
3位を確保した当社のアプローチには,データの重複,低レベルかつ高品質なフィルタリング,多様性の選択などが取り入れられている。
私たちのソリューションの基盤はKe-Data-Juicerで、大規模言語モデルのデータの処理と最適化における堅牢な能力を実証しています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:46:06 GMT)
Improving the Adaptive Moment Estimation (ADAM) stochastic optimizer through an Implicit-Explicit (IMEX) time-stepping approach [1.2] 古典的アダムアルゴリズムは、基礎となるODEの1次暗黙的明示(IMEX)離散化である。
本稿では,高次IMEX法を用いてODEを解いたAdamスキームの新たな拡張を提案する。
いくつかの回帰問題と分類問題において,従来のAdamよりも優れた性能を示すニューラルネットワークトレーニングのための新しい最適化アルゴリズムを導出する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:08:27 GMT)
Average circuit eigenvalue sampling on NISQ devices [1.2] 平均回路固有値サンプリング (ACES) はFlamia が arXiv:2108.05803 で導入した。
この作業は、実際のデバイス向けのACESの完全な実装を示し、Superstaq arXiv:2309.05157にデプロイすることで、この方向に進んでいる。
シミュレーションの結果,ACES は 1-および 2-qubit の非一様パウリ誤差チャネルを平均固有値絶対誤差$0.003$ 以下と推定できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 04:21:10 GMT)
Enhancing Quantum Annealing via entanglement distribution [1.1] 量子アニーリングは、いくつかの最適化問題に対処するための強力なツールであることが証明されている。
その性能は、基礎となる量子ハードウェアの接続性に大きく影響している。
本稿では,非局所結合を実装する手法を記述することによって,これらの問題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:36:53 GMT)
Empirical Analysis on CI/CD Pipeline Evolution in Machine Learning Projects [1.1] この研究は、機械学習(ML)ソフトウェアシステムにおいて、継続的インテグレーションとデリバリ(CI/CD)の構成がどのように進化するかについて、最初の経験的分析を提示する。
我々は508のオープンソースMLプロジェクトから収集した343のコミットを手動で分析し、CI/CD構成変更カテゴリを特定した。
我々は15,634コミットで頻繁なCI/CD構成変更パターンを識別するCI/CD構成変更クラスタリングツールを開発した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:43:54 GMT)
Malaria Parasitic Detection using a New Deep Boosted and Ensemble Learning Framework [1.1] Deep Boosted and Ensemble Learning (DBEL)フレームワークはマラリア原虫の画像をスクリーニングするために開発された。
提案するフレームワークは、顕著で多様なブーストチャネルの積み重ねを含意し、開発したBoosted-BR-STMの識別特性を提供する。
このフレームワークは精度(98.50%)、感度(0.9920)、Fスコア(0.9850)、AUC(0.997)を達成した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:20:34 GMT)
Gammatonegram Representation for End-to-End Dysarthric Speech Processing Tasks: Speech Recognition, Speaker Identification, and Intelligibility Assessment [1.0] 失語症(Dysarthria)は、人間の音声システムに障害を引き起こす障害である。
本稿では,ガンマトーングラムを識別的詳細で音声ファイルを表現する効果的な方法として紹介する。
我々は,各音声ファイルを画像に変換し,異なるシナリオで音声を分類する画像認識システムを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:08:06 GMT)
Quantum-inspired identification of complex cellular automata [1.0] 基本細胞オートマトン(ECA)は複雑なシステムの象徴的な例である。
ECAルールは、最寄りの更新ルールに従って進化するバイナリセルの1次元文字列によってのみ記述される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:51:01 GMT)
Highly Efficient Decomposition of n-Qubit Quantum Gates Based on Block-ZXZ Decomposition [1.0] 本稿では、より最適な量子回路を構築するために、新しい最適化量子ブロックZXZ分解法[4,5,6]を提案する。
一般の n ビットゲートに対して、提案した分解は、(22/48) 4n - (3/2) 2n + (5/3)$ CNOT ゲートを持つ回路を生成する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:55:35 GMT)
VCounselor: A Psychological Intervention Chat Agent Based on a Knowledge-Enhanced Large Language Model [1.0] 本研究の目的は,心理介入における大規模言語モデルの有効性と信頼性を向上させることである。
我々は、新しい感情的相互作用構造と知識・エンハンスメント構造を提案することで、この目標を達成した。
その結果, VCounselorの感情的相互作用構造と知識強調構造は, 心理的介入の有効性と信頼性を有意に向上した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:46:02 GMT)
Observational and Experimental Insights into Machine Learning-Based Defect Classification in Wafers [0.9] 本稿では,半導体製造におけるウエハ欠陥の同定に機械学習(ML)分類技術を用いた方法論の総合的なレビューを行う。
提案する方法論の革新的な分類法は、より洗練されたカテゴリと技法にアルゴリズムの詳細な分類を提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:26:55 GMT)
Quantum-limited superresolution of two incoherent point sources with unknown photon numbers [0.8] 超解像はレイリーの基準の限界を克服することが示されている。
近年では、2つの非コヒーレントな光源の光子数が未知の場合、超解像の精度は消滅することが判明した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:00:00 GMT)
HyLiMo: A Hybrid Live-Synchronized Modular Diagramming Editor as IDE Extension for Technical and Scientific Publications [0.8] 本稿では,HyLiMoを提案する。
HyLiMoでは、ダイアグラムは内部DSLを使用して作成され、描画されたダイアグラムのためのインタラクティブなグラフィカルエディタとライブ同期されます。
ユーザスタディの結果から,このようなアプローチが高速かつ正確なダイアグラム作成を可能にすることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:14:00 GMT)
Enhancing Law Enforcement Training: A Gamified Approach to Detecting Terrorism Financing [0.8] トレーニングイベントには、約60%の参加者が11週間のトレーニングコースを完了している。
ハッカソンの結果は2つのパイロット研究(マドリッドとハーグ)にまとめられ、参加者の間では専門知識が増している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:22:19 GMT)
Quantum simulation of time-dependent Hamiltonians via commutator-free quasi-Magnus operators [0.8] マグナス作用素(Magnus operator)は、計算数学における時間依存ハミルトニアンシミュレーションの一般的な方法である。
可換準マグヌス作用素(CFQM)の開発は、この障害を回避する。
CFQMは、しばしば1桁以上のオーダーで利用できる最も効率的な製品-フォーミュラ技術であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:01:27 GMT)
FissionFusion: Fast Geometric Generation and Hierarchical Souping for Medical Image Analysis [0.8] 十分に注釈付けされた医療データセットの不足は、ImageNetのような広範なデータセットやCLIPのような事前訓練されたモデルからの移行学習を活用する必要がある。
モデルスープは、In-Domain(ID)タスクのパフォーマンスを改善し、out-of-Distribution(OOD)データセットに対する堅牢性を高めることを目的とした、複数の微調整されたモデルの平均である。
本稿では,様々なレベルのモデルの局所的および大域的集約を伴う階層的統合手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:48:48 GMT)
Stochastic Geometry Models for Texture Synthesis of Machined Metallic Surfaces: Sandblasting and Milling [0.8] 視覚面検査システムのためのトレーニング欠陥検出アルゴリズムには,大規模かつ代表的なトレーニングデータが必要である。
テクスチャ合成モデルを用いて微小な表面トポグラフィーをモデル化するデジタルツインが必要である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:27:49 GMT)
A Non-Parametric Bootstrap for Spectral Clustering [0.8] 我々は,データ行列のスペクトル分解と非パラメトリックブートストラップサンプリング方式を組み合わせた2つの新しいアルゴリズムを開発した。
我々の手法は、有限混合モデルに適合する他のブートストラップアルゴリズムと比較して収束性においてより一貫性がある。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:19:28 GMT)
TiBiX: Leveraging Temporal Information for Bidirectional X-ray and Report Generation [0.7] TiBiX:双方向X線とレポート生成のための時間情報を活用する。
双方向X線とレポート生成のための時間情報を活用するTiBiXを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:00:03 GMT)
Contingency Analyses with Warm Starter using Probabilistic Graphical Model [0.7] サイバー脅威は電力網にとってますます一般的なリスクであり、セキュアなグリッド運用を妨げる可能性がある。
本稿では,サイバー脅威評価を含む緊急分析の拡張を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:42:11 GMT)
Arcee's MergeKit: A Toolkit for Merging Large Language Models [0.6] MergeKitは、モデルマージ戦略の適用を容易にするように設計されたライブラリである。
何千ものモデルがオープンソースコミュニティによってマージされている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:38:01 GMT)
Towards an extension of Fault Trees in the Predictive Maintenance Scenario [0.6] 本稿では,予測保守の問題を考慮した断層木の拡張を提案する。
本稿では予測フォールトツリー言語をスケッチし、具体的な産業環境でのモデリングと分析を支援するいくつかのユースケースを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:47:25 GMT)
Quantum chaos in the sparse SYK model [0.6] SYKモデル(Sachdev-Ye-Kitaev model)は、ランダム相互作用と強いカオス力学を持つ$N$Majoranaフェルミオンのシステムである。
我々はSYKモデルのスペーサー化バージョンについて検討し、相互作用項を1-p$の確率で削除する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:00:02 GMT)
Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet [0.5] 本稿では,新しい3次元焦点変調UNetであるFocalSegNetを提案する。
UIA検出では偽陽性率は0.21で感度は0.80であった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:29:56 GMT)
Single-frame transmission and phase imaging using off-axis holography with undetected photons [0.5] オフ軸デジタルホログラフィーにより、単一干渉画像からの赤外線波長における透過像と位相像の再構成が可能となる。
我々は1秒10フレームで信号対雑音比1.78,pm,0.06$で、赤外線ビーム内の物体の透過画像を再構成することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:30:13 GMT)
Enhancing Fingerprint Image Synthesis with GANs, Diffusion Models, and Style Transfer Techniques [0.4] 我々は様々な方法でノイズからライブ指紋を生成し、画像翻訳技術を用いてライブ指紋画像をスプーフに変換する。
我々はFr'echet Inception Distance (FID) とFalse Acceptance Rate (FAR) によって生成されたライブ指紋画像の多様性と現実性を評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:36:30 GMT)
Principle of least action for quasi-adiabatic state transfers with dissipation [0.4] 準断熱状態転送プロトコルを最適化するための一般的な形式について論じる。
我々は,散逸と非断熱遷移の組み合わせによって引き起こされた残存忠実度損失を,古典的な行動の形で打ち出した。
応用として、強い散逸性量子バスを介して相互作用する2つの量子ビットの弱緩和とデファス化の系を解析する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:12:47 GMT)
Have You Poisoned My Data? Defending Neural Networks against Data Poisoning [0.4] 本稿では,トランスファー学習環境における有毒なデータポイントの検出とフィルタリングを行う新しい手法を提案する。
有効毒は, 特徴ベクトル空間の清浄点とよく区別できることを示す。
提案手法は, 防衛率と最終訓練モデルの性能において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:50:16 GMT)
Large Language Models meet Network Slicing Management and Orchestration [0.4] 本稿では,Large Language Models (LLM) とマルチエージェントシステムを利用したネットワークスライシングの今後の展望を提案する。
このフレームワークの実装に伴う課題と、それを緩和する潜在的なソリューションについて議論する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:29:52 GMT)
HRI Curriculum for a Liberal Arts Education [0.3] 本研究では,大学院リベラル・アーツ・カレッジにおいて,人間-ロボットインタラクション・コースを教える機会と課題について論じる。
コースの以前のバージョンから適応したサンプルシラバスを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:51:29 GMT)
Immunohistochemistry guided segmentation of benign epithelial cells, in situ lesions, and invasive epithelial cells in breast cancer slides [0.3] 乳がん領域における上皮細胞のセグメンテーションのためのAIモデルを開発した。
浸潤上皮細胞,良性上皮細胞,in situ病変に対するDiceスコア0.70,0.79,0.75の定量評価を行った。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:06:09 GMT)
Simple But Effective: Rethinking the Ability of Deep Learning in fNIRS to Exclude Abnormal Input [0.3] 研究者はしばしば、fNIRSデータの分類問題に取り組むためにディープラーニングを使用する。
本研究は、fNIRSの現在のネットワークが、トレーニング分布内での予測に極めて正確である一方で、異常データの特定と排除を困難にしていることを示している。
本稿では,fNIRS研究にメトリクス学習と教師あり手法を組み込むことにより,アウト・オブ・ディストリビューション・アウトレイラを識別・排除するネットワーク能力を向上させることを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:08:28 GMT)
Calibration of Deep Learning Classification Models in fNIRS [0.3] 機能近赤外分光法(FNIRS)は脳活動を監視する貴重な非侵襲的ツールである。
多くの研究者は、fNIRSデータに固有の分類問題に取り組むために、ディープラーニングに目を向けている。
本稿では,fNIRS分類タスクにおける深層学習に基づく予測の信頼性向上を論じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:12:49 GMT)
The Bid Picture: Auction-Inspired Multi-player Generative Adversarial Networks Training [0.2] 生成的敵ネットワークのためのオークションライクなトレーニングが提案されている。
各モデルの値は、オークションのようなプロセスで他のプレイヤーが提出した入札によって決定される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:47:42 GMT)
Information-theoretic derivation of energy and speed bounds [0.2] 力学が情報非平衡状態から生じるモデルを提供する。
量子論におけるエネルギーの主な特徴を捉えるエネルギーの概念を導出する。
この結果は、量子進化の速度に依存するマンデルスタム・タムを情報理論で再構築するものである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:02:05 GMT)
qec_code_sim: An open-source Python framework for estimating the effectiveness of quantum-error correcting codes on superconducting qubits [0.2] 我々は、小さな量子誤り訂正符号の性能を研究するためのオープンソースの軽量Pythonフレームワークであるqec_code_simを紹介する。
qec_code_simは、最小限のソフトウェア依存関係を必要とし、実行速度よりも使いやすさ、変更の容易さ、教育性を優先する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:03:50 GMT)
New opportunities in condensed matter physics for nanoscale quantum sensors [0.1] 窒素空孔(NV)中心量子センサーは凝縮物質の研究にユニークな機会を提供する。
定量的、非侵襲的、物理的に堅牢で、ナノスケールの分解能を持ち、幅広い温度で使用することができる。
これらの性質は近年,静磁場のナノスケール分解能測定に利用されてきた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:13:22 GMT)
Leveraging High-Resolution Features for Improved Deep Hashing-based Image Retrieval [0.1] 本稿では,HHNet(High-Resolution Hashing Network)と呼ばれるディープハッシュタスクのバックボーンとして高分解能ネットワーク(HRNet)を利用する新しい手法を提案する。
提案手法は,CIFAR-10, NUS-WIDE, MS COCO, ImageNetなど,すべてのベンチマークデータセットを対象とした既存手法と比較して,優れた性能を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:54:55 GMT)
Graph Neural Network for Crawling Target Nodes in Social Networks [0.1] ソーシャルネットワークのクロールは、クロールステップの予算を考えれば難しい作業だ。
GNNベースのアプローチは、特に分散ターゲットノードの場合、クローリングタスクに潜在的な可能性がある。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:13:54 GMT)
GeoScaler: Geometry and Rendering-Aware Downsampling of 3D Mesh Textures [0.1] 高解像度テクスチャマップは、3Dメッシュで現実世界のオブジェクトを正確に表現するために必要である。
GeoScalerは幾何学的手がかりを取り入れつつ、3Dメッシュのテクスチャマップをダウンサンプリングする方法である。
また,GeoScalerが生成したテクスチャは,従来のダウンサンプリング手法に比べて,画質のよいレンダリング画像を提供することを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:59:44 GMT)
Towards AI-Based Precision Oncology: A Machine Learning Framework for Personalized Counterfactual Treatment Suggestions based on Multi-Omics Data [0.1] 本稿では,個別のがん治療提案のためのモジュール型機械学習フレームワークを提案する。
このフレームワークは、データ駆動がん研究に固有の重要な課題に対処するように調整されている。
本手法は,臨床医に現実的な意思決定支援ツールを提供することを目的としている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:21:48 GMT)
dc atomtronic quantum interference device: quantum superposition of persistent-current states and a parity-protected qubit [0.0] 直流原子線量子干渉装置の回転ダイナミクスについて検討した。
パリティ保護スキームは、中心周波数の周りの小さな間隔で生存する。
周波数決定におけるそのような許容誤差の最大値は、クビット品質係数に逆比例することがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:10:00 GMT)
What makes a small-world network? Leveraging machine learning for the robust prediction and classification of networks [0.0] 我々は、解釈可能な機械学習の進歩を利用して、様々なネットワーク属性に基づいて、生成モデルによってシミュレーションされたネットワークを分類する。
本研究は,ネットワークモデルの作成,複雑なネットワーク構造の理解,実世界のネットワーク形成において,ネットワークの特徴とその相互作用の重要性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:24:23 GMT)
Wavelet-based Ramsey magnetometry enhancement of a single NV center in diamond [0.0] ダイヤモンド中の窒素空孔中心は固体ナノセンシングパラダイムを構成する。
本研究では,光子ショットノイズの抑制に適したウェーブレットデノジング法により強化された単一NV中心のラムゼー直流磁力計を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:25:49 GMT)
Vulnerability analysis of captcha using Deep learning [0.0] 本研究ではCAPTCHA生成システムの欠陥と脆弱性について検討する。
これを実現するために、我々は畳み込みニューラルネットワークであるCapNetを開発した。
提案プラットフォームは,数値およびアルファ数値CAPTCHAの両方を評価することができる
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:11:19 GMT)
Vi-Mistral-X: Building a Vietnamese Language Model with Advanced Continual Pre-training [0.0] vi-mistral-xはベトナム語用に特別に設計された革新的な大規模言語モデルである。
これはMistralアーキテクチャに基づいた、継続事前トレーニングのユニークな方法を利用している。
既存のベトナムのLLMを、テキスト分類、質問応答、テキスト生成など、いくつかの重要な領域で上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:14:13 GMT)
Using machine learning to find exact analytic solutions to analytically posed physics problems [0.0] 理論物理学における解析問題に対する機械学習の利用について検討する。
特に、記号回帰(SR)は、全体形が事前に分かっていない関数を用いてデータを適合させるツールとして、近年急速に進歩している。
我々は、最先端のSRパッケージを使用して、正確な解を見つける方法を実証し、未解決の物理学問題を解こうとする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:54:53 GMT)
Using Super-Resolution Imaging for Recognition of Low-Resolution Blurred License Plates: A Comparative Study of Real-ESRGAN, A-ESRGAN, and StarSRGAN [0.0] 本研究は主に、Real-ESRGAN、A-ESRGAN、StarSRGANの3つの超解像モデルを微調整する。
異なる超解像モデルを比較することにより、この課題に最も適したモデルを見つけることが期待されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:42:15 GMT)
Universal consistency of the $k$-NN rule in metric spaces and Nagata dimension. II [0.0] 我々は、この規則が関係の欠如においてそのような空間において強く普遍的に整合であることを示す。
1つの予想では、$k$-NN 則はデ・グルートの意味で有限次元を持つ距離空間において普遍的に一貫したものである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:25:52 GMT)
Uncertainty quantification for data-driven weather models [0.0] 本研究では,現在最先端の決定論的データ駆動気象モデルであるPangu-Weatherから確率的天気予報を生成するための不確実性定量化手法について検討・比較する。
具体的には,摂動によるアンサンブル予測を初期条件と比較し,予測の不確実性を定量化する手法を提案する。
欧州における選択された気象変数の中距離予測のケーススタディにおいて,不確実な定量化手法を用いてパング・ウェザーモデルを用いて得られた確率的予測は,有望な結果を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:07:51 GMT)
Trojan Playground: A Reinforcement Learning Framework for Hardware Trojan Insertion and Detection [0.0] 現在のハードウェアトロイジャン(HT)検出技術は、主に限られたHTベンチマークに基づいて開発されている。
本稿では,これらの欠点に対処する最初の自動強化学習(RL) HT挿入検出フレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:28:48 GMT)
Transition of Anticoncentration in Gaussian Boson Sampling [0.0] ガウスボソンサンプリング分布のモーメントを解析するためのグラフ理論フレームワークを開発した。
初期圧縮モードの数が光子数とともに十分に緩やかにスケールすると、アンチ集中が欠如していることが示される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:11:41 GMT)
The future of generative AI chatbots in higher education [0.0] 本研究では,高等教育機関(HEIs)における生成型AIチャットボットの将来的意味について検討する。
この発見は、管理タスクの合理化、学生の学習経験の向上、研究活動支援における、生成型AIチャットボットの変革の可能性を強調している。
しかし、学術的整合性の懸念、ユーザ入力の理解、リソース割り当てといった課題は、HEIにおける生成AIチャットボットの効果的な統合に重大な障害をもたらす。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:44:03 GMT)
The Second Moment of Hafnians in Gaussian Boson Sampling [0.0] アンチ濃度は出力確率の第2モーメント特性である。
我々はこれらの瞬間を研究するグラフ理論法を開発し、これを用いて反濃縮の遷移を同定する。
これらの結果から, 反集中化の推移を見極めることができ, さらに, 理想的な(エラーのない)デバイスに対して, 期待される線形クロスエントロピーベンチマークスコアを得ることができた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:00:00 GMT)
The ParlaSent Multilingual Training Dataset for Sentiment Identification in Parliamentary Proceedings [0.0] そこで本論文では,感傷的に手動で注釈付けした7言語による文のトレーニングデータセットを提案する。
さらに、政治科学応用のためのドメイン固有多言語トランスフォーマー言語モデルについても紹介する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:33:24 GMT)
The Mediterraneus Protocol: building an SSI native decentralised ecosystem of digital services [0.0] Mediterraneousプロトコルは、クリエイターが所有し、分散化されたデジタルアイデンティティとサービス購入の証明を提示することで、ユーザによって消費されるデジタルサービスのインターネットの開発を支援するように設計されている。
それはSSI(Self-Sovereign Identity)ネイティブであり、SSIモデルをその動作原則の中核に組み込んで、偽名の使用と既存のWeb3ソリューションの集中的なアクセス制御による制限を克服する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:14:10 GMT)
The Fermionic Entanglement Entropy of the Vacuum State of a Schwarzschild Black Hole Horizon [0.0] 我々は、シュワルツ子ブラックホール水平線のフェルミオンエンタングルメントエントロピーを、無限遠における観測者の正規化真空状態に対して解析する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:45:03 GMT)
Tailoring Polarization in WSe$_2$ Quantum Emitters through Deterministic Strain Engineering [0.0] 遷移金属ジアルコゲナイド(TMD)の量子エミッタは、光量子情報処理のための単一の光子を生成するための有望なプラットフォームとして登場した。
本稿では,ジセレナイド (WSe$$) 単層膜における生成量子エミッタの分極を決定論的に制御するためのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:46:59 GMT)
Symmetry Protected Topological Phases of Mixed States in the Doubled Space [0.0] 量子多体混合状態における対称性と位相の相互作用を研究する。
純粋な状態には見られない現象では、混合状態は平均対称性を示すことができる。
混合状態の自発的対称性破壊(SSB)のパターンについて検討した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:40:28 GMT)
Symmetrisation effects on the correlation time delay [0.0] 励起直交およびパラヘリウム状態の光イオン化における時間遅延に対する電子相関の寄与を解析した。
単純な推定は、イオン化確率振幅に基づいており、両状態の異なる形の反対称性が原理的に相関時間遅延の全く異なる値をもたらすことを示している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:15:31 GMT)
Super narrow peaks in excitation spectrum of alkali spin polarization: non-adiabatic case of spin dynamics [0.0] 非断熱スピンダイナミクスはアルカリ蒸気で満たされたガスセルで起こる。
スピン偏極のステッピング増加は、磁場の周波数が一定の値に等しい場合に起こる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:55:51 GMT)
Spontaneous disentanglement and thermalisation [0.0] 非線形項を追加することで、標準量子力学では禁止されている極限周期定常状態が可能になる。
この発見は、そのような極限周期定常状態の実験的な観察が、自然発散仮説を支持する重要な証拠となることを示唆している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:10:24 GMT)
Spatial-Temporal Graph Representation Learning for Tactical Networks Future State Prediction [0.0] 本稿では,戦術通信ネットワークのための空間時間グラフデコーダ(STGED)フレームワークを紹介する。
STGEDはグラフベースのアテンション機構を利用して、一連の通信ネットワーク状態を空間的に符号化する。
我々は,STGEDが時間ステップの異なる入力に対して,ベースラインモデルよりも大きなマージンで一貫した性能を示すことを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:27:17 GMT)
Sparse Implementation of Versatile Graph-Informed Layers [0.0] グラフノード上の回帰タスクに対処するために、グラフインフォームド(GI)層が導入された。
既存のGIレイヤの実装では、メモリの割り当てが密集しているため、効率が良くない。
本稿では, 隣接行列の空間性を利用して, メモリ使用量を大幅に削減する, GI層の疎実装を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:43:58 GMT)
Searching Search Spaces: Meta-evolving a Geometric Encoding for Neural Networks [0.0] 学習機能を持つ遺伝子は、直接符号化と手作り距離の両方に優れることを示す。
符号化がニューラルネットワークの特性に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:40:53 GMT)
Scattering theory of mesons in doped antiferromagnetic Mott insulators: Multichannel perspective and Feshbach resonance [0.0] 反強磁性(AFM)モット絶縁体をドーピングするホールにおける比較的高温の超伝導
近年、強結合と低ドーピングでは、基本的な1ホールと2ホールの中間子型成分(磁気ポーラロンと双極子対)がフェシュバッハ共鳴を実現する可能性が示唆されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:19:09 GMT)
Scalability of quantum error mitigation techniques: from utility to advantage [0.0] エラー軽減は量子コンピューティングを数百の量子ビットと数十のレイヤーのスケールに高めた。
しかし、量子コンピューティングの可能性を完全に活用するためには、より大きなスケール(ディーパー回路)が必要である。
ここでは、量子ユーティリティから量子優位への飛躍の道を開く3つの重要な結果を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:26:51 GMT)
Rounding near-optimal quantum strategies for nonlocal games to strategies using maximally entangled states [0.0] 特に、ほぼ完全な量子戦略は、小さなフロベニウスノルムにおける対応するBCS代数の近似表現であることを示す。
XOR の非局所ゲームに対して、準最適量子戦略はゲームに関連する対応する *-代数の近似表現であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:38:25 GMT)
Robustness Verifcation in Neural Networks [0.0] ニューラルネットワーク計算における形式的検証問題について検討する。
1つの疑問は、ネットワークが有効な出力を計算するような有効な入力が存在するかどうかである。
半線形環境では,この問題が克服可能であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:34:38 GMT)
Research Re: search & Re-search [0.0] 本研究では,深度優先アルゴリズムのABと最良優先アルゴリズムのSSSについて詳しく検討する。
これらのアルゴリズムの一般的な意見は、SSSはより効率的な探索の可能性をもっているが、その複雑な定式化と指数記憶の要求はそれを非現実的にしている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:08:57 GMT)
Reducing Large Language Model Bias with Emphasis on 'Restricted Industries': Automated Dataset Augmentation and Prejudice Quantification [0.0] 本稿では,大規模言語モデルを疎外するための新しい自動メカニズムを提案する。
さらに、バイアスを定量化するために、mb-indexとdb-indexという2つの新しいメトリクスを作成します。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:59:18 GMT)
Randomized measurement protocols for lattice gauge theories [0.0] 量子状態の発見のための対称性を考慮したランダム化計測手法を提案する。
これは、我々が提案する対称性を意識したランダム化測定スキームによって利用することができ、対称性-盲乱数化よりも明確な優位性が得られる。
対称性ブラインドランダム化測定プロトコルとは異なり、これらの後者のタスクは密度行列の完全な再構成によって対称性を学習することなく実行できる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:17:29 GMT)
Quantum stabilizer formalism for any composite system [0.0] まず、関連する背景と必要な基礎知識を紹介し、量子安定化器の定義とその量子系の進化と測定への応用について紹介する。
量子安定化器の定式化を、以前に定義されていない量子ビット量子と量子ビット量子に拡張し、任意の合成系の量子安定化器をさらに定義しようと試みる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:21:07 GMT)
Quantum nonlinear optics on the edge of small lattice fractional quantum Hall fluids [0.0] 格子分数量子ホール液体の外部電位に対するエッジモードの量子力学について検討した。
非線形キラルルッティンガー液体理論は, 格子状小領域においても, 定量的に正確な説明を提供することを示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:21:37 GMT)
Prospects for the determination of fundamental constants with beyond-state-of-the-art uncertainty using molecular hydrogen ion spectroscopy [0.0] 我々は、より大きな量子数を持つレベル間の実験的な遷移周波数を提供することにより、質量比の精度がどのように向上するかを分析する。
リドベルク定数と電荷半径について、4から11の因子による改善が予想される。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:43:29 GMT)
Phase transition of a continuous-time quantum walk on the half line [0.0] 量子ウォークは数学におけるランダムウォークの量子アナログと呼ばれる。
量子コンピュータの量子情報における量子アルゴリズムとして研究されている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:21:29 GMT)
Overhead-constrained circuit knitting for variational quantum dynamics [0.0] 回路編み込みを用いて、大きな量子システムを小さなサブシステムに分割し、それぞれを別々のデバイスでシミュレートすることができる。
長径ゲートを切断することで回路深度を低減するために,同じ手法が利用できることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:15:54 GMT)
Out-of-Distribution Detection Using Peer-Class Generated by Large Language Model [0.0] アウト・オブ・ディストリビューション(OOD)検出は、マシンラーニングモデルの信頼性とセキュリティを確保するための重要なタスクである。
本稿では,ODPCと呼ばれる新しい手法を提案し,大規模言語モデルを用いてOODピア・セマンティクスのクラスを生成する。
5つのベンチマークデータセットの実験により,提案手法は最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:04:05 GMT)
Orthosymplectic diagonalization in Williamson's theorem [0.0] 行列を直交行列で対角化するのに必要で十分である任意の 2n 倍 2n$ 実対称正定行列に条件を与える。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:45:13 GMT)
Optimal function estimation with photonic quantum sensor networks [0.0] 量子ビットセンサにそれぞれ線形に結合した未知の局所パラメータの解析関数を最適に測定する。
特に、局所位相シフトまたは二次変位の線形関数を推定する際に、達成可能な平均二乗誤差の下位境界を導出する。
二次変位に対しては、任意の線型函数の場合に有界を拡張する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:34:29 GMT)
Open Access NAO (OAN): a ROS2-based software framework for HRI applications with the NAO robot [0.0] 本稿では,ユナイテッド・ロボティクス・グループによって開発された共通NAOロボットの第6バージョンを用いて,HRI実験のための新しいソフトウェアフレームワークを提案する。
著者らは、NAO上でROS2を実行して、メーカーが提供するAPIに依存しないフレームワークを開発する能力を利用していた。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:13:39 GMT)
One Axis Twisting (OAT) spin squeezing for metrology [0.0] スピンスクイージングは,OATスクイージングにおけるデコヒーレンスの存在下においても,メロジカルな精度向上に有効であることを示す。
我々は, 北川上田OATスクイーズ式を有限分極に拡張する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:45:09 GMT)
On unitary time evolution out of equilibrium [0.0] 局所作用素の一点函数が非平衡状態の拡大の振動に依存することを示す。
小型のクエンチの場合、一般結果の構造が摂動的に知られていることを単純化し、再現する方法を示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:30:01 GMT)
On the structure of Completely Reducible States [0.0] バイパルタイト状態に対する完全な再現性は、内外絡み理論のいくつかの定理を証明するために用いられた。
これまでのところ、この性質を持つことが証明されたのは3種類のバイパルタイト状態のみである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:06:49 GMT)
On the choice of non-linear terms in blocking cats states by energy conservations [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
有限温度で磁化を観測するためには、エネルギー保存による重畳をブロックする非線形項を加える必要があった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:03:03 GMT)
On scrambling, tomperature and superdiffusion in de Sitter space [0.0] デ・シッターは微分的に平衡するほとんどの物理系とは異なり、超拡散的に平衡する。
また、熱力学温度と逆相関時間との相互作用についても論じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:33:37 GMT)
Nonlocality of the energy density of a spontaneously emitted single-photon from a Hydrogen atom [0.0] 我々は水素原子の自然崩壊によって放出される単一光子の空間的非局所性を分析する。
量子化された電磁場と原子との最小結合を用いて、単一光子のみが生成されるという仮定の下で光子の状態を計算する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:15:18 GMT)
Nonequilibrium quantum heat transport between structured environments [0.0] 本研究では, スピンボソン型モデルにおける非平衡熱輸送の解析に, 動きの階層式を適用した。
熱電流はシステムバス結合の弱いときに劇的に変化することがわかった。
本分析は,ナノスケール系における熱輸送の制御機構について述べる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:20:12 GMT)
Network bottlenecks and task structure control the evolution of interpretable learning rules in a foraging agent [0.0] 我々は, メタラーニングを, 単純な報酬変調型可塑性規則の進化的最適化により研究した。
制約のないメタラーニングが多様な可塑性規則の出現につながることを示す。
その結果, 可塑性規則のメタラーニングは様々なパラメータに非常に敏感であり, この感度は生物学的ネットワークで見られる学習規則に反映している可能性が示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:57:02 GMT)
Multimodal Chaptering for Long-Form TV Newscast Video [0.0] 本手法は、凍結ニューラルネットワークと訓練されたLSTMネットワークを含む2段階のプロセスを通して、オーディオと視覚の両方を統合している。
提案手法は,フランスのテレビ放送局TF1から平均41分間の映像を500本以上収録した多種多様なデータセットを用いて評価した。
実験結果から, このイノベーティブ・フュージョン・ストラテジーは技術性能の状態を達成し, 90%のIoUでは82%の精度で高い精度が得られることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:39:41 GMT)
Measurement-only dynamical phase transition of topological and boundary orders in toric code and gauge-Higgs models [0.0] 本研究では, トリック符号モデルにおける時間的ダイナミクスとトポロジカル秩序状態の運命について, プロジェクティブな計測専用回路を通しての進化について検討する。
ヒッグス、閉じ込められ、分解された相は、回路による時間進化に存在している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:23:28 GMT)
Machine learning approach to detect dynamical states from recurrence measures [0.0] 本研究では,この研究のために,ロジスティック回帰,ランダムフォレスト,サポートベクトルマシンの3つの機械学習アルゴリズムを実装した。
トレーニングとテストのために、標準的な非線形力学系から合成データを生成する。
トレーニングされたアルゴリズムは、2つの変光星 SX Her と AC Her の動的状態の予測に成功している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:11:26 GMT)
Machine Learning-based Layer-wise Detection of Overheating Anomaly in LPBF using Photodiode Data [0.0] 本研究は,光ダイオードセンサデータを用いた過熱異常の検出に焦点を当てた。
光ダイオードセンサーは、プロセスのダイナミクスと熱履歴を反映して、溶融プールから高周波データを収集することができる。
提案手法は,フォトダイオードセンサデータを用いて過熱異常を階層的に検出する機械学習フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 01:12:44 GMT)
Machine Learning Optimized Approach for Parameter Selection in MESHFREE Simulations [0.0] 従来のメッシュベースのアプローチに代わる魅力的な代替手段として、メッシュフリーシミュレーション手法が登場している。
機械学習(ML)とFraunhoferのMESHFREEソフトウェアを組み合わせた研究の概要について概説する。
本稿では,MESHFREEシミュレーションデータに能動的学習,回帰木を用いたML最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:29:59 GMT)
Local Approximation of Secrecy Capacity [0.0] 圧縮速度と秘密保持制約を考慮した少量の情報を効率よく送信するシナリオについて検討する。
情報理論問題を線形代数問題に変換し、秘密性が達成可能な摂動確率分布を得る。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:07:13 GMT)
Linearized analysis of dissipative Two Axis Counter Twisting (TACT) squeezing for Metrology [0.0] 脱分極ノイズTACTは、分極が小さくノイズのないTACTと等価である。
雑音に対する信号の指数的な利得は、スクイーズ強度と脱分極率の比に比例する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:35:42 GMT)
Leveraging Linguistically Enhanced Embeddings for Open Information Extraction [0.0] オープン情報抽出(OIE)は自然言語処理における構造化予測タスクである
私たちは、OIE用のSeq2Seq PLMで言語機能を利用する最初の人です。
私たちの作業は、任意のニューラルなOIEアーキテクチャに対して、PLMと言語機能の両方から重要なパフォーマンス向上を提供することができます。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:18:48 GMT)
Learning to Predict Short-Term Volatility with Order Flow Image Representation [0.0] 本論文は、注文フロー情報を用いてBitcoin価格の短期的な変動を予測するという課題に対処する。
本稿では,一定時間間隔(スナップショット)で順序フローデータを画像に変換する手法を提案する。
次にイメージを使用して、単純な3層畳み込みニューラルネットワーク(CNN)と、より高度なResNet-18とConvMixerの両方をトレーニングする。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:33:35 GMT)
Large language models can help boost food production, but be mindful of their risks [0.0] チャットGPTスタイルの大規模言語モデル(LLM)は、農業効率を高め、イノベーションを推進し、より良い政策を伝える可能性がある。
しかし、農業の誤報、大量の農夫データの収集、農業雇用への脅威といった課題は重要な懸念事項である。
LLMランドスケープの急速な進化は、農業政策立案者がフレームワークやガイドラインについて慎重に考える必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:19:25 GMT)
Joint Person Identity, Gender and Age Estimation from Hand Images using Deep Multi-Task Representation Learning [0.0] 画像から人物の身元、性別、年齢を共同で推定するマルチタスク表現学習フレームワークを提案する。
公開可能な1kハンドデータセット上で,畳み込みベースと変圧器ベースの両方のディープラーニングアーキテクチャの評価と比較を行う。
実験により, 身元だけでなく, 被疑者の性別や年齢などの属性を手動画像から効率的に推定できることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:39:28 GMT)
Interaction-induced transition in quantum many-body detection probability [0.0] 本稿では,量子多体検出確率(QMBDP)の概念を紹介する。
いくつかのハミルトンパラメータをチューニングすると、QMBDP $approx 1$のレジームから、QMBDP $approx 0$のレジームへの急激な遷移が存在することを示す。
これは測定誘起遷移ではなく、多体スペクトルの特定のタイプのギャップの開口を反映する非平衡遷移である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 21:03:30 GMT)
Inserting Faces inside Captions: Image Captioning with Attention Guided Merging [0.0] 画像キャプションタスク用のデータセットであるAstroCaptionsを紹介する。
キャプション内に識別された人物の名前を挿入するための新しいポストプロセッシング手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 08:38:25 GMT)
Hyacinth6B: A large language model for Traditional Chinese [0.0] Hyacinth6B は LLM のコア機能を活用するために開発された。
トレーニング手法は、LoRA法を用いてパラメータ効率の良い微調整を行う。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:37:59 GMT)
How scanning probe microscopy can be supported by Artificial Intelligence and quantum computing [0.0] 我々は,Scanning Probe Microscopy測定をサポートする可能性に注目し,人工知能と量子コンピューティングの応用を強調した。
人工知能は、日常的な作業における実験プロセスの自動化に有効であることが判明した。
人工知能ベースのアルゴリズムと量子コンピューティングの組み合わせは、走査プローブ顕微鏡の実用性を高める大きな可能性を秘めている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:22:02 GMT)
How Gender Interacts with Political Values: A Case Study on Czech BERT Models [0.0] このケーススタディは、チェコの事前訓練エンコーダの政治的バイアスに焦点を当てている。
チェコ語は性的な言語であるため、調査における男女の反応と文法的な性別がどのように一致しているかを測定する。
モデルが値駆動推論に従って文の確率を割り当てていないことが分かる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 11:30:45 GMT)
Hey, Teacher, (Don't) Leave Those Kids Alone: Standardizing HRI Education [0.0] 本稿では,この分野の学際的な性質を十分に理解した学部生に必要な重要な要素について概説する。
それは、あらゆる異なる学習の好みを満たすために、理論的および実験的な構成要素でコースを作成することの重要性を強調している。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:01:20 GMT)
Hardware-Efficient Bosonic Quantum Computing with Photon-loss Detection Capability [0.0] 本稿では,任意のX,Z回転と制御位相ゲートを実装可能な,単純でハードウェア効率の良いボソニック02誤り検出符号を提案する。
我々のコードは単一光子損失を検出でき、短期量子コンピューティングにおいて頻繁に使用されるハードウェア効率のアンサッツ量子回路をシミュレートすることにより、重大なエラー抑制を観測する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:10:09 GMT)
HAE-RAE Bench: Evaluation of Korean Knowledge in Language Models [0.0] HAE-RAE Benchは,韓国の文化的・文脈的深度に欠けるモデルに挑戦するためのデータセットである。
このデータセットは、語彙、歴史、一般的な知識、読み理解の4つの領域にまたがる6つの下流タスクを含んでいる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:56:48 GMT)
General criterion for non-Hermitian skin effects and Application: Fock space skin effects in many body systems [0.0] 非エルミート皮膚効果は単一粒子系において十分に確立されているが、一般系の適切な特性は解明されている。
線形作用素によって発展する任意の有限次元系に対して作用する非エルミート皮膚効果の一般的な基準を提案する。
この基準を適用して、Fock空間の皮膚効果を再現する新しいタイプの非エルミート皮膚効果を多体系で発見する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:44:18 GMT)
Fermionic wave packet scattering: a quantum computing approach [0.0] 本稿では,デジタル量子コンピュータ上でのウェーブパケットの進化を通じて,観測対象の期待値を効率的に取得する方法を示す。
さらに、我々はIBMの量子ハードウェア上で小さなデモを行い、我々の手法が現在の量子デバイスと短期量子デバイスに適していることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:40:41 GMT)
Extremality of stabilizer states [0.0] 安定化状態の極端性を調べ、すべての$n$-qubit/qudit状態の空間におけるそれらの例外的な役割を明らかにする。
その結果,安定化状態の顕著な情報理論的性質が明らかになった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:30:59 GMT)
Exploiting nonclassical motion of a trapped ion crystal for quantum-enhanced metrology of global and differential spin rotations [0.0] イオンの集合運動の圧縮状態に結合することで、捕捉されたイオン配列における非古典的スピン状態の生成の可能性について理論的に検討する。
生成したスピン状態の相関は、スピンのサブアンサンブルの大域的あるいは微分的回転を量子的に検出するために調整することができる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:41:38 GMT)
Exact solution for the collective non-Markovian decay of two fully excited quantum emitters [0.0] 1次元単一バンド導波路の隣り合う単位セルに位置する2つの励起量子エミッタの正確な解を示す。
我々は非線形量子光学現象の複雑さに光を当てる多粒子オープン量子系の解析法を開発した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:54:45 GMT)
Entanglement phase transitions in non-Hermitian Kitaev chains [0.0] ロスによって引き起こされる絡み合い遷移は、非エルミート的トポロジカル超伝導体で見られる。
システムが異なる位相相間で切り替わる際に、対数法則と対数法則の対数法則の対数法則を同定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:16:37 GMT)
Enhanced Face Authentication With Separate Loss Functions [0.0] 本プロジェクトの全体的な目的は、顔認識を用いて携帯電話やアプリケーションをアンロックする際の顔認識システムの提案と開発である。
システムには、顔検出、顔認識、顔の偽造、閉鎖眼の分類の4つの異なるアーキテクチャが含まれる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:23:49 GMT)
Engineering 3D Floquet codes by rewinding [0.0] フロッケ符号は動的に生成された論理量子ビットを持つ量子誤り訂正符号である。
我々は、トポロジカルな励起の凝縮の観点から測定の解釈を利用する。
再巻き戻しは、所望の瞬時安定化群を得るのに有利であることを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 22:29:54 GMT)
Elevating Software Quality in Agile Environments: The Role of Testing Professionals in Unit Testing [0.0] テストはソフトウェア開発プロセスにおいて不可欠な品質活動です。
本報告では, 産業環境での単体テストにおけるテストエンジニアの関与について考察する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 00:41:49 GMT)
Efficient exploration of high-Tc superconductors by a gradient-based composition design [0.0] 組成の勾配に基づく最適化による材料設計手法を提案する。
これは、徹底的なデータベース検索と条件付き生成モデルという、従来の手法の限界を克服する。
本手法は, 有効で広範囲な探索と新しい制約への適応性を実現し, 材料設計を著しく向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:23:17 GMT)
Efficient argument classification with compact language models and ChatGPT-4 refinements [0.0] 本稿では,議論マイニングにおける深層学習モデルの比較研究について述べる。
本稿では,BERTアーキテクチャに基づくアンサンブルモデルと,微調整モデルとしてのChatGPT-4について述べる。
以上の結果から,BERT+ChatGPT-4は他のTransformerベースモデルやLSTMベースモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 16:24:10 GMT)
Effects of the measurement power on states discrimination and dynamics in a circuit-QED experiment [0.0] 超伝導弱リンクにおけるマターライク'の部分とAndreevレベルが一致する回路QED実験において、キャビティを大きな光子数で駆動する効果について検討する。
キャビティによって継承される非線形性は,その結合から弱いリンクへの結合が,状態判別と光子数校正にどのように影響するかを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 10:15:17 GMT)
Dynamic Vulnerability Criticality Calculator for Industrial Control Systems [0.0] 本稿では,動的脆弱性臨界計算機を提案する革新的な手法を提案する。
本手法は, 環境トポロジの分析と, 展開されたセキュリティ機構の有効性を包含する。
本手法では,これらの要因を総合的なファジィ認知マップモデルに統合し,攻撃経路を組み込んで全体の脆弱性スコアを総合的に評価する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:48:47 GMT)
Document Author Classification Using Parsed Language Structure [0.0] 統計的自然言語を用いて抽出した文法構造を用いて著者検出の新たな可能性を探る。
本稿では,一組の「保護テキスト」の文法的構造に基づく著者分類を検証し,概念実証を行う。
統計的自然言語から抽出されたいくつかの特徴は、任意のレベルからある深さのすべての部分木、ある深さのルート木、スピーチの一部、およびパースツリーの音声部分である。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:32:24 GMT)
Dipole-dipole-interaction-induced entanglement between two-dimensional ferromagnets [0.0] 均一なマグノンモードの結合は4つのスクイーズパラメータを用いて表現できることを示す。
無限大の2次元強磁性体の場合、双極子-双極子相互作用は大きな長距離絡みを生じさせないと予測する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 07:34:02 GMT)
D-YOLO a robust framework for object detection in adverse weather conditions [0.0] ヘイズ、雪、雨などの逆の気象条件は、画像品質の低下を招き、深層学習に基づく検知ネットワークの性能低下を招きかねない。
画像復元とオブジェクト検出のタスクをよりうまく統合するために,注目機能融合モジュールを備えた二重経路ネットワークを設計した。
我々はまた,検出ネットワークにヘイズフリーな機能を提供するサブネットワークを提案し,特に,明瞭な特徴抽出サブネットワークと検出ネットワーク間の距離を最小化することにより,検出ネットワークの性能を向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 02:38:44 GMT)
Contemplating Secure and Optimal Design Practices for Information Infrastructure From a Human Factors Perspective [0.0] システムが開発されている場合、セキュリティが優先されることはめったにない。
セキュアな設計プラクティスは、最小限の要件とユーザフレンドリさを満たすために、機能(すなわち適切な設計)間でバランスをとるべきである。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:11:37 GMT)
Considerations in the use of ML interaction potentials for free energy calculations [0.0] 機械学習ポテンシャル(MLP)は、分子のエネルギーと自由エネルギーのランドスケープを正確にモデル化する能力を提供する。
トレーニングデータ中の集合変数(CV)の分布が,システムの自由エネルギー面(FES)を決定する際の精度に与える影響について検討した。
ブタンの発見から,キーFES領域のトレーニングデータカバレッジにより,CV分布にかかわらずモデルの精度が保証されることがわかった。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 19:49:21 GMT)
Conceptualizing predictive conceptual model for unemployment rates in the implementation of Industry 4.0: Exploring machine learning techniques [0.0] この研究は、予測概念モデルを通じて機械学習技術を活用するという概念を掘り下げるものである。
発展途上国の失業率に影響を及ぼす経済的・社会的要因を決定するため、文献を徹底的に調査した。
先進国における失業に寄与する要因を機械学習の手法を用いて解決可能な予測概念モデルを開発した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 12:14:00 GMT)
Beyond Specialization: Assessing the Capabilities of MLLMs in Age and Gender Estimation [0.0] 現在最も強力なMLLM(ShareGPT4V, ChatGPT, LLaVA-Next)の能力を比較する。
この比較は、参加モデルの強みと弱みに関する興味深い結果と洞察をもたらした。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:05:45 GMT)
Automated Extraction and Maturity Analysis of Open Source Clinical Informatics Repositories from Scientific Literature [0.0] 本研究では、arXivにインデックスされた学術論文からGitHubリポジトリURLを体系的に抽出することにより、ギャップを埋める自動化手法を提案する。
当社のアプローチでは、関連論文に対するarXiv APIのクエリ、抽出したGitHub URLのクリーニング、GitHub APIによる包括的なリポジトリ情報の取得、スター、フォーク、オープンイシュー、コントリビュータなどの定義されたメトリクスに基づいてリポジトリの成熟度を分析しています。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:06:51 GMT)
Asymptotic generalization error of a single-layer graph convolutional network [0.0] 属性ブロックモデルにより生成されたデータに基づいて学習した単一層グラフ畳み込みネットワークの性能を予測する。
我々は,高信号対雑音比の限界について検討し,GCNの収束率を詳細に検討し,一貫性はあるものの,いずれの場合においてもベイズ最適値に達しないことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 15:08:27 GMT)
Applicability of QKD: TerraQuantum view on the NSA's scepticism [0.0] 最近の出版物では、NSAはQKDは「量子耐性」暗号より劣っており、使用を推奨していないと主張している。
ここでは、量子セキュリティの評価に対するこのような懐疑的なアプローチが、十分に正当化されていないことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:44:50 GMT)
Analysing heavy-tail properties of Stochastic Gradient Descent by means of Stochastic Recurrence Equations [0.0] 近年の研究では、グラディエント蛍光(SGD)の重いテール特性が再帰の確率的枠組みで研究されている。
我々は、引用された論文のいくつかのオープンな質問に答え、既約確率 (i-p) 行列の理論を適用して結果を拡張する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 13:39:19 GMT)
Analysing and Organising Human Communications for AI Fairness-Related Decisions: Use Cases from the Public Sector [0.0] 多様な利害関係者間のコミュニケーション問題は、AIアルゴリズムの誤解釈と誤用につながる可能性がある。
我々は,公共部門におけるアルゴリズムシステムに取り組む実践者とのインタビューを行う。
公平性に関連する人間の決定を下すコミュニケーションプロセスの鍵となる要素を同定する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:20:42 GMT)
Analysing Guarantees in Australian Senate Outcomes [0.0] STV(Single Transferable Vote)は、6つの州と2つの領域で76議席のオーストラリア上院議員を選出するために使用される。
これらの8つのSTVコンテストは、投票スキャナー、手動データ入力、集計ソフトウェアを組み合わせて数えられる。
選挙の夜には、鋳型投票のいくつかの特性が手で決定される。
本報告では, 個々の候補者の選好傾向など, 正確であると仮定した場合は, 選挙結果の一部となるような特性があるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 03:19:51 GMT)
Advancing 6D Pose Estimation in Augmented Reality -- Overcoming Projection Ambiguity with Uncontrolled Imagery [0.0] 本研究では,拡張現実(AR)における正確な6次元ポーズ推定の課題に対処する。
本稿では,z軸変換と焦点長の推定を戦略的に分解する手法を提案する。
この手法は6次元ポーズ推定プロセスの合理化だけでなく、AR設定における3次元オブジェクトのオーバーレイの精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:22:22 GMT)
Adaptive Ensembles of Fine-Tuned Transformers for LLM-Generated Text Detection [0.0] 大規模言語モデル (LLM) は、多種多様なテキストコンテンツを生成するのに人間のように習熟している。
これまでの研究では、主に分散データセット上の単一モデルをテストしてきた。
分布内および分布外の両方のデータセット上で、トランスフォーマーをベースとした5つのモデルを検証した。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 06:38:13 GMT)
Accurate heat currents via reorganised master equation [0.0] 我々は「再構成されたマスター方程式」が熱電流の非常に正確な推定をいかに生み出すかを示す。
特に、そのようなマスター方程式は熱電流の計算において「非再編成」の方程式よりも優れている。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 17:36:31 GMT)
Acceptable solutions of the Schrodinger radial equation for a particle in a two-dimensional central potential [0.0] 中心ポテンシャルにおける粒子の定常状態は、通常、角部Phiと放射部Rの積とみなす。
R が特異であれば、完全波動関数 psi = Phi R はフルシュロディンガー方程式を満たすことができないことを示す。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 09:08:56 GMT)
Absence of a dissipative quantum phase transition in Josephson junctions: Theory [0.0] RSJの超伝導絶縁量子相転移の痕跡は見つかっていない。
紫外線遮断のない抵抗体は、常に完全に局所的な位相を生じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 20:10:15 GMT)
A Secure Quantum Key Distribution Protocol Using Two-Particle Transmission [0.0] Unextendible Product Bases (UPB) は、その固有の不明瞭さのため、量子暗号において約束を守る。
本稿では, UPBを用いて遠隔者間の量子鍵を確立するプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 14:33:17 GMT)
A Noisy Approach to Intrinsically Mixed-State Topological Order [0.0] 得られた混合状態は内在的に混合状態位相秩序(imTO)を示すことができることを示す。
我々は、デコヒーレント状態は物質の真の混合状態量子相を表すと論じる。
論文参考訳(メタデータ) (Wed, 20 Mar 2024 18:00:01 GMT)