Learning Hierarchical Color Guidance for Depth Map Super-Resolution [168.1] 深度マップ超解像(DSR)を実現する階層カラー誘導ネットワークを提案する。
一方、低レベルのディテール埋め込みモジュールは、奥行き特徴の高周波カラー情報を補うように設計されている。
一方,再建過程における意味的一貫性を維持するため,高レベルの抽象的ガイダンスモジュールが提案されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:44:46 GMT)
Self-Alignment with Instruction Backtranslation [162.0] 本稿では,人文テキストに対応する命令を自動ラベル付けすることで,高品質な命令従言語モデルを構築する方法を提案する。
我々の手法は命令バックトランスレーションと呼ばれ、少量のシードデータと与えられたWebコーパスに基づいて微調整された言語モデルから始まります。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:22:46 GMT)
StyleGaussian: Instant 3D Style Transfer with Gaussian Splatting [141.1] StyleGaussianは、新しい3Dスタイル転送技術である。
任意の画像のスタイルを毎秒10フレームの3Dシーンに即時転送できる(fps)。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:44:52 GMT)
You'll Never Walk Alone: A Sketch and Text Duet for Fine-Grained Image
Retrieval [127.7] 事前学習したCLIPモデルを用いて,スケッチとテキストを効果的に組み合わせた新しい構成性フレームワークを提案する。
本システムは, 合成画像検索, ドメイン転送, 微粒化生成における新しい応用にまで拡張する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:27:18 GMT)
Text-to-Image Diffusion Models are Great Sketch-Photo Matchmakers [127.7] 本稿では,ゼロショットスケッチに基づく画像検索(ZS-SBIR)のためのテキスト・画像拡散モデルについて検討する。
スケッチと写真の間のギャップをシームレスに埋めるテキストと画像の拡散モデルの能力。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:02:03 GMT)
OPERA: Alleviating Hallucination in Multi-Modal Large Language Models
via Over-Trust Penalty and Retrospection-Allocation [124.9] OPERA(Over-trust PenaltyとRetrospection-Allocation戦略に基づく新しいMLLM復号法)を提案する。
私たちのアプローチは、ほとんどの幻覚は自己注意行列の知識集約パターンと密接に結びついているという興味深い観察から始まります。
この観察に基づいて、OPERAは、ビーム探索復号時にモデルロジットにペナルティ項を導入し、オーバートラスト問題を緩和する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:59:46 GMT)
Image Super-Resolution with Text Prompt Diffusion [123.9] 画像SRにテキストプロンプトを導入し、劣化前の情報を提供する。
PromptSRは、事前訓練された言語モデル(例えば、T5やCLIP)を使用して復元を強化する。
実験により、テキストプロンプトをSRに導入すると、合成画像と実世界の画像の両方で優れた結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:14:51 GMT)
Knowledge Distillation of Large Language Models [123.4] 知識蒸留(KD)は,大規模言語モデル(LLM)の高い計算要求を低減させる,有望な手法である。
より小さな言語モデルにLPMを蒸留するKD手法を提案する。
提案手法は,120Mから13Bのパラメータを持つ異なるモデルファミリに対してスケーラブルである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:15:19 GMT)
Exploring Safety Generalization Challenges of Large Language Models via
Code [123.1] 本稿では,自然言語入力をコード入力に変換するフレームワークであるCodeAttackを紹介する。
調査によると、CodeAttackは全モデルの80%以上の安全ガードレールを一貫してバイパスしている。
CodeAttackと自然言語の間の配布ギャップが大きくなると、安全性の一般化が弱まる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:55:38 GMT)
Take a Step Back: Evoking Reasoning via Abstraction in Large Language
Models [122.2] Step-Back Promptingは、LLMが抽象化を行い、特定の詳細を含むインスタンスから高レベルの概念と第一原則を導出することを可能にする。
推論を導くために概念と原則を用いることで、LLMはソリューションへの正しい推論パスに従うことで、その能力を大幅に向上します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:38:27 GMT)
It's All About Your Sketch: Democratising Sketch Control in Diffusion
Models [120.5] 本稿では,拡散モデルにおけるスケッチの可能性を明らかにするとともに,生成型AIにおける直接スケッチ制御の詐欺的可能性に対処する。
私たちはこのプロセスを民主化し、アマチュアのスケッチが正確なイメージを生成できるようにします。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:05:25 GMT)
Training Small Multimodal Models to Bridge Biomedical Competency Gap: A
Case Study in Radiology Imaging [114.4] バイオメディカル・コンピテンシー・ギャップを橋渡しするオープンソース小型マルチモーダル・モデル(SMM)の訓練について検討する。
LLaVA-Radは高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:12:02 GMT)
A Survey on Large Language Model based Autonomous Agents [107.8] 大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:51:35 GMT)
Object Recognition as Next Token Prediction [105.3] オブジェクト認識を次のトークン予測として提案する。
その考え方は、画像埋め込みからフォームラベルへのテキストトークンの自動回帰予測を行う言語デコーダを適用することである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:39:31 GMT)
Advancing Differential Privacy: Where We Are Now and Future Directions for Real-World Deployment [100.2] 差分プライバシ(DP)分野における現状と現状の方法論の詳細なレビューを行う。
論文のポイントとハイレベルな内容は,「認知プライバシ(DP:次のフロンティアへの挑戦)」の議論から生まれた。
この記事では、プライバシの領域におけるアルゴリズムおよび設計決定の基準点を提供することを目標とし、重要な課題と潜在的研究の方向性を強調します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:48:59 GMT)
DreamControl: Control-Based Text-to-3D Generation with 3D Self-Prior [97.7] 本稿では,DreamControlという2段階の2Dリフトフレームワークを提案する。
制御ベースのスコア蒸留による微粒なオブジェクトを生成する。
DreamControlは、幾何学的一貫性とテクスチャ忠実度の両方の観点から、高品質な3Dコンテンツを生成することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:47:06 GMT)
Multi-modal Auto-regressive Modeling via Visual Words [96.3] 本稿では,視覚的特徴を大規模多モードモデルの語彙上の確率分布にマッピングする視覚的単語の概念を提案する。
さらに、LMM内の意味空間における視覚的特徴の分布と、視覚情報を表現するためにテキスト埋め込みを使用することの可能性について検討する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:58:52 GMT)
Two-stage LLM Fine-tuning with Less Specialization and More
Generalization [93.1] 本稿では,Model Tuning (ProMoT) を用いた Prompt Tuning を提案する。
ProMoTは、タスク固有のフォーマット学習を、最初はプロンプトチューニングを行い、次にこのソフトプロンプトでモデル自体を微調整することで、追加的で取り外し可能なパラメータにオフロードする。
ProMoTは、微調整タスクと意味的に関連するコンテキスト内学習タスクの一般化を強化することもできる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:05:53 GMT)
Continual All-in-One Adverse Weather Removal with Knowledge Replay on a
Unified Network Structure [92.9] 現実の応用では、悪天候による画像の劣化は常に複雑で、日や季節によって異なる気象条件で変化する。
我々は,ネットワーク構造を統一した上で,効果的な知識再生(KR)を実現するための新しい連続学習フレームワークを開発した。
連続学習における複数の退化を伴う画像復元作業の特徴を考察し、異なる退化に関する知識を共有・蓄積することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:50:57 GMT)
Lumen: Unleashing Versatile Vision-Centric Capabilities of Large
Multimodal Models [92.7] 本稿では,多目的視覚中心機能拡張を備えた大規模マルチモーダルモデルであるLumenという新しいLMMアーキテクチャを提案する。
我々はLMMの知覚能力の学習をタスク非依存およびタスク特化段階に分離する。
LumenはCOCO検出ベンチマークで既存のLMMベースのアプローチをはるかに上回り、視覚的なタスクにシームレスなスケーラビリティを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:13:45 GMT)
From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.6] DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:32:23 GMT)
Q-SLAM: Quadric Representations for Monocular SLAM [89.1] モノクラーSLAMは、3Dジオメトリを正確にモデル化するという課題に長い間取り組んできた。
ニューラルラジアンス場(NeRF)をベースとしたモノキュラーSLAMの最近の進歩は、将来性を示している。
本稿では,2次形式のレンズを通して体積表現を再現する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:27:30 GMT)
WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work
Tasks? [85.1] 本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。
WorkArenaは、広く使用されているServiceNowプラットフォームに基づく29のタスクのベンチマークである。
BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:58:45 GMT)
PreRoutGNN for Timing Prediction with Order Preserving Partition: Global
Circuit Pre-training, Local Delay Learning and Attentional Cell Modeling [84.3] 本稿では,事前のタイミング予測に対する2段階のアプローチを提案する。
まず、回路網リストからグローバルグラフ埋め込みを学習するグラフオートエンコーダを事前学習するためのグローバル回路トレーニングを提案する。
第2に、GCN上のメッセージパッシングのための新しいノード更新方式を、学習したグラフ埋め込みと回路グラフのトポロジ的ソートシーケンスに従って使用する。
21個の実世界の回路の実験では、スラック予測のための新しいSOTA R2が0.93で達成され、以前のSOTA法では0.59をはるかに上回っている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:59:45 GMT)
Slovo: Russian Sign Language Dataset [83.9] 本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:45:02 GMT)
GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition? [82.4] 本稿では,ゼロショット視覚認識タスクにおけるGPT-4の言語的・視覚的能力の評価に焦点を当てる。
我々は、画像、ビデオ、点群にわたるGPT-4の性能を評価するための広範な実験を行った。
言語記述が充実したGPT-4はゼロショット認識を著しく改善した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:07:14 GMT)
Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [82.0] この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:28:00 GMT)
Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM [81.2] 大規模言語モデル(LLM)を学習し,複数の専門分野の能力を持つための効率的な手法について検討する。
当社の手法はBブランチ・トレイン・MiX (BTX) という種モデルから始まり, 恥ずかしいほど並列な方法で専門家を訓練する。
BTXは、ルーティングを学ぶためのMoEの微調整段階を持たないブランチ・トレイン・マージ法と、エキスパートの非同期訓練を省略するスパース・アップサイクリングという2つの特殊なケースを一般化している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:54:58 GMT)
Convolutional Neural Networks on Graphs with Chebyshev Approximation,
Revisited [80.3] ChebNetは、Chebyshevsを使ってスペクトルグラフの畳み込みを近似する初期の試みの1つである。
GCNはChebNetを単純化し、最初の2つのChebyshevしか利用せず、実際のデータセットでは依然としてパフォーマンスが優れている。
本稿では,Chebyshevに基づく新しいGNNモデルであるChebNetIIを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:27:38 GMT)
A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing
Objects in 3D Scenes [80.2] 3Dシークエンスキャプションは、3Dシーンの詳細な説明を作成することを目的とした、視覚言語によるブリッジングタスクである。
2次元の視覚的キャプションと比較して、現実世界の表現が密接なため、大きな可能性と課題が提示される。
既存手法の人気と成功にもかかわらず、この分野の進歩を要約した総合的な調査は乏しい。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:04:08 GMT)
pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.7] $textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:46:54 GMT)
Chronos: Learning the Language of Time Series [79.5] Chronosは事前訓練された確率的時系列モデルのためのフレームワークである。
クロノスモデルでは,様々な領域の時系列データを利用して,未知の予測タスクにおけるゼロショット精度を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:53:54 GMT)
MINT: Evaluating LLMs in Multi-turn Interaction with Tools and Language
Feedback [78.6] 我々は,大規模言語モデルのマルチターンインタラクションによる課題解決能力を評価するベンチマークであるMINTを紹介する。
LLMは一般的に、ツールと言語フィードバックの恩恵を受けます。
LLMの評価、教師あり指導ファインタニング(SIFT)、人間からのフィードバックからの強化学習(RLHF)は、一般的にマルチターン能力を損なう。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:53:06 GMT)
Proxy Methods for Domain Adaptation [78.0] プロキシ変数は、遅延変数を明示的にリカバリしたりモデル化したりすることなく、分散シフトへの適応を可能にする。
両設定の複雑な分散シフトに適応する2段階のカーネル推定手法を開発した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:32:41 GMT)
StableToolBench: Towards Stable Large-Scale Benchmarking on Tool
Learning of Large Language Models [77.7] ToolBenchから進化したベンチマークであるStableToolBenchを紹介します。
仮想APIサーバには、キャッシングシステムとAPIシミュレータが含まれており、APIステータスの変更を緩和するための補完となる。
安定評価システムは、GPT-4を自動評価器として使用し、評価中のランダム性を排除し、解決可能なパスと勝利率を設計する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:57:40 GMT)
Bias and Fairness in Large Language Models: A Survey [76.7] 本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:50:00 GMT)
Do Deep Neural Network Solutions Form a Star Domain? [73.7] Entezari et al. (2022) は、ニューラルネットワークの解集合が勾配降下(SGD)を介して到達可能であると推測した。
本稿では,与えられた学習課題のスターモデルを求めるスターライトアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:59:23 GMT)
SpokenWOZ: A Large-Scale Speech-Text Benchmark for Spoken Task-Oriented
Dialogue Agents [72.4] SpokenWOZは音声TODのための大規模音声テキストデータセットである。
SpokenWOZでは、クロスターンスロットと推論スロット検出が新たな課題である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:52:02 GMT)
Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey [71.1] マルチオブジェクトトラッキング(MOT)は、動画フレーム全体で対象物を関連付け、移動軌道全体を取得することを目的としている。
埋め込み法はMOTにおける物体の位置推定と時間的同一性関連において重要な役割を担っている。
まず 7 つの異なる視点からMOT への埋め込み手法の奥行き解析による包括的概要を述べる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:29:18 GMT)
Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized
Visual Class Discovery [69.9] Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:06:50 GMT)
Gradual Optimization Learning for Conformational Energy Minimization [69.4] ニューラルネットワークによるエネルギー最小化のためのGradual Optimization Learning Framework(GOLF)は、必要な追加データを大幅に削減する。
GOLFでトレーニングしたニューラルネットワークは,種々の薬物様分子のベンチマークにおいて,オラクルと同等に動作することを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:36:05 GMT)
How does promoting the minority fraction affect generalization? A
theoretical study of the one-hidden-layer neural network on group imbalance [68.0] グループ不均衡は経験的リスク最小化において既知の問題である。
本稿では,個々の集団がサンプルの複雑さ,収束率,平均および群レベルの試験性能に与える影響を定量化する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:38:05 GMT)
Complex Reasoning over Logical Queries on Commonsense Knowledge Graphs [67.5] 論理クエリをサンプリングして作成した新しいデータセットであるCOM2(COMplex COMmonsense)を提示する。
我々は、手書きのルールと大きな言語モデルを用いて、複数の選択とテキスト生成の質問に言語化します。
COM2でトレーニングされた言語モデルでは、複雑な推論能力が大幅に改善されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:13:52 GMT)
Learning-Augmented Algorithms with Explicit Predictors [67.0] アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:40:21 GMT)
Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound [65.2] 自己教師付き学習 (SSL) は, 医療画像におけるラベル付きデータの健全性に対処するための戦略である。
本研究では,同じBモード超音波映像をSSLのペアとして用いた近位画像の利用効果について検討した。
この手法は、従来の超音波特異的比較学習法の平均検査精度を新型コロナウイルスの分類で上回り、IVPP(Intra-Video Positive Pairs)と命名された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:57:57 GMT)
DEADiff: An Efficient Stylization Diffusion Model with Disentangled
Representations [64.4] 現在のエンコーダベースのアプローチは、スタイルの転送中にテキスト・ツー・イメージモデルのテキスト制御性を著しく損なう。
この問題に対処するために、以下の2つの戦略を用いてDEADiffを紹介します。
DeAiffは、テキスト・ツー・イメージモデルに固有のテキスト制御性と、参照画像とスタイルの類似性との間の最適な視覚的スタイリング結果と最適なバランスを得る。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:38:13 GMT)
MgSvF: Multi-Grained Slow vs. Fast Framework for Few-Shot
Class-Incremental Learning [64.2] FSCIL(Few-shot class-incremental Learning)は、一連のタスクを継続的に学習する。
スロー vs. ファスト" (SvF) ジレンマによって、どの知識コンポーネントを遅い方法で、あるいは速い方法で更新すべきかを決定する。
2つの異なる粒子からSvFジレンマに対処する多粒SvF学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:53:14 GMT)
Premonition: Using Generative Models to Preempt Future Data Changes in
Continual Learning [63.9] 継続的な学習には、データ分散の継続的な変化に対応するためのモデルが必要である。
本稿では,大規模言語モデルと画像生成モデルの組み合わせが有用であることを示す。
トレーニング済みネットワークのバックボーンは、下流の連続学習問題に有用な表現を学習できることがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:29:54 GMT)
CivRealm: A Learning and Reasoning Odyssey in Civilization for
Decision-Making Agents [63.8] 文明ゲームに触発された環境であるCivRealmを紹介する。
CivRealmは、意思決定エージェントにとってユニークな学習と推論の課題である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:24:37 GMT)
Efficient Diffusion Model for Image Restoration by Residual Shifting [63.0] 本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。
提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。
提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:06:07 GMT)
Taming Pre-trained LLMs for Generalised Time Series Forecasting via
Cross-modal Knowledge Distillation [62.5] 我々はLLaTAと呼ばれる新しい大規模言語モデルと時系列アライメントフレームワークを提案し、時系列予測課題におけるLLMの可能性を完全に解き放つ。
提案手法は, クロスモーダルな知識蒸留に基づいて, 入力に依存しない静的知識と, 事前学習LLMにおける入力依存動的知識の両方を利用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:04:38 GMT)
Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in
the Real World [60.7] Bongard-OpenWorldは、マシンビジョンの実際の数ショット推論を評価するための新しいベンチマークである。
これは、現在の数発の推論アルゴリズムにすでに大きな課題を課している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:57:49 GMT)
Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in
the Real World [60.7] Bongard-OpenWorldは、マシンビジョンの実際の数ショット推論を評価するための新しいベンチマークである。
これは、現在の数発の推論アルゴリズムにすでに大きな課題を課している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:57:49 GMT)
SciGLM: Training Scientific Language Models with Self-Reflective
Instruction Annotation and Tuning [60.1] SciGLMは、大学レベルの科学的推論を行うことができる科学言語モデルのスイートである。
本研究では, 自己回帰的指示アノテーションの枠組みを適用し, 難解な科学的問題に対する段階的推論を生成する。
言語モデルのChatGLMをSciInstructで微調整し、科学的および数学的推論能力を向上した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:34:05 GMT)
KnowCoder: Coding Structured Knowledge into LLMs for Universal
Information Extraction [60.1] コード生成によるユニバーサル情報抽出(UIE)を行うためのLarge Language Model(LLM)であるKnowCoderを提案する。
KnowCoderは、異なるスキーマをPythonクラスに一様に変換するコードスタイルのスキーマ表現メソッドを導入した。
UIEにとって最大の知識であるtextbf30,000$以上の知識をカバーするコードスタイルのスキーマライブラリを構築します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:56:34 GMT)
Beyond Memorization: The Challenge of Random Memory Access in Language
Models [59.9] 生成言語モデル(LM)がそのメモリに逐次的またはランダムにアクセスできるかどうかを検討する。
本手法により, LMのランダムメモリアクセス性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:42:44 GMT)
Decentralized Riemannian Conjugate Gradient Method on the Stiefel
Manifold [59.7] 本稿では,最急降下法よりも高速に収束する一階共役最適化法を提案する。
これはスティーフェル多様体上の大域収束を達成することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:58:02 GMT)
MENTOR: Multilingual tExt detectioN TOward leaRning by analogy [59.4] 本研究では,シーンイメージ内の視覚領域と見えない言語領域の両方を検出し,識別するフレームワークを提案する。
mentOR」は、ゼロショット学習と少数ショット学習の学習戦略を多言語シーンテキスト検出のために実現した最初の作品である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:35:17 GMT)
LLMvsSmall Model? Large Language Model Based Text Augmentation Enhanced
Personality Detection Model [58.9] パーソナリティ検出は、ソーシャルメディア投稿に根ざした性格特性を検出することを目的としている。
既存のほとんどのメソッドは、事前訓練された言語モデルを微調整することで、ポスト機能を直接学習する。
本稿では,大規模言語モデル (LLM) に基づくテキスト拡張強化人格検出モデルを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:10:18 GMT)
Harder Tasks Need More Experts: Dynamic Routing in MoE Models [58.2] 本稿では,Mixture of Experts(MoE)モデルのための新しい動的専門家選択フレームワークを提案する。
提案手法は,各入力に対する専門家選択の信頼性レベルに基づいて,専門家を動的に選択する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:41:15 GMT)
Characterization of Large Language Model Development in the Datacenter [57.5] 大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:31:14 GMT)
MoPE-CLIP: Structured Pruning for Efficient Vision-Language Models with
Module-wise Pruning Error Metric [57.3] より小さな事前学習モデルを用いてCLIPモデルに等級に基づくプルーニングを適用すると、柔軟性が低下し、性能が低下することがわかった。
The Module-wise Pruning Error (MoPE) metric, we introduced a unified pruning framework for both pre-training and task-specific fine-tuning compression stage。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:24:26 GMT)
Symmetric Equilibrium Learning of VAEs [56.6] 可変オートエンコーダ(VAE)をデコーダ-エンコーダペアとみなし,データ空間内の分布を潜在空間内の分布にマッピングする。
本研究では,エンコーダとデコーダに対して対称なナッシュ均衡学習手法を提案し,データと潜伏分布の両方がサンプリングによってのみアクセス可能な状況下でのVAEの学習を可能にする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:20:37 GMT)
Symmetric Q-learning: Reducing Skewness of Bellman Error in Online
Reinforcement Learning [55.8] 深層強化学習では、状態や行動の質を評価するために、価値関数を推定することが不可欠である。
最近の研究では、値関数を訓練する際の誤差分布はベルマン作用素の特性のためにしばしば歪むことが示唆されている。
そこで我々は,ゼロ平均分布から発生する合成ノイズを目標値に加え,ガウス誤差分布を生成するSymmetric Q-learning法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:49:19 GMT)
Signed graphs in data sciences via communicability geometry [55.2] 符号付きグラフに対する可換幾何学の概念を提案し、この空間における可換距離や角度などの測度がユークリッド的かつ球面的であることを証明した。
次に、これらのメトリクスを適用して、署名付きグラフのデータ解析におけるいくつかの問題を統一的に解決する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:32:35 GMT)
Debatrix: Multi-dimensinal Debate Judge with Iterative Chronological
Analysis Based on LLM [54.0] 本稿では,マルチターン討論の分析と評価を多数派の好意に合致させるDebatrixを提案する。
具体的には、Debatrixは垂直かつ反復的な時系列分析と水平多次元評価コラボレーションを備えている。
実世界の議論シナリオに合わせるため、私たちはPanelBenchベンチマークを導入し、システムの性能と実際の議論結果を比較した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:19:47 GMT)
3DCoMPaT$^{++}$: An improved Large-scale 3D Vision Dataset for
Compositional Recognition [54.0] 3DCoMPaT$++$は、1000万以上のスタイリングされた3D形状の1億6000万レンダリングビューを備えたマルチモーダル2D/3Dデータセットである。
我々は,3Dオブジェクトの部品の合成を総合的に認識し,グラウンドドコMPaT認識(GCR)と呼ばれる新しいタスクを導入する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:52:42 GMT)
The 6th Affective Behavior Analysis in-the-wild (ABAW) Competition [53.7] 本稿では,第6回ABAWコンペティションについて述べる。
第6回ABAWコンペティションは、人間の感情や行動を理解する上での現代の課題に対処する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:49:56 GMT)
The 6th Affective Behavior Analysis in-the-wild (ABAW) Competition [53.7] 本稿では,第6回ABAWコンペティションについて述べる。
第6回ABAWコンペティションは、人間の感情や行動を理解する上での現代の課題に対処する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:49:56 GMT)
Genuine Knowledge from Practice: Diffusion Test-Time Adaptation for
Video Adverse Weather Removal [53.2] ビデオの悪天候除去におけるテスト時間適応について紹介する。
本稿では,テスト時間適応を反復拡散逆プロセスに統合する最初のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:21:30 GMT)
OpenBox: A Python Toolkit for Generalized Black-box Optimization [53.1] Black-box Optimization (BBO) には、自動機械学習、実験設計、データベースノブチューニングなど、幅広い応用がある。
本稿では,ユーザビリティを向上したオープンソースのBBOツールキットであるOpenBoxについて述べる。
ユーザがタスクを定義したり管理したりするためのユーザフレンドリーなインターフェースと視覚化を実装している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:21:04 GMT)
Visual Privacy Auditing with Diffusion Models [52.9] 本稿では,拡散モデル(DM)に基づくリコンストラクション攻撃を提案する。
本研究では,(1)実世界のデータ漏洩が再建の成功に大きく影響すること,(2)現在のリビルド境界がデータ先行によるリスクをうまくモデル化していないこと,(3)DMは,プライバシー漏洩を可視化するための効果的な監査ツールとして機能すること,を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:18:55 GMT)
Explainable Anomaly Detection in Images and Videos: A Survey [52.6] 画像やビデオを含む視覚データの異常検出とローカライゼーションは、機械学習のアカデミックと実世界のシナリオの適用において非常に重要である。
近年の視覚異常検出技術の急速な発展にもかかわらず、これらのブラックボックスモデルの解釈や、なぜ異常を区別できるのかの合理的な説明は乏しい。
本稿では,説明可能な視覚異常検出法に焦点をあてた最初の調査を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:23:53 GMT)
KEBench: A Benchmark on Knowledge Editing for Large Vision-Language
Models [52.1] LVLM(Large Vision-Language Models)の編集は、さまざまなモダリティ(画像とテキスト)を統合すると同時に、一貫性とコンテキストに関連のある修正を保証する。
既存のベンチマークには、LVLMの知識編集を測定するための3つのメトリクス(信頼性、局所性、一般性)がある。
我々は、新しいベンチマークを構築するために異なるデータ収集メソッド、$textbfKEBench$を採用し、包括的な評価のために新しいメトリック(移植性)を拡張します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:16:33 GMT)
Curriculum Graph Machine Learning: A Survey [51.9] カリキュラムグラフ機械学習(Graph CL)は、グラフ機械学習とカリキュラム学習の強みを統合する。
本稿では,グラフCLのアプローチを概観し,最近の研究動向を概観する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:54:04 GMT)
Complementing Event Streams and RGB Frames for Hand Mesh Reconstruction [51.9] EvRGBHand - イベントカメラとRGBカメラによる3Dハンドメッシュ再構築のための最初のアプローチを提案する。
EvRGBHandは、RGBベースのHMRにおける露出とモーションのぼかしの問題と、イベントベースのHMRにおける前景の不足とバックグラウンドのオーバーフロー問題に対処することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:04:50 GMT)
ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of
Commonsense Problem in Large Language Models [51.7] 大規模言語モデル(LLM)はNLPに大きな進歩をもたらした。
特にChatGPTは,広く利用されており,アクセスしやすいLLMである。
我々は、ChatGPTの常識能力を評価するために、11のデータセットで一連の実験を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:14:18 GMT)
Closing the Gap between TD Learning and Supervised Learning -- A
Generalisation Point of View [51.3] いくつかの強化学習(RL)アルゴリズムは、トレーニング中に見たことのないタスクを解決するために、経験の断片を縫い合わせることができる。
このoft-sought特性は、動的プログラミングに基づくRL法と教師あり学習(SL)に基づくRL法とを区別する数少ない方法の1つである。
これらの方法がこの重要な縫合特性を許すかどうかは不明である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:58:18 GMT)
Multiple Latent Space Mapping for Compressed Dark Image Enhancement [51.1] 既存の暗黒画像強調手法は、圧縮された暗黒画像を入力とし、優れた性能を実現する。
可変オートエンコーダ(VAE)に基づく新しい潜時マッピングネットワークを提案する。
総合的な実験により,提案手法は圧縮暗画像強調における最先端性能を実現することを示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:05:51 GMT)
Unleashing Network Potentials for Semantic Scene Completion [51.0] 本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:48:49 GMT)
Making Pre-trained Language Models Great on Tabular Prediction [50.7] ディープニューラルネットワーク(DNN)の転送性は、画像および言語処理において著しく進歩している。
本稿では,表型データ予測のための訓練済みLMであるTP-BERTaを提案する。
新たな相対等級トークン化では、スカラー数値の特徴値を細分化した高次元トークンに変換し、特徴値と対応する特徴名を統合する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:34:28 GMT)
Conditional computation in neural networks: principles and research
trends [50.6] 本稿では,ニューラルネットワークの設計にテクトコンディショナリ計算を適用するという,新たな領域の原理とアイデアを要約する。
特に、入力に条件付きで計算グラフの一部を動的に活性化または非活性化するニューラルネットワークに焦点を当てる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:56:38 GMT)
FedRA: A Random Allocation Strategy for Federated Tuning to Unleash the
Power of Heterogeneous Clients [50.1] 実世界のフェデレーションシナリオでは、様々な計算と通信資源を持つ多種多様なクライアントが存在することが多い。
本稿では,新しいフェデレーションチューニングアルゴリズムであるFedRAを提案する。
各通信ラウンドにおいて、FedRAはランダムにアロケーション行列を生成する。
アダプタを用いてアロケーション行列とファインチューンに基づいて、元のモデルから少数のレイヤを再編成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:26:45 GMT)
SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and
Related Observable Overgeneration Mistakes [50.0] 本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:06:22 GMT)
Preserving Automotive Heritage: A Blockchain-Based Solution for Secure
Documentation of Classic Cars Restoration [49.9] 傑作と見なすには、専門職の厳格なガイドラインに従って、古典的な車両を原始的な状態に維持するか、または復元する必要がある。
デザインサイエンス研究アプローチを使用して、Hyperledger Fabricを使用したブロックチェーンベースのソリューションを開発しました。
このソリューションは検証され、クラシックカーセクターの様々なエンティティから肯定的なフィードバックを受けた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:06:57 GMT)
Robustifying and Boosting Training-Free Neural Architecture Search [49.8] 本稿では,多種多様なタスクにおいて,頑健で一貫したパフォーマンスの指標を開発するために,トレーニング不要なNAS (RoBoT) アルゴリズムを提案する。
注目すべきは、我々のRoBoTの期待性能が理論的に保証され、既存のトレーニングフリーNASよりも改善されることだ。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:24:11 GMT)
Duwak: Dual Watermarks in Large Language Models [49.0] トークン確率分布とサンプリングスキームの両方に二重秘密パターンを埋め込むことにより、透かしの効率と品質を向上させるために、Duwakを提案する。
Llama2でDuwakを4つの最先端透かし技術と組み合わせて評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:25:38 GMT)
Self-Supervised Learning of Whole and Component-Based Semantic
Representations for Person Re-Identification [48.2] 個人再識別(ReID)は、さまざまな設定にまたがって個人を特定することに焦点を当て、困難な問題である。
本稿では,対話モデルにインスパイアされた局所意味抽出(LSE)モジュールを提案する。
また,LSEを利用したセマンティックReID(Semantic ReID)を導入し,様々なReIDドメインやモダリティをシームレスに移動するための効果的なセマンティックスを学習する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:20:53 GMT)
Effective pruning of web-scale datasets based on complexity of concept
clusters [48.1] 本稿では,大規模なマルチモーダルデータセットを抽出し,イメージネット上でCLIPスタイルのモデルを訓練する手法を提案する。
高品質なデータのより小さなセットでのトレーニングは、トレーニングコストを大幅に削減して、より高いパフォーマンスをもたらす可能性があることに気付きました。
我々は38の評価タスクにおいて、新しい最先端のImagehttps://info.arxiv.org/help/prep#commentsネットゼロショット精度と競合平均ゼロショット精度を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:35:56 GMT)
Adaptive Bounding Box Uncertainties via Two-Step Conformal Prediction [48.1] 我々は共形予測を利用してオブジェクト境界ボックスのカバレッジを保証した不確実区間を求める。
これを行う上での課題のひとつは、オブジェクトのクラスラベルにバウンディングボックスの予測が条件付けられていることだ。
本研究では,予測されたクラスラベルの不確かさを,境界ボックスの不確かさ間隔に伝播させる新しい2段階共形手法を開発する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:45:24 GMT)
Fairness Feedback Loops: Training on Synthetic Data Amplifies Bias [47.8] モデル誘導分散シフト(MIDS)は、以前のモデルが代々のモデルに対して汚染された新しいモデルトレーニングセットを出力するときに発生する。
我々は,複数世代にわたるMIDSの追跡を可能にするフレームワークを導入し,性能,公平性,少数化グループ表現の損失につながることを確認した。
これらの否定的な結果にもかかわらず、モデルがデータエコシステムにおけるポジティブで意図的な介入にどのように使用されるかを特定します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:48:08 GMT)
FineMath: A Fine-Grained Mathematical Evaluation Benchmark for Chinese
Large Language Models [47.6] FineMathは、中国語大言語モデル(LLM)を評価するための詳細な数学的評価ベンチマークデータセットである。
FineMathは、小学校数学で教えられる主要な数学的概念をカバーし、数学用語の問題の17のカテゴリに分けられる。
数学の単語問題のうち17のカテゴリは、これらの問題を解決するために必要な推論ステップの数に応じて、難易度を手動でアノテートする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:32:39 GMT)
Robust Second-Order Nonconvex Optimization and Its Application to Low Rank Matrix Sensing [47.3] 近似第二エピシロン依存(SOSP)の発見は、よく研究され基礎的な問題である。
本稿では,低次元センサマシン最適化問題に適用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:27:44 GMT)
MAMMOTH: Massively Multilingual Modular Open Translation @ Helsinki [46.6] MAMMOTHツールキットは,大規模な多言語モジュール型機械翻訳システムを大規模に学習するためのフレームワークである。
A100およびV100 NVIDIA GPUのクラスタ間で効率を実証し、設計哲学と今後の情報計画について議論する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:32:30 GMT)
LayoutDiffusion: Controllable Diffusion Model for Layout-to-image
Generation [46.6] 本稿では,従来よりも高い生成品質と制御性が得られるLayoutDiffusionという拡散モデルを提案する。
本稿では、領域情報を用いた構造画像パッチを構築し、パッチされた画像を特別なレイアウトに変換し、通常のレイアウトを統一した形で融合させる。
実験の結果,従来のSOTA法では比較的46.35%,COCO-stuff法では26.70%,VG Codeでは44.29%,41.82%であった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:15:24 GMT)
Decomposing Disease Descriptions for Enhanced Pathology Detection: A
Multi-Aspect Vision-Language Matching Framework [46.4] 医学的な視覚言語事前訓練は研究の最前線として現れ、ゼロショットの病理診断を可能にしている。
現在, 医療画像と病理所見の整合に苦慮している。
これは、大きな言語モデルと医療専門家に相談することで達成される。
我々の成績は最近の手法を8.07%、AUCでは11.23%で上回っている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:18:22 GMT)
VideoMamba: State Space Model for Efficient Video Understanding [46.2] VideoMambaは既存の3D畳み込みニューラルネットワークとビデオトランスフォーマーの限界を克服する。
線形複雑度演算子は、効率的な長期モデリングを可能にする。
VideoMambaはビデオ理解のための新しいベンチマークを設定している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:22:52 GMT)
MoAI: Mixture of All Intelligence for Large Language and Vision Models [46.1] Mixture of All Intelligence (MoAI)は、命令調整型大規模言語および視覚モデル(LLVM)である。
MoAIは外部セグメンテーション、検出、SGG、OCRモデルの出力から得られる補助的な視覚情報を使用する。
MoAIは、多数のゼロショットビジョン言語(VL)タスクにおいて、オープンソースとクローズドソースのLLVMの両方を著しく上回っている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:44:13 GMT)
Ray Denoising: Depth-aware Hard Negative Sampling for Multi-view 3D
Object Detection [46.0] レイデノジング(Ray Denoising)は、カメラ線に沿って戦略的にサンプリングすることで検出精度を高める革新的な手法である。
Ray Denoisingはプラグイン・アンド・プレイモジュールとして設計されており、DETR方式のマルチビュー3D検出器と互換性がある。
NuScenesデータセット上の最先端のStreamPETR法よりも平均精度(mAP)が1.9%向上した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:38:34 GMT)
Frequency Decoupling for Motion Magnification via Multi-Level Isomorphic
Architecture [45.6] Video Motion Magnificationは、マクロ世界の物体の微妙で知覚できない動き情報を明らかにすることを目的としている。
動作拡大のための周波数デカップリングの新しいパラダイムであるFD4MMについて述べる。
FD4MMはFLOPを1.63$times$に削減し、推論速度を1.68$times$に向上させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:07:29 GMT)
Process Modeling With Large Language Models [45.1] 本稿では,大規模言語モデル(LLM)のプロセスモデリングへの統合について検討する。
プロセスモデルの自動生成と反復的改善にLLMを利用するフレームワークを提案する。
予備的な結果は、プロセスモデリングタスクを合理化するフレームワークの能力を示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:27:47 GMT)
Spectral Density Classification For Environment Spectroscopy [45.0] 環境の特徴を再構築するために,機械学習技術の可能性を活用する。
スピンボソンモデルの関連する例としては、環境のオーミック性パラメータをOhmic、sub-Ohmic、Super-Ohmicのいずれかとして高精度に分類することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:30:36 GMT)
Compressed-sensing Lindbladian quantum tomography with trapped ions [45.0] 量子システムの力学を特徴づけることは、量子情報プロセッサの開発における中心的な課題である。
従来の欠点を緩和するLindbladian quantum tomography(LQT)の2つの改良点を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:58:37 GMT)
Federated Adaptive Prompt Tuning for Multi-Domain Collaborative Learning [44.6] フェデレートラーニング(FL)は、複数のクライアントがデータを開示することなく、協力的にグローバルモデルをトレーニングすることを可能にする。
多領域協調画像分類のためのフェデレーション適応型プロンプトチューニングアルゴリズムであるFedAPTを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:23:54 GMT)
DiffuScene: Denoising Diffusion Models for Generative Indoor Scene
Synthesis [44.5] 拡散モデルに基づく屋内3次元シーン合成のためのDiffuSceneを提案する。
非順序オブジェクトセットに格納された3Dインスタンスプロパティを生成し、各オブジェクト設定に最もよく似た幾何学を検索する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:40:08 GMT)
Unveiling the Pitfalls of Knowledge Editing for Large Language Models [44.3] 知識編集が潜在的なリスクをもたらす副作用をもたらすかどうかはまだ不明である。
本稿では,大規模言語モデルの知識編集に伴う潜在的な落とし穴について検討する。
実験結果は、知識編集が意図しない結果の影を必然的に落としてしまうことを鮮明に示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:58:53 GMT)
MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large
Language Models [44.2] 我々は,Multimodal Large Language Models (MLLM) がクエリ関連画像によって容易に損なわれることを観察した。
画像ベース操作に対するMLLMの安全性クリティカルな評価を行うためのフレームワークであるMM-SafetyBenchを紹介する。
我々の研究は、潜在的に悪意のある悪用に対して、オープンソースのMLLMの安全性対策を強化し、強化するための協力的な努力の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:27:19 GMT)
Hallmarks of Optimization Trajectories in Neural Networks and LLMs: The
Lengths, Bends, and Dead Ends [44.2] 最適化軌道に含まれるパラメータの豊富な構造を解析することにより,ニューラルネットワークのメカニズムを理解することを提案する。
深層ニューラルネットワークにおける最適化の性質に関する重要な指標を提供するために、それらを使用します。
最大120億のパラメータを持つ大規模言語モデルを含む,大規模ビジョンと言語設定に関する実験を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:32:47 GMT)
Language-Specific Representation of Emotion-Concept Knowledge Causally
Supports Emotion Inference [44.1] この研究は、大規模言語モデル(LLMs)として知られる人工知能の形式を用いて、言語に基づく感情の表現が、新しい状況の感情的意味に関する推論を生成するAIの能力に因果的に寄与するかどうかを評価する。
本研究は,LLMでも知覚モダ表現の欠如による感情の学習が可能であり,言語由来の感情概念知識の感情推論への寄与を強調した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:55:29 GMT)
Data Interpreter: An LLM Agent For Data Science [44.0] Data Interpreterは、コードで解決するように設計されたソリューションである。
データサイエンスにおける問題解決を強化するための3つの重要なテクニックを強調している。
MATHデータセットは26%増加し、オープンなタスクは112%改善した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:26:53 GMT)
Certified Robustness via Dynamic Margin Maximization and Improved
Lipschitz Regularization [44.0] 我々は、弱い方向に沿ってモデルのリプシッツ定数を規則化しながら、出力(ロジット)空間のマージンを増大させる頑健なトレーニングアルゴリズムを開発する。
境界の相対的精度は過剰な正規化を防ぎ、決定境界をより直接的に操作することができる。
MNIST, CIFAR-10 および Tiny-ImageNet データセットを用いた実験により,提案アルゴリズムが最先端技術と比較して競争力に向上した結果が得られることを確認した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:57:37 GMT)
Enhancing Group Fairness in Online Settings Using Oblique Decision
Forests [43.9] 我々は,オンライン設定において公平な判断を行うために,斜めの意思決定ツリーのアンサンブルであるアラニーニを提案する。
アラニーニの階層木構造はパラメータ分離を可能にし、フェアネス勾配を効率的に計算することができる。
Aranyaniはベースラインアプローチよりも精度と公正性のトレードオフが優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:56:41 GMT)
Adversarial Distortion Learning for Medical Image Denoising [43.5] 本稿では,2次元および3次元(2D/3D)のバイオメディカル画像データから,新たな逆歪み学習法を提案する。
提案されたADLは2つの自動エンコーダで構成されている。
デノイザとディスクリミネータはどちらも、Efficient-Unetと呼ばれる自動エンコーダをベースとしている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:36:06 GMT)
Augmenting Transformers with Recursively Composed Multi-grained
Representations [42.9] ReCATは、学習と推論の両方の間、金の木に頼ることなく、生テキストの階層的構文構造を明示的にモデル化することができる。
Transformerの組み込み層とアテンション層の間にCIO層を積み重ねることで、ReCATモデルは、ディープ・イン・スパンとディープ・インター・スパンの両方のインタラクションを実行することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:43:57 GMT)
Source-Free Domain Adaptation with Frozen Multimodal Foundation Model [42.2] Source-Free Domain Adaptation (SFDA)は、ターゲットドメインにソースモデルを適用することを目的としている。
ヘテロジニアス知識を生かしながら、リッチな市販の視覚言語(ViL)マルチモーダルモデルの可能性を探る。
本稿では,新しいDIFOアポローチモデルを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:41:31 GMT)
Mechanics of Next Token Prediction with Self-Attention [41.8] トランスフォーマーベースの言語モデルは、入力シーケンスが与えられた次のトークンを予測するために、大きなデータセットでトレーニングされる。
勾配降下による自己注意の訓練は,次のトークンを2つの異なるステップで生成するオートマトンを学習することを示す。
これらの発見が、どのように自己認識がシーケンシャルなデータをどのように処理し、より複雑なアーキテクチャをデミステライズする道を開くか、光を当てることを願っています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:15:38 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [41.8] 本稿では,知識グラフにおけるマルチホップリンク予測を強化するために,知識グラフ大言語モデルフレームワーク(KG-LLM)を提案する。
知識グラフをチェーン・オブ・シークレットのプロンプトに変換することで、我々のフレームワークは、エンティティの潜在表現とその相互関係を識別し、学習するように設計されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:47:29 GMT)
Agile gesture recognition for low-power applications: customisation for generalisation [41.7] 自動手ジェスチャー認識は、長い間AIコミュニティの焦点だった。
低消費電力センサデバイスで動作するジェスチャー認識技術への需要が高まっている。
本研究では,適応的およびアジャイル的誤り訂正を用いたパターン認識システムのための新しい手法を提示する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:34:18 GMT)
Health-LLM: Personalized Retrieval-Augmented Disease Prediction System [39.9] 本稿では,大規模特徴抽出と医療知識トレードオフスコアリングを組み合わせたHeath-LLMという革新的なフレームワークを提案する。
本システムでは,医療報告を大規模モデルに統合し,詳細なタスク情報を提供する。
第2に、専門的な医療専門知識は、健康特性の重み付けスコアを調整するために使用される。
第3に,言語モデルの分析能力を高めるために,半自動特徴抽出フレームワークを用いる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:16:10 GMT)
"In Dialogues We Learn": Towards Personalized Dialogue Without
Pre-defined Profiles through In-Dialogue Learning [39.2] In-Dialogue Learning (IDL) は、対話履歴を利用してペルソナを特徴づける、事前訓練された大規模言語モデルの能力を高めるための微調整フレームワークである。
3つのデータセットに対する実験により,IDLはBLEUとROUGEのスコアを最大200%,ROUGEは247%向上した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:33:16 GMT)
"In Dialogues We Learn": Towards Personalized Dialogue Without
Pre-defined Profiles through In-Dialogue Learning [39.2] In-Dialogue Learning (IDL) は、対話履歴を利用してペルソナを特徴づける、事前訓練された大規模言語モデルの能力を高めるための微調整フレームワークである。
3つのデータセットに対する実験により,IDLはBLEUとROUGEのスコアを最大200%,ROUGEは247%向上した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:33:16 GMT)
Information-based Transductive Active Learning [38.1] 本稿では,情報に基づくトランスダクティブ学習を短縮したIDLを提案する。
一般の正則性仮定では、IPLはアクセス可能なデータから得られる最小の不確実性に一様に収束する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:37:03 GMT)
Active Few-Shot Fine-Tuning [38.1] 古典的能動学習, 帰納的能動学習の一般化の一例として, 数ショットの微調整があげられる。
本稿では,情報に基づくトランスダクティブ学習を短縮したIDLを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:44:00 GMT)
Learning to Generate Training Datasets for Robust Semantic Segmentation [37.9] セマンティックセグメンテーション手法の堅牢性を改善するための新しい手法を提案する。
我々は,現実的で可視な摂動画像を生成するために,新しい条件付き生成対向ネットワークであるRobustaを設計した。
我々の結果は、このアプローチが安全クリティカルなアプリケーションに有用である可能性を示唆している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:39:33 GMT)
CounterCurate: Enhancing Physical and Semantic Visio-Linguistic
Compositional Reasoning via Counterfactual Examples [37.9] 視覚言語合成推論能力を包括的に改善するフレームワークであるCounterCurateを提案する。
私たちはまず,CLIPやLLaVAといったマルチモーダルモデルの物理基底合成推論における近距離性能に注目した。
次に、グラウンドド画像生成モデルGLIGENを用いて単純なデータ拡張を適用し、微調整データを生成する。
我々は、高パフォーマンステキスト生成と画像生成モデル、特にGPT-4VとDALLE-3の能力を利用して、難解なセマンティックカウンターファクトをキュレートする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:59:56 GMT)
PeLK: Parameter-efficient Large Kernel ConvNets with Peripheral
Convolution [37.7] 人間の視覚に触発されて、高密度グリッド畳み込みの90%以上のパラメータ数を効率的に削減する、ヒトのような周辺畳み込みを提案する。
末梢のコンボリューションは人間と非常によく似ており,O(K2) から O(logK) へのコンボリューションの複雑度を低下させる。
初めて、CNNのカーネルサイズを前例のない101x101にスケールアップし、一貫した改善を実証しました。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:19:05 GMT)
ConsPrompt: Exploiting Contrastive Samples for Fewshot Prompt Learning [37.2] 本研究では,プロンプト表現のロバスト性を改善するために,適切なコントラストサンプルと多自由度コントラスト学習手法について検討する。
以上の結果から, 高速微調整プロセスにおける多自由度コントラスト学習の有効性が証明された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:29:41 GMT)
GlanceVAD: Exploring Glance Supervision for Label-efficient Video
Anomaly Detection [36.7] 本稿では,異常検出精度とアノテーションコストのバランスを改善するために,"glance annotations"と呼ばれる新しいラベリングパラダイムを提案する。
本手法の有効性を評価するため,UCF-Crime と XD-Violence の2つの標準ビデオ異常検出データセットに対して,視線アノテーションを手動でアノテートする。
また,Ssianカーネルを基本単位として時間的異常分布を構成するGlanceVAD法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:44:36 GMT)
Entropy is not Enough for Test-Time Adaptation: From the Perspective of
Disentangled Factors [36.5] テストタイム適応(TTA) 未確認のテストデータのための訓練済みのディープニューラルネットワーク。
本稿では,Destroy Your Object (DeYO) という新しいTTA手法を紹介する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:01:57 GMT)
Pareto-Optimal Estimation and Policy Learning on Short-term and
Long-term Treatment Effects [36.5] 短期的効果と長期的効果のトレードオフ、あるいは最適な治療を達成するための両者のトレードオフは、依然としてオープンな課題である。
本稿では,これらの問題を体系的に検討し,POEとPOPLを組み合わせたPareto-Efficientアルゴリズムを提案する。
合成と実世界の両方のデータセットで,本手法の優位性を実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:28:39 GMT)
In-Context Sharpness as Alerts: An Inner Representation Perspective for
Hallucination Mitigation [36.3] 大規模言語モデル(LLM)は、しばしば幻覚を起こし、事実の誤りを引き起こす。
正しい世代は、不正な世代に比べて、コンテキスト内のトークンの隠された状態において、よりシャープなコンテキストアクティベーションを持つ傾向がある。
本研究では,テキスト内隠れ状態のシャープネス'を定量化し,デコード処理に組み込むエントロピーに基づく計量法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:49:28 GMT)
Search-Adaptor: Embedding Customization for Information Retrieval [35.8] 事前学習されたLarge Language Models (LLM) によって抽出された埋め込みは、情報検索と検索を改善する重要な可能性を持っている。
本稿では,情報検索のためのLLMを効率的かつロバストな方法でカスタマイズする新しい手法であるSearch-Adaptorを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:09:41 GMT)
A Unified Taxonomy-Guided Instruction Tuning Framework for Entity Set
Expansion and Taxonomy Expansion [35.7] 3つの代表的タスクを使用して、既存の分類を新しいエンティティで自動的にポップアップさせることができる。
我々はこれらのタスクに必要な共通鍵スキルを分類学的構造の観点から同定する。
本稿では,これら3つの課題を協調的に解決する統合型分類誘導指導フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:12:25 GMT)
Truth-Aware Context Selection: Mitigating the Hallucinations of Large
Language Models Being Misled by Untruthful Contexts [35.7] 大規模言語モデル(LLM)は、ユーザや知識の議論ツールが提供する非現実的なコンテキストによって容易に誤解される。
我々は、入力から非現実的なコンテキストを保護するために、TACS(Truth-Aware Context Selection)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:40:44 GMT)
Rediscovering BCE Loss for Uniform Classification [35.7] 本稿では,全サンプルの分類に統一しきい値を用いた一様分類の概念を紹介する。
本研究では,一様分類におけるモデルの性能を測定する指標として,一様分類精度を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:44:40 GMT)
LiveCodeBench: Holistic and Contamination Free Evaluation of Large
Language Models for Code [35.1] コードに対する大規模言語モデルの包括的で汚染のない評価手法であるLiveCodeBenchを提案する。
LiveCodeBenchは、LeetCode、AtCoder、CodeForcesという3つのコンペティションプラットフォーム間のコンテストから、時間とともに新たな問題を収集している。
本稿では, 汚染, 総合的な性能比較, 既存ベンチマークの過度なオーバーフィット, および個別モデル比較に関する実証的な知見を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:58:04 GMT)
TeleMoMa: A Modular and Versatile Teleoperation System for Mobile
Manipulation [35.0] 本研究では,移動マニピュレータの全身遠隔操作のための汎用・モジュールインタフェースであるTeleMoMaを実演する。
TeleMoMaは、RGBとディープカメラ、バーチャルリアリティコントローラ、キーボード、ジョイスティックなど、複数のヒューマンインターフェースを統合する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:58:01 GMT)
Stable-Makeup: When Real-World Makeup Transfer Meets Diffusion Model [35.0] 現在のメークアップ転送方式は単純なメイクスタイルに限られており、現実のシナリオでは適用が困難である。
本研究では,多様な現実世界の化粧品を堅牢に転写できる新しい拡散型化粧品転写法であるStable-Makeupを紹介する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:53:14 GMT)
AesopAgent: Agent-driven Evolutionary System on Story-to-Video
Production [34.7] AesopAgentは、ストーリー・ツー・ビデオ制作のためのエージェント駆動進化システムである。
このシステムは統合されたフレームワークに複数の生成機能を統合し、個々のユーザがこれらのモジュールを容易に活用できるようにする。
私たちのAesopAgentは、以前のビジュアルストーリーテリングの多くの作品と比較して最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:30:50 GMT)
Efficient Diffusion Models for Vision: A Survey [34.6] 拡散モデル (DM) は, 逆行訓練を必要とせず, コンテンツ生成における最先端の性能を実証している。
DMは非平衡熱力学にインスパイアされ、本質的に高い計算複雑性を持つ。
DMはトレーニングと推論の段階でかなりの計算オーバーヘッドを発生させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:08:37 GMT)
CEAT: Continual Expansion and Absorption Transformer for Non-Exemplar
Class-Incremental Learning [34.6] 現実のアプリケーションでは、動的シナリオは、古い知識を忘れずに新しいタスクを継続的に学習する能力を持つ必要がある。
連続膨張吸収変圧器(CEAT)という新しいアーキテクチャを提案する。
このモデルは、凍結した前のパラメータと平行に拡散層を拡張することで、新しい知識を学ぶことができる。
モデルの学習能力を向上させるために,特徴空間における古クラスと新クラスの重複を低減するために,新しいプロトタイプを設計した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:04:15 GMT)
Beyond Text: Frozen Large Language Models in Visual Signal Comprehension [34.4] Vision-to-Language Tokenizer(V2T Tokenizer)は、エンコーダデコーダ、LLM語彙、CLIPモデルを組み合わせて、画像を「外国語」に変換する。
我々は、画像認識、画像キャプション、視覚的質問応答などの理解タスクを含む、厳密な実験を行い、また、塗り絵、アウトペイント、デブロアリング、シフト復元などの画像装飾タスクを実施。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:59:51 GMT)
Switching the Loss Reduces the Cost in Batch Reinforcement Learning [34.3] 本稿では,FQI-LOG尺度を用いた準最適政策の学習に必要なサンプル数と,最適政策の蓄積コストについて述べる。
我々は,FQI-LOGが目標を確実に達成する問題に対して,2乗損失を訓練したFQIよりも少ないサンプルを用いていることを実証的に検証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:01:02 GMT)
Switching the Loss Reduces the Cost in Batch Reinforcement Learning [34.3] 本稿では,FQI-LOG尺度を用いた準最適政策の学習に必要なサンプル数と,最適政策の蓄積コストについて述べる。
我々は,FQI-LOGが目標を確実に達成する問題に対して,2乗損失を訓練したFQIよりも少ないサンプルを用いていることを実証的に検証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:01:02 GMT)
Safety-aware Causal Representation for Trustworthy Offline Reinforcement
Learning in Autonomous Driving [33.7] オフライン強化学習(RL)アプローチは、オフラインデータセットからのシーケンシャルな意思決定問題に対処する上で、顕著な効果を示す。
一般化可能なエンドツーエンド駆動ポリシの学習を容易にするために,saFety-aware strUctured Scenario representation (Fusion)を導入した。
様々な運転シナリオにおける実証的な証拠は、フュージョンが自律運転エージェントの安全性と一般化性を著しく向上させることを証明している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:01:38 GMT)
Approaching Rate-Distortion Limits in Neural Compression with Lattice
Transform Coding [33.4] ニューラル圧縮設計では、ソースを潜在ベクトルに変換し、それを整数に丸め、エントロピーを符号化する。
我々は、i.d.配列に対して非常に最適であり、実際に、元のソースシーケンスのスカラー量子化を常に回復することを示した。
遅延空間におけるスカラー量子化の代わりに格子量子化を用いることにより、格子変換符号化(LTC)が様々な次元で最適なベクトル量子化を回復できることを実証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:09:25 GMT)
A Framework for Cost-Effective and Self-Adaptive LLM Shaking and
Recovery Mechanism [33.3] 我々は,CypherTalk という,費用対効果と自己適応性を備えた LLM 揺らぎチューニングとリカバリ機構を導入する。
水平および垂直の揺動演算子を慎重に設計することにより、SOTAのプライバシー保護型LLMスキームと同等の精度が得られる。
また、CypherTalkフレームワークでは、最適化された揺動演算子設定を使用すると、信頼性の高い精度が得られる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:30:04 GMT)
IndicSTR12: A Dataset for Indic Scene Text Recognition [33.2] 本稿では、インドにおける最大かつ最も包括的な実データセットであるIndicSTR12を提案し、12の主要言語でのSTRパフォーマンスをベンチマークする。
提案されたデータセットのサイズと複雑さは、既存のラテン系同時代のデータセットに匹敵するものである。
データセットには、様々な自然のシーンから集められた27000以上のワードイメージが含まれており、各言語に1000以上のワードイメージがある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:14:48 GMT)
On the Identifiability of Quantized Factors [33.1] 一般非線形微分同相の下で量子化潜在因子を復元することは可能であることを示す。
本稿では、この新しい形の量子化因子識別可能性を紹介し、量子化因子の回復の包括的証明を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:04:04 GMT)
Knowledge-guided Causal Intervention for Weakly-supervised Object
Localization [33.0] KG-CI-CAMは知識誘導因果介入法である。
我々は、因果介入による共起コンテキスト共同設立問題に取り組む。
分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:55:20 GMT)
Light Field Diffusion for Single-View Novel View Synthesis [32.6] NVS(Single-view novel view synthesis)は、コンピュータビジョンにおいて重要であるが困難である。
NVSの最近の進歩は、高忠実度画像を生成するのに優れた能力として、Denoising Diffusion Probabilistic Models (DDPMs)を活用している。
光電界拡散(LFD)は,従来のカメラポーズ行列への依存を超越した,条件拡散に基づく新しいアプローチである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:48:13 GMT)
LOTUS: Continual Imitation Learning for Robot Manipulation Through
Unsupervised Skill Discovery [32.5] 我々は,ロボットが新しい操作タスクを継続的に,効率的に学習することを可能にする,連続的な模倣学習アルゴリズムであるLOTUSを紹介する。
継続的なスキル発見は、既存のスキルを更新して、以前のタスクを忘れないようにし、新しいタスクを解決するための新しいスキルを追加する。
総合的な実験の結果、LOTUSは最先端のベースラインを11%以上の成功率で上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:23:55 GMT)
Overthinking the Truth: Understanding how Language Models Process False
Demonstrations [32.3] モデルの内部表現のレンズを通して有害な模倣を研究する。
我々は「過剰思考」と「偽誘導頭部」の2つの関連する現象を同定する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:00:02 GMT)
Overthinking the Truth: Understanding how Language Models Process False
Demonstrations [32.3] モデルの内部表現のレンズを通して有害な模倣を研究する。
我々は「過剰思考」と「偽誘導頭部」の2つの関連する現象を同定する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:00:02 GMT)
Implicit Neural Representation for MRI Parallel Imaging Reconstruction [32.0] 暗黙的ニューラル表現(INR)に基づく新しいMRI再構成法を提案する。
INRは、再構成された完全サンプリング画像を、ボクセル座標とアンダーサンプル画像の以前の特徴ベクトルの関数として表現する。
具体的には、異なるアンダーサンプリングスケールのMR画像からスケール非依存のボクセル特異な特徴を生成するためのスケール埋め込みエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:24:51 GMT)
Open-World Semantic Segmentation Including Class Similarity [31.8] 本論文は, オープンワールドのセマンティックセマンティックセグメンテーション, すなわち, トレーニング中に未確認の物体を解釈する画像データの変種に対処する。
本稿では,クローズドワールドのセマンティックセグメンテーションを正確に行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:11:19 GMT)
Advantage-Aware Policy Optimization for Offline Reinforcement Learning [31.8] 本稿では,オフライン学習におけるアドバンテージ・アウェア政策最適化(A2PO)手法を提案する。
A2POは条件付き変分自動エンコーダ(CVAE)を使用して、相互に絡み合った行動ポリシーの動作分布を歪めている。
D4RLベンチマークの単一品質データセットと混合品質データセットの両方で実施された実験は、A2POが最先端のデータセットよりも優れた結果が得られることを示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:43:41 GMT)
APOLLO: An Optimized Training Approach for Long-form Numerical Reasoning [31.3] 我々は,長文の数値推論フレームワークを改善するためにAPOLLOを提案する。
検索者に対しては,検索者が重要な数値的事実に対してより識別しやすくするために,無認識の負のサンプリング戦略を採用する。
ジェネレータに対しては、一貫性に基づく強化学習と目標プログラム拡張戦略を設計する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:30:16 GMT)
Tree Counting by Bridging 3D Point Clouds with Imagery [31.0] 2次元リモートセンシング画像は、主に高層キャノピーを示すが、密集したキャノピーを持つ地域では、個々の木の分化が容易ではない。
我々は,3次元LiDAR測定と2次元画像の融合を利用して,正確な木数計測を行う。
我々は,3次元空中LiDARデータと2次元画像を用いて,森林内の木を数える深層学習手法の比較を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:12:56 GMT)
GRACE: Loss-Resilient Real-Time Video through Neural Codecs [31.0] リアルタイムビデオ通信では、遅延の厳しい要求のため、ロスパケットを高遅延ネットワーク上で再送信することは不可能である。
本稿では,ユーザによるパケットロスに対するQE(Quality of Experience, QE)の保存を行うGRACEという,損失耐性のあるリアルタイムビデオシステムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:40:53 GMT)
The Missing Piece in Model Editing: A Deep Dive into the Hidden Damage
Brought By Model Editing [31.0] 大規模言語モデルは、その顕著な効果で多くのタスクに革命をもたらした。
これらのモデルの編集は時代遅れまたは誤った情報の修正に不可欠であり、しばしば隠れた空間におけるリップル効果として知られる複雑な問題を引き起こす。
本稿では, モデルの適応とその後の編集の影響を定量的に評価する, 新たな評価手法を提案することによって, この科学的課題に対処する。
さらに,このリップル効果を緩和するモデル編集手法であるSelective Outlier Re-Editing Approach(SORA)を導入する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:04:28 GMT)
DrivAerNet: A Parametric Car Dataset for Data-Driven Aerodynamic Design
and Graph-Based Drag Prediction [30.7] 本研究では,3次元産業標準車形状の大規模高速CFDデータセットであるDrivAerNetと,動的グラフ畳み込みニューラルネットワークモデルであるRegDGCNNを紹介する。
DrivAerNetとRegDGCNNは共に、車の設計プロセスを加速し、より効率的な車両の開発に貢献することを約束している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:02:39 GMT)
DragAnything: Motion Control for Anything using Entity Representation [30.5] DragAnythingは、制御可能なビデオ生成における任意のオブジェクトのモーション制御を実現する。
提案手法は従来の手法(例えばDragNUWA)を26%上回る。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:57:29 GMT)
TRAM: Bridging Trust Regions and Sharpness Aware Minimization [30.4] Trust Region Aware Minimization (TRAM) は、パラメータのシャープさと、事前訓練された構造を保存するスムーズな情報表現のためのSAMアルゴリズムである。
我々は、堅牢なドメイン転送と表現の一般化が重要となる視覚(データセット間の適応)およびテキストタスクにおいて、TRAMを実証的に検証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:38:31 GMT)
Schema-Driven Information Extraction from Heterogeneous Tables [30.3] 本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:54:12 GMT)
Toward Generalist Anomaly Detection via In-context Residual Learning
with Few-shot Sample Prompts [30.3] Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、異なるアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
クエリ画像と数発のサンプルプロンプト間の残差の全体的評価に基づいて、通常のサンプルから異常を識別する補助データセットを用いて訓練する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:52:14 GMT)
Laser-written waveguide-integrated coherent spins in diamond [30.1] ダイヤモンド中の負電荷の窒素空孔中心のような量子放出体は、量子技術にとって魅力的なものである。
欠陥のスピンコヒーレンス特性を保ちながら、フォトニック構造に個々のエミッタを配置することは依然として困難である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:42:37 GMT)
DexCap: Scalable and Portable Mocap Data Collection System for Dexterous
Manipulation [30.1] 人間の手の動きデータからの模倣学習は、現実世界の操作タスクにおいて、人間のような器用さでロボットを倒すための有望な道を示す。
携帯型ハンドモーションキャプチャシステムであるDexCapとDexILを紹介する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:23:49 GMT)
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data [29.7] 状態空間モデルに基づくMambaは、テキストシーケンスをモデル化するための同等のパフォーマンスを実現することが示されている。
本稿では,Mambaアーキテクチャを任意の多次元データに拡張した汎用設計であるMamba-NDを提案する。
我々は,Mamba-NDが,多次元ベンチマークにおける最先端技術と性能の競争力を示すことを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:35:11 GMT)
Scissorhands: Scrub Data Influence via Connection Sensitivity in
Networks [29.7] 我々は、訓練されたモデルからデータの影響を消すために、Scisorhandsの新しい機械学習アプローチを提案する。
画像分類と画像生成タスクにまたがって行った実験の結果,Scisorhandsは既存の手法と比較して競合性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:38:33 GMT)
Authorship Style Transfer with Policy Optimization [29.6] オーサシップスタイルの転送は、ソースの本来の意味を保ちながら、指定されたテキストを指定されたターゲットに書き換えることを目的としている。
既存のアプローチでは、モデルトレーニングのための多くのターゲットスタイルの例が利用可能になっている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:34:54 GMT)
LF-PGVIO: A Visual-Inertial-Odometry Framework for Large Field-of-View
Cameras using Points and Geodesic Segments [29.5] 本研究では,大規模視野カメラ(FoV)のための視覚慣性オドメトリー(VIO)フレームワークを提案する。
本研究の目的は,大FoV全方位カメラを用いた点線オドメトリーの可能性を明らかにすることである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:52:35 GMT)
Disentangling Policy from Offline Task Representation Learning via
Adversarial Data Augmentation [29.5] オフラインメタ強化学習(OMRL)は、静的データセットに依存して、エージェントが新しいタスクに取り組むことができる。
本稿では,タスク表現学習から行動ポリシーの影響を解き放つ新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:38:36 GMT)
Reinforced Sequential Decision-Making for Sepsis Treatment: The POSNEGDM
Framework with Mortality Classifier and Transformer [29.4] 既存の機械学習手法による敗血症管理は、生存率50%未満のオフラインシナリオで苦労する。
本稿では, 革新的トランスフォーマーモデルとフィードバック強化を用いたPOSNEGDMフレームワークを提案する。
POSNEGDMフレームワークは患者の生存率を大幅に改善し、97.39%の患者を救った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:36:41 GMT)
Accelerated Inference and Reduced Forgetting: The Dual Benefits of
Early-Exit Networks in Continual Learning [29.4] アーリーエグジットネットワークは、ネットワークの早い段階で決定を行うことで、素早く予測できるため、時間とリソースを保存できる。
本研究の目的は,早期のネットワークの継続的な学習を探求することである。
本稿では,このバイアスを等しくし,ネットワーク性能を向上させるシンプルな手法であるタスクワイズログ補正(TLC)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:33:26 GMT)
Gujarati-English Code-Switching Speech Recognition using ensemble
prediction of spoken language [29.1] マルチヘッドアテンション機構において,言語固有のパラメータと説明可能性を導入する2つの手法を提案する。
WERを著しく削減できないにもかかわらず、本手法は音声データから正しい言語を予測することを約束している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:21:20 GMT)
SoK: Can Trajectory Generation Combine Privacy and Utility? [28.8] 本稿では,プライバシ保護トラジェクトリ・パブリッシング・アプローチを設計するためのフレームワークを提案する。
本稿では,提案フレームワークの文脈におけるトラジェクトリの最先端生成モデルの体系化に焦点をあてる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:25:14 GMT)
generAItor: Tree-in-the-Loop Text Generation for Language Model
Explainability and Adaptation [28.7] 大規模言語モデル(LLM)は、自動補完、補助的な書き込み、チャットベースのテキスト生成など、様々な下流タスクに広くデプロイされている。
本稿では,ビーム探索ツリーの視覚的表現を解析,説明,適応する中心的な要素とする,ループ内ツリーのアプローチを提案することで,この欠点に対処する。
視覚解析技術であるGenerAItorを,タスク固有のウィジェットで中央ビーム探索木を拡大し,ターゲットとした可視化とインタラクションの可能性を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:09:15 GMT)
Entangled View-Epipolar Information Aggregation for Generalizable Neural
Radiance Fields [28.5] 一般化可能なNeRFは、新しいシーンにまたがる新しいビューを合成することができ、バニラのNeRFでシーン固有のリトレーニングを不要にする。
EVE-NeRFと呼ばれるエンタングルビュー・エピポーラ情報集約手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:57:53 GMT)
Graph Unlearning with Efficient Partial Retraining [28.4] グラフニューラルネットワーク(GNN)は、様々な現実世界のアプリケーションで顕著な成功を収めている。
GNNは、望ましくないグラフデータに基づいてトレーニングされ、パフォーマンスと信頼性を低下させることができる。
学習不能なGNNのモデルユーティリティをよりよく維持するグラフアンラーニングフレームワークであるGraphRevokerを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:22:10 GMT)
Transformations in Learned Image Compression from a Modulation
Perspective [28.4] 変調の観点から学習画像圧縮(lic)における統一変換法を提案する。
提案手法は,複雑さを増大させることなく,コダックデータセット上のGDNよりも3.52$%のBDレートの低減を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:57:45 GMT)
Motion Mamba: Efficient and Long Sequence Motion Generation with
Hierarchical and Bidirectional Selective SSM [28.4] 状態空間モデル(SSM)の最近の進歩は、長いシーケンスモデリングにおいてかなりの可能性を秘めている。
我々は,SSMを用いた先駆的な動き生成モデルを示す,シンプルで効率的な手法であるモーション・マンバを提案する。
提案手法は,HumanML3DおよびKIT-MLデータセットの最大50%のFID改善と最大4倍の高速化を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:25:29 GMT)
Annotations on a Budget: Leveraging Geo-Data Similarity to Balance Model
Performance and Annotation Cost [28.4] モデルの性能とアノテーションのコストのバランスをとるためにアノテートするデータを特定する手法を提案する。
私たちのアプローチはまず、トレーニングデータセットにあるものと最も視覚的に異なるトピックのイメージを持つ国を見つけることです。
次に、これらのトピックに高い視覚的類似性を持つ国を特定し、これらの国のデータを用いてトレーニングデータを補完することで、モデルの性能を改善し、アノテーションのコストを削減できることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:27:17 GMT)
Deep Learning-Assisted Parallel Interference Cancellation for Grant-Free
NOMA in Machine-Type Communication [28.3] そこで本稿では,アリンクフリーな非直交多重アクセス(NOMA)システムにおける共同アクティビティ検出(AD),チャネル推定(CE),データ検出(DD)の新たなアプローチを提案する。
我々のアプローチは、並列干渉キャンセル(PIC)にインスパイアされた反復的かつ並列干渉除去戦略を採用する。
我々は3つのPICフレームワークを開発し、それぞれがコヒーレンスまたは非コヒーレンススキーム用に設計されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:24:37 GMT)
A Question-centric Multi-experts Contrastive Learning Framework for
Improving the Accuracy and Interpretability of Deep Sequential Knowledge
Tracing Models [28.2] 知識追跡は,学生の今後の業績を予測する上で重要な役割を担っている。
ディープニューラルネットワーク(DNN)は、KT問題を解決する大きな可能性を示している。
しかし、KTプロセスのモデル化にディープラーニング技術を適用する際には、いくつかの重要な課題がある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:15:42 GMT)
Near-Interpolators: Rapid Norm Growth and the Trade-Off between
Interpolation and Generalization [28.0] ほぼ補間された線形回帰器の一般化能力について検討する。
for $tau$ fixed, $boldsymbolbeta$ has squared $ell$-norm $bbE[|boldsymbolbeta|_22].
我々は、同様の現象が、ほぼ補間された浅いニューラルネットワークに現れることを実証的に証明した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:47:00 GMT)
Improving Reinforcement Learning from Human Feedback Using Contrastive
Rewards [28.0] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)を人間の好みに合わせるために使われる主流パラダイムである。
しかし、既存のRLHFは、様々な情報源からのノイズに対して脆弱で敏感な正確で情報的な報酬モデルに大きく依存している。
本研究では,報酬に対するペナルティ項を導入することで,報酬モデルの有効性を向上する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:51:57 GMT)
Enhancing Depression-Diagnosis-Oriented Chat with Psychological State Tracking [28.0] Depression-diagnosis-oriented chatは、自己表現の患者を誘導し、うつ病検出の主要な症状を収集することを目的としている。
最近の研究は、面接に基づくうつ病の診断をシミュレートするために、タスク指向対話とchitchatを組み合わせることに焦点を当てている。
対話をガイドするための明確なフレームワークは検討されていない。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:17:01 GMT)
IM-Unpack: Training and Inference with Arbitrarily Low Precision
Integers [27.6] GEMM(GEneral Matrix Multiply)は、ディープラーニングにおける中心的な演算であり、計算フットプリントの最大部分に相当する。
一般的な戦略は、行列の元のエントリを近似するために低ビット幅整数を使用することである。
これにより効率が向上するが、しばしば丸め誤差を抑えるための高度な技術を必要とする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:44:27 GMT)
A Data Perspective on Enhanced Identity Preservation for Diffusion
Personalization [27.4] 大規模なテキスト画像モデルは、自然言語を使って画像を生成する能力に革命をもたらした。
これはテキスト・ツー・イメージ・モデルのパーソナライズ方法への関心につながった。
テキストと画像の両レベルで、新しい正規化データセット生成戦略を導入する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:19:48 GMT)
SIFiD: Reassess Summary Factual Inconsistency Detection with LLM [27.4] 本研究では,Large Language Models (LLMs) を用いた要約不整合検出について再検討する。
本稿では,自然言語推論を用いて文書内のキー文を識別するSIFiD(Summary Inconsistency Detection with Filtered Document)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:41:51 GMT)
Towards Saner Deep Image Registration [27.3] 本稿では,衛生検査顕微鏡による一般的な学習に基づく深層登録の動作について検討する。
既存のほとんどの登録は、過度に最適化された画像の類似性により、逆一貫性が低く、同一のペアの非識別に悩まされている。
本稿では, 逆整合性誤差を低減し, 同時に識別力を高めるために, 奥行きモデルに2つの正準チェックを課す新しい正則化法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:29:56 GMT)
Maxwell's Demon at Work: Efficient Pruning by Leveraging Saturation of
Neurons [27.3] 死ニューロンの増殖を動的に制御するDemPを導入する。
CIFAR10とImageNetデータセットの実験では、精度とスパーシリティのトレードオフが優れている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:28:06 GMT)
TNPAR: Topological Neural Poisson Auto-Regressive Model for Learning
Granger Causal Structure from Event Sequences [27.3] イベントシーケンスからグランガー因果関係を学ぶことは、さまざまなアプリケーションにまたがって難しいが必須の課題である。
トポロジカル・ニューラル・ポアソン自己回帰モデルと2つのプロセスの融合を考案する。
シミュレーションおよび実世界のデータを用いた実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:39:03 GMT)
Rethinking Generative Large Language Model Evaluation for Semantic
Comprehension [27.2] 本稿では,複数の選択質問応答(MCQA)の評価方法について再検討する。
RWQ-Elo レーティングシステムを導入し,24大言語モデル (LLM) を2プレイヤーの競争形式で動作させ,GPT-4 を審査員とする。
このシステムは実世界の利用を反映するように設計されており、そのためにRWQ(Real-world Question')と呼ばれる新しいベンチマークをコンパイルした。
我々の分析は、我々のRWQ-Eloシステムの安定性、新しいモデル登録の可能性、そしてその可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:59:48 GMT)
xMLP: Revolutionizing Private Inference with Exclusive Square Activation [27.1] プライベート推論(PI)は、機密情報を漏らすことなく、ディープニューラルネットワーク(DNN)がプライベートデータを扱うことを可能にする。
DNNにおけるReLUのような非線形アクティベーションの使用は、急激なPIレイテンシにつながる可能性がある。
精度と効率の両面においてパリティを維持しつつ,二乗アクティベーションのみを利用する新しいDNNアーキテクチャであるxMLPを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:46:56 GMT)
Eliminating Cross-modal Conflicts in BEV Space for LiDAR-Camera 3D
Object Detection [26.8] 最近の3Dオブジェクト検出器は、一般的にマルチセンサーデータを使用し、共有鳥眼ビュー(BEV)表現空間におけるマルチモーダル特徴を統一する。
従来手法では、モーダル間衝突のない融合型BEV機能の生成に制限があった。
本稿では,BEV空間における外因性/外因性衝突を明示的に除去する新しいECFusion法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:16:20 GMT)
Backdoor Attack with Mode Mixture Latent Modification [26.7] 本研究では,微調整の要領でバックドアを注入するために,クリーンモデルへの最小限の変更しか必要としないバックドア攻撃パラダイムを提案する。
提案手法の有効性を4つのベンチマーク・データセットで評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:59:34 GMT)
Gradient Alignment for Cross-Domain Face Anti-Spoofing [26.5] 本稿では,新たな学習目標であるGAC-FASを紹介する。
従来のシャープネス対応最小化器とは異なり、GAC-FASは各領域の上昇点を特定し、一般化勾配の更新を制御する。
ドメイン間FASデータセットの厳密な検証によりGAC-FASの有効性を実証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:54:21 GMT)
Large, Small or Both: A Novel Data Augmentation Framework Based on
Language Models for Debiasing Opinion Summarization [26.4] 現在の意見要約アプローチは、負のテキストの入力から負の要約を生成するのに消極的である。
本稿では,大小の言語モデルと大小の言語モデルに基づく新しいデータ拡張フレームワークを提案する。
我々のフレームワークは、大きなモデルだけでなく、より経済的にも、感情バイアスを効果的に軽減することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:37:03 GMT)
RSBuilding: Towards General Remote Sensing Image Building Extraction and
Change Detection with Foundation Model [26.3] 本稿では、基礎モデルの観点から、RSBuildingと呼ばれる総合的なリモートセンシング画像構築モデルを提案する。
RSBuildingはクロスシーンの一般化とタスク理解を強化するように設計されている。
我々のモデルは最大245,000の画像からなるデータセットでトレーニングされ、複数のビルの抽出と変更検出データセットで検証された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:51:59 GMT)
Learning Generalizable Feature Fields for Mobile Manipulation [25.9] 本稿では,実時間でのナビゲーションと操作の統一表現として機能する,シーンレベルの一般化可能なニューラル特徴場であるGeFFを提案する。
マニピュレータを備えた四足歩行ロボットにGeFFを配置することにより,本手法の有効性を実証する。
我々は,動的シーンでオープン語彙移動操作を行う場合,GeFFのオープンセットオブジェクトへの一般化能力と実行時間を評価する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:51:55 GMT)
Revisiting the Last-Iterate Convergence of Stochastic Gradient Methods [25.8] グラディエント・Descent(SGD)アルゴリズムは、実際の性能が良く、理論的な理解が欠如していることから、人々の関心を喚起している。
有限収束がより広い合成最適化や非ユークリッドノルムに証明可能な拡張が可能かどうかはまだ不明である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:53:46 GMT)
On the Last-Iterate Convergence of Shuffling Gradient Methods [25.8] 対象値に関して勾配法をシャッフルする際の最終点収束率を示す。
我々の結果は、(ほぼ)既存のラストイテレートの下限と一致するか、あるいは、平均的なイテレートの前の最高の上限と同速である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:01:17 GMT)
Optimizing Polynomial Graph Filters: A Novel Adaptive Krylov Subspace
Approach [25.8] 我々は,Krylov部分空間に基づく適応グラフフィルタを開発し,複素グラフをフィルタする。
我々は、一連の実世界のデータセットにまたがって広範な実験を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:26:17 GMT)
Physics-Inspired Deep Learning Anti-Aliasing Framework in Efficient
Channel State Feedback [25.7] この研究は、アンダーサンプリングによるギャップに対処するための後処理ソリューションとして、gNBで新しいCSIアップサンプリングフレームワークを導入している。
また,提案したアルゴリズムをISTA-Netアーキテクチャと統合する学習手法を開発した。
以上の結果から,ルールベースと深層学習の両手法が従来の手法や最先端の手法よりも性能的に優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:40:51 GMT)
SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large
Language Models by Summarizing Training Trajectories of Small Models [25.4] 教師付き微調整のための効率的でスケーラブルなデータ選択手法を提案する。
S2Lは数学的な問題解決のために,SFTのデータ効率を著しく向上させることを示した。
また,S2Lは対象モデルよりも40倍小さい参照モデルを用いてデータ選択を行うことができることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:45:33 GMT)
In-context Learning with Retrieved Demonstrations for Language Models: A
Survey [24.9] インコンテクスト学習者(ICL)は入力コンテキストでのデモを少しだけ行うだけで、新しいタスクに適応できる。
最近の開発では、固定された一連のデモを使う代わりに、各入力クエリに合わせたデモを検索する。
本稿では,検索モデル,検索訓練手順,推論アルゴリズムの異なる設計選択について論じ,比較する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:38:53 GMT)
PoRF: Pose Residual Field for Accurate Neural Surface Reconstruction [24.9] 本稿では、ポーズ更新の回帰に対応づける新しい暗黙の表現である、ポーズ残留フィールド(PoRF)を紹介する。
DTUデータセットでは,COLMAPポーズの回転誤差を78%削減し,チャンファー距離を3.48mmから0.85mmに短縮した。
カジュアルにキャプチャされた360度ビデオを含むMobileデータセットでは、ARKitのポーズを洗練し、リコンストラクションF1スコアを69.18から75.67に改善する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:39:02 GMT)
RIME: Robust Preference-based Reinforcement Learning with Noisy
Preferences [24.8] 嗜好に基づく強化学習(PbRL)は、報酬信号として人間の嗜好を活用することにより、報酬工学の必要性を回避する。
現在のPbRLアルゴリズムは、ドメインエキスパートからの高品質なフィードバックを過度に頼っているため、堅牢性が欠如している。
雑音の選好から効果的な報酬学習のための頑健なPbRLアルゴリズムであるRIMEを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:48:46 GMT)
Deep learning for multi-label classification of coral conditions in the
Indo-Pacific via underwater photogrammetry [24.0] 本研究はインド太平洋におけるサンゴの一般的な条件と関連するストレスを表わしたデータセットを作成する。
既存の分類アルゴリズムを評価し、サンゴの条件を自動的に検出し、生態情報を抽出する新しいマルチラベル手法を提案した。
提案手法はサンゴの条件を, 健康, 危害, 死, 汚物として正確に分類する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:15:50 GMT)
Deep learning for multi-label classification of coral conditions in the
Indo-Pacific via underwater photogrammetry [24.0] 本研究はインド太平洋におけるサンゴの一般的な条件と関連するストレスを表わしたデータセットを作成する。
既存の分類アルゴリズムを評価し、サンゴの条件を自動的に検出し、生態情報を抽出する新しいマルチラベル手法を提案した。
提案手法はサンゴの条件を, 健康, 危害, 死, 汚物として正確に分類する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:15:50 GMT)
Customizing Graph Neural Networks using Path Reweighting [23.7] 経路再重み付きカスタムグラフニューラルネットワーク(略してCustomGNN)という新しいGNNソリューションを提案する。
具体的には、提案したCustomGNNは、特定の下流タスクのハイレベルなセマンティクスを自動的に学習し、意味論的に関連するパスをハイライトし、グラフ内のタスク非関連ノイズをフィルタリングする。
ノード分類タスクの実験では、CustomGNNは3つの標準グラフデータセットと4つの大きなグラフデータセットに対して最先端の精度を達成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:14:31 GMT)
LookupFFN: Making Transformers Compute-lite for CPU inference [23.6] GPUクラスタは現在、大規模なディープニューラルネットワーク(DNN)モデルをトレーニングするための事実上の選択肢です。
ワークフローの容易さ、セキュリティ、コストなど、いくつかの理由から、CPUが業界の多くの分野において、定期的な使用における推論に有効かどうかの調査が進められている。
本稿では,GEMMをベースとしたFeed Forward Networks (FFNs) という,現代的なアーキテクチャにおけるワークホースであるモジュールについて検討し,計算的(FLOP-)な表現の程度を評価する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:26:16 GMT)
On the Effectiveness of Large Language Models in Domain-Specific Code
Generation [23.3] ChatGPTのような大規模言語モデル(LLM)は、コード生成において顕著な能力を示している。
本稿では,ドメイン固有コード生成におけるLLMの詳細な研究を行う。
コード生成プロセスにAPI知識を効率的に組み込む方法について検討する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:15:51 GMT)
Test-Time Personalization with Meta Prompt for Gaze Estimation [23.0] 自然言語処理(NLP)の最近の進歩からインスピレーションを得て、テスト時間に無数のパラメータ"prompts"を更新する。
我々は、その更新が目標に合致することを確実にするために、プロンプトをメタ学習することを提案する。
実験の結果,メタ学習プロンプトは単純な対称性の損失でも効果的に適応できることがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:06:06 GMT)
Adaptive Fusion of Single-View and Multi-View Depth for Autonomous
Driving [22.6] 現在のマルチビュー深度推定法やシングルビューおよびマルチビュー融合法は、ノイズのあるポーズ設定で失敗する。
本稿では,高信頼度なマルチビューと単一ビューの結果を適応的に統合する単一ビュー・多ビュー融合深度推定システムを提案する。
本手法は,ロバストネス試験において,最先端のマルチビュー・フュージョン法より優れる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:18:35 GMT)
From Paper to Card: Transforming Design Implications with Generative AI [22.4] 学術論文を出版する際、HCIコミュニティ内では、デザイン含意のコミュニケーションが一般的である。
1つの解決策は、文書から貴重な洞察を伝える翻訳リソースの形式としてデザインカードを使用することである。
LLMとテキスト・ツー・イメージ・モデルを用いて学術論文からデザインカードを作成するシステムを構築した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:47:28 GMT)
Algebraic discrete quantum harmonic oscillator with dynamic resolution
scaling [22.2] 我々は離散量子調和振動子(DQHO)の代数的定式化を開発する。
この定式化はシュラー・オーディンガー方程式の離散化と特殊関数の反復関係に依存しない。
DQHOのコヒーレントな状態が構築され、期待される位置は古典的な高調波発振器として振動することが証明されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:33:39 GMT)
SSM Meets Video Diffusion Models: Efficient Video Generation with
Structured State Spaces [22.1] 映像生成のための近年の拡散モデルでは、時間的特徴を抽出するために注意層を主に利用している。
我々は、より長いビデオシーケンスを生成するために状態空間モデル(SSM)を活用することを提案する。
我々のSSMベースのモデルは、注目ベースのモデルと競合するFVDスコアを維持しながら、長いシーケンスでメモリ消費を大幅に削減することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:53:56 GMT)
QUASAR: QUality and Aesthetics Scoring with Advanced Representations [22.1] 本稿では,画像品質と美学評価のための新しいデータ駆動非パラメトリック手法を提案する。
データに効率的な画像アンカーを提案することで、表現力のあるテキスト埋め込みの必要性を解消する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:28:39 GMT)
Enhancing Transfer Learning with Flexible Nonparametric Posterior
Sampling [22.0] 本稿では、分散シフト問題に対処するフレキシブルな後続サンプリング法である非パラメトリックトランスファーラーニング(NPTL)を提案する。
NPTLは、上流と下流のタスク間の分散シフトを伴うかもしれない伝達学習シナリオに適している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:26:58 GMT)
Let Storytelling Tell Vivid Stories: An Expressive and Fluent Multimodal
Storyteller [22.0] 我々はLLaMSと呼ばれる新しいパイプラインを提案し、マルチモーダルな人間レベルのストーリーを生成する。
まず、実写コンテンツ表現を強化するために、シーケンスデータ自動強調戦略を用いる。
次に,SQ-Adatpterモジュールを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:07:00 GMT)
Entropic (Gromov) Wasserstein Flow Matching with GENOT [21.9] テクスチジェニックエントロピック・ニューラルOT(GENOT)フレームワークは、最適テクスチテントロピ結合の条件分布$pi_varepsilon(*y|*x)$をモデル化する。
我々は、Gromov-Wasserstein問題に対して、サンプルベースで不均衡な解によって導かれる、任意のコストで、 GenOT がテキストタクロス空間をいかに輸送できるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:24:06 GMT)
Efficient Language Model Architectures for Differentially Private
Federated Learning [21.3] クロスデバイス・フェデレーション・ラーニング(Cross-device Federated Learning, FL)は、デバイスを離れることなく、数百万のエッジデバイスに分散したデータ上でモデルをトレーニングするテクニックである。
言語モデルの集中的なトレーニングでは、安定性とパフォーマンスの向上を提供するため、適応が望ましい。
ニューラルリカレントセルにおけるシグモイドとタンハの活性化を修飾することにより、SI CIFG (Coupled Input Forget Gate) 再カレントネットワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:21:48 GMT)
ChatASU: Evoking LLM's Reflexion to Truly Understand Aspect Sentiment in
Dialogues [21.3] 本稿では、対話シナリオにおけるアスペクト感情を理解するLLMの能力を探求する、Chat-based Aspect Sentiment Understanding (ChatASU)タスクを提案する。
具体的には,ChatASUのバックボーンとしてChatGLMを用いた信頼自己回帰アプローチ(TSA)を提案する。
具体的には、このTSAは、ACRタスクを補助タスクとして扱い、主要なASUタスクの性能を高める。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:12:36 GMT)
TaskCLIP: Extend Large Vision-Language Model for Task Oriented Object
Detection [21.1] タスク指向オブジェクト検出は、特定のタスクを達成するのに適したオブジェクトを見つけることを目的としている。
最近のソリューションは主にオールインワンモデルです。
汎用オブジェクト検出とタスク誘導オブジェクト選択からなるより自然な2段階設計であるTaskCLIPを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:33:02 GMT)
Self-paced Multi-grained Cross-modal Interaction Modeling for Referring
Expression Comprehension [21.0] 参照表現理解(REC)は一般的に、正確な推論を実現するために、視覚的・言語的モダリティの多種多様な情報を必要とする。
異なるモダリティから多粒度情報を集約し、ハードな例から豊富な知識を抽出する方法は、RECタスクにおいて不可欠である。
本稿では,言語と視覚のローカライズ機能を改善するセルフペースト・マルチモーダル・インタラクション・モデリング・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:13:27 GMT)
Calibrating Multi-modal Representations: A Pursuit of Group Robustness
without Annotations [21.0] CLIPのような微調整済みの視覚言語モデルは、さまざまな下流タスクで成功している。
これらの調整されたモデルは高度に専門化され、実際の展開の実用性が制限される傾向にある。
微調整CLIPのための軽量表現校正法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:47:17 GMT)
GPT-4V(ision) is a Generalist Web Agent, if Grounded [20.9] GPT-4Vは、手動でウェブサイト上のアクションに計画を立てれば、ライブWebサイト上で51.1タスクを完了できることを示す。
本稿では,Web上での視覚的理解と行動の統合にLMMの力を利用するWebエージェントであるSEEACTを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:14:33 GMT)
WanJuan-CC: A Safe and High-Quality Open-sourced English Webtext Dataset [20.9] 本稿では,Common Crawlデータから得られた安全で高品質なウェブテキストデータセットであるWanJuan-CCを提案する。
包括的なプロセスは、抽出、ルールフィルタリング、ファジィ重複、コンテントセーフティフィルタリング、データ品質フィルタリングを含むCommon Crawlデータを扱うように設計されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:27:52 GMT)
A Survey of Lottery Ticket Hypothesis [20.6] Lottery Ticket仮説は、高密度ニューラルネットワークモデルには高度にスパースなサブネットワークが含まれており、独立にトレーニングされた場合、元のモデルよりもパフォーマンスが向上する、と述べている。
この調査は、LTHの現状を詳細に把握し、実験を行い、最も更新されたベースラインと比較する、完全に保守されたプラットフォームを開発することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:35:48 GMT)
A Non-Intrusive Neural Quality Assessment Model for Surface
Electromyography Signals [20.3] 本研究では,SEMG信号のSNRを予測する新しい非侵入モデルQASE-netを提案する。
実験フレームワークは,2つのオープンアクセスデータベースから実世界のsEMGとECGデータを利用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:44:58 GMT)
Neural 3D Strokes: Creating Stylized 3D Scenes with Vectorized 3D
Strokes [20.3] ニューラル3Dストロークス(Neural 3D Strokes)は、多視点2D画像から任意の新しいビューで3Dシーンのスタイリング画像を生成する新しい技術である。
提案手法は,ベクトルストロークによる人間のアートワークのプログレッシブ・ペインティングの過程をシミュレートし,イメージ・ツー・ペインティング法からインスピレーションを得ている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:34:53 GMT)
StoRM: A Diffusion-based Stochastic Regeneration Model for Speech
Enhancement and Dereverberation [20.3] 本稿では,予測モデルによる推定値がさらなる拡散のガイドとして提供される再生手法を提案する。
提案手法は, 高い品質のサンプルを作成しながら, 発声・呼吸アーチファクトを除去するために, 予測モデルを用いていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:31:01 GMT)
BAGEL: Bootstrapping Agents by Guiding Exploration with Language [20.2] この研究は、人間の監督なしに言語モデル(LM)エージェントをブートストラップする方法であるBAGELを提示する。
BAGELのデモを使用して、ゼロショットLMエージェントをテスト時に、検索したデモよりもコンテキスト内学習により適応する。
ToolQAとMiniWob++では2-13%以上の絶対値の改善が見られ、最大で13倍のエラーが発生しています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:59:15 GMT)
A Bayesian Approach to OOD Robustness in Image Classification [20.1] 対象分類のためのOODロバストネスに対する新しいベイズ的アプローチを導入する。
我々は、CompNetsがvon Mises-Fisher(vMF)カーネルで表される特徴ベクトル上に定義された生成ヘッドを含んでいるという事実を活用する。
これにより、ソースとターゲットドメインの中間に位置するvMFカーネルの遷移辞書を学習することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:15:08 GMT)
Online Continual Learning For Interactive Instruction Following Agents [20.1] このような学習シナリオは,ロボットエージェントが世界を探索し,知覚する上で,継続的に世界を学ぶことが求められているため,現実的ではない,と我々は主張する。
本研究では,新しい行動学習と新しい環境学習という,エンボディエージェントのための2つの連続学習環境を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:33:48 GMT)
Robust Synthetic-to-Real Transfer for Stereo Matching [19.8] 未確認領域に対するロバスト性を損なうことなく、細調整のステレオマッチングネットワークを探索する。
我々のモチベーションは、微調整においてGTとPLを比較したことである。
本研究では,凍結教師,指数移動平均教師(EMA)教師,学生ネットワークからなる微調整にこの差を利用するための枠組みを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:50:05 GMT)
A survey on efficient vision transformers: algorithms, techniques, and
performance benchmarking [19.7] Vision Transformer (ViT) アーキテクチャは、コンピュータビジョンアプリケーションに取り組むために人気が高まり、広く使われている。
本稿では,ビジョントランスフォーマーを効率的にするための戦略を数学的に定義し,最先端の方法論を記述・議論し,その性能を異なるアプリケーションシナリオで解析する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:33:20 GMT)
CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in
Korean [19.6] 韓国における1,995対のQAペアからなる文化・言語知能のベンチマークについて紹介する。
CLIcKは、公式の韓国の試験と教科書からデータを入手し、質問を言語と文化の2つの主要なカテゴリで11のカテゴリに分けている。
CLIcKを用いて、13の言語モデルを用いて、パフォーマンスを評価する。評価では、カテゴリ間でのパフォーマンスに関する洞察と、その理解に影響を与えるさまざまな要因を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:33:06 GMT)
Emerging Synergies Between Large Language Models and Machine Learning in
Ecommerce Recommendations [19.4] 大規模言語モデル(LLM)は、言語理解と生成の基本的なタスクにおいて優れた機能を持つ。
機能エンコーダとしてLLMを用いたユーザとアイテムの表現を学習するための代表的なアプローチを提案する。
次に、協調フィルタリング強化レコメンデーションシステムのためのLLM技術の最新技術について概説した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:29:07 GMT)
tdCoxSNN: Time-Dependent Cox Survival Neural Network for Continuous-time
Dynamic Prediction [19.4] 本研究では,時間依存型Coxサバイバルニューラルネットワーク(tdCoxSNN)を提案する。
提案手法と共同モデリングおよびランドマーク手法を広範囲なシミュレーションにより評価・比較する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:09:56 GMT)
Bridging Cross-task Protocol Inconsistency for Distillation in Dense
Object Detection [19.1] 本研究では,高密度物体検出に適したクロスタスク一貫したプロトコルを用いた新しい蒸留法を提案する。
分類蒸留では,教師モデルと学生モデルの両方の分類ロジットマップを複数の二分分類マップとして定式化し,各地図に二分分類蒸留損失を適用した。
提案手法は単純だが有効であり,既存の手法よりも優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:29:51 GMT)
TutoAI: A Cross-domain Framework for AI-assisted Mixed-media Tutorial
Creation on Physical Tasks [19.0] TutoAIは、物理的なタスクでAI支援のミックスメディアチュートリアルを作成するためのクロスドメインフレームワークである。
既存の作業を調査することで、一般的なチュートリアルコンポーネントを蒸留する。
コンポーネント抽出のためのAIモデルを特定し,組み立て,評価する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:46:59 GMT)
Unsupervised Acoustic Scene Mapping Based on Acoustic Features and
Dimensionality Reduction [18.6] データの自然な構造を生かした教師なしのデータ駆動型アプローチを導入する。
本手法は,実測値から標準データ座標を学習するためのオフライン深層学習方式であるローカル共形オートエンコーダ(LOCA)に基づいて構築する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:48:40 GMT)
Privacy-Preserving Collaborative Split Learning Framework for Smart Grid
Load Forecasting [18.2] 従来のMLでは、中央サーバにデータ転送を必要とする複数のスマートメーターのデータを使用して、単一のグローバルモデルをトレーニングすることができる。
本稿では,この問題を緩和するために,負荷予測のための分割学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:37:07 GMT)
LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content [18.0] 尾の認識は、尾のカテゴリから良い表現を学習し、すべてのカテゴリで不均衡に対処する必要があるため、困難である。
そこで本研究では,生成コンテンツを利用した長期認識を実現するための,新たな生成および微調整フレームワークLTGCを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:26:39 GMT)
LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content [18.0] 尾の認識は、尾のカテゴリから良い表現を学習し、すべてのカテゴリで不均衡に対処する必要があるため、困難である。
そこで本研究では,生成コンテンツを利用した長期認識を実現するための,新たな生成および微調整フレームワークLTGCを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:26:39 GMT)
Epoch-evolving Gaussian Process Guided Learning [17.9] GPGL(Epoch-evolving Gaussian Process Guided Learning)は,バッチレベル分布とグローバルデータ分布の相関情報を特徴付けることを目的とする。
文脈ラベルと基底真理ラベルのガイダンスにより、GPGLスキームは三角形の整合性損失でモデルパラメータを更新することで、より効率的な最適化を提供する。
我々のGPGLスキームはより一般化され、現在のディープモデルに自然に適用でき、主要なデータセット上で既存のバッチベースの最先端モデルよりも優れている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:00:14 GMT)
Majority-of-Three: The Simplest Optimal Learner? [17.9] ハンネケのアルゴリズムは、多くのERM分類器の多数票を返すため、非常に複雑である。
このアルゴリズムは,その誤差に縛られた最適逆予測を実現する。
我々は、このアルゴリズムが実際に高い確率構造において最適であると推測する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:01:30 GMT)
Efficient GPU implementation of randomized SVD and its applications [17.7] 行列分解は、次元データの圧縮やディープラーニングアルゴリズムなど、機械学習においてユビキタスである。
行列分解の典型的な解は、計算コストと時間を大幅に増大させる複雑さを持つ。
我々は,計算行列分解の計算負担を軽減するために,現代のグラフィカル処理ユニット(GPU)で並列に動作する効率的な処理操作を利用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:12:29 GMT)
AACP: Aesthetics assessment of children's paintings based on
self-supervised learning [17.7] 小児絵画の美学評価(AACP)は画像美学評価(IAA)の重要な分野である
これまでのアプローチでは、大規模なデータセットのトレーニングと、画像に対する美学スコアの提供に頼っていた。
子どもの絵の美学評価データセットを構築し,自己指導型学習モデルを構築した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:07:00 GMT)
Multi-View Variational Autoencoder for Missing Value Imputation in
Untargeted Metabolomics [17.6] 本稿では,WGSデータと参照代謝産物の情報を利用して未知の代謝産物をインプットする新しい手法を提案する。
両オミクスデータの潜伏表現を学習することにより,欠落したメタボロミクス値を効果的にインプットすることができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:34:13 GMT)
SemCity: Semantic Scene Generation with Triplane Diffusion [17.4] セムシティ」は現実世界の屋外環境におけるセマンティックシーン生成のための3次元拡散モデルである。
本研究では,三面体表現をシーン分布のプロキシ形式として利用し,拡散モデルを用いて学習する。
私たちは、シーン内のオブジェクトのシームレスな追加、削除、修正を容易にするトリプレーン操作を示します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:59:08 GMT)
JSTR: Joint Spatio-Temporal Reasoning for Event-based Moving Object
Detection [17.3] イベントベースの移動オブジェクト検出は、静的なバックグラウンドと移動オブジェクトが混在する難しいタスクである。
イベントベース移動物体検出のための新しい共同時間推論法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:22:52 GMT)
Bring Event into RGB and LiDAR: Hierarchical Visual-Motion Fusion for
Scene Flow [17.2] 単一RGBまたはLiDARは、挑戦的なシーンフローのメインストリームセンサーである。
既存の手法では、移動空間における相互補完的な知識を直接融合する融合戦略を採用している。
シーンフローのための新しい階層型視覚運動融合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:15:19 GMT)
Towards a Dynamic Future with Adaptable Computing and Network
Convergence (ACNC) [17.2] 本稿では,コンピュータとネットワークリソースの協調オーケストレーションを目的とした自律機械学習(ML)支援機構として,適応型CNC(ACNC)の概念を提案する。
ACNCは、状態認識とコンテキスト検出の2つの主要な機能を含んでいる。
継続的学習が採用され、システムの状態を専用のMLエージェントによって制御されたコンテキストに分類することで、効率的に運用することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:03:16 GMT)
Uncertainty-guided Contrastive Learning for Single Source Domain
Generalisation [17.1] 本稿では,Contrastive Uncertainty Domain Generalisation Network(CUDGNet)と呼ばれる新しいモデルを紹介する。
鍵となるアイデアは、架空のドメインジェネレータを通じて、入力空間とラベル空間の両方のソース容量を増大させることである。
また,提案手法は,1つのフォワードパスからジェネレータサブネットワークを経由した推論時間における効率的な不確実性推定も提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:47:45 GMT)
Synth$^2$: Boosting Visual-Language Models with Synthetic Captions and
Image Embeddings [16.9] 高品質な人ラベル画像キャプチャーデータセットの作成は、視覚言語モデル(VLM)の開発において大きなボトルネックとなる。
本稿では,Large Language Models(LLMs)と画像生成モデルの強みを活用して,効率的なVLM学習のための合成画像テキストペアを作成する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:36:42 GMT)
Domain Adaptation Using Pseudo Labels [16.8] ラベル付き対象データがない場合、教師なしのドメイン適応アプローチは、ソースとターゲットドメインの限界分布を整合させようとする。
我々は,複数段階の擬似ラベル修正手法を用いて,対象ドメインの正確なラベルを決定するために事前訓練ネットワークをデプロイする。
複数のデータセットに対する結果から, 複雑な最先端技術と比較して, 簡単な手順の有効性が示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:59:34 GMT)
Boosting keyword spotting through on-device learnable user speech
characteristics [16.6] 常時オンのTinyML制約されたアプリケーションのキーワードスポッティングシステムは、オンサイトチューニングを必要とする。
ターゲットユーザの音声特異性に適応するには、多くのドメイン内サンプルが必要であり、多くの場合、現実のシナリオでは利用できない。
本稿では,事前学習されたバックボーンとユーザの音声特性を学習するユーザ認識を組み込んだ,デバイス上での新たな学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:41:31 GMT)
Category-Agnostic Pose Estimation for Point Clouds [16.5] オブジェクトポーズ推定の目標は、RGB-D入力における特定のオブジェクトのポーズを視覚的に決定することである。
インスタンスベースとカテゴリベースの両方のメソッドは、目に見えないカテゴリの未確認オブジェクトを扱うことができない。
本稿では,カテゴリ情報を必要とせずに点雲のポーズ推定のための幾何学的特徴を導入する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:28:11 GMT)
One for All and All for One: GNN-based Control-Flow Attestation for
Embedded Devices [16.4] Control-Flow (CFA) は、エンティティ(検証者)がリモートコンピュータシステム上でのコード実行の整合性を検証するためのセキュリティサービスである。
既存のCFAスキームは、証明者の内部状態へのアクセスを要求するなど、非現実的な仮定に悩まされる。
RAGEは、最小限の要件を持つ、新しくて軽量なCFAアプローチです。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:00:06 GMT)
Speak It Out: Solving Symbol-Related Problems with Symbol-to-Language
Conversion for Language Models [16.3] 記号は抽象的推論、化学特性予測、テーブル質問応答といった様々なタスクで重要な役割を果たしている。
印象的な自然言語理解能力にもかかわらず、シンボルに対する大きな言語モデルの推論能力は依然として不十分である。
本稿では,自然言語で表現された情報を用いて,大規模言語モデルによるシンボル関連問題の解法を可能にする,S2L( symbol-to- language)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:48:17 GMT)
SVD-LLM: Truncation-aware Singular Value Decomposition for Large
Language Model Compression [16.2] 大規模言語モデル(LLM)のための新しいSVDベースの圧縮手法であるSVD-LLMを提案する。
SVD-LLMは、特異値と圧縮損失の直接マッピングを保証するために、トラクション対応のデータホワイトニング戦略を組み込んでいる。
SVD-LLMを3つのLLMファミリーの合計11のデータセットと7つのモデルで4つのスケールで評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:31:18 GMT)
COVID-19 Computer-aided Diagnosis through AI-assisted CT Imaging
Analysis: Deploying a Medical AI System [16.2] 我々は,CT画像の自動解析を目的とした最先端AIシステムの統合と信頼性,迅速な展開について紹介する。
提案システムは、医師の発見時間を短縮し、新型コロナウイルス検出の全体的な効率を高めることが期待されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:54:57 GMT)
Time-Efficient Light-Field Acquisition Using Coded Aperture and Events [16.1] 本手法は,画像フレームの単一露光中に一連の符号化パターンを適用する。
符号化パターンの違いに関連するパララックス情報は、イベントとして記録される。
画像フレームとイベントは、すべて単一の露光で測定され、光場を計算的に再構成するために共同で使用される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:04:17 GMT)
Better Uncertainty Calibration via Proper Scores for Classification and
Beyond [16.0] 各校正誤差を適切なスコアに関連付ける適切な校正誤差の枠組みを導入する。
この関係は、モデルのキャリブレーションの改善を確実に定量化するために利用することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:48:50 GMT)
Understanding the Multi-modal Prompts of the Pre-trained Vision-Language
Model [15.8] 我々は、以下の質問をすることで、マルチモーダルプロンプトを直接分析する。
$(i)$ 学習したマルチモーダルはどのように認識性能を向上させるのか?
$(ii)$ マルチモーダルプロンプトは何を学習しますか?
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:19:05 GMT)
Understanding the Multi-modal Prompts of the Pre-trained Vision-Language
Model [15.8] 我々は、以下の質問をすることで、マルチモーダルプロンプトを直接分析する。
$(i)$ 学習したマルチモーダルはどのように認識性能を向上させるのか?
$(ii)$ マルチモーダルプロンプトは何を学習しますか?
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:19:05 GMT)
Frequency-Adaptive Dilated Convolution for Semantic Segmentation [15.8] 本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:33:51 GMT)
Tractable Joint Prediction and Planning over Discrete Behavior Modes for
Urban Driving [15.7] 自己回帰閉ループモデルのパラメータ化は,再学習を伴わずに可能であることを示す。
離散潜在モード上での完全反応性閉ループ計画を提案する。
当社のアプローチは、CARLAにおける従来の最先端技術よりも、高密度なトラフィックシナリオに挑戦する上で優れています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:00:52 GMT)
An Audio-textual Diffusion Model For Converting Speech Signals Into
Ultrasound Tongue Imaging Data [15.2] 音響-調音インバージョン(AAI)は、超音波舌画像(UTI)データなどの音声を調音運動に変換することである。
本稿では,UTIデータ生成タスクのための音声-テキスト拡散モデルを提案する。
実験結果から,提案した拡散モデルにより,舌の輪郭が明瞭な高品質なUTIデータを生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:26:07 GMT)
An Audio-textual Diffusion Model For Converting Speech Signals Into
Ultrasound Tongue Imaging Data [15.2] 音響-調音インバージョン(AAI)は、超音波舌画像(UTI)データなどの音声を調音運動に変換することである。
本稿では,UTIデータ生成タスクのための音声-テキスト拡散モデルを提案する。
実験結果から,提案した拡散モデルにより,舌の輪郭が明瞭な高品質なUTIデータを生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:26:07 GMT)
Mitigating the Impact of Attribute Editing on Face Recognition [15.2] ローカル属性とグローバル属性の編集を行う2つの手法を提案する。
我々は、現在最先端の生成モデルを用いて、26の顔意味、人口統計、および表現に基づく属性を実証的に比較した。
本手法は,識別を維持しながら顔編集において,SOTA(BLIP, InstantID)よりも優れていた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:03:19 GMT)
Lite-Mind: Towards Efficient and Robust Brain Representation Network [15.2] 離散変換に基づく軽量・効率的・多目的な脳表現ネットワークLite-Mindを提案する。
Lite-Mindは、被写体1のNSDデータセット上で94.3%のfMRI-to-image検索精度を実現し、MindEyeよりも9つのパラメータが少ない。
Lite-Mindはまた、より小さな脳データセットに移行できることが証明されており、GODデータセット上でゼロショット分類のための新しい最先端技術を確立している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:13:01 GMT)
SemGauss-SLAM: Dense Semantic Gaussian Splatting SLAM [15.2] 本稿では,高精度な3次元セマンティックマッピング,ロバストなカメラトラッキング,高品質なリアルタイムレンダリングを実現するSemGauss-SLAMを提案する。
セマンティックな特徴を3次元ガウス表現に組み込んで,環境の空間的レイアウト内で意味情報を効果的にエンコードする。
我々のSemGauss-SLAM法は、ReplicaおよびScanNetデータセットのマッピングと追跡精度の観点から、既存の高密度なセマンティックSLAM法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:33:26 GMT)
Multilingual DistilWhisper: Efficient Distillation of Multi-task Speech
Models via Language-Specific Experts [15.0] 表現不足言語に対するASRの性能ギャップを埋めるため、DistilWhisperを提案する。
提案手法は, 言語専門家を用いた軽量モジュール型ASR微調整と, ささやかな大口径v2からの知識蒸留の2つの戦略を含む。
その結果,本手法は通常のファインチューニングやLoRAアダプタよりも効果的であることがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:50:30 GMT)
Global 4D Ionospheric STEC Prediction based on DeepONet for GNSS Rays [14.9] 我々は,DeepONet-STECと呼ばれる高精度STECモデルを提案する。これは非線形演算子を学習し,特定地上局 - 衛星線経路の4次元時空間統合パラメータを予測する。
実演として,電離層および嵐条件下でのグローバルおよびUS-CORS体制の観測データに基づくモデルの性能評価を行った。
DeepONet-STECモデルの結果から,時間分解能30sのPPP(Precise Point Positioning)による観測データを用いて,3日間の静かな期間における72時間予測を高精度に行うことができた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:51:38 GMT)
Perennial Semantic Data Terms of Use for Decentralized Web [14.8] データ用語(Data Terms of Use, DTOU)の新たな形式記述を提案する。
ユーザとアプリケーションは、ローカル知識でDToUポリシーの独自の部分を指定する。
これは年長のDTOU言語を構成するもので、ポリシーのオーサリングは一度しか行われない。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:18:20 GMT)
CMax-SLAM: Event-based Rotational-Motion Bundle Adjustment and SLAM
System using Contrast Maximization [14.8] イベントカメラはバイオインスパイアされた視覚センサで、ピクセルワイドの強度変化を捉え、非同期イベントストリームを出力する。
本稿では,イベントカメラを用いた回転運動推定の問題点について考察する。
過去10年間にいくつかの事象に基づく回転推定法が開発されてきたが、その性能は評価されていない。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:05:10 GMT)
SMURF: Continuous Dynamics for Motion-Deblurring Radiance Fields [14.7] 本稿では,ニューラル常微分方程式(Neural-ODE)を用いて連続カメラの動きをモデル化する新しい手法である,逐次的動き理解放射場(SMURF)を提案する。
我々のモデルは、ベンチマークデータセットに対して厳密に評価され、定量的かつ定性的に最先端のパフォーマンスを実証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:32:57 GMT)
Towards Zero-shot Human-Object Interaction Detection via Vision-Language
Integration [14.7] 本稿では,ゼロショットHOI検出を改善するために,視覚言語モデルの知識を効果的に統合する新しいフレームワーク「KI2HOI」を提案する。
より包括的な視覚表現を生成するための効果的な付加的自己認識機構を開発する。
我々のモデルは、様々なゼロショットおよびフル教師付き設定において、以前の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:07:23 GMT)
Investigating the Effect of Misalignment on Membership Privacy in the
White-box Setting [14.6] 機械学習モデルは、トレーニングデータセットに関する機密情報を漏洩することが示されている。
モデルパラメータへのホワイトボックスアクセスはブラックボックスアクセスと比較して攻撃面を増加させる。
本研究は,影モデルにおける誤認識の原因を初めて体系的に解析する。
ターゲットモデルとシャドウモデルの間の測定ミスアライメントを著しく低減する再アライメント手法を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:29:18 GMT)
Cross-Domain Deep Code Search with Meta Learning [14.6] ドメイン固有のコード検索のための新しいアプローチであるCroCSを提案する。
CroCSは、プログラム表現モデルを一般的なプログラミング言語の大規模なコーパス上で事前訓練するトランスファーラーニングフレームワークを採用している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:31:50 GMT)
Data-Efficient Contrastive Self-supervised Learning: Most Beneficial
Examples for Supervised Learning Contribute the Least [14.5] 自己教師付き学習(SSL)は、ラベルなしのトレーニングデータの大規模なプールから高品質な表現を学ぶ。
データセットが大きくなるにつれて、そのような表現の学習に最も寄与する例を特定することが重要になる。
対照的なSSLに最も貢献する例は、他の例と最もよく似た拡張であることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:22:20 GMT)
A Survey of Explainable Knowledge Tracing [14.5] 本稿では,KTアルゴリズムの解釈可能性について詳細に解析する。
説明可能な知識追跡のための現在の評価方法が不足している。
本稿では,教育関係者の視点から評価手法について考察する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:17:59 GMT)
Balancing Fairness and Accuracy in Data-Restricted Binary Classification [14.4] 本稿では,4つの実践シナリオ下での精度と公平性のトレードオフをモデル化する枠組みを提案する。
3つのデータセットの実験では、トレードオフを定量化するためのツールとして提案されたフレームワークの有用性が示されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:01:27 GMT)
Utility Theory of Synthetic Data Generation [14.1] 本稿では,統計的学習フレームワークにおける実用理論の確立により,実践と理論のギャップを埋める。
合成データに基づいてトレーニングされたモデルの一般化とランキングの2つのユーティリティメトリクスを考慮に入れている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:26:45 GMT)
On-Device Domain Learning for Keyword Spotting on Low-Power Extreme Edge Embedded Systems [13.9] ニューラルネットワークがノイズの多い環境にさらされると、キーワードスポッティングの精度が低下する。
本稿では,すでにロバストなキーワードスポッティングモデルに対して最大14%の精度を達成できる,デバイス上でのドメイン適応システムを提案する。
超低消費電力マイクロコントローラでは、常時オンのバッテリー駆動デバイスでは、わずか14秒で806mJ以下でドメイン適応が達成できることを実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:54:35 GMT)
UR2M: Uncertainty and Resource-Aware Event Detection on Microcontrollers [13.8] 従来の機械学習技術は、データの分布の変化に直面したとき、不正確な予測を生成する傾向がある。
本稿では,マイクロコントローラのための新しい不確実性とリソースを考慮したイベント検出フレームワークUR2Mを提案する。
UR2Mは最大864%の高速化、857%の省エネルギー、55%のメモリ節約を実現している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:25:10 GMT)
McCatch: Scalable Microcluster Detection in Dimensional and
Nondimensional Datasets [13.7] 本稿では,提案した Oracle プロットを利用してマイクロクラスタを検出するアルゴリズムである McCatch を提案する。
我々は、最大100万のデータ要素を持つ31の実データと合成データセットを調査し、McMatchが上記の2つの疑問に答える唯一の方法であることを示す。
また、グラフ、指紋、ネットワーク接続ログ、テキストデータ、衛星画像などの意味のあるマイクロクラスタを検出できる、McMatchの機能についても紹介する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:55:23 GMT)
ClaimVer: Explainable Claim-Level Verification and Evidence Attribution of Text Through Knowledge Graphs [13.6] $textitClaimVerは、ユーザの情報や検証のニーズを満たすための、人間中心のフレームワークである。
各クレームをハイライトし、信頼された知識グラフに対して検証し、クレームの予測に対して簡潔で明確な説明を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:07:53 GMT)
Joint Selection: Adaptively Incorporating Public Information for Private
Synthetic Data [13.6] 我々は,適応測定フレームワークを拡張して,公開データとプライベートデータとを協調的に選択する機構であるjam-pgmを開発した。
また, ジャム-pgmは, 公用データ分布に偏りがある場合でも, 公用データと非公用データ生成機構の両方より優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:34:07 GMT)
Dataset Condensation for Time Series Classification via Dual Domain
Matching [13.5] 本研究では,textittextbfTime textittextbfSeries textittextbfClassificationをDual Domain Matching経由で生成する新しいフレームワークであるtextittextbfCondensationを提案する。
提案するフレームワークは,時間領域と周波数領域の両方のサロゲート目的にマッチする凝縮データセットを生成することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:05:06 GMT)
Towards Faithful Explanations: Boosting Rationalization with Shortcuts
Discovery [13.4] 本稿では,潜在的ショートカットの発見と活用により合理化を促進するショートカット融合選択合理化法を提案する。
具体的には、SSRはいくつかの潜在的なショートカットを検出するショートカット発見アプローチを最初に設計した。
そして,同定されたショートカットを導入することで,合理性を構成するためにショートカットを利用する問題を緩和する2つの戦略を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:24:17 GMT)
ProMIL: Probabilistic Multiple Instance Learning for Medical Imaging [13.4] マルチインスタンスラーニング(MIL)は、ひとつのラベルがインスタンスの袋全体に割り当てられる弱い教師付き問題である。
本稿では,深層ニューラルネットワークとBernstein推定に基づく,ProMILと呼ばれる専用インスタンスベースの手法を提案する。
実世界の医療応用において, ProMIL は標準的なインスタンスベースの MIL よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:57:00 GMT)
BID: Boundary-Interior Decoding for Unsupervised Temporal Action
Localization Pre-Trainin [13.3] 本稿では,骨格に基づく動作シーケンスを意味論的に意味のある事前動作セグメントに分割する,教師なし事前学習フレームワークを提案する。
事前学習ネットワークを少量のアノテートデータで微調整することにより、SOTA法よりも大きなマージンで性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:23:45 GMT)
Mobile Foundation Model as Firmware [13.2] sysはモバイルOSとハードウェアの協調管理アプローチである。
公開されているLarge Language Models (LLM) のキュレートされた選択と、動的データフローの促進を両立させる。
タスクの85%で精度を同等にし、ストレージとメモリのスケーラビリティを改善し、十分な推論速度を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:17:03 GMT)
Mobile Foundation Model as Firmware [13.2] sysはモバイルOSとハードウェアの協調管理アプローチである。
公開されているLarge Language Models (LLM) のキュレートされた選択と、動的データフローの促進を両立させる。
タスクの85%で精度を同等にし、ストレージとメモリのスケーラビリティを改善し、十分な推論速度を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:17:03 GMT)
Mafin: Enhancing Black-Box Embeddings with Model Augmented Fine-Tuning [13.2] マフィン(Mafin)は、トレーニング可能な埋め込みモデルで強化することで、ブラックボックスの埋め込みモデルを微調整するための新しいアプローチである。
以上の結果から,Mafinは小さな拡張モデルの訓練を必要とせず,ブラックボックス埋め込みの性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:04:23 GMT)
Quantifying and Mitigating Privacy Risks for Tabular Generative Models [13.2] 生成モデルからの合成データは、プライバシを保存するデータ共有ソリューションとして現れる。
本稿では,DP-TLDM,差分プライベートタブララプレント拡散モデルを提案する。
DP-TLDMは, 平均データ類似度35%, 下流タスク用ユーティリティ15%, データの識別性50%で, 合成品質の向上を図っている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:27:49 GMT)
MMSR: Symbolic Regression is a Multimodal Task [13.1] 記号回帰は、もともと最適化問題として定式化され、GPと強化学習アルゴリズムがそれを解決するために用いられた。
この問題を解決するために、研究者はデータから表現へのマッピングを翻訳問題として扱う。
本稿では,複数の主流データセット上で最も高度な結果が得られるMMSRを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:35:25 GMT)
MMSR: Symbolic Regression is a Multimodal Task [13.1] 記号回帰は、もともと最適化問題として定式化され、GPと強化学習アルゴリズムがそれを解決するために用いられた。
この問題を解決するために、研究者はデータから表現へのマッピングを翻訳問題として扱う。
本稿では,複数の主流データセット上で最も高度な結果が得られるMMSRを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:35:25 GMT)
Mental Workload Estimation with Electroencephalogram Signals by
Combining Multi-Space Deep Models [13.1] 精神活動は日常的なプロセスであり、過負荷として知られる脳が過度に活動すると、人間の健康に悪影響を及ぼす可能性がある。
本稿では,メンタルワークロードを3つの状態(低,中,高)に分類し,メンタルワークロードレベルの連続性を推定する。
本手法は,複数の空間次元からの情報を活用し,心的推定において最適な結果を得る。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:25:24 GMT)
Federated Learning for Large-Scale Scene Modeling with Neural Radiance
Fields [12.9] 我々は,車両やドローンから収集したデータを用いて,地球規模のニューラル放射場(NeRF)に基づく地図を連続的に構築し,維持するシステムを提案する。
NeRFによる既存の大規模モデリングには、地球規模の環境をモデル化する際のスケーラビリティと保守性に問題がある。
我々は、NeRFのフェデレーション学習におけるモデル集約パイプラインを調整し、NeRFの局所的な更新を可能にする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:32:08 GMT)
Integrating Uncertainty Awareness into Conformalized Quantile Regression [12.9] 本稿では,特徴空間全体にわたって量子回帰器を微分的に調整するコンフォーマル化量子回帰(CQR)手法を提案する。
CQRと比較して,本手法は,シミュレーション設定や実世界のデータセットなどにおいて,より強い条件付きカバレッジ特性を示しながら,分布のない理論的カバレッジ保証を享受する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:58:30 GMT)
Defending Against Poisoning Attacks in Federated Learning with
Blockchain [12.8] ブロックチェーンと分散台帳技術に基づくセキュアで信頼性の高いフェデレーション学習システムを提案する。
本システムでは,オンチェーン型スマートコントラクトを利用したピアツーピア投票機構と報酬アンドスラッシュ機構を組み込んで,悪意ある行動の検出と検出を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:44:55 GMT)
Defending Against Poisoning Attacks in Federated Learning with
Blockchain [12.8] ブロックチェーンと分散台帳技術に基づくセキュアで信頼性の高いフェデレーション学習システムを提案する。
本システムでは,オンチェーン型スマートコントラクトを利用したピアツーピア投票機構と報酬アンドスラッシュ機構を組み込んで,悪意ある行動の検出と検出を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:44:55 GMT)
ProPML: Probability Partial Multi-label Learning [12.8] 部分的多ラベル学習(Partial Multi-label Learning, PML)は、弱い教師付き学習の一種で、各トレーニングインスタンスが候補ラベルの集合に対応する。
本稿では,この問題に対する新しい確率的アプローチとして,二項交叉エントロピーをPML設定に拡張する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:40:23 GMT)
12 mJ per Class On-Device Online Few-Shot Class-Incremental Learning [12.8] FSCIL(Few-Shot Class-Incremental Learning)は、いくつかのラベル付き例を使用して、機械学習システムが推論能力を新しいクラスに拡張することを可能にする。
O-FSCILは、FSCIL CIFAR100ベンチマークで68.62%の平均精度を取得し、最先端の結果を得た。
超低消費電力プラットフォーム向けに設計され、60mW GAP9マイクロコントローラにO-FSCILを実装し、新しいクラスあたり12mJ以内のオンライン学習能力を実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:43:20 GMT)
Detection of ChatGPT Fake Science with the xFakeSci Learning Algorithm [12.6] xFakeSciは、ChatGPTが生成した記事を科学者によって作成された出版物と区別できる新しい学習アルゴリズムである。
我々は,そのアルゴリズムが最先端(SOTA)アルゴリズムに対してどのようにベンチマークされるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:10:05 GMT)
FluoroSAM: A Language-aligned Foundation Model for X-ray Image
Segmentation [12.5] 我々は、1.6Mの合成X線画像に基づいて、ゼロから訓練されたセグメンテーション・アニーシング・モデルの言語対応版であるFluoroSAMを開発した。
FluoroSAMは0.51と0.79のDICEでテキストのみのプロンプトに基づいて骨質の解剖学的構造を分割することができる。
また、言語アライメントのおかげで、トレーニングセット以外のセグメントクラスへのゼロショットの一般化も可能である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:11:38 GMT)
Vivim: a Video Vision Mamba for Medical Video Object Segmentation [12.4] 本稿では、医療用ビデオオブジェクトセグメンテーションタスクのための一般的なビデオビジョン・マンバベースのフレームワークbftextVivimを提案する。
我々のビビムは、設計したテンポラルマンバブロックにより、長期の時間的表現を様々なスケールのシーケンスに効果的に圧縮することができる。
また,医用画像の曖昧な病変に対するビビムの識別能力を高めるための境界認識制約も導入した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:45:49 GMT)
Syncopated Dynamical Decoupling for Suppressing Crosstalk in Quantum
Circuits [12.3] 本研究では、望ましくない2ビット結合と基礎となる1ビットデコヒーレンスを特徴付けるための動的デカップリングの利用について検討する。
本研究では,デコヒーレンスを防止し,望ましくない2ビット相互作用を選択的にターゲットとする同期デカップリング手法を開発した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:18:35 GMT)
A Semantic Mention Graph Augmented Model for Document-Level Event Argument Extraction [12.3] Document-level Event Argument extract (DEAE)は、構造化されていないドキュメントから引数とその特定の役割を特定することを目的としている。
DEAEの先進的なアプローチは、事前訓練された言語モデル(PLM)を誘導するプロンプトベースの手法を用いて、入力文書から引数を抽出する。
本稿では,この2つの問題に対処するために,グラフ拡張モデル (GAM) のセマンティック言及を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:58:07 GMT)
POS: A Prompts Optimization Suite for Augmenting Text-to-Video
Generation [12.2] 本稿では、ノイズやテキストを含む2つの入力プロンプトを改善し、拡散に基づくテキスト・ビデオ生成を改善することを目的とする。
テキスト・ツー・ビデオ・モデルを改善するためのトレーニング不要な Prompt Optimization Suite であるPOS を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:19:00 GMT)
Bridging Different Language Models and Generative Vision Models for
Text-to-Image Generation [12.0] テキスト・ツー・イメージ生成のための多種多様な事前学習言語モデルと生成視覚モデルの統合を可能にするパイプラインであるLaVi-Bridgeを提案する。
私たちのパイプラインは、様々な言語モデルと生成視覚モデルと互換性があり、異なる構造を収容しています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:50:11 GMT)
Big City Bias: Evaluating the Impact of Metropolitan Size on
Computational Job Market Abilities of Language Models [12.0] 大規模言語モデル(LLM)は、候補者と雇用主の両方にとって、ジョブマッチングに有用な技術として登場した。
ジョブマッチングは、都市や地域など、特定の地理的位置に基づいて行われることが多い。
大規模言語モデルで符号化された大都市規模のバイアスを定量化し, ゼロショット給与, 雇用主の存在, 通勤時間予測を384大都市圏で評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:40:18 GMT)
AI-Assisted Causal Pathway Diagram for Human-Centered Design [12.0] 本稿では人中心設計(HCD)への因果経路図(CPD)の統合について検討する。
オンラインホワイトボードプラットフォームのMiro用の専用のCDDプラグインが開発され、ダイアグラムの作成を合理化し、リアルタイムAI駆動のガイダンスを提供する。
その結果, CPDの分岐と因果関係の強調は, 設計過程での分岐過程と収束過程の両方を支持した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:36:27 GMT)
FairRR: Pre-Processing for Group Fairness through Randomized Response [11.7] グループフェアネスの尺度を最適モデルユーティリティで直接制御できることが示される。
本稿では,FairRRという,下流モデルの有用性と公平性を向上する前処理アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:08:47 GMT)
CarbonNet: How Computer Vision Plays a Role in Climate Change?
Application: Learning Geomechanics from Subsurface Geometry of CCS to
Mitigate Global Warming [11.7] 炭素捕獲・隔離のための地下地形画像から地表面の変位を予測するためのコンピュータビジョンを用いた新しいアプローチを提案する。
地下地形画像から直接モデルを訓練することで,これらの課題に対処する。
本研究の目的は,炭素注入による地表面変位の応答を理解し,訓練されたモデルを用いてCCSプロジェクトの意思決定を通知することである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:35:29 GMT)
CHAI: Clustered Head Attention for Efficient LLM Inference [11.5] クラスタ型ヘッドアテンション(CHAI)は、K,Vキャッシュを最大21.4%、推論時間遅延を最大1.73倍まで、微調整を必要とせずに削減することができる。
我々は,K,Vキャッシュを最大21.4%,推論時間遅延を最大1.73倍,微調整を必要とせずに,メモリ要求を最大で1.73倍削減できることを示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:10:04 GMT)
DeepSafeMPC: Deep Learning-Based Model Predictive Control for Safe
Multi-Agent Reinforcement Learning [11.4] 安全なマルチエージェント強化学習(DeepSafeMPC)のためのDeep Learning-based Model Predictive Controlと呼ばれる新しい手法を提案する。
DeepSafeMPCの重要な洞察は、環境力学を正確に予測するために、エンタライズされたディープラーニングモデルを活用することである。
Safe Multi-agent MuJoCo 環境を用いて,本手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:13:51 GMT)
Dynamic Graph Representation with Knowledge-aware Attention for
Histopathology Whole Slide Image Analysis [11.4] 本稿では,知識グラフ構造の形式としてWSIを概念化する新しい動的グラフ表現アルゴリズムを提案する。
具体的には、インスタンス間の頭と尾の関係に基づいて、隣人や方向のエッジの埋め込みを動的に構築する。
我々のエンドツーエンドグラフ表現学習アプローチは、TCGAベンチマーク3つのデータセットと社内テストセットにおける最先端のWSI分析手法よりも優れています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:58:51 GMT)
TFCounter:Polishing Gems for Training-Free Object Counting [11.0] 既存のオブジェクトカウント手法は、優れたパフォーマンスを実現し、高い一般化性を維持し、アノテーションのコストを最小限に抑えるという3つの課題に直面している。
TFCounterは,大規模基盤モデルの必須要素のカスケードを介し,プロンプト・コンテクスト対応のTFCounterを開発する。
それは、形状、外観、大きさの異なる幅広い物体のスペクトルを認識するために、二重プロンプトシステムを備えた反復的な計数フレームワークを使用している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:11:54 GMT)
Making RL with Preference-based Feedback Efficient via Randomization [11.0] 人間のフィードバックから学習する強化学習アルゴリズムは、統計複雑性、計算複雑性、クエリ複雑性の点で効率的である必要がある。
提案するアルゴリズムは, サンプル効率のよいアルゴリズム(すなわち, ほぼ最適ケースの後悔境界)と実行時間(すなわち, 関連するパラメータに関して計算複雑性が最悪の場合)を提案する。
結果をより一般的な非線形関数近似に拡張するために、トンプソンサンプリングのアイデアに触発されたモデルベースランダム化アルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:49:59 GMT)
Matrix-Transformation Based Low-Rank Adaptation (MTLoRA): A
Brain-Inspired Method for Parameter-Efficient Fine-Tuning [10.9] マトリックス変換に基づく低ランク適応(MTLoRA)は、脳の機能はその幾何学的構造によって形成されるという考えから着想を得ている。
MTLoRAは8つのタスクでパフォーマンスが約1.0%向上する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:32:25 GMT)
InstructERC: Reforming Emotion Recognition in Conversation with a
Retrieval Multi-task LLMs Framework [10.9] 本稿では,Large Language Models(LLMs)に基づく識別的枠組みから生成的枠組みへ,感情認識タスクを再構築する新しい手法を提案する。
インストラクタは3つの重要な貢献をしている。
私たちのコードとアライメントされた統合データセット(UIME)はGithubのリンクで参照できます。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:54:36 GMT)
Challenging Forgets: Unveiling the Worst-Case Forget Sets in Machine
Unlearning [10.9] マシン・アンラーニング(MU)は、選択したデータポイントがモデルの性能に与える影響を排除することを目的としている。
データ影響消去のための様々なMU手法にもかかわらず、評価は主にランダムなデータの忘れ方に焦点を当てている。
本稿では,影響消去の最も重要な課題を示すデータサブセットの同定を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:50:32 GMT)
The Terminating-Random Experiments Selector: Fast High-Dimensional
Variable Selection with False Discovery Rate Control [10.9] T-Rexセレクタは、ユーザ定義のターゲット偽発見率(FDR)を制御する
元の予測器とランダムに生成されたダミー予測器の複数セットの組み合わせで実験を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:50:35 GMT)
Large Window-based Mamba UNet for Medical Image Segmentation: Beyond
Convolution and Self-attention [10.8] 2次元および3次元の医用画像セグメンテーションのためのLMa-UNet(Large Window-based Mamba U-shape Network)を提案する。
LMa-UNetの際立った特徴は、小さなカーネルベースのCNNや小さなウィンドウベースのトランスフォーマーに比べて、局所的な空間モデリングに優れた大きなウィンドウの利用である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:34:51 GMT)
Reference-free Monolithic Preference Optimization with Odds Ratio [10.7] モデルのないモノリシックオッズ比最適化アルゴリズムORPOを導入し、追加の選好アライメントフェーズの必要性を排除した。
具体的には、Phi-2 (2.7B)、Llama-2 (7B)、Mistral (7B)、ORPO on the UltraFeedbackは、7Bと13B以上のパラメータを持つ最先端言語モデルの性能を上回っている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:34:08 GMT)
Antiferromagnetic magnons on a M\"obius strip: topology-induced symmetry
breaking [10.6] 2つの反強磁性結合スピン鎖からなるM"obius stripについて検討した。
境界条件を満たすため、マグノン励起はキラリティのないN'eelベクトルの線形偏極を特徴とする。
以上の結果から, トポロジー誘起対称性がマグノンに与える影響が明らかとなった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:38:14 GMT)
Decoupled Data Consistency with Diffusion Purification for Image
Restoration [10.5] 本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:22:13 GMT)
Red Teaming Models for Hyperspectral Image Analysis Using Explainable AI [10.2] 本稿では,ハイパースペクトル画像を用いた機械学習モデルの検討手法を提案する。
我々は、説明可能なAI(XAI)ドメインからのポストホックな説明手法を用いて、最高のパフォーマンスモデルを評価する。
当社のアプローチは,重要な欠点を指摘し,検証することで,モデルを効果的にチーム化するものです。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:28:32 GMT)
Spatiotemporal Representation Learning for Short and Long Medical Image
Time Series [10.2] 時間的発達の分析は多くの医療条件の正確な予後に不可欠である。
数ヶ月または数年にわたって起こる長期の発達を追跡することは、正確な予後に不可欠である。
短期的・長期的分析と臨床的意思決定の両方の重要性にもかかわらず、彼らは医学的深層学習において過小評価されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:47:29 GMT)
Disjoint Contrastive Regression Learning for Multi-Sourced Annotations [10.2] 大規模データセットはディープラーニングモデルの開発に重要である。
複数のアノテータを使用して、データの異なるサブセットをラベル付けすることができる。
異なるアノテータ間の矛盾とバイアスはモデルトレーニングに有害である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:16:00 GMT)
SEMRes-DDPM: Residual Network Based Diffusion Modelling Applied to
Imbalanced Data [10.0] データマイニングと機械学習の分野では、一般的に使われている分類モデルは、不均衡なデータで効果的に学習することはできない。
古典的なオーバーサンプリング手法の多くは、データのローカル情報のみに焦点を当てたSMOTE技術に基づいている。
本稿では,SEMRes-DDPMのオーバーサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:45:48 GMT)
SEMRes-DDPM: Residual Network Based Diffusion Modelling Applied to
Imbalanced Data [10.0] データマイニングと機械学習の分野では、一般的に使われている分類モデルは、不均衡なデータで効果的に学習することはできない。
古典的なオーバーサンプリング手法の多くは、データのローカル情報のみに焦点を当てたSMOTE技術に基づいている。
本稿では,SEMRes-DDPMのオーバーサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:45:48 GMT)
Relevance Score: A Landmark-Like Heuristic for Planning [9.9] 我々は、特定の目標を達成するための計画がすべてではないが、ほとんどに現れる事実や行動を特定するのに役立つ新しい「関連スコア」を定義します。
我々は,提案手法の性能と,ベンチマーク計画問題を用いた画期的な計画手法の状況とを実験的に比較した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:45:45 GMT)
Triples-to-isiXhosa (T2X): Addressing the Challenges of Low-Resource
Agglutinative Data-to-Text Generation [9.8] 我々は,低リソースかつ凝集性の高いisiXhosaのデータ・トゥ・テキストに取り組む。
我々はWebNLGのサブセットに基づいた新しいデータセットであるTriples-to-isiXhosa (T2X)を紹介する。
本研究では,T2X の評価フレームワークを開発し,データ記述の精度を計測する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:53:27 GMT)
Towards Independence Criterion in Machine Unlearning of Features and
Labels [9.8] この研究は、分散シフトに直面した機械学習の複雑さを掘り下げるものだ。
本研究は、これらの課題に対処するために、影響関数と分布独立の原理を活用する新しいアプローチを導入する。
提案手法は, 効率的なデータ除去を容易にするだけでなく, モデルを動的に調整し, 一般化機能を維持する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:21:09 GMT)
SGE: Structured Light System Based on Gray Code with an Event Camera [9.7] イベントベースの構造化光システムに初めてGrayコードを導入します。
提案手法は,最先端の走査法に匹敵する精度を実現する。
提案手法は, 超高速, リアルタイム, 高精度深度推定のための, 極めて有望な解を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:20:44 GMT)
MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation [9.7] 本稿では,1枚のRGB画像から3次元コンピュータ支援デザイン(CAD)モデルを用いてオブジェクトの6-DoFポーズを決定するための単発アプローチを提案する。
まず、ポーズ分類を行い、3Dオブジェクトを分類されたポーズに描画する。
第2段階は、クラス内のきめ細かい残留ポーズを予測するために回帰を実行する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:36:59 GMT)
A Fourier Transform Framework for Domain Adaptation [9.7] 教師なしドメイン適応(UDA)は、ラベルに富んだソースドメインからラベルを持たないターゲットドメインに知識を転送することができる。
既存のUDAアルゴリズムの多くは、生画像を直接入力として使用することに悩まされている。
我々は、ターゲットドメインからの低レベル情報をソースドメインに組み込むために、Fourier法(FTF)を用いる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:35:32 GMT)
Curry-DPO: Enhancing Alignment using Curriculum Learning & Ranked
Preferences [9.4] Curry-DPOは一貫してMTbench、Vicuna、WizardLM、UltraFeedbackテストセットのパフォーマンス向上を示している。
また、Curry-DPOはVicuna、WizardLM、UltraFeedbackテストデータセット上で最高に調整された勝利率を達成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:58:19 GMT)
Towards Graph Foundation Models for Personalization [9.4] 本稿では、パーソナライズに適したグラフベースの基礎モデリング手法を提案する。
当社のアプローチは厳格にテストされ、さまざまな製品にレコメンデーションを提供する上で有効であることが証明されています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:12:59 GMT)
Robustness, Security, Privacy, Explainability, Efficiency, and Usability
of Large Language Models for Code [9.3] コードのための大規模言語モデル(LLM4Code)は、ソースコードの処理において強力なパフォーマンス(例えば高い精度)を示す。
本稿では,セキュリティ,プライバシ,説明可能性,効率,堅牢性など,正確性を超えた7つの重要な特性を特定するための146の関連研究を網羅的に検討する。
本稿では,現在の最先端の手法と動向について論じ,既存の研究のギャップを特定し,今後の研究に向けて有望な方向性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:43:26 GMT)
Real-time Surgical Instrument Segmentation in Video Using Point Tracking
and Segment Anything [9.3] 手術器具のセグメンテーションを微調整した軽量SAMモデルとオンラインポイントトラッカーを組み合わせた新しいフレームワークを提案する。
結果は、EndoVis 2015データセット上の最先端の半教師付きビデオオブジェクトセグメンテーションメソッドを上回る。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:12:42 GMT)
MEND: Meta dEmonstratioN Distillation for Efficient and Effective
In-Context Learning [9.3] 大規模言語モデル(LLM)は、与えられたテスト入力と少数のインプット・アウトプットペア(デモ)を同時に予測する。
既存の解は、長い実演をコンパクトなベクトルに蒸留しようとする。
本稿では,メタdEmonstratioN蒸留(MEND)について述べる。そこでは,言語モデルが,新しい下流タスクを再学習することなく,任意の長い実演をベクトルに蒸留することを学ぶ。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:52:14 GMT)
The Principles of Data-Centric AI (DCAI) [9.2] 新たな概念としてのデータ中心型AI(DCAI)は、データ、その品質、ダイナミズムを最前線にもたらす。
この記事では、DCAIの基礎を概説するために、データ中心の視点と概念をまとめます。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:07:12 GMT)
Quantized Fourier and Polynomial Features for more Expressive Tensor
Network Models [9.2] モデル重みを過度にパラメータ化されたテンソルネットワークに制約することで,特徴量に存在するテンソル構造を利用する。
同じ数のモデルパラメータに対して、結果の量子化モデルは、その非量子化モデルとは対照的に、VC次元に高いバウンドを持つことを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:18:09 GMT)
GradTree: Learning Axis-Aligned Decision Trees with Gradient Descent [9.1] 決定木(DT)は多くの機械学習タスクで一般的に使われている。
本稿では,greedyアルゴリズムを用いた新しいDT学習手法を提案する。
直進演算子と直進演算子を高密度DT表現とし,すべての木パラメータを協調的に最適化する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:22:51 GMT)
GRANDE: Gradient-Based Decision Tree Ensembles for Tabular Data [9.1] そこで本研究では,エンドツーエンドの勾配勾配勾配を用いた軸方向決定木アンサンブルの学習手法を提案する。
Grandeはツリーアンサンブルの密度の高い表現に基づいており、ストレートスルー演算子でバックプロパゲーションを使用することができる。
提案手法は,ほとんどのデータセットにおいて,既存の勾配ブースティングおよびディープラーニングフレームワークよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:30:39 GMT)
Open-Vocabulary Scene Text Recognition via Pseudo-Image Labeling and
Margin Loss [9.1] オープン語彙テキスト認識フレームワークPseudo-OCRを提案する。
ICDAR2022チャレンジでは,8つのデータセットで最先端のパフォーマンスを達成し,第1位を達成している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:54:38 GMT)
Decomposition Ascribed Synergistic Learning for Unified Image
Restoration [8.9] 特異値分解のレンズによる多彩な劣化に着目した。
劣化した特異ベクトルと特異値の専用最適化は、本質的に様々な復元タスク間のポテンシャル関係を利用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:58:06 GMT)
A Cross-Cultural Analysis of Social Norms in Bollywood and Hollywood
Movies [8.8] 我々は,5.4Kボリウッド映画とハリウッド映画から得られた,初めての文化的自己意識感情データセットと10K以上の社会的規範を提示する。
我々は、母国語話者を用いてデータセットを検証し、これらの国で観察される文化的二分法と整合した社会的規範の変化を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:02:02 GMT)
Learning Data Association for Multi-Object Tracking using Only
Coordinates [8.8] TransformerベースのモジュールTWiXは、同じオブジェクトから来るトラックのペアと、そうでないトラックのペアを識別する目的で、トラックのセットでトレーニングされている。
オンラインカスケードマッチングパイプラインにTWiXを挿入することで、トラッカーC-TWiXはDanceTrackとKITTIMOTデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:36:18 GMT)
Generative deep learning-enabled ultra-large field-of-view lens-free
imaging [8.8] 我々は、ホログラフィック画像再構成に生成人工知能(AI)を活用するディープラーニング(DL)ベースのイメージングフレームワーク、GenLFIを提案する。
我々は、GenLFIが550ドル以上のリアルタイムFOVを達成でき、現在のLFIシステムを20倍以上上回り、世界最大規模の共焦点顕微鏡よりも1.76倍大きいことを実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:20:27 GMT)
Knowledge Transfer across Multiple Principal Component Analysis Studies [8.6] 本稿では,複数音源成分分析(PCA)研究から有用な情報を抽出する2段階移動学習アルゴリズムを提案する。
最初のステップでは、複数の研究にまたがる共有部分空間情報をGrassmannian barycenterと呼ばれる提案手法で統合する。
第1段階から得られた共有部分空間の推定器を利用して、対象のプライベート部分空間を推定する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:15:12 GMT)
VANP: Learning Where to See for Navigation with Self-Supervised
Vision-Action Pre-Training [8.5] 人間は、ナビゲーションに関連する特定の視覚領域に焦点を当てることで、衝突することなく、群衆を効率的にナビゲートする。
ほとんどのロボットビジュアルナビゲーション手法は、視覚タスクで事前訓練されたディープラーニングモデルに依存しており、これは有能な物体を優先する。
視覚ナビゲーション事前訓練(VANP)のためのセルフ・スーパービジョン・ビジョン・アクション・モデルを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:33:08 GMT)
Graph Data Condensation via Self-expressive Graph Structure
Reconstruction [8.4] グラフデータの凝縮は、トレーニングフェーズにおけるストレージと時間コストを軽減するための重要なテクニックである。
我々は textbfSelf-presentive Graph Structure textbfReconstruction による textbfGraph Data textbfCondensation という新しいフレームワークを紹介した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:54:25 GMT)
Evaluating a Methodology for Increasing AI Transparency: A Case Study [8.3] 人工知能の潜在的な害に対する懸念が高まる中、社会はAIモデルとシステムがどのように作成され、使用されるかについて、より透明性を求めるようになった。
これらの懸念に対処するため、いくつかの取り組みが、モデル開発者が答えるべき質問を含むドキュメンテーションテンプレートを提案している。
多様なドキュメントコンシューマのニーズをカバーできるテンプレートはひとつもありません。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:46:43 GMT)
WiMANS: A Benchmark Dataset for WiFi-based Multi-user Activity Sensing [8.1] WiMANSはWiFiに基づくマルチユーザーセンシングのための最初のデータセットである。
We exploit WiMANS to benchmark the performance of State-of-the-the-art WiFi-based human sensor model and video-based model。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:48:02 GMT)
Alignment of Density Maps in Wasserstein Distance [8.1] 本研究では,3次元物体を密度マップとして表現するアルゴリズムを提案する。
このアルゴリズムは、剛性変換後の密度写像間の1-ワッサーシュタイン距離を最小化することに基づいている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:44:18 GMT)
Deep Discriminative to Kernel Density Graph for In- and
Out-of-distribution Calibrated Inference [8.1] ランダムフォレストやディープニューラルネットワークのような深い差別的アプローチは、最近、多くの重要な現実世界のシナリオで応用を見出した。
本稿では,配当データポイントと配当データポイントの両方に対する信頼度校正について述べる。
本稿では,提案手法が対応するクラス条件密度の一貫性のある推定器となるための十分な条件を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:57:20 GMT)
MicroT: Low-Energy and Adaptive Models for MCUs [8.0] MicroTはリソース制約型MCUのための低エネルギーマルチタスク適応モデルフレームワークである。
我々はMicroTを2つのモデル、3つのデータセット、2つのMCUボードで評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:23:13 GMT)
A fixed-point algorithm for matrix projections with applications in
quantum information [8.0] このアルゴリズムは反復数において最適解に指数関数的に収束することを示す。
量子資源理論および量子シャノン理論における我々のアルゴリズムのいくつかの応用について論じる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:51:41 GMT)
Simulating Opinion Dynamics with Networks of LLM-based Agents [8.0] 本稿では,Large Language Models (LLMs) の集団に基づく意見力学のシミュレーション手法を提案する。
以上の結果から, LLMエージェントの正確な情報生成に対するバイアスが強く, シミュレーションエージェントが科学的現実に一致していることが明らかとなった。
しかし、素早い工学を通して確認バイアスを誘導した後、既存のエージェント・ベース・モデリングや意見ダイナミクス研究と並んで意見の断片化を観察した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:14:18 GMT)
Designing variational ansatz for quantum-enabled simulation of
non-unitary dynamical evolution -- an excursion into Dicke supperradiance [8.0] 我々は、AVQDの非制限ベクトル化変種を用いて、様々な非単位進化系をシミュレートし、ベンチマークする。
使用したアンザッツの効率的な分解方式を示し,その応用範囲を様々なオープン量子システムシナリオに拡張することができる。
我々の成功例は、化学と物理学の複雑なシステムを研究するために、適応的な変分法を利用するための道を開いた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:22:20 GMT)
Vector Quantization for Deep-Learning-Based CSI Feedback in Massive MIMO
Systems [7.9] 本稿では,大規模マルチインプットマルチアウトプット(MIMO)システムのための,有限レート深層学習(DL)に基づくチャネル状態情報(CSI)フィードバック手法を提案する。
提案手法は,ベクトル量子化変分オートエンコーダ(VQ-VAE)フレームワークに基づく潜在ベクトルの有限ビット表現を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:28:41 GMT)
Deep-learning-based clustering of OCT images for biomarker discovery in age-related macular degeneration (Pinnacle study report 4) [7.9] 加齢関連黄斑変性症(AMD)に対する深層学習に基づくバイオマーカーの提案について紹介する。
まず、自己教師付きコントラスト学習を用いてニューラルネットワークをトレーニングし、既知のAMDバイオマーカーと未知のAMDバイオマーカーの両方に関連する特徴を発見する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:48:17 GMT)
UniHand: Privacy-preserving Universal Handover for Small-Cell Networks in 5G-enabled Mobile Communication with KCI Resilience [7.8] 小型セルネットワーク(SCN)の導入は、無線リンク品質、スペクトル効率、ネットワーク容量を大幅に改善した。
本研究は,5Gモバイル通信におけるSCNに対するセキュアなプライバシー保護ユニバーサルHOスキーム(UniHand$)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:56:31 GMT)
Mondrian: On-Device High-Performance Video Analytics with Compressive
Packed Inference [7.6] Mondrianは、高解像度ビデオストリーム上で高性能なオブジェクト検出を可能にするエッジシステムである。
我々は,1ピクセルあたりの処理コストを最小限に抑えるために,新しい圧縮パッケージ推論を考案した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:35:12 GMT)
Clifford Group Equivariant Simplicial Message Passing Networks [7.6] Clifford Group Equivariant Simplicial Message Passing Networksを紹介する。
本手法は,クリフォード群同変層と単純メッセージパッシングの表現性を統合する。
本手法は,様々な幾何学的タスクにおいて,同変および単純グラフニューラルネットよりも優れた性能を示すことができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:38:09 GMT)
BizBench: A Quantitative Reasoning Benchmark for Business and Finance [7.5] BizBenchは、現実的な金融問題を推論するモデルの能力を評価するためのベンチマークである。
新たに収集および拡張されたQAデータから、財務的にテーマ化された3つのコード生成タスクを含む。
これらのタスクは、モデルの財務的背景の知識、財務文書を解析する能力、およびコードの問題を解決する能力を評価する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:54:57 GMT)
PowerFlowMultiNet: Multigraph Neural Networks for Unbalanced Three-Phase
Distribution Systems [7.4] このレターでは、非平衡三相電力グリッド用に明示的に設計された新しいマルチグラフGNNフレームワークであるPowerFlowMultiNetを紹介する。
メッセージパッシングを利用したグラフ埋め込み機構を導入し、電力系統ネットワーク内の空間的依存関係をキャプチャする。
厳密なテストでは、大規模な電力ネットワークにおけるエラー率と計算速度の顕著な増加が明らかにされている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:36:27 GMT)
Robust 3D Object Detection from LiDAR-Radar Point Clouds via Cross-Modal
Feature Augmentation [7.4] 本稿では,点雲からの3次元物体検出のための新しい枠組みを提案する。
背骨の微細化と幻覚発生を同時に行うために,空間的および特徴的に複数のアライメントを導入する。
View-of-Delftデータセットの実験により,提案手法は,レーダとLiDARの両方のオブジェクト検出において,最先端(SOTA)手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:24:29 GMT)
Robust 3D Object Detection from LiDAR-Radar Point Clouds via Cross-Modal
Feature Augmentation [7.4] 本稿では,点雲からの3次元物体検出のための新しい枠組みを提案する。
背骨の微細化と幻覚発生を同時に行うために,空間的および特徴的に複数のアライメントを導入する。
View-of-Delftデータセットの実験により,提案手法は,レーダとLiDARの両方のオブジェクト検出において,最先端(SOTA)手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:24:29 GMT)
Multimodal Indoor Localization Using Crowdsourced Radio Maps [7.2] 我々は,無線地図の不正確さとスパースカバレッジの課題に対処する新しい枠組みを導入する。
提案システムは,WiFiローカライゼーションのための不確実性を考慮したニューラルネットワークモデルと,最適核融合のためのベージアン融合技術を統合する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:06:14 GMT)
BraSyn 2023 challenge: Missing MRI synthesis and the effect of different
learning objectives [7.2] 我々はBraSynチャレンジのマルチシーケンスMR画像合成設定における異なる損失関数の影響について検討した。
異なる学習目的をうまく組み合わせることで、画像合成性能を最適化する方法を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:36:27 GMT)
Learn and Search: An Elegant Technique for Object Lookup using
Contrastive Learning [6.9] ラーン・アンド・サーチ(Learn and Search)は,コントラスト学習の力を活用して検索システムの効率性と有効性を高める,オブジェクト検索の新しいアプローチである。
「学習と探索」は、画像内の極端に類似した領域の識別において、その有効性を示す優れた類似性グリッド精度を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:58:19 GMT)
Verification-Aided Learning of Neural Network Barrier Functions with
Termination Guarantees [6.9] バリア関数は、システムの安全性を保証するための一般的なフレームワークである。
これらの関数を見つける一般的な方法は存在しない。
近年のアプローチでは、自己教師付き学習技術を用いてこれらの機能を学習している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:29:43 GMT)
Network Formation and Dynamics Among Multi-LLMs [6.9] 大規模言語モデル (LLM) は, ネットワーク形成における好みを問うと, 重要なソーシャルネットワークの原則を示す。
また、実世界のネットワークに基づくLCMの意思決定について検討し、三進的閉鎖とホモフィリーが優先的なアタッチメントよりも強い影響があることを明らかにした。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:12:55 GMT)
RudolfV: A Foundation Model by Pathologists for Pathologists [6.9] 我々は、半自動データキュレーションにより、スライド画像全体のデジタル病理学の基礎モデルの現状を拡大する。
我々は、異なる固定、染色、走査プロトコルからのデータをカバーする12億の画像パッチに対応する133kのスライドをキュレートする。
得られたモデルを公開および内部ベンチマークで評価し、我々の基礎モデルは、桁違いに少ないスライドで訓練されているものの、競合するモデルよりも同等かそれ以上の性能を発揮していることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:47:59 GMT)
Couler: Unified Machine Learning Workflow Optimization in Cloud [6.8] Coulerは、クラウドにおけるMLワークフローの統一最適化のために設計されたシステムである。
大規模言語モデル(LLM)をワークフロー生成に統合し、さまざまなワークフローエンジンに統一されたプログラミングインターフェースを提供する。
Couerは、CPU/メモリ使用率を15%以上改善し、ワークフロー完了率を約17%向上させた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:47:32 GMT)
SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted
Technical Debt [6.7] 自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。
textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:33:53 GMT)
Automated Approaches to Detect Self-Admitted Technical Debt: A
Systematic Literature Review [6.7] 自己承認型技術的負債(SATD)とは、開発者が最適なコード品質や設計上の欠陥を明確に認識するインスタンスを指す。
本稿では,技術的負債検出に使用される特徴抽出手法とML/DLアルゴリズムの分類法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:12:38 GMT)
A Deep Learning Approach to Diabetes Diagnosis [6.5] 3つのデータセットの実験結果は、従来の手法と比較して、全体的な精度、感度、特異性を大幅に改善したことを示している。
このことは、堅牢な糖尿病診断のためのディープラーニングモデルの可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:18:59 GMT)
A New Random Forest Ensemble of Intuitionistic Fuzzy Decision Trees [6.4] 直観主義的ファジィ決定木(IFDT)のランダム森林アンサンブルを提案する。
提案手法は,ブートストラップサンプリングと特徴選択からランダム性のパワーを享受する。
本研究は,直観的ファジィ理論に基づくランダムな森林アンサンブルを提案する最初の試みである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:52:24 GMT)
Distilling the Knowledge in Data Pruning [6.3] 刈り込みサブセットのトレーニングにおいて,知識蒸留(KD)を取り入れたデータ刈り込みの適用について検討する。
我々は、データセット、プルーニング方法、および全てのプルーニング率において、大幅な改善を示す。
興味をそそる観察を行ない、より低いプルーニング率を使用すると、より大きな教師が精度を低下させ、驚くべきことに、学生よりも少ない能力の教師を雇うことで、結果が改善する可能性がある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:44:45 GMT)
SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object
Detection [6.3] クエリベースのパラダイムは、明示的な高密度なBEV機能構築を伴わずに低レイテンシを採用するため、スパース3D検出器は大きな注目を集めている。
エンドツーエンドのマルチモード3Dオブジェクト検出のための高性能フルスパース検出器を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:34:03 GMT)
WsiCaption: Multiple Instance Generation of Pathology Reports for
Gigapixel Whole-Slide Images [6.3] スライド画像全体から病理報告を生成する方法について検討する。
私たちは、最大のWSIテキストデータセット(TCGA-PathoText)をキュレートしました。
本稿では,ギガピクセルWSIの病態レポートを生成するマルチインスタンス生成モデル(MI-Gen)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:07:39 GMT)
Federated Learning of Socially Appropriate Agent Behaviours in Simulated
Home Environments [6.3] 社会ロボットは日々の生活にますます統合され、彼らの行動が社会的規範と整合することを保証することが不可欠である。
個々のロボットが独自の環境について学ぶことのできるフェデレートラーニング(FL)設定を探求することが重要である。
本稿では,複数ラベルの回帰目標を用いて,異なる戦略を評価する新しいFLベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:16:40 GMT)
Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified
3D Perception [6.2] 多様な3次元知覚タスクのための新しいカメラレーダ融合アーキテクチャであるHyDRaを紹介する。
我々のハイト・アソシエーション・トランスフォーマー・モジュールは、すでに視界のレーダー機能を利用して、より堅牢で正確な深度予測を行う。
HyDRaは64.2 NDS (+1.8) と58.4 AMOTA (+1.5) のカメラレーダー融合のための新しい最先端技術を実現している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:28:51 GMT)
Fine-tuning of diffusion models via stochastic control: entropy
regularization and beyond [6.2] 本稿では,連続時間拡散モデルにおけるエントロピー正規化微調整問題に対する厳密な対処法を開発し,提供することを目的とする。
一般の$f$-divergence regularizerを含む微調整まで解析をどのように拡張できるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:54:34 GMT)
Progress in artificial intelligence applications based on the
combination of self-driven sensors and deep learning [6.1] Wang Zhong linと彼のチームは、マックスウェル変位電流を駆動力として、機械的刺激を直接電気信号に変換する三誘電体ナノジェネレータ(TENG)を発明した。
本稿では,優れた音声認識能力を有するTENGのインテリジェントな音響監視・認識システムについて述べる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:14:15 GMT)
Fixing Smart Contract Vulnerabilities: A Comparative Analysis of
Literature and Developer's Practices [6.1] 文献で見られるような脆弱性の修正をガイドラインとして挙げる。
開発者がこれらのガイドラインにどの程度準拠しているか、あるいは他の実行可能な共通ソリューションがあるのか、それらが何であるかは明らかではない。
本研究の目的は,開発者が既存のガイドラインを遵守することに関連する知識ギャップを埋めることと,セキュリティ脆弱性に対する新たな,実行可能なソリューションを提案することである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:55:54 GMT)
Application of Quantum Machine Learning in a Higgs Physics Study at the
CEPC [5.7] 我々は、Circular Electron-Positron Collider (CEPC)において、量子機械学習アルゴリズムを用いて、$e+e- rightarrow ZH$プロセスの研究を行った。
量子コンピュータシミュレータの6キュービットを用いて,QSVM-カーネルアルゴリズムを最適化し,従来のサポートベクトルマシンアルゴリズムと同様の分類性能を得た。
我々の研究は、最先端の量子コンピューティング技術が粒子物理学によって活用できることを示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:26:42 GMT)
On Alternating-Time Temporal Logic, Hyperproperties, and Strategy
Sharing [5.6] We show that HyperATL$*_S$ is a rich specification language that captures important AI-related properties。
我々はHyMASMCと呼ぶツールにモデルチェックアルゴリズムを実装し、それを様々なベンチマークで評価する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:09:50 GMT)
Beyond Regrets: Geometric Metrics for Bayesian Optimization [5.3] 我々は4つの新しい幾何学的指標、すなわち精度、リコール、平均等級、平均距離を提案する。
これらの測定により、クエリポイントとグローバルオプティマの両方の幾何を考慮したベイズ最適化アルゴリズムまたはクエリポイントを比較することができる。
提案手法がベイズ最適化アルゴリズムをより微妙に解釈できることを実証的に検証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:41:06 GMT)
Novelty Detection on Radio Astronomy Data using Signatures [5.3] SigNovaは、ストリームデータ中の異常を検出するための、新しい半教師付きフレームワークである。
我々は、シグネチャ変換を用いて観測シーケンスから統計の標準的コレクションを抽出する。
各特徴ベクトルは、RFIフリートレーニングセットにおいて、マハラノビスから隣人への距離として計算されたノベルティスコアが割り当てられる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:34:16 GMT)
Simulating Weighted Automata over Sequences and Trees with Transformers [5.1] DFAを仮定するモデルのクラスである重み付き有限オートマトン (WFAs) と重み付き木オートマトン (WTA) をシミュレートできることを示す。
我々はこれらの主張を正式に証明し、ターゲットオートマタの状態数の関数として必要とされる変換器モデルのサイズについて上限を与える。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:54:34 GMT)
Decentralized and Equitable Optimal Transport [5.0] 制約結合最適化問題としてD-OT問題を再構成する。
本稿では,O(1/epsilon)の反復複雑度を持つ単一ループ分散アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:02:49 GMT)
Style2Talker: High-Resolution Talking Head Generation with Emotion Style
and Art Style [5.0] 本稿では,Style2Talkerという,革新的な音声駆動音声生成手法を提案する。
Style-EとStyle-Aという2つのスタイル化ステージがあり、テキストコントロールされた感情スタイルと絵コントロールされたアートスタイルを最終出力に統合する。
本手法は、感情スタイルと芸術スタイルの両方のオーディオ-リップ同期とパフォーマンスの観点から、既存の最先端手法よりも優れています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:12:29 GMT)
FlowVQTalker: High-Quality Emotional Talking Face Generation through
Normalizing Flow and Quantization [5.0] 本稿では,正規化フローとベクトル量子化モデルを用いて感情的な発話顔を生成することを提案する。
具体的には、顔の感情のダイナミクスを多感情階級の潜在空間にエンコードするフローベース係数生成器を開発する。
設計したベクトル量子化画像生成器は、コードクエリータスクとして表現力のある顔画像を作成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:31:12 GMT)
CheXmask: a large-scale dataset of anatomical segmentation masks for
multi-center chest x-ray images [5.0] 画像に均一な微細な解剖学的アノテーションを付加した胸部X線マルチセンターセグメンテーションデータセットを提案する。
提案手法はHybridGNetモデルを用いて,一貫性と高品質なセグメンテーションを保証する。
このデータセットは、より広い科学コミュニティにとって貴重なリソースである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:15:45 GMT)
ViT-CoMer: Vision Transformer with Convolutional Multi-scale Feature
Interaction for Dense Predictions [4.9] Vision Transformer (ViT) はコンピュータビジョンにおいて大きな成功を収めているが、密集した予測タスクではうまく機能しない。
コンボリューショナル・マルチスケール機能を有するVTバックボーンであるViT-CoMerについて述べる。
階層的特徴をまたいだマルチスケールの融合を行う,シンプルで効率的なCNN-Transformer双方向核融合モジュールを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:59:41 GMT)
Communication Optimization for Distributed Training: Architecture,
Advances, and Opportunities [4.9] 分散ディープニューラルネットワークトレーニングの一般的なアーキテクチャを導入し、並列化戦略、集合通信ライブラリ、ネットワーク間の関係を分析する。
現在の3層パラダイムのレイヤは比較的独立しているが、分散トレーニングシナリオでは、層間協調最適化のための豊富な設計スペースがある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:15:57 GMT)
An Active Contour Model Driven By the Hybrid Signed Pressure Function [4.8] 本稿では,ハイブリッド符号付き圧力関数によって駆動されるアクティブな輪郭モデルを提案する。
実験および数値解析により、このモデルは強度不均一画像と雑音画像の両方に対して優れたセグメンテーション性能を有することが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:58:37 GMT)
GPT-generated Text Detection: Benchmark Dataset and Tensor-based
Detection Method [4.8] GPT Reddit データセット(GRiD)は,GPT(Generative Pretrained Transformer)によって生成された新しいテキスト検出データセットである。
データセットは、Redditに基づくコンテキストプロンプトペアと、人間生成とChatGPT生成のレスポンスで構成されている。
データセットの有用性を示すために、我々は、その上でいくつかの検出方法をベンチマークし、人間とChatGPTが生成する応答を区別する効果を実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:15:21 GMT)
Uncertainty Quantification with Deep Ensembles for 6D Object Pose
Estimation [4.8] 深層アンサンブルを用いた多段6次元オブジェクトポーズ推定手法の不確かさを定量化する手法を提案する。
実装において、SurfEmbを代表として選択する。これは、最も優れた6Dオブジェクトのポーズ推定手法の1つである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:19:25 GMT)
Robustifying Point Cloud Networks by Refocusing [4.7] 我々は、焦点分析に基づくニューラルネットワークのロバスト性を高めるための一般的なメカニズムを開発する。
最近の研究では、textitOverfocusingの現象が明らかにされており、パフォーマンス低下につながっている。
パラメータフリーなtextbfrefocusing アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:05:23 GMT)
Fast and Simple Explainability for Point Cloud Networks [4.7] 本稿では,ポイントクラウドデータのための高速で簡単なAI(XAI)手法を提案する。
トレーニングされたネットワークダウンストリームタスクに関して、ポイントワイズの重要性を計算します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:51:23 GMT)
lil'HDoC: An Algorithm for Good Arm Identification under Small Threshold
Gap [4.7] グッドアーム識別(GAI)は、単一の学習者が良い腕と特定されるとすぐに腕を出力する純粋探索バンディット問題である。
本稿では,腕の期待報酬と与えられた閾値との距離を参考に,小さな閾値ギャップ下でのGAI問題に焦点を当てた。
我々は,HDoCアルゴリズムの総サンプリング複雑性を大幅に改善するLil'HDoCと呼ばれる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:53:36 GMT)
Harnessing Artificial Intelligence to Combat Online Hate: Exploring the
Challenges and Opportunities of Large Language Models in Hate Speech
Detection [4.7] 大規模言語モデル(LLM)は、翻訳、要約、感情分析など、言語生成以外の多くの多様なアプリケーションで優れている。
このことは、憎しみや有害なスピーチを識別する領域において、問題や倫理的なジレンマに悩まされる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:12:28 GMT)
Unsupervised Multi-Person 3D Human Pose Estimation From 2D Poses Alone [4.6] 本研究は,教師なし多人数2D-3Dポーズ推定の実現可能性について検討した最初の研究の1つである。
本手法では,各被験者の2次元ポーズを3次元に独立に持ち上げ,それらを共有3次元座標系で組み合わせる。
これにより、ポーズの正確な3D再構成を検索することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:45:45 GMT)
A Survey on Causal Discovery Methods for I.I.D. and Time Series Data [4.6] 因果発見(CD)アルゴリズムは、関連する観測データからシステムの変数間の因果関係を識別することができる。
本稿では、独立および同一分散データ(I.I.D.)データと時系列データの両方から因果発見を行うために設計された手法について広範な議論を行う。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:14:45 GMT)
Prompter: Utilizing Large Language Model Prompting for a Data Efficient
Embodied Instruction Following [4.5] Embodied Instruction 自律的な移動操作ロボットは、長期のタスクを達成するためにどのように制御されるべきかの研究に続く。
デプロイされたロボットの物理的制約をモジュール設計に組み込むことは非常に効果的であることを示す。
私たちの設計では、同じモジュールシステムが、最小限の修正で、異なる構成のロボット間で動作できるようにしています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:01:54 GMT)
CAS: A General Algorithm for Online Selective Conformal Prediction with
FCR Control [4.5] 我々は,任意の予測モデルとオンライン選択ルールをラップできるCASという汎用フレームワークを開発した。
我々はCASが有限サンプルおよび分布自由な状態において、厳密な選択条件のカバレッジ保証を達成できることを証明した。
合成データと実データの両方の数値計算結果から,CASがFCRを目標レベル付近で効果的に制御できることが判明した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:07:20 GMT)
Time-Efficient and Identity-Consistent Virtual Try-On Using A Variant of
Altered Diffusion Models [4.4] 本研究は, 多様なシナリオにおいて, 複雑なテクスチャの詳細と, 対象者と衣服の特徴的な特徴を保存することの課題を強調した。
様々な既存アプローチが検討され、制限と未解決の側面を強調している。
次に,仮想試行中にテクスチャのテクスチャ保存とユーザアイデンティティ保持に対処する,新しい拡散型ソリューションを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:15:29 GMT)
Vision-based Vehicle Re-identification in Bridge Scenario using Flock
Similarity [4.4] 車両の再識別(英: vehicle re-identification)とは、あるカメラの下に別のカメラに現れる車両を見つけることを指す。
車両の外観データには、高いクラス間類似性と大きなクラス内差異の特徴がある。
そこで本研究では,フロック類似性に基づく車両再識別手法を提案し,車両再識別の精度を向上する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:39:56 GMT)
Continual Learning by Three-Phase Consolidation [4.3] TPC(Three-Phase Consolidation)は、新しいクラス(および/または既知のクラスのインスタンス)を継続的に学習するためのシンプルで効果的なアプローチとして紹介される。
クラスバイアス問題(クラスアンバランシングによる)の除去と、未表現のクラスを忘れないように勾配ベースの修正を制限することを目的としている。
Avalanche Open framework for continual learningの公開により,本論文で提示したアルゴリズムとすべての結果は再現可能である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:31:14 GMT)
Temporal Decisions: Leveraging Temporal Correlation for Efficient
Decisions in Early Exit Neural Networks [4.3] 本稿では,早期排他ニューラルネットワークの決定機構としての差分検出と時間パタンスについて述べる。
健康モニタリング、画像分類、ウェイクワード検出タスクにおけるそれらの効果を評価する。
推定平均演算を最大80%削減し,元のモデルの5%以内の精度を維持した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:28:27 GMT)
Efficient Post-Training Augmentation for Adaptive Inference in
Heterogeneous and Distributed IoT Environments [4.3] Early Exit Neural Networks (EENN)は、ニューラルネットワークのデプロイメントの効率を高めるソリューションを提供する。
本稿では,既存のモデルをEENNに変換することに焦点を当てた自動拡張フローを提案する。
本フレームワークはEENNアーキテクチャを構築し,そのサブグラフをハードウェアターゲットにマップし,その決定機構を構成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:27:53 GMT)
Anderson acceleration for iteratively reweighted $\ell_1$ algorithm [4.3] 反復再重み付きL1アルゴリズム(IRL1)は、非滑らかな正規化による最適化問題の解法として一般的なアルゴリズムである。
アンダーソン加速IRL1アルゴリズムを提案し,その局所収束率を確立する。
実験結果から,我々のアルゴリズムは既存のNesterov加速度に基づくアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:00:15 GMT)
Augmenting Interpolation-Based Model Checking with Auxiliary Invariants
(Extended Version) [4.3] モデル検査に外部不変量を注入する拡張型検証アルゴリズムを提案する。
インジェクション不変により安全性の証明に必要なクエリ数が削減され,実行時の効率が向上することがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:02:53 GMT)
Smartphone region-wise image indoor localization using deep learning for
indoor tourist attraction [4.3] スマートフォンのGlobal Positional Systemsは、コンクリートや金属ブロックのような密度の高い物質がGPS信号を弱めるシナリオには適さない。
深層学習により、スマートフォン画像を用いて、地域的屋内ローカライゼーションを行うことができる。
本稿では,屋内観光地におけるスマートフォンカメラ画像を用いた深層学習アルゴリズムによる位置の分類を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:04:37 GMT)
Dynamic Cross Attention for Audio-Visual Person Verification [4.2] 本研究では,動的クロスアテンション(DCA)モデルを提案する。
特に、コンディショナルゲーティング層は、クロスアテンション機構の寄与を評価するように設計されている。
Voxceleb1データセットで大規模な実験を行い、提案モデルの堅牢性を実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:52:02 GMT)
Audio-Visual Person Verification based on Recursive Fusion of Joint
Cross-Attention [4.2] 本稿では,クロスアテンショナル・フレームワークにおいて,共同音声・視覚的特徴表現が使用されるような,共同のクロスアテンショナル・モデルを提案する。
また,音声・視覚的特徴表現の時間的モデリングを改善するため,BLSTMについても検討する。
その結果,本モデルでは,モーダル内関係とモーダル間関係を良好に捉えることにより,融合性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:50:27 GMT)
An Improved Strategy for Blood Glucose Control Using Multi-Step Deep
Reinforcement Learning [4.2] 血糖コントロール(BG)は、体外インスリン注入によって、個人のBGを健康な範囲に保持する。
最近の研究は、個別化および自動化されたBG制御アプローチの探索に費やされている。
深層強化学習(DRL)は新たなアプローチとしての可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:53:00 GMT)
BayesFLo: Bayesian fault localization of complex software systems [4.2] ソフトウェアテストの主要なステップは、障害ローカライゼーションである。これは、テストデータを使用して、さらなる診断のために障害誘発の組み合わせをピンポイントする。
既存の断層定位法は決定論的であり、潜在的な根本原因の確率的リスクを評価するための原則的アプローチを提供していない。
本稿では,潜在的根本原因の組み合わせに対して柔軟なベイズモデルを利用するベイズFLoと呼ばれる新しいベイズ断層定位フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:12:53 GMT)
Interpolation and SAT-Based Model Checking Revisited: Adoption to
Software Verification [3.9] 有限状態遷移系の安全性を検証するために形式検証アルゴリズムが考案された。
20年経っても、このアルゴリズムはまだハードウェアモデル検査の最先端にある。
私たちの貢献は、この重要な20年前の知識ギャップを、ソフトウェア検証にアルゴリズムを採用することで埋めることです。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:38:30 GMT)
Monocular Microscope to CT Registration using Pose Estimation of the
Incus for Augmented Reality Cochlear Implant Surgery [3.9] 本研究では, 外部追跡装置を必要とせず, 2次元から3次元の観察顕微鏡映像を直接CTスキャンに登録する手法を開発した。
その結果, x, y, z軸の平均回転誤差は25度未満, 翻訳誤差は2mm, 3mm, 0.55%であった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:26:08 GMT)
AI Ethics: A Bibliometric Analysis, Critical Issues, and Key Gaps [3.8] この研究は、過去20年間にAI倫理文学の総合的文献計測分析を行った。
彼らは、コリングリッジジレンマを含む7つの重要なAI倫理問題、AIステータスの議論、AIの透明性と説明可能性に関連する課題、プライバシー保護の合併症、正義と公正の考慮、アルゴクラシーと人間の啓発に関する懸念、超知能の問題を提示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:43:21 GMT)
A generative artificial intelligence framework based on a molecular
diffusion model for the design of metal-organic frameworks for carbon capture [3.8] GHP-MOFassembleは、CO2容量と合成可能なリンカーを備えたMOFの合理的かつ迅速な設計のための生成人工知能フレームワークである。
GHP-MOFassembleは、一意性、合成可能性、構造的妥当性のためにAI生成のMOFをスクリーンし、検証する。
仮説MOFデータセットの96.9%以上の2$m mol/g$以上のCO2容量を持つAI生成MOFの上位6つを提示する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:14:22 GMT)
SAMDA: Leveraging SAM on Few-Shot Domain Adaptation for Electronic
Microscopy Segmentation [3.8] 本稿では,新しいドメイン適応フレームワークSAMDAを紹介する。
これは、Segment Anything Model(SAM)と埋め込み空間のnnUNetを組み合わせることで、高い転送性と精度を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:28:29 GMT)
A quantum oscillator interacting with a classical oscillator [3.7] 古典振動子上での量子発振器の相互作用とバックリアクタについて検討する。
古典量子経路積分の定式化を応用したシステムを提案する。
これは、1つのシステムを効果的に古典的なものとして扱うことができる、他の多くのシステムのためのおもちゃモデルとして機能する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:13:02 GMT)
Generating Clarification Questions for Disambiguating Contracts [3.7] 我々は,契約の明確化に関する疑問を生じさせる新たな法的NLPタスクを導入する。
これらの質問は、文書レベルで契約の曖昧さを特定し、非法的利害関係者を支援することを目的としています。
CUADデータセットから得られた契約に基づいて実施された実験は、ConRAPがF2スコア0.87であいまいさを検出できることを示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:57:39 GMT)
An Efficient Difference-of-Convex Solver for Privacy Funnel [3.6] 本稿では,プライバシ・ファンネル(PF)手法の効率的な解法を提案する。
提案した直流分離は, クローズドフォーム更新方程式を導出する。
提案手法をMNISTおよびFashionデータセットを用いて評価する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:47:52 GMT)
FeTrIL++: Feature Translation for Exemplar-Free Class-Incremental
Learning with Hill-Climbing [3.5] EFCIL(Exemplar-free class-incremental Learning)は、主に破滅的な忘れが原因で大きな課題を提起する。
従来のEFCILのアプローチは、連続した微調整や安定性を通じて、プラスチックのモデルに傾くのが一般的である。
本稿では,様々なオーバーサンプリング手法と動的最適化手法の有効性を検討するための基礎的なFeTrILフレームワークを構築した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:34:05 GMT)
Beyond Privacy Trade-offs with Structured Transparency [3.5] これらの懸念の多くは「コピー問題」に還元されていると論じる。
コピー問題は解けないが、これらの増幅問題の側面は様々な非連結フィールドで解決されている。
我々は、これらの取り組みを特定の機能にグループ化し、"構造化透明性"と呼ばれる包括的なビジョンに統合するための基盤を提供する5つのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:09:35 GMT)
Imbalance-aware Presence-only Loss Function for Species Distribution
Modeling [3.4] 本研究では,大規模市民科学に基づくデータセットに対して,存在のみの損失関数を用いたディープラーニングモデルのトレーニングの有効性を評価する。
この不均衡認識損失関数は、様々なデータセットやタスクにおける従来の損失関数よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:08:36 GMT)
Optimal Design and Implementation of an Open-source Emulation Platform
for User-Centric Shared E-mobility Services [3.4] e-mobilityリサーチコミュニティに利益をもたらすような、統合されたオープンソースフレームワークはありません。
本稿では,共有e-mobilityの先駆的なオープンソースフレームワークを提供することで,このギャップを埋めることを目的とする。
提案するフレームワークは、エージェント・イン・ザ・ループのアプローチとモジュラーアーキテクチャを持ち、多様なユーザの好みに合わせてカスタマイズされ、拡張されたカスタマイズを提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:51:30 GMT)
On Solving Close Enough Orienteering Problem with Overlapped
Neighborhoods [3.4] Close Enough Traveling Salesman Problem (CETSP) は、Close Enough Orienteering Problem (CEOP) のよく知られた変種である。
シュタイナーゾーン(Steiner Zones, SZ)と呼ばれる重なり合う地区に基づくヒューリスティックスは、CETSPに対処する上で注目されている。
ここでは、重複する地区に賞品を集約することで、このような制限が、親密な配向問題(CEOP)の利点にどのように変換できるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:16:29 GMT)
Scalable Spatiotemporal Prediction with Bayesian Neural Fields [3.3] BayesNFは、高容量関数推定のための新しいディープニューラルネットワークアーキテクチャである。
気候および公衆衛生データセットからの統計的機械学習予測問題に対してベイズNFを評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:47:50 GMT)
Detecting Security-Relevant Methods using Multi-label Machine Learning [3.3] Dev-AssistはIntelliJ IDEAプラグインで、マルチラベル機械学習アプローチを使用してセキュリティ関連メソッドを検出する。
静的解析ツールの設定を自動的に生成し、静的解析を実行し、IntelliJ IDEAで結果を表示することができる。
我々の実験によると、Dev-Assistの機械学習アプローチは、関連するアプローチよりもF1-Measureが高い。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:38:54 GMT)
Trainable and Explainable Simplicial Map Neural Networks [3.3] 単純なマップニューラルネットワーク(SMNN)は、興味深い特性を持つトポロジベースのニューラルネットワークである。
SMNNは高次元データセットに適用可能なボトルネックをいくつか提示する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:41:35 GMT)
Deep Learning for Steganalysis of Diverse Data Types: A review of
methods, taxonomy, challenges and future directions [3.2] ステガノグラフィーとステガナリシスは特に法執行機関から大きな関心を集めている。
本稿では,ディープラーニングに基づくステガナリシス技術の概要を概観する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:16:38 GMT)
SCALHEALTH: Scalable Blockchain Integration for Secure IoT Healthcare Systems [3.1] 分散化、患者のプライバシの保護、機密性の維持は、電子医療システムに不可欠です。
本研究では,データ暗号化の共通鍵を秘密裏に送信するために認証を用いる。
非偽造トークン(NFT)は、患者処方薬の信頼性を確保するために、薬局や保険会社に患者処方薬を送るために使用される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:42:32 GMT)
MoralBERT: Detecting Moral Values in Social Discourse [3.1] 道徳は、私たちの決定や判断に大きな影響を与えながら、情報をどのように知覚するかにおいて、基本的な役割を担います。
自然言語処理の最近の進歩は、道徳的価値を人間の生成したテキストコンテンツで測定できることを実証している。
そこで本研究では,MoralBERTと呼ばれるテキストの道徳的ニュアンスを正確に捉えるために,微調整された言語表現モデルを設計する。
私たちは、Twitter、Reddit、Facebookの3つの異なるソースからの注釈付き道徳データを活用しています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:12:59 GMT)
Low-depth Hamiltonian Simulation by Adaptive Product Formula [3.1] 量子コンピュータ上の量子システムの力学を効率的に研究するために、様々なハミルトンシミュレーションアルゴリズムが提案されている。
本稿では,低深度時間進化回路を構築するための適応的手法を提案する。
我々の研究は、雑音の中規模量子デバイスを用いた実践的なハミルトンシミュレーションに光を当てている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:01:16 GMT)
Exploring Architectures for CNN-Based Word Spotting [2.9] 最近の研究では、畳み込みニューラルネットワークがこの分野を乗っ取っている。
CNNがワードスポッティングにどの程度複雑でなければならないのか?
最近成功したTPP-PHOCNetはResidual Network、Densely Connected Convolutional Network、LeNetアーキテクチャと比較される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:21:12 GMT)
When Eye-Tracking Meets Machine Learning: A Systematic Review on
Applications in Medical Image Analysis [2.9] 目の動きを監視し記録する技術であるアイトラッキングは、人間の視覚的注意パターンに関する貴重な洞察を提供する。
複雑な人間の視覚的注意パターンが埋め込まれた視線追跡データは、人工知能(AI)開発と人間の認知を統合するための橋渡しを提供する。
本稿では,医療画像解析のためのML/DLアルゴリズムの深度化のための視線追跡と手法について検討する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:17:20 GMT)
Do Agents Dream of Electric Sheep?: Improving Generalization in
Reinforcement Learning through Generative Learning [2.9] 我々は想像力に基づく強化学習を用いて、夢のようなエピソードのポリシーを訓練する。
4つのProcGen環境における実験により,古典的想像力や学習経験のオフライントレーニングに比べ,本手法はより高度な一般化を実現することができた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:00:02 GMT)
Fine-tuning Large Language Models with Sequential Instructions [2.9] 大きな言語モデル(LLM)は、その一部を無視したり誤解させたりするため、単一のクエリで命令列に従うのに苦労する。
本稿では,命令処理データを自動的に拡張し,複数の逐次命令を実行する能力を備えたLCMを装備するシーケンシャル命令チューニング手法を提案する。
逐次的命令調整モデルは、推論、多言語、マルチモーダル能力を含む下流タスクにおいて、従来の命令調整ベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:33:30 GMT)
Group Decision-Making among Privacy-Aware Agents [2.9] 個人のプライバシーを維持し、効果的な社会学習を可能にすることはどちらも重要なデシダータであるが、基本的には互いに相反しているように見える。
差分プライバシー(DP)に基づく厳密な統計的保証を用いて情報漏洩を制御する。
その結果,グループ意思決定の結果の質,学習精度,通信コスト,エージェントが備えているプライバシー保護の水準の両面でのトレードオフの性質が明らかになった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:37:26 GMT)
Atomic clock locking via Bayesian frequency estimation [2.9] ハイゼンベルクスケーリングにアプローチする適応周波数推定プロトコルを開発した。
ベイズ周波数推定プロトコルを用いて原子時計のロバスト閉ループロックを実現する。
私たちの発見は、量子磁気センサや原子干渉計など、他の量子センサーにも有望な応用が期待できる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:16:11 GMT)
Supporting Error Chains in Static Analysis for Precise Evaluation
Results and Enhanced Usability [2.9] 静的解析は、固定位置よりも脆弱性が現れる場所を報告する傾向にある。
これは仮定された偽陽性や不正確な結果を引き起こす可能性がある。
我々は、既存の静的解析アルゴリズムを適応させ、マニフェストと固定位置を区別できるように設計した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:46:29 GMT)
Assessing the Influence of Toxic and Gender Discriminatory Communication
on Perceptible Diversity in OSS Projects [2.8] 近年,オープンソースソフトウェア(OSS)コミュニティにおける有毒・性同一性推論言語の存在が研究者の焦点となっている。
本研究は,オープンソースソフトウェア開発チームのジェンダー,民族性,在職多様性にどのような影響を及ぼすかを検討することを目的とする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:48:21 GMT)
General surgery vision transformer: A video pre-trained foundation model
for general surgery [2.8] 現在までに680時間に及ぶ手術ビデオのデータセットをオープンソース化しています。
本稿では,前方映像予測に基づく手術映像における一般手術視変換器(GSViT)の事前訓練手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:23:45 GMT)
General surgery vision transformer: A video pre-trained foundation model
for general surgery [2.8] 現在までに680時間に及ぶ手術ビデオのデータセットをオープンソース化しています。
本稿では,前方映像予測に基づく手術映像における一般手術視変換器(GSViT)の事前訓練手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:23:45 GMT)
Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic
Music Generation [2.8] 音楽構造をモデル化することは、シンボリック・ミュージック・コンポジションを生成する人工知能システムにとって重要な課題である。
本稿では,コヒーレント構造を取り入れた手法の進化を概観する。
我々は,すべての時代のアプローチを組み合わせることによる相乗効果を実現するために,いくつかの重要な方向性を概説する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:03:08 GMT)
RAD-PHI2: Instruction Tuning PHI-2 for Radiology [2.8] 小言語モデル(SLM)は、一般的なドメイン言語理解、推論、コーディングタスクにおいて顕著なパフォーマンスを示している。
本研究では,SLMの一般放射線学知識への応用,特に症状の理解に関連する質問応答について検討する。
胸部X線レポートに関連する一般領域タスクと放射線学固有のタスクの両方でPhi-2を微調整することにより、Rad-Phi2を作成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:27:22 GMT)
Information Leakage through Physical Layer Supply Voltage Coupling Vulnerability [2.6] 物理層電源電圧結合(PSVC)によるデータ依存電力変動をリークする新しいサイドチャネル脆弱性を導入する。
従来の電源サイドチャネル攻撃とは異なり、提案された脆弱性により、敵は攻撃をマウントし、デバイスを変更することなく情報を抽出することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:39:54 GMT)
Lander.AI: Adaptive Landing Behavior Agent for Expertise in 3D Dynamic
Platform Landings [2.5] 本研究では,風環境下でのプラットフォーム上での移動と着陸を目的とした,高度な深層強化学習(DRL)エージェントであるLander:AIを紹介する。
Lander:AIは、風の乱流を含む現実世界の複雑さを反映するジム・ピブルレット・ドーンシミュレーションで厳格に訓練されています。
実験の結果、ランダー:AIの高精度着陸と移動プラットフォームへの適応能力は、風による乱れでも示されました。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:46:33 GMT)
Low coordinate degree algorithms I: Universality of computational
thresholds for hypothesis testing [2.5] 低座標次関数 (LCDF) は高次元確率測度間の仮説テストを行うことができる。
LCDFはノイズチャネルを介して十分な「希薄」ランダム信号の存在をテストできることを示す。
これらの結果は、これら全てのモデルに対する任意の大きなアルゴリズムに対する最初の計算下界である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:52:35 GMT)
Majorization-minimization for Sparse Nonnegative Matrix Factorization
with the $\beta$-divergence [2.4] 他の因子(辞書行列)のノルムは不正な定式化を避けるために制御する必要があることはよく知られている。
標準のプラクティスは、辞書の列に単位ノルムを持つよう制約することであり、これは非自明な最適化問題につながる。
我々は,$ell_1$-regularization あるいはより "攻撃的" なログ規則化に対して,単純な乗法的更新をもたらすブロック・ディフレッシブ・プライマリゼーション・最小化アルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:29:58 GMT)
DALSA: Domain Adaptation for Supervised Learning From Sparsely Annotated
MR Images [2.4] そこで本研究では,自動腫瘍セグメンテーションのための教師あり学習において,スパースアノテーションによるサンプル選択誤差を補正するトランスファーラーニング手法を提案する。
提案手法は,スパースおよび曖昧なアノテーションから,異なる組織クラスに対する高品質な分類法を導出する。
完全ラベル付きデータを用いたトレーニングと比較して, ラベル付け時間とトレーニング時間は, 精度を犠牲にすることなく, 70倍, 180倍に短縮した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:17:21 GMT)
Efficient Knowledge Deletion from Trained Models through Layer-wise
Partial Machine Unlearning [2.3] 本稿では,機械学習アルゴリズムの新たなクラスを紹介する。
第1の方法は、アンネシアック・アンラーニングであり、アンネシアック・アンラーニングとレイヤーワイズ・プルーニングの統合である。
第2の方法は、階層的な部分更新をラベルフリップと最適化に基づくアンラーニングに同化する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:49:47 GMT)
Experimental Comparison of Ensemble Methods and Time-to-Event Analysis
Models Through Integrated Brier Score and Concordance Index [2.3] 本稿では,時間-時間解析のための予測モデルの性能について検討・比較する。
本研究では,時間-時間分析においてまだ研究されていないアンサンブル法が,予測精度を向上し,予測性能の堅牢性を高める方法を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:57:45 GMT)
Gabor-guided transformer for single image deraining [2.3] 単一画像デライニングのためのGabor-Guided tranformer(Gabformer)を提案する。
Gaborフィルタによって処理された情報をクエリベクトルに組み込むことにより、ローカルテクスチャ機能へのフォーカスが強化される。
我々の手法は最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:41:51 GMT)
Early Directional Convergence in Deep Homogeneous Neural Networks for
Small Initializations [2.3] 本稿では、深部均一性ニューラルネットワークのトレーニング時に発生する勾配流れのダイナミクスについて検討する。
ニューラルネットワークの重みは標準では小さく、カルーシュ=クーン=タッカー点に沿ってほぼ収束している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:17:32 GMT)
Vision-Language Models Learn Super Images for Efficient Partially
Relevant Video Retrieval [2.3] 本稿では,部分的関連ビデオ検索のための効率的かつ高性能な手法を提案する。
入力テキストクエリに関連する少なくとも1つのモーメントを含む長いビデオを取得することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:39:23 GMT)
Characterising harmful data sources when constructing multi-fidelity
surrogate models [2.3] 本稿では,サロゲートモデルのトレーニングに利用可能な限られたデータのみを用いて,有害な低忠実度源の特性を示す。
これらのベンチマークスイートの1つをインスタンス空間分析(Instance Space Analysis)と呼ばれるテクニックで分析し、低忠実度ソースをいつ使用するべきかを直感的に視覚化する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:57:53 GMT)
The AL$\ell_0$CORE Tensor Decomposition for Sparse Count Data [2.3] AL$ell_0$COREは確率的でない非負テンソル分解の新しい形式である。
CP分解の計算的トラクタビリティとタッカーの質的に魅力的な潜在構造の両方を楽しむ。
通常、完全なタッカー分解と同じ結果を得るためには、完全なコアのごく一部しか必要としない。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:10:16 GMT)
Recovery of contextuality based on mirror-like state discrimination in
PT- and anti-PT-symmetric systems [2.3] ミラー対称三状態最小誤差判定(MED)と最大信頼度判定(MCD)の2つのシナリオを例に挙げる。
シミュレーションでは,MEDシナリオとMCDシナリオの両シナリオの周期的振動が示され,その周期は状態に依存しないが,システムの非ハーモニティに関係している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:02:50 GMT)
Experimental demonstration of Contextual Advantage in minimum error and
maximum confidence mirror-state discrimination [2.3] 最小誤差判別 (MED) と最大信頼度判定 (MCD) の両方において, 文脈的優位性を示す最初の実験例を示す。
我々の実験は理論シミュレーションの結果とよく一致しており、また、この手法を利用して、文脈性の目撃者のためのより単純なバージョンを探索する大きな可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:54:32 GMT)
Block-wise LoRA: Revisiting Fine-grained LoRA for Effective
Personalization and Stylization in Text-to-Image Generation [2.2] テキスト・ツー・イメージにおけるパーソナライズとスタイリゼーションの目的は,ユーザによって導入された新しい概念を分析し,それらを期待されるスタイルに組み込むために,事前学習した拡散モデルに指示することである。
SDの異なるブロックに対してきめ細かな微調整を行うブロックワイド低ランク適応(LoRA)を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:38:03 GMT)
A novel interface for adversarial trivia question-writing [2.1] 対人書きトリビアの質問を収集するためのインタフェースを導入する。
私たちのインターフェースは、Quiz Bowlのライターやプレイヤーを対象にしています。
利用を促進するために、私たちのインターフェイスにある機械学習ベースのツール群は、人間が質問を書くのを助ける。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:37:24 GMT)
GuideGen: A Text-guided Framework for Joint CT Volume and Anatomical
structure Generation [2.1] textbfGuideGenは腹部臓器と大腸癌のCT画像と組織マスクを共同生成するパイプラインである。
我々のパイプラインは、高忠実度と可変性、および生成されたCTボリュームと組織マスクの正確な一致を保証します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:09:39 GMT)
Atomicity and Abstraction for Cross-Blockchain Interactions [2.0] マルチチェーンのアトミックトランザクションの現在の方法は、暗号スワップの範囲に限られている。
まず、チェーン間の通信のための一様で高レベルなインターフェースを定義する。
次に、操作が複数の連鎖にまたがる一般的なトランザクションに対して原子性を保証するプロトコルを定式化する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:13:29 GMT)
Bus Factor Explorer [2.0] バスファクタ(BF)は、プロジェクトの知識分布を追跡するメトリクスである。
Bus Factor Explorerは、Bus Factorメトリックを計算、エクスポート、探索するためのインターフェースとAPIを提供するWebアプリケーションです。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:21:48 GMT)
A Review of Cybersecurity Incidents in the Food and Agriculture Sector [2.0] この原稿は、食品農業(FA)分野におけるサイバーセキュリティ事件を公表し、記録した。
2011年7月から2023年4月にかけて、30件のサイバーセキュリティ事件が特定された。
FAセクターにおけるAI保証の必要性を解説し、Farmer-Centered AI(FCAI)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:15:20 GMT)
DT-SIM: Property-Based Testing for MPC Security [2.0] プロパティベースのテストはセキュアプロトコルのセキュリティバグの検出に有効である。
セキュアマルチパーティ計算(MPC)を特に対象とする。
MPCプロトコルのビットレベル実装において,様々な欠陥を検出するテストを作成する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:07:49 GMT)
Security of differential phase shift QKD against explicit individual
attacks [2.0] 個別攻撃に対する3とnのパルス差動位相シフト量子鍵分配プロトコルのセキュリティを特徴付ける。
一般個人攻撃下で得られたセキュアな鍵レートと既知の下界を比較検討した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:40:24 GMT)
TMU at TREC Clinical Trials Track 2023 [2.0] 本稿では,トロント大学が2023年に開催したTRECクリニカル・トライアル・トラックへの参加について述べる。
本実験では,先進的な自然言語処理技術とニューラルネットワークモデルを用いて,最も関連性の高い臨床試験を検索する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:45:49 GMT)
Dynamic U-Net: Adaptively Calibrate Features for Abdominal Multi-organ
Segmentation [1.9] U-Netは腹部臓器の分節化に広く使われており、有望なパフォーマンスを実現している。
本稿では、動的校正変換(DCC)、動的校正ダウンサンプリング(DCD)、動的校正アップサンプリング(DCU)モジュールを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:10:06 GMT)
Dense outlier detection and open-set recognition based on training with
noisy negative images [1.9] 深部畳み込みモデルにおける外乱画像の検出の問題に対処する。
私たちのアプローチは2つの合理的な仮定に基づいている。
実験では、2つの密集した開集合認識ベンチマークと1つの密集した開集合認識データセットをターゲットにした。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:22:32 GMT)
The R2D2 deep neural network series paradigm for fast precision imaging
in radio astronomy [1.9] 最近の画像再構成技術は、CLEANの能力を超えて、画像の精度を著しく向上させる。
高ダイナミックレンジイメージングのためのResidual-to-Residual DNNシリーズと呼ばれる新しいディープラーニング手法を導入する。
高精度を実現するためのR2D2の能力は、超大型アレイ(VLA)を用いた様々な画像観測環境においてシミュレーションで実証されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:24:32 GMT)
Cross-user activity recognition using deep domain adaptation with temporal relation information [1.9] HAR(Human Activity Recognition)はユビキタスコンピューティングの基盤である。
本稿では,個人間の行動変動がデータ分布の異なる結果をもたらす,ユーザ間HAR問題について考察する。
本稿では,ユーザ間HARにおける時系列領域適応に適した革新的アプローチであるDeep Temporal State Domain Adaptation (DTSDA)モデルを紹介する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:38:09 GMT)
Dissipative Feedback Switching for Quantum Stabilization [1.9] 測定に基づく散逸的フィードバック設計への新しいアプローチが導入された。
スイッチング戦略は, オープンループ技術による散逸よりも高速に収束することを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:36:58 GMT)
Domain constraints improve risk prediction when outcome data is missing [1.8] 機械学習モデルにより, 検査対象者および検査対象者双方のリスクを正確に推定できることが示唆された。
本研究は,癌リスク予測のケーススタディに適用し,そのモデルが癌診断を予測していることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:12:18 GMT)
Efficient Observation Time Window Segmentation for Administrative Data
Machine Learning [1.8] 機械学習モデルは、タイムスタンプ管理データにおける時間的傾向から学ぶことができると恩恵を受ける。
モデルのトレーニング時間とパフォーマンスは、各機能を異なる時間解像度で表現することで改善できる。
本論文は, ビンニング(TAIB)技術を検討するために, 計算効率のよい時系列解析手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:01:47 GMT)
Weakly supervised training of universal visual concepts for multi-domain
semantic segmentation [1.8] 深層教師付きモデルには、大量のトレーニングデータを吸収する前例のない能力がある。
異なるデータセットは、しばしば非互換なラベルを持つ。我々はラベルを普遍的な視覚概念の結合と見なしている。
本手法は,トレーニングデータセットに別々にラベル付けされていない視覚概念を学習すると同時に,競合するデータセット内およびクロスデータセットの一般化を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:53:46 GMT)
Comprehensive Implementation of TextCNN for Enhanced Collaboration between Natural Language Processing and System Recommendation [1.8] 本稿では,NLPの3つのコアタスクにおけるディープラーニングの適用状況について分析する。
テキスト生成、テキスト分類、意味解析において、敵対的手法がもたらす課題を考慮に入れている。
テキスト分類タスクに関する実証的研究は,対話型統合学習の有効性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:25:53 GMT)
WannaLaugh: A Configurable Ransomware Emulator -- Learning to Mimic
Malicious Storage Traces [1.8] ランサムウェアは恐ろしく、急速に進化するサイバーセキュリティの脅威だ。
静的シグネチャとアプリケーション動作パターンに依存した従来の検出方法は、これらの脅威の動的性質によって問題視される。
本稿では,この課題に対処するための主な貢献を3つ紹介する。
まず、ランサムウェアエミュレータを導入する。本ツールは、実際の被害やマルウェアの拡散を発生させることなく、ランサムウェア攻撃を安全に模倣するように設計されている。
次に、このエミュレータを使ってストレージI/Oトレースを作成する方法を示す。これらのトレースは機械学習モデルのトレーニングに使用される。
第3に,我々のエミュレータが既存のランサムウェアのI/O動作を模倣して安全を実現する方法を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:26:58 GMT)
Learning Correction Errors via Frequency-Self Attention for Blind Image
Super-Resolution [1.7] 我々は,LCE(Learning Correction Errors)に着目した新しいブラインドSR手法を提案する。
SRネットワーク内では、元のLR画像とCLR画像の周波数学習の両方を利用して、SR性能を協調的に最適化する。
提案手法は,劣化推定と補正誤差に関連する課題を効果的に解決し,より正確なブラインド画像SRへの道を開く。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:58:14 GMT)
FPT: Fine-grained Prompt Tuning for Parameter and Memory Efficient Fine
Tuning in High-resolution Medical Image Classification [1.7] きめ細かいPrompt Tuning(FPT)は、訓練済みのモデルを下流のタスクに転送するコスト効率の良い方法である。
FPTは、他のPEFT法と比較してメモリ消費を大幅に削減する。
FPTは, サイズ, モダリティ, 複雑さの異なる4つの医療データセットで評価した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:05:43 GMT)
On measuring the topological charge of anyons [1.7] 提案手法を記述し,パラメータの異なる値に対してどのように機能するかを解析する。
チャーン・サイモンズ理論の様々なレベルに対してより効果的に修正できることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:39:03 GMT)
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in
Text-To-Image Generation [1.7] 我々は、画像生成の高速化に向けて、負のプロンプト生成を最適化する新しい方法であるNegOptを提案する。
その結果,他の手法と比較して,インセプションスコアの25%が大幅に増加した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:44:34 GMT)
A Safe Preference Learning Approach for Personalization with
Applications to Autonomous Vehicles [1.7] この研究は、自動運転車への適用とともに、所定の仕様に準拠することを保証する選好学習手法を導入している。
本稿では,ペア比較に基づく安全保証型選好学習の問題を定式化し,この課題を解決するためのアプローチを提案する。
提案手法は,従来の選好学習法と比較して,従来の選好学習法と比較して競争力があり,安全性を考慮した場合,特に優れる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:13:59 GMT)
LaB-GATr: geometric algebra transformers for large biomedical surface
and volume meshes [1.6] 高忠実度メッシュを用いた学習のための幾何学的トークン化を備えた深層ニューラルネットワークLaB-GATrを提案する。
LaB-GATrは、心臓血管血行動態モデリングと神経発達型表現型予測の3つの課題について最先端の結果を得る。
以上の結果から,LaB-GATrは高忠実度メッシュで学習するための強力なアーキテクチャであることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:19:46 GMT)
Explaining Code Examples in Introductory Programming Courses: LLM vs
Humans [1.6] 受動型およびアクティブなサンプル探索システムにおいて,LLMを用いてコード説明を生成する可能性について検討した。
この目的を達成するために,チャットGPTが生成したコード説明と,専門家と学生の両方が生成した説明とを比較した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:06:25 GMT)
A Two-Stage Feature Selection Approach for Robust Evaluation of
Treatment Effects in High-Dimensional Observational Data [1.5] 我々は,OAENet(Outcome Adaptive Elastic Net)と呼ばれる新しい2段階特徴選択手法を提案する。
OAENetは、マッチング技術を用いて堅牢な因果推論決定を行うように設計されている。
シミュレーションデータに関する数値実験により、OAENetは最先端の手法を大きく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:25:35 GMT)
Ariadne and Theseus: Exploration and Rendezvous with Two Mobile Agents
in an Unknown Graph [1.5] モバイルコンピューティングにおける2つの基本的な問題、探索とランデブーについて検討する。
我々は,深度優先探索の単純な変種が,同期時間ステップ$m$の集合探索を実現することを示す。
ランデブー問題では、エージェントはグラフの異なるノードから始まり、できるだけ早く満たさなければならない。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:33:09 GMT)
Zero-Rating, One Big Mess: Analyzing Differential Pricing Practices of
European MNOs [1.4] 特定のアプリケーションに属するデータトラフィックを請求しないZero-ratingは、モバイルエコシステム内で人気を博している。
この研究は、EUの7つの異なるモバイルオペレーターで4つの人気アプリケーションのゼロレーティングに使用される分類プラクティスを独立して監査することを目的としている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:31:58 GMT)
XpertAI: uncovering model strategies for sub-manifolds [1.3] レグレッションでは、特定のユーザクエリに対処するために、説明を正確に定式化する必要がある。
XpertAIは、予測戦略を複数の範囲固有のサブストラテジーに切り離すフレームワークである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:21:31 GMT)
Learning Closed-form Equations for Subgrid-scale Closures from
High-fidelity Data: Promises and Challenges [1.3] 2次元乱流とレイリー・ブエナード対流のフィルタ数値シミュレーションから閉包を学習する。
発見された閉包はテイラー級数の先頭項と一致することを示す。
これらの知見は,任意のマルチスケールシステムのクロージャモデリングに関係している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:55:57 GMT)
A Multimodal Intermediate Fusion Network with Manifold Learning for
Stress Detection [1.2] 本稿では,多様体学習に基づく次元減少を伴う中間的マルチモーダル融合ネットワークを提案する。
マルチモーダルネットワークと単調ネットワークの異なるバリエーションについて,様々な次元削減手法を比較した。
多次元スケーリング(MDS)法による中間レベル融合は96.00%の精度で有望な結果を示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:06:19 GMT)
MinkUNeXt: Point Cloud-based Large-scale Place Recognition using 3D
Sparse Convolutions [1.1] MinkUNeXtは、新しい3D MinkNeXt Blockをベースとした、ポイントクラウドからの位置認識のための効率的かつ効率的なアーキテクチャである。
提案の徹底的な評価は、Oxford RobotCarとIn-houseデータセットを用いて行われている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:25:54 GMT)
Reconstructions of Jupiter's magnetic field using physics informed
neural networks [1.1] 物理インフォームドニューラルネットワークに基づく木星内部磁場の新たな再構成について述べる。
私たちのモデルは、奥行きのノイズによって妨げられません。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:43:52 GMT)
51% Attack via Difficulty Increase with a Small Quantum Miner [1.1] ハッシュパワーが比較的低い単一量子マイナの戦略を提案する。
Bitcoinを含む多くの暗号通貨は、我々の攻撃に弱い。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:45:29 GMT)
What Can Quantum Information Theory Offer to Quantum Chemistry? [1.0] まず、絡み合いや相関などの量子情報の概念を量子化学系の文脈に翻訳する。
我々は、電子相関に関する2つの概念的な視点を確立し、軌道相関と粒子相関の概念を導いた。
この結果は、電子構造を単純化するための長期の自然軌道の理論的正当性を与える。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:38:17 GMT)
Hole Flying Qubits in Quantum Dot Arrays [1.0] 我々は、電場操作によりSOIの動的制御が可能であり、転送中に量子ゲートの実装を同時に行うことができることを示す。
我々はスピン状態に焦点を合わせ保存するために動的デカップリング方式を採用し、より高い伝達忠実性をもたらす。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:57:23 GMT)
Physics-Transfer Learning for Material Strength Screening [1.0] ピエルス応力(Peierls stress)は、結晶の塑性における中心的な概念の1つで、塑性の流れへの変位の抵抗を通じて強度を測定する。
経験的原子論シミュレーションから結晶塑性の物理を学ぶための物理移動フレームワークを提案する。
次に, 物質パラメータの化学的に正確な密度汎関数理論に基づく計算から, ピエルス応力を予測した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:05:05 GMT)
CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive
Self-Supervised Transformers [1.0] 本稿では、教師なしオブジェクト発見のための革新的な方法であるVoteCutを紹介する。
また、VoteCutによって生成された擬似ラベルを用いて訓練されたゼロショットモデルCuVLERを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:46:03 GMT)
Empirical Study of the Docker Smells Impact on the Image Size [1.0] 本稿では,Dockerイメージのサイズに対する14のDockerの匂いの影響について検討する。
11313のオープンソースDockerfileから16,145のDocker臭いが検出され、修復されました。
最も影響のある臭いは、一般的に遭遇し、比較的簡単に修正できるパッケージマネージャに関連している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:38:18 GMT)
Machine Learning for Soccer Match Result Prediction [0.9] 本章では、利用可能なデータセット、モデルと機能のタイプ、モデルパフォーマンスを評価する方法について論じる。
本章の目的は,サッカーの試合結果予測のための機械学習の現状と今後の展開について概説することである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:00:50 GMT)
Fast, accurate and lightweight sequential simulation-based inference
using Gaussian locally linear mappings [0.9] シミュレーションベース推論」は、難解な確率で複雑なモデルに取り組むために用いられる。
近年のSBI法では、ニューラルネットワーク(NN)を用いて、不可能な可能性関数と後部分布の近似的かつ表現的な構造を提供している。
本稿では,確率分布の構造化混合を用いて,確率分布と後部分布の両方を近似する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:48:17 GMT)
Rotation-Agnostic Image Representation Learning for Digital Pathology [0.8] 本稿では,全スライディング画像(WSI)解析のための高速パッチ選択法FPSを提案する。
また5つのTransformerブロックの最小構成を持つ軽量な病理機能抽出器であるPathDinoも紹介されている。
本モデルでは,12種類の異なるデータセット上で,既存の病理組織特異的ビジョントランスフォーマーよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:40:28 GMT)
Machine Learning Techniques for Sensor-based Human Activity Recognition with Data Heterogeneity -- A Review [0.8] HAR(Human Activity Recognition)はユビキタスコンピューティングにおいて重要である。
HARは特にデータ分散の仮定において、課題に直面します。
本稿では,機械学習がHARにおけるデータの不均一性にどのように対処するかを検討する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:22:14 GMT)
A Hybrid Quantum-assisted Column Generation Algorithm for the Fleet
Conversion Problem [0.7] フリート・コンバージョン(Fleet Conversion)は、所定のツアーのために車両を運用する際の二酸化炭素排出量とコストを削減することを目的としている。
量子および古典的解法が産業規模のユースケースにどのようにアプローチできるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:10:39 GMT)
Equipping Computational Pathology Systems with Artifact Processing
Pipelines: A Showcase for Computation and Performance Trade-offs [0.7] 損傷組織, ぼかし, 折りたたみ組織, 気泡, 組織学的に無関係な血液を含む5つの重要な人工物を検出するための専門家(MoE)の混合手法を提案する。
2つのMoEと2つのマルチクラスモデルであるDCNNとビジョントランスフォーマーを用いたDLパイプラインを開発した。
提案されたMoEは86.15%のF1と97.93%の感度スコアを持ち、ViTを用いたMoEよりも推論の計算コストが低い。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:22:05 GMT)
In-context learning enables multimodal large language models to classify
cancer pathology images [0.7] 言語処理では、コンテキスト内学習(in-context learning)は、モデルがプロンプト内で学習し、パラメータ更新の必要性を回避できる代替手段を提供する。
そこで本研究では,GPT-4V(Generative Pretrained Transformer 4 with Vision (GPT-4V)) を用いたがん画像処理モデルの評価を行った。
この結果から,テキスト内学習は特定のタスクで訓練された特殊なニューラルネットワークに適合したり,あるいは性能を向上するのに十分であり,最小限のサンプルしか必要としないことがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:34:34 GMT)
Beyond the Labels: Unveiling Text-Dependency in Paralinguistic Speech
Recognition Datasets [0.7] 本稿では、機械学習モデルが真にパラ言語的特徴を特定することを学んでいるという前提を批判的に評価する。
これらのデータセットの語彙的重複を調べ、機械学習モデルの性能をテストすることにより、特性ラベル付けにおける重要なテキスト依存性を明らかにする。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:54:32 GMT)
Deep Adaptation of Adult-Child Facial Expressions by Fusing Landmark Features [0.6] 深層畳み込みニューラルネットワークは、成人の表情の分類において有望な結果を示す。
本研究では, BEACE-BE-SELF (BEtaMix Selected Landmark Features) を用いた適応型FACial Expressionsを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:31:49 GMT)
Applying ranking techniques for estimating influence of Earth variables
on temperature forecast error [0.6] 本稿では,地球系の変数が温度予測を行う際の誤差に与える影響を解析する方法について述べる。
主なコントリビューションは、相関関係をランキングに変換し、それらを総合的なランキングに組み合わせる方法を示すフレームワークである。
我々は,このランク付け手法の挙動を解析するために,選択した5つの場所で実験を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:59:00 GMT)
Fusing Climate Data Products using a Spatially Varying Autoencoder [0.6] 本研究は、同定可能かつ解釈可能なオートエンコーダの作成に焦点を当てる。
提案するオートエンコーダはベイズ統計フレームワークを利用する。
本研究では,高山地域の降水産物からの情報を組み合わせることで,オートエンコーダの有用性を実証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:03:07 GMT)
Computational limits to the legibility of the imaged human brain [0.6] 構造的および機能的データから25個の生物特性の予測可能性を評価する。
性別の高い予測可能性(精度99.7%)、年齢(平均絶対誤差2.048年、R2 0.859)、体重(平均絶対誤差2.609Kg、R225)は、新しい最先端性能と、他の特性の驚くほど低い予測可能性との間に相違があることを見出した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:30:34 GMT)
Embracing Uncertainty Flexibility: Harnessing a Supervised Tree Kernel
to Empower Ensemble Modelling for 2D Echocardiography-Based Prediction of
Right Ventricular Volume [0.5] 右室機能低下は,多くの状況において臨床効果を強く予測する。
本稿では,不確実性スコアによるボリューム予測を補完する手法を提案する。
提案手法は意思決定プロセスの強化とリスク低減に有効である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:03:03 GMT)
Customizable Avatars with Dynamic Facial Action Coded Expressions
(CADyFACE) for Improved User Engagement [0.5] 3Dアバターに基づく表情刺激は、行動バイオマーカー発見におけるユーザエンゲージメントを改善する可能性がある。
FACS(Facial Action Coding System)アクションユニット(AU)ラベルによるカスタマイズ可能なアバターベースの刺激がない。
本研究は,(1)被験者のエンゲージメントを維持するためのFACS-labeled,Customizable Avatar-based expression stimuli,(2)被験者の顔の反応を定量化するための学習ベース測定,(3)測定刺激ペアで表される構成物の検証に焦点を当てた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 05:00:38 GMT)
Pix2Pix-OnTheFly: Leveraging LLMs for Instruction-Guided Image Editing [0.5] 本研究では,命令誘導画像編集をオンザフライで行うための準備不要な手法を提案する。
本手法は,MAGICBRUSHデータセットで評価した場合に,この課題に対する技術モデルの有効性と競争性を示すものである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:12:50 GMT)
The Variant of Designated Verifier Signature Scheme with Message Recovery [0.4] 本稿では,メッセージ復元機構を組み込んだ強力なDesignated Verifier Signature(DVS)方式を提案する。
この研究は、UDVS(Universal Designated Verifier Signature)スキームの概念に触発されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:02:10 GMT)
Approximating many-body quantum states with quantum circuits and
measurements [0.4] 本稿では,局所的な演算と古典的通信を補助する量子回路を用いた多体量子状態の生成プロトコルを提案する。
まず, 正確な準備条件を引き上げることで, 資源を大幅に節約できることを示す。
また、よく知られたスピンモデルの固有状態(自由と相互作用の両方)を作成する際に、どのように資源を節約できるかを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:42:28 GMT)
Examining Pathological Bias in a Generative Adversarial Network
Discriminator: A Case Study on a StyleGAN3 Model [0.3] GAN(Generative Adversarial Network)は、実際の顔から人間に区別できない、フォトリアリスティックな顔を生成する。
事前学習したStyleGAN3-rモデルの判別器において,病理内部色と輝度バイアスが認められた。
また、判別器は、画像レベルと顔レベルの両方の品質でスコアを体系的に階層化し、不均等に性別、人種、その他のカテゴリーのイメージに影響を及ぼすことも見出した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:36:23 GMT)
Aedes aegypti Egg Counting with Neural Networks for Object Detection [0.3] 本研究では,実験室の卵子を含む新しいデータセットと,その課題に適用した3つのニューラルネットワークの試験結果を提案する。
エッグカウント(Egg counting)は、コンピュータビジョンベースの技術によって自動化される、面倒でエラーを起こしやすいタスクである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:28:13 GMT)
Tree-based Learning for High-Fidelity Prediction of Chaos [0.3] TreeDOXは、カオスシステムのモデルフリー予測に対するツリーベースのアプローチである。
時間遅延オーバー埋め込みを明示的な短期記憶として使用し、Extra-Trees Regressorsを使用して機能の削減と予測を行う。
我々はHenon map, Lorenz and Kuramoto-Sivashinsky system, and the real-world Southern Oscillation Indexを用いてTreeDOXの最先端性能を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:16:29 GMT)
Prediction of readmission of patients by extracting biomedical concepts from clinical texts [0.3] この研究は、68.9%のリコールスコアで、患者の再入院の確率を予測する上で、最も高いスコアを達成している。
様々な機械学習モデルの性能は、単語の袋と概念の袋という2つのアプローチを用いて評価されてきた。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:03:44 GMT)
Auxiliary CycleGAN-guidance for Task-Aware Domain Translation from
Duplex to Monoplex IHC Images [0.3] サイクル生成共役ネットワーク(GAN)は確立されているが、関連するサイクル一貫性の制約は、2つの領域の間に可逆写像が存在することに依存する。
我々は,新しいトレーニングデザインの導入を通じて,免疫蛍光(IF)画像の集合を補助的未ペア画像領域として活用する代替的制約を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 07:57:33 GMT)
Understanding the Effects of Noise in Text-to-SQL: An Examination of the
BIRD-Bench Benchmark [0.2] 本研究では,広範に使用されているBIRD-Benchベンチマークにおいて,ノイズの分布と種類を詳細に解析する。
質問やゴールドクエリのノイズがデータセットに広まっており、ドメイン毎にさまざまな量があることがわかった。
誤ったゴールドクエリの存在は、誤ったゴールド回答を発生させ、ベンチマークの信頼性に大きな影響を及ぼす。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:52:13 GMT)
A Flexible Cell Classification for ML Projects in Jupyter Notebooks [0.2] 本稿では,ルールベースと決定木分類器を組み合わせたハイブリッド分類手法により,より柔軟な細胞分類手法を提案する。
われわれはJupyLabelというツールで新しいフレキシブルな細胞分類手法を実装した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:50:47 GMT)
Designing high-fidelity two-qubit gates between fluxonium qubits [0.2] 本稿では,フッソニウム量子ビット間の2量子ゲートを最小誤差,速度,制御の簡易化のために提案する。
我々のアーキテクチャは、線形共振器を介して結合された2つのフラクソニウムからなる。
オープンシステムの平均CZゲート不忠実度は70nsで1.86倍10-4$である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:56:21 GMT)
AutoGCN -- Towards Generic Human Activity Recognition with Neural
Architecture Search [0.2] 本稿では、グラフ畳み込みネットワーク(GCN)を用いた人間活動認識(HAR)のための汎用ニューラルアーキテクチャ探索(NAS)アルゴリズムであるAutoGCNを紹介する。
提案アルゴリズムの性能を評価するために,骨格に基づく行動認識に着目した2つの大規模データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:35:20 GMT)
Three statistical descriptions of classical systems and their extensions
to hybrid quantum-classical systems [0.1] 古典粒子系の統計学的記述を3つ提示し、それらのハイブリッド量子古典系への拡張について考察する。
位相空間上のアンサンブルのアプローチと、新しいヒルベルト空間アプローチは、等価なハイブリッドモデルをもたらす。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:15:41 GMT)
Input Data Adaptive Learning (IDAL) for Sub-acute Ischemic Stroke Lesion
Segmentation [0.1] 本稿では、与えられた入力データに対して最適なトレーニングサンプルを適応的に選択することで、大規模なトレーニングベースから学習する方法を提案する。
提案アルゴリズムは,分類精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:11:02 GMT)
Cabello's nonlocality argument for multisetting high-dimensional systems
and its experimental test [0.1] カベロの非局所的議論(CNA)は、非局所的特徴を説明できる優れた選択として現れる。
我々は,マルチセットと多次元CNAのための新しい論理的枠組みを構築した。
実験的に、制御可能なフォトニック軌道角運動量エンタングルメントを用いて、実験で記録された20.29%の確率で非局所性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:45:51 GMT)
CT evaluation of 2D and 3D holistic deep learning methods for the
volumetric segmentation of airway lesions [0.0] 本研究では,2次元モデルと3次元モデルを比較し,粘液プラグやコンソリデーションなどの複雑な特徴を捉える上で,3次元モデルが優れていることを示す。
また、モデルの解釈可能性と信頼性を総合的に評価し、臨床応用に有用な洞察を提供した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:34:50 GMT)
A dataset of over one thousand computed tomography scans of battery
cells [0.0] 市販電池の1万点以上のトモグラフィー画像のデータセットを提示する。
データセットは、さまざまな化学(リチウムイオンとナトリウムイオン)と、さまざまな電池形成因子にまたがる。
製造の多様性とバッテリーの欠陥の存在は、このデータセットを通して観察することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:21:04 GMT)
WaveShot: A Compact Portable Unmanned Surface Vessel for Dynamic Water Surface Videography and Media Production [0.0] WaveShotは、従来の撮影方法に代わる、高度に操作可能で費用対効果があり、安全を提供することで、水面の映像を変換することを目指している。
WaveShotは、映画制作、広告、ドキュメンタリー、視覚芸術の現代的な需要のために特別に設計された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 14:06:27 GMT)
Tuning diagonal scale matrices for HMC [0.0] HMCの対角スケール行列を適応的に調整する3つの手法を議論し、比較した。
限界標準偏差の推定によるスケーリングの一般的な実践は、ベンチマークとしてとらえられる。
平均対数勾配(ISG)によるスケーリングと、基礎となるハミルトン力学がそれぞれの中央値と交差する頻度を目標とするスケーリング手法は、代替となる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:35:40 GMT)
Transforming Competition into Collaboration: The Revolutionary Role of
Multi-Agent Systems and Language Models in Modern Organizations [0.0] 本稿では,マルチエージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく計算エンティティがユーザインタラクションに与える影響について考察する。
提案手法では,大規模言語モデル (LLM) から発達したエージェントを用いて,行動要素を考慮したプロトタイピングを行う。
我々は,多エージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく革新的な利用に基づいて,組織戦略に有用なエージェントの開発の可能性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:56:10 GMT)
Transformer tricks: Precomputing the first layer [0.0] このマイクロペーパーは、RoPEでトランスフォーマーの推論を高速化するトリックを記述している。
第1変圧器層の大部分をプリ計算できるため、レイテンシがわずかに小さく、コスト対トーケンが低くなる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:32:05 GMT)
Towards a universal mechanism for successful deep learning [0.0] 本研究は,SNRの精度が層によって徐々に増加することを示す。
与えられた深いアーキテクチャでは、最大誤差率は出力ラベルの数とともにほぼ直線的に増加する。
同様の傾向がデータセットラベルの [3, 1,000] の範囲で得られ, この機構の普遍性を支持した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:46:33 GMT)
Towards a Framework for Deep Learning Certification in Safety-Critical Applications Using Inherently Safe Design and Run-Time Error Detection [0.0] 航空や他の安全上重要な分野における現実世界の問題について検討し,認定モデルの要件について検討する。
我々は、(i)本質的に安全な設計と(ii)実行時のエラー検出に基づいて、ディープラーニング認定に向けた新しいフレームワークを構築した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:38:45 GMT)
Toward a Plug-and-Play Vision-Based Grasping Module for Robotics [0.0] 本稿では,複数のマニピュレータ間で容易に移動可能な視覚ベースの把握フレームワークを提案する。
このフレームワークは、オープンループ把持軌跡の多様なレパートリーを生成し、把握の多様性を維持しつつ、適応性を向上させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:22:05 GMT)
The order-theoretical foundation for data flow security [0.0] 本稿では,セキュリティ概念と部分順序概念の対応について述べる。
この形式化には、データフローの概念、同じデータにアクセス可能なエンティティの等価クラス、ラベルが含まれる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:33:20 GMT)
The future of document indexing: GPT and Donut revolutionize table of
content processing [0.0] 本稿では、2つの最先端AIモデルの能力を活用して、このプロセスを自動化するための革新的なアプローチを紹介する。
DonutはOCRなしでスキャンされた文書から直接情報を抽出するモデルで、OpenAI GPT-3.5 Turboは堅牢な大規模言語モデルである。
ドナツは85%、GPT-3.5ターボは89%に達し、ToCを効果的に編成した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:39:18 GMT)
The Minimax Rate of HSIC Estimation for Translation-Invariant Kernels [0.0] 連続有界変換不変特性核を持つガウス環を含むボレル測度に対する$mathbb Rd$のHSIC推定の最小値が$mathcal O!left(n-1/2right)$であることを証明する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:13:21 GMT)
The Democratization of Wealth Management: Hedged Mutual Fund Blockchain Protocol [0.0] 従来の投資資金のベストプラクティスをブロックチェーンの世界に持ち込むために設計されたイノベーションを開発しています。
我々は、相互資金のようにファンド価格を定期的に更新し、ヘッジファンドのようにパフォーマンス手数料を請求する方法について説明する。
ブロックチェーンスマートコントラクトとしてこれらのアイデアを実装するための、数学的定式化やインストラクティブポインタなど、詳細なステップを提供します。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:16:35 GMT)
Supervised Time Series Classification for Anomaly Detection in Subsea
Engineering [0.0] IntactとBrokenの2つの状態を持つ物理システムに基づくシミュレーションデータに対する教師付き機械学習分類アルゴリズムの使用について検討する。
本稿では,時間データの事前処理について,統計的分散と次元縮小の手法を用いて包括的な議論を行う。
本稿では,さまざまなパフォーマンス指標に基づく各種手法の比較を行い,機械学習を意思決定のツールとして活用することの利点を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:25:10 GMT)
Stress index strategy enhanced with financial news sentiment analysis for the equity markets [0.0] この戦略は性能の向上を示し、シャープ比の上昇と最大ドローダウンの低減によって証明された。
パフォーマンスの改善はNASDAQ、S&P 500、および6つの主要株式市場で一貫している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:23:30 GMT)
Simulation of a Diels-Alder Reaction on a Quantum Computer [0.0] 本研究では、量子アルゴリズムとハードウェアの化学反応研究への応用の可能性について検討する。
我々の目標は、遷移状態を形成するエチレンとシクロペンタジエンとの反応の活性化障壁を計算することである。
我々は最大8キュービットの量子ハードウェア上でシミュレーションを行い、正確なアクティベーションバリアを計算する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:29:07 GMT)
RoboCertProb: Property Specification for Probabilistic RoboChart Models [0.0] 本研究は,RoboChartでモデル化された確率論的ロボットシステムの量的特性を特定するためのRoboCertProbを提案する。
RoboChartモデル上でRoboCertProbを解釈するために、マルコフ意味論(DTMCとMDP)をRoboChartに与える。
プロパティ仕様に加えて、RoboCertProbは、RoboChartモデルで緩やかな定数と未指定の関数と操作を設定する権利も私たちに与えています。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:47:00 GMT)
Rigid Transformations for Stabilized Lower Dimensional Space to Support
Subsurface Uncertainty Quantification and Interpretation [0.0] 地下データセットは本質的に、膨大な量、多様な特徴、高いサンプリング速度などのビッグデータ特性を持っている。
計量多次元スケーリング(MDS)は、その固有の複雑さのため、地下データセットに好まれる。
地下推論と機械学習を強化するためには、データセットを安定して縮小次元表現に変換する必要がある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:46:10 GMT)
Real-time observation of picosecond-timescale optical quantum
entanglement toward ultrafast quantum information processing [0.0] 絡み合いは様々な光量子情報処理(QIP)アプリケーションの基本資源である。
連続波(CW)系におけるピコ秒時間スケールにおける超高速光アインシュタイン-ポドルスキー-ローゼン相関のリアルタイム観測を報告する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:32:20 GMT)
Quantum tunneling of the magnetization in systems with anisotropic 4f
ion pairs: Rates from low temperature zero field relaxation [0.0] 磁化の量子トンネルはケルビン以下の温度で磁化寿命に印加される。
磁化の量子トンネルを含むハミルトニアンは、ゼロ場基底状態の退化を予測する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:14:12 GMT)
Quantum correlations in the steady state of light-emitter ensembles from
perturbation theory [0.0] 単一エミッターまたは2エミッター駆動を受ける発光器系では、U(1)限界から遠ざかる定常状態がスピンスクイーズを示す。
我々の主な成果は、単一エミッタまたは2エミッタ駆動を受ける発光器系において、U(1)限界から遠ざかる定常状態がスピンスクイーズを示すことである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:11:31 GMT)
Quantum Support Vector Machine for Prostate Cancer Detection: A
Performance Analysis [0.0] 本稿では,この重要な医療課題に対するQuantum Support Vector Machine (QSVM)の適用について紹介する。
本研究は,従来のSVM技術よりもQSVMによる診断性能の顕著な改善について概説する。
この結果は、古典的なSVMと同等の精度であるだけでなく、感度が7.14%上昇し、特に高いF1スコア(93.33%ドル)が明らかになった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:46:38 GMT)
Quantum Simulation of SU(3) Lattice Yang Mills Theory at Leading Order
in Large N [0.0] ヒルベルト空間と相互作用が N_c の逆パワーでどのように拡張できるかを示す。
量子ビットおよび量子ビット上の SU(3) ゲージ場の単純表現を可能にする明示的な構成を与える。
この定式化により、CNOT 深さ 113 の ibm_torino 上の 5times5$ と 8times8$ の格子上で SU(3) 格子ゲージ理論のリアルタイムダイナミクスをシミュレーションすることができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:15:45 GMT)
Quantum Information Dimension and Geometric Entropy [0.0] Renyiの情報理論に触発された2つの解析ツールを導入し、幾何学量子状態の基本的性質を特徴づけ、定量化する。
我々は、それらの古典的定義、情報理論的意味、物理的解釈を振り返り、幾何学的アプローチを通じて量子システムに適用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:53:54 GMT)
Quantum Darwinism-encoding transitions on expanding trees [0.0] ブロードキャストとスクランブルの間を補間する量子力学は情報伝達の鋭い位相遷移を示す可能性があることを示す。
QD、中間および符号化の3つのフェーズと、2つの連続的な遷移を見出す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:32:07 GMT)
Quantum Channel Conditioning and Measurement Models [0.0] 我々は、$mathcalIc$が後処理と部品の取り出しでクローズされていることを示す。
また、チャンネルによる楽器のコンディショニングも定義する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:31:06 GMT)
PROSKILL: A formal skill language for acting in robotics [0.0] 自律ロボットにとって行動は重要な決定機能である。
演技スキルをプログラムする新しい言語を提案する。
この言語は、オフラインでプロパティをチェックしたり、スキルを実行するのに使える形式モデルに自由にマッピングします。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:56:53 GMT)
PR-NET: Leveraging Pathway Refined Network Structures for Prostate
Cancer Patient Condition Prediction [0.0] 我々はPR-NETという,より正確で効率的な前立腺がん患者の状態予測モデルを開発した。
PR-NETは前立腺癌患者の予後を予測するのに優れた性能を示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:55:00 GMT)
PR-NET: Leveraging Pathway Refined Network Structures for Prostate
Cancer Patient Condition Prediction [0.0] 我々はPR-NETという,より正確で効率的な前立腺がん患者の状態予測モデルを開発した。
PR-NETは前立腺癌患者の予後を予測するのに優れた性能を示した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:55:00 GMT)
PMBO: Enhancing Black-Box Optimization through Multivariate Polynomial
Surrogates [0.0] 我々は、PMBO(Polynomial-based Optimization)と呼ばれるサロゲートベースのブラックボックス最適化手法を導入する。
PMBOの性能を解析的テスト関数の集合に対するいくつかの最適化手法と比較する。
興味深いことに、PMBOは最先端の進化アルゴリズムと互換性がある。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:21:21 GMT)
On the rational invariants of quantum systems of $n$-qubits [0.0] 局所対称性群の作用に関して不変な混合状態の空間上の有理函数は、絡み合いの詳細な尺度と見なすことができる。
そのような不変な有理関数の体は、複素数に対して純粋に超越的であり、超越次数 4n − 2n-1$ を持つことを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:19:56 GMT)
On the nonconvexity of some push-forward constraints and its
consequences in machine learning [0.0] プッシュフォワード操作により、地図を介して凸確率測度を再分配することができる。
統計学において重要な役割を果たす: 最適な輸送の影響からプッシュフォワードへの多くの問題。
本研究の目的は,予測やアルゴリズム学習の問題を研究者がよりよく理解することである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:06:48 GMT)
On Ranking-based Tests of Independence [0.0] 2つの確率変数 $mathbfX$ と $mathbfY$ の独立性をテストするための新しい非パラメトリックフレームワークを開発する。
我々は、ROC空間の対角線から逸脱して独立性テストを構築する様々な方法を含む幅広い階級統計を考察する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:00:00 GMT)
Nonequilibrium symmetry-protected topological order: emergence of
semilocal Gibbs ensembles [0.0] 我々は、大域的クエンチ後の量子スピン鎖における非平衡時間進化を考察する。
このため、無限に現われる定常状態は例外的な特徴を示すことができる。
例外的な性質の中で、後期には、初期状態における局所摂動によって引き起こされるスピンブロックのエントロピーの過剰が、サブシステムの長さと対数的に増加することが分かる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:46:09 GMT)
Navigating the Quantum Divide(s) [0.0] 本稿では、新しい量子技術(QT)を社会に導入した際の可能性の相違について考察する。
科学、技術、地政学、社会構造に対するQTの多面的な影響を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 19:10:02 GMT)
Monocentric or polycentric city? An empirical perspective [0.0] 本研究は、都市における両視点の合成を行い、文学における使用について述べる。
欧州の都市部での調査では、一部の都市がヨーロッパで最も多中心的な都市であると見なされている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:06:38 GMT)
Misgendering and Assuming Gender in Machine Translation when Working
with Low-Resource Languages [0.0] 本章では、低リソース言語の文脈における機械翻訳(MT)における性別関連エラーに焦点を当てる。
まず、低リソース言語とは何かを説明し、そのような言語階層を形成する社会的・計算的要因を分離できないかを検討する。
本稿では,このような誤りが言語的消去や表現的害に繋がるポストコロニアルおよび社会的影響について論じる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:41:13 GMT)
Mevaker: Conclusion Extraction and Allocation Resources for the Hebrew Language [0.0] 本稿では,イスラエルのState ComptrollerとOmbudsmanに基づくヘブライ語の要約MevakerSummと結論抽出MevakerConcデータセットを紹介する。
我々はこれらのデータセットに、結論抽出モデル(HeConE, HeConEspc)と結論割り当てモデル(HeCross)を添付する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:40:44 GMT)
Lessons from a Pioneering Software Engineering Environment: Design
Principles of Software through Pictures [0.0] 本稿では,Picturesによるマルチユーザ開発環境の革新的開発に繋がる歴史的背景について述べる。
また、ソフトウェア開発ライフサイクルにおける複数のタスクをカバーするソフトウェアエンジニアリング環境を構築するために、他のソフトウェア製品との統合の原則についても説明している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:35:08 GMT)
Legally Binding but Unfair? Towards Assessing Fairness of Privacy
Policies [0.0] 本稿では,プライバシポリシの公平性を評価するためのアプローチについて概説する。
我々は、基本的な法的根拠と公正性の研究から、情報的公正性、表現的公正性、倫理/道徳がプライバシーポリシーとどのように関係しているかを識別する。
テキスト統計,言語学的手法,人工知能に基づいて,これらの公平度次元におけるポリシーを自動評価するオプションを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:53:32 GMT)
Lanczos spectrum for random operator growth [0.0] 我々は、ハミルトニアンとリウヴィリアンは、シュロディンガー/ハイゼンベルクの時間進化がクリロフ基底で表されるように三角化されていることを示す。
これらの展開をハイゼンベルクの時間発展に拡張し、クリロフ空間の終点まで、リウヴィリアンを三対角化する方法を記述する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:00:02 GMT)
Label Dropout: Improved Deep Learning Echocardiography Segmentation
Using Multiple Datasets With Domain Shift and Partial Labelling [0.0] 本稿では,ドメイン特性とラベルの有無を関連付ける新しいラベルドロップアウト方式を提案する。
ラベルのドロップアウトは,複数の部分ラベル付きデータセットを用いたトレーニングにおいて,2つの心構造に対して62%,25%のエコーセグメンテーションDiceスコアを改善することを実証した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:57:56 GMT)
Iterative Graph Neural Network Enhancement via Frequent Subgraph Mining
of Explanations [0.0] 我々は、説明強化グラフ学習(EEGL)と呼ばれるノード分類のためのグラフニューラルネットワーク(GNN)のためのXAIベースのモデル改善アプローチを定式化する。
目的は、説明を用いてGNNの予測性能を改善することである。
EEGLは、学習された"バニラ"GNNから始まる反復的な自己改善アルゴリズムであり、頻繁にサブグラフマイニングを使用して説明サブグラフの関連パターンを見つける。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:41:27 GMT)
Investigating the performance of Retrieval-Augmented Generation and fine-tuning for the development of AI-driven knowledge-based systems [0.0] Fine-tuning (FN) と Retrieval-Augmented Generation (RAG) はドメイン適応の実装に使用できる技法である。
GPT-J-6B, OPT-6.7B, LlaMA, LlaMA-2言語モデルにおけるRAGとFNの性能を比較検討する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 21:06:31 GMT)
Implementation and characterization of the dice lattice in the electron
quantum simulator [0.0] 調整可能なパラメータを用いたダイス格子の実験的実現について検討する。
ショックレー状態電子の高モビリティは、人工格子の正確な理論的記述を可能にする。
実験結果から,アハロノフ-ボームケージ機構にともなう高縮退エネルギーは,電子移動性に起因している可能性が示唆された。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:21:55 GMT)
IGUANe: a 3D generalizable CycleGAN for multicenter harmonization of
brain MR images [0.0] 画像翻訳のための深層学習手法が, MR画像との調和のためのソリューションとして登場した。
本研究では,ドメイン翻訳の強みを生かしたオリジナル3DモデルIGUANeを紹介する。
モデルは未知の取得サイトからでも任意の画像に適用することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:28:20 GMT)
Harnessing two-photon dissipation for enhanced quantum measurement and
control [0.0] 量子計測と制御に強い2光子散逸の3つの重要な応用について述べる。
まず,高光子数でのウィグナー断層撮影で発生する限界を克服する効果を示す。
第2に、猫量子ビット上の普遍ゲートの実現の可能性を示し、猫量子ビット状態と0および1光子の重畳の間のコヒーレントマッピングを利用する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:27:35 GMT)
Grey Level Texture Features for Segmentation of Chromogenic Dye RNAscope
From Breast Cancer Tissue [0.0] 本稿では,RNAスコープの転写位置の自動分割と分類におけるグレーレベルテクスチャの有用性について検討する。
Grey Level Dependence Matrix や Neighbouring Grey Tone Different Matrix などの小さなグレーレベル機能は、このタスクに適していた。
この手法は、RNAスコープ転写産物の位置を特定する専門家アノテータと同様に、F1スコアが0.571であり、専門家間F1スコアが0.596であるのに対して、F1スコアが0.571である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:15:35 GMT)
Geometry of the Visual Cortex with Applications to Image Inpainting and
Enhancement [0.0] 本稿では,低楕円拡散に基づく画像のインペイントと強調のためのアルゴリズムを提案する。
また、この部分リーマン構造を利用して、全く新しいアンシャープフィルタを定義する。
網膜シンチグラフィーにおける血管造影法について検討した。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:41:56 GMT)
Fine-tuning vs Prompting, Can Language Models Understand Human Values? [0.0] 本稿では,この下流タスクにおける微調整と迅速なチューニングの可能性について,Human Value Detection 2023を用いて検討する。
また,事前学習の段階で得られた知識に基づいて,モデルが効果的に解決できるかどうかを検証する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 08:49:31 GMT)
Feasibility of machine learning-based rice yield prediction in India at
the district level using climate reanalysis data [0.0] 本研究の目的は,インドにおいて,機械学習による収穫予測モデルがハリフの季節米収量の予測に有効であるかどうかを検討することである。
この手法は、20年間の気候、衛星、米の収量に関する19の機械学習モデルを、インドの米生産地区247地域にわたって訓練することを含む。
その結果, 収量予測の精度は, サンプル外R2, MAE, MAPEそれぞれ0.82, 0.29, 0.16であった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:31:13 GMT)
Fast Simulated Annealing inspired by Quantum Monte Carlo [0.0] 量子モンテカルロ(Quantum Monte Carlo, QMC)は、量子アニーリング(Quantum Annealing, QA)のシミュレーションで一般的に用いられる。
厳密な数学的手法ではないが、短時間で計算する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 04:47:08 GMT)
Exploring Multiscale Quantum Media: High-Precision Efficient Numerical
Solution of the Fractional Schr\"odinger equation, Eigenfunctions with
Physical Potentials, and Fractionally-Enhanced Quantum Tunneling [0.0] この研究には、量子実験家から応用数学者へのコミュニティのためのオープンソースコードが含まれており、分数的なシュリンガー方程式の解を簡単かつ効率的に探索することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 01:03:42 GMT)
Exploring Challenges in Deep Learning of Single-Station Ground Motion
Records [0.0] 実験の結果,P相とS相の到着情報に強く依存していることが判明した。
本研究は, 現場における潜在的なギャップを浮き彫りにして, 単一局地動記録の深層学習のためのロバストな手法が欠如していることを示唆する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:56:50 GMT)
Expiring opacity problems in parametric timed automata [0.0] タイムドオートマトンにおける期限付き不透明度問題について検討した。
我々は,システムが不透明な時間境界の集合を考察し,時間付きオートマトンに対して有効に計算できることを示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:30:53 GMT)
Exchange-correlation energy from Green's functions [0.0] DFT計算は有用な基底状態エネルギーと密度をもたらすが、グリーンの関数技術(例えば$GW$)は、主にスペクトル関数を生成するために用いられる。
グリーン関数から直接DFTの交換相関を抽出する。
このスペクトル表現は、DFTの揺動散逸定理の代替となり、個々の単一粒子と多粒子の寄与を識別する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:32:14 GMT)
Enhancing Joint Motion Prediction for Individuals with Limb Loss Through
Model Reprogramming [0.0] 手足の喪失による運動障害は、世界中の何百万人もの個人が直面している重要な課題である。
人工装具などの高度な補助技術の開発は、切断者の生活の質を大幅に向上させる可能性がある。
このような技術の設計において重要な要素は、行方不明肢の基準関節運動の正確な予測である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:40:33 GMT)
Emergent (2+1)D topological orders from iterative (1+1)D gauging [0.0] ゲージはゲージ場と呼ばれる新しい自由度を導入し、既存の大域対称性をローカライズする。
この反復的なプロセスについて検討し、新しい自由度が創出され、局所的な対称性を通して以前の自由度と絡み合わされる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:04:58 GMT)
Efficient quantum amplitude encoding of polynomial functions [0.0] 実関数を$n$ qubitsで符号化する2つの効率的な方法を紹介し比較する。
まず、線形関数をワード列多制御ゲートで量子レジスタにエンコードする。
第2に、この構成をビルディングブロックとして使用し、線形関数に対応する振幅のブロック符号化を実現する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 16:00:57 GMT)
Dissipative frequency converter: from Lindblad dynamics to non-Hermitian
topology [0.0] 位相周波数変換器は整数量子ホール効果の動的対向を表す。
我々は、ハミルトニアンの瞬時固有ベイズにおいて、自然崩壊と脱落に対応する散逸チャネルを考察する。
我々は、非摂動力学から量子ウォッチドッグ効果へ遷移し、強い結合限界における電力伝達を破壊する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:00:58 GMT)
Directionally Tunable Co- and Counter-Propagating Photon Pairs from a
Nonlinear Metasurface [0.0] 非線形な準曲面から発生する光子対の放出角の正確な制御を初めて示す。
一致事故率の高い角度調整可能なペアジェネレーションについて検討した。
この研究は、サブ波長厚光子対源のツールセットに重要な追加を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:35:57 GMT)
Diagnostics of mixed-state topological order and breakdown of quantum
memory [0.0] トポロジカル量子メモリは、局所誤差から有限エラーしきい値まで情報を保護することができる。
本稿では、トポロジカル量子メモリの破壊の本質的な特徴について述べる。
地中トポロジカル秩序の診断の一般化として,3つの情報理論量を用いる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:20:34 GMT)
Deep Generative Domain Adaptation with Temporal Relation Knowledge for Cross-User Activity Recognition [0.0] 人間の行動認識では、トレーニングとテストが独立であり、同じ分布(すなわち、d)がしばしば失敗する。
本研究では,HARにおける時系列領域適応の独特な課題に対処する,ユニバーサルシーケンスマッピング(CVAE-USM)を用いた変分オートエンコーダを提案する。
本手法は, ユーザ間の共通時間パターンを捉え, 利用するために, 可変オートエンコーダ (VAE) とユニバーサルシーケンスマッピング (USM) の長所を組み合わせる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:48:23 GMT)
Deep Generative Domain Adaptation with Temporal Attention for Cross-User Activity Recognition [0.0] HAR(Human Activity Recognition)では、トレーニングや評価目的で使用されるデータが同じ分布から引き出されるという前提が主流である。
本研究では時間的アテンション法による深部生成ドメイン適応を提案する。
時間的関係注意機構による生成モデルの能力の相乗化により,本手法はユーザ間HARの分類性能を向上させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:45:05 GMT)
D4D: An RGBD diffusion model to boost monocular depth estimation [0.0] 地上のRGBDデータは、幅広いコンピュータビジョンアプリケーションに基礎を置いている。
本研究では,リアルなRGBDサンプルを生成することができる4チャネル拡散モデルであるDiffusion4D(D4D)を取り入れた新しいトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:47:53 GMT)
Cross-user activity recognition via temporal relation optimal transport [0.0] 人間の活動認識(HAR)に関する現在の研究は、トレーニングデータとテストデータが同一の分布から抽出され、一般化されたモデルを達成することを前提としている。
本稿では,時間的関係を利用した時間的関係最適輸送法(TROT)を提案し,$の仮定を緩和する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:33:56 GMT)
Cost-Effective Methodology for Complex Tuning Searches in HPC:
Navigating Interdependencies and Dimensionality [0.0] この複雑さは、ルーチン内のパラメータの微調整と、それら間の潜在的な相互依存性から生じる。
パラメータやルーチン間の相互依存を精査する代わりに、実践者はそれぞれのルーチンに対して独立したチューニングサーチを実行するというジレンマに直面します。
本手法は,実世界のシナリオにおける性能向上を最大化しながら,計算可能性を確保するために,これらの手法を適応・洗練する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 23:39:43 GMT)
Controlling Nonequilibrium Bose-Einstein Condensation with Engineered
Environments [0.0] 熱平衡から、ボゾン量子系は基底状態からボース・コンデンスを遠ざけることができる。
以前の研究で、駆動散逸理想のボース気体凝縮状態を予測する理論が開発された。
ここでは逆問題に対処する: ある単一粒子状態において所望の分数を持つターゲット状態が与えられた場合、この構成は利用可能な制御パラメータをチューニングすることによってどのように達成できるのか?
超伝導回路において実験的に実装可能なBose Condenser'を提案する。Bose Condensation into eigenstates of a chain of Resonator is driven through the coupling to Artificial quantum baths。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:36:36 GMT)
Contextual Clarity: Generating Sentences with Transformer Models using
Context-Reverso Data [0.0] コンテキスト(KIC)生成におけるキーワードは、検索エンジン、パーソナルアシスタント、コンテンツ要約などのアプリケーションにおいて重要な役割を担っている。
本稿では,T5 トランスフォーマーモデルを用いて,Context-Reverso API から得られたデータを活用することによって,与えられたキーワードに対して不明瞭で簡潔な文文文を生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 22:23:08 GMT)
Constrained Optimal Fuel Consumption of HEV: A Constrained Reinforcement
Learning Approach [0.0] この研究は、制約付き強化学習(CRL)の観点から、制約付き最適燃料消費(COFC)の数学的表現を提供する。
CRLの2つの主要なアプローチ、制約付き変動ポリシー最適化(CVPO)とラグランジアンベースのアプローチが、車両の最小燃費を得るために初めて使用される。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 10:42:32 GMT)
Computing a Group Action from the Class Field Theory of Imaginary Hyperelliptic Function Fields [0.0] $mathbb F_q$ 上で定義される虚超楕円曲線のヤコビアンは、ドリンフェルト加群の同型類の部分集合に作用する。
これは、Couveignes-Rostovtsev-Stolbunov群作用の関数場類似体である。
群作用を反転する問題は、Drynfeld $mathbb F_q[X]$-加群の間の固定された$tau$-次数の同種関係を見つける問題を減少させる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:45:27 GMT)
Classical Limits of Hilbert Bimodules as Symplectic Dual Pairs [0.0] ヒルベルト双加群は、量子系のC*-代数モデルとシンプレクティック双対の間の射である。
逆方向において、厳密な変形量子化は、シンプレクティック双対を再構成するためにヒルベルト双加群の古典的極限を取ることも示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 20:23:15 GMT)
Characterizations of homomorphisms among unital completely positive maps [0.0] 有限次元 C*-代数の間の単位正の正の写像が準同型であることを証明する。
どちらの同値も有限集合間の写像に関するよく知られた事実を一般化する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:55:44 GMT)
Challenges in certifying quantum teleportation: moving beyond
conventional fidelity benchmark [0.0] 従来の量子テレポーテーションの認証方法は、目標状態とテレポーテーション状態の間の到達可能な古典的平均忠実度を超えることに依存している。
不整合結論は、量子状態空間における異なる距離測度と見なされるときに得られる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 18:02:17 GMT)
CardioGenAI: A Machine Learning-Based Framework for Re-Engineering Drugs
for Reduced hERG Liability [0.0] 薬物による心毒性は、生命を脅かす不整脈を引き起こす主要な健康上の問題である。
CardioGenAIは、HERG活性を減少させるために、開発薬と市販薬の両方を再設計する機械学習ベースのフレームワークである。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:12:24 GMT)
CKERC : Joint Large Language Models with Commonsense Knowledge for
Emotion Recognition in Conversation [0.0] 会話における感情認識(英: Emotion Recognition in conversation、ERC)とは、会話の文脈における発話の感情を予測するタスクである。
会話における感情認識のための共通知識フレームワークであるCKERCを提案する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 02:37:11 GMT)
Broadcasting Quantum Information using Finite Resources [0.0] 測定はシステムと特に準備されたポインタ間の相互作用と見なすことができる。
我々は、この情報を複数の量子メモリに一元的に分散する問題を考察する。
この放送プロセスの精度は、純粋な状態でのメモリ作成に関する熱力学的制約によって制限されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 13:50:01 GMT)
Bright and dark states of light: The quantum origin of classical
interference [0.0] 量子光学では、古典的な干渉は光の集合的明るい状態と暗い状態から現れる。
これにより、光の粒子記述と線形系の重ね合わせ原理を用いて波動干渉を説明することができる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:31:20 GMT)
Beyond-adiabatic Quantum Admittance of a Semiconductor Quantum Dot at
High Frequencies: Rethinking Reflectometry as Polaron Dynamics [0.0] 我々は、電荷貯水池に結合した量子ドットトンネルのアプタンスを得るために、自己整合量子マスター方程式の定式化を開発する。
本報告では,QD状態のドレッシングによって決定されるFloquet wideeningと,光子損失によって決定されるFloquet wideeningの2つについて述べる。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:30:07 GMT)
Anomalous magnetic flux via junction twist-angle in a
triplet-superconducting transmon qubit [0.0] 低エラー実装には、強い不調和性とオフセット電荷に対する感度の低い超伝導トランスモン量子ビットが望ましい。
本稿では,三重項超伝導体からなるc軸接合を相対的なねじれ角度で設定する。
このアーキテクチャでは、異常なフラックスは接合のツイスト角によって決定され、新しいゼロフィールド機能を提供する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:03:44 GMT)
An Interpretable Generalization Mechanism for Accurately Detecting
Anomaly and Identifying Networking Intrusion Techniques [0.0] 解釈可能な一般化メカニズム(IG)は、コヒーレントパターンを識別し、正常なネットワークトラフィックと異常なネットワークトラフィックを区別する。
実世界のデータセットによる実験により、IGはトレーニングとテストの比率が低い場合でも正確である。
IGは、多様なデータセットとトレーニングとテストの比率を一貫して比較することで、優れた一般化を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:01:04 GMT)
An Effective Way to Determine the Separability of Quantum State [0.0] 測定誘起ブロッホ空間を構成することにより、いくつかの一般的な分離性条件が設定されることを示す。
この新しいアプローチは、一般的な絡み合い基準の多くを再現するだけでなく、より強い結果をもたらし、いくつかの有界絡み合い状態に対して優越性を示す。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 06:17:19 GMT)
An Architecture for Noise-Aware Distributed Quantum Computation [0.0] 分散量子計算とストレージのためのアーキテクチャを開発する。
我々は,各ノードに適した量子誤り訂正法を開発することにより,ノイズに対する各ノードの堅牢性を高める。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:33:54 GMT)
Alternative robust ways of witnessing nonclassicality in the simplest
scenario [0.0] 最も単純な非自明なシナリオにおいて、非古典性の概念を関連付ける。
我々は準備のために有界な存在論的別性の概念に基づくアプローチを用いる。
本研究の応用として,ノイズの有無で2ビットパリティ多重化を施行した症例を報告する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:31:53 GMT)
Advancements in Continuous Glucose Monitoring: Integrating Deep Learning
and ECG Signal [0.0] 本稿では, 心電図(ECG)を用いた非侵襲性高血糖モニタリングへの新しいアプローチを提案する。
我々は、様々な空間的位置における重要な特徴を特定し、各畳み込み層内の異なる特徴間の相互依存性を調べることができるディープニューラルネットワークモデルを設計した。
提案アルゴリズムは、曲線(AUC)下の91.60%の領域、81.05%の感度、85.54%の特異性を持つ高血糖を効果的に検出する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 03:57:25 GMT)
Adaptive Gain Scheduling using Reinforcement Learning for Quadcopter
Control [0.0] 本稿では, クアッドコプター制御器の制御利得を適応させるために, 強化学習を用いた手法を提案する。
このコントローラの第一の目的は、特定の軌跡を辿りながらトラッキングエラーを最小限にすることである。
その結果,適応利得方式は静的利得制御器と比較して40$%以上の追従誤差を減少させることがわかった。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 00:08:54 GMT)
Accurate Spatial Gene Expression Prediction by integrating
Multi-resolution features [0.0] TRIPLEXは全スライド画像(WSI)から空間的遺伝子発現を予測するための新しいディープラーニングフレームワーク
3つのパブリックSTデータセットを用いて行ったベンチマーク研究により、TRIPLEXはMean Squared Error(MSE)、Mean Absolute Error(MAE)、Pearson correlation Coefficient(PCC)において、現在の最先端モデルよりも優れていることが示された。
このモデルの予測は、がんの診断と治療の進歩におけるTRIPLEXのポテンシャルを裏付ける、基底真理遺伝子発現プロファイルや腫瘍アノテーションと密接に一致している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 12:25:38 GMT)
Ab-initio variational wave functions for the time-dependent
many-electron Schr\"odinger equation [0.0] フェミオン時間依存波動関数に対する変動的アプローチを導入し,多体相関を捉えることで平均場近似を超越する。
提案手法は、時間発展する量子状態のパラメータ化を伴い、状態の進化の近似を可能にする。
このアプローチは、可溶性調和相互作用モデル、強いレーザー場における二原子分子のダイナミクス、焼成量子ドットの3つの異なるシステムで実証されている。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:37:22 GMT)
A tutorial on multi-view autoencoders using the multi-view-AE library [0.0] マルチビューオートエンコーダのための統一的な数学的枠組みを提案する。
それぞれのモデルのモチベーションと理論的アドバンテージに関する洞察を提供する。
以前導入された textttmulti-view-AE ライブラリのドキュメントと機能を拡張する。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 09:51:05 GMT)
A local approach to parameter space reduction for regression and
classification tasks [0.0] そこで本研究では, クラスタリング手法を用いて, アクティブ部分空間のシナジーを探索する, ローカルアクティブ部分空間 (LAS) と呼ばれる新しい手法を提案する。
LASは、サロゲートモデリングに取り組んでいるコミュニティにとって特に有用である。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 15:07:08 GMT)
A Survey of Vision Transformers in Autonomous Driving: Current Trends
and Future Directions [0.0] 本調査では、自律運転における視覚トランスフォーマーモデルの適応について検討する。
自己注意、マルチヘッドアテンション、エンコーダ・デコーダアーキテクチャといった基本的な概念に焦点を当てている。
調査は将来の研究方向で終わり、自動運転におけるビジョントランスフォーマーの役割の増大を強調している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 11:29:40 GMT)
A Machine learning and Empirical Bayesian Approach for Predictive Buying
in B2B E-commerce [0.0] 我々は,XGBoostとPoisson Gammaモデルの改良版を組み合わせたアンサンブルアプローチを用いて,顧客の注文パターンを精度良く予測した。
本稿では,機械学習の戦略的融合と経験的ベイズ的アプローチを深く探求する。
この革新的なアプローチは、顧客の注文率を3倍に向上させ、Eコマース業界に変革をもたらす可能性を示している。
論文参考訳(メタデータ) (Tue, 12 Mar 2024 17:32:52 GMT)