Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction [153.5] Gambaは、エンドツーエンドの3D再構成モデルである。
Gambaは、データ前処理、正規化設計、トレーニング方法論の大幅な進歩を取り入れている。
ここでガンバは、質的にも量的にも競争力のある生成能力を示しながら、目覚ましいスピードを実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:02:14 GMT)
Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation [122.6] 大規模言語モデル(LLM)は、言語における生成タスクの主要なモデルである。
本稿では,ビデオと画像の両方に対して簡潔かつ表現力のあるトークンを生成するために設計されたビデオトークンライザMAGVIT-v2を紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:44:41 GMT)
Efficient Modulation for Vision Networks [122.1] 我々は、効率的なビジョンネットワークのための新しい設計である効率的な変調を提案する。
変調機構が特に効率的なネットワークに適していることを実証する。
私たちのネットワークは、精度と効率のトレードオフをうまく達成できます。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:48:35 GMT)
Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.2] 拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:18:02 GMT)
Learning From Mistakes Makes LLM Better Reasoner [106.5] 大規模言語モデル(LLM)は、最近数学の問題を解く際、顕著な推論能力を示した。
この研究は、LLMが人間の学習プロセスに似たMistAkes(LEMA)から学習できるかどうかを探求する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:17:39 GMT)
FABind+: Enhancing Molecular Docking through Improved Pocket Prediction and Pose Generation [104.1] スピードと精度を重視したモデルであるFABindを改良したモデルを提案する。
本稿では,ポケット予測を大幅に洗練し,ドッキングプロセスの合理化を図る手法を提案する。
従来のサンプリング/生成手法とギャップを埋めるために, 単純で効果的なサンプリング手法を取り入れた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:10:34 GMT)
Domain Specialization as the Key to Make Large Language Models Disruptive: A Comprehensive Survey [100.2] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野を著しく進歩させた。
広範囲のアプリケーションに対して、非常に有用でタスクに依存しない基盤を提供する。
しかし、特定の領域における洗練された問題を解決するために直接LLMを適用することは、多くのハードルを満たす。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:05:07 GMT)
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality [95.8] mPLUG-Owlは、大規模言語モデル(LLM)にマルチモーダル能力を持たせる訓練パラダイムである。
トレーニングパラダイムは、LLMの助けを借りて視覚知識を学ぶ、画像とテキストの整列のための2段階の手法を含む。
実験の結果,本モデルは既存のマルチモーダルモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:13:38 GMT)
Are We on the Right Way for Evaluating Large Vision-Language Models? [92.6] 大規模視覚言語モデル(LVLM)は、最近急速に進歩し、そのマルチモーダル能力を評価するために多くの研究を巻き起こした。
視覚コンテンツは多くのサンプルに対して不要であり、意図的なデータ漏洩が存在する。
本稿では,人間によって精巧に選択された1500個のサンプルからなる,高度に視覚に欠かせないマルチモーダルベンチマークMMStarを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:59:34 GMT)
SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation [87.2] In-context segmentationは、"in-context example"と呼ばれるいくつかのラベル付きサンプルイメージを使用して、新しいイメージをセグメント化することを目的としている。
単一ビジョン基盤モデル(VFM)に基づくエンドツーエンドのセグメンテーション・イン・コンテクストフレームワークSEGICを提案する。
SEGICは、ワンショットセグメンテーションベンチマークで最先端のパフォーマンスをもたらす、単純だが効果的なアプローチである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:36:41 GMT)
Single-Model and Any-Modality for Video Object Tracking [85.8] 任意のモダリティに対して単一のパラメータセットの統一トラッカーUn-Trackを導入する。
任意のモダリティを扱うために,低ランク因子化および再構成手法を用いて,それらの共通潜時空間を学習する。
我々のUn-Trackは、+6.6M(93M以上)のパラメータを持つ+2.14(21.50以上)のGFLOPを導入することで、DepthTrackデータセット上で、+8.1絶対Fスコアゲインを達成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:25:45 GMT)
Unsolvable Problem Detection: Evaluating Trustworthiness of Vision Language Models [84.8] 本稿では、未解決問題検出(UPD)と呼ばれるビジョン言語モデル(VLM)の新規かつ重要な課題を紹介する。
UPDは、VQA(Visual Question Answering)タスクのコンテキストにおいて、解決不可能な問題に直面したときのVLMの回答を抑える能力について検討している。
UPD問題を深く研究するため, GPT-4V や LLaVA-Next-34B を含む多くの VLM が, 様々な範囲で我々のベンチマークと競合していることを示す実験を行った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:59:53 GMT)
Natural Language Embedded Programs for Hybrid Language Symbolic Reasoning [84.1] 本研究では,数学・記号的推論,自然言語理解,後続の課題に対処するための統合フレームワークとして,自然言語組み込みプログラム(NLEP)を提案する。
我々のアプローチは,構造化知識の自然言語表現を含むデータ構造上の関数を定義する完全なPythonプログラムを生成するよう,言語モデルに促す。
Pythonインタープリタが生成されたコードを実行し、出力をプリントする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:18:18 GMT)
SHINOBI: Shape and Illumination using Neural Object Decomposition via BRDF Optimization In-the-wild [76.2] 制約のない画像コレクションに基づくオブジェクトの逆レンダリングは、コンピュータビジョンとグラフィックスにおける長年の課題である。
マルチレゾリューションハッシュ符号化に基づく暗黙の形状表現により,高速かつ堅牢な形状復元が可能となることを示す。
本手法はクラス非依存であり,3Dアセットを生成するために,オブジェクトのWildイメージコレクションで動作する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:47:59 GMT)
Stable Surface Regularization for Fast Few-Shot NeRF [76.0] 我々はAnnealing Signed Distance Function (ASDF) と呼ばれる安定表面正規化手法を開発した。
SDFの異なるレベルセットを形成するためには、アイコンの損失が密集した訓練信号を必要とすることが観察され、数発の訓練で低忠実度結果が得られた。
提案手法は、既存の数発の新規ビュー合成法よりも最大45倍高速である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:39:47 GMT)
On Large Language Models' Hallucination with Regard to Known Facts [75.0] 大規模な言語モデルはファクトイドの質問に答えることに成功したが、幻覚を起こす傾向がある。
正しい解答知識を持つLLMの現象を推論力学の観点から検討する。
我々の研究は、LLMの幻覚が既知の事実について、そしてより重要なのは、幻覚を正確に予測する理由を理解することに光を当てた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:48:30 GMT)
Interpreting CLIP's Image Representation via Text-Based Decomposition [73.5] CLIP画像エンコーダは,個々のモデルコンポーネントが最終表現にどう影響するかを解析することによって検討する。
画像表現は、個々の画像パッチ、モデル層、アテンションヘッドにまたがる和として分解する。
この理解を利用して、CLIPからスプリケートな機能を取り除き、強力なゼロショットイメージセグメンタを作成します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:40:47 GMT)
VicTR: Video-conditioned Text Representations for Activity Recognition [73.1] より優れたビデオVLMは、視覚情報よりもテキストの強化に重点を置くことで設計できる、と我々は主張する。
本稿では,ビデオ条件付きテキスト表現(VicTR)を紹介する。
我々のモデルは、視覚的に接地された補助テキストという形で、自由に利用できるセマンティック情報を利用することができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:56:33 GMT)
Rewrite the Stars [70.5] 近年の研究では、ネットワーク設計における「スター操作」の未解決の可能性に注意が向けられている。
本研究は、高次元の非線形特徴空間に入力をマッピングする恒星操作の能力を明らかにすることを試みる。
StarNetはシンプルだがパワフルなプロトタイプで、素晴らしいパフォーマンスと低レイテンシを誇示しています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:10:07 GMT)
Taming Mode Collapse in Score Distillation for Text-to-3D Generation [70.3] Janus"アーティファクトはテキストから3D生成における問題であり、生成されたオブジェクトは複数のフロントフェイスで各ビューを偽装する。
エントロピースコア蒸留(Entropic Score Distillation, ESD)と呼ばれる新しい3Dスコア蒸留法を提案する。
恥ずかしいほど単純ではないが,我々はESDがJanusアーティファクトのスコア蒸留に有効であることを示す実験を行った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:04:37 GMT)
SteinDreamer: Variance Reduction for Text-to-3D Score Distillation via Stein Identity [70.3] スコア蒸留における勾配推定は, 分散度が高いことが示唆された。
本稿では,Stin Score Distillation (SSD) と呼ばれる,スコア蒸留の分散を低減するための,より一般的な解を提案する。
我々はSteinDreamerがより安定した勾配更新により既存の方法よりも高速に収束できることを実証した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:33:30 GMT)
CLOVA: A Closed-Loop Visual Assistant with Tool Usage and Update [69.6] CLOVAは、推論、リフレクション、学習フェーズを含むフレームワーク内で動作するクローズドループビジュアルアシスタントである。
その結果,CLOVAは既存のツール利用手法を5%,知識タグ付けでは10%,画像編集では20%,視覚的質問応答や複数画像推論では5%に上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:24:23 GMT)
Shallow Cross-Encoders for Low-Latency Retrieval [69.1] BERTやT5のような大きなトランスフォーマーモデルに基づくクロスエンコーダは計算コストが高く、非常に小さな遅延ウィンドウ内で少数の文書しかスコアできない。
より弱い浅層変圧器モデル(すなわち、層数が限られている変圧器)は、これらの実用的な低レイテンシ設定に制約された場合、実際にフルスケールモデルよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:07:21 GMT)
CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.1] そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:13:49 GMT)
NOPE: Novel Object Pose Estimation from a Single Image [67.1] 本稿では,新しいオブジェクトの1つのイメージを入力として取り込んで,オブジェクトの3Dモデルに関する事前知識を必要とせずに,新しいイメージにおけるオブジェクトの相対的なポーズを予測するアプローチを提案する。
我々は、オブジェクトを取り巻く視点に対する識別的埋め込みを直接予測するモデルを訓練することで、これを実現する。
この予測は単純なU-Netアーキテクチャを用いて行われ、要求されたポーズに注意を向け、条件を定め、非常に高速な推論をもたらす。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:42:05 GMT)
Point Cloud Mamba: Point Cloud Learning via State Space Model [64.9] 我々は,マンバをベースとしたポイントクラウド手法が,ポイントベースの手法より優れていることを示す。
ローカル・グローバル・モデリングを組み合わせたポイント・クラウド・マンバ(Point Cloud Mamba)というポイント・クラウド・ネットワークを構築した。
Point Cloud Mambaは、SOTAポイントベースのPointNeXtを超え、ScanObjectNN、ModelNet40、ShapeNetPartデータセットで新しいSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:02:03 GMT)
Relation Rectification in Diffusion Model [64.8] 本稿では,最初に生成できない関係を正確に表現するためにモデルを洗練することを目的とした,リレーション・リクティフィケーション(Relation Rectification)と呼ばれる新しいタスクを紹介する。
異種グラフ畳み込みネットワーク(HGCN)を利用した革新的な解を提案する。
軽量HGCNは、テキストエンコーダによって生成されたテキスト埋め込みを調整し、埋め込み空間におけるテキスト関係の正確な反映を保証する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:54:36 GMT)
Long-Tailed Anomaly Detection with Learnable Class Names [64.8] 性能評価のためのクラス不均衡とメトリクスのレベルが異なるデータセットをいくつか導入する。
次に、データセットのクラス名に頼ることなく、複数の長い尾を持つクラスから欠陥を検出する新しい手法LTADを提案する。
LTADは、ほとんどの形式のデータセットの不均衡に対して最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:26:44 GMT)
Multi-Level Neural Scene Graphs for Dynamic Urban Environments [64.3] 本稿では, 動的都市環境に対する新しい分解可能放射場アプローチを提案する。
本稿では,数百の高速移動物体を含む数十のシーケンスから数千の画像にスケールする多段階ニューラルシーングラフ表現を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:52:01 GMT)
MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark [63.9] マルチターゲットマルチカメラトラッキングは、複数のカメラからのビデオストリームを使用して個人を特定し、追跡する重要なタスクである。
このタスクの既存のデータセットは、制御されたカメラネットワーク設定内で合成または人工的に構築される。
我々は16台のマルチモーダルカメラで2つの異なる環境でキャプチャされた長いビデオシーケンスを含む実世界の大規模データセットであるMTMMCを紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:08:37 GMT)
GTA: A Geometry-Aware Attention Mechanism for Multi-View Transformers [63.4] 既存の位置符号化方式は3次元視覚タスクに最適であると主張する。
トークンの幾何学的構造を相対変換として符号化する幾何学的注意機構を提案する。
我々は、Geometric Transform Attention (GTA) と呼ばれる、最先端のトランスフォーマーベースNVSモデルの学習効率と性能を向上させることに留意している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:08:12 GMT)
Psychometry: An Omnifit Model for Image Reconstruction from Human Brain Activity [61.0] 人間の脳活動から見るイメージを再構築することで、人間とコンピュータのビジョンをBrain-Computer Interfaceを通して橋渡しする。
異なる被験者から得られた機能的磁気共鳴イメージング(fMRI)による画像再構成のための全能モデルであるサイコメトリを考案した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:16:34 GMT)
GAvatar: Animatable 3D Gaussian Avatars with Implicit Mesh Learning [60.3] ガウススプラッティングは、明示的(メッシュ)と暗黙的(NeRF)の両方の3D表現の利点を利用する強力な3D表現として登場した。
本稿では,ガウススプラッティングを利用してテキスト記述から現実的なアニマタブルなアバターを生成する。
提案手法であるGAvatarは,テキストプロンプトのみを用いて,多様なアニマタブルアバターを大規模に生成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:32:57 GMT)
DVIS-DAQ: Improving Video Segmentation via Dynamic Anchor Queries [60.1] 動的アンカークエリ(DAQ)を導入し、アンカーとターゲットクエリ間の遷移ギャップを短くする。
また,クエリレベルのオブジェクトEmergence and Disappearance Simulation(EDS)戦略を導入する。
実験により、DVIS-DAQは5つの主流ビデオセグメンテーションベンチマーク上で、新しい最先端(SOTA)性能を達成することが示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:58:50 GMT)
DragVideo: Interactive Drag-style Video Editing [58.6] DragVideoはドラッグ・テンポラリなビデオ編集フレームワークだ。
動画を直感的で、ユーザの意図に忠実に編集し、ほとんど目立たない歪みやアーティファクトで、時間的一貫性を維持しながら編集することができる。
従来のプロンプトベースのビデオ編集では、前者の2つを行ない、画像ドラッグを直接適用することは最後に失敗するが、DragVideoの汎用性と汎用性が強調されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:59:13 GMT)
Draw-and-Understand: Leveraging Visual Prompts to Enable MLLMs to Comprehend What You Want [58.1] 我々は、Draw-and-Understandプロジェクト、新しいモデル、マルチドメインデータセット、ビジュアルプロンプトのための挑戦的なベンチマークを紹介する。
具体的には、視覚エンコーダ、視覚プロンプトエンコーダ、LLMを接続する、エンド・ツー・エンドのマルチモーダル大規模言語モデル(MLLM)を提案する。
MLLMの視覚的プロンプト研究を進めるために,MDVP-DataとMDVP-Benchを紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:26:20 GMT)
Self-learning Canonical Space for Multi-view 3D Human Pose Estimation [58.0] マルチビュー3次元人間のポーズ推定は、自然に単一ビューのポーズ推定よりも優れている。
これらの情報の正確な注釈を得るのは難しい。
完全自己管理型多視点アグリゲーションネットワーク(CMANet)を提案する。
CMANetは、大規模で質的な分析において最先端の手法よりも優れている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:55:50 GMT)
Decentralized Multimedia Data Sharing in IoV: A Learning-based Equilibrium of Supply and Demand [57.8] インターネット・オブ・ビークルズ(IoV)は、道路の安全性を高め、交通渋滞を軽減し、インフォテインメントアプリケーションを通じてユーザーエクスペリエンスを向上させることにより、交通システムを変革する大きな可能性を秘めている。
分散データ共有は、セキュリティ、プライバシ、信頼性を改善し、IoVにおけるインフォテインメントデータの共有を容易にする。
市場における需給バランスを学習するための多知能強化学習に基づく分散型データ共有インセンティブ機構を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:58:28 GMT)
Defending Against Weight-Poisoning Backdoor Attacks for Parameter-Efficient Fine-Tuning [57.5] パラメータ効率のよい微調整(PEFT)は,重み付けによるバックドア攻撃の影響を受けやすいことを示す。
PEFTを利用したPSIM(Poisoned Sample Identification Module)を開発した。
テキスト分類タスク,5つの微調整戦略,および3つの重み付けバックドア攻撃手法について実験を行った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:12:30 GMT)
Enhancing the General Agent Capabilities of Low-Parameter LLMs through Tuning and Multi-Branch Reasoning [56.8] オープンソースの事前訓練された大規模言語モデル(LLM)は、強力な言語理解と生成能力を示す。
現実世界の複雑な問題に対処するエージェントとして使用される場合、ChatGPTやGPT-4のような大型の商用モデルに比べてパフォーマンスははるかに劣る。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:48:12 GMT)
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.7] 我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。
我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。
当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:38:25 GMT)
Model Reprogramming Outperforms Fine-tuning on Out-of-distribution Data in Text-Image Encoders [56.5] 本稿では,侵入的微調整技術に関連する隠れたコストを明らかにする。
ファインチューニングのための新しいモデル再プログラミング手法を導入し、それをリプログラマと呼ぶ。
我々の経験的証拠は、Re Programmerは侵入力が少なく、より優れた下流モデルが得られることを示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:34:26 GMT)
LipSim: A Provably Robust Perceptual Similarity Metric [56.0] 敵攻撃に対するViTベースの特徴抽出器のアンサンブルに基づく,最先端の知覚的類似度指標の脆弱性を示す。
次に、証明可能な保証とともに、LipSimと呼ばれる堅牢な知覚的類似度メトリックをトレーニングするためのフレームワークを提案する。
LipSimは、各データポイント周辺の保護された領域と、$ell$ ball内のすべての摂動の証明書を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:34:40 GMT)
LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and 200+ FPS [55.9] 光ガウシアン(LightGaussian)は、3次元ガウシアンをより効率的でコンパクトなフォーマットに変換する新しい方法である。
ネットワーク・プルーニング(Network Pruning)の概念からインスピレーションを得たLightGaussianは、シーンの再構築に貢献するに足りていないガウシアンを特定する。
本稿では,全ての属性を量子化するハイブリッド方式であるVecTree Quantizationを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:58:34 GMT)
DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation [55.7] 本稿では,DreamGaussianを提案する。DreamGaussianは,効率と品質を両立させる新しい3Dコンテンツ生成フレームワークである。
我々の重要な洞察は、UV空間におけるメッシュ抽出とテクスチャ改善を伴う3次元ガウススプラッティングモデルを設計することである。
ニューラル・ラジアンス・フィールドにおける占有プルーニングとは対照的に、3次元ガウスの進行的な密度化は3次元生成タスクにおいて著しく速く収束することを示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:39:23 GMT)
Differentiated Security Architecture for Secure and Efficient Infotainment Data Communication in IoV Networks [55.3] IoVネットワークにおけるインフォテインメントデータ通信の安全性の欠如は、社会的エンジニアリング攻撃の容易なアクセスポイントを意図せずに開放することができる。
特に、まずIoVネットワークでデータ通信を分類し、各データ通信のセキュリティ焦点を調べ、その後、ファイル間通信でセキュリティ保護を提供するための異なるセキュリティアーキテクチャを開発する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:01:31 GMT)
ECLIPSE: Efficient Continual Learning in Panoptic Segmentation with Visual Prompt Tuning [54.7] パノプティカルセグメンテーション(英: Panoptic segmentation)は、コンピュータビジョンの最先端タスクである。
ECLIPSE と呼ばれる Visual Prompt Tuning をベースとした,新規で効率的なパノプティカルセグメンテーション手法を提案する。
我々のアプローチは、基本モデルのパラメータを凍結し、小さなプロンプト埋め込みだけを微調整することであり、破滅的な忘れ物と塑性の両方に対処する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:31:12 GMT)
Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields [54.5] ニューラル・ラジアンス・フィールドを使用する手法は、新しいビュー合成のような従来のタスクに汎用的である。
3次元ガウシアンスプラッティングは, 実時間ラディアンス場レンダリングにおける最先端の性能を示した。
この問題を効果的に回避するために,アーキテクチャとトレーニングの変更を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:09:30 GMT)
SGD: Street View Synthesis with Gaussian Splatting and Diffusion Prior [53.5] 現在の手法では、トレーニングの観点から大きく逸脱する観点で、レンダリングの品質を維持するのに苦労しています。
この問題は、移動中の車両の固定カメラが捉えた、まばらなトレーニングビューに起因している。
そこで本研究では,拡散モデルを用いて3DGSのキャパシティを向上させる手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:20:29 GMT)
Grounding and Enhancing Grid-based Models for Neural Fields [52.6] 本稿では,グリッドモデルに関する理論的枠組みを紹介する。
このフレームワークは、これらのモデルの近似と一般化の挙動がグリッド接カーネル(GTK)によって決定されることを指摘している。
導入されたフレームワークは、Multiplicative Fourier Adaptive Grid(MulFAGrid)と呼ばれる新しいグリッドベースモデルの開発を動機付けている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:33:13 GMT)
Integrating Language-Derived Appearance Elements with Visual Cues in Pedestrian Detection [51.7] 本研究では,大言語モデルの強みを文脈的外見の変化の理解に活用するための新しいアプローチを提案する。
本稿では,言語由来の外観要素を定式化し,歩行者検出に視覚的手がかりを取り入れることを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:09:33 GMT)
A Learning-based Incentive Mechanism for Mobile AIGC Service in Decentralized Internet of Vehicles [49.9] モバイルAIGCサービスアロケーションのための分散インセンティブ機構を提案する。
我々は、AIGCサービスのRSUへの供給と、IoVコンテキスト内のサービスに対するユーザ要求のバランスを見つけるために、マルチエージェントの深層強化学習を採用している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:46:07 GMT)
Binarized Low-light Raw Video Enhancement [49.7] ディープニューラルネットワークは、低照度生ビデオの強化において優れたパフォーマンスを実現している。
本稿では,低照度生ビデオエンハンスメントに超コンパクトなバイナリニューラルネットワーク(BNN)を適用する可能性について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:55:07 GMT)
SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.8] 本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:59:07 GMT)
Conversational Question Answering with Reformulations over Knowledge Graph [48.6] ConvQAの最先端の手法は、しばしば難解な問合せに苦労する。
本稿では,ConvQAの性能向上を目的とした強化学習モデルであるCornNetを提案する。
CornNetは、人間の書き直しと教師モデルの出力を模倣する学生モデルを用いて質問表現を学習する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:32:18 GMT)
H2RSVLM: Towards Helpful and Honest Remote Sensing Large Vision Language Model [48.1] 既存のリモートセンシング 特定の視覚言語モデル(RSVLM)は、改善の可能性がある。
HqDC-1.4Mは,大容量の高品質かつ詳細なRS画像のキャプションであり,14万枚の画像キャプションペアを含む。
RSVLMの自己認識能力向上を目的とした最初のデータセットであるRSSAを開発した。
これらのデータセットに基づいて,H2RSVLM,Helpful and Honest Remote Sensing Vision Language Modelを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:50:43 GMT)
Video Super-Resolution Transformer with Masked Inter&Intra-Frame Attention [46.7] Vision Transformerは、低解像度のシーケンスで欠落した詳細を復元することに成功した。
VSRの精度が優れているにもかかわらず、計算負荷と大きなメモリフットプリントはトランスフォーマーベースのVSRモデルの展開を妨げる。
マスク内およびフレーム間アテンション(MIA-VSR)を用いた新しい特徴レベルマスキング処理フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:10:56 GMT)
An Interpretable Cross-Attentive Multi-modal MRI Fusion Framework for Schizophrenia Diagnosis [46.6] 本稿では,fMRI と sMRI のモーダル内およびモーダル間関係を捉えるために,CAMF (Cross-Attentive Multi-modal Fusion framework) を提案する。
提案手法は,2つの広範囲なマルチモーダル脳画像データセットを用いた評価により,分類精度を著しく向上させる。
勾配誘導Score-CAMは、統合失調症に関連する重要な機能的ネットワークと脳領域の解釈に応用される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:32:30 GMT)
Data-Driven Room Acoustic Modeling Via Differentiable Feedback Delay Networks With Learnable Delay Lines [46.3] フィードバック遅延ネットワーク(FDN)のパラメータを求める新しい手法を提案する。
提案手法は、訓練可能な遅延線を持つ微分可能なFDNの実装を含む。
提案手法は,所望の音響特性と密に一致できる時間不変周波数独立FDNが得られることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:48:32 GMT)
Particle creation in left-handed metamaterial transmission lines [45.0] 伝送線は量子場の量子シミュレータの優れた例である。
超伝導量子干渉デバイスにおけるジョセフソンエネルギーの変調による左利き伝送線路の粒子生成について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:20:47 GMT)
Efficient and Sharp Off-Policy Evaluation in Robust Markov Decision Processes [45.0] マルコフ決定過程(MDP)に対する最善かつ最悪の摂動下での政策評価について検討する。
これは、歴史的環境と将来の環境のシフトの可能性において重要な問題である。
本稿では、ある乗算係数またはその逆数への遷移カーネル密度を変更可能な摂動モデルを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:11:49 GMT)
Emergent Open-Vocabulary Semantic Segmentation from Off-the-shelf Vision-Language Models [44.1] 大規模な視覚プレイモデルは、視覚的な質問のようなタスクに有効である画像領域と単語を関連付けることを学習する。
本稿では,この課題に対する学習自由化手法であるPlug-and-Play Open-Vocabulary Semantic- Language (OVSS)を提案する。
オーバーセグメンテーションとアンダーセグメンテーションのバランスをとるために、モデルのパッチが解決に最も注意を払っていることを反復的にドロップすることで、Salience Dropoutを導入します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:18:40 GMT)
Semantically-Shifted Incremental Adapter-Tuning is A Continual ViTransformer [44.1] クラスインクリメンタルラーニング(CIL)は、モデルが破滅的な忘れを克服しつつ、新しいクラスを継続的に学習できるようにすることを目的としている。
本稿では,連続学習の文脈において,異なるパラメータ効率チューニング(PET)手法を再検討する。
適応チューニングは,各学習セッションにおいてパラメータ拡張がなくても,プロンプトベースの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:23:12 GMT)
Learn "No" to Say "Yes" Better: Improving Vision-Language Models via Negations [43.5] 既存の視覚言語モデル(VLM)は、テキスト記述を単位として扱い、個々の概念をプロンプトで混乱させる。
CC-Negは,228,246のイメージ,真のキャプション,それに対応する否定的なキャプションを含むデータセットである。
提案するCoN-CLIPフレームワークであるCLIPの対照的な損失に対する修正とともにCC-Negを用いることで,否定の理解が向上した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:33:42 GMT)
Latxa: An Open Language Model and Evaluation Suite for Basque [42.1] 私たちはLatxaを紹介します。Latxaは、70億から700億のパラメータからなるバスクの大規模言語モデルのファミリーです。
Basqueの高品質なベンチマークの不足に対処するため、さらに4つの選択肢評価データセットを導入します。
広範囲な評価において、Latxaは、私たちが比較した過去のすべてのオープンモデルよりも大きなマージンで優れています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:16:48 GMT)
CroissantLLM: A Truly Bilingual French-English Language Model [42.0] 英語とフランス語のトークンセットを事前訓練した1.3B言語モデルであるCroissantLLMを紹介する。
我々は、英語とフランス語の事前学習データ比率1:1で、本質的なバイリンガルモデルを訓練するアプローチを開拓した。
英語以外のパフォーマンスを評価するため、新しいベンチマークである FrenchBench を作成します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:56:42 GMT)
GD^2-NeRF: Generative Detail Compensation via GAN and Diffusion for One-shot Generalizable Neural Radiance Fields [41.6] 本稿では,GANと拡散を用いた生成的詳細補償フレームワークを提案する。
このフレームワークは、推論時の微調整なしと、鮮明な検証可能な詳細の両方である。
合成データセットと実世界のデータセットの両方の実験では、GD$2$-NeRFはシーンごとの微調整なしに細部を著しく改善している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:27:32 GMT)
Revolutionizing Disease Diagnosis with simultaneous functional PET/MR and Deeply Integrated Brain Metabolic, Hemodynamic, and Perfusion Networks [41.0] マルチモーダルなMiXture-of-expertsアライメント再構成とモデルであるMX-ARMを提案する。
モダリティは分離可能で交換可能であり、異なる多層パーセプトロン(「専門家の混合」)を学習可能な重みを通して動的に割り当て、異なるモダリティからそれぞれの表現を学ぶ。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:47:49 GMT)
Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [39.6] 本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:05:26 GMT)
Embodied Multi-Modal Agent trained by an LLM from a Parallel TextWorld [39.5] 視覚言語モデル(VLM)は、静的な画像の特徴に合わせた大きな言語モデル(LLM)を統合する。
VLMは、具現化された視覚世界において訓練されていないため、その力学と整合することができない。
我々は、平行テキストの世界において優れたLDMエージェントを用いて、視覚の世界に住むVLMエージェントを訓練する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:07:25 GMT)
CtRL-Sim: Reactive and Controllable Driving Agents with Offline Reinforcement Learning [38.6] 本稿では,リアクティブかつ制御可能なトラフィックエージェントを効率的に生成するCtRL-Simを提案する。
我々はNocturneシミュレータを通して実世界の運転データを処理し、多様なオフライン強化学習データセットを生成する。
CtRL-Simは,エージェントの挙動を詳細に制御しながら,多様かつ現実的な安全クリティカルシナリオを効率的に生成できることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:10:19 GMT)
Sparse Views, Near Light: A Practical Paradigm for Uncalibrated Point-light Photometric Stereo [37.8] 光度ステレオ(PS)アプローチは、スパース視点下で高品質な再構成を実現する大きな可能性を示している。
実環境下でのスパースな視点から得られた高解像度形状を再構築するための,エンドツーエンドのマルチビューPSフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:09:11 GMT)
Segmentation, Classification and Interpretation of Breast Cancer Medical Images using Human-in-the-Loop Machine Learning [37.7] 本論文は、乳癌のゲノムデータと全スライドイメージング(WSI)解析の統合を扱っている。
病理医の関与は, より優れたセグメンテーションモデルの開発と, モデルの説明能力の向上に役立ったが, 分類結果は準最適であった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:49:02 GMT)
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions [36.3] 気象条件下でのマルチエージェント認識システムにおいて,LiDARに基づく3次元物体検出のための領域一般化手法 V2X-DGW を提案する。
クリーンな天候だけでなく、クリーンな天気データのみを学習することで、好適なマルチエージェントのパフォーマンスを確保することを目的としている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:19:56 GMT)
Learning Visual Quadrupedal Loco-Manipulation from Demonstrations [36.2] 我々は四足歩行ロボットに、足だけを使って現実世界の操作タスクを実行させることを目標としている。
我々はロコ操作プロセスを低レベル強化学習(RL)ベースのコントローラと高レベル行動クローン(BC)ベースのプランナに分解する。
提案手法はシミュレーションや実世界の実験を通じて検証され,移動性や高精度なタスクをロボットが実行できることが実証された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:59:05 GMT)
Functional Bilevel Optimization for Machine Learning [36.1] 本稿では,関数空間上での内的目的を最小化する機械学習における二段階最適化問題に対する新たな機能的視点を提案する。
機能的二段階最適化問題に対して,スケーラブルで効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:22:03 GMT)
Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation [35.5] 複雑な依存関係をより効率的にキャプチャできるHVtemporalDMというハイブリッドビデオオートエンコーダを提案する。
HVDMは、ビデオの歪んだ表現を抽出するハイブリッドビデオオートエンコーダによって訓練される。
当社のハイブリッドオートエンコーダは、生成されたビデオに詳細な構造と詳細を付加した、より包括的なビデオラテントを提供します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:42:02 GMT)
MANGO: A Benchmark for Evaluating Mapping and Navigation Abilities of Large Language Models [35.5] ChatGPTやGPT-4のような大規模言語モデルは、最近、様々な自然言語処理タスクにおける驚くべきパフォーマンスを達成した。
テキストベースのマッピングとナビゲーションを行う機能を評価するためのベンチマークであるMANGOを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:53:24 GMT)
Snap-it, Tap-it, Splat-it: Tactile-Informed 3D Gaussian Splatting for Reconstructing Challenging Surfaces [34.8] 本研究では,タッチデータ(局所深度マップ)を多視点視覚データと組み合わせ,表面再構成と新しいビュー合成を実現する新しいアプローチである触覚インフォームド3DGSを提案する。
タッチ位置の透過率を低下させる枠組みを作成することにより,表面の微細化を実現し,均一に滑らかな深度マップを実現する。
我々は、光沢と反射面を有する物体に対して評価を行い、我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:30:17 GMT)
MMCert: Provable Defense against Adversarial Attacks to Multi-modal Models [34.8] 我々は,マルチモーダルモデルに対する敵攻撃に対する最初の認証された防御であるMCCertを提案する。
我々は,マルチモーダル道路セグメンテーションタスクとマルチモーダル道路セグメンテーションタスクと,マルチモーダル感情認識タスクの2つのベンチマークデータセットを用いて,MCCertを評価した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:31:10 GMT)
Diff-Reg v1: Diffusion Matching Model for Registration Problem [34.6] 本稿では,ロバスト対応推定のための拡散マッチングモデルを提案する。
本稿では,2重行列構成における共振拡散過程として対応推定を扱う。
これは、ガウス雑音を基底の真理マッチング行列に徐々に導入する前方拡散過程と、雑音マッチング行列を反復的に洗練する逆復調過程を含む。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:10:38 GMT)
New Classes of the Greedy-Applicable Arm Feature Distributions in the Sparse Linear Bandit Problem [34.5] スパースパラメータの内積を通じて腕の特徴が報酬に影響を及ぼすスパースコンテキストバンドイット問題を考える。
近年の研究では、グリーディアーム選択ポリシーに基づくスパーシリティ非依存アルゴリズムが開発されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:58:19 GMT)
Can LLMs Learn from Previous Mistakes? Investigating LLMs' Errors to Boost for Reasoning [34.3] textscCoTErrorSetは609,432の質問を持つ新しいベンチマークで、それぞれが正しい参照とエラー参照の両方で設計されている。
textbfSelf-rethinking guideing LLMsは、彼らが同じような間違いを犯したかどうかを再考するよう促している。
textbfMistakeチューニングは、正しい推論ドメインと間違った推論ドメインの両方でモデルを微調整する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:30:34 GMT)
Rethinking Multi-view Representation Learning via Distilled Disentangling [34.1] マルチビュー表現学習は、多様なデータソースからビュー一貫性とビュー固有性の両方を持つ堅牢な表現を導出することを目的としている。
本稿では、この領域における既存のアプローチの詳細な分析を行い、ビュー一貫性とビュー固有表現の冗長性を強調した。
我々は,多視点表現学習のための革新的枠組みを提案し,これを「蒸留解離」と呼ぶ手法を取り入れた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:49:11 GMT)
Distribution-Aware Continual Test-Time Adaptation for Semantic Segmentation [33.8] 実世界の応用において, セマンティックセグメンテーションCTTAを効率的かつ実用的なものにするための分散対応チューニング(DAT)手法を提案する。
DATは、連続的な適応プロセス中にデータ分布に基づいて、トレーニング可能なパラメータの2つの小さなグループを適応的に選択し、更新する。
我々は2つの広く使われているセマンティックセマンティックセマンティクスCTTAベンチマークで実験を行い、従来の最先端手法と比較して有望な性能を実現した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:59:34 GMT)
P-MapNet: Far-seeing Map Generator Enhanced by both SDMap and HDMap Priors [33.7] 提案するP-MapNetでは、P文字は、モデル性能を改善するために、マッププリエントの導入に重点を置いているという事実を強調している。
注意に基づくアーキテクチャは,SDMapスケルトンに適応的に対応し,性能を大幅に向上させる。
P-MapNetは、長い範囲でより大きな改善をもたらす、探究可能なソリューションです。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:21:27 GMT)
Multi-Resolution Active Learning of Fourier Neural Operators [33.6] 本稿では,FNO(MRA-FNO)の多解能動的学習を提案する。
具体的には,確率的多分解能FNOを提案し,モンテカルロのアンサンブルを用いて効果的な後部推論アルゴリズムを提案する。
いくつかのベンチマーク演算子学習タスクにおいて,本手法の利点を示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:44:48 GMT)
FlashAvatar: High-fidelity Head Avatar with Efficient Gaussian Embedding [33.0] FlashAvatarは、新しくて軽量な3Dアニマタブルなアバター表現である。
短い単眼ビデオシーケンスから数分でデジタルアバターを再構築することができる。
コンシューマグレードのGPU上で300FPSで高忠実なフォトリアリスティック画像をレンダリングすることができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:31:44 GMT)
Variational Flow Models: Flowing in Your Style [32.9] 我々は「線形」過程の後流を直列定速(SC)流れに変換する。
この変換は、SC流の新しいモデルを訓練することなく、元の後流に沿って高速なサンプリングを容易にする。
高次数値解法を変換SC流に容易に組み込むことができ、サンプリング精度と効率をより高めることができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:28:46 GMT)
Making Batch Normalization Great in Federated Deep Learning [32.8] バッチ正規化(BN)は集中型ディープラーニングにおいて収束と一般化を改善するために広く用いられている。
BNによるトレーニングはパフォーマンスを阻害する可能性があり、グループ正規化(GN)に置き換えることを提案している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:37:04 GMT)
Motion Inversion for Video Customization [32.8] 映像生成モデルにおける動きのカスタマイズに関する新しいアプローチを提案する。
本手法では,映像から得られた時間的コヒーレントな1次元埋め込みの組であるモーション・エンベディングを導入する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:14:22 GMT)
STaR-GATE: Teaching Language Models to Ask Clarifying Questions [32.7] 有用な質問を生成するために,言語モデルの自己改善能力について検討する。
25,500のユニークなペルソナ・タスク・プロンプトの合成データセットを生成する。
より良い質問をするために言語モデルを教えることは、よりパーソナライズされた回答につながる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:15:12 GMT)
IndiBias: A Benchmark Dataset to Measure Social Biases in Language Models for Indian Context [32.5] インドにおける社会的バイアスを評価するためのベンチマークデータセットであるIndiBiasを紹介する。
バイアスの次元には、性別、宗教、キャスト、年齢、地域、身体的外観、職業が含まれる。
また、3つの交叉次元に沿った交叉バイアスに対処するリソースも構築する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:32:06 GMT)
Gecko: Versatile Text Embeddings Distilled from Large Language Models [32.1] 本稿では,コンパクトで汎用的なテキスト埋め込みモデルであるGeckoを紹介する。
私たちは、大きな言語モデル(LLM)から知識をレトリバーに抽出する、という重要なアイデアを活用しています。
MTEB (Massive Text Embedding Benchmark) では、256の埋め込み次元を持つ Gecko が 768 の埋め込みサイズで既存のエントリを上回ります。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:56:40 GMT)
MI-NeRF: Learning a Single Face NeRF from Multiple Identities [31.8] 本研究では,複数の人物の顔映像から単一動的神経放射場(NeRF)を学習する手法を提案する。
本稿では,表情伝達と音声合成の両面での結果について述べる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:17:09 GMT)
3DInAction: Understanding Human Actions in 3D Point Clouds [31.7] 本稿では,3次元クラウド行動認識のための新しい手法を提案する。
提案手法は,ASMビデオを含む既存のデータセットの性能向上を実現する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:10:29 GMT)
Promptly Predicting Structures: The Return of Inference [31.4] ゼロショットと少数ショットの言語構造予測器を構築するためのフレームワークを提案する。
その結果, 整合性の維持は構造的に有効であるだけでなく, 性能も向上することがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:27:17 GMT)
Multiple-policy Evaluation via Density Estimation [30.9] 本研究は、ターゲットポリシーのセットとしてKドルを与えられる多重政治評価問題に焦点を当てる。
我々はこの問題に対処するために$mathrmCAESAR$というアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:55:25 GMT)
AVID: Any-Length Video Inpainting with Diffusion Model [30.9] 拡散モデルを用いたAVID(Any-Length Video Inpainting with Diffusion Model)を提案する。
本モデルは,固定長映像の描画に有効な動作モジュールと調整可能な構造ガイダンスを備える。
実験により,映像の持続時間帯の異なる様々なインパインティングタイプを,高品質で頑健に扱うことが可能であることが確認された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:50:38 GMT)
On Size and Hardness Generalization in Unsupervised Learning for the Travelling Salesman Problem [30.7] 旅行セールスマン問題(TSP)における教師なし学習の一般化能力について検討する。
代理損失関数で訓練されたグラフニューラルネットワーク(GNN)を用いて各ノードに埋め込みを生成する。
次に、最終予測を生成するために局所探索を適用する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:47:54 GMT)
Learning the Topology and Behavior of Discrete Dynamical Systems [30.4] ブラックボックスシステムの振る舞いと基盤となるトポロジを学習する問題に焦点をあてる。
一般に、この学習問題は計算的に難解であることが示される。
この結果は、離散力学系の挙動とトポロジーの両方を学ぶための理論的基盤を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:16:16 GMT)
Utilizing Local Hierarchy with Adversarial Training for Hierarchical Text Classification [30.4] 階層的テキスト分類(HTC)は、その複雑な分類学的構造のために難しいサブタスクである。
我々は,ほぼすべてのHTCモデルに適合するHiAdvフレームワークを提案し,それを補助情報としてローカル階層で最適化する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:08:41 GMT)
Sāmayik: A Benchmark and Dataset for English-Sanskrit Translation [30.3] S=amayikは、現代の散文で書かれた53,000の英サンスクリット文からなるデータセットである。
S=amayikは、言語教材、テキスト教育教育、オンラインチュートリアルなど、さまざまな分野からキュレーションされている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:42:53 GMT)
DiJiang: Efficient Large Language Models through Compact Kernelization [30.2] 本稿では、事前学習したバニラ変換器を、トレーニングコストの少ない線形複雑化モデルに変換するための新しい周波数領域カーネル化手法を提案する。
実験により,提案手法は元のTransformerに匹敵する性能を示したが,トレーニングコストを大幅に削減し,推論速度を大幅に高速化した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:32:15 GMT)
LUQ: Long-text Uncertainty Quantification for LLMs [30.0] 大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な能力を示した。
有効性にもかかわらず、これらのモデルは非現実的なコンテンツを生成する傾向にある。
不確実性定量化(UQ)は、モデルが生成したコンテンツに対する信頼度を高める上で重要な要素である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:49:24 GMT)
Finding Nontrivial Minimum Fixed Points in Discrete Dynamical Systems [29.7] 影響を受けるノードの最小数でシステムの非自明な固定点を求めるという新しい最適化問題を定式化する。
この計算難易度に対処するため,この問題を効率的に解決できる特別な事例をいくつか挙げる。
大規模ネットワーク上での問題を解くため,グリーディ選択法とともに汎用的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:18:18 GMT)
Doubly Optimal No-Regret Online Learning in Strongly Monotone Games with Bandit Feedback [29.6] 本研究では,テキストモオと強いモノトーンゲームの研究を行い,その学習方法について検討した。
我々はまず,新しい帯域学習アルゴリズムを構築し,$tildeTheta(nsqrtT)$の単一エージェント最適後悔を実現することを示す。
そこで我々は,このオープンな問題を解決し,広範にわたるバンディットゲーム理論学習に寄与した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:18:14 GMT)
SNE-RoadSegV2: Advancing Heterogeneous Feature Fusion and Fallibility Awareness for Freespace Detection [29.3] 本稿では、全体的注意モジュール、異種特徴コントラスト記述子、親和性重み付き特徴校正器からなる新規な異種特徴融合ブロックを提案する。
スケール内およびスケール内の両方のスキップ接続をデコーダアーキテクチャに組み込むと同時に、冗長な接続を排除し、精度と計算効率を向上させる。
セマンティック・トランジションと深度不整合領域に別々に焦点をあてる2つの誤認認識損失関数を導入し、モデルトレーニングにおけるより深い監督に寄与する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:06:38 GMT)
Talk3D: High-Fidelity Talking Portrait Synthesis via Personalized 3D Generative Prior [29.1] 本研究では,Talk3Dと呼ばれる新しい音声駆動音声ヘッド合成フレームワークを提案する。
予め訓練された3D認識生成前を効果的に活用することにより、そのもっともらしい顔のジオメトリを忠実に再構築することができる。
提案手法は,既存の手法と比較して,極端な頭部ポーズ下であっても,現実的な顔のジオメトリーの生成に優れる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:49:40 GMT)
Distributed Swarm Learning for Edge Internet of Things [28.1] IoT(Internet of Things)の急速な成長により、マシンラーニングタスクのための無線エッジにスマート計算デバイスが広くデプロイされている。
本稿では,Swarmセキュリティ,非制約無線通信,プライバシ問題などのリスクについて検討する。
生物学的インテリジェンスを総合的に組み合わせて、エッジ無線ネットワークにおける大規模IoTの効率的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:05:40 GMT)
On-the-fly Definition Augmentation of LLMs for Biomedical NER [28.0] LLMは、専門用語と訓練データの欠如により、生物医学的なNERタスクに苦慮している。
我々は,関連する概念の定義をオンザフライで組み込んだ知識増強手法を開発した。
注意的なプロンプト戦略はLLMの性能も向上し、微調整された言語モデルを数ショット設定で上回ることができることがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:59:27 GMT)
DiffAvatar: Simulation-Ready Garment Optimization with Differentiable Simulation [27.6] 物理シミュレーションは、人間の現実的な動きを生み出すことができるが、布のシミュレーションには、関連する物理パラメータを持つ高品質な衣服の資産が必要である。
本稿では,身体と衣服の共最適化を行う新しい手法であるPapernameを提案する。
提案手法は,下流の用途に適したリアルな衣服や体型を創出することを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:37:18 GMT)
TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods [27.5] 時系列は、経済、交通、健康、エネルギーといった様々な領域で生成される。
本稿では,時系列予測(TSF)手法の自動ベンチマークであるTFBを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:37:57 GMT)
Context-Aware Integration of Language and Visual References for Natural Language Tracking [27.4] 自然言語仕様(TNL)による追跡は、初期フレームに言語的記述が与えられたビデオシーケンスにおいて、ターゲットを一貫してローカライズすることを目的としている。
本稿では,1)時間的視覚的テンプレートと言語表現の相補性を活用するためのプロンプトモジュールを併用したマルチモーダルトラッキングフレームワークを提案する。
この設計は、歴史的視覚情報と統合されたソリューションを活用することで時間的一貫性を確保し、単一のステップで予測を生成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:58:33 GMT)
FairRAG: Fair Human Generation via Fair Retrieval Augmentation [27.1] 本稿では,Fair Retrieval Augmented Generation (FairRAG)について紹介する。FairRAGは,外部画像データベースから取得した参照画像に事前学習した生成モデルを条件付けし,人間の生成における公平性を改善するためのフレームワークである。
公平性を高めるために、FairRAGは単純なyet- Effective debiasing戦略を適用し、生成過程において多様な人口集団の画像を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:56:19 GMT)
An Efficient Approach for Studying Cross-Lingual Transfer in Multilingual Language Models [26.7] 本稿では,他の対象言語に対するゼロショット性能における転送言語の影響を研究するためのテキスト効率の手法を提案する。
以上の結果から,一部の言語,特に事前学習中に見つからない言語は,異なる対象言語に対して極めて有益あるいは有害である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:52:18 GMT)
Genetic Quantization-Aware Approximation for Non-Linear Operations in Transformers [26.6] 非線型関数はトランスフォーマーとその軽量な変種で広く使われており、ハードウェアコストは大幅に過小評価されている。
従来の最先端の作業では、これらの操作を1次線形近似により最適化し、パラメータをルックアップテーブル(LUT)に格納する。
本稿では,量子化認識を用いたパラメータの自動決定が可能な遺伝的LUT近似アルゴリズムGQA-LUTを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:13:11 GMT)
VGTS: Visually Guided Text Spotting for Novel Categories in Historical Manuscripts [26.1] 本稿では,1つの注釈付きサポートサンプルを用いて,新しい文字を正確に検出するビジュアルガイドテキストスポッティング(VGTS)手法を提案する。
DSAブロックは、人間の視覚的スポッティングプロセスを模倣して、サポート画像とクエリ画像における識別的空間領域を特定し、焦点を合わせ、学習することを目的としている。
低リソーススポッティングタスクにおける例不均衡問題に対処するため,距離メトリック学習のための埋め込み空間の識別力を高める新しいトーラス損失関数を開発した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:32:53 GMT)
DyBluRF: Dynamic Deblurring Neural Radiance Fields for Blurry Monocular Video [26.0] そこで我々は,DyBluRFと呼ばれる,ぼやけたビデオモノクロビデオのための動的デブロアリングフレームワークを提案する。
我々のDyBluRFは、新しい2段階のフレームワークで、ぼやけたモノクロビデオのための新しいビュー合成を処理する最初のものです。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:57:33 GMT)
ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language Models [25.7] 本稿では,現実的な会議支援シナリオに基づく長期コンテキストモデルのための新しいベンチマークを提案する。
ELITR-Benchという名前のベンチマークでは、既存のERLITRコーパスの書き起こしを271の手作業による質問と、その真真正な回答で強化しています。
以上の結果から,GPT-4の評価スコアは人間の判断値と相関するが,3つ以上の評価値と区別できる能力は限定的である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:13:31 GMT)
Training Data Influence Analysis and Estimation: A Survey [25.5] トレーニングデータの影響分析と推定に関する総合的な調査を初めて実施する。
我々は、最先端の影響分析手法を分類学に編成する。
本研究では,影響分析をより効果的に活用するための今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:33:29 GMT)
Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models [25.1] 9つの視覚・言語(VL)タスクを導入し、4つの言語(英語、日本語、スワヒリ語、ウルドゥー語)で多言語視覚テキストデータセットを構築した。
我々の研究はスワヒリ語とウルドゥー語でこのような分析を行った最初のものである。また、VL分析におけるテクストレーションを導入し、評価において重要な役割を担った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:53:07 GMT)
Modeling Weather Uncertainty for Multi-weather Co-Presence Estimation [25.1] 既存のアルゴリズムでは、気象条件を個別の状態としてモデル化し、マルチラベル分類を用いて推定する。
マルチウェザー条件の物理的定式化を考慮し,物理パラメータが画像の外観から学習に与える影響をモデル化する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:05:29 GMT)
Tiny Machine Learning: Progress and Futures [24.8] Tiny Machine Learning (TinyML)は、機械学習の新しいフロンティアである。
TinyMLはハードウェアの制約のために難しい。
まず、TinyMLの定義、課題、応用について論じる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:33:39 GMT)
Towards 3D Vision with Low-Cost Single-Photon Cameras [24.7] 小型で省エネで低コストな単光子カメラによる計測に基づいて,任意のランベルト物体の3次元形状を再構成する手法を提案する。
我々の研究は、画像ベースモデリングとアクティブレンジスキャンの関連性を引き合いに出し、単光子カメラによる3Dビジョンに向けた一歩である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:45:35 GMT)
Incorporating Geo-Diverse Knowledge into Prompting for Increased Geographical Robustness in Object Recognition [24.7] 地理に基づくオブジェクト知識のための大規模言語モデルを提案することの実現可能性について検討する。
我々は,地理的知識の正規化を提案し,ソースセットで訓練されたソフトプロンプトが未知のターゲットセットに一般化されることを保証する。
DollarStreetのベースラインの推進による精度の向上は、アフリカ/アジア/アメリカからのターゲットデータで+2.8/1.2/1.6、最も厳しいクラスでは+4.6である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:52:59 GMT)
Measuring Taiwanese Mandarin Language Understanding [24.6] 大規模言語モデル(LLM)における高度な知識と推論能力を評価するための総合評価スーツであるTMLUを提案する。
TMLUは、社会科学、STEM、人文科学、台湾固有のコンテンツなど、中学から専門レベルまで、37の被験者からなる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:56:21 GMT)
CAESAR: Enhancing Federated RL in Heterogeneous MDPs through Convergence-Aware Sampling with Screening [24.2] 既存のFedRLメソッドは、一般的に、エージェントのパフォーマンスを改善するために、それらの値関数を平均化することで、エージェントの学習を集約する。
我々は,多様なMDPを対象とした個別エージェントの学習を促進するために,CAESAR(Convergence-AwarE SAmpling with screening)アグリゲーションスキームを導入する。
エージェントの学習効率を高めるためのCAESARの有効性を実証的に検証した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:05:59 GMT)
HO-Gaussian: Hybrid Optimization of 3D Gaussian Splatting for Urban Scenes [24.2] 本稿では,グリッドベースボリュームと3DGSパイプラインを組み合わせたHO-Gaussianというハイブリッド最適化手法を提案する。
広範に使用されている自律走行データセットの結果から,HO-Gaussianはマルチカメラ都市データセット上でリアルタイムに写真リアリスティックレンダリングを実現することが示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:58:21 GMT)
Strong Transferable Adversarial Attacks via Ensembled Asymptotically Normal Distribution Learning [24.1] 多重漸近正規分布攻撃(MultiANDA)という手法を提案する。
我々は勾配上昇(SGA)の正規性を利用して摂動の後方分布を近似する。
提案手法は、防御の有無にかかわらず、ディープラーニングモデルに対する10の最先端のブラックボックス攻撃より優れる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:46:46 GMT)
Improving Learnt Local MAPF Policies with Heuristic Search [24.1] MAPF (Multi-Adnt Path Finding) は、エージェントのチームが目標地点に到達するための衝突のない経路を見つける問題である。
MAPFに対する現在の機械学習アプローチでは、このポテンシャルの表面を掻き傷始めた手法が提案されている。
我々は,学習ポリシーを用いた検索のモデルに依存しないいくつかの方法を示し,政策の成功率とスケーラビリティを著しく向上させる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:16:20 GMT)
PLGSLAM: Progressive Neural Scene Represenation with Local to Global Bundle Adjustment [24.1] PLGSLAMは、高忠実な表面再構成とロバストなカメラトラッキングをリアルタイムで実現可能な、ニューラルビジュアルSLAMシステムである。
PLGSLAMは,様々なデータセットやシナリオにまたがって,最先端のシーン再構築結果を達成し,性能の追跡を行う。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:25:36 GMT)
A Unified Framework for Human-centric Point Cloud Video Understanding [23.9] 人間中心のポイントクラウドビデオ理解(PVU)は、人間のポイントクラウドのシーケンスから人間に関連する特徴を抽出し、解釈することに焦点を当てた新興分野である。
本稿では,従来の知識を十分に活用する統一的なフレームワークを提案し,汎用的人間中心のクラウドビデオ理解のためのデータ自体の本質的特徴を探求する。
本手法は,動作認識や3次元ポーズ推定など,多種多様なヒューマンタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:53:06 GMT)
NeSLAM: Neural Implicit Mapping and Self-Supervised Feature Tracking With Depth Completion and Denoising [23.9] 我々は,高精度で密度の高い深度推定,ロバストなカメラトラッキング,新しいビューの現実的な合成を実現するフレームワークNeSLAMを提案する。
各種屋内データセットを用いた実験は、再構築、品質追跡、新しいビュー合成におけるシステムの有効性と精度を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:59:37 GMT)
Embracing Unknown Step by Step: Towards Reliable Sparse Training in Real World [23.8] スパーストレーニングは、現実世界のアプリケーションにおいて、リソース効率の高いディープニューラルネットワーク(DNN)の有望な方法として登場した。
しかし、スパースモデルの信頼性は、特に未知のアウト・オブ・ディストリビューション(OOD)データを検出する上で重要な問題である。
本研究は,OODの観点からスパーストレーニングの信頼性を検討することにより,知識ギャップに対処する。
本稿では,損失修正,自動チューニング,投票方式を取り入れた未知のスパース学習手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:33:05 GMT)
Dr.Hair: Reconstructing Scalp-Connected Hair Strands without Pre-training via Differentiable Rendering of Line Segments [23.7] 映画やゲーム業界では、現実的な髪型を達成するには、頭皮由来の鎖を使うのが一般的である。
本研究では,事前学習の必要性を解消する最適化手法を提案する。
提案手法は,既存の手法の精度を越え,処理速度を大幅に向上させるとともに,堅牢かつ高精度な逆レンダリングを実現する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:38:21 GMT)
Learning to Count without Annotations [23.5] 我々は、手動のアノテーションを必要とせずに、このタスクを学習できるモデルUnCounTRを提案する。
任意の種類のオブジェクトと数をカバーするリッチな学習信号を提供する訓練用サンプルとして,様々なペーストされたオブジェクトを用いた「自己相関」画像を構築した。
提案手法は既存の教師なし表現とセグメンテーション技術に基づいて,手動の監督なしに参照ベースのカウント機能を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:38:00 GMT)
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.4] 本研究では,SAR自動目標認識(ATR)のための効果的な自己監視学習(SSL)手法について検討する。
SSLはデータから直接監視信号を構築することを目的としている。
本稿では,SAR ATR (SAR-JEPA) のための新しい統合埋め込み予測アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:18:37 GMT)
Emotion-Anchored Contrastive Learning Framework for Emotion Recognition in Conversation [23.3] 会話における感情認識(英: Emotion Recognition in Conversation、ERC)とは、会話の中で各発話の背後にある感情を検出することである。
類似した感情に対してより識別可能な発話表現を生成できる感情認識コントラスト学習フレームワークを提案する。
提案したEACLは、最先端の感情認識性能を達成し、類似した感情に対して優れた性能を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:00:55 GMT)
Efficient Data-Free Model Stealing with Label Diversity [22.9] マシンラーニング・アズ・ア・サービス(ML)は、ユーザがAPI形式で機械学習モデルに問い合わせることを可能にし、価値あるデータに基づいてトレーニングされた高性能モデルによるメリットを享受する機会を提供する。
このインターフェースは機械学習ベースのアプリケーションの増殖を促進する一方で、モデル盗難攻撃のための攻撃面を導入している。
既存のモデル盗難攻撃は、有効性を保ちながら、攻撃想定をデータフリー設定に緩和した。
本稿では,多様性の観点からモデルを盗む問題を再考し,生成したデータサンプルをすべてのクラスに多様性を持たせることが重要なポイントであることを実証する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:52:33 GMT)
Selective Attention-based Modulation for Continual Learning [22.8] 本稿では,生物学的に評価可能な注意誘導変調手法を提案し,連続的な学習環境における分類モデルを強化する。
我々は,非I.D.分類タスクのシーケンスの学習を駆動し,安定化させる変調信号として,補助塩分率予測機能を用いる。
注意に基づく変調は、刺激的な特徴の存在に対してより堅牢な特徴の学習を成功させることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:46:14 GMT)
An Information-Theoretic Framework for Out-of-Distribution Generalization [22.6] 機械学習におけるアウト・オブ・ディストリビューションの一般化について検討し、情報理論の一般化境界を提供する汎用フレームワークを提案する。
本フレームワークは,IPM(Integrated Probability Metric)と$f$-divergence($f$-divergence)を自由に補間する。
我々は,この枠組みが最適輸送解釈を許容していることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:29:57 GMT)
ADAPT^2: Adapting Pre-Trained Sensing Models to End-Users via Self-Supervision Replay [22.6] 自己教師付き学習は、事前学習モデルに大量のラベルのないデータを活用する方法として登場した。
自己教師型モデルがヘテロジニアス領域で微調整された場合に発生する性能劣化について検討する。
本稿では,自己教師付きモデルをパーソナライズするためのドメイン適応フレームワークADAPT2を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:48:07 GMT)
SceneTracker: Long-term Scene Flow Estimation Network [22.1] SceneTrackerは学習に基づく新しいLSFEネットワークであり、最適軌道を近似するために反復的なアプローチを採用する。
SceneTrackerは、LSFEタスクのニーズに合わせて高度に調整された3次元空間閉塞と奥行きノイズ干渉を扱う優れた能力を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:22:54 GMT)
Can LLMs Correct Physicians, Yet? Investigating Effective Interaction Methods in the Medical Domain [22.0] LLM(Large Language Models)は、医学的意思決定タスクにおいて医師を支援し、修正することができる。
我々は,メディトロン,Llama2,MistralなどいくつかのLSMを評価し,これらのモデルが様々なシナリオで医師と効果的に相互作用する能力について分析した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:59:13 GMT)
Long-form evaluation of model editing [21.6] 本稿では,モデル編集の有効性と効果を評価する新しい評価プロトコルであるLEME(Long-form Evaluation of Model Editor)について紹介する。
いくつかの手法(ROMEとMEMIT)は、限られた範囲内で一貫した編集を行うのによく機能するが、他の方法よりも現実的なドリフトに悩まされている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:17:23 GMT)
SeaBird: Segmentation in Bird's View with Dice Loss Improves Monocular 3D Detection of Large Objects [21.5] 障害の原因は, 大きな物体の騒音に対する深さ回帰損失の感度である。
数学的には、ダイス損失が大きな物体に対して優れたノイズ・ロバスト性およびモデル収束をもたらすことを証明している。
大規模オブジェクトへの一般化に向けた第一歩として,SeaBirdを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:41:57 GMT)
Uncovering Misattributed Suicide Causes through Annotation Inconsistency Detection in Death Investigation Notes [21.4] NVDRS(National Violent Death Reporting System)のデータは、死のパターンや原因を発見するために広く利用されている。
最近の研究では、NVDRS内のアノテーションの不整合と誤った自殺原因の帰属に対する潜在的影響が示唆されている。
本稿では,アノテーションの不整合を検知し,問題のあるインスタンスを識別するクロスバリデーションのようなパラダイムを採用する,経験的自然言語処理(NLP)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:21:02 GMT)
FedAC: An Adaptive Clustered Federated Learning Framework for Heterogeneous Data [21.3] クラスタ化フェデレーション学習(CFL)は、データ不均一性から生じる性能劣化を軽減するために提案される。
我々は,グローバル知識をクラスタ内学習に効率的に統合する適応型CFLフレームワークFedACを提案する。
実験の結果、FedACは試験精度が1.82%、12.67%向上した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:46:16 GMT)
Benchmarking the Robustness of Temporal Action Detection Models Against Temporal Corruptions [21.0] 時間的行動検出(TAD)は、アクションの位置を特定し、長期的な未トリミングビデオでアクションカテゴリを認識することを目的としている。
ビデオ内の時間情報は、フレームの欠落やぼやけなど、時々破損する可能性がある。
本稿では,7種類のTAD手法のロバスト性を網羅的に分析し,いくつかの興味深い知見を得た。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:01:00 GMT)
Accelerating Search-Based Planning for Multi-Robot Manipulation by Leveraging Online-Generated Experiences [20.9] MAPF(Multi-Agent Path-Finding)アルゴリズムは、離散的な2Dドメインで保証され、厳密な保証を提供する。
本稿では,その反復的かつ漸進的な性質を活用して,競合に基づく探索アルゴリズムを高速化する手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:31:07 GMT)
FairCLIP: Harnessing Fairness in Vision-Language Learning [20.7] 本研究は,広範に使用されている医療ビジョン(VL)モデル(CLIPとBLIP2)を,自然領域と医療領域の両方で事前訓練した2種類のフェアネス分析を行った。
その結果,アジア,男性,非ヒスパニック,スペインが好まれるVLモデルにおいて,有意なバイアスが認められた。
最初の公正なビジョン言語医療データセットとして、FairVLMedは、開発機械学習モデルの進歩の可能性を秘めている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:15:31 GMT)
FSMR: A Feature Swapping Multi-modal Reasoning Approach with Joint Textual and Visual Clues [20.6] Feature Swapping Multi-modal Reasoning (FSMR) モデルは、機能スワップによるマルチモーダル推論を強化するように設計されている。
FSMRにはマルチモーダル・クロスアテンション機構が組み込まれており、テキスト情報と視覚情報の共同モデリングを容易にする。
PMRデータセットの実験は、FSMRが最先端のベースラインモデルよりも優れていることを示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:28:50 GMT)
Formal Verification of Robustness and Resilience of Learning-Enabled State Estimation Systems [20.5] 我々は,ロボット工学の分野で広く利用されている学習可能な状態推定システム(LE-SESs)に注目した。
LE-SESを形式的検証の観点から検討し,システムモデルの満足度を決定する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:41:08 GMT)
Improving Implicit Regularization of SGD with Preconditioning for Least Square Problems [20.0] 最小二乗問題に対する事前条件付き勾配降下(SGD)の一般化性能について検討した。
提案したプレコンディショニング行列は有限標本からのロバストな推定が可能なほど単純であることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:15:47 GMT)
SCINeRF: Neural Radiance Fields from a Snapshot Compressive Image [19.6] Snapshot Compressive Imaging (SCI) 技術は、1つの時間圧縮画像から基礎となる3次元シーン表現を復元する。
神経放射場(NeRF)の訓練の一環としてSCIの物理的イメージング過程を定式化する。
提案手法は、画像再構成と新しいビュー画像合成の観点から、最先端の手法を超越した手法である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:14:14 GMT)
Disentangling Racial Phenotypes: Fine-Grained Control of Race-related Facial Phenotype Characteristics [19.1] 顔画像の個々の人種関連表現型属性のきめ細かい制御を可能にする新しいGANフレームワークを提案する。
従来の作業とは異なり、我々のフレームワークは2D画像と関連するパラメータにのみ依存し、レース関連表現型属性に対する最先端の個別制御を実現する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:36:38 GMT)
PET-SQL: A Prompt-enhanced Two-stage Text-to-SQL Framework with Cross-consistency [19.1] スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:21:01 GMT)
U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation [18.8] 最先端のパーソナライズモデルでは、被写体全体をオーバーフィットさせる傾向があり、画素空間における視覚的特徴を乱すことはできない。
ユーザ固有の視覚属性を学習するために,ターゲット関連および非ターゲットサンプルを生成するために,新たなデカップリング自己拡張戦略を提案する。
SOTAパーソナライズ手法による様々な視覚特性の実験は、新規な文脈における対象の視覚的外観を模倣する手法の能力を示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:20:34 GMT)
Structure Matters: Tackling the Semantic Discrepancy in Diffusion Models for Image Inpainting [18.8] 画像塗布用拡散確率モデルのデノイングは、前処理中に画像のテクスチャにノイズを加えることを目的としており、逆デノイング処理により、テクスチャの未加工領域でマスク領域を復元することを目的としている。
意味のある意味論の生成にもかかわらず、既存の芸術は、意味的に密集した未成熟のテクスチャが完全に劣化せず、仮面の領域は拡散過程において純粋なノイズに変化し、それらの大きな違いをもたらすため、仮面と未成熟の領域間の意味的な相違に悩まされる。
従来のテクスチャ・デノナイズ法を改良したStrDiffusionという構造誘導拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:40:12 GMT)
Two-sample Test using Projected Wasserstein Distance [18.5] 統計学と機械学習の基本的な問題である2サンプルテストのための予測されたワッサースタイン距離を開発する。
重要な貢献は、投影された確率分布の間のワッサーシュタイン距離を最大化する低次元線型写像を見つけるために最適射影を結合することである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:40:04 GMT)
DialogCC: An Automated Pipeline for Creating High-Quality Multi-Modal Dialogue Dataset [18.4] 本稿では,マルチモーダル対話データセットを構築するための自動パイプラインを提案する。
我々のパイプラインでは、画像と対話のコヒーレンスを保証するため、GPT-4に潜在的な画像共有モーメントを推測するよう促す。
このパイプラインを通じて、高品質で多様な多モード対話データセットであるDialogCCを紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:27:47 GMT)
Heterogeneous Network Based Contrastive Learning Method for PolSAR Land Cover Classification [18.4] SL(Supervised Learning)は、高性能を実現するために大量のラベル付きPolSARデータを必要とする。
本稿では,異種ネットワークに基づくコントラスト学習法(HCLNet)を提案する。
ラベルなしのPolSARデータから高レベルな表現を学習し、マルチ機能やスーパーピクセルに応じて数ショットの分類を行う。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:05:23 GMT)
Lens: A Foundation Model for Network Traffic in Cybersecurity [18.4] Lensは、T5アーキテクチャを活用して、大規模な未ラベルデータから事前訓練された表現を学習するネットワークトラフィックの基礎モデルである。
Masked Span Prediction(MSP)、Packet Order Prediction(POP)、Homologous Traffic Prediction(HTP)の3つの異なるタスクを組み合わせた新しい損失を設計する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:01:11 GMT)
StegoGAN: Leveraging Steganography for Non-Bijective Image-to-Image Translation [18.2] CycleGANベースの手法は、生成した画像のミスマッチした情報を隠して、サイクル一貫性の目的をバイパスすることが知られている。
本稿では,ステガノグラフィーを利用した新しいモデルであるStegoGANを紹介した。
我々のアプローチは、追加の後処理や監督を必要とすることなく、翻訳画像のセマンティック一貫性を高める。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:23:58 GMT)
LoCoNet: Long-Short Context Network for Active Speaker Detection [18.1] Active Speaker Detection (ASD) は、ビデオの各フレームで誰が話しているかを特定することを目的としている。
簡単な長短コンテキストネットワークであるLoCoNetを提案する。
LoCoNetは、複数のデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:29:03 GMT)
Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science [17.9] この研究は、これらの予測タスクにLarge Language Models (LLM)を適用する試みである。
本研究の目的は,Llama-2 の大規模学習を行う上で,注釈付きテーブルの包括的コーパスをコンパイルすることで,このギャップを緩和することにある。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:41:21 GMT)
QestOptPOVM: An iterative algorithm to find optimal measurements for quantum parameter estimation [17.3] 最適正の演算子検定(POVM)を直接同定するアルゴリズム「QestPOVM」を導入する。
量子状態の複数コピー(最大6コピー)の厳密な試行を通じて,提案アルゴリズムの有効性と精度を実証した。
提案アルゴリズムは,最適なPOVMの明示的な形式を解明するためのツールとして機能し,量子パラメータ推定手法の理解を深める。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:46:09 GMT)
DialogBench: Evaluating LLMs as Human-like Dialogue Systems [17.0] 大規模言語モデル(LLM)は、命令チューニングを活用することで、新しい対話機能において画期的なブレークスルーを達成している。
本稿では,12の対話タスクを含む対話評価ベンチマークであるDialogBenchを提案する。
インストラクションチューニングはLLMの人間的類似性をある程度改善するが、ほとんどのLLMは人間的な対話システムとして改善の余地が十分にある。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:35:30 GMT)
Identifying Linear Relational Concepts in Large Language Models [16.9] トランスフォーマー言語モデル(LM)は、隠れたアクティベーションの潜在空間における方向として概念を表現することが示されている。
本稿では,リレーショナル・リレーショナル・コンセプト (LRC) と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:14:30 GMT)
A Multi-Aspect Framework for Counter Narrative Evaluation using Large Language Models [16.9] カウンター物語は、憎しみに満ちた主張を否定し、遭遇をエスカレートするように設計されたヘイトスピーチの文脈に反応する。
従来の対物的評価のための自動メトリクスは、人間の判断と一致していない。
そこで本稿では,LLMが生成した対物的候補に対して,スコアとフィードバックを提供するための新たな評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:01:38 GMT)
A multi-stage semi-supervised learning for ankle fracture classification on CT images [16.8] 足関節の関節小臼歯部領域に対して, 遠位骨と遠位骨の分節ネットワークが提案されている。
半教師付き分類器は、多数のラベルのないデータをフル活用して足首骨折を分類するために構成される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:35:04 GMT)
Beyond the Known: Novel Class Discovery for Open-world Graph Learning [16.3] 我々は,グラフ上の新しいクラス発見に取り組むために,オープンワールドのgRAph neuraLネットワーク(ORAL)を提案する。
ORALは、半教師付きプロトタイプ学習により、クラス間の相関を初めて検出する。
ラベル欠陥を緩和するためのマルチスケールグラフ機能を完全に探索するため、ORALは擬似ラベルを生成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:25:05 GMT)
Enhance Reasoning for Large Language Models in the Game Werewolf [15.7] 本稿では,Large Language Models(LLM)を外部のThinkerモジュールと統合する革新的なフレームワークを提案する。
本フレームワークは,マルチシステム推論を必要とする9人プレイヤのWerewolfゲームを用いて提案する。
実験では, 帰納的推論, 音声生成, オンラインゲーム評価におけるフレームワークの有効性を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:01:56 GMT)
Non-Abelian braiding of Fibonacci anyons with a superconducting processor [15.7] フィボナッチ弦網モデルの非アベリア位相秩序状態の実現について報告する。
普遍計算パワーを特徴とするフィボナッチのブレイディングを実演する。
その結果,エキゾチックな非アベリア位相状態の探索に多目的なディジタル手法が確立された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:00:01 GMT)
Visual Spatial Attention and Proprioceptive Data-Driven Reinforcement Learning for Robust Peg-in-Hole Task Under Variable Conditions [15.6] アンカーボルト挿入(アンカーボルト挿入、Anchor-bolt insert)は、コンクリート中の穴の建設現場で行われるペグ・イン・ホールの作業である。
この作業を自動化する努力は行われているが、様々な照明と穴面条件が自動化を困難にしている。
本研究では,この課題に対して,照明条件や穴面条件に頑健な視覚とプロプリセプティブなデータ駆動型ロボット制御モデルを導入する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:04:02 GMT)
Gradient strikes back: How filtering out high frequencies improves explanations [15.3] ホワイトボックス」の帰属法は、高周波ノイズによってしばしば汚染される勾配信号に依存している。
我々は「FORGrad」と呼ばれる新しいアプローチを導入する。
本手法は,各モデルアーキテクチャの固有特性に合わせて最適なカットオフ周波数を用いて,ノイズアーティファクトを効果的にフィルタリングする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:04:03 GMT)
A Parallel Attention Network for Cattle Face Recognition [15.3] 乳牛の顔の認識は、動物愛護や行動研究のような領域において最も重要である。
野生環境のための最初の大規模な牛の顔認識データセット ICRWE を作成しました。
483頭の牛と9,816頭の高解像度画像サンプルを含んでいる。
各モジュールには2つの並列位置注意モジュール (PAM) と特徴マッピングモジュール (FMM) が組み込まれている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:23:34 GMT)
Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs [15.3] 大規模言語モデル(LLM)は、インテリジェントアシスタント、テキスト要約、翻訳、携帯電話でのマルチモダリティといったタスクに広く使われている。
デバイスGPU上でのLLMの高効率展開を容易にするため,我々は4つの最適化手法を提案する。
モバイル推論エンジンであるTransformer-LiteはQualcommおよびMTKプロセッサと互換性がある。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:26:53 GMT)
Biologically-Plausible Topology Improved Spiking Actor Network for Efficient Deep Reinforcement Learning [15.1] 近年の神経科学の進歩により、ヒトの脳は報酬に基づく効果的な学習を達成していることが明らかになった。
Deep Reinforcement Learning (DRL)の成功は主に、関数近似器としてArtificial Neural Networks (ANN)を活用することによる。
そこで我々は,機能近似の新たな代替手法として,生物学的に証明可能なトポロジー改良スパイキング・アクター・ネットワーク(BPT-SAN)を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:25:19 GMT)
LifelongMemory: Leveraging LLMs for Answering Queries in Long-form Egocentric Videos [15.1] LifelongMemoryは、自然言語による質問応答と検索を通じて、長い形式のエゴシックなビデオメモリにアクセスするための新しいフレームワークである。
Ego4D の自然言語クエリ (NLQ) の課題に対して,本手法は質問応答のためのベンチマークの最先端性能を実現し,高い競争力を発揮する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:44:05 GMT)
Rectifying Demonstration Shortcut in In-Context Learning [15.1] 大規模言語モデル(LLM)は、ICL(In-context Learning)能力を利用したいくつかのデモで、様々なタスクを解くことができる。
LLMは、ICL予測を進めるために、インプット-ラベル関係よりも、事前に訓練されたデモのセマンティック先行に頼っていることが多い。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:51:11 GMT)
SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models [14.9] 大規模言語モデル(LLM)は優れた性能を示すが、計算とメモリ集約性がある。
SmoothQuant, トレーニング不要, 精度保存, 汎用的なポストトレーニング量子化ソリューションを提案する。
最大1.56倍の高速化と2倍のメモリ削減を実現した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:21:58 GMT)
BAMM: Bidirectional Autoregressive Motion Model [14.7] 本稿では,双方向自動回帰運動モデル(BAMM)を提案する。
BAMMは,(1)3次元の人間の動きを潜在空間の離散トークンに変換するモーション・トークンライザ,(2)ランダムにマスクされたトークンを自動予測するマスキング・セルフアテンション・トランスフォーマーの2つの重要な構成要素から構成される。
HumanML3DとKIT-MLデータセットに関する実験は、BAMMが定性的および定量的な測定において現在の最先端の手法を上回ることを示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:15:04 GMT)
PURPLE: Making a Large Language Model a Better SQL Writer [14.6] NL2タスクに必要な論理演算子構成を含む実演を検索することで精度を向上させるPURPLEを提案する。
PURPLEは、一般的なNL2ベンチマークの検証セット上で80.5%の正確な一致精度と87.8%の実行一致精度という、最先端の新たなパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:01:29 GMT)
Budget-aware Query Tuning: An AutoML Perspective [14.6] 現代のデータベースシステムは、入力クエリの優れた実行計画を作成するために、コストベースのクエリに依存している。
コストユニットの値を変えることで、デフォルトのクエリプランを大幅に上回るクエリプランを得ることができることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:19:36 GMT)
A Peg-in-hole Task Strategy for Holes in Concrete [13.9] 提案手法は, コンクリートの高摩擦係数の負の影響を回避するため, 壁面からペグをわずかに除去する。
強化学習を通じてトレーニングされたディープニューラルネットワーク(DNN)を使用して、形状や表面仕上げの異なる穴を効果的に見つける。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:00:54 GMT)
SPOT: Self-Training with Patch-Order Permutation for Object-Centric Learning with Autoregressive Transformers [13.2] 教師なしのオブジェクト中心学習は、シーンを解釈可能なオブジェクトエンティティ(スロット)に分解することを目的としている。
Slotベースのオートエンコーダは、このタスクの顕著な方法である。
本研究は,デコーダからエンコーダに優れたスロットベースのアテンションマスクを蒸留する2つの新しい手法を紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:30:20 GMT)
Descriptor and Word Soups: Overcoming the Parameter Efficiency Accuracy Tradeoff for Out-of-Distribution Few-shot Learning [13.1] 記述子(descriptor)と単語スープ( word soups)という,より柔軟な方法を提案する。
Descriptor soupは、ジェネリックな数ショットのトレーニングデータを使用して、テキスト記述子の小さなセットを優しく選択する。
単語のスープは、似たような方法で単語の連鎖を優雅に組み立てる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:55:48 GMT)
Systematic comparison of semi-supervised and self-supervised learning for medical image classification [13.0] 典型的な医用画像分類問題では、ラベル付きデータが不足し、ラベルなしデータが利用できない。
両方の方向からの最近の手法は、従来のベンチマークで顕著な上昇を報告している。
本研究は,4つの医療データセット上でのラベル付きセットのみのベースラインに対して,13の代表的な半指導的手法と自己指導的手法を比較した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:19:36 GMT)
Towards a Framework for Evaluating Explanations in Automated Fact Verification [12.9] NLPの深いニューラルモデルがより複雑になるにつれて、それらを解釈する必要性はさらに高くなる。
急激な関心は、予測の簡潔で一貫性のある正当化を提供するための合理的な説明に現れている。
我々は,それらの評価を体系的に支援するための説明の合理化について,重要な概念と特性に関する公式な枠組みを提唱する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:50:28 GMT)
Temporal Difference Learning for High-Dimensional PIDEs with Jumps [12.7] 我々は,一連のLeviプロセスを導入し,それに対応する強化学習モデルを構築した。
プロセス全体をシミュレートするために、方程式の解と非局所項を表現するためにディープニューラルネットワークを使用します。
この手法の相対誤差は100次元実験でO(10-3)、一次元純粋ジャンプ問題でO(10-4)に達する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:55:22 GMT)
Real-time Lane-wise Traffic Monitoring in Optimal ROIs [12.5] 米国では、何千ものパン、ティルト、Zoom(PTZ)の交通カメラが高速道路の状態を監視しています。
本稿では,これらのカメラからハイウェイレーンの位置と交通方向を自動で学習する新しいシステムを提案する。
リアルタイムで車線固有のトラフィックデータを継続的に収集し、カメラの角度やズームの変化も調整する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:08:26 GMT)
Are LLMs Effective Backbones for Fine-tuning? An Experimental Investigation of Supervised LLMs on Chinese Short Text Matching [12.2] 中国語短文マッチング作業のための微調整LDMによる実験的検討を行った。
タスクモデリング手法,プロンプト形式,出力形式など,微調整LDMの性能に影響を及ぼす諸要因について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:36:54 GMT)
DerainNeRF: 3D Scene Estimation with Adhesive Waterdrop Removal [12.1] 水滴により劣化した多視点画像から透明な3Dシーンを暗黙的に再構築する手法を提案する。
本手法は,水滴の位置を予測するためにアテンションネットワークを利用して,暗黙的に3Dシーンを復元するニューラルレージアンスフィールドを訓練する。
NeRFの強いシーン表現機能を活用することで,水滴を除去した高品質なノベルビュー画像をレンダリングすることができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:58:57 GMT)
Towards Human-Centered Construction Robotics: An RL-Driven Companion Robot For Contextually Assisting Carpentry Workers [11.8] 本稿では,既存の作業における作業者の支援を目的とした「作業支援ローバー」による人間中心型アプローチを提案する。
我々は,ロボットシステムを大工のフォームワークに導入するための詳細な研究を行い,移動性,安全性,快適な作業ロボットのコラボレーションを重視したプロトタイプを紹介した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:25:03 GMT)
Towards a Robust Retrieval-Based Summarization System [11.7] 本稿では,大規模言語モデル(LLM)のRAGに基づく要約タスクに対する堅牢性について検討する。
最初のコントリビューションはLogicSummで、現実的なシナリオを取り入れた革新的な評価フレームワークです。
LogiSummによって特定された制限に基づいて、トレーニング対話を作成し、堅牢性を高めるためのモデルを微調整する包括的システム SummRAG を開発した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:14:46 GMT)
NLP for Counterspeech against Hate: A Survey and How-To Guide [11.7] 本稿では, 対訳研究のガイドとして, 具体例を詳述し, 実施すべきステップについて述べる。
NLPにおける対音声研究の課題と今後の方向性について論じる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:32:44 GMT)
Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.6] 本稿では,視覚的マンバベースUNetアーキテクチャを従来のUNetと統合したセミマンバUNetを,半教師付き学習(SSL)フレームワークに導入する。
一般に公開されているMRI心筋セグメンテーションデータセットの総合的評価は,Semi-Mamba-UNetの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:47:50 GMT)
GPTA: Generative Prompt Tuning Assistant for Synergistic Downstream Neural Network Enhancement with LLMs [11.6] 本研究はGPTA(Large Language Model assistance training framework)を導入し,プレフィックスプロンプトによる下流タスクモデルのトレーニングを強化する。
LLMのデータ露出を最小限にすることで、下流タスクモデルトレーニングにLLMを適用する際のセキュリティと法的課題に対処する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:04:04 GMT)
Coverage-Guaranteed Prediction Sets for Out-of-Distribution Data [11.4] 分割予測(SCP)は、信頼セット予測問題を扱うための効率的なフレームワークである。
SCPを自明に適用すると、未知のターゲットドメインがソースドメインと異なる場合、限界範囲のカバレッジを維持することができないことが示される。
我々は,OOD設定に自信ある予測セットを形成する手法を開発し,提案手法の有効性を理論的に証明する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:16:29 GMT)
Online Convex Optimization with Unbounded Memory [10.3] OCOフレームワークの一般化である"Online Convex Optimization with Unbounded Memory"を導入する。
ポリシーの後悔に対して$O(sqrtH_p T)$上界とマッチング(Worst-case)下界を証明します。
我々は、このフレームワークの広範な適用性を、後悔境界の導出に利用し、既存の後悔境界の導出を改善し、単純化することで実証する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:25:28 GMT)
Does Faithfulness Conflict with Plausibility? An Empirical Study in Explainable AI across NLP Tasks [10.0] 私たちは、Shapleyの価値とLIMEがより忠実で妥当性が高いことを示す。
この結果から,一方の次元を一方の次元に最適化するのではなく,2つの目的を持つ説明可能性アルゴリズムを最適化する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:28:42 GMT)
Evaluating Text-to-Image Synthesis: Survey and Taxonomy of Image Quality Metrics [9.8] 本稿では,既存のテキスト・画像評価指標について概観する。
これらの指標を分類するための新しい分類法を提案する。
我々は,テキスト・ツー・イメージ評価を行う実践者のためのガイドラインを導出し,評価メカニズムのオープンな課題と,現在の指標の限界について論じる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:27:23 GMT)
CustomListener: Text-guided Responsive Interaction for User-friendly Listening Head Generation [9.7] 話者とリスナーの動的変換の相関をモデル化することにより,非言語対応型リスナーヘッドを合成することを目的とする。
ユーザフレンドリーなフレームワークであるCustomListenerを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:14:59 GMT)
HGS-Mapping: Online Dense Mapping Using Hybrid Gaussian Representation in Urban Scenes [9.7] 大規模都市景観におけるオンライン高密度マッピングフレームワークHGS-Mappingを提案する。
私たちは、ガウス表現を都市景観のオンライン密集地図に統合した最初の人物です。
提案手法は66%のガウスしか採用せず,SOTA再建精度が向上し,再建速度は20%向上した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:16:05 GMT)
DeepHeteroIoT: Deep Local and Global Learning over Heterogeneous IoT Sensor Data [9.5] 本稿では,畳み込みニューラルネットワークと双方向Gated Recurrent Unitを併用して,局所的特徴とグローバルな特徴をそれぞれ学習する新しいディープラーニングモデルを提案する。
特に、このモデルはデータセット全体で平均3.37%の精度と2.85%のF1スコアの絶対的な改善を実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:24:07 GMT)
Audio-Visual Compound Expression Recognition Method based on Late Modality Fusion and Rule-based Decision [9.4] 本稿では,第6回ABAWコンペティションの複合表現認識チャレンジにおけるSUNチームの結果について述べる。
本稿では,複合表現認識のための新しい音声視覚手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:45:27 GMT)
Security Risks Concerns of Generative AI in the IoT [9.4] モノのインターネット(IoT)が、生成的人工知能(AI)とますます交差する時代において、この記事では、この統合に固有の突発的なセキュリティリスクを精査する。
我々は、生成AIがIoTのイノベーションを促進する方法について検討し、生成AIを使用する際のデータ漏洩の可能性と、生成AI技術のIoTエコシステムにおける誤用を分析します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:28:30 GMT)
Versatile Medical Image Segmentation Learned from Multi-Source Datasets via Model Self-Disambiguation [9.1] 本稿では,トレーニングのために,部分的あるいはスパースなセグメンテーションラベルのみを用いたマルチソースデータを活用する,費用対効果の代替案を提案する。
我々は,非一貫性なラベル付きマルチソースデータに関わる課題に対処するために,自己曖昧性,事前知識の取り込み,不均衡緩和の戦略を考案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:17:29 GMT)
Improving Generalization via Meta-Learning on Hard Samples [9.0] 検証集合における難しい分類インスタンスの使用は、理論上の関係と、一般化の強い経験的証拠の両方を持つことを示す。
我々は,このメタ最適化モデルを訓練するための効率的なアルゴリズムと,注意深い比較研究のための簡単なトレインツースを提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:41:07 GMT)
Health Text Simplification: An Annotated Corpus for Digestive Cancer Education and Novel Strategies for Reinforcement Learning [8.9] 普及とリテラシーを高めるために、健康情報における高パフォーマンステキスト単純化モデルが不可欠である。
アメリカがん学会, 疾病対策センター, 国立がん研究所の教育コンテンツを含む, 健康テキストの簡易化研究に適した, がん教材の同時コーパスを紹介する。
大規模言語モデル (LLM) に基づく単純化手法について検討し, 微調整, 強化学習 (RL) , 人間のフィードバックによる強化学習 (RLHF) , ドメイン適応, プロンプトに基づくアプローチについて検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:01:27 GMT)
Interpretable Decision Tree Search as a Markov Decision Process [8.5] 教師付き学習タスクに最適な決定木を見つけることは、大規模に解決する上で難しい問題である。
近年、マルコフ決定問題 (MDP) としてこの問題の枠組みを定め、深層強化学習を用いてスケーリングに取り組むことが提案されている。
そこで我々は,全ての状態に対して生成する情報理論テスト生成関数を用いて,MDPの分解能を拡大する手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:06:26 GMT)
Advancing the Arabic WordNet: Elevating Content Quality [8.4] 本稿では,複数次元のレキシコ・セマンティックな資源品質に対処するアラビア語WordNetの大規模な改訂について紹介する。
既存のアラビア語のWordNetのシンセセットの58%以上を更新します。
言語多様性と非翻訳性の問題に対処するため,新しい要素であるフレーズと語彙のギャップによってワードネット構造を拡張した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:54:19 GMT)
Gradient Reweighting: Towards Imbalanced Class-Incremental Learning [8.4] CIL(Class-Incremental Learning)は、非定常データから新しいクラスを継続的に認識するためにモデルを訓練する。
CILの大きな課題は、非一様分布を特徴とする実世界のデータに適用する場合である。
この二重不均衡問題により、FC層に偏りのある勾配更新が生じ、CILの過度/過度な適合と破滅的な忘れが引き起こされる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:41:13 GMT)
Uncovering Bias in Large Vision-Language Models with Counterfactuals [8.4] 大規模視覚言語モデル(LVLM)によるテキストに含まれる社会的バイアスについて検討する。
異なる対物集合の画像を条件付けしながら、同一のオープンエンドテキストプロンプトを持つLVLMを提案する。
入力画像に表現される人種,性別,身体的特徴などの社会的特性は,有毒度や有能な関連語の発生に大きく影響することがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:45:53 GMT)
Colorful Cutout: Enhancing Image Data Augmentation with Curriculum Learning [8.4] 本研究では,画像データ拡張のためのカリキュラムデータ拡張を採用し,カラフルなカットアウトを提案する。
実験結果は,画像データに対するカリキュラムデータ拡張の可能性を強調した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:53:52 GMT)
Adverb Is the Key: Simple Text Data Augmentation with Adverb Deletion [8.4] ルールベースの手法は、コスト効率のために現実世界のアプリケーションに広く採用されている。
副詞の直接削除によってこのような現象を回避する新しいテキストデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:01:39 GMT)
Unsupervised Tumor-Aware Distillation for Multi-Modal Brain Image Translation [8.4] 教師なしマルチモーダル脳画像翻訳は広く研究されている。
既存の方法は翻訳中の脳腫瘍の変形の問題に悩まされている。
UTAD-Netと呼ばれる教師なしの腫瘍対応蒸留教員ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:35:37 GMT)
TACOS: Topology-Aware Collective Algorithm Synthesizer for Distributed Machine Learning [8.4] 本稿では,共通分散機械学習集団のためのトポロジ対応集合アルゴリズムを自動合成するTACOSを紹介する。
TACOSは、異質な512-NPUシステムのAll-Reduceアルゴリズムをわずか6.09分で合成し、最先端の作業よりも4.27倍の性能向上を実現した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:34:59 GMT)
A Systematic Analysis of Subwords and Cross-Lingual Transfer in Multilingual Translation [8.3] サブワード規則化は多言語モデリングのシナジーを高めるが、BPEはより効果的に言語間微調整の移行を促進する。
本研究は,サブワードモデリングに関する決定が,多言語モデリングの利点を最適化するための鍵となることを確認した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:09:23 GMT)
WoLF: Wide-scope Large Language Model Framework for CXR Understanding [8.3] 胸部X線理解のための広スコープ大言語モデルフレームワークを提案する。
実際の臨床シナリオにおける正確な診断に利用される多面的患者の記録を収集する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:38:51 GMT)
ReALM: Reference Resolution As Language Modeling [8.2] 本稿では, LLMが様々なタイプの参照を解くために, 極めて効率的なシステムを構築する方法を示す。
異なるタイプの参照にまたがって同様の機能を持つ既存システムに対する大幅な改善を実証する。
また,GPT-3.5 と GPT-4 をベンチマークし,GPT-4 に匹敵する性能を達成した最小モデルについて検討した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:59:06 GMT)
On Inherent Adversarial Robustness of Active Vision Systems [7.8] GFNetとFALconの2つのアクティブビジョン手法は、最先端の敵攻撃下での標準的な受動畳み込みネットワークに比べて(2-3)強靭性を実現していることを示す。
さらに重要なことは、異なる固定点からの推論を行うと、アクティブな視覚メソッドが悪意のある入力に対して脆弱になることを示す、図解的で解釈可能な可視化分析を提供することである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:51:45 GMT)
HARMamba: Efficient Wearable Sensor Human Activity Recognition Based on Bidirectional Selective SSM [7.8] 本稿では、より軽量な選択的SSMをアクティビティ認識の基盤モデルアーキテクチャとして採用したHARMambaを紹介する。
私たちのアプローチでは、各チャネルを独立して学習し、データを“パッチ”に分割することで、センサデータフローを処理する。
Transformerベースのモデルのような既存のアクティビティ認識フレームワークと比較して、HARMambaは計算とメモリオーバーヘッドを低減しつつ、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:57:46 GMT)
FocusMAE: Gallbladder Cancer Detection from Ultrasound Videos with Focused Masked Autoencoders [7.8] 本研究は,ビデオベース検出へのパラダイムシフトを提唱する。
高情報領域からのマスキングトークンの選択を体系的にバイアスするFocusMAEという新しい設計を提案する。
我々は,現在の画像ベースSOTA-RadFormerで84%,ビデオベースSOTA-AdaMAEで94.7%,GBC検出問題で96.4%の最先端(SOTA)精度を報告した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:22:06 GMT)
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs [7.7] YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のために設計された、新しい生成モデルである。
提案手法は,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。
特に、512の解像度で訓練された1ステップで画像を生成できる最初の拡散変換器を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:48:42 GMT)
Latent Embedding Clustering for Occlusion Robust Head Pose Estimation [7.6] 頭部ポーズ推定は、幅広い応用において有用であることから、コンピュータビジョンにおいて重要な研究領域となっている。
この分野で最も難しい課題の1つは、現実世界のシナリオで頻繁に発生するヘッドオクルージョンの管理である。
我々は,現実の頭部閉塞のシナリオにおいて堅牢な,新規で効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:57:38 GMT)
Rapid Motor Adaptation for Robotic Manipulator Arms [7.6] 汎用的な操作スキルの開発は、AIの具体化における中核的な課題である。
Rapid Motor Adaptation (RMA)はこの課題に対して有望な解決策を提供する。
我々は、様々な操作タスクにおいて、迅速な運動適応に適したエージェントを開発する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:39:28 GMT)
FTFT: Efficient and Robust Fine-Tuning by Transferring Training Dynamics [7.6] トレーニングダイナミクスは,モデルサイズや事前学習手法間で非常に伝達可能であることを示す。
本稿では,TransFerring Training dynamics (FTFT)によるファインチューニング手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:53:28 GMT)
Exploring Pathological Speech Quality Assessment with ASR-Powered Wav2Vec2 in Data-Scarce Context [7.6] 本稿では,データ不足にもかかわらずセグメントではなく,音声レベルで学習する手法を提案する。
その結果, ASR に基づく Wav2Vec2 モデルが最高の結果をもたらし, ASR と音声品質評価との間に強い相関関係があることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:59:34 GMT)
ChainNet: Structured Metaphor and Metonymy in WordNet [7.6] ChainNet(リンク)は、初めて意味関係のない感覚を明確に識別する語彙リソースである。
単語のすべての名義的な感覚は、メタファーまたはメトニミーによって他の感覚と結び付けられているか、あるいはホモニミーの場合、切り離されている。
ChainNetは、グラウンドド・メタファーとメトニミーの最初のデータセットである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:22:53 GMT)
Learning using granularity statistical invariants for classification [7.5] 本稿では、LUSIの粒度統計不変量を導入し、LUGSIを用いた学習という新しい学習パラダイムを開発する。
LUGSIは、期待されるリスクを最小限に抑えるため、強い収束機構と弱い収束機構の両方を採用している。
実験結果から、LUGSIは一般化能力の向上だけでなく、特に大規模データセットのトレーニング速度の向上も示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:23:10 GMT)
Integrated quantum communication network and vibration sensing in optical fibers [7.5] 本稿では、ダウンストリーム量子アクセスネットワーク(DQAN)と光ファイバーの振動検出を統合したネットワークアーキテクチャを提案し、実証する。
私たちの統合アーキテクチャは、セキュアな量子通信センサネットワークを構築するための、実用的で費用対効果の高いソリューションを提供します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:00:48 GMT)
Large Language Model based Situational Dialogues for Second Language Learning [7.5] 第二言語学習において、シナリオベースの会話実践は、言語学習者が話し言葉の流布を達成するために重要である。
このギャップを埋めるために,学生が会話の実践を行うための状況対話モデルを提案する。
我々の状況対話モデルは大規模言語モデル(LLM)に基づいて微調整されており、オープンエンド会話の係り受け性とシナリオベースタスクの焦点を合わせることを目的としている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:43:55 GMT)
Artificial Neural Networks-based Real-time Classification of ENG Signals for Implanted Nerve Interfaces [7.3] そこで我々は,ラットの坐骨神経で測定された脳波(ENG)信号から感覚刺激を抽出するために,4種類の人工ニューラルネットワーク(ANN)を探索した。
データセットの異なるサイズは、リアルタイム分類のための調査されたANNの実現可能性を分析するために考慮される。
以上の結果から,ANNはリアルタイムアプリケーションに適しており,100ドル,200ドル以上の信号ウィンドウに対して90%以上のアキュラシーを達成でき,その処理時間も低く,病的回復に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:23:30 GMT)
A Strong Baseline for Point Cloud Registration via Direct Superpoints Matching [7.3] 本稿では,グローバルなマッチング方式でスーパーポイントの対応を見つけるための,シンプルで効果的なベースラインを提案する。
我々の単純で効果的なベースラインは、3つのデータセットの最先端メソッドと同等かそれ以上の結果を示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:11:38 GMT)
Quantum Bayes Classifiers and Their Application in Image Classification [7.3] ベイズネットワーク上に構築されたベイズ分類器は、サンプルの統計データのみに基づいて決定を下すことができる。
ナイーブQBCと3つの半ナイーブQBC(SN-QBC)の両方を設計する。
これらのQBCは画像分類タスクに適用される。
我々は,これらのQBCをMindQuantumプラットフォーム上でシミュレートし,MNISTおよびFashion-MNISTデータセット上での性能を評価する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:26:10 GMT)
Towards Low-Energy Adaptive Personalization for Resource-Constrained Devices [7.2] Target Block Fine-Tuning (TBFT) はリソース制約のあるデバイスのための低エネルギー適応型パーソナライズフレームワークである。
我々は、エネルギーコストを削減して最適な性能を達成するために、モデルの異なるブロックを微調整する。
Block Avg$と比較すると、TBFTは平均15.30%の精度向上を示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:53:58 GMT)
Fully Zeroth-Order Bilevel Programming via Gaussian Smoothing [7.1] ビルベル問題の解法としてゼロ階近似アルゴリズムを研究・解析する。
我々の知る限りでは、完全ゼロ階二階最適化アルゴリズムのためにサンプル境界が確立されたのはこれが初めてである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:12:25 GMT)
SplatFace: Gaussian Splat Face Reconstruction Leveraging an Optimizable Surface [7.1] SplatFaceは3次元人間の顔再構成のための新しいガウススプレイティングフレームワークであり、正確な事前決定幾何に依存しない。
本手法は,高品質な新規ビューレンダリングと高精度な3Dメッシュ再構成の両方を同時に実現するように設計されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:16:29 GMT)
Identifying Banking Transaction Descriptions via Support Vector Machine Short-Text Classification Based on a Specialized Labelled Corpus [7.0] 本稿では,自然言語処理技術と機械学習アルゴリズムを組み合わせて,銀行取引記述を分類する新しいシステムについて述べる。
また,スパム検出における既存のソリューションに触発されて,ジャカード距離に基づくトレーニングセットサイズの削減を目的とした,短いテキスト類似度検出手法を提案する。
Google PlayとApp Storeで利用可能なパーソナルファイナンスアプリケーションCoinScrapのユースケースを提示する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:15:46 GMT)
Automated Identification and Segmentation of Hi Sources in CRAFTS Using Deep Learning Method [6.8] 本研究では,3次元スペクトルデータからHIソースを抽出する機械学習手法を導入し,CRAFTSからHIソースの専用データセットを構築する。
本手法はHI源を確実に同定し, 再現率91.6%, 精度95.7%の顕著な性能指標を達成できる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:46:11 GMT)
GlitchBench: Can large multimodal models detect video game glitches? [6.8] GlitchBenchは、ビデオゲームの品質保証タスクから派生した新しいベンチマークである。
当社のベンチマークは、ビデオゲームの異常なシナリオや派手なシナリオから収集しています。
我々はGlitchBenchが最先端のLMMに新たな課題をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:49:59 GMT)
Detection of financial opportunities in micro-blogging data with a stacked classification system [6.8] ツイートの肯定的な予測を検知する新しいシステムを提案する。
具体的には、金融業者にかなりの量のツイートを提示するために、高い検出精度を求める。
3層積み重ね機械学習の分類システムで実現した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:23:44 GMT)
Multi-Region Transfer Learning for Segmentation of Crop Field Boundaries in Satellite Images with Limited Labels [6.8] 本稿では,ラベル付きデータを持たない地域での衛星画像における作物の畑の境界のセグメンテーションについて述べる。
提案手法は既存の手法よりも優れており,マルチリージョン転送学習によって複数のモデルアーキテクチャの性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:24:12 GMT)
SLFNet: Generating Semantic Logic Forms from Natural Language Using Semantic Probability Graphs [6.7] 自然言語インターフェースの構築は通常、ユーザの自然言語を解析し、構造化された textbfSemantic textbfLogic textbfForms (SLFs) に変換するために semanticSlot を使用する。
本研究では,依存構文情報を先行知識として組み込んだニューラルネットワークSLFNetを提案し,文脈情報と単語間の長距離相互作用を捉える。
実験の結果,中国QCI-TSデータセットとオカピデータセットのSLFNetによる最先端のパフォーマンス,ATISデータセットの競合性能が得られた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:42:39 GMT)
Towards Greener LLMs: Bringing Energy-Efficiency to the Forefront of LLM Inference [6.7] 大規模な言語モデルを提供するためのデータセンター拡張の最大の課題として、エネルギーの可用性が最前線に現れている。
入力,モデル,サービスレベルの合意によっては,LLM推論プロバイダがエネルギー効率を高めるために利用できるノブがいくつか存在することを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:22:48 GMT)
PEMA: An Offsite-Tunable Plug-in External Memory Adaptation for Language Models [6.6] プレトレーニング言語モデル (PLM) は、様々な下流のNLPタスクにおいて顕著な性能を示す。
大量の資源を必要とするため、多くのPLM重みは機密である。
本稿では,PEMA(Plug-in external Memory Adaptation)を紹介する。
すべての重みを必要とせずにファインチューニングを可能にするPEFT (Efficient Fine-Tuning) 法。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:24:46 GMT)
Structured Evaluation of Synthetic Tabular Data [6.4] タブラルデータは一般的には不完全であり、ボリュームは小さく、プライバシー上の懸念からアクセス制限されている。
本稿では,観測データと同じ分布から合成データを抽出すべきと仮定した,単一の数学的目的を持つ評価フレームワークを提案する。
深層学習を利用した構造情報型シンセサイザーとシンセサイザーの評価を行った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:48:44 GMT)
Forecasting Long-Time Dynamics in Quantum Many-Body Systems by Dynamic Mode Decomposition [6.4] そこで本研究では,身体量の短時間データの信頼性を利用して,長時間の挙動を正確に予測する手法を提案する。
この方法は流体力学で一般的に用いられる動的モード分解(DMD)に基づいている。
本手法により,短時間のトレーニングデータよりも1桁近い精度の予測が可能であることが実証された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:10:34 GMT)
Entertainment chatbot for the digital inclusion of elderly people without abstraction capabilities [6.4] EBERはバックグラウンドでニュースを読み、ユーザーの気分に反応する。
我々は,人工知能モデリング言語,自然言語自動生成,感性分析を組み合わせることで実現した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:10:21 GMT)
Estimating large causal polytrees from small samples [6.3] 比較的小さなi.d.サンプルから大きな因果ポリツリーを推定する問題を考察する。
このような設定で高い精度で木を復元するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:50:04 GMT)
Separate, Dynamic and Differentiable (SMART) Pruner for Block/Output Channel Pruning on Computer Vision Tasks [6.2] Deep Neural Network(DNN)プルーニングは、モデルサイズを削減し、レイテンシを改善し、アクセラレータの消費電力を削減するための重要な戦略として登場した。
ブロックおよび出力チャネルプルーニングのための分離された動的かつ微分可能な()プルーナを導入する。
実験では,SMARTプルーナーは既存のプルーニング法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:28:06 GMT)
Quadratic Lower bounds on the Approximate Stabilizer Rank: A Probabilistic Approach [6.2] 量子状態の近似安定化器ランクは、その状態の任意の近似分解における最小の項数である。
我々は近似ランクの下位境界を、近似パラメータの広い範囲に対して$tilde Omega(sqrt n)$に改善する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:55:52 GMT)
Cell Variational Information Bottleneck Network [6.2] 本稿では,最新のフィードフォワードネットワークアーキテクチャと組み合わせることができる情報ボトルネック機構を用いた畳み込みニューラルネットワークを提案する。
セル変動情報ボトルネックネットワークは、不確実性のある特徴マップを生成するVIBセルを積み重ねて構築される。
より複雑な表現学習タスクである顔認識では、ネットワーク構造も非常に競争力のある結果を得た。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:20:42 GMT)
GuaranTEE: Towards Attestable and Private ML with CCA [6.0] GuaranTEEは、エッジ上で証明不可能なプライベート機械学習を提供するためのフレームワークである。
CCAがプロトタイプを開発し、評価し、公開することで、MLモデルをデプロイできる可能性を評価する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:07:29 GMT)
Explaining latent representations of generative models with large multimodal models [6.0] データ生成潜在因子の解釈可能な表現を学習することは、人工知能の発展にとって重要なトピックである。
大規模マルチモーダルモデルを用いた生成モデルにおいて,各潜伏変数を包括的に記述するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:18:37 GMT)
MultiCorrupt: A Multi-Modal Robustness Dataset and Benchmark of LiDAR-Camera Fusion for 3D Object Detection [6.0] 自動走行のためのマルチモーダル3Dオブジェクト検出モデルは、nuScenesのようなコンピュータビジョンベンチマークでは例外的な性能を示した。
しかし、密集したLiDAR点雲や精密に校正されたセンサーアレイへの依存は、現実世界のアプリケーションに課題をもたらす。
我々は,10種類の汚職に対してマルチモーダル3Dオブジェクト検出器の堅牢性を評価するためのベンチマークであるMultiCorruptを紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:34:34 GMT)
MCNet: A crowd denstity estimation network based on integrating multiscale attention module [5.8] 利用者の群集密度を自動的に分類するために,Metro Crowd density Estimation Network(MCNet)を提案する。
Integating Multi-scale Attention (IMA) モジュールは, セマンティック・クラウド・テクスチャの特徴を抽出するプレーン・クラシファイアの能力を高めるために提案されている。
ビデオフレームを直接処理し,群集密度推定のためのテクスチャ特徴を自動的に抽出する,軽量な群集テクスチャ特徴抽出ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:40:44 GMT)
FastLog: An End-to-End Method to Efficiently Generate and Insert Logging Statements [5.8] 我々は、完全なロギングステートメントの生成と挿入アクティビティをサポートするFastLogを提案する。
FastLogは最初、最も優れたトークンレベルの挿入位置を予測し、次に挿入する完全なロギングステートメントを生成する。
総合的な実証分析により,本手法は効率と出力品質の両方において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:56:27 GMT)
MindArm: Mechanized Intelligent Non-Invasive Neuro-Driven Prosthetic Arm System [5.5] 我々は、インテリジェントな非侵襲的神経駆動義肢システムであるMindArmを提案する。
私たちのMindArmシステムでは、ディープニューラルネットワーク(DNN)エンジンを使用して、脳信号を義肢の動きに変換する。
私たちのMindArmシステムは、アイドル/静止時で91%、握手時で85%、ピックアップカップ時で84%という、肯定的な成功率を達成する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:09:24 GMT)
EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.5] 意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:13:13 GMT)
Automatic Alignment of Discourse Relations of Different Discourse Annotation Frameworks [5.4] 分類作業中にラベル埋め込みを学習するための完全自動アプローチを導入する。
これらの埋め込みは、異なるフレームワークの談話関係をマッピングするために使われる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:18:26 GMT)
MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selection [5.4] MambaMixerは、トークンとチャネル間の二重選択機構を使用する、データ依存の重みを持つ新しいアーキテクチャである。
概念実証として,Vision MambaMixer (ViM2) とTime Series MambaMixer (TSM2) を設計した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:05:13 GMT)
DCAE-SR: Design of a Denoising Convolutional Autoencoder for reconstructing Electrocardiograms signals at Super Resolution [5.4] 心電図(ECG)信号は心血管診断において重要な役割を担っている。
ECG記録における固有ノイズと限定分解能は、正確な解釈と診断を妨げる可能性がある。
本稿では,DNAEを用いて心電図信号の内部の時間・周波数情報を強化する新しいECGスーパー解像度(SR)モデルを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:46:08 GMT)
Conformer-Based Speech Recognition On Extreme Edge-Computing Devices [5.2] 本稿では,高度なコンバータベースのエンドツーエンドストリーミングASRシステムを,精度の低下を伴わないリソース制約デバイスに適合させるために,一連のモデルアーキテクチャ適応,ニューラルネットワーク変換,数値最適化を提案する。
我々は,小型ウェアラブル端末におけるリアルタイム(0.19)音声認識よりも5.26倍の速さで,エネルギー消費を最小化し,最先端の精度を実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:44:44 GMT)
An FPGA-Based Reconfigurable Accelerator for Convolution-Transformer Hybrid EfficientViT [5.1] 本稿では,VTのハードウェア効率フロンティアを向上するために,FPGAベースのEfficientViTアクセラレータを提案する。
具体的には、軽量な畳み込みや注意を含む様々な操作タイプを効率的にサポートする再構成可能なアーキテクチャを設計する。
実験の結果,我々の加速器はスループット780.2 GOPS,エネルギー効率105.1 GOPS/Wを200MHzで達成した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:20:33 GMT)
The Future of Combating Rumors? Retrieval, Discrimination, and Generation [5.1] 人工知能生成コンテンツ(AIGC)技術開発は、誤情報による噂の作成を促進する。
現在の噂検出努力は、誤報を単にラベル付けするだけで不足している。
提案手法は,噂を検知するだけでなく,情報の有効性を否定する説明的コンテンツも提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:32:41 GMT)
FetalDiffusion: Pose-Controllable 3D Fetal MRI Synthesis with Conditional Diffusion Model [5.1] FetalDiffusionは,3次元合成胎児MRIを合成可能なポーズで生成する新しい手法である。
本研究は, 高精度かつ認識可能な胎児のポーズを持つ高品質な合成胎児MRI画像を作成することによって, 提案モデルの成功を実証するものである。
本手法は, リアルタイム追跡モデルの改善を約束し, 胎児運動の問題をより効果的に解決する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:58:13 GMT)
Gromov-Wassertein-like Distances in the Gaussian Mixture Models Space [5.1] グロモフ=ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は、機械学習において、異なる距離空間の分布を比較するためにしばしば用いられる。
近年、ガウス混合モデルに特化して、MW(mixture Wasserstein)として知られる新しいワッサーシュタイン距離が導入されている。
本稿では,新しいGromov型距離を導入することでMWの拡張を目指す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:50:17 GMT)
CATSNet: a context-aware network for Height Estimation in a Forested Area based on Pol-TomoSAR data [5.0] この研究は、CATSNetというコンテキスト対応のディープラーニングベースのソリューションを定義している。
畳み込みニューラルネットワークは、パッチベースの情報を活用し、単一のピクセルに注目するのではなく、近隣から特徴を抽出すると考えられる。
実験結果から,複数基線(MB)のTtomoSARデータ内のコンテキスト情報を活用することで,従来の手法を超越した性能と能力の両面で,顕著な優位性を示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:27:40 GMT)
FISBe: A real-world benchmark dataset for instance segmentation of long-range thin filamentous structures [4.9] 神経系の体積光顕微鏡画像におけるニューロンのセグメンテーションは、神経科学における画期的な研究を可能にする。
しかし、マルチニューロン光顕微鏡のデータは、インスタンスセグメンテーションのタスクにとって非常に難しい特性を示している。
私たちはFlyLight Instance Benchmark(FISBe)データセットをリリースしました。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:51:34 GMT)
Fast OMP for Exact Recovery and Sparse Approximation [4.9] 本論文は, オリゴナル・マッチング・パースーツ(OMP)を2つの面で前進させる。
各イテレーションで入力信号の投影を高速に行うアルゴリズムと、グリーディ選択のための新しい選択基準を提供する。
実験結果は計算時間において古典的なOMPよりも大幅に改善したことを示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:39:37 GMT)
PikeLPN: Mitigating Overlooked Inefficiencies of Low-Precision Neural Networks [4.8] 非量子化要素演算は、低精度モデルの推論コストを支配している。
PikeLPNモデルは、要素演算と乗算累積演算の両方に量子化を適用することで、これらの問題に対処する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:23:34 GMT)
Cross-Lingual Transfer Robustness to Lower-Resource Languages on Adversarial Datasets [4.7] 多言語言語モデル(MLLM)の言語間伝達能力について検討した。
本研究は,言語間移動とそのNLP応用への応用に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:47:15 GMT)
LLaVA-Gemma: Accelerating Multimodal Foundation Models with a Compact Language Model [4.6] 我々は、最近リリースされた大規模言語モデル(LLM)のGemmaファミリで、人気のあるLLaVAフレームワークを使用して、MMFM(Multimodal foundation model)のスイートをトレーニングする。
コネクタの事前訓練,より強力な画像バックボーンの利用,言語バックボーンのサイズ拡大という,3つの設計上の特徴を損なう効果を検証した。
LLaVA-Gemmaと呼ばれる結果のモデルは、評価の配列に対して適度な性能を示すが、現在の大容量SOTAモデルよりは改善されない。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:32:50 GMT)
Classifying Conspiratorial Narratives At Scale: False Alarms and Erroneous Connections [4.6] この研究は、陰謀論に関する議論を分類するための一般的なスキームを確立する。
我々は、オンラインCTを分類するためのBERTベースのモデルをトレーニングするために、人間ラベル付き地上真実を利用する。
本研究は,最も活発な陰謀に関するRedditフォーラムの投稿を用いた,最初の大規模分類研究である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:29:12 GMT)
Robust Ensemble Person Re-Identification via Orthogonal Fusion with Occlusion Handling [4.4] 排除は、個人再識別(ReID)における大きな課題の1つとして残されている。
本稿では,CNN と Transformer アーキテクチャを併用し,ロバストな特徴表現を生成する深層アンサンブルモデルを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:38:59 GMT)
The Impact of Prompts on Zero-Shot Detection of AI-Generated Text [4.3] チャットベースのアプリケーションでは、ユーザーは一般的にAI生成テキストのプロンプトを入力し、利用する。
本稿では,AI生成テキストの検出精度に対するプロンプトの影響を実証的に分析するための評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:33:34 GMT)
Convolutional Prompting meets Language Models for Continual Learning [4.1] 継続学習(CL)により、機械学習モデルは、古いタスクからのデータなしで、新しいトレーニングデータを継続的にシフトすることから学ぶことができる。
ConvPromptは、階層的に共有された埋め込みを維持する新しい畳み込みプロンプト生成機構である。
畳み込みのインテリジェントな利用により、パフォーマンスを損なうことなく、低パラメータのオーバーヘッドを維持することができます。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:40:37 GMT)
Using LLMs to Model the Beliefs and Preferences of Targeted Populations [4.1] 本研究では,人間の嗜好をモデル化する大規模言語モデル (LLM) の整合性について考察する。
特定の集団の信念、好み、行動のモデル化は、様々な応用に有用である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:58:46 GMT)
Graph Neural Aggregation-diffusion with Metastability [4.0] 微分方程式に基づく連続グラフニューラルモデルはグラフニューラルネット(GNN)のアーキテクチャを拡張した
相互作用ポテンシャルによって誘導される非線形拡散と凝集の微妙なバランスを含むグラフ凝集拡散方程式に着想を得たGRADEを提案する。
我々はGRADEが様々なベンチマークで競合性能を達成し、GNNにおける過度にスムースな問題を軽減することを証明した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:05:57 GMT)
Adaptive Decentralized Federated Learning in Energy and Latency Constrained Wireless Networks [4.0] 中央ノードで集約されたパラメータを持つフェデレートラーニング(FL)では、通信オーバーヘッドがかなり懸念される。
最近の研究では、分散フェデレートラーニング(DFL)が実現可能な代替手段として紹介されている。
エネルギーと遅延の制約を考慮してDFLの損失関数を最小化する問題を定式化する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:17:40 GMT)
DXAI: Explaining Classification by Image Decomposition [4.0] 我々は、分解に基づく説明可能なAI(DXAI)を用いてニューラルネットワークの分類を可視化する新しい方法を提案する。
本手法は,説明熱マップを提供する代わりに,画像のクラス非依存部分とクラス固有部分への分解を行う。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:04:52 GMT)
Regulating eXplainable Artificial Intelligence (XAI) May Harm Consumers [4.0] 一般的な知恵として、完全に透明なXAIを強制することによってAIの規制が社会福祉を増大させる。
本稿では,社会福祉を最大化する政策立案者のゲーム理論モデルを用いて,この概念に挑戦する。
必須のXAIでも保証できないXAI公正性の概念を考察する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:22:00 GMT)
Interpretable Constructive Algorithm for Random Weight Neural Networks [3.9] 本稿では、インクリメンタルランダムウェイトニューラルネットワーク(IRWNN)の重大な欠点に対処するために、幾何情報を用いた解釈可能な構成法(IC)を提案する。
ICは幾何学的関係を利用してランダムに隠れパラメータを割り当て、解釈性を向上させる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:10:30 GMT)
The LSCD Benchmark: a Testbed for Diachronic Word Meaning Tasks [3.8] Lexical Semantic Change Detection (LSCD) は複雑な補題レベルのタスクである。
このリポジトリは、WiC、WSI、LSCDのモデル評価を可能にすることで、タスクのモジュラリティを反映している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:11:54 GMT)
Nonparametric Bellman Mappings for Reinforcement Learning: Application to Robust Adaptive Filtering [3.7] 本稿では、強化学習(RL)のための再生カーネルヒルベルト空間(RKHS)における新しい非パラメトリックベルマン写像を設計する。
提案したマッピングは、RKHSのリッチな近似特性の恩恵を受け、非パラメトリックな性質のためデータの統計に仮定を適用せず、トレーニングデータなしで運用することができる。
応用として, 適応フィルタリングにおける外れ値の対応問題に対する新しい解決策を提供するために, 提案した写像を用いる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:15:30 GMT)
Designing Poisson Integrators Through Machine Learning [3.5] ポアソン多様体は可積分であり、つまり、ポアソン多様体が単位の集合として機能する既知の局所シンプレクティック群が存在する。
我々の構成はポアソン微分同相写像とラグランジュ二項の対応の上に構築され、ポアソンの設計をある種のPDE(Hamilton-Jacobi)の解として再構成することができる。
この研究の主な特徴は、ハミルトン・ヤコビ PDE を最適化問題として理解することであり、その解は機械学習関連の技術を用いて容易に近似できる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:16:01 GMT)
TacoGFN: Target-conditioned GFlowNet for Structure-based Drug Design [3.5] 分子の深層生成モデルは、徹底的な仮想スクリーニングよりも効率的であることを約束する。
本稿では,タンパク質ポケット構造を前提とした生成フローネットワークであるTacoGFNを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:47:29 GMT)
Homomorphic WiSARDs: Efficient Weightless Neural Network training over encrypted data [3.4] 比較的深い畳み込みニューラルネットワーク(CNN)においても、推論アルゴリズムの同型評価は実用的である
本研究は,Wilkie,Stonham,Aleksander's Recognition Device (WiSARD) とその後のWeightless Neural Networks (WNN) の同型評価を導入し,暗号化データのトレーニングと推論を行う。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:09:59 GMT)
RNb-NeuS: Reflectance and Normal-based Multi-View 3D Reconstruction [3.2] 本稿では,光度ステレオにより得られる多視点反射率と正規写像を統合するための多目的パラダイムを提案する。
提案手法では, 反射率と正規度の画素ワイドな共同パラメータ化を, 放射光のベクトルとして用いた。
これは、高い曲率または低い視認性を持つ領域の詳細な3D再構成を大幅に改善する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:30:58 GMT)
User Modeling Challenges in Interactive AI Assistant Systems [3.1] Interactive Artificial Intelligent(AI)アシスタントシステムは、人間が様々なタスクを完了するのを助けるタイムリーなガイダンスを提供するように設計されている。
残りの課題の1つは、よりパーソナライズされたガイダンスのために、タスク中のユーザの精神状態を理解することである。
本研究では,タスク実行中のユーザの精神状態を分析し,よりパーソナライズされたユーザガイダンスのために,大規模言語モデルがユーザプロファイルを解釈する能力と課題について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:54:13 GMT)
Multi-task Magnetic Resonance Imaging Reconstruction using Meta-learning [3.1] 本稿では,複数のMR画像データセットから画像特徴を効率的に学習するメタラーニング手法を提案する。
実験により,複数のMRIデータセットから得られた高度にアンサンプされたk空間データを同時に再構成するメタラーニング再構成手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:02:51 GMT)
Molecular Generative Adversarial Network with Multi-Property Optimization [3.0] GAN(Generative Adversarial Network)のような深層生成モデルは、創薬におけるデノボ$分子生成に用いられている。
本研究では,マルチプロパティ最適化によりトークンレベルで分子を生成するために,InstGANと呼ばれる即時かつグローバルな報酬を持つアクタ批判的RLに基づく新しいGANを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:55:39 GMT)
LooPIN: A PinFi protocol for decentralized computing [3.0] PinFiプロトコルは、分散的な方法でネットワーク内のコンピューティングパワーの分散を容易にするように設計されている。
これにより、コンピューティングパワーへのアクセスコストが大幅に削減され、既存のサービスに比べて1%も低くなる可能性がある。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:37:59 GMT)
A Comparison of Speech Data Augmentation Methods Using S3PRL Toolkit [3.0] SpecAugmentは、元のデータセット上での HuBERT と wav2vec のパフォーマンスをわずかに改善する。
また,Gaussian Noise and Speed Perturbationデータセットを用いてトレーニングしたモデルは,拡張テストセットでテストした場合,より堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:01:32 GMT)
Exponentially tighter bounds on limitations of quantum error mitigation [2.9] 短期量子コンピューティングにおいて、望ましくない、避けられない誤りに対処する手段として、量子エラー軽減法が提案されている。
本研究では,より大きなシステムサイズに対して,量子ノイズを効果的に排除できる程度に強い制約を課す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:46:11 GMT)
Conversational Financial Information Retrieval Model (ConFIRM) [2.9] 本稿では,照会意図の分類と知識ベースラベリングに適した LLM ベースの財務情報検索モデル ConFIRM を提案する。
ConFIRMは,1)ドメイン固有の問合せペアを合成する手法,2)クエリ分類タスクのためのパラメータ効率の良い微調整手法の評価,の2つのモジュールから構成される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:51:53 GMT)
LayerNorm: A key component in parameter-efficient fine-tuning [2.7] BERT(Bidirectional Representations from Transformers)のような事前学習モデルの微調整は、多くの自然言語処理(NLP)タスクを解決する効果的な方法であることが証明されている。
BERTを含む多くの最先端NLPモデルではパラメータが多数存在するため、微調整のプロセスは計算コストがかかる。
この問題に対する魅力的な解決策の1つはパラメータ効率の細かいチューニングであり、残余を変更せずに最小限のセグメントだけを変更することである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:53:11 GMT)
Joint chest X-ray diagnosis and clinical visual attention prediction with multi-stage cooperative learning: enhancing interpretability [2.6] 胸部X線検査における関節疾患診断のための新しい深層学習フレームワークと対応する視力マップの予測について紹介する。
具体的には、DenseNet201バックボーンとResidualおよびSqueeze-and-Excitationブロックベースのエンコーダの両方を活用する、新しいデュアルエンコーダマルチタスクUNetを設計した。
実験の結果,提案手法は胸部X線診断や視力マップの精度に優れていた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:14:41 GMT)
Label-Efficient Sleep Staging Using Transformers Pre-trained with Position Prediction [2.6] 本稿では,特徴と時間的エンコーディングをシームレスに結合するアーキテクチャと,モデル全体を事前訓練する適切な事前学習方式を提案する。
サンプル睡眠ステージングデータセットにおいて,提案手法はラベル付きトレーニングデータに飽和しない性能向上を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:22:30 GMT)
Hayden-Preskill Recovery in Hamiltonian Systems [2.3] 情報スクランブル(英: information scrambling)とは、局所化された量子情報を多体システム全体に素早く拡散してエンコードするユニタリダイナミクスである。
情報リカバリは,カオスモデルでは可能であるが,すべてではないことを示す。
また,情報回復は情報理論的特徴の変化による遷移を探索することを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:07:00 GMT)
MedCLIP-SAM: Bridging Text and Image Towards Universal Medical Image Segmentation [2.3] 本稿では,CLIPモデルとSAMモデルを組み合わせて臨床スキャンのセグメンテーションを生成する新しいフレームワーク MedCLIP-SAM を提案する。
3つの多様なセグメンテーションタスクと医用画像モダリティを広範囲にテストすることにより、提案手法は優れた精度を示した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:59:11 GMT)
Towards a Fault-Injection Benchmarking Suite [2.2] フォールトトレランスアプローチを示すためのベンチマークスイートは合意されていない。
代替として、著者は他のドメインからベンチマークを選択する。
ベンチマーク選択の基準を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:42:31 GMT)
Sound event localization and classification using WASN in Outdoor Environment [2.2] 音声イベントのローカライゼーションと分類の方法は、通常は単一のマイクロホンアレイに依存する。
音源の位置とクラスを推定するために,複数の特徴と注意機構を用いた深層学習に基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:44:14 GMT)
Bounding the amount of entanglement from witness operators [2.2] 本稿では, 絡み合った状態と分離可能な状態との操作的区別性を, 絡み合った証人から直接推定する手法を提案する。
この推定は、他のよく知られた絡み合い量化器の有界性も示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:53:09 GMT)
Prototype-based Interpretable Breast Cancer Prediction Models: Analysis and Challenges [2.2] 乳がん予測におけるPEF-Cの有用性について,マンモグラフィーを用いて検討した。
マンモグラフィーを用いた乳がん予測のプロトタイプベースモデルに関する既存の研究は,プロトタイプベースモデルの分類性能の向上に重点を置いている。
PEF-Cを用いたマンモグラフィーの試作機の品質評価を初めて行った。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:08:59 GMT)
Chinese Offensive Language Detection:Current Status and Future Directions [2.1] 本稿では,中国語における攻撃的言語検出について概観し,現在のベンチマークとアプローチについて検討する。
本調査の主な目的は,既存の技術を探究し,今後の研究の道筋を明らかにすることである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:48:35 GMT)
Generative AI Adoption in Classroom in Context of Technology Acceptance Model (TAM) and the Innovation Diffusion Theory (IDT) [2.0] 本研究は, 教育者の認知とGenAI, LLMの受容に影響を及ぼす要因を明らかにすることを目的とする。
本研究は,GenAIツールの有用性と,その受容性との間に強い正の相関関係があることを明らかにする。
使用の容易さが重要な要因として現れたが、それより少なかったため、受け入れに影響が及んだ。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:41:51 GMT)
OLYMPIA: A Simulation Framework for Evaluating the Concrete Scalability of Secure Aggregation Protocols [1.8] シミュレーションによるセキュアプロトコルの実証評価のためのフレームワークであるOLYMPIAを提案する。
OLYMPIAはプロトコルを定義するための組み込みドメイン固有言語と、パフォーマンスを評価するためのシミュレーションフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:07:39 GMT)
Development of Compositionality and Generalization through Interactive Learning of Language and Action of Robots [1.8] 本稿では、視覚、受容、言語を予測符号化と能動推論の枠組みに組み込む脳に触発されたニューラルネットワークモデルを提案する。
その結果,課題構成の訓練変化が増大すると,未学習の動詞-名詞合成への学習の一般化が著しく向上することが示唆された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:22:37 GMT)
Universal Bovine Identification via Depth Data and Deep Metric Learning [1.7] 本稿では,個別の牛を正確に識別する深度のみの深度学習システムを提案する。
群れの大きさの増大は、農場における牛と人間の比率を歪め、個人を手動で監視することがより困難になる。
そこで本研究では,市販の3Dカメラの深度データを用いた牛の識別のための深度学習手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:03:53 GMT)
AgileFormer: Spatially Agile Transformer UNet for Medical Image Segmentation [1.7] 視覚変換器をベースとしたUNet(ViT-UNet)セグメンテーションモデルの現在の設計は、不均一な外観を効果的に扱えない。
本稿では,空間動的成分をViT-UNetに導入するための構造化手法を提案する。
この適応により、モデルは様々な外観のターゲットオブジェクトの特徴を効果的に捉えることができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:25:09 GMT)
Cross-modal tumor segmentation using generative blending augmentation and self training [1.6] 本稿では,新しいデータ拡張手法によって強化された従来の画像合成に基づくクロスモーダルセグメンテーション手法を提案する。
Generative Blending Augmentation (GBA)は、単一のトレーニング画像から代表的生成特徴を学習し、腫瘍の外観を現実的に多様化させる。
提案手法は,MICCAI CrossMoDA 2022 チャレンジの検証および試験段階において,前庭神経ショーノマ(VS)セグメンテーションにおいて第1位となった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:53:33 GMT)
Holo-VQVAE: VQ-VAE for phase-only holograms [1.5] ホログラフィーは視覚技術革新の最前線にあり、光波振幅と位相の操作による没入型3次元可視化を提供する。
ホログラム生成に関する最近の研究は、主に画像からホログラムへの変換に焦点を当てており、既存の画像からホログラムを生成する。
位相限定ホログラム(POHs)に適した新規な生成フレームワークであるHolo-VQVAEについて述べる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:27:28 GMT)
Excitonic Mott insulator in a Bose-Fermi-Hubbard system of moiré $\rm{WS}_2$/$\rm{WSe}_2$ heterobilayer [1.5] 遷移金属ジアルコゲナイドヘテロ二層膜を用いたフェミオンとボソニックの相互作用について検討した。
ボソンの弱い相互作用を持つ気体の期待挙動とは対照的に,励起子拡散はポンプ強度の増加に一定である。
我々のシステムは、量子多体モデルの探索に制御可能なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:09:42 GMT)
Implications of the AI Act for Non-Discrimination Law and Algorithmic Fairness [1.5] FATE(Fairness, Accountability, Transparency, Ethics in AI)コミュニティで議論されているように、AIの公平性というトピックは、ここ数年で有意義な議論を引き起こしている。
法的な観点から、特に欧州連合の法律では、多くのオープンな疑問が残る。
AI法は、非差別的な責任をAIモデルの設計段階に移すことで、これらの2つの概念をブリッジする大きな一歩を示すかもしれない。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:54:09 GMT)
RLSynC: Offline-Online Reinforcement Learning for Synthon Completion [1.5] セミテンプレート法におけるシントーン補完のためのオフラインオンライン強化学習法 RLSynC を開発した。
以上の結果から,RTSynCは14.9%の精度で,最先端のシントーン完成法より優れることが示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:36:03 GMT)
MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning [1.4] 大規模データセットに事前トレーニングされたモデルを、さまざまな下流タスクに適応させることは、ディープラーニングにおける一般的な戦略である。
パラメータ効率のよい微調整手法は、最小限のパラメータだけを訓練しながら、事前訓練されたモデルを異なるタスクに適応させる有望な方法として登場した。
本稿では,マルチタスク学習モデルのパラメータ効率向上のための新しいフレームワークMTLoRAを紹介する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:43:58 GMT)
LACS: Learning-Augmented Algorithms for Carbon-Aware Resource Scaling with Uncertain Demand [1.4] 本稿では,未知の作業時間(OCSU)を用いたオンラインCO_2-Awareリソーススケーリング問題について検討する。
我々は,論理的に堅牢な学習拡張アルゴリズムであるLACSを提案し,OCSUを解く。
LACSは、納期を意識した炭素に依存しない作業と比較して、炭素フットプリントの32%の削減を実現している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:54:22 GMT)
Potential quantum advantage for simulation of fluid dynamics [1.4] 我々は,量子コンピューティングを用いて乱流を制御したナビエ・ストークス方程式をシミュレートするために,潜在的な量子指数的高速化を実現することができることを示す。
この研究は、非線形多スケール輸送現象をシミュレートする指数的な量子優位性が存在することを示唆している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:20:12 GMT)
A multiobjective continuation method to compute the regularization path of deep neural networks [1.4] 数値効率を保証し、モデルの解釈性を改善し、堅牢性を向上させるため、ディープニューラルネットワーク(DNN)では、スパシティは高い特徴である。
本稿では,数百万のパラメータを持つ高次元勾配に対して,上述の目的に対するスパースフロント全体を極めて効率的な方法で実現するアルゴリズムを提案する。
正規化パスの知識がネットワークパラメトリゼーションを十分に一般化することを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:25:29 GMT)
Path planning of magnetic microswimmers in high-fidelity simulations of capillaries with deep reinforcement learning [1.3] ヒト網膜に存在する複雑な毛細血管網で進化する人工細菌鞭毛(ABF)のシミュレーションを行った。
ABFは、予め縮小順序モデルに基づいて訓練された強化学習剤により、所定の目標に頑健に誘導される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:01:09 GMT)
Optimal s-boxes against alternative operations [1.3] 4ビットのs-ボックスを持つ暗号の並列な代替操作において線形性を示す拡散層を分類する。
最適4ビットs-ボックスの全クラスに対する代替演算に対する微分挙動について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:48:04 GMT)
MedPromptX: Grounded Multimodal Prompting for Chest X-ray Diagnosis [1.3] 胸部X線像は急性および慢性の心肺疾患の予測に一般的に用いられている。
構造化された臨床データと統合する努力は、不完全な電子健康記録による課題に直面している。
本稿では,MedPromptXについて紹介する。MedPromptXはマルチモーダル大言語モデル(MLLM),少数ショットプロンプト(FP),視覚的グラウンドディング(VG)を統合した最初のモデルである。
その結果、MedPromptXのSOTA性能を示し、ベースラインに比べてF1スコアが11%向上した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:44:18 GMT)
WhatsApp Explorer: A Data Donation Tool To Facilitate Research on WhatsApp [1.3] 本稿では,WhatsAppデータ収集を大規模に実現するツールであるWhatsApp Explorerを紹介する。
我々は、潜在的なサンプリングアプローチを含む、データ収集のためのプロトコルについて議論し、我々のツール(および隣接するプロトコル)がWhatsAppデータを倫理的かつ法的に、大規模に収集することを可能にする理由を説明します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:30:29 GMT)
Wait, It's All Token Noise? Always Has Been: Interpreting LLM Behavior Using Shapley Value [1.2] 大規模言語モデル(LLM)は、人間の行動や認知過程をシミュレートするエキサイティングな可能性を開いた。
しかし, LLMを人体用スタンドインとして活用する妥当性は, いまだに不明である。
本稿では,モデルの出力に対する各プロンプト成分の相対的寄与を定量化するために,シェープリー値に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:49:43 GMT)
ITCMA: A Generative Agent Based on a Computational Consciousness Structure [1.2] 本稿では,計算意識構造である内部時間意識機械(ITCM)を紹介する。
オープンワールド環境における行動生成と推論を支援するITCMベースのエージェント(ITCMA)を提案する。
四足歩行ロボットを用いた実世界のタスクでは、トレーニングされていないITCMAは85%のタスク完了率を達成し、実世界の設定で同等のユーティリティを実証する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:23:18 GMT)
Where Are You From? Let Me Guess! Subdialect Recognition of Speeches in Sorani Kurdish [1.2] 研究対象地域はイラクのクルディスタン地方である。
107回のインタビューから29時間16分40秒の音声録音を蓄積しました。
我々は、ANN、CNN、RNN-LSTMの3つのディープラーニングモデルを適用した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:27:04 GMT)
CT respiratory motion synthesis using joint supervised and adversarial learning [1.1] 本研究では,静止画像から擬似呼吸CT位相を生成する深層合成法を提案する。
このモデルでは,外部の患者表面をベースとしたコンディショニング合成により,患者特異的な変形ベクトル場(DVF)を生成する。
その結果, 生成した擬似呼吸CTの位相が, 同一患者の4DCTスキャンと同等の精度で臓器, 腫瘍の運動を捉えることができた。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:40:12 GMT)
Specifying Genericity through Inclusiveness and Abstractness Continuous Scales [1.0] 本稿では,自然言語における名詞句(NP)の詳細なモデリングのための新しいアノテーションフレームワークを提案する。
このフレームワークはシンプルで直感的に設計されており、専門家でないアノテータにもアクセスでき、クラウドソースのタスクに適している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:43:37 GMT)
Deepfake Sentry: Harnessing Ensemble Intelligence for Resilient Detection and Generalisation [0.9] 本稿では,持続的かつ積極的なディープフェイクトレーニング強化ソリューションを提案する。
我々は、ディープフェイクジェネレータモデルによって導入されたアーティファクトの効果を模倣するオートエンコーダのプールを採用する。
実験の結果,提案するアンサンブル・オートエンコーダに基づくデータ拡張学習手法が一般化の点で改善されていることがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:09:08 GMT)
Linear Hashing with $\ell_\infty$ guarantees and two-sided Kakeya bounds [0.9] 有限体上のランダムに選択された線型写像が $ell_infty$ の意味でよいハッシュ関数を与えることを示す。
負荷分散文献[RS98]からの既知のバウンダリにより、この結果は厳密であり、線形関数とトラリーランダム関数がエントロピー損失の定数因子であることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:27:03 GMT)
EnCoMP: Enhanced Covert Maneuver Planning using Offline Reinforcement Learning [0.8] 本研究では,ロボットが自然環境や人工環境の特徴をカバーとして識別し,活用するためのナビゲーションシステムを提案する。
我々の知覚パイプラインはLiDARデータを利用して高忠実度カバーマップと潜在的な脅威マップを生成する。
実環境から収集した多様なデータセットを用いてオフラインの強化学習モデルを訓練する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:03:10 GMT)
The qudit Pauli group: non-commuting pairs, non-commuting sets, and structure theorems [0.8] クディット・パウリ群の構造について、合成を含め、いくつかの点で$d$について研究する。
任意の特定の可換関係に対して、これらの関係を満たすクディット・パウリの集合を構築する。
また、互いに非可換なパウリ集合の最大サイズと、ペアで非可換な集合についても検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:21:21 GMT)
Verifying the Selected Completely at Random Assumption in Positive-Unlabeled Learning [0.8] 観測されたデータがSCARの仮定に合致するかどうかを判定するために,比較的単純で計算的に高速なテストを提案する。
本テストは,SCAR ケースに適合する人工ラベルを生成することに基づいて,SCAR の null 仮説の下での試験統計量の分布を模倣することができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:36:58 GMT)
Augmented Reality Warnings in Roadway Work Zones: Evaluating the Effect of Modality on Worker Reaction Times [0.7] 本研究では、異なるAR警告の組み合わせが労働者の反応時間に与える影響を分析することにより、道路作業区域内の安全対策を改善することを目的とする。
提案手法は,高度なARシステムのプロトタイプ,ワークゾーン環境内のAR機能のVRシミュレーション,実験間でユーザエクスペリエンスを同期するWizard of Ozテクニックの3つの重要なコンポーネントから構成される。
コントロールされた屋外ワークゾーンと屋内VR設定で5つの実験を行うことで、さまざまなマルチモーダルAR警告が労働者の反応時間に与える影響について貴重な情報を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:14:36 GMT)
Word Ladders: A Mobile Application for Semantic Data Collection [0.7] Word LaddersはAndroidとiOS向けの無料のモバイルアプリケーションで、言語データを集めるために開発された。
ゲームロジック、モチベーション、期待された結果、および認知科学的オープンな質問の調査について説明する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:41:40 GMT)
Review-Based Cross-Domain Recommendation via Hyperbolic Embedding and Hierarchy-Aware Domain Disentanglement [0.7] Cross-Domain Recommendation (CDR)は、ドメイン共有可能な知識をキャプチャし、よりリッチなドメインからスパサーに転送する。
本稿では,ユーザ・イテム関係をモデル化するためのレビューテキストに基づく双曲型CDR手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:15:21 GMT)
Accurate Block Quantization in LLMs with Outliers [0.6] 極大規模LLMの推理需要はここ数カ月で大きく伸びている。
この問題は処理中のシーケンスの長さが爆発的に増加することで増大する。
重みとアクティベーションの両方の正確な量子化を可能にする様々な量子化技術が提案されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:15:06 GMT)
Individual Text Corpora Predict Openness, Interests, Knowledge and Level of Education [0.6] 個々の検索履歴から経験への開放性の個性次元を予測することができる。
個々のテキストコーパス(IC)は,平均500万ワードトークン数214人の参加者から生成される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:44:24 GMT)
Bayesian Nonparametrics: An Alternative to Deep Learning [0.6] この調査はベイズ非パラメトリックの重要性を掘り下げることを目的としており、特に統計学、計算機科学、電気工学など様々な分野における複雑な課題に対処することを目的としている。
ベイズ的非パラメトリック手法の汎用性と有効性を明らかにし、様々な分野にまたがる課題を複雑に解決する革新的な解決策の道を開く。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:32:42 GMT)
PLoc: A New Evaluation Criterion Based on Physical Location for Autonomous Driving Datasets [0.6] 本稿では,PLOCと呼ばれる物理位置情報に基づく新しい評価基準を提案する。
自動運転車のシナリオにおける歩行者の物理的な位置が、貴重な安全関連情報を提供できることを認識することで、従来の基準の限界を超越している。
提案したPLOC基準に基づいて,様々な物体検出モデルの性能を評価する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:28:26 GMT)
Non-invertible symmetries act locally by quantum operations [0.6] 場の量子論と多体系の非可逆対称性は対称性の概念を一般化する。
非可逆対称性は量子演算によって局所作用素に作用する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 08:54:53 GMT)
Video-Based Human Pose Regression via Decoupled Space-Time Aggregation [0.6] そこで我々は,Asmapなどの中間表現をバイパスし,その代わりに入力を直接共同座標にマッピングする,効率的で効果的なビデオベースヒューマンポーズ回帰手法を開発した。
本手法は, 隣り合う関節の空間的依存性と各関節の時間的依存性を効率よく, 柔軟に利用することができる。
我々のアプローチは、最先端のヒートマップベースのマルチフレームヒューマンポーズ推定手法に匹敵するか、同等である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:26:22 GMT)
TDANet: A Novel Temporal Denoise Convolutional Neural Network With Attention for Fault Diagnosis [0.5] 本稿では,音環境における故障診断性能を向上させるため,TDANet(Tunal Denoise Convolutional Neural Network With Attention)を提案する。
TDANetモデルは、その周期特性に基づいて1次元信号を2次元テンソルに変換し、マルチスケールの2次元畳み込みカーネルを用いて周期内および周期間の信号情報を抽出する。
CWRU (single sensor) とReal Aircraft Sensor Fault (multiple sensor) の2つのデータセットに対する評価は、TDANetモデルがノイズの多い環境下での診断精度において既存のディープラーニングアプローチを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:54:41 GMT)
Magic of Random Matrix Product States [0.5] L_1$-norm測度を用いて1次元のランダム行列生成状態(RMPS)の魔法を研究する。
数値計算の結果, 量子ビットの場合, マジックは指数関数的に増大することがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:36:36 GMT)
Diverse Feature Learning by Self-distillation and Reset [0.5] 本稿では,重要な特徴保存アルゴリズムと新しい特徴学習アルゴリズムを組み合わせたDFLを紹介する。
重要な特徴を保存するために、トレーニング中に観察される意味のあるモデルの重みを選択することで、アンサンブルモデルの自己蒸留を利用する。
新機能の学習には、定期的にモデルの一部を初期化するリセットを採用しています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:49:15 GMT)
A Lightweight Architecture for Real-Time Neuronal-Spike Classification [0.5] 本稿では,軽量な神経スパイク検出と分類アーキテクチャを提案する。
不要な情報をスパースニューラルネットワークからリアルタイムで破棄する。
これにより、(凝縮した)データはヘッドステージ上の取り外し可能な記憶装置に簡単に格納できる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:56:23 GMT)
Mixed-precision Supernet Training from Vision Foundation Models using Low Rank Adapter [0.5] 混合精度量子化スーパーネットに視覚基礎モデル(VFM)を微調整することを提案する。
この目的のために、スーパーネットベースのニューラルアーキテクチャサーチ(NAS)を採用することができる。
NASはスーパーネットをトレーニングし、任意のハードウェア予算内で抽出することができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:22:44 GMT)
UAV-Borne Mapping Algorithms for Low-Altitude and High-Speed Drone Applications [0.5] 本稿では,現状のセンサとUAV(Unmanned Aerial Vehicle)アプリケーションのためのマッピングアルゴリズムについて述べる。
新しい実験構造は、AirSimシミュレータとGoogle 3Dマップモデルを統合することで実現可能な、非常に現実的な環境を用いて作成される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:02:27 GMT)
NeuraLunaDTNet: Feedforward Neural Network-Based Routing Protocol for Delay-Tolerant Lunar Communication Networks [0.5] 宇宙は、厳しい遅延、予測の難しいルート、通信の中断といった課題を引き起こす。
従来のDTNルーティングプロトコルは、空間通信の本質的な複雑さのため、最適なパフォーマンスを提供できない。
本稿では,月面通信の効率を高める新しいプロトコルであるNeuraLunaDTNetを開発するために,フィードフォワードニューラルネットワークの利用を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:24:15 GMT)
MaxViT-UNet: Multi-Axis Attention for Medical Image Segmentation [0.5] MaxViT-UNetは医療画像セグメンテーションのためのハイブリッドビジョントランス (CNN-Transformer) である。
提案するハイブリッドデコーダは,各復号段階における畳み込み機構と自己保持機構の両方のパワーを利用するように設計されている。
復号器の各段階における多軸自己アテンションの包含は、対象領域と背景領域の識別能力を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:50:38 GMT)
Sample-Efficient and Surrogate-Based Design Optimization of Underwater Vehicle Hulls [0.5] 本稿では,BO-LCBアルゴリズムが最もサンプリング効率のよい最適化フレームワークであり,最適収束挙動を有することを示す。
また, DNN に基づく代理モデルでは, CFD シミュレーションと密に一致し, 平均絶対パーセンテージ誤差 (MAPE) が 1.85% であることを示す。
本稿では,サロゲートモデルを用いた設計最適化の2次高速化について述べる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:13:25 GMT)
Improved Stabilizer Estimation via Bell Difference Sampling [0.4] 安定化器の形式性に関して,様々なモデルにおける量子状態の学習の複雑さについて検討する。
Omega(n)$$T$gates は任意の Clifford+$T$ 回路で擬ランダム量子状態を作るのに必要であることを示す。
上記のアルゴリズムの修正は時間内に行われることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:56:54 GMT)
Hybrid Quantum Solvers in Production: how to succeed in the NISQ era? [0.4] 我々は、最も頻繁に使用されるハイブリッド・ソルバについて記述し分類する。
現在実運用にデプロイされている2つの解決器に特化しています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:47:30 GMT)
The $g$-theorem from Strong Subadditivity [0.3] 強部分付加性は2次元共形場理論における境界再正規化群フローに対する$g$-理論の単純な導出を与えることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:42:08 GMT)
Application of Machine Learning Algorithms in Classifying Postoperative Success in Metabolic Bariatric Surgery: A Comprehensive Study [0.3] 本研究は, メタボリック・バリウム手術の文脈において, 患者を分類するための新しい機械学習手法を提案する。
GaussianNB、ComplementNB、KNN、Decision Tree、RandomOverSamplerのKNN、SMOTEのKNNなど、さまざまな機械学習モデルを73人のデータセットに適用した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:27:37 GMT)
Decision Mamba: Reinforcement Learning via Sequence Modeling with Selective State Spaces [0.3] マンバは効率的かつ効率的なシーケンスモデリングの高度な能力で知られている。
本稿では,効率的かつ効率的なシーケンスモデリングの高度な能力で知られるMambaフレームワークを,決定変換器アーキテクチャに統合することについて検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:25:55 GMT)
ChatGPT v.s. Media Bias: A Comparative Study of GPT-3.5 and Fine-tuned Language Models [0.3] 本研究は,メディアバイアス識別ベンチマーク(MBIB)を活用して,この問題に答えようとするものである。
メディアバイアスの6つのカテゴリを区別し、BART、ConvBERT、GPT-2などの微調整されたモデルに差をつけ、ChatGPTの能力を評価する。
ChatGPTはヘイトスピーチとテキストレベルの文脈バイアスを検出するために微調整されたモデルと同等に機能するが、他のバイアス検出の微妙な要素で困難に直面している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:12:09 GMT)
IPA Transcription of Bengali Texts [0.2] 国際音声アルファベット(IPA)は、言語で音素を体系化する。
ベンガル音韻学と音声学では、IPA標準とベンガル中核音素に関する学術的な議論が続いている。
この研究は、先行研究を検証し、現在および潜在的な問題を特定し、ベンガルのIPA標準の枠組みを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:33:34 GMT)
Energy Efficient Deep Multi-Label ON/OFF Classification of Low Frequency Metered Home Appliances [0.2] 非侵入負荷監視(Non-Inrusive Load Monitoring、NILM)は、単一計測点からアプライアンスレベルのデータを取得するプロセスである。
本稿では,NILMのマルチラベル分類を改良した新しいDLモデルを提案する。
最先端モデルと比較して、提案モデルではエネルギー消費を23%以上削減している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:54:02 GMT)
Optimal Hospital Capacity Management During Demand Surges [0.1] 本研究では,サージイベント中の病院システム内のキャパシティ管理決定を最適化するためのデータ駆動型フレームワークを提案する。
2つの重要な決定は、戦術的な計画の観点で最適化されている。
この手法は、新型コロナウイルスのパンデミックの最盛期に病院システムで振り返って評価され、推奨された決定の潜在的影響を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:47:16 GMT)
Fine-tuning Large Language Models for Automated Diagnostic Screening Summaries [0.0] 我々は、精神状態検査から簡潔な要約を生成するために、いくつかの最先端の大規模言語モデル(LLM)を評価した。
確立されたROUGEメトリクスと人間評価器からの入力を用いて、要約生成のための4つの異なるモデルを厳格に評価する。
我々の最高性能の微調整モデルは既存のモデルより優れており、ROUGE-1とROUGE-Lはそれぞれ0.810と0.764である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:25:37 GMT)
What an event is not: unravelling the identity of events in quantum theory and gravity [0.0] 量子物理学と重力の交点における事象の概念を探求する。
様々な実験や思考実験を通じて、このような非古典的な文脈でイベントを定義するために、どの特性が使えるのか、あるいは利用できないのかを分析する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:22:16 GMT)
What Generative Artificial Intelligence Means for Terminological Definitions [0.0] 本稿では,ジェネレーティブ・人工知能(GenAI)ツールが用語定義の作成と消費に与える影響について検討する。
GenAIツールはAI支援のターミノグラフィー、特に編集後のターミノグラフィーを可能にする。
GenAIツールが、用語定義を含む利用者のすべての用語的ニーズを満たす可能性を、私たちが知っている用語的定義とリソースの存在に挑戦する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:51:32 GMT)
Voice Signal Processing for Machine Learning. The Case of Speaker Isolation [0.0] 本稿では,音声処理タスクの信号分解手法として最もよく用いられるフーリエ変換とウェーブレット変換の比較解析を行う。
展示の詳細なレベルは、特定のMLモデルの分解方法を選択し、微調整し、評価する際に、MLエンジニアが情報的な決定を下すのに十分である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:31:36 GMT)
Using Images as Covariates: Measuring Curb Appeal with Deep Learning [0.0] 本稿では、画像データを従来の計量モデルに統合する革新的な手法を詳述する。
住宅不動産の販売価格予測に動機づけられた深層学習の力を活用して「情報」を付加する
各画像内で提示される特異な特徴は、さらに汎視的セグメンテーションによって符号化された。
符号化されたデータに基づいてトレーニングされたニューラルネットワークからの予測は、サンプル外予測能力を改善する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:03:00 GMT)
Unobserving the Moon: the spurious possibility of orbital decoupling due to solar neutrino Arago spot [0.0] アラゴスポット(英: Arago spot)は、球状物体の周りの回折波の構成的干渉によって生じる影の中心における最大強度である。
太陽の日食の間、太陽から放出されるニュートリノのいくつかは月によって回折され、地球上で観測できる回折パターンをもたらす。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:52:05 GMT)
Unconditional verification of quantum computation with classical light [0.0] 既存の検証プロトコルは、量子コンピュータの悪意ある振る舞いを無条件に検出するために、量子通信を必要とする。
本稿では,検証者が量子コンピュータにコヒーレント光を送信した「物理的に古典的な」検証プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:50:34 GMT)
Transparency challenges in policy evaluation with causal machine learning -- improving usability and accountability [0.0] モデルがどのように見積を行うかを理解するには、グローバルに解釈可能な方法はない。
因果機械学習モデルが公正な方法で機能しているかどうかを理解するのは難しい。
本稿では,透明性の問題が公共政策評価アプリケーションにおける因果的機械学習の課題である理由を考察する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:49:02 GMT)
TransNeXt: Robust Foveal Visual Perception for Vision Transformers [0.0] 生体模倣設計に基づくトークンミキサーAggregated Attentionを提案する。
従来のクエリやキーと対話する学習可能なトークンを組み込んでいます。
集約された注意と畳み込みGLUを組み合わせて、TransNeXtと呼ばれる新しいビジュアルバックボーンを作成します。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 04:55:51 GMT)
Training neural networks with structured noise improves classification and generalization [0.0] ノイズの多いトレーニングデータに構造を加えることで,アルゴリズムの性能が大幅に向上することを示す。
また,Hebbian Unlearning(ヘビアン・アンラーニング・ルール)と呼ばれる規則は,雑音が最大値である場合のトレーニング・ウィズ・ノイズ・アルゴリズムと一致することを証明した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 09:57:24 GMT)
Study on a Quantization Condition and the Solvability of Schrödinger-type Equations [0.0] シュル・オーディンガー方程式の可解性に関連する量子化条件について検討する。
SWKB量子化条件はエネルギーの量子化を提供する。
古典-直交-ポリノミカル準特殊可解ポテンシャルを持つシュル・オーディンガー方程式の明示的な解を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:56:34 GMT)
Sparse multimodal fusion with modal channel attention [0.0] モーダルチャネルアテンション(MCA)と呼ばれるマルチヘッドアテンション機構にモーダル不完全チャネルを組み込んだマスク型マルチモーダルトランスフォーマーモデルの拡張を提案する。
その結果、モーダルな間隔がなくても、提案したMCA機構は、生成された埋め込み空間、リコールメトリクス、下流タスクにおけるその後のパフォーマンスを改善していることがわかった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:49:40 GMT)
SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks [0.0] 本研究では,一意に効率的な残差ネットワークであるEfficient-ResNetを用いたエンコーダデコーダアーキテクチャを提案する。
アテンションブーティングゲート(AbG)とアテンションブーイングモジュール(AbM)は、グローバルコンテキストの出力の等価サイズで同変および特徴に基づく意味情報を融合することを目的として展開される。
我々のネットワークは、挑戦的なCamVidとCityscapesのデータセットでテストされており、提案手法により、残余ネットワークに対する大幅な改善が示されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:42:21 GMT)
Restricting to the chip architecture maintains the quantum neural network accuracy [0.0] 変分量子アルゴリズム(VQA)は、量子機械学習モデルを構築するための重要な戦略である。
本稿では、最適ゲート列の決定、効率的なパラメータ最適化戦略、量子チップアーキテクチャが最終的な結果に与える影響の理解など、いくつかの重要な問題に対処することを目的とする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:45:11 GMT)
RealKIE: Five Novel Datasets for Enterprise Key Information Extraction [0.0] RealKIEは、キー情報抽出手法の進歩を目的とした、5つの挑戦的なデータセットのベンチマークである。
データセットには、SEC S1 Filings、US Non-disclosure Agreements、UK Charity Reports、FCC Invoices、Resource Contractsなど、さまざまなドキュメントが含まれている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:31:32 GMT)
Quantum trajectory of the one atom maser [0.0] 一原子メーザーモデルに付随するそのような量子軌道の特定のモデルを考える。
系が非共鳴であるとき、このマルコフ連鎖が一意な不変確率測度を持つことを証明する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:11:37 GMT)
Quantum simulation of entanglement and hadronization in jet production: lessons from the massive Schwinger model [0.0] 外部ソースに結合した大規模シュウィンガーモデルのリアルタイム応答について検討する。
古典的ハードウェア上での量子シミュレーションを用いて、生成したジェット間の絡み合いを研究する。
フェミオンフォック状態から中間子様境界状態への遷移を時間の関数として観察する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:00:00 GMT)
Quantum reservoir probing of quantum information scrambling [0.0] 我々は,任意の自由度でスクランブルを統一的に診断する量子貯水池探索法(QRP)を提案する。
量子カオス系において,QRPは,自由フェルミオン系における準粒子媒介情報伝達と相関媒介情報伝達の区別に成功していることを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:28:36 GMT)
Quantum limit to subdiffraction incoherent optical imaging. III. Numerical analysis [0.0] この研究は、量子境界の数値解析を行い、この法則が現実の非ゼロの物体のサイズに対してうまく機能していることを検証する。
また,空間モードデマルチプレクシング (SPADE) と呼ばれる測定値の最適性について検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:37:47 GMT)
Quantum critical engine at finite temperatures [0.0] 有限温度浴を動力とする量子臨界オットーエンジンを構築する。
エンジンの作業出力は,作業媒体の臨界指数に依存する普遍的な電力法則の挙動を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:38:21 GMT)
Privacy-Preserving Data Aggregation Techniques for Enhanced Efficiency and Security in Wireless Sensor Networks: A Comprehensive Analysis and Evaluation [0.0] プライバシを維持しつつ,無線センサネットワークのデータ収集を多次元かつ効果的に行う方法を提案する。
このシステムはデータ損失に耐性があり、アクティブとパッシブの両方のプライバシー侵害攻撃に対して安全である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:09:22 GMT)
Phase transitions induced by standard and predetermined measurements in transmon arrays [0.0] 測定誘起相転移は、閉じ込められたイオンと超伝導量子デバイスからなる量子系で観測されている。
魅力的なボース・ハッバードモデルによりモデル化されたトランスモンアレイは、定常状態における軌道のアンサンブルの絡み合いエントロピー特性の相転移を示すことを示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:00:29 GMT)
Phase estimation via number-conserving operation inside the SU(1,1) interferometer [0.0] ホモダイン検出による位相測定の精度向上のための理論的手法を提案する。
本稿では,数保存操作が位相感度,量子フィッシャー情報,量子クレーマー・ラオ境界に与える影響を,理想的・光子損失の両方のシナリオで解析する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 11:04:38 GMT)
Optimal Policy Learning with Observational Data in Multi-Action Scenarios: Estimation, Risk Preference, and Potential Failures [0.0] 本稿では、最適政策学習と観測データを扱う。
それは、見積もり、リスク優先、潜在的な失敗の3つの部分に分かれています。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:55:06 GMT)
Optimal Blackjack Strategy Recommender: A Comprehensive Study on Computer Vision Integration for Enhanced Gameplay [0.0] ブラックジャックの文脈におけるカードの検出・認識におけるコンピュータビジョン技術の適用について検討した。
提案手法は, K-Means を用いて画像分割, カード再投影, 特徴抽出を行う。
本研究の目的は、異なる照明条件下での各種カード設計の検出において、このアプローチの有効性を観察することである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 23:17:49 GMT)
Notes on the type classification of von Neumann algebras [0.0] これらのノートはフォン・ノイマン代数の型分類の説明を与える。
目標は、専門家でない読者には技術的すぎるリソース間の文学のギャップを埋めることです。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:54:16 GMT)
Nonlinearity Enhanced Adaptive Activation Function [0.0] 十分な計算資源を必要とせず、ニューラルネットワークの精度を高めるような、立方次非線形性さえも持つ活性化関数が導入された。
関連する精度向上を、MNIST桁データセットのコンテキストで定量化する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:33:37 GMT)
New Online Communities: Graph Deep Learning on Anonymous Voting Networks to Identify Sybils in Polycentric Governance [0.0] 本研究では,ブロックチェーンに基づく分散自律組織(DAOs)におけるデジタル資産の多元的ガバナンスについて検討する。
理論的な枠組みを提供し、シビル(Sybils)を識別する手法を開発することで、分散ガバナンスに直面する重要な課題に対処する。
この実験方法は、オートエンコーダアーキテクチャとグラフ深層学習技術を用いて、ガバナンスデータセット内のSybilアクティビティを識別する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 19:14:18 GMT)
Multi-Label Classification of Thoracic Diseases using Dense Convolutional Network on Chest Radiographs [0.0] そこで本研究では,1回の検査で複数の病態を検出できる多ラベル疾患予測モデルを提案する。
提案モデルでは,AUCスコアが0.896であった。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:57:25 GMT)
Mol-AIR: Molecular Reinforcement Learning with Adaptive Intrinsic Rewards for Goal-directed Molecular Generation [0.0] Mol-AIRは、ゴール指向分子生成のための適応型固有報酬を用いた強化学習ベースのフレームワークである。
ベンチマークテストでは、Moll-AIRは所望の特性を持つ分子を生成する既存のアプローチよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:44:51 GMT)
Modeling Large-Scale Walking and Cycling Networks: A Machine Learning Approach Using Mobile Phone and Crowdsourced Data [0.0] オーストラリア,ニューサウスウェールズ州の大規模地域ネットワークを横断する日中歩行量とサイクリング量を推定するための機械学習に基づくモデリング手法を開発し,適用した。
この研究では、モデルトレーニング、テスト、推論の3つの側面すべてに関連する、ユニークな課題と制限について論じている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 21:37:23 GMT)
Loss resilience of driven-dissipative remote entanglement in chiral waveguide quantum electrodynamics [0.0] 遠隔量子ビット間の絡み合い安定化の限界について検討する。
一対のストレージキュービットを2つの駆動キュービットに結合することにより、定常状態を調整できることが分かる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:29:34 GMT)
Locality bounds for quantum dynamics at low energy [0.0] 空間的局所ハミルトニアンの低エネルギー密度状態における量子力学の一般的な減速について論じる。
ハミルトニアンのある種のクラスでは、低エネルギーでの粒子運動の「バタフライ速度」は、次元解析から予想されるように、E(2k-1)/2k$のスケールの上限を持つ。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:47:21 GMT)
Localising the Seizure Onset Zone from Single-Pulse Electrical Stimulation Responses with a Transformer [0.0] 本稿では,Single Pulse Electro Stimulation (SPES) 応答を用いたSOZローカライゼーションのための深層学習の応用を推し進める。
チャネル間アテンションを組み込んだTransformerモデルを提案する。
本研究は, これらのモデルを用いて, 既往の患者に対する汎用性や電極配置の評価を行う。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:51:50 GMT)
Is Winter Coming? [0.0] 我々は,「春冬(または他の冬)がやってくる」というしばしば作られた観察結果と,それに備える,あるいはその冬に備える,必然的に到着する,関連する警告について検討する。
最も表面的な証拠でもわかるのは、こうした主張が誇張されているだけでなく、事実的に間違っているということだ。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 05:07:48 GMT)
High-dimensional analysis of ridge regression for non-identically distributed data with a variance profile [0.0] 線形回帰に対する尾根推定器の予測リスクを分散プロファイルを用いて検討した。
ある種の分散プロファイルについては、よく知られた二重降下現象の出現に注目した。
また、独立分散データと同一分散データの標準設定で存在する類似点と相違点についても検討する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:24:49 GMT)
Harmonic Oscillator with a Step and its Isospectral Properties [0.0] 原点における有限ジャンプ$a$の高調波発振器の1次元シュリンガー方程式について検討する。
この解法は、通常のマッチング技術を用いて構成される。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 06:33:13 GMT)
Gate generation for open quantum systems via a monotonic algorithm with time optimization [0.0] オープンシステムのための量子ゲートを生成するための単調な数値アルゴリズムを提案する。
予備的な実装は、このアルゴリズムがキャットキュービットゲートに適していることを示している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:43:29 GMT)
Exploiting separation-dependent coherence to boost optical resolution [0.0] 空間モード多重化手法を用いて任意の相互コヒーレンスを共有する2つの熱源を分離する。
我々の分析研究は、コヒーレンスと排出率がソース間の分離に依存し、かすかなソース制限に制限されないシナリオを含む。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:38:11 GMT)
Exact WKB analysis for ${\cal PT}$ symmetric quantum mechanics: Study of the Ai-Bender-Sarkar conjecture [0.0] ABS予想は、エネルギースペクトルやユークリッド分割関数に関するエルミート理論の$D$次元の$cal PT$-symmetric theoryと解析的連続(AC)の関係に関するものである。
エネルギー解に対して異種計算を行うことで、ABS予想の妥当性を検証するとともに、それが破られた場合のボレル再仮定理論による代替形の可能性を求める。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 03:42:52 GMT)
Euclidean and Affine Curve Reconstruction [0.0] 所定のユークリッド曲率やアフィン曲率で平面曲線を再構成する実践的側面を考察する。
これらの曲率はそれぞれ特殊ユークリッド群と同値群の下で不変である。
このような再構成のためのアルゴリズムを議論し実装し、適切な測定値における曲率の密接度に対する再構成曲線の密接度を推定する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 20:10:38 GMT)
Enhancing Lithological Mapping with Spatially Constrained Bayesian Network (SCB-Net): An Approach for Field Data-Constrained Predictions with Uncertainty Evaluation [0.0] SCB-Netは、空間的に制約された予測を生成しながら、補助変数からの情報を効果的に活用することを目的としている。
SCB-Netはカナダのケベック州北部の2つの地域に適用されている。
この研究は、特に複雑な空間的特徴学習タスクの処理において、ジオリニアにおけるディープニューラルネットワークの有望な進歩を強調した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:17:30 GMT)
Enhancing Dimension-Reduced Scatter Plots with Class and Feature Centroids [0.0] データセットが2次元に縮小されると、各観測は x と y の座標に割り当てられ、散乱プロット上の点として表される。
重要な課題は、次元減少に固有の複雑さのため、x と y の軸の意味を解釈することである。
本研究は, 次元減少から導出されるx, y座標を用いて, 散乱プロット上にオーバーレイ可能なクラスおよび特徴セントロイドを計算することで, この課題に対処する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 15:45:25 GMT)
Energetics of a pulsed quantum battery [0.0] 本稿では,充電器とエネルギホルダからなる2成分量子電池の透過的解析モデルを提案する。
我々は、パルスの駆動強度、充電器とホルダーの結合、環境への必然的なエネルギー損失の観点から、電池の最適設計について議論する。
我々は、我々の理論が、真に量子電池の第1世代を特徴づける、初期段階の実験的な構築のための有用なガイドとして機能することを期待している。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:54:53 GMT)
Distributed agency in second language learning and teaching through generative AI [0.0] ChatGPTは、テキストまたは音声形式のチャットを通じて非公式な第二言語プラクティスを提供することができる。
インストラクタはAIを使って、さまざまなメディアで学習と評価材料を構築することができる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 14:55:40 GMT)
Dimensional reduction for a system of 2D anyons [0.0] タイト導波路内のエノンの2次元系の次元的低減について検討する。
固有関数と固有関数の双方が、この還元の過程で緩やかな収束方向と厳密な収束方向に分離されることを証明した。
$x$-directionの極限1Dは、$alpha$に依存せず、2Dモデルの長距離相互作用の痕跡も残っていないトンクス=ジラルドー・ボース気体によって与えられる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:07:15 GMT)
DataAgent: Evaluating Large Language Models' Ability to Answer Zero-Shot, Natural Language Queries [0.0] OpenAIのGPT-3.5をLanguage Data Scientist(LDS)として評価する
このモデルは、さまざまなベンチマークデータセットでテストされ、そのパフォーマンスを複数の標準で評価した。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:59:34 GMT)
Counterdiabatic, Better, Faster, Stronger: Optimal control for approximate counterdiabatic driving [0.0] この論文は、最適制御技術とSTAの普遍的手法を組み合わせた新しい方法の発見に焦点を当てている:反断熱駆動(CD)
CDアプローチは、プロセスの速度に関係なく、時間依存ハミルトニアンによって駆動されるシステムによって経験される全ての非断熱効果を完璧に抑制する。
この論文で示された主な成果は、反断熱最適化局所駆動(COLD)と呼ばれる新しい手法の開発である。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:18:10 GMT)
Controlling the dynamics of atomic correlations via the coupling to a dissipative cavity [0.0] 量子クエンチ後に共振器に結合した相互作用するボゾンガス中のコヒーレンスの周期振動の開始を報告する。
この挙動は、空洞場の量子散逸性の性質と、散逸系における(近似的な)強い対称性の存在の相互作用から生じる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:18:21 GMT)
Conformal Prediction for Stochastic Decision-Making of PV Power in Electricity Markets [0.0] コンフォメーション予測(CP)は、日々の太陽光発電電力予測の確率予測手法である。
CPを特定の入札戦略と組み合わせることで、エネルギーの不均衡を最小限に抑えて高い利益を得ることができる。
具体的には、k-アネレスト近傍の共形予測システムと無作為な森林回帰の後にモンドリアン・ビンニングを用いると、最良の利益が得られる。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:34:57 GMT)
Classification of Diabetic Retinopathy using Pre-Trained Deep Learning Models [0.0] 糖尿病網膜症(DR)は、特に20歳から70歳までの人の視覚障害の主要な原因である。
本稿では,正常,軽度,中等度,重症,増殖性糖尿病網膜症(PDR)の5つの分類に分類するコンピュータ支援診断システムを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 01:11:56 GMT)
Charge-parity switching effects and optimisation of transmon-qubit design parameters [0.0] 包括的雑音モデルに基づく量子ビット設計パラメータの最適範囲を同定する。
電荷パリティスイッチは、2量子ゲートの準粒子関連エラー源となる。
本稿では,量子回路実行のための性能指標を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 12:40:52 GMT)
CP HDR: A feature point detection and description library for LDR and HDR images [0.0] コンピュータビジョンにおいて、特徴とは、コーナー、エッジ、テクスチャ、あるいはコントラストの高い領域などの独特の特性を持つ画像領域を指す。
ほとんどのFP検出および記述方法は低ダイナミックレンジ(LDR)画像を使用し、デジタル画像を含むほとんどのアプリケーションに十分である。
一方、高ダイナミックレンジ(HDR)画像は、通常より広いダイナミックレンジを示すが、FP検出アルゴリズムはそのような画像の全ての情報を利用するわけではない。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 02:42:22 GMT)
Bulk-boundary correspondence in point-gap topological phases [0.0] 非エルミート系の顕著な特徴は、2つの異なるタイプの位相が存在することである。
1つはエルミート位相を一般化し、もう1つは非エルミート系に固有のものである。
このレターは、非エルミート系の点ギャップ位相におけるバルク境界対応を確立する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:24:25 GMT)
Beyond Suspension: A Two-phase Methodology for Concluding Sports Leagues [0.0] プロスポーツリーグは、新型コロナウイルスの感染拡大などさまざまな理由で休業する可能性がある。
再オープン時にリーグが対処しなければならない重要な疑問は、シーズンを短縮した時間枠で終了するために残りのゲームのサブセットを適切に選択する方法である。
本稿では,データ駆動型モデルを提案する。予測分析と規範解析を利用して,当初予定されていたゲームのサブセットで構成されたシーズンの残りを決定論的にスケジュールする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:23:35 GMT)
Artificial consciousness. Some logical and conceptual preliminaries [0.0] 人工システムにおいて実現可能か,あるいは実現可能かというバランスのとれた議論のために,意識の次元とプロファイルを用いることの必要性を論じる。
本論文の主目的は, 人工意識領域における理論的問題について概観することである。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 13:47:47 GMT)
Almost optimal measurement scheduling of molecular Hamiltonian via finite projective plane [0.0] 本稿では,量子コンピュータ上での量子化学における分子ハミルトニアンの測定方法を提案する。
分子軌道の個数である$N$は、先頭の順で2N2$の異なる測定を必要とする。
分子ハミルトニアンの期待値を評価することは、量子デバイスによる量子化学への応用における主要なボトルネックの1つであるため、我々はそのような応用を加速することが期待されている。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 22:09:29 GMT)
Algorithms for Non-Negative Matrix Factorization on Noisy Data With Negative Values [0.0] 非負行列分解(Non- negative matrix factorization, NMF)は, ノイズデータを解析するための次元還元法である。
本稿では、入力データのノイズと導入された負性の両方を扱えるShift-NMFとNearly-NMFの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 17:10:55 GMT)
Aggregating Local and Global Features via Selective State Spaces Model for Efficient Image Deblurring [0.0] 本稿では,高密度かつ高精度な特徴を集約するために,選択的構造化状態空間モデルを利用する効率的な画像デブロアリングネットワークを提案する。
実験により,提案手法は広く用いられているベンチマークにおいて,最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 10:40:41 GMT)
A novel decision fusion approach for sale price prediction using Elastic Net and MOPSO [0.0] 価格予測アルゴリズムは、市場動向、予測された需要、その他の特性に応じて、すべての製品またはサービスの価格を提案する。
価格予測における依存変数として、いくつかの独立変数および相関変数に影響される。
本研究では,価格予測において情報変数を選択するための新たな意思決定レベル融合手法を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 07:59:33 GMT)
A Versatile Hong-Ou-Mandel Interference Experiment in Optical Fiber for the Undergraduate Laboratory [0.0] ホン・ウー・マンデル干渉(Hong-Ou-Mandel、HOM)は量子光学研究所の実験で、近年、学部生がよりアクセスしやすくなっている。
我々は、連続的に再現可能な実験を行うための代替光ファイバベースの装置を提案する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 16:26:28 GMT)
A Survey of Machine Learning Techniques for Improving Global Navigation Satellite Systems [0.0] 本稿では,機械学習(ML)の最近の進歩とその限界に対処する可能性を強調する。
教師なし学習、教師なし学習、ディープラーニング、ハイブリッドアプローチなど、幅広いML手法をカバーする。
このサーベイは、信号解析、異常検出、マルチセンサー統合、予測、MLを用いた精度向上といった、位置決めアプリケーションに関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 18:31:50 GMT)
A Backdoor Approach with Inverted Labels Using Dirty Label-Flipping Attacks [0.0] 本研究では,「Dirty Flipping」というバックドア攻撃を提案する。
これは"label-on-label"という汚いラベル技術を使用して、ターゲットクラスに関連する選択されたデータパターンのトリガ(拍手)を入力し、ステルスなバックドアを可能にする。
論文参考訳(メタデータ) (Fri, 29 Mar 2024 00:09:48 GMT)