A Survey of Reasoning with Foundation Models [235.7] 推論は、交渉、医療診断、刑事捜査など、様々な現実世界の環境において重要な役割を担っている。
基礎モデルの開発が進み、推論タスクの能力を探究することへの関心が高まっている。
本稿では,様々な推論タスク,メソッド,ベンチマークの最新の進歩を浮き彫りにして,推論に適応する基礎モデルを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:16:13 GMT)
Deep Unrestricted Document Image Rectification [110.6] 文書画像修正のための新しい統合フレームワークDocTr++を提案する。
我々は,階層型エンコーダデコーダ構造を多スケール表現抽出・解析に適用することにより,元のアーキテクチャをアップグレードする。
実際のテストセットとメトリクスをコントリビュートして、修正品質を評価します。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:18:33 GMT)
VidToMe: Video Token Merging for Zero-Shot Video Editing [100.8] 本稿では,フレーム間で自己注意トークンをマージすることで,生成ビデオの時間的一貫性を高める新しい手法を提案する。
本手法は時間的コヒーレンスを改善し,自己アテンション計算におけるメモリ消費を削減する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:05:56 GMT)
ELSA: Partial Weight Freezing for Overhead-Free Sparse Network
Deployment [95.0] 本稿では,異なるレベルの空間に容易に展開可能な深層ネットワーク構築のための実用的ソリューションであるELSAを提案する。
中心となる考え方は、重みの適切なサブセットとして、1つの高密度ネットワークに1つ以上のスパースネットワークを埋め込むことである。
予測時には、任意のスパースモデルを、予め定義されたマスクに従って単純に重みをゼロにすることができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:38:51 GMT)
ZeroSCROLLS: A Zero-Shot Benchmark for Long Text Understanding [86.1] 我々は、長いテキスト上での自然言語理解のためのゼロショットベンチマークであるZeroSCROLLSを紹介する。
SCROLLSベンチマークから6つのタスクを適応させ、新しい2つの情報拡散タスクを含む4つのデータセットを追加します。
クロードはChatGPTより優れており、GPT-4は最高スコアを得る。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:05:09 GMT)
Single Image Backdoor Inversion via Robust Smoothed Classifiers [76.7] 隠れたバックドアを1枚の画像で復元できるバックドア・インバージョンのための新しいアプローチを提案する。
本研究では,1枚の画像で隠れたバックドアを復元できる,バックドア・インバージョンのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:11:52 GMT)
DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.3] 本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:00:55 GMT)
Re-parameterized Low-rank Prompt: Generalize a Vision-Language Model
within 0.5K Parameters [75.3] そこで我々は,RLP(Re- parameterized Low-rank Prompt)という新しいタイプのプロンプトを開発した。
11データセットを超える一連のタスクにおいて、RLPは0.5Kパラメータだけで古典的なプロンプトチューニングの平均下流精度を最大5.25%向上させる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:42:43 GMT)
Multi-level Reasoning for Robotic Assembly: From Sequence Inference to
Contact Selection [74.4] 本稿では,PAST(Part Assembly Sequence Transformer)を用いて,対象とするブループリントからアセンブリシーケンスを推論する。
次に、モーションプランナーと最適化を使用して、部品の動きと接触を生成する。
実験結果から,本手法は従来手法よりも一般化されていることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:47:13 GMT)
Machine-Created Universal Language for Cross-lingual Transfer [73.4] 代替中間言語として,MUL(Machine-created Universal Language)を提案する。
MULは、MUL翻訳者に対する普遍的な語彙と自然言語を形成する独立したシンボルの集合からなる。
MULは、様々な言語から共有される概念を単一の普遍語に統一し、言語間の移動を強化する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 03:20:13 GMT)
SAI3D: Segment Any Instance in 3D Scenes [72.7] 新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。
我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。
Scan-Netとより挑戦的なScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:05:47 GMT)
A Weighted K-Center Algorithm for Data Subset Selection [70.5] サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:41:07 GMT)
Robust 3D Tracking with Quality-Aware Shape Completion [68.0] そこで本研究では,高密度および完全点の雲からなる合成対象表現について,ロバストな3次元追跡のための形状完備化により正確に表現する。
具体的には, 形状が整ったボキセル化3次元追跡フレームワークを設計し, ノイズのある歴史的予測の悪影響を軽減するために, 品質に配慮した形状完備化機構を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:50:24 GMT)
ULTRA-DP: Unifying Graph Pre-training with Multi-task Graph Dual Prompt [67.9] 本稿では,タスク識別と位置識別をGNNに注入する,グラフハイブリッド事前学習のための統合フレームワークを提案する。
また,約$k$-nearest隣人のグループに基づいた,新しい事前学習パラダイムを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:16:44 GMT)
Interpretable Causal Inference for Analyzing Wearable, Sensor, and
Distributional Data [67.1] 本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:42:42 GMT)
Bi-directional Adapter for Multi-modal Tracking [67.0] 汎用の双方向アダプタを用いたマルチモーダル視覚プロンプト追跡モデルを提案する。
我々は、モーダリティ固有の情報をあるモーダリティから別のモーダリティへ転送するための、シンプルだが効果的なライト・フィーチャー・アダプタを開発した。
本モデルでは,完全微調整法と素早い学習法の両方と比較して,追跡性能が優れている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:27:31 GMT)
StyleSinger: Style Transfer for Out-Of-Domain Singing Voice Synthesis [65.6] ドメイン外歌唱音声合成(SVS)のためのスタイル転送は、目に見えないスタイルで高品質な歌唱音声を生成することに焦点を当てている。
StyleSingerは、ドメイン外参照音声サンプルのゼロショットスタイル転送のための最初の歌声合成モデルである。
ゼロショット・スタイル・トランスファーにおける評価は、StyleSingerが基準歌唱音声サンプルの音質と類似性の両方でベースライン・モデルより優れていることを不確実に証明している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:26:16 GMT)
Learning Discrete-Time Major-Minor Mean Field Games [61.1] 本稿では,M3FG(Major-minor MFG)の新たな離散時間バージョンと,実演に基づく学習アルゴリズムを提案する。
M3FGは一般的な雑音でMFGを一般化し、ランダムな異種環境状態だけでなく、メジャープレイヤーも扱える。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:22:08 GMT)
Primitive-based 3D Human-Object Interaction Modelling and Programming [59.5] 本研究では,人間と物体の両方を符号化する新しい3次元幾何学的原始言語を提案する。
プリミティブと画像を組み合わせた3D HAOIのベンチマークを構築した。
このプリミティブベースの3DHAOI表現は、3DHAOI研究の道を開くと信じている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:16:49 GMT)
A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.1] マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:45:15 GMT)
Artificial intelligence optical hardware empowers high-resolution
hyperspectral video understanding at 1.2 Tb/s [53.9] 本研究は,多次元映像理解のためのハードウェアアクセラレーション型集積光電子プラットフォームをリアルタイムに導入する。
この技術プラットフォームは、人工知能ハードウェアと光学的に情報を処理し、最先端のマシンビジョンネットワークを組み合わせる。
このような性能は、類似のスペクトル分解能を持つ最も近い技術の速度を3~4等級で上回る。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:51:38 GMT)
Latent Space Editing in Transformer-Based Flow Matching [53.8] Flow Matching with a transformer backboneはスケーラブルで高品質な生成モデリングの可能性を秘めている。
編集スペースである$u$-spaceを導入し、制御可能で、蓄積可能で、構成可能な方法で操作できる。
最後に,テキストプロンプトを用いた微粒でニュアンスな編集を実現するための,単純かつ強力な手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:49:59 GMT)
Zero Resource Code-switched Speech Benchmark Using Speech Utterance
Pairs For Multiple Spoken Languages [53.3] 我々は,自己教師型音声エンコーダのコード切替能力を評価するために,ゼロリソースコード切替音声ベンチマークを導入した。
本稿では,音声エンコーダのコードスイッチング能力を評価するために,離散単位に基づく言語モデリングのベースラインシステムを紹介する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:49:18 GMT)
Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.7] 本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:17:05 GMT)
Open3DIS: Open-vocabulary 3D Instance Segmentation with 2D Mask Guidance [51.6] Open3DISは3Dシーン内でのOpen-Vocabulary Instanceの問題に対処するために設計された新しいソリューションである。
3D環境内のオブジェクトは、さまざまな形状、スケール、色を示し、正確なインスタンスレベルの識別が困難なタスクとなる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:07:03 GMT)
Cross-Lingual Learning in Multilingual Scene Text Recognition [49.1] 多言語シーンテキスト認識(STR)のための言語間学習(CLL)
我々は,低リソース言語の性能向上のために,高リソース言語からの知識を活用した条件を見つけることを目的としている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:12:42 GMT)
LLMEval: A Preliminary Study on How to Evaluate Large Language Models [47.1] 我々は,様々な基準を手動評価と自動評価を比較し,現場,クラウドソーシング,パブリックアノテータ,GPT-4を用いて評価方法を分析する。
計2,186人が参加し、243,337のマニュアルアノテーションと57,511の自動評価結果が作成された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:39:05 GMT)
Knowledge Graph Prompting for Multi-Document Question Answering [46.3] 我々は,多文書質問応答(MD-QA)を促す上で,適切なコンテキストを定式化するための知識グラフプロンプティング(KGP)手法を提案する。
グラフ構築のために、パスや文書構造(例えば、ページ/テーブル)を象徴するノードを持つ複数のドキュメントに知識グラフ(KG)を作成する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:21:57 GMT)
Fair Enough? A map of the current limitations of the requirements to
have "fair" algorithms [46.2] 自動意思決定システムはバイアスや不当な格差を永久に、あるいは増幅することができる。
政策立案者を含む社会の層はますます「公正」なアルゴリズムを要求するようになった。
社会が自動意思決定システムから求めているものと、現実のシナリオにおいて実際に何を意味するものとの間には、行き詰まりがある。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:45:26 GMT)
Lane Graph as Path: Continuity-preserving Path-wise Modeling for Online
Lane Graph Construction [45.6] レーングラフの構築は、自動運転において有望だが挑戦的な課題である。
従来の方法は、通常、ピクセルまたはピースレベルでレーングラフをモデル化し、ピクセルワイドまたはピースワイド接続によってレーングラフを復元する。
本稿では,パスに基づくオンラインレーングラフ構築手法であるLaneGAPを提案し,パスをエンドツーエンドで学習し,Path2Graphアルゴリズムを用いてレーングラフを復元する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:52:14 GMT)
Data Efficient Language-supervised Zero-shot Recognition with Optimal
Transport Distillation [43.0] 本稿では,オンライン最適トランスポートを用いて,コントラスト学習のためのラベルとしてソフトな画像テキストマッチングを求めるOTTERを提案する。
事前訓練された画像とテキストエンコーダに基づいて、OTTERで訓練されたモデルは、3M画像テキストペアだけで強力なパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:47:04 GMT)
Rethinking Large Language Models in Mental Health Applications [42.2] 大規模言語モデル(LLM)は、メンタルヘルスにおいて貴重な資産となっている。
本稿では,精神保健分野におけるLSMの利用について考察する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:06:09 GMT)
DomainForensics: Exposing Face Forgery across Domains via Bi-directional
Adaptation [42.2] 最近のDeepFake検出手法は、公開データセットでは優れた性能を示しているが、新しい偽造品では著しく劣化している。
本稿では,教師なし領域適応の観点から新しい手法を提案する。
私たちのソリューションはDomainForensicsと呼ばれ、既知の偽造者から新しい偽造者へ偽造の知識を転送することを目的としています。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:46:46 GMT)
SHaRPose: Sparse High-Resolution Representation for Human Pose
Estimation [39.9] Sparse High- resolution Representations のみを人間の姿勢推定に用いるフレームワーク(SHaRPose)を提案する。
我々のモデルであるSHaRPose-Baseは、検証セット上で77.4 AP(+0.5 AP)、COCOテストデブセット上で76.7 AP(+0.5 AP)を達成し、ViTPose-Baseより1.4Times$速い速度で推論する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:29:16 GMT)
Online Boosting Adaptive Learning under Concept Drift for Multistream
Classification [34.6] マルチストリーム分類は,コンセプトドリフトを伴う動的ストリーミングプロセスにおいて,迅速な適応の必要性から,重要な課題となっている。
本稿では,異なるストリーム間の動的相関を適応的に学習する新しいオンラインブースティング適応学習法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:10:39 GMT)
Unraveling the Temporal Dynamics of the Unet in Diffusion Models [33.3] 拡散モデルはガウスノイズをトレーニングデータに導入し、元のデータを反復的に再構築する。
この反復プロセスの中心は単一のUnetであり、生成を容易にするために時間ステップを越えて適応する。
近年の研究では, この生成過程における組成および脱臭相の存在が明らかにされている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:40:33 GMT)
A Novel RFID Authentication Protocol Based on A Block-Order-Modulus Variable Matrix Encryption Algorithm [32.0] 低コストなタグ付き移動無線周波数識別システム(RFID)の認証について検討した。
対角ブロック鍵行列(DBKM)暗号アルゴリズムを提案する。
自己更新暗号順序(SUEO)アルゴリズムが考案される。
DBKM-SUEO-SUM-RFIDという双方向RFID認証プロトコルを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:55:13 GMT)
ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method
for Aligning Large Language Models [31.8] 近似ポリシー最適化は、計算の非効率性に苦しむことが知られている。
我々は,人間フィードバックからの強化学習に適した新しいアルゴリズムReMaxを開発した。
ReMaxはPPOに対して3倍のアドバンテージを提供する: まず、たった6行のコードで実装するのは簡単である。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:18:45 GMT)
DePRL: Achieving Linear Convergence Speedup in Personalized
Decentralized Learning with Shared Representations [31.5] 本稿では,共有表現を用いた分散学習アルゴリズムDePRLを提案する。
初めて、DePRLは一般非線形表現との収束の証明可能な線形高速化を実現する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:53:37 GMT)
HypoCompass: Large-Language-Model-based Tutor for Hypothesis
Construction in Debugging for Novices [30.9] hypoは理論上動機づけられたLLM強化チューターである。
sysnameは、人間の4倍の効率で高品質なトレーニング材料を作る。
19人の初心者がプレ・トゥ・ポストテストのパフォーマンスを12%改善し、完了時間の14%を短縮した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:58:29 GMT)
SUREL+: Moving from Walks to Sets for Scalable Subgraph-based Graph
Representation Learning [30.8] グラフ上の多くの予測タスクにおいて,グラフ表現学習(SGRL)が強力なツールとして登場した。
本稿では,SUREL+の更新を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:46:18 GMT)
M3DBench: Let's Instruct Large Models with Multi-modal 3D Prompts [30.6] M3DBenchと呼ばれる包括的3Dインストラクションフォローデータセットを導入する。
テキスト、画像、3Dオブジェクト、その他の視覚的プロンプトとインターリーブされた一般的なマルチモーダル命令をサポートする。
地域レベルでもシーンレベルでも多様な3Dタスクを統一し、現実世界の3D環境における様々な基本的な能力をカバーしている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:53:30 GMT)
All in One: Multi-task Prompting for Graph Neural Networks [30.5] 本稿では,グラフモデルのための新しいマルチタスクプロンプト手法を提案する。
まず、グラフプロンプトと言語プロンプトのフォーマットを、プロンプトトークン、トークン構造、挿入パターンで統一する。
次に、様々なグラフアプリケーションのタスク空間を調査し、下流の問題をグラフレベルのタスクに再構成する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:36:44 GMT)
SynFundus: A synthetic fundus images dataset with millions of samples
and multi-disease annotations [29.4] 我々はSynFundus-1Mをリリースした。SynFundus-1Mは、textbf100万基画像を含む高品質な合成データセットである。
全ての画像は、SynFundus-Generatorという名前のDenoising Diffusion Probabilistic Modelによって生成される。
我々は、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)の両方が、SynFundus-1Mの事前トレーニングやトレーニングによって恩恵を受けることを実証した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:59:20 GMT)
Deciphering Compatibility Relationships with Textual Descriptions via
Extraction and Explanation [28.9] Pair Fashion Explanationデータセットは、互換性関係を照らすためにキュレーションされたユニークなリソースである。
このデータセットを活用する革新的な2段階パイプラインモデルを提案する。
実験では, 知識に富み, 真実の一致した相関関係に整合し, 理解しやすく, 情報に富む記述を生成するモデルの可能性を示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:45:49 GMT)
Light-weight CNN-based VVC Inter Partitioning Acceleration [28.6] Versatile Video Coding(VVC)標準は、2020年にJVET(Joint Video Exploration Team)によって確定した。
VVC は Bjontegaard Delta-Rate (BD-rate) の約50%の圧縮効率向上を提供する。
本稿では,VVCにおけるパーティショニングを高速化するために,畳み込みニューラルネットワーク(CNN)に基づく手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:20:02 GMT)
Towards Reasoning in Large Language Models via Multi-Agent Peer Review
Collaboration [28.3] 大規模言語モデル(LLM)は、一般的な自然言語処理タスクにおいて顕著な能力を示しているが、複雑な推論タスクでは不足することが多い。
近年の研究では、自己正当性のような人間的な問題解決戦略を探求し、単一モデル推論能力の境界を推し進めている。
学術的ピアレビュープロセスをエミュレートするマルチエージェントコラボレーション戦略を導入する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:02:27 GMT)
Benchmarks for Physical Reasoning AI [28.0] 既存のベンチマークの概要と、AIシステムの物理的推論能力を測定するためのソリューションアプローチについて説明する。
物理推論タスクにおけるアルゴリズム性能をテストするためのベンチマークを選択する。
提示された物理推論ベンチマークをサブカテゴリにグループ化し、より狭い一般AIエージェントをこれらのグループで最初にテストできるようにします。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:24:03 GMT)
Do LLMs Work on Charts? Designing Few-Shot Prompts for Chart Question
Answering and Summarization [27.9] 大規模言語モデル(LLM)は、目に見えないタスクに対して印象的な一般化能力を示している。
本稿では,チャート関連アプリケーションのための LLM を用いたマルチモーダルな複数ショットプロンプトフレームワーク PromptChart を提案する。
3つの異なるチャート関連情報消費タスクに関する実験により、適切に設計されたプロンプトにより、LLMがベンチマーク上で優れることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:13:58 GMT)
DistilVPR: Cross-Modal Knowledge Distillation for Visual Place
Recognition [27.7] DistilVPRは視覚的位置認識のための新しい蒸留パイプラインである。
本稿では,教師と学生のニューラルネットワークにおいて,自己エージェントやクロスエージェントを含む複数のエージェントの機能的関係を活用することを提案する。
実験により, 提案したパイプラインは, 他の蒸留ベースラインと比較して, 最先端の性能を達成できることが実証された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:59:06 GMT)
Sequential Principal-Agent Problems with Communication: Efficient
Computation and Learning [27.5] 両端に不完全な情報を持つ主要因とエージェント間の逐次的意思決定問題について検討する。
このモデルでは、プリンシパルとエージェントは環境の中で相互作用し、それぞれが他で利用できない状態についての観測にプライベートである。
本稿では,アルゴリズムのアルゴリズムを用いて,主成分の最適ポリシを加法近似まで計算する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:34:46 GMT)
Will More Expressive Graph Neural Networks do Better on Generative
Tasks? [27.4] グラフニューラルネットワーク(GNN)アーキテクチャはしばしば過小評価される。
グラフ生成モデルの基盤となるGNNを、より表現力のあるGNNに置き換える。
分子生成タスクにおけるGCPN, GraphAF, GraphEBMの性能を向上できることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:20:14 GMT)
ParrotTTS: Text-to-Speech synthesis by exploiting self-supervised
representations [27.2] ParrotTTSは、モジュール化されたテキスト音声合成モデルである。
単一の話者からの書き起こしを使って、効果的にマルチスピーカーの変種を訓練することができる。
低リソース設定で新しい言語に適応し、自己管理バックボーンのトレーニング中に見えない言語に一般化する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:06:16 GMT)
Your Student is Better Than Expected: Adaptive Teacher-Student
Collaboration for Text-Conditional Diffusion Models [26.6] 教師のテキスト・画像拡散モデルによるサンプルの相対的品質とその蒸留された学生版について検討する。
学生と教師の拡散モデルによる効果的なテキスト・画像合成のための適応的協調手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:40:38 GMT)
Privacy-preserving transactive energy systems: Key topics and open research challenges [26.6] この写本は、2023年3月22-23日のプリTEMワークショップで始まった議論を形式化し、結論付けることを目的としている。
本稿では,過渡的エネルギーシステムの文脈における重要なアイデアと議論のトピックについて述べる。
この結論は、将来のエネルギー管理に関する研究で検討すべき潜在的な側面を明らかにしている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:23:44 GMT)
Deep Learning-Aided Subspace-Based DOA Recovery for Sparse Arrays [25.8] 本研究では,Sparse-SubspaceNetを提案する。
これにより、モデルベース部分空間DoA推定器の解釈可能性と適合性を保ちながら、コヒーレントソースやスパースアレイの誤校正に対処することを学ぶ。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:45:19 GMT)
Active Learning Guided by Efficient Surrogate Learners [25.5] 1つのデータポイントが新しいラベルを受け取るたびに、ディープラーニングモデルを再トレーニングするのは現実的ではない。
本稿では,ニューラルネットワークの主学習者とともに,ガウス過程の力を利用する新しい能動学習アルゴリズムを提案する。
提案モデルでは,新しいデータインスタンス毎のサロゲート学習者を積極的に更新し,ニューラルネットワークの連続学習ダイナミクスをエミュレートし,活用する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:25:50 GMT)
DeblurSR: Event-Based Motion Deblurring Under the Spiking Representation [25.4] 本稿では、ぼやけた画像をシャープなビデオに変換する新しいモーションデブロアリング手法を提案する。
DeblurSRはスパイキング表現を利用して、シャープな出力ビデオを時間から強度へのマッピングとしてパラメータ化する。
提案手法は,近年の暗黙的ニューラル表現の進歩と組み合わせることで,ビデオ超解像に容易に拡張できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:00:40 GMT)
Pedestrian Attribute Recognition via CLIP based Prompt Vision-Language
Fusion [24.8] 我々は、PARを視覚言語融合問題として定式化し、歩行者画像と属性ラベルの関係を完全に活用する。
提案するPARアルゴリズムは, 微調整手法と比較して0.75%しか学習可能なパラメータを調整できない。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:59:14 GMT)
A mathematical perspective on Transformers [24.8] 相互作用する粒子系として解釈したトランスフォーマーを解析するための数学的枠組みを開発する。
本研究は、基礎となる理論を探求し、数学者だけでなく計算機科学者にも新たな視点を提供する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:06:29 GMT)
Out-of-Distribution Detection in Long-Tailed Recognition with Calibrated
Outlier Class Learning [24.7] 既存のアウト・オブ・ディストリビューション(OOD)手法は、バランスの取れたデータセットで大きな成功を収めている。
OODサンプルは、しばしば誤ってヘッドクラスに分類され、/またはテールクラスのサンプルはOODサンプルとして扱われる。
提案手法では,1)オフレイアクラス学習において,OODサンプルを表現空間の頭と尾の両方のクラスと区別するために,デバイアスド・大型辺縁学習法を導入し,2)オフレイアクラスを意識したロジット校正法を定義し,長い尾の分類信頼性を高める。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:11:02 GMT)
World Models via Policy-Guided Trajectory Diffusion [24.6] 既存の世界モデルは、次の状態を予測するために、ポリシーから次のアクションをサンプリングする、自己回帰的である。
本稿では, 自己回帰的でない新しい世界モデリング手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:47:29 GMT)
Anomaly Score: Evaluating Generative Models and Individual Generated
Images based on Complexity and Vulnerability [24.0] 生成した画像の表現空間と入力空間の関係について検討する。
異常スコア(AS)と呼ばれる画像生成モデルを評価するための新しい指標を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:33:06 GMT)
Few-Shot Learning from Augmented Label-Uncertain Queries in Bongard-HOI [23.7] 本稿では,クエリ入力の多様性を高めるために,ラベル不確実なクエリ拡張手法を提案する。
提案手法は,Bongard-HOIベンチマークにおいて68.74%の精度でSOTA(State-of-the-art)性能を実現する。
HICO-FSの精度は73.27%であり、5-way 5-shot タスクでは以前のSOTAの71.20%を上回った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:18:10 GMT)
Can Transformers Learn Optimal Filtering for Unknown Systems? [23.2] 過去の全ての出力予測を生成する変換器を用いた最適出力推定問題について検討する。
我々は、様々な異なるシステムを用いてトランスフォーマーを訓練し、未知のダイナミクスを持つ未知のシステムの性能を評価する。
非d.d.ノイズ、時間変化力学、未知のパラメータを持つ四元数系のような非線形力学のより複雑な設定では、トランスフォーマーも有望な結果を示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:18:56 GMT)
SAM-Deblur: Let Segment Anything Boost Image Deblurring [22.0] 本稿では,Segment Anything Model (SAM) からの事前知識をデブロア処理に組み込んだ SAM-Deblur フレームワークを提案する。
RealBlurJ、ReloBlur、REDSデータセットの実験結果から、GoProでトレーニングしたNAFNetのPSNRをそれぞれ0.05、0.96、および7.03に改善したことが明らかとなった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:39:20 GMT)
Novel Categories Discovery Via Constraints on Empirical Prediction
Statistics [21.9] New Categories Discovery (NCD) は、既知のクラスのクラスセマンティクスに基づいて、新しいデータをクラスタリングすることを目的としている。
そこで本研究では,データサンプリングと新規クラスの多極的(カテゴリー的)分布の関連性を利用する。
画像, ビデオ, 時系列モダリティにおける新しいサンプルのセマンティッククラスタリングを実現するための, 提案手法の識別能力を示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:49:55 GMT)
Real-time Network Intrusion Detection via Decision Transformers [21.7] そこで我々は, カジュアルシーケンスモデルとして, リアルタイムネットワーク侵入検出の問題を提起した。
過去の軌跡に因果決定変換器を組み込むことで,提案手法は将来の検出決定を生成する。
これにより、リアルタイムネットワーク侵入検出に決定変換器を適用することができ、検出の正確性とタイムラインの間に新たなトレードオフが生まれる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:18:39 GMT)
Wikiformer: Pre-training with Structured Information of Wikipedia for
Ad-hoc Retrieval [21.3] 本稿では,ウィキペディアの構造的知識に基づいて,情報検索タスクに適した4つの事前学習目標を考案する。
既存の事前学習手法と比較して,本手法はトレーニングコーパスにおける意味的知識をよりよく捉えることができる。
生物医学・法学領域における実験結果から,本手法は垂直領域において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:31:47 GMT)
Cross-Modal Conceptualization in Bottleneck Models [21.3] 概念ボトルネックモデル(CBM)は、訓練例(例えば、x線画像)が高レベルの概念で注釈付けされていると仮定する。
このアプローチでは、より穏健な仮定を採用し、代わりに、訓練中の画像に付随するテキスト記述を用いて概念の導出を誘導する。
我々のクロスモーダルアプローチは,概念を離散潜在変数として扱い,(1)ラベルの予測,(2)画像とテキストの両方から確実に予測できる概念を促進する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:40:52 GMT)
An Evaluation of GPT-4V and Gemini in Online VQA [20.1] 我々は、VQAonlineデータセットを用いて、最先端のLMM、すなわちGPT-4VとGeminiを評価した。
VQAonlineは、さまざまな日常ユーザから得られたエンドツーエンドの認証VQAデータセットである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:38:43 GMT)
UltraClean: A Simple Framework to Train Robust Neural Networks against Backdoor Attacks [19.4] バックドア攻撃は、ディープニューラルネットワークに対する脅威を生じさせている。
彼らは通常、毒を盛ったサンプルを注入することで、悪意のある行動を被害者のモデルに埋め込む。
有毒試料の同定を簡略化する枠組みであるUltraCleanを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:16:17 GMT)
Transformer-CNN Cohort: Semi-supervised Semantic Segmentation by the
Best of Both Students [18.9] 本稿では、視覚変換器(ViT)と畳み込みニューラルネットワーク(CNN)に基づく2人の学生からなる、新しい半教師付き学習(SSL)手法を提案する。
提案手法は,非ラベルデータに対する擬似ラベルによる予測と異種特徴空間の多レベル整合正則化を,下位に組み込む。
我々はCityscapesとPascal VOC 2012データセットのTCCフレームワークを検証する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:31:57 GMT)
CR-SFP: Learning Consistent Representation for Soft Filter Pruning [18.7] ソフトフィルタプルーニング(SFP)は,プルーニングフィルタのネットワークへの更新と再グローを可能にする効果的なプルーニング技術として登場した。
CR-SFPと呼ばれるソフトフィルタプルーニングのための一貫した表現を学習することで,このギャップを軽減することを提案する。
CR-SFPは、追加の推論コストを導入することなくP-NNの精度を向上させるための、シンプルで効果的なトレーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:41:04 GMT)
Cut your annotation cost: An empirical study on the use of weak, noisy,
and SAM-generated annotations for segmentation network training [18.3] ディープニューラルネットワーク(DNN)は多くのイメージセグメンテーションタスクにデプロイされ、優れたパフォーマンスを実現している。
セグメンテーションをトレーニングするためのデータセットを作成するのは面倒で費用がかかる。
この問題を緩和するためには、バウンディングボックスやスクリブルのような弱いラベルのみを提供するか、オブジェクトのより正確な(ノイズの多い)アノテーションを提供することができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:26:42 GMT)
Learning to Act without Actions [18.0] 本研究では,アクションフリーなデモンストレーションから遅延アクションを推論する方法であるLAPO(Latent Action Policies from Observation)を紹介する。
LAPOは、RLポリシーを得るための効果的な事前学習方法として機能し、専門家レベルのパフォーマンスに迅速に微調整することができる。
当社のアプローチは,Web上で利用可能な大量のアクションフリーデモにおいて,強力で汎用的なRLモデルの事前学習を可能にするための重要なステップストーンとして機能する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:39:54 GMT)
DIAS: A Dataset and Benchmark for Intracranial Artery Segmentation in
DSA sequences [17.5] デジタルサブトラクション(DSA)は,病変血管構築を検査するための金の基準として広く認められている。
DSAにおける頭蓋内動脈(IA)の自動分節は血管形態の定量化に重要である。
本稿では,DSAシークエンスにおけるIAセグメンテーションのためのデータセットであるDIASを紹介する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:12:46 GMT)
Policy Optimization in RLHF: The Impact of Out-of-preference Data [17.1] 本稿では、DPO(Direct Preference Optimization)とReward-Model-Based Policy Optimization(RMB-PO)の2つの一般的なアライメント手法について検討する。
RMB-PO+とも呼ばれるRMB-POの変種も検討されている。
特に、DPOと比較して、RMB-POはポリシー生成データを使用し、RMB-PO+は新たな好みのないデータを活用する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:14:15 GMT)
Label-Free Multivariate Time Series Anomaly Detection [17.1] MTGFlowは、動的グラフとエンティティ認識正規化フローによるMTS異常検出のための教師なし異常検出アプローチである。
グラフ構造学習モデルを用いて、エンティティ間の関係を学習し、進化させ、MSSの複雑かつ正確な分布パターンを効果的にキャプチャする。
提案手法は,エンティティを意識した正規化フローを用いることで,個々のエンティティのユニークな特徴を取り入れたものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:58:18 GMT)
Faithful Model Explanations through Energy-Constrained Conformal
Counterfactuals [16.7] ブラックボックスモデルを説明するための直感的で直感的な説明を提供する。
既存の作業は主に、入力データの分散方法を学ぶために代理モデルに依存しています。
そこで本研究では,モデルが許容する範囲でのみ有効な,エネルギー制約のあるコンフォーマル・カウンセリングを生成するための新しいアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:24:44 GMT)
Leaf-Based Plant Disease Detection and Explainable AI [16.1] 農業部門は国の経済成長に不可欠な役割を担っている。
植物病は農業に影響を及ぼす重要な要因の1つである。
研究者は、植物病を検出するAIと機械学習技術に基づく多くのアプリケーションを調査してきた。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 03:40:12 GMT)
SAME: Sample Reconstruction Against Model Extraction Attacks [16.1] ディープラーニングモデルに対する大きな脅威の1つは、モデル攻撃である。
そこで本研究では,サンプル再構成の概念に基づく新しい防御機構であるTHETについて紹介する。
我々の実験は、最先端のソリューションよりもITSの優れた効果を裏付けるものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:44:29 GMT)
Knowledge-enhanced Agents for Interactive Text Games [16.1] テキストベースのゲームにおいてエージェントの機能的接地を改善するための知識注入フレームワークを提案する。
学習に基づくエージェントに注入するドメイン知識の2つの形態について考察する。
我々のフレームワークは、強化学習エージェントと言語モデルエージェントの2つの代表的なモデルクラスをサポートしている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:03:29 GMT)
High-Fidelity Face Swapping with Style Blending [16.0] 高忠実な顔交換のための革新的なエンドツーエンドフレームワークを提案する。
まず、スタイルGANベースの顔属性エンコーダを導入し、顔から重要な特徴を抽出し、潜在スタイルコードに変換する。
第二に、ターゲットからターゲットへFace IDを効果的に転送するアテンションベースのスタイルブレンディングモジュールを導入する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:22:37 GMT)
Uniform Sequence Better: Time Interval Aware Data Augmentation for
Sequential Recommendation [16.0] シーケンシャルレコメンデーションは、アイテムのシーケンスに基づいてアクセスする次の項目を予測する重要なタスクである。
既存の作業の多くは、これらの2つの項目間の時間間隔を無視して、前の項目から次の項目への遷移パターンとして、ユーザの好みを学ぶ。
文献では研究されていない時間間隔の観点からシーケンスデータを拡張することを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:05:22 GMT)
Thermal variational quantum simulation on a superconducting quantum
processor [15.9] 熱量子状態のハイブリッド量子古典シミュレーション実験について述べる。
古典的確率モデルと5量子ビットプログラム可能な超伝導量子プロセッサを組み合わせることで、ハイゼンベルクXYおよびXXZモデルのギブス状態と励起状態を作成する。
このアプローチは量子ビット数でスケーラブルであり、自己検証可能な特徴を持ち、大規模量子統計力学問題の解法の可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:31:20 GMT)
HE-DKSAP: Privacy-Preserving Stealth Address Protocol via Additively Homomorphic Encryption [15.9] ホモモルフィック暗号化に基づくデュアルキーステルスアドレスプロトコル(HE-DKSAP)
本稿では、HE-DKSAPの中核となる原則を掘り下げ、プログラム可能なブロックチェーンにおけるプライバシ、スケーラビリティ、セキュリティを強化する能力を強調します。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:23:49 GMT)
GLT-T++: Global-Local Transformer for 3D Siamese Tracking with Ranking
Loss [15.8] 3D領域提案ネットワーク(RPN)に基づくシームズトラッカーは、ディープ投票で顕著な成功を収めた。
しかし、投票のキューとして1つのシードポイント機能を使用することで、高品質な3D提案が得られない。
そこで我々は,より優れた提案を生成するために,トランスフォーマーに基づく投票方式を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 03:18:58 GMT)
Modeling Complex Mathematical Reasoning via Large Language Model based
MathAgent [15.8] 大規模言語モデル (LLM) は複雑な数学的問題を解く上で困難に直面している。
本稿では, エージェントベースのゼロショットフレームワークを用いて, LLMの数学的解法を公式に記述し, 拡張する。
miniF2FとMATHの実験では、PreRとMathAgentsの有効性が実証されている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 03:34:36 GMT)
Evaluating Pretrained models for Deployable Lifelong Learning [15.6] 我々は、キュレートされたデータセット上で事前学習した、視覚強化学習のための展開可能な生涯学習システム(RL)を評価する。
本システムは,メモリフットプリントが小さく,計算資源も少ないため,多数のタスクを組み込むことができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:19:50 GMT)
DER-GCN: Dialogue and Event Relation-Aware Graph Convolutional Neural
Network for Multimodal Dialogue Emotion Recognition [15.5] 本稿では,多モーダル感情認識(DER-GCN)のための新しい対話・イベント関係対応グラフ畳み込みニューラルネットワークを提案する。
話者間の対話関係をモデル化し、潜在イベント関係情報をキャプチャする。
DER-GCNモデルの有効性を検証したIEMOCAPおよびMELDベンチマークデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:49:40 GMT)
Students' Perceptions and Preferences of Generative Artificial
Intelligence Feedback for Programming [15.4] そこで我々はChatGPT APIを用いて,導入型コンピュータサイエンスクラスにおける4つの実験室割り当てのための自動フィードバックを生成した。
学生は、フィードバックは、Shuteが確立した形式的なフィードバックガイドラインとよく一致していると感じた。
学生は通常、十分なコード例で特定の修正フィードバックを期待していたが、フィードバックのトーンについて意見が分かれていた。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:26:53 GMT)
CLDR: Contrastive Learning Drug Response Models from Natural Language
Supervision [15.3] 自然言語の教師付きコントラスト学習フレームワークであるMNを提案する。
がんデータセットにおける薬物感受性のゲノムから数十万のサンプルを検証した。
実験により、MN は標本を表現空間内の連続分布に効果的に制約することを示した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:51:49 GMT)
Audio Generation with Multiple Conditional Diffusion Model [15.3] 本稿では,既存の事前学習型テキスト音声モデルの制御性を向上する新しいモデルを提案する。
このアプローチは、生成された音声の時間的順序、ピッチ、エネルギーを細かく制御する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:01:27 GMT)
Far3D: Expanding the Horizon for Surround-view 3D Object Detection [15.0] 本稿では、Far3Dと呼ばれるスパースクエリベースの新しいフレームワークを提案する。
高品質な2Dオブジェクトの事前利用により、3Dグローバルクエリを補完する3D適応クエリを生成する。
課題であるArgoverse 2データセット上でのSoTA性能を実証し,150mの範囲をカバーした。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:17:38 GMT)
IntraSeismic: a coordinate-based learning approach to seismic inversion [14.6] IntraSeismicは、座標に基づく学習とポストスタックモデリング演算子の物理をシームレスに組み合わせた、新しいハイブリッド地震インバージョン手法である。
IntraSeismicの主な特徴は、2Dおよび3D後の地震インバージョン、高速収束率、およびシームレスにハード制約を含む能力である。
提案手法の有効性を検証するために, 震源内データの合成とフィールドデータの適用について述べる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:29:25 GMT)
SeGA: Preference-Aware Self-Contrastive Learning with Prompts for
Anomalous User Detection on Twitter [14.5] 本稿では,ユーザの異常検出のための自己コントラスト学習であるSeGAを提案する。
SeGAは、投稿を通じてユーザの好みを要約するために、大きな言語モデルを使用する。
モデル設計と事前学習戦略の有効性を実証的に検証する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:35:28 GMT)
Practical Non-Intrusive GUI Exploration Testing with Visual-based
Robotic Arms [14.3] 視覚ロボットアームを用いた実用的な非侵襲的GUIテストフレームワークを提案する。
RoboTestは、新しいGUI画面とウィジェット検出アルゴリズムを統合し、異なるサイズのスクリーンに適応する。
20のモバイルアプリでRoboTestを評価し,組込みシステムのケーススタディを行った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:05:39 GMT)
StarVector: Generating Scalable Vector Graphics Code from Images [14.0] 本稿では,コード生成大言語モデル(CodeLLM)と視覚モデルを統合する多モードSVG生成モデルであるStarを紹介する。
提案手法では,CLIP画像を用いて画素ベースの画像から視覚表現を抽出し,アダプタモジュールを介して視覚トークンに変換する。
以上の結果から,従来のSVG生成技術よりも視覚的品質と複雑さが著しく向上していることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:07:32 GMT)
Compositional Inductive Invariant Based Verification of Neural Network
Controlled Systems [14.0] 本稿では,インダクティブ不変法を利用したNNCSの安全性検証手法を提案する。
本稿では、必要な分解述語を自動的に推論することで、与えられた候補の帰納性を自動的に検証できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:20:51 GMT)
Choosing Wisely and Learning Deeply: Selective Cross-Modality
Distillation via CLIP for Domain Generalization [13.8] ドメイン一般化(Domain Generalization, DG)は、複数のドメインにまたがるモデルをトレーニングし、見えないドメインでテストすることを目指している。
ドメイン一般化のための選択的クロスモーダル蒸留法(Selective Cross-Modality Distillation for Domain Generalization, SCMD)を提案する。
SCMDは大規模な視覚言語モデル、特にCLIPモデルの能力を活用して、より効率的なモデルをトレーニングする。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:06:31 GMT)
Exploring Sound vs Vibration for Robust Fault Detection on Rotating
Machinery [13.5] 本研究は, カタール大学Dual-Machine Bearing Fault Benchmarkデータセット(QU-DMBF)を提案する。
我々は,多数の設置条件と運転条件により,振動に基づく故障検出の大きな限界と欠点に焦点をあてる。
幅広い実験結果から, 音による断層検出法は, 振動による検出法よりもかなり頑健であることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:27:32 GMT)
Enhancing Numeric-SAM for Learning with Few Observations [13.4] 安全行動モデル学習(N-SAM)の強化版を提案する。
N-SAM*は返却されたアクションモデルの安全性を損なうことなくそうする。
ベンチマーク領域の集合に関する実証的研究は、N-SAM* で返される作用モデルが N-SAM で返される作用モデルよりもはるかに多くの問題を解くことができることを示している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:50:10 GMT)
A Survey on Query-based API Recommendation [13.4] アプリケーションプログラミングインターフェース(API)は、開発者がより効率的にソフトウェアを構築するのに役立つように設計されています。
この研究領域を理解するため,過去10年間に公開されたAPIレコメンデーション研究を分析した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:39:10 GMT)
CogCartoon: Towards Practical Story Visualization [13.3] 本稿では,事前学習した拡散モデルに基づく現実的なストーリー可視化手法であるCogCartoonを紹介する。
データとストレージへの依存を軽減するため,特定文字をコンパクトな316KBプラグインとして表現できる文字生成の革新的な戦略を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:39:04 GMT)
Post-Training Quantization for Re-parameterization via Coarse & Fine
Weight Splitting [13.3] 本稿では,重みの量子化誤差を低減するために,粗大かつ微細な重み分割法(CFWS)を提案する。
我々は、活性化のための最適な量子化尺度を決定するために改良されたKLメトリックを開発した。
例えば、量子化されたRepVGG-A1モデルは、わずか0.3%の精度損失を示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:31:20 GMT)
MWSIS: Multimodal Weakly Supervised Instance Segmentation with 2D Box
Annotations for Autonomous Driving [13.1] 我々はMultimodal Weakly Supervised Instance (MWSIS)と呼ばれる新しいフレームワークを提案する。
MWSISは、様々な細粒度ラベルの生成と修正モジュールを2Dと3Dの両方に組み込んでいる。
完全に教師されたインスタンスセグメンテーションよりも優れており、完全に教師されたアノテーションはわずか5%である。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:06:56 GMT)
SCLIP: Rethinking Self-Attention for Dense Vision-Language Inference [12.9] セマンティックセグメンテーションにおけるコントラッシブ言語イメージ事前学習の可能性を高める。
自己注意を再考することで、CLIPは密集した予測タスクに適応できることがわかった。
従来のCLIPビジョンエンコーダの自己保持ブロックをCSAモジュールで置き換える。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:10:33 GMT)
Optimized View and Geometry Distillation from Multi-view Diffuser [12.8] 本研究では,2次元拡散モデルから無条件雑音を利用するUnbiased Score Distillation (USD)を提案する。
最適化された放射場からのレンダリングビューを基礎として、2次元拡散モデルの2段階の特殊化プロセスを開発する。
改良された多視点画像から直接忠実な幾何学とテクスチャを復元する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:50:10 GMT)
Cryogenic hybrid magnonic circuits based on spalled YIG thin films [12.8] イットリウム鉄ガーネット(YIG)は、マグノンを信号処理に利用することに対する広範な研究の関心を喚起している。
本研究では, 基板レスYIG薄膜において, 制御スペーリングと層移動技術を導入することにより, 基板レスYIG薄膜が得られることを示す。
この進歩は、YIGベースの量子デバイスのオンチップ統合とスケーラビリティの向上の道を開く。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:31:07 GMT)
CACTO-SL: Using Sobolev Learning to improve Continuous Actor-Critic with
Trajectory Optimization [12.1] トラボ学習ガイドTOと強化学習(RL)は最適な制御問題を解決するための強力なツールである。
本稿では,Solev-SLのアイデアを利用したCACTOの拡張について述べる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:44:41 GMT)
A Study on Transferability of Deep Learning Models for Network Intrusion
Detection [12.0] 我々は、特定の攻撃クラスでディープラーニングモデルを訓練し、個別の攻撃クラスでテストすることで、攻撃クラスの転送可能性を評価する。
実データおよび合成データ拡張技術が伝達性に及ぼす影響を観察する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:06:20 GMT)
Attention-Driven Multichannel Speech Enhancement in Moving Sound Source
Scenarios [11.8] 音声強調アルゴリズムは典型的に静止音源を仮定するが、これは現実との共通のミスマッチであり、現実のシナリオではその性能を制限している。
本稿では,動的設定のための注意駆動型空間フィルタリング技術について述べる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:12:35 GMT)
Discretionary Trees: Understanding Street-Level Bureaucracy via Machine
Learning [11.7] 我々は、街頭官僚の行動を理解するために機械学習技術を用いる。
単純な決定規則に従わない決定は、ケースワーナーの判断の応用と見なすことができると我々は論じる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:08:09 GMT)
Synthesizing Black-box Anti-forensics DeepFakes with High Visual Quality [11.5] そこで本研究では,ブラックボックス・アンチ・フォレスティクス・アタック(英語版)を起動するための新しい対向型シャープニングマスクを生成する手法を提案する。
提案手法が最先端のDeepFake検出器を破壊できることを示す。
既存のディープフェイク法で処理された画像と比較すると,提案法で作成したディープフェイクの視覚的特性は著しく改善されている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:12:34 GMT)
Satellite Data Shows Resilience of Tigrayan Farmers in Crop Cultivation
During Civil War [11.4] ティグレイ戦争(ティグレイせんせん、英語: Tigray War)は、2020年11月3日から2022年11月2日までエチオピア北部のティグレイ地方で起きた戦闘である。
ティグレイの農業が生活と食料安全保障にとって重要であることを考えると、戦争が耕作地に与える影響を判断することが重要である。
衛星画像と統計地域推定技術を用いて,戦前および戦時中におけるティグレイの作物栽培地域の変化を評価した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:33:07 GMT)
Emergence Learning: A Rising Direction from Emergent Abilities and a
Monosemanticity-Based Study [11.4] 本稿では,スケールの重要性を重視した創発的学習の概念を提案する。
異なるスケールのモデルを研究することで、大きなモデルにおいて高い性能を達成するための重要な要因を特定できた。
我々の解法は、理論解析によって支持される単節性ニューロンの検出と抑制を含む2段階のプロセスを含む。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:42:46 GMT)
On the Contractivity of Plug-and-Play Operators [11.2] ノイズ・アンド・プレイの正規化では、ISTAやADMといったアルゴリズムの演算子をパワーラーに置き換える。
この形式的な置換は、実際は驚くほどうまく機能する。
実際は。
様々な画像応用の最先端の結果が示されている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:19:57 GMT)
p-Laplacian Adaptation for Generative Pre-trained Vision-Language Models [10.7] 大きなコーパスで事前訓練された視覚言語モデル(VLM)は、下流のタスクで顕著な成功を収めている。
PETLはフル微調整の代替として注目されている。
グラフニューラルネットワーク(GNN)において,$p$-Laplacianメッセージパッシングを利用する新しいアダプタアーキテクチャである$p$-adapterを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:30:35 GMT)
ADF & TransApp: A Transformer-Based Framework for Appliance Detection
Using Smart Meter Consumption Series [10.7] 世界中の電力供給業者が何百万ものスマートメーターを設置し、大量の電力消費データを収集している。
これらのサプライヤーが直面する重要な課題の1つは、異なるアプライアンスの存在/存在を検出するためにこのデータを利用する方法である。
本稿では,アプライアンスの存在/存在を検出するために,クライアント消費系列のサブシーケンスを利用するフレームワークであるAFFを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:25:01 GMT)
RayDF: Neural Ray-surface Distance Fields with Multi-view Consistency [10.6] 我々は、レイベースニューラルネットワークとして3次元形状を定式化するためのRayDFと呼ばれる新しいフレームワークを提案する。
本手法は,800×800の深度画像を描画する座標法よりも1000倍高速な高速化を実現する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:19:13 GMT)
Bayesian Model Selection via Mean-Field Variational Approximation [10.4] 平均場(MF)推論の非漸近特性をベイズ的枠組みの下で検討する。
BvM(Bernstein von-Mises)定理は、MF からの変分分布をモデル的不特定性(英語版)の下で表す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:48:25 GMT)
Understanding the Instruction Mixture for Large Language Model [10.3] 本研究では,命令をNLPダウンストリームタスク,コーディング,一般的なチャットの3つのタイプに分類する。
以上の結果から,特定の種類の命令が特定の用途に有用であること,他の側面に害を与える可能性が示唆された。
本研究は, 教示混合物に光を当て, 今後の研究の道を開くものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:44:26 GMT)
GLOBE-CE: A Translation-Based Approach for Global Counterfactual
Explanations [10.3] Global & Efficient Counterfactual Explanations (GLOBE-CE)は、現在の最先端技術に関連する信頼性とスケーラビリティの問題に取り組む柔軟なフレームワークである。
分類的特徴翻訳を数学的に解析し,その手法を応用した。
公開データセットとユーザスタディによる実験的評価は、GLOBE-CEが現在の最先端よりも大幅にパフォーマンスが向上していることを示している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:26:53 GMT)
Traffic Incident Database with Multiple Labels Including Various
Perspective Environmental Information [9.8] V-TIDBは、様々な環境情報をマルチラベルとして注釈付けした大規模交通事故認識データセットである。
V-TIDBは、環境情報を詳細に考慮した交通事故認識モデルを学ぶために使用できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:52:31 GMT)
E2E-AT: A Unified Framework for Tackling Uncertainty in Task-aware
End-to-end Learning [9.7] 本稿では,機械学習モデルの入力特徴空間と制約付き最適化モデルの両方で生じる不確実性をカバーする統一フレームワークを提案する。
トレーニング中にCOの不確かさを無視することは、一般化エラーの新たな引き金となる。
このフレームワークはロバストな最適化問題として記述され、エンド・ツー・エンドの対角訓練(E2E-AT)によって現実的に解決されている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:23:25 GMT)
FormalGeo: The First Step Toward Human-like IMO-level Geometric
Automated Reasoning [9.7] これは、私たちが過去3年間に達成した一連の研究の中で、初めての論文です。
我々は完全かつ互換性のある形式平面幾何学システムを構築した。
これは、IMOレベルの平面幾何学の課題と、可読性のあるAI自動推論の間に重要な橋渡しとなる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:56:33 GMT)
Fuzz Driver Synthesis for Rust Generic APIs [9.3] 本稿では,汎用APIを用いたRustライブラリのファズドライバ自動合成問題について検討する。
このような依存関係と型制約を解決することで、候補となるモノモルフィックAPIのコレクションを生成することができる。
29の人気のあるオープンソースライブラリによる実験結果から,我々のアプローチは,無効なファズドライバを低い速度で,有望な汎用APIカバレッジを実現することができることが示された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:24:34 GMT)
Geometrizing the Partial Entanglement Entropy: from PEE Threads to Bit
Threads [9.2] ホログラフィックCFTにおける部分絡み合いエントロピー(PEE)をAdS/CFTの文脈で測る手法を提案する。
任意の静的区間または球面領域$A$に対して、状態によって決定されるPEEスレッド構成からユニークなビットスレッド構成を生成することができることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:22:58 GMT)
FigGen: Text to Scientific Figure Generation [9.1] 本稿では,テキスト記述から論文の科学的数値を生成するテキスト・ツー・フィギュア生成の問題を紹介する。
本稿では,テキスト・ツー・フィギュアの拡散に基づくアプローチであるFigGenについて紹介する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:24:37 GMT)
SAMP: A Model Inference Toolkit of Post-Training Quantization for Text
Processing via Self-Adaptive Mixed-Precision [8.7] 推論のためのモデルを簡単に定量化するためのツールキットを開発した。
混合精度アーキテクチャにより量子化率を自動的に制御する自己適応混合精度(SAMP)を提案する。
実験の結果,SAMPツールキットはPyTorchやFasterTransformerよりも高速であることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:54:55 GMT)
Episodic Return Decomposition by Difference of Implicitly Assigned
Sub-Trajectory Reward [8.4] 本稿では,ダイアスターと呼ばれる新しいエピソード回帰分解法を提案する。
ダイアスターはエピソード報酬を任意のカットポイントで2つの分割されたサブトラジェクトリのクレジットに分解する。
実験結果から,本手法は試料効率と性能の両面から従来の最先端手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:58:19 GMT)
Observation of the non-Hermitian skin effect and Fermi skin on a digital
quantum computer [8.3] 汎用量子プロセッサ上での非エルミタンスキン効果(NHSE)の最初の観測を報告する。
複数のアンシラ量子ビットを選択後,このような非単体手術が体系的に実現可能であることを示す。
我々の研究は、今日の量子コンピュータにおける非エルミート格子現象の量子シミュレーションにおける重要なマイルストーンである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:22:43 GMT)
ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation [7.9] 本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:15:49 GMT)
DSD$^2$: Can We Dodge Sparse Double Descent and Compress the Neural
Network Worry-Free? [7.8] このような現象を回避し、一般化を改善する学習フレームワークを提案する。
第2に,この現象の持続性に関する洞察を提供するエントロピー尺度を導入する。
第3に、再初期化法、モデル幅と深さ、データセットノイズなどの要因を包括的に定量的に分析する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:04:11 GMT)
Learning to Learn in Interactive Constraint Acquisition [7.7] 制約獲得(CA:Constraint Acquisition)では、モデルを自動的に学習することでユーザを支援することが目標である。
アクティブCAでは、クエリを対話的にユーザにポストすることでこれを行う。
本稿では、確率論的分類モデルを用いて対話型CAを誘導し、より有望なクエリを生成することを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:12:33 GMT)
RoleCraft-GLM: Advancing Personalized Role-Playing in Large Language
Models [7.2] RoleCraft-GLMは、大規模言語モデル(LLM)によるパーソナライズされたロールプレイングの強化を目的とした革新的なフレームワークである。
従来の有名人中心のキャラクターから多彩な非有名人ペルソナへとシフトする、ユニークな会話データセットをコントリビュートする。
私たちのアプローチには、細心の注意深いキャラクタ開発、対話が現実的かつ感情的に共鳴することを保証することが含まれる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:57:50 GMT)
A Framework of Full-Process Generation Design for Park Green Spaces
Based on Remote Sensing Segmentation-GAN-Diffusion [7.1] GAN, 安定拡散マルチモーダル大規模画像事前学習モデルを用いて, フルプロセスパーク生成設計法を構築する。
メソッドは、完全に無人の設計自動化ワークフローを達成することができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:16:47 GMT)
The unreasonable effectiveness of AI CADe polyp detectors to generalize
to new countries [6.9] ポリープ検出にはCAD(Computer-Aided Detection)が一般的に用いられるが、臨床現場で見られるデータはモデルトレーニングとは異なる場合がある。
CADe検出器が訓練中に見られない国々の大腸でどれだけ効果があるかを評価する研究はほとんどない。
イスラエルの大腸内視鏡ビデオ(5004本,1106時間)でCADeポリープ検出装置を訓練し,TPR(True Positive Rate)とFAPM(False alarms per minute)を測定し,日本のビデオ(354本,128時間)で評価した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:38:15 GMT)
Addressing Sample Inefficiency in Multi-View Representation Learning [6.6] 非コントラスト型自己教師型学習(NC-SSL)法は,コンピュータビジョンにおけるラベルなし表現学習に大きな可能性を示している。
我々は、バーローツインズとVICReg損失の暗黙の偏見に関する理論的洞察を提供し、これらを説明し、より原則化されたレコメンデーションの開発を導くことができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:14:31 GMT)
Adversarially Balanced Representation for Continuous Treatment Effect
Estimation [6.5] 本稿では,この処理が連続変数である,より実践的で困難なシナリオについて考察する。
本稿では,KL分散の表現の不均衡を対角的に最小化する対向反事実回帰ネットワーク(ACFR)を提案する。
半合成データセットに対する実験的な評価は、ACFRの最先端手法に対する経験的優位性を実証するものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:46:16 GMT)
Revisiting Backflow Corrections by Tensor Representations: Benchmarks on
Fermi-Hubbard-type Models [5.9] 提案手法は,現在の最先端手法よりも競争力や低エネルギー化を実現していることを示す。
我々は、STO-3Gに基づく分子と、周期的および円筒的ボーダリー条件を持つフェルミ・ハッバードモデルについてベンチマークを行った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:01:49 GMT)
LLM-Twin: Mini-Giant Model-driven Beyond 5G Digital Twin Networking
Framework with Semantic Secure Communication and Computation [5.9] 本稿では,大規模言語モデル (LLM) によるDTNネットワークフレームワーク LLM-Twin を提案する。
まず, DTN における LLM の効率的な展開を実現するため, 最小限のモデル協調方式を設計する。
そこで本研究では,DTNのためのセマンティックレベルの高効率かつセキュアな通信モデルの設計を行う。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:13:59 GMT)
FFT-based Dynamic Token Mixer for Vision [5.4] 本稿では,動的フィルタと新しい画像認識モデルDFFormerとCDFFormerを提案する。
我々の結果は、Dynamic Filterが、真剣に検討すべきトークン-ミキサーオプションの1つであることを示唆している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:53:44 GMT)
HyperPIE: Hyperparameter Information Extraction from Scientific
Publications [5.4] 我々は,ハイパーパラメータ情報抽出(HyperPIE)をエンティティ認識および関係抽出タスクとして形式化し,課題に取り組む。
微調整モデルに対しては,最先端のベースラインよりも29%のF1を向上する関係抽出手法を開発した。
大規模言語モデルでは,構造化データよりも,エンティティ認識における平均5.5%のF1向上を実現するYAMLを活用するアプローチを開発する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:39:07 GMT)
Deep dive into language traits of AI-generated Abstracts [5.2] ChatGPTのような生成言語モデルは、人間のような文章を生成する能力に注意を向けている。
本研究では,ChatGPTが生成する抽象概念を,長さとバウンドがはるかに短い方法で検出しようと試みる。
テキストの意味的特徴と語彙的特性を抽出し、従来の機械学習モデルがこれらの抽象概念を確実に検出できることを観察する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:03:33 GMT)
NN-Steiner: A Mixed Neural-algorithmic Approach for the Rectilinear
Steiner Minimum Tree Problem [5.1] ICレイアウト設計において重要となるリチ線形スタイナー最小木(RSMT)問題に着目する。
提案するNN-Steinerは,RSMTを演算するための新しいニューラル・アルゴリズムフレームワークである。
特にNN-Steinerは、アルゴリズムフレームワーク内で繰り返し呼び出される4つのニューラルネットワーク(NN)コンポーネントのみを必要とする。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 02:42:11 GMT)
STS-CCL: Spatial-Temporal Synchronous Contextual Contrastive Learning
for Urban Traffic Forecasting [4.9] 本研究は、高度なコントラスト学習を採用し、新しい時空間コントラスト学習(STS-CCL)モデルを提案する。
STS-CCLコントラスト学習モデルに基づく予測器の構築は,既存のトラフィック予測ベンチマークよりも優れた性能を発揮することを示す実験と評価を行った。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:56:44 GMT)
Probabilistic Offline Policy Ranking with Approximate Bayesian
Computation [4.9] 安全性と信頼性のために、現実のデプロイメントの前に、候補ポリシーをオフラインで比較し、ランク付けすることが不可欠です。
我々は、OPR問題に対処する枠組みである確率的オフライン政策ランキング(POPR)を提示する。
POPRは値推定に依存せず、導出された性能後部は、最悪の、最も良い、平均的なケースの候補を区別するために使用することができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:22:44 GMT)
Testing Relative Fairness in Human Decisions With Machine Learning [4.9] この研究は、人間の判断における相対的公正性をテストすることを目的としている。
公正な決定”を定義する代わりに、私たちは、別の決定に対して設定された相対的公正性をチェックします。
人間の判断に基づいてトレーニングされた機械学習モデルがバイアス/推論を継承可能であることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:06:15 GMT)
Embedded Feature Similarity Optimization with Specific Parameter
Initialization for 2D/3D Medical Image Registration [4.5] 医用画像登録のための新しい深層学習フレームワークを提案する。
提案フレームワークは, 特殊訓練技術と新規な複合接続を用いて, マルチスケールの特徴を抽出する。
本実験により,本手法は登録性能を向上し,既存の手法を精度,実行時間で上回っていることが示された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:53:42 GMT)
Practical Scheme for Realization of a Quantum Battery [4.5] 非マルコフ状態における構造的貯留層下での原子空洞相互作用系からなる量子電池の実用化手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:08:51 GMT)
Ocean Data Quality Assessment through Outlier Detection-enhanced Active
Learning [4.3] 海洋プロファイリングに特化したArgoネットワークは、膨大な量の観測データを生成する。
機械学習を含む既存の方法は、ラベル付きデータの不均衡なデータセットによって不足する。
ALを用いた海洋データ品質評価のためのOフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:57:22 GMT)
Price-Discrimination Game for Distributed Resource Management in
Federated Learning [4.2] FedAvgのようなバニラ連合学習(FL)では、パラメータサーバ(PS)と複数の分散クライアントが典型的な買い手市場を形成する。
本稿では、異なるクライアントに対して同じサービス価格を提供するのではなく、異なるクライアントが提供するサービスの価格を区別することを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:14:50 GMT)
An appointment with Reproducing Kernel Hilbert Space generated by
Generalized Gaussian RBF as $L^2-$measure [4.0] Generalized Gaussian Radial Basis Function (RBF) Kernelsは、人工知能と機械学習ルーチンにおいて最も多く採用されているカーネルである。
この原稿は、前述の機械学習ルーチンに対する一般化ガウスRBFのカーネルセンスへの応用と、上記の関数との比較を実証している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:02:10 GMT)
Mostly Beneficial Clustering: Aggregating Data for Operational Decision
Making [4.0] 本稿では,クラスタ構造を利用したShrunken-SAA手法を提案する。
問題の数が増えるにつれて、問題間で与えられたクラスタ構造を活用することで、さらなるメリットが得られます。
提案手法は, 軽度条件下での一般的なコスト関数に拡張することができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:04:47 GMT)
Variational Inference on the Final-Layer Output of Neural Networks [3.7] 本稿では、最終層出力空間(VIFO)における変分推論を行うことにより、両方のアプローチの利点を組み合わせることを提案する。
ニューラルネットワークを用いて確率出力の平均と分散を学習する。
実験により、VIFOとVIFOのアンサンブルは、実行時間と不確実性の定量化の観点から良いトレードオフをもたらすことが示された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:16:31 GMT)
Improved Anonymous Multi Agent Path Finding Algorithm [3.7] エージェントの集合をグラフに限定する匿名多エージェントパスフィンディング(AMAPF)問題を考える。
我々は,検索空間を探索するアイデアを,個別の検索状態ではなく,一括して考えることによって活用する,特定の検索アルゴリズムを提案する。
その結果、AMAPFソルバは最先端の競合に比べて優れた性能を示し、30秒未満で利用可能なすべてのMAPFインスタンスを解決できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:49:30 GMT)
Investigating salient representations and label Variance in Dimensional
Speech Emotion Analysis [3.7] 事前訓練された表現空間内には、感情推定の性能を犠牲にすることなく、下流モデルの複雑さを低減できる低次元部分空間が存在することを示す。
音響的劣化に対する感情モデルのロバスト性を比較し、縮小次元表現は、実次元表現と同様の性能を維持できるが、実次元の感情性能は顕著に低下しないことを示した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:54:41 GMT)
AI Gender Bias, Disparities, and Fairness: Does Training Data Matter? [3.5] この研究は、人工知能(AI)におけるジェンダー問題に関する広範囲にわたる課題について考察する。
それは、6つの評価項目で男女1000人以上の学生の反応を分析する。
その結果,混合学習モデルのスコアリング精度は,男性モデルと女性モデルとでは有意な差があることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:37:06 GMT)
Large-Scale Multi-Robot Coverage Path Planning via Local Search [3.4] 本稿では,複数のロボットのカバレッジパスを計算することを目的とした,グラフベースのマルチロボットカバレッジパス計画(MCPP)について検討する。
我々はLS-MCPPと呼ばれる新しいアルゴリズムフレームワークを導入し、ローカル検索を活用して$D$で直接操作する。
実験ではLS-MCPPの有効性を実証し,初期解法を一貫して改善した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:14:07 GMT)
Explorers at #SMM4H 2023: Enhancing BERT for Health Applications through
Knowledge and Model Fusion [3.4] ソーシャルメディアは人間の健康を研究する上で貴重なデータ資源となっている。
本稿では,#SMM4H 2023共有タスクへの参加方法について概説する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:52:05 GMT)
An Empirical Study of Untangling Patterns of Two-Class Dependency Cycles [2.3] 依存性のサイクルは、ソフトウェアの品質と保守性に大きな課題をもたらします。
異なるドメインにわたる38のオープンソースプロジェクトのデータを分析し、手動で数百のサイクル回避ケースを検査しました。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:14:03 GMT)
Optimal non-Gaussian operations in difference-intensity detection and
parity detection-based Mach-Zehnder interferometer [2.3] マッハ・ツェンダー干渉計(MZI)を用いた位相推定における確率的非ガウス演算の利点について検討する。
光子サブトラクション(PS)、光子付加(PA)、光子モデル(PC)の3つの異なる非ガウス演算を実験的に実装可能なモデルを考える。
差分強度検出MZIでは,2つのPC操作が最も最適であるのに対し,パリティ検出ベースMZIでは2つのPA操作が最も最適であることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:52:14 GMT)
Measurement-based quantum computation in finite one-dimensional systems:
string order implies computational power [2.2] 本稿では,近距離対称資源状態における測定ベースの量子計算(MBQC)のパワーを評価するための新しい枠組みを提案する。
MBQC計算パワーと文字列順序の接続性を強化する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:45:44 GMT)
Chiral basis for qubits [2.2] 我々は,横スピンヘリックスとキンクからなる量子ビット基底を提案する。
任意の波長のヘリックスの緩和を記述する明示的な普遍関数を得る。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:32:44 GMT)
Unit Test Generation using Generative AI : A Comparative Performance
Analysis of Autogeneration Tools [2.1] 本研究では,Pythonプログラムの単体テストスクリプト生成におけるLarge Language Models(LLMs)の有効性を実験的に検討することを目的とする。
実験では,1)手続き型スクリプト,2)関数ベースのモジュール型コード,3)クラスベースのコードという3つのタイプのコードユニットを検討する。
以上の結果から,ChatGPTの性能はカバレッジ,正確性,可読性においてPynguinに匹敵することがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:38:11 GMT)
Multimodality in Online Education: A Comparative Study [2.0] 現在のシステムは、教育分野に焦点をあてていない単一のキューのみを考慮に入れている。
本稿では,オンライン教室における認識とその展開に影響を与えるマルチモーダルアプローチの必要性を強調した。
各キューで利用可能なさまざまな機械学習モデルを比較し、最も適切なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:57:36 GMT)
Cross-Domain Robustness of Transformer-based Keyphrase Generation [1.8] キーフレーズのリストは、データベースや電子文書のリポジトリにおけるテキストの重要な要素である。
本実験では,キーフレーズ生成のために微調整された抽象テキスト要約モデルを用いて,目的のテキストコーパスに対して非常に高い結果を示す。
本稿では,6つのベンチマークコーパス間のキーフレーズ選択タスクに対する微調整BARTモデルの評価を行う。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:27:15 GMT)
Search Still Matters: Information Retrieval in the Era of Generative AI [1.7] この視点は、IRプロセスのモチベーション、考慮、結果の文脈における生成的AIの使用を探求する。
このようなシステムのユーザ、特に学者は、信頼性、タイムライン、検索の文脈化に関する懸念を持っている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:57:21 GMT)
Android Malware Detection with Unbiased Confidence Guarantees [1.6] 本稿では,マルウェア検出毎に確実な信頼性を保証する機械学習動的解析手法を提案する。
提案手法は、Conformal Predictionと呼ばれる新しい機械学習フレームワークと、ランダムな森林分類器を組み合わせたものである。
実際のアンドロイドデバイスに1866の悪意のある4816の良質なアプリケーションをインストールすることで,大規模なデータセット上での性能を検証した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:07:31 GMT)
GO-DICE: Goal-Conditioned Option-Aware Offline Imitation Learning via
Stationary Distribution Correction Estimation [1.5] GO-DICEはゴール条件のロングホライゾンシーケンシャルタスクのためのオフラインIL技術である。
拡張的なDICEファミリーの技法に触発された政策学習は、静止分布の空間内で両方のレベルが成立する。
実験結果はGO-DICEが最近のベースラインより優れていることを裏付けるものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:47:49 GMT)
Geometric structure of Deep Learning networks and construction of global
${\mathcal L}^2$ minimizers [1.4] 本稿では,Deep Learning(DL)ネットワークの構造を幾何学的に解釈する。
この構造は、$L$隠れ層、ReLUランプアクティベーション関数、$mathcalL2$ Schattenクラス(またはHilbert-Schmidt)コスト関数、入出力空間によって特徴づけられる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 07:34:17 GMT)
Sparse Learning and Class Probability Estimation with Weighted Support
Vector Machines [1.4] 重み付きサポートベクトルマシン (wSVM) は、高い精度で様々な問題に対するクラス確率と分類を頑健に予測する上で、優れた値を示している。
スパース学習問題に対する精度の高い確率推定と自動変数選択を組み込んだ新しいwSVMフレームワークを提案する。
提案したwSVMsベースのスパース学習手法は幅広い応用があり、アンサンブル学習によりさらに$K$クラスに拡張できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:12:33 GMT)
Land use/land cover classification of fused Sentinel-1 and Sentinel-2
imageries using ensembles of Random Forests [1.2] 本研究では、土地利用/土地被覆(LULC)分類のための合成開口レーダ(SAR)と可視赤外短波赤外線(VNIR-SWIR)画像の相乗的組み合わせについて検討した。
ベイズ融合を利用した画像融合は、SARテクスチャバンドとVNIR-SWIR画像とを融合する。
本研究は, この融合がLULC分類に与える影響について検討することを目的とする。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:22:39 GMT)
Human AI Collaboration in Software Engineering: Lessons Learned from a
Hands On Workshop [1.1] この研究は、人間のAIインタラクションの進化する性質、ソフトウェアエンジニアリングタスクにおけるAIの能力、この領域にAIを統合することの課題と制限など、重要なテーマを特定している。
この結果は、AI、特にChatGPTがコード生成と最適化の効率を改善する一方で、特に複雑な問題解決とセキュリティ上の考慮を必要とする分野において、人間の監視は依然として重要であることを示している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:31:05 GMT)
Automatic Optimisation of Normalised Neural Networks [1.0] ニューラルネットワークの正規化パラメータに対する行列多様体の幾何を考慮した自動最適化手法を提案する。
我々の手法はまずネットワークを初期化し、初期化ネットワークの$ell2$-$ell2$ゲインに関してデータを正規化する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:13:42 GMT)
Revealing Networks: Understanding Effective Teacher Practices in
AI-Supported Classrooms using Transmodal Ordered Network Analysis [0.9] 本研究は,AI教師と連携した数学教室において,システム内学習の伝統的な指標に関連する効果的な教員の実践を理解するために,トランスモーダル順序ネットワーク分析を用いた。
教師の実践を学生の学習率で比較すると,低学率の生徒はモニタリング後,より有意な使用感を示した。
学習率の低い生徒は、高学率の学生と同様の学習行動を示し、教師の正しい試みを繰り返した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:50:02 GMT)
COPD-FlowNet: Elevating Non-invasive COPD Diagnosis with CFD Simulations [0.9] COPDFlowNetは, COPD患者の気管に特異的なCFD速度場画像を生成する。
COPDFlowNetは独自の畳み込みニューラルネットワーク(CNN)アーキテクチャを導入し、障害サイトの位置を予測する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:09:20 GMT)
Passive Photonic Phase Gate via a Two-Level Emitter and Few Cavities [0.8] 2レベルエミッタと少数のキャビティからなる単純なシステムでは、単一光子量子ビットを走行するための高忠実性決定性制御=$pi$相ゲートが実現可能であることを示す。
ゲートは、エミッタとキャビティ間のカップリングレートの最適設定と、適切な時間形状の光子ウェーブパケットの使用に依存している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 13:39:44 GMT)
T2M-HiFiGPT: Generating High Quality Human Motion from Textual
Descriptions with Residual Discrete Representations [0.8] T2M-HiFiGPTは、テキスト記述から人間の動きを合成するための新しい条件付き生成フレームワークである。
我々のCNNベースのRVQ-VAEは、高精度な2次元時間残差離散運動表現を生成可能であることを実証する。
この結果, RVQ-VAEは, VQ-VAEと比較して, 高精度な3次元人体の動きの計測に適していることが判明した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:58:31 GMT)
Security for Machine Learning-based Software Systems: a survey of
threats, practices and challenges [0.8] 機械学習ベースのモダンソフトウェアシステム(MLBSS)を安全に開発する方法は、依然として大きな課題である。
潜伏中の脆弱性と、外部のユーザーや攻撃者に暴露されるプライバシー問題は、ほとんど無視され、特定が難しい。
機械学習ベースのソフトウェアシステムのセキュリティは、固有のシステム欠陥や外敵攻撃から生じる可能性があると考えている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:17:11 GMT)
Can Offline A/B Testing Be Automated for Data-Driven Requirement
Engineering? [0.7] オフラインA/Bテストは、履歴ログデータを推定することで、新しい技術のオフライン評価を実行することを目的として、注目を集めている。
本稿では,最新のログに対してオフラインA/Bテストの変種を自動的に実行し,オフライン評価結果を更新するAutoOffABを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:49:14 GMT)
Distinguishing Translations by Human, NMT, and ChatGPT: A Linguistic and
Statistical Approach [0.7] 本研究では,(1)NMTとヒト翻訳(HT)からのChatGPT生成翻訳の識別可能性,(2)翻訳タイプの言語的特徴,(3)ChatGPT生成翻訳とHT,あるいはNMTとの類似度について検討する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:56:05 GMT)
Detecting QT prolongation From a Single-lead ECG With Deep Learning [0.7] 薬物によるQT延長リスクは、ディープラーニングを用いてECGリードIから追跡することができる。
我々は,ECGリードIからQT間隔を推定する深層学習モデルを開発した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:22:04 GMT)
Federated learning with differential privacy and an untrusted aggregator [0.5] モバイルデバイス上でのトレーニングモデルのフェデレーション学習が人気を集めている。
現在のシステムは、モデルの正確性、プライバシー保証、デバイスの効率の間に大きなトレードオフがある。
本稿では,このトレードオフを大幅に改善する新しいフェデレーション学習システムであるAeroについて述べる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:26:10 GMT)
Comparing Shor and Steane Error Correction Using the Bacon-Shor Code [0.5] 本研究では,23個の原子イオンの連鎖に実装されたBacon-Shor符号を用いて,ビットフリップ誤りのShorとSteaneの誤り訂正を実験的に比較した。
我々は,Steane誤り訂正が単一ラウンドの誤り訂正後の論理誤差率を向上し,誤り訂正を伴わないデータキュービットの乱れを低減することを発見した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:57:32 GMT)
Nonparametric Strategy Test [0.5] 本稿では,エージェントが与えられた混合戦略に従っているかどうかを,エージェントのプレイのサンプルが与えられた繰り返し戦略形式のゲームで判定する非パラメトリック統計的テストを提案する。
これには、エージェントの純粋な戦略の頻度がターゲットのイテレーションに十分近いかどうかを判断し、選択された純粋な戦略が異なるゲームイテレーション間で独立であるかどうかを決定する2つのコンポーネントが含まれる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:09:42 GMT)
Southern Ocean Dynamics Under Climate Change: New Knowledge Through
Physics-Guided Machine Learning [0.4] 我々は、気候モデルから容易にアクセス可能なフィールドを用いて、動的レジームと呼ばれる類似の物理学によって特徴づけられる海の領域を同定する。
我々は、ニューラルネットワークのアンサンブルを訓練し、不確実な定量化を可能にし、これらのレジームを予測し、気候変動の下でそれらを追跡する。
南極圏の極性海流は、炭素の減少と漁業にとって重要な地域である太平洋-南極海リッジと交差している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 08:25:42 GMT)
Dataset Optimization for Chronic Disease Prediction with Bio-Inspired
Feature Selection [0.3] 本研究は慢性疾患領域における予測分析の進歩に寄与する。
この研究の潜在的影響は、早期介入、精密医療、そして患者の成果の改善にまで及んでいる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 18:18:34 GMT)
Bengali Intent Classification with Generative Adversarial BERT [0.2] BNIntent30は,30の意図クラスを含むベンガル語意図分類データセットである。
データセットは、150以上のクラスに分類された多様なユーザインテントを含むCLINIC150データセットから抜粋され、翻訳される。
本稿では,GAN-BnBERT を用いたベンガル語意図分類手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:45:50 GMT)
Macroscopic distant magnon modes entanglement via a squeezed reservoir [0.2] 量子マグノニクスは、この方向に進むための有望なプラットフォームとして大きな注目を集めている。
提案手法では, 一つのイットリウム鉄ガーネット(YIG)球体を各空洞に収容した一次元キャビティアレイを用いた。
量子情報処理や量子通信システムにおけるキャビティ-マグノンアレイの応用が期待できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:07:11 GMT)
Meta-Referential Games to Learn Compositional Learning Behaviours [0.2] 構成学習行動(CLB)の学習における中心的な問題は、結合問題(BP)の解決である。
本稿では,BPのドメインに依存しないバージョンを解くことにより,CLBを提示するエージェントの能力を調べるベンチマークを提案する。
我々は、我々のベンチマークが魅力的な課題であることを示すベースラインの結果とエラー分析を提供し、研究コミュニティがより有能な人工エージェントを開発するよう促すことを願っている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:12:37 GMT)
ETHER: Aligning Emergent Communication for Hindsight Experience Replay [0.2] 自然言語条件強化学習(RL)エージェントは、構成性などの自然言語の性質が、複雑な政策を学ぶための強い帰納バイアスをもたらすことを示した。
Hindsight Experience Replay (HER)と言語コンディショニングの利点を組み合わせたHIGhERのような以前のアーキテクチャは、スパース報酬環境に対処する。
本研究では,BabyAIベンチマークの目標記述に使用される自然言語と一致した人工言語が出現することを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:30:11 GMT)
A Smoothing Algorithm for l1 Support Vector Machines [0.1] ソフトマージン支援ベクトルマシン(SVM)最適化問題を$ell1$ペナルティで解くためのスムーシングアルゴリズムを提案する。
このアルゴリズムはヒンジロス関数のスムース化と$ell1$ペナルティのアクティブなセットアプローチを使用する。
実験により,本アルゴリズムはトレーニング速度を犠牲にすることなく,試験精度を向上できることが示された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 00:54:56 GMT)
Validation of Rigorous Requirements Specifications and Document
Automation with the ITLingo RSL Language [0.0] ITLingoイニシアチブは、技術的文書の厳密さと一貫性を高めるためにRSLという要求仕様言語を導入した。
本稿では、要求検証と文書自動化の分野における既存の研究・ツールについてレビューする。
我々は、カスタマイズされたチェックと、RSL自体で動的に定義された言語規則に基づいて、仕様の検証によりRSLを拡張することを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:39:26 GMT)
Unmasking Deepfake Faces from Videos Using An Explainable Cost-Sensitive
Deep Learning Approach [0.0] ディープフェイク技術は広く使われており、デジタルメディアの信頼性に関する深刻な懸念につながっている。
本研究は,映像中のディープフェイク顔を効果的に検出するために,リソース効率が高く透明なコスト感受性深層学習法を用いている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:57:10 GMT)
Two-mode squeezing and SU(1,1) interferometry with trapped ions [0.0] 単一イオンの2つの運動モードに対して, 1モードと2モードの回路を実験的に実装した。
これは、トラップ電極に印加される振動電位を用いて、所要の変位、スクイーズ、2モードスクイーズ、ビームスプリッタ演算を実装することで達成される。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:44:21 GMT)
Towards AI-driven Integrative Emissions Monitoring & Management for
Nature-Based Climate Solutions [0.0] 本稿では,AIを活用した統合的・包括的意思決定支援のための新しい枠組みを提案する。
異なる要素ではなく、フレームワークの要素間でデータと分析結果の交換が大きな価値をもたらすと仮定する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:55:41 GMT)
The degenerate vertices of the $2$-qubit $\Lambda$-polytope and their
update rules [0.0] Lambda$-polytopesとして知られるオブジェクトのクラスは、古典的に魔法の状態で普遍的な量子計算をシミュレートするために導入された。
本稿では,ポリトープに対して$Lambda_2$,$$$-qubit$Lambda$の退化頂点の更新と記述を行う。
我々のアプローチは、$Lambda_2$がMermin正方形上の分布からなるよく理解されたpolytope $textMP$にプロジェクトするという事実を利用する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:43:13 GMT)
The Conditioning Bias in Binary Decision Trees and Random Forests and
Its Elimination [0.0] 格子特性を持つ特徴が存在する場合の条件付き演算子の選択によって生じるバイアスについて検討する。
我々は、このバイアスを排除し、決定木によるさらなる予測を必要とし、無作為な森林のコストを発生させない手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:56:39 GMT)
Sub-microsecond high-fidelity dispersive readout of a spin qubit with
squeezed photons [0.0] 量子誤り訂正を実現するためには、高速かつ高忠実な量子ビット測定が不可欠である。
提案手法では, 真空状態の変位により, 量子ビットの読み出し精度と速度が向上することを示した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:33:54 GMT)
Signature of attochemical quantum interference upon ionization and
excitation of an electronic wavepacket in fluoro-benzene [0.0] ベンゼンおよびフルオロベンゼン分子の異なる電子波束へのイオン化に伴う結合電子核動力学をシミュレートする。
フルオロベンゼンでは、計算は状態間および状態内量子干渉の両方を解き、アトケミカルの明確なシグネチャと自己相関関数の形で電荷指向の反応性を残す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:42:41 GMT)
Sentiment Analysis and Text Analysis of the Public Discourse on Twitter
about COVID-19 and MPox [0.0] 新型コロナウイルス(COVID-19)とMPox(MPox)の最近の流行は、情報の検索や共有、意見、感情の両面でのTwitter利用の触媒となった。
この分野での以前の研究は、COVID-19とMPoxの両方に焦点を当てたツイートを同時に分析することはなかった。
この研究ギャップに対処するため、2022年5月7日から2023年3月3日までに、MPoxとCOVID-19を同時に対象とする合計61,862のツイートが調査された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:50:27 GMT)
Random Forest Variable Importance-based Selection Algorithm in Class
Imbalance Problem [0.0] クラスバランスがRF変数の重要度に及ぼす影響について検討する。
RF変数の重要度とその信頼区間を利用した変数選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 01:11:03 GMT)
Probing atoms and molecules close to macroscopic bodie [0.0] シリコンチップ上に作製されたマイクロピラミドで原子雲をトラップする作業について、簡単に紹介します。
本研究は、SAIグループのレーザー物理学研究所で実施した研究について述べる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:30:47 GMT)
Photon-number resolution with microwave Josephson photomultipliers [0.0] マイクロ波共振器モードに閉じ込められた光子をジョセフソン光増倍器(JPM)による繰り返し測定により計数する。
2つの計数手法が研究され、第1に、測定シーケンスにおけるクリック総数をカウントする。第2に、第1のノークリックイベントの発生または測定シーケンスの終了までのクリック数をカウントする。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:41:38 GMT)
Penetration Testing and Legacy Systems [0.0] 現在の企業ビジネスシステムの70%はレガシーアプリケーションである。
本稿は,レガシシステムを確保するために取るべき対策について,読者の理解を支援することを目的としている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 19:51:22 GMT)
Observation of subdiffusive dynamic scaling in a driven and disordered
Bose gas [0.0] 本研究では, ボックストラッピングボースガスの強い周期強制下での動的挙動について検討した。
粒子間相互作用がなければ、駆動と障害の相互作用は等方性非熱的運動量分布をもたらす。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:33:16 GMT)
Nonadiabatic transitions during a passage near a critical point [0.0] 励起確率の先頭指数は、ダイクネの公式の標準引数によって得られることを示す。
スタークはしごの臨界点付近の遷移の、正確に解けるモデルを導入する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:43:45 GMT)
Multi-Label Classification of COVID-Tweets Using Large Language Models [0.0] ワクチンは新型コロナウイルスのパンデミックに対抗するための重要なステップだ。
多くの人は様々な理由でワクチンの使用に懐疑的です。
この課題の目標は、投稿者の表現するワクチンに対する具体的な懸念に応じて、ソーシャルメディアポストにラベルを付ける効果的なマルチラベル分類器を構築することである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:50:05 GMT)
Mixed Distillation Helps Smaller Language Model Better Reasoning [0.0] 本稿では,Program-of-Thought(PoT)とChain-of-Thought(CoT)の長所を活かしたtextbfMixed Distillationフレームワークを紹介する。
我々のフレームワークは、より小さなモデルの能力を高めるための有望なアプローチを提供し、大きな言語モデルとのギャップを埋める。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 14:28:28 GMT)
LightGCN: Evaluated and Enhanced [0.0] LightGCNは埋め込みの線形伝播を可能にし、性能を向上させる。
元の結果を再現し、多様なデータセットやメトリクスに対するLightGCNの堅牢性を評価し、LightGCNにおける信号伝搬の増大としてグラフ拡散を探索する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:18:18 GMT)
Knowledge Trees: Gradient Boosting Decision Trees on Knowledge Neurons
as Probing Classifier [0.0] 変圧器ニューラルネットワーク層の出力表現におけるロジスティック回帰は、言語モデルの構文特性の探索に最もよく用いられる。
本研究では, 変圧器層の出力表現におけるロジスティック回帰を用いた場合よりも, 知識ニューロン層での勾配向上決定木を用いた方が有利であることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 15:37:03 GMT)
Improving Cross-Domain Hate Speech Generalizability with Emotion
Knowledge [0.0] ヘイトスピーチ検出システムは、訓練で使用されるデータと異なるヘイトスピーチを識別する一般性に欠ける。
マルチタスクアーキテクチャにおける感情知識を活用するヘイトスピーチ一般化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:14:37 GMT)
Identifying Planetary Names in Astronomy Papers: A Multi-Step Approach [0.0] 多くの特徴名はシリア、アインシュタイン、セーガンなどの名前にちなむ地名や人物の名前と重複している。
いくつかの特徴名は、月のクレーターであるブラック、グリーン、ホワイトなど、形容詞である。
いくつかの特徴名は、月の西と南のクレーターのような方向を向いている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 23:20:49 GMT)
Identification of Knowledge Neurons in Protein Language Models [0.0] キー情報の理解を表現した知識ニューロンを同定し,特徴付ける。
自己認識モジュールのキーベクトル予測ネットワークには,知識ニューロンの密度が高いことを示す。
将来的には、各ニューロンが捉えた知識の種類を特徴付けることができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:23:43 GMT)
Human Voice Pitch Estimation: A Convolutional Network with Auto-Labeled
and Synthetic Data [0.0] 本稿では,ピッチ抽出のための特殊な畳み込みニューラルネットワークを提案する。
提案手法は,合成データと自動ラベル付アカペラ歌唱音声を組み合わせることで,ロバストなトレーニング環境を構築する。
この研究は、音楽と音声の両方において、ピッチ抽出の強化の道を開くものである。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 17:46:27 GMT)
Heuristics and Metaheuristics for Dynamic Management of Computing and
Cooling Energy in Cloud Data Centers [0.0] 共同冷却・計算最適化のための新しい電力・熱対応戦略とモデルを提案する。
結果から,メタヒューリスティックアルゴリズムと最適適応アルゴリズムの併用により,グローバルエネルギーを高速かつ軽量な最適化戦略に記述できることが示唆された。
このアプローチにより、コンピューティングと冷却インフラストラクチャの両方を考慮して、データセンターのエネルギー効率を21.74%向上し、サービス品質を維持しながら、最大で21.74%向上できる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:40:36 GMT)
Generalization Analogies: A Testbed for Generalizing AI Oversight to
Hard-To-Measure Domains [0.0] 報酬モデルは、デフォルトでは命令フォローを評価することを学ばない。
報酬モデルの内部表現を解釈する技術は、標準的な微調整よりも優れた一般化を実現する。
我々は15の最も困難な分布シフトをジェネラライゼーションアナログIESベンチマークに統合する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:18:14 GMT)
Facial Emotion Recognition using CNN in PyTorch [0.0] カメラ画像からリアルタイムの顔の感情を認識するモデルを実装した。
我々のモデルはPyTorchライブラリを利用した畳み込みニューラルネットワークに基づいている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 21:31:35 GMT)
Evidence for reentrant quantum paraelectric state preceded by a
multiglass phase with non-classical exponent and magnetodielectric coupling
in SrFe12O19 [0.0] SrFe12O19の量子臨界状態における非古典的指数を持つ双極子ガラス(DG)相に先行する再入射型量子パラ誘電体(QPE)状態の証拠を示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:14:46 GMT)
Evaluating AI Vocational Skills Through Professional Testing [0.0] 本研究は,GPT-3とTurbo-GPT3.5の2つのAIモデルの職業能力を評価することに焦点を当てた。
どちらのモデルも、従来の機械の役割以外の感覚や経験に基づくテストでよく評価された。
調査によると、OpenAIのBabageからTurboへのモデル改善により、数年のうちにグレードスケールでのパフォーマンスが60%向上した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 04:41:59 GMT)
Dissipative Stability and Dynamical Phase Transition in Two Driven
Interacting Qubits [0.0] マルコフ浴と相互作用しながら, 時間周期外界の影響を受ける2量子系について検討した。
以上の結果から, 動的位相遷移をナビゲートするシステムの能力が明らかとなった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 05:12:52 GMT)
Deep-Dispatch: A Deep Reinforcement Learning-Based Vehicle Dispatch
Algorithm for Advanced Air Mobility [0.0] 我々は,営業利益を最大化するために,深層強化学習に基づくeVTOLディスパッチアルゴリズムを開発した。
提案アルゴリズムの性能評価のために,eVTOLを用いた乗客輸送シミュレーション環境を構築した。
その結果,マルチエージェントeVTOLディスパッチアルゴリズムは最適ディスパッチポリシーを近似できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:21:49 GMT)
Decoding Concerns: Multi-label Classification of Vaccine Sentiments in
Social Media [0.0] 新型コロナウイルス(COVID-19)のパンデミックは、ワクチンが私たちを守る上で重要な役割を担っていることを強調した。
本論文は、予防接種の文脈で表されるこれらの多様な懸念を包括的に理解し、分類することの課題に対処する。
我々の焦点は、ワクチンに対する明瞭な理解に基づいて、特定の関心ラベルのツイートを割り当てる、堅牢なマルチラベルの開発である。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 06:55:04 GMT)
Commutativity and Disentanglement from the Manifold Perspective [0.0] 本研究では,行列指数演算子を学習し,データ生成モデルを圧縮する2種類の問題に対して,この多様体フレームワークが与える影響について検討する。
それぞれの問題において、多様体のパースペクティブは、それらの解の実現可能性と実りあるアプローチに関する興味深い結果をもたらす。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 03:33:23 GMT)
Can persistent homology whiten Transformer-based black-box models? A
case study on BERT compression [0.0] 本稿では BERT モデルに説明可能性をもたらす OBCE (Optimus BERT Compression and Explainability) を提案する。
提案手法は,ニューロンに説明可能性を提供し,モデルのサイズを小さくすることで,BERTモデルを「白色化」することができる。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:33:50 GMT)
Bird Movement Prediction Using Long Short-Term Memory Networks to
Prevent Bird Strikes with Low Altitude Aircraft [0.0] 空域内での航空機と鳥の衝突数は過去10年間で急増している。
アドバンスト・エアモビリティ(Advanced Air Mobility)が低高度空域で運用を開始すると、航空機による鳥の攻撃は劇的に増加すると予想されている。
我々は,鳥の動きの緯度と経度を予測するために,LSTM(Long Short-Term Memory)モデルを4種類実装した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:12:39 GMT)
Bilayer crystals of trapped ions for quantum information processing [0.0] ペニングトラップは、数百のイオンが2つのよく定義された層に自己組織化する、驚くほどクリーンな2層結晶を実現するために使用できることを示す。
これらの2層結晶は、アンハーモニックトラップ電位を含むことにより可能となる。
2層以上の多層結晶を実現するために、ここで提示されたアイデアを拡張することが可能である。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 10:51:00 GMT)
Bengali License Plate Recognition: Unveiling Clarity with CNN and
GFP-GAN [0.0] LPRは、車両ナンバープレートから自動的にデータを読み取り、抽出するシステムである。
この計画のために1292枚のベンガル数字と文字のデータセットが準備された。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:28:30 GMT)
Beam Splitter Physics and Testing Bell Inequalities with Phase Retarders [0.0] 量子力学的粒子(量子粒子)の統計的挙動を明らかにするため、ビームスプリッター(BS)は量子物理学において不可欠である
本稿では,BS-P-BSシステムとフェーズリターダ(P)の組み合わせについて検討し,新興量子技術におけるBS-P-BSシステムの重要性を強調した。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 22:47:08 GMT)
AutoVisual Fusion Suite: A Comprehensive Evaluation of Image
Segmentation and Voice Conversion Tools on HuggingFace Platform [0.0] 本研究では,HuggingFaceプラットフォーム上で利用可能なツールについて,画像分割と音声変換の2つの重要な応用について総合評価を行った。
画像セグメンテーションのためのResNet-50バックボーンを用いたSAMやDETRモデル、音声変換のためのいわゆるvits-svc-forkモデルなど、事前訓練されたセグメンテーションモデルのパワーを活用した。
本稿では,AutoVisual Fusion Suiteという統合プロジェクトにおいて,ビデオセグメンテーションと音声変換の組み合わせが成功していることを示す。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 16:38:41 GMT)
Approximating outcome probabilities of linear optical circuits [0.0] 線形光回路の出力確率を近似する古典的アルゴリズムを提案する。
提案手法は,回路の古典性に応じて精度の高い結果確率を効率的に推定する。
我々の研究は線形光学のパワーに光を当て、計算複雑性の問題に多くの量子インスパイアされたアルゴリズムを提供する。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 11:57:30 GMT)
Analisis Eksploratif Dan Augmentasi Data NSL-KDD Menggunakan Deep
Generative Adversarial Networks Untuk Meningkatkan Performa Algoritma Extreme
Gradient Boosting Dalam Klasifikasi Jenis Serangan Siber [0.0] 第一の目的は、NSL-KDDデータセット上のサイバー攻撃の分類におけるeXtreme Gradient Boosting(XGBoost)の有効性を高めることである。
その結果, GANによるデータ拡張を伴わないXGBoostモデルで99.53%, GANを用いたデータ拡張で99.78%の精度が得られた。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 09:54:07 GMT)
An Interpretable Deep Learning Approach for Skin Cancer Categorization [0.0] 我々は、皮膚がん検出の問題に対処するために、現代のディープラーニング手法と説明可能な人工知能(XAI)アプローチを使用する。
皮膚病変の分類には,XceptionNet,EfficientNetV2S,InceptionResNetV2,EfficientNetV2Mの4つの最先端事前訓練モデルを用いる。
我々の研究は、ディープラーニングと説明可能な人工知能(XAI)が皮膚がんの診断をどのように改善するかを示している。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 12:11:38 GMT)
A review-based study on different Text-to-Speech technologies [0.0] 本稿では, 共役TS, ホルマント合成TS, 統計パラメトリックTSなど, 利用可能なTS技術について検討する。
この研究は、これらの技術の利点と限界を、音声の自然性、システムの複雑さのレベル、異なるアプリケーションに適合する可能性の観点から比較することに焦点を当てている。
論文参考訳(メタデータ) (Sun, 17 Dec 2023 20:07:23 GMT)