SingingHead: A Large-scale 4D Dataset for Singing Head Animation [75.6] 我々は,27時間以上の同期歌唱ビデオ,3D顔の動き,歌声音声,バックグラウンド音楽からなる大規模歌唱ヘッドデータセットであるSingingHeadを収集した。
SingingHeadデータセットとともに、既存の音声駆動型3D顔アニメーション法と2Dトーキングヘッド法を歌唱タスク上でベンチマークする。
We propose a unified singing head animation framework called UniSinger to achieve both singing audio-driven 3D singing head animation and 2D singing portrait video synthesis。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:16:43 GMT)
A3S: A General Active Clustering Method with Pairwise Constraints [66.7] A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:37:03 GMT)
Multi-Granularity Semantic Revision for Large Language Model Distillation [66.0] LLM蒸留における多粒性セマンティックリビジョン法を提案する。
シーケンスレベルでは、シーケンス修正と再生戦略を提案する。
トークンレベルでは、蒸留目的関数として、Kulback-Leibler損失を補正する分布適応クリッピングを設計する。
スパンレベルでは、シーケンスのスパン前処理を利用して、スパン内の確率相関を計算し、教師と学生の確率相関を一貫性に制約する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:51:49 GMT)
What Makes and Breaks Safety Fine-tuning? Mechanistic Study [65.0] 安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全微調整法として, 教師付き安全微調整, 直接選好最適化, 未学習の3つの方法を検討した。
逆入力(例えばjailbreak)が提供されると、そのアクティベーションはより安全なサンプルに近づき、それが安全であるかのようにモデル処理される。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 16:12:57 GMT)
All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era [63.6] 我々は、リコメンデータシステムをより広い視野に統合し、将来の研究のためのより包括的なソリューションの道を開くことを目指しています。
我々は、リストワイズレコメンデーションと会話レコメンデーションを通じて、現代のレコメンデーションシステムの2つの進化経路を特定する。
本稿では,ユーザの獲得コストを削減しつつ,推薦情報の有効性を高めることを指摘する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 05:02:21 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos Perspective [63.6] textbftextitAttraosはカオス理論を長期時系列予測に取り入れている。
本研究では,AttraosがPatchTSTと比較して,パラメータの12分の1しか持たない主流データセットやカオスデータセットにおいて,LTSF法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:46:50 GMT)
Can Adversarial Examples Be Parsed to Reveal Victim Model Information? [62.8] 本研究では,データ固有の敵インスタンスから,データに依存しない被害者モデル(VM)情報を推測できるかどうかを問う。
我々は,135件の被害者モデルから生成された7種類の攻撃に対して,敵攻撃のデータセットを収集する。
単純な教師付きモデル解析ネットワーク(MPN)は、見えない敵攻撃からVM属性を推測できることを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 05:13:02 GMT)
3D Small Object Detection with Dynamic Spatial Pruning [62.7] 本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 02:36:42 GMT)
Shape2Scene: 3D Scene Representation Learning Through Pre-training on Shape Data [61.4] Shape2Scene(S2S)は3次元形状データから大規模3次元シーンの表現を学習する新しい手法である。
MH-P/Vは、複数のスケールにわたる深い意味情報をキャプチャする高解像度機能への直接パスを確立する。
S2SSアマルガメートは様々な形状を指して、トレーニングデータのためのランダムな擬似シーン(複数のオブジェクトを含む)を作成する。
実験では,MH-P/Vで学習した3次元表現の形状レベルおよびシーンレベルの3次元タスク間での伝達性を示した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:42:05 GMT)
MPM: A Unified 2D-3D Human Pose Representation via Masked Pose Modeling [59.7] mpmcanは、3D人間のポーズ推定、クラッドされた2Dポーズからの3Dポーズ推定、3Dポーズ完了をtextocbsingleフレームワークで処理する。
MPI-INF-3DHPにおいて、広く使われているポーズデータセットの広範な実験とアブレーション研究を行い、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 18:13:33 GMT)
Roleplay-doh: Enabling Domain-Experts to Create LLM-simulated Patients via Eliciting and Adhering to Principles [58.8] ドメインエキスパートから定性的なフィードバックを引き出す新しい人間-LLMコラボレーションパイプラインであるRoleplay-dohを開発した。
このパイプラインを適用して、シニアメンタルヘルスサポーターが、シミュレートされた実践パートナのためにカスタマイズされたAI患者を作成できるようにします。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 22:35:34 GMT)
VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.4] LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 23:11:05 GMT)
WildAvatar: Web-scale In-the-wild Video Dataset for 3D Avatar Creation [55.9] WildAvatar(ワイルドアバター)は、YouTubeから抽出されたウェブスケールの人間のアバター生成データセットである。
我々は,アバター作成における現実のアプリケーションにおける未探索課題を,データセット上でいくつかの最先端アバター作成手法を評価した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:15:12 GMT)
Lean-STaR: Learning to Interleave Thinking and Proving [53.9] 証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。
Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 01:43:07 GMT)
Cross-Lingual Multi-Hop Knowledge Editing -- Benchmarks, Analysis and a Simple Contrastive Learning based Approach [53.0] 言語横断的な設定で様々なSoTA知識編集技術の性能を計測・解析するための多言語多言語知識編集パラダイムを提案する。
具体的には、知識編集能力を測定するために並列言語間ベンチマーク CROLIN-MQUAKE を作成します。
次に,言語間マルチホップ知識編集システムであるCLEVER-CKEを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:18:16 GMT)
A Closer Look at the Limitations of Instruction Tuning [52.6] インストラクションチューニング(IT)は,大規模言語モデル(LLM)における知識やスキルの向上に失敗することを示す。
また、一般的なIT改善手法は、シンプルなLoRA微調整モデルよりも性能改善につながるものではないことも示している。
この結果から,事前学習した知識のみから生成した応答は,オープンソースデータセット上でITから新たな知識を学習するモデルによって,一貫した応答性能が向上することが判明した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 18:14:57 GMT)
CLIP-Guided Networks for Transferable Targeted Attacks [52.3] トランスファー可能な敵攻撃は、ブラックボックスのシナリオで敵が特定した予測を出力するモデルを誤解させることを目的としている。
textitsingle-target 生成攻撃は、高い転送可能な摂動を生成するために、各ターゲットクラスのジェネレータを訓練する。
textbfCLIP-guided textbfGenerative textbfNetwork with textbfCross-attention module (CGNC) to enhance multi-target attack。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 12:30:32 GMT)
From PEFT to DEFT: Parameter Efficient Finetuning for Reducing Activation Density in Transformers [52.2] 本稿では,事前学習したモデルにおいて,高い活性化空間性を促進する新しい密度損失を提案する。
提案手法である textbfDEFT は,RoBERTa$_mathrmLarge$ で textbf44.94% ,Flan-T5$_mathrmXXL$ で textbf53.19% (エンコーダ密度) と textbf90.60% (デコーダ密度) で常に活性化密度を減少させることができる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:32:36 GMT)
DiffBP: Generative Diffusion of 3D Molecules for Target Protein Binding [52.0] 従来の研究は通常、原子の要素タイプと3次元座標を1つずつ生成する自己回帰的な方法で原子を生成する。
現実世界の分子系では、分子全体の原子間の相互作用が大域的であり、原子間のエネルギー関数が結合する。
本研究では、標的タンパク質に基づく分子3次元構造の生成拡散モデルを構築し、非自己回帰的に全原子レベルで構築する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 06:41:36 GMT)
Spurious Feature Diversification Improves Out-of-distribution Generalization [43.8] アウト・オブ・ディストリビューション(OOD)データへの一般化は、機械学習において重要な課題である。
トレーニング済みモデルと微調整済みモデルの間を補間する一般的な重量空間アンサンブル法であるWiSE-FTについて検討する。
We observed an unexpected FalseFalseTrue, where WiSE-FT successfully corrects many case that each each model makes wrong corrects。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:02:49 GMT)
WPS-SAM: Towards Weakly-Supervised Part Segmentation with Foundation Models [43.3] Weakly-supervised Part (WPS) と WPS-SAM という手法を提案する。
WPS-SAMは画像から直接プロンプトトークンを抽出し、部分領域のピクセルレベルのセグメンテーションを実行するために設計されたエンドツーエンドフレームワークである。
実験により、事前訓練された基礎モデルに埋め込まれた豊富な知識を利用することで、WPS-SAMはピクセルレベルの強いアノテーションで訓練された他のセグメンテーションモデルより優れていることが示された。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:31:21 GMT)
Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization [42.3] この研究は、このトレードオフを効果的に管理するために、RLと軌道最適化を組み合わせた新しいアプローチを導入する。
我々のアプローチは、修正マルコフ決定プロセス(MDP)の動作空間に安全制約を埋め込む。
この新しいアプローチは、セーフティ・ジムの課題に挑戦するパフォーマンスに優れており、推論中にはるかに高い報酬とほぼゼロに近い安全違反を達成している。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:56:37 GMT)
MoAI: Mixture of All Intelligence for Large Language and Vision Models [42.2] Mixture of All Intelligence (MoAI)は、命令調整型大規模言語および視覚モデル(LLVM)である。
MoAIは外部セグメンテーション、検出、SGG、OCRモデルの出力から得られる補助的な視覚情報を使用する。
MoAIは、多数のゼロショットビジョン言語(VL)タスクにおいて、オープンソースとクローズドソースのLLVMの両方を著しく上回っている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 18:13:53 GMT)
When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset [40.2] 本稿では,マルチモーダル知覚のための新しい一般化モデルであるMMPedestronを紹介する。
提案手法は,モーダル表現と融合のための統一エンコーダと,歩行者検出のための汎用ヘッドを備える。
マルチモーダルジョイントトレーニングでは、幅広い歩行者検出ベンチマークにおいて最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:16:49 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey [40.1] AI生成メディアがより現実的になるにつれて、誤情報を拡散したり、身元確認詐欺を犯したりする危険性が高まっている。
この研究は、従来の単一モダリティ手法から、音声・視覚・テキスト・視覚シナリオを扱う高度なマルチモーダルアプローチへの進化を辿る。
私たちの知る限りでは、この種の調査はこれが初めてである。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:27:56 GMT)
You Only Learn One Query: Learning Unified Human Query for Single-Stage Multi-Person Multi-Task Human-Centric Perception [37.7] 人間中心の知覚は、コンピュータビジョンの長年の問題である。
本稿では,一段階多人数マルチタスク人間中心認識(HCP)のための統合多目的フレームワーク(HQNet)を提案する。
Human Queryは、個人のための複雑なインスタンスレベルの機能をキャプチャし、複雑なマルチパーソンシナリオを分離する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:33:09 GMT)
Parameter Estimation for Generalized Low-Rank Matrix Sensing by Learning on Riemannian Manifolds [37.5] 我々は、一般化された低ランク行列センシングのための収束保証を証明した。
最適推定器の局所収束に着目し、最適化の問題を無視する。
我々の解析は、パラメータ空間の回転対称性を扱うためにリーマン幾何学のツールに依存している。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:11:13 GMT)
MKDTI: Predicting drug-target interactions via multiple kernel fusion on graph attention network [37.4] グラフアテンションネットワークの様々な層埋め込みからカーネル情報を抽出することにより、MKDTIと呼ばれるモデルを定式化する。
我々は、Dual Laplacian Regularized Least Squaresフレームワークを使用して、新規なドラッグターゲットエンティティ接続を予測する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 02:53:25 GMT)
LeanQuant: Accurate Large Language Model Quantization with Loss-Error-Aware Grid [36.3] 大規模言語モデル (LLM) は様々な分野にまたがって多くの応用がある。
重み量子化は、LLMの復号遅延とメモリ要求を低減する効果的な手法である。
本稿では,逆対角Hessianを利用して損失エラー対応量子化グリッドを学習するLeanQuantを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 00:23:51 GMT)
A Watermark-Conditioned Diffusion Model for IP Protection [32.0] 拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。
そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。
本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 06:53:20 GMT)
InfiniMotion: Mamba Boosts Memory in Transformer for Arbitrary Long Motion Generation [31.8] 現在の手法では、計算コストが高いため、単一の入力として長い動き列を扱うのに苦労している。
自己回帰フレームワーク内で任意の長さの連続的な動き列を生成する手法であるInfiniMotionを提案する。
約8万フレームの連続した1時間の人間の動きを生成することで、その画期的な能力を強調します。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:12:19 GMT)
Time-SSM: Simplifying and Unifying State Space Models for Time Series Forecasting [22.8] 状態空間モデル(SSM)は、基底関数の集合を用いて連続系を近似し、それらを離散化して入力データを処理する。
本稿では,SSMを時系列データに適用するためのより直感的で汎用的なガイダンスを提供する,動的スペクトル演算子(Dynamic Spectral Operator)と呼ばれる新しい理論フレームワークを提案する。
パラメータの7分の1しか持たない新しいSSM基盤モデルであるTime-SSMを紹介する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:40:20 GMT)
The Hidden Influence of Latent Feature Magnitude When Learning with Imbalanced Data [22.5] 不均衡データを用いた学習における一般化の障害の主な原因の1つは、MLモデルが推論を行う固有の方法であることを示す。
攻撃的データ拡張は一般にマイノリティクラス予測の精度を向上するが、パラメトリックMLモデルはクラスラベルと限られた機能の組み合わせを関連づける。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 11:20:50 GMT)
Key-Point-Driven Mathematical Reasoning Distillation of Large Language Model [21.8] KPDD(Key-Point-Driven Mathematical Reasoning Distillation)を提案する。
KPDDは、問題解決プロセスを3段階に分割することで、SLMの推論性能を向上させる。
実験により、KPDD-CoTは推論能力を大幅に向上し、KPDD-PoTは数学的推論タスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 11:41:03 GMT)
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with Smartwatches [21.5] スマートウォッチを用いたウェアラブルソリューションであるUWashを提案し,ハンドウォッシングの手順を評価する。
コンピュータビジョンにおけるアクションセグメンテーション問題と同様の動作センサの読み書きによるハンドウォッシング評価の課題に対処する。
51人以上の被験者による実験では、UWashはハンドウォッシングジェスチャー認識において92.27%の精度を達成している。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:35:23 GMT)
Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models [21.5] ビデオ異常検出は、セキュリティ監視や自動運転といったアプリケーションには不可欠である。
既存のVADメソッドは、検出の背後にある根拠をほとんど示さず、現実世界のデプロイメントに対する公衆の信頼を妨げる。
本稿では,大言語モデルを用いたVADのためのルールベースの推論フレームワークであるAnomalyRulerを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 19:23:12 GMT)
Defending Against Repetitive-based Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off [20.7] 半教師付き学習(SSL)は、わずかなラベル付きデータで顕著なパフォーマンスを達成した。
信頼できないデータの大規模なプールは、データ中毒に極めて脆弱であり、バックドア攻撃につながる可能性がある。
トリガーパターンとターゲットクラスの関係を阻害する新しい手法であるunlabeled Data Purification (UPure)を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 12:42:11 GMT)
Tree-D Fusion: Simulation-Ready Tree Dataset from Single Images with Diffusion Priors [20.6] 我々は,600,000の環境に配慮した3次元シミュレーション対応ツリーモデルの最初のコレクションを特徴とするツリーD融合について紹介する。
再構成された各3Dツリーモデルは、GoogleのAuto Arboristデータセットの画像に対応する。
本手法は,木種を特定するためのテキストプロンプトを利用して,2種類の木適応拡散モデルのスコアを蒸留する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:56:07 GMT)
PAFUSE: Part-based Diffusion for 3D Whole-Body Pose Estimation [20.4] 本研究では,3次元全体のポーズ推定に新たなアプローチを導入し,身体部分間のスケールと変形性-分散の課題に対処する。
不均一なサンプルデータにおける動きの活用という課題に対処するだけでなく、安定な拡散と階層的な部分表現を結合する。
H3WBデータセットでは,時間情報の活用に失敗した技術の現状を大幅に上回っている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:24:05 GMT)
Disrupting Diffusion-based Inpainters with Semantic Digression [20.1] Web やソーシャルメディア上での視覚的誤情報の生成は,テキスト・画像拡散モデルの出現とともに指数関数的に増加している。
すなわち、安定拡散のインペイントは、個人的および私的人物の悪意に塗られたイメージと、ディープフェイク(deepfakes)として知られる著作権のあるコンテンツの合成を可能にする。
このような世代と戦うために、フォトガードと呼ばれる破壊的枠組みが提案され、環境画像に逆ノイズを加えて、その影響を和らげる合成を妨害する。
彼らのフレームワークは拡散に親しみやすいアプローチを提案するが、破壊は十分に強くはなく、コンテキストイメージを免疫するのにかなりの量のGPUと時間を必要とする。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:21:19 GMT)
Enhancing Low-Precision Sampling via Stochastic Gradient Hamiltonian Monte Carlo [20.0] 深層ニューラルネットワークのトレーニング効率を高めるための、有望な低コスト技術として、低精度トレーニングが登場している。
本稿では, グラディエント・ハミルトン・モンテカルロ(SGHMC)による低精度サンプリングについて検討する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:02:27 GMT)
Have ASkotch: Fast Methods for Large-scale, Memory-constrained Kernel Ridge Regression [18.1] KRRソルバを大規模データセットにスケールすることは困難である。
我々は, KRR の反復解法における記憶と繰り返しの複雑さを低減するために ASkotch を提案する。
我々の研究は、幅広い分野にわたるKRRの非想像的応用の可能性を開く。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:11:10 GMT)
A Framework for Evaluating Privacy-Utility Trade-off in Vertical Federated Learning [18.0] プライバシ・ユーティリティ評価問題を定式化する評価フレームワークを提案する。
我々は,3つの広くデプロイされたVFLアルゴリズムに対して,最先端のプライバシ攻撃に対する幅広い保護機構を評価する。
VFLシステムのプライバシー保護機能を改善するための具体的なアドバイスを提供する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:23:56 GMT)
Nonrigid Reconstruction of Freehand Ultrasound without a Tracker [17.1] トラッカーを使わずに2Dフリーハンド超音波(US)フレームを3次元空間に再構成する手法は,近年,ディープラーニングの進歩を目にしている。
本研究では, 3次元USの再構成における非剛性変換の予測手法とその利点について検討した。
そこで本稿では, トラッカーからの接地構造によって制御されたUSフレーム間の剛性変換を同時に推定する, 正規化された登録ネットワークによって最適化された非剛性変形を同時に最適化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:36:37 GMT)
On the Importance of Uncertainty in Decision-Making with Large Language Models [17.0] 自然言語を入力とする意思決定問題における不確実性の役割について検討する。
我々は、Laplace Approximation、Dropout、Epinetsなどの不確実性推定に異なる手法を採用する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 02:20:59 GMT)
Lost and Found: Overcoming Detector Failures in Online Multi-Object Tracking [15.5] マルチオブジェクト追跡(MOT)は、時間とともに複数のオブジェクトのアイデンティティと位置を正確に推定する。
現代の検出器は、あるフレーム内のいくつかのオブジェクトを見逃すことがあるため、トラッカーは早めに追跡をやめる。
オンラインTbDシステムと互換性のある汎用フレームワークであるBUSCAを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:45:12 GMT)
ChatLogic: Integrating Logic Programming with Large Language Models for Multi-Step Reasoning [15.5] 本稿では、推論タスクに特化したフレームワークChatLogicを紹介する。
ChatLogicでは、言語モデルが中心的な役割を担い、コントローラとして機能し、すべてのシステム運用ステージに参加する。
本稿では,論理問題を推論エンジンとのシンボリックな統合に変換する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 11:06:43 GMT)
SUP-NeRF: A Streamlined Unification of Pose Estimation and NeRF for Monocular 3D Object Reconstruction [15.2] 我々は,オブジェクトポース推定とNeRFに基づくオブジェクト再構成の合体であるSUP-NeRFを提案する。
SUP-NeRFは物体の次元推定を分離し、スケールと深さのあいまいさを解決するために精細化を行う。
SUP-NeRFは、nuScenesデータセットの再構成とポーズ推定の両方を行う。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 18:50:38 GMT)
V2I-Calib: A Novel Calibration Approach for Collaborative Vehicle and Infrastructure LiDAR Systems [13.1] 本稿では,自動車と道路インフラのLiDARシステムのための新しいキャリブレーション手法を提案する。
親和性行列を構成することにより,車両ノードとインフラノード間の共通マッチングボックスを探索する。
DAIR-V2Xデータセットの実験により,本手法の優位性が確認された。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:34:00 GMT)
A Quantum Automatic Tool for Finding Impossible Differentials [13.0] 不可能な微分を探索するための2つの量子自動ツールを提案する。
提案した量子アルゴリズムは、ミス・イン・ザ・ミドル(英語版)の概念と、切り刻まれた微分の性質を利用する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:00:24 GMT)
Gaussian in the Wild: 3D Gaussian Splatting for Unconstrained Image Collections [12.8] 制約のない画像における光度変化と過渡オクルーダは、元のシーンを正確に再構築することが困難である。
ニューラルレージアンスフィールド(NeRF)におけるグローバルな外観特徴の導入による課題への先行的アプローチ
この事実に触発されて,3次元ガウス点を用いてシーンを再構築する手法であるGaussian in the wild (GS-W)を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:25:46 GMT)
Empowering ChatGPT-Like Large-Scale Language Models with Local Knowledge Base for Industrial Prognostics and Health Management [12.4] ChatGPTのような大規模言語モデル(LLM)は、AI分野における新たなイノベーションのラウンドをリードし始めている。
ChatGPTのようなLLMには豊富な知識と強力な言語理解と生成能力があるが、ドメイン固有の専門知識は欠如している。
本研究は,産業用PHMにおける局所知識ベース(LKB)によって付与されるChatGPT-like LLMを用いて,上記の制限を解決することを目的とする。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:01:01 GMT)
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction [10.4] 大規模言語モデルは現実世界のアプリケーションで顕著に使われ、しばしば大量の文書を推論する。
本稿では,標準テストの限界に対処する評価フレームワークであるSWiMを提案する。
また,この効果を緩和する,単純かつ効果的なトレーニングフリーアプローチであるメドイド投票を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 22:47:13 GMT)
Evolutionary Trigger Detection and Lightweight Model Repair Based Backdoor Defense [10.3] ディープニューラルネットワーク(DNN)は、自律運転や顔認識など、多くの分野で広く利用されている。
DNNモデルのバックドアは、トリガーによる有毒な入力によってアクティベートされ、誤った予測につながる。
進化的トリガ検出と軽量モデル修復に基づく効率的なバックドア防御を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:25:25 GMT)
Learning Unlabeled Clients Divergence via Anchor Model Aggregation for Federated Semi-supervised Learning [10.3] SemiAnAggはアンカーモデルを通じて未ラベルのクライアントコントリビューションを学習する。
SemiAnAggは4つの広く使用されているFedSemiベンチマークにおいて、最先端の新たな結果を達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:50:40 GMT)
Resource-efficient Direct Characterization of General Density Matrix [10.1] 逐次弱測定により、密度行列全体を世界規模で再構成するのではなく、個々の密度行列要素を直接抽出することができる。
汎用マルチキュージットシステムの密度行列を直接特徴付けるリソース効率の手法(RES)を提案する。
我々はRESを一般の単一光子クォート状態と2光子絡み状態の直接的評価に実験的に適用した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 05:03:42 GMT)
"Add more config detail": A Taxonomy of Installation Instruction Changes [10.0] インストール関連セクションの更新に重点を置いた1,163のコミットでGitHubリポジトリを調査した。
調査の結果,コミットの変更には,プリインストール命令,インストール後のインストレーション命令,ドキュメント提示,外部リソース管理の6つの大きなカテゴリが明らかになった。
そこで本稿では,ドキュメント更新時にドキュメンテーションメンテナが参照するインストール関連セクションをカバーするテンプレートを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:37:33 GMT)
Towards detailed and interpretable hybrid modeling of continental-scale bird migration [9.9] 我々は最近開発された大陸規模の鳥の移動のハイブリッドモデルを構築し、流体力学にインスパイアされた運動モデルと繰り返しニューラルネットワークを組み合わせる。
F FluxRGNNは、重要なマイグレーションパターンの予測に成功しているが、その空間分解能は、気象レーダーから得られる典型的な希薄な観測によって制限されている。
本稿では,モデルコンポーネントの解釈可能性の制御を提供しながら,望まれるテッセル化に関するより詳細な予測を可能にする2つの大きな修正を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:52:19 GMT)
Vector Field Attention for Deformable Image Registration [9.9] 変形可能な画像登録は、固定画像と移動画像の間の非線形空間対応を確立する。
既存のディープラーニングベースの手法では、ニューラルネットワークが特徴マップの位置情報をエンコードする必要がある。
本稿では、位置対応の直接検索を可能にすることにより、既存のネットワーク設計の効率を高める新しいフレームワークであるベクトル場注意(VFA)を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:06:58 GMT)
Mitigating Translationese in Low-resource Languages: The Storyboard Approach [9.7] 本稿では,より流動的で自然な文を引き出すために,ストーリーボードを活用した新しいデータ収集手法を提案する。
提案手法では,視覚刺激のあるネイティブ話者をストーリーボード形式で提示し,その記述を原文に直接露出することなく収集する。
従来のテキスト翻訳手法とストーリーボードによるアプローチを,精度と流布率の観点から総合評価した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:47:03 GMT)
Progress and Perspectives on Weak-value Amplification [9.7] WVA(Weak-value Amplification)は、超小さな物理効果を効果的に増幅する気象プロトコルである。
WVAは、精密気象学におけるポストセレクションの重要な役割を認識するための新しい視点を提供する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 05:26:53 GMT)
Weighted Aggregation of Conformity Scores for Classification [9.6] コンフォーマル予測は、有効なカバレッジ保証を備えた予測セットを構築するための強力なフレームワークである。
本稿では,共形予測器の性能向上のために,複数のスコア関数を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:58:03 GMT)
Towards Adapting Reinforcement Learning Agents to New Tasks: Insights from Q-Values [8.7] ポリシー勾配メソッドは、サンプル効率のよい方法でそれらを活用する方法に悩まされる限り、多くのドメインで有用です。
我々は、強化学習におけるDQNのカオス的な性質を探求し、トレーニング時に保持する情報を、異なるタスクにモデルを適用するためにどのように再利用するかを理解した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:28:27 GMT)
PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.7] 回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。
既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。
高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:26:38 GMT)
Boosting Transferability in Vision-Language Attacks via Diversification along the Intersection Region of Adversarial Trajectory [8.6] 視覚言語事前学習モデルは多モーダル逆例(AE)の影響を受けやすい
我々は,AEsの多様性を拡大するために,対向軌道の交差領域に沿った多様化を利用することを提案する。
潜在的なオーバーフィッティングを緩和するため、最適化経路に沿った最後の交差点領域から逸脱する逆テキストを指示する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:58:57 GMT)
Transferable 3D Adversarial Shape Completion using Diffusion Models [8.3] 3Dポイントクラウド機能学習は、3Dディープラーニングモデルのパフォーマンスを大幅に改善した。
既存の攻撃方法は、主にホワイトボックスのシナリオに焦点を当てており、最近提案された3Dディープラーニングモデルへの移行に苦労している。
本稿では,拡散モデルを用いて高品質な対向点雲を生成する。
提案した攻撃は、ブラックボックスモデルとディフェンスの両方に対して、最先端の敵攻撃法より優れている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:51:32 GMT)
Computational Copyright: Towards A Royalty Model for Music Generative AI [8.1] 生成的AIは、特に音楽業界において、著作権問題に拍車をかけた。
本稿では,これらの課題の経済的側面に焦点をあて,著作権分野における経済的影響が中心的な課題となっていることを強調する。
我々は、AI音楽生成プラットフォーム上での収益分配のための実行可能なロイヤリティモデルを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:49:37 GMT)
SACNet: A Spatially Adaptive Convolution Network for 2D Multi-organ Medical Segmentation [7.9] 医用画像解析における多臓器分割は診断と治療計画に不可欠である。
本稿では、変形可能な畳み込みV3の知識を利用して、空間適応畳み込みネットワーク(SACNet)を最適化する。
ACDCとSynapseの3Dスライスデータセットの実験は、SACNetが既存のいくつかの手法と比較して優れたセグメンテーション性能を提供することを示した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:58:09 GMT)
Reinforcement Learning in High-frequency Market Making [7.7] 本稿では、高周波市場形成における強化学習(RL)の適用に関する、新しい包括的理論的解析手法を確立する。
我々は、現代RL理論と高周波金融経済学における連続時間統計モデルを橋渡しする。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 22:07:48 GMT)
Mapping the Scholarship of Dark Pattern Regulation: A Systematic Review of Concepts, Regulatory Paradigms, and Solutions from an Interdisciplinary Perspective [7.5] 本研究は,暗黒パターンに対する法学研究のユニークな傾向と特徴を合成し,五つの根問題と三重層害を同定する。
法律理論やセクター法の観点から現在の規制を批判し、暗黒パターンに対処する上での彼らの意味を強調している。
本研究は、効果的なダークパターン規制の現在の障壁を批判的に議論し、有望な規制ソリューションを探究する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:41:18 GMT)
STGFormer: Spatio-Temporal GraphFormer for 3D Human Pose Estimation in Video [7.3] 本稿では,映像中の3次元ポーズ推定のためのグラフベースのフレームワークを提案する。
具体的には,各アテンション層に直接グラフ情報を統合するグラフベースのアテンションメカニズムを開発する。
提案手法は,3次元人物のポーズ推定において,最先端の性能を実現することを実証する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 06:45:27 GMT)
BiasAlert: A Plug-and-play Tool for Social Bias Detection in LLMs [7.3] BiasAlertは、LLM(Large Language Models)のオープンテキスト世代における社会的バイアスを検出するために設計されたプラグアンドプレイツールである。
外部の人間の知識と固有の推論能力を統合し、バイアスを確実に検出する。
大規模な実験により、BiasAlertはGPT4-as-A-Judgeのような最先端の手法でバイアスを検出するのに優れていた。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:17:02 GMT)
Contrastive Learning of Shared Spatiotemporal EEG Representations Across Individuals for Naturalistic Neuroscience [7.1] 本研究は、個人間での共有時空間脳波表現(CL-SSTER)のコントラスト学習の枠組みを提案する。
このネットワークは、脳波に固有の空間的パターンと時間的パターンを同時に学習するために、空間的・時間的畳み込みを用いた。
CL-SSTERは、自然主義神経科学において、オブジェクト間共有神経表現を識別するための解釈可能でスケーラブルなフレームワークとして機能する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:48:28 GMT)
HSFusion: A high-level vision task-driven infrared and visible image fusion network via semantic and geometric domain transformation [7.1] 意味的および幾何学的領域変換を用いた高レベルの視覚タスク駆動赤外線・可視画像融合ネットワークを提案する。
CycleGANはドメイン変換パターンを学習し、これらのパターンの制約の下でCycleGANの再構成プロセスを実行する。
融合段階において,2つのセフェレートサイクロンの再構成過程から抽出した赤外・可視的特徴を統合し,融合結果を得た。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 02:16:13 GMT)
MSD: A Benchmark Dataset for Floor Plan Generation of Building Complexes [7.0] textbfModified Swiss Dwellings (MSD) - 大規模なフロアプランデータセット。
MSDは中規模から大規模の複合住宅の5.3K以上のフロアプランがあり、18.9K以上のアパートをカバーしている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:51:25 GMT)
Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge [6.9] 我々は、堅牢な相互モダリティ推論能力を持つAIモデルを装備するためのQ&A Promptsを提案する。
まず、視覚的質問生成モデルの入力と出力として、画像と回答のペアと対応する質問をトレーニングセットとして使用する。
次に、画像タグモデルを用いて様々なインスタンスを識別し、パッケージ化された画像タグペアを視覚質問生成モデルに送信し、抽出した画像タグと関連する質問を回答として生成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 18:18:05 GMT)
Learning to Refuse: Towards Mitigating Privacy Risks in LLMs [6.7] 大規模言語モデル(LLM)は、自然言語の理解と生成において顕著な能力を示す。
本研究は、LLMが完全再トレーニングを必要とせず、特定の個人のプライベートデータを保護できることの課題に対処する。
プライバシ保護のためのネーム・アウェア・アンラーニング・フレームワーク(NAUF)を導入する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:05:53 GMT)
Adaptive Differentially Quantized Subspace Perturbation (ADQSP): A Unified Framework for Privacy-Preserving Distributed Average Consensus [6.4] 本稿では適応微分量子化部分空間(ADQSP)という一般手法を提案する。
本研究では,単一の量子化パラメータを変化させることで,提案手法がSMPC型の性能とDP型性能に異なることを示す。
この結果から,従来の分散信号処理ツールを暗号保証に活用する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:20:50 GMT)
Order parameters and phase transitions of continual learning in deep neural networks [6.3] 継続学習(CL)により、動物は事前知識を消去することなく新しいタスクを学習することができる。
ニューラルネットワーク(NN)におけるCLは、破滅的な忘れが原因で困難であり、新しい学習は古いタスクのパフォーマンスを低下させる。
本稿では,ネットワークの入出力マッピングがタスク列を学習する際に特徴付ける,深層広帯域NNにおけるCLの統計力学理論を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:22:36 GMT)
AlphaDou: High-Performance End-to-End Doudizhu AI Integrating Bidding [6.2] 本稿では、強化学習を用いてDeep Monte Carloアルゴリズムの枠組みを変更し、勝利率と期待値を同時に推定するニューラルネットワークを得る。
このRLモデルは、現実的なDouDiZhu環境で訓練され、公開モデルの最先端レベルを達成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:32:36 GMT)
3DEgo: 3D Editing on the Go! [6.1] 本稿では,テキストプロンプトで案内されたモノクロ映像から3Dシーンを直接合成する新しい問題に対処する3DEgoを紹介する。
本フレームワークは,従来のマルチステージ3D編集プロセスを一段階のワークフローに合理化する。
3DEgoは、様々なビデオソースの編集精度、速度、適応性を示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 07:03:50 GMT)
Numbers Matter! Bringing Quantity-awareness to Retrieval Systems [5.7] 本稿では,2つの量対応ランキング技術を導入し,その量とテキストの内容のランク付けを共同で行う。
これらの技術は、利用可能な検索システムに量情報を導入し、数値条件が等しく、より大きく、より少ないクエリに対処することができる。
提案モデルの有効性を評価するため,ファイナンスと医療の領域に2つの新しい量対応ベンチマークデータセットを導入する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:56:11 GMT)
Risks of uncertainty propagation in Al-augmented security pipelines [5.7] AI技術の使用は、ソフトウェアベースのシステムのセキュアな開発に浸透している。
パイプライン内のエラーの伝播を考慮すると、AIが拡張したシステムの不確実性を推定する以前の研究はない。
本研究では,不確かさの伝播を把握し,不確かさを定量化するためのシミュレータを開発し,2つのケーススタディで誤りの伝播シミュレーションを評価する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 19:02:20 GMT)
AgileCoder: Dynamic Collaborative Agents for Software Development based on Agile Methodology [5.2] AgileCoderは、Agile Methodology(AM)をフレームワークに統合するマルチエージェントシステムである。
このシステムは、Product Manager、Developer、Testerといった特定のAMロールを異なるエージェントに割り当て、ユーザ入力に基づいて協調してソフトウェアを開発する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:14:30 GMT)
Building holographic code from the boundary [4.4] AdS/CFT対応を仮定した量子情報構造であるホログラフィック量子誤り訂正符号は、新しい方向に注目を集めている。
我々は、潜在的に広範かつ学際的な文脈に適用可能なホログラフィックコードを構築するための新しいアプローチを開始する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 16:51:17 GMT)
ReactAIvate: A Deep Learning Approach to Predicting Reaction Mechanisms and Unmasking Reactivity Hotspots [4.4] 我々は,反応ステップ分類の精度を96%とほぼ均一に達成した,解釈可能な注意に基づくGNNを開発した。
我々のモデルは、配布外クラスからでも、キー原子を十分に識別します。
この一般性は、モジュラーな方法で新しい反応型を包含することができるため、新しい分子の反応性を理解するための専門家にとって価値がある。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 05:53:18 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3] 大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。
LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。
本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 07:21:54 GMT)
Group Projected Subspace Pursuit for Block Sparse Signal Reconstruction: Convergence Analysis and Applications [4.3] 本稿では,グループ・プロジェクテッド・サブスペース・パースーツ(GPSP)アルゴリズムの収束解析について述べる。
GPSPは、観測がうるさいときに真のブロックスパース信号を回復する。
GPSPは様々なブロック間隔やブロックサイズに対して,ほとんどの場合,他のアルゴリズムよりも優れています。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 03:18:43 GMT)
Semantic Understanding and Data Imputation using Large Language Model to Accelerate Recommendation System [3.9] そこで本稿では,LLM(Large-Tune Large Language Model)を提案する。
大量のテキストで訓練されたLLMは、データ間の複雑な関係を理解し、行方不明の情報をインテリジェントに埋めることができる。
この強化されたデータは、より正確でパーソナライズされた提案を生成するためにレコメンデーションシステムによって使用される。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:53:36 GMT)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.6] psifxはマルチモーダルな特徴抽出ツールキットである。
それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 16:20:42 GMT)
A Self-Supervised Learning Pipeline for Demographically Fair Facial Attribute Classification [3.5] 本稿では,人口統計学的に公平な顔属性分類のための完全自己教師付きパイプラインを提案する。
我々は、事前訓練されたエンコーダ、多様なデータキュレーション技術、メタラーニングに基づく重み付きコントラスト学習を通じて、完全にラベル付けされていないデータを活用する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 07:11:57 GMT)
Cycle Index Polynomials and Generalized Quantum Separability Tests [3.5] 純粋な二分項状態の1つのシェアの混合性は、全体状態が分離可能で非絡み合い状態であるかどうかを決定する。
量子分離性テストの族を導出し、それぞれが有限群によって生成される。
これら全てのアルゴリズムに対して、受理確率は群のサイクル指数によって決定されることを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:20:48 GMT)
Maximum mean discrepancies of Farey sequences [3.3] クラスは、少なくとも1-半の順序のすべてのマトエルン核を含む。
このクラスは、少なくとも半順序のすべてのマトエルン核を含む。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:16:03 GMT)
An exactly solvable model for emergence and scaling laws [2.6] 本稿では,新たな能力(スキル)を基礎関数として表現するフレームワークを提案する。
新たなスキルの出現と、トレーニング時間、データサイズ、モデルサイズ、最適計算による損失の法則のスケーリングに関する分析式を見つける。
私たちの単純なモデルでは、単一の適合パラメータを使用して、トレーニング時間、データサイズ、モデルサイズが増大するにつれて、複数の新しいスキルのシグモダルな出現を捉えます。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:28:01 GMT)
SyDRA: An Approach to Understand Game Engine Architecture [2.5] 本稿では,ゲームエンジンアーキテクチャの理解を支援するために,サブシステム依存回復アプローチ(SyDRA)を提案する。
SyDRAはゲームエンジン開発者がゲームエンジンアーキテクチャを理解し、ゲームエンジンの開発に情報を与えるのに役立つ。
我々は,SyDRAにより,設計上の理解や影響分析に関連するタスクを,これらのモデルなしでより少ない時間で,高精度に完了させることができることを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:37:35 GMT)
Ontology-driven Reinforcement Learning for Personalized Student Support [1.9] 本稿では,バーチャル教育システムに適用可能な,パーソナライズされた学生支援のための汎用フレームワークを提案する。
データ収集とマルチエージェント強化学習を組み合わせたセマンティックな組織に応用する。
その結果、学生にパーソナライズされた支援を提供するために、どんなバーチャル教育ソフトウェアにも適応できるモジュールシステムとなった。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:11:44 GMT)
KAT: Dependency-aware Automated API Testing with Large Language Models [1.7] KAT(Katalon API Testing)は、APIを検証するためのテストケースを自律的に生成する、AI駆動の新たなアプローチである。
実世界の12のサービスを用いたKATの評価は、検証カバレッジを改善し、文書化されていないステータスコードを検出し、これらのサービスの偽陽性を低減できることを示している。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:48:18 GMT)
Addressing Domain Discrepancy: A Dual-branch Collaborative Model to Unsupervised Dehazing [1.7] 本稿では、この問題に対処する新しい二分岐協調脱ハージングモデル(DCM-dehaze)を提案する。
具体的には,DDSCM (Double Deepwise Separable Convolutional Module) を設計し,より深い特徴の情報を強化する。
さらに、画像のエッジ特徴を最適化し、画像の明瞭度と忠実度を高めるために、双方向の輪郭関数を構築した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:47:32 GMT)
What Appears Appealing May Not be Significant! -- A Clinical Perspective of Diffusion Models [1.6] 本研究は, 異なる病態の合成ポリープ画像の臨床的意義を評価するための戦略について検討する。
質的結果と臨床関連性との関係について検討した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 00:06:12 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6] 言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。
これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。
また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 23:52:25 GMT)
GenSco: Can Question Decomposition based Passage Alignment improve Question Answering? [1.6] ジェンスコ(GenSco)は,マルチホップ質問の予測分解に基づく経路選択手法である。
広範に確立された3つのマルチホップ質問応答データセットについて評価した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:25:08 GMT)
The Error Analysis of the Secret Key Generation Algorithm Using Analog Function Computation [1.4] 本研究では,分散ノード間の暗号秘密鍵生成アルゴリズムを用いて,セキュアな無線通信を実現する分散型手法を提案する。
フェードチャネル条件下でのモデルの有効性を成功率で評価する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:20:54 GMT)
Synthetic high angular momentum spin dynamics in a microwave oscillator [1.3] 本研究では、高調波クディットの共振駆動に付随する連続的な発電機を実現するために、高調波発振器をオンデマンドで変更する方法を示す。
初めて線形高調波演算を用いて、4つの論理ゲートを高調波キュート符号化で達成する。
この結果は、閉ヒルベルト空間上の運動が量子情報処理にどのように役立つかを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:13:14 GMT)
Efficient Facial Landmark Detection for Embedded Systems [1.1] 本稿では、電力消費と時間遅延に関する課題に直面するエッジデバイス向けに特別に設計された、効率的な顔画像位置検出(EFLD)モデルを提案する。
EFLDは軽量のバックボーンとフレキシブルな検出ヘッドを備えており、それぞれがリソース制約されたデバイスの運用効率を大幅に向上する。
予測コストを増大させることなく,モデルの一般化性と堅牢性を高めるためのクロスフォーマットトレーニング戦略を提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 14:49:20 GMT)
FreeCG: Free the Design Space of Clebsch-Gordan Transform for Machine Learning Force Field [1.1] 置換不変入力にCG変換層を実装することで、対称性に影響を与えることなく、この層の設計が完全に自由になることを示す。
我々は,群CG変換をスパースパス,抽象エッジシャッフル,アテンションエンハンサーで実現し,強力かつ効率的なCG変換層を形成する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 12:40:35 GMT)
The Feasibility of a Smart Contract "Kill Switch" [1.0] いくつかの主要なブロックチェーンプラットフォームにおけるスマートコントラクトの終了メカニズムについて検討する。
我々は、これらのメカニズムとEUデータ法の要件との整合性を評価する。
いわゆるスマートコントラクト「キルスイッチ」の実施に伴う課題について論じる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 19:31:15 GMT)
Augmented prediction of a true class for Positive Unlabeled data under selection bias [0.9] 本稿では, 観測時刻をラベル付けした正のアンラベル(PU)データに対して, 新たな観測環境を提案する。
我々は、追加情報は予測に重要であると主張し、このタスクを"Augmented PU prediction"と呼んでいる。
このようなシナリオで経験的ベイズ則のいくつかの変種を導入し、それらの性能について検討する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 19:58:01 GMT)
A graph-based formalism for surface codes and twists [0.8] 我々は、ツイストで曲面コードを構築するための厳密な形式主義を提供する。
特に、曲面符号を2次元多様体上に埋め込まれた幻グラフ$G$に関連付ける。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:48:44 GMT)
Unexpected Benefits of Self-Modeling in Neural Systems [0.7] 人工ネットワークが内部状態を補助的タスクとして予測することを学ぶと、それらが根本的に変化することを示す。
自己モデルタスクをより良く実行するために、ネットワークはよりシンプルで、より正規化され、よりパラメータ効率が良いものにすることを学ぶ。
この自己正規化は、最近の機械学習文献で報告されている自己モデルの有用性を説明するのに役立つかもしれない。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:16:23 GMT)
MambaForGCN: Enhancing Long-Range Dependency with State Space Model and Kolmogorov-Arnold Networks for Aspect-Based Sentiment Analysis [0.7] ABSAにおけるアスペクトと意見語間の短距離および長距離の依存関係を高める新しいアプローチであるMambaForGCNを提案する。
3つのベンチマークデータセットの実験結果は、MambaForGCNの有効性を示し、最先端(SOTA)ベースラインモデルを上回っている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 22:23:07 GMT)
Ensemble Deep Random Vector Functional Link Neural Network Based on Fuzzy Inference System [0.6] アンサンブルディープランダムベクトル汎関数リンク(edRVFL)ニューラルネットワークは、従来の人工ニューラルネットワークの限界に対処する能力を示した。
本稿では,ファジィ推論システム(edRVFL-FIS)に基づく新しいEDRVFLを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:37:14 GMT)
Towards a Unified Framework for Evaluating Explanations [0.6] 我々は、モデルと利害関係者の間の仲介者として、本質的に解釈可能なモデルであれ、不透明なブラックボックスモデルであれ、説明が役立ちます。
本稿では,学習者の行動を予測するための解釈可能なニューラルネットワークの例を用いて,これらの基準と具体的な評価手法について述べる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 01:11:22 GMT)
Digital Twin Evolution for Sustainable Smart Ecosystems [0.4] 我々は4つの異なるデジタルツイン進化シナリオを用いて、デジタルツイン進化の7R分類の使い方を説明する。
私たちは、ソフトウェアエンジニアリングのプラクティスを活用して堅牢なスマートエコシステムを開発する上で、大きなギャップを埋めることを目指しています。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:33:13 GMT)
Efficient tensor network simulation of multi-emitter non-Markovian systems [0.3] 非接触浴に結合した複数のエミッタ系をシミュレーションする数値計算法を提案する。
ボソンの正方格子に結合した複数のエミッタからの集合放出について検討した。
また、多重励起初期状態から有界状態における励起の動的準備をシミュレートする。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 10:24:23 GMT)
Two-electron two-nucleus effective Hamiltonian and the spin diffusion barrier [0.2] 動的核偏極(DNP)は、未対電子から超微細結合核への偏極移動を伴う。
ハイパーファインカップリングは、核双極子フリップフロップ遷移を抑制し、バルクへの核双極子輸送を妨げると考えられている。
電子双極子と核双極子フリップフロップを結合したエネルギー保存型電子核四スピンフリップフロップが同定される。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:25:12 GMT)
Addressing Class Imbalance and Data Limitations in Advanced Node Semiconductor Defect Inspection: A Generative Approach for SEM Images [0.1] 限られたデータ構造内で拡散モデルを用いて合成半導体SEM画像を生成する手法を提案する。
従来のシミュレーション手法による画像とは対照的に,提案手法により生成されたSEM画像は実SEM画像とよく似ており,そのノイズ特性と表面粗さを適応的に再現する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 22:25:05 GMT)
Curriculum Learning for Small Code Language Models [0.1] 本稿では,プログラム言語モデルの性能向上におけるカリキュラム学習の可能性について考察する。
十分に設計されたカリキュラム学習手法は,デコーダのみの小さな言語モデルの精度を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 13:32:24 GMT)
Nullpointer at CheckThat! 2024: Identifying Subjectivity from Multilingual Text Sequence [0.0] 本研究は、文または段落のテキストシーケンスが主観的か客観的かを決定するために、二分分類タスクに対処する。
タスクはアラビア語、ブルガリア語、英語、ドイツ語、イタリア語の5つの言語にまたがる。
感情に基づくトランスフォーマーモデルであるMarieAngeA13/Sentiment-Analysis-BERTをデータセット上で微調整した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:37:28 GMT)
xLSTMTime : Long-term Time Series Forecasting With xLSTM [0.0] 本稿では、時系列予測のための拡張LSTM (xLSTM) と呼ばれる最近のアーキテクチャの適応について述べる。
我々は、xLSTMTimeの性能を、複数の実世界のda-tasetにまたがる様々な最先端モデルと比較する。
この結果から,改良されたリカレントアーキテクチャは時系列予測において,トランスフォーマーモデルに代わる競合的な代替手段を提供する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:15:00 GMT)
Why Teach Quantum In Your Own Time: The Values of Grassroots Organizations Involved in Quantum Technologies Education and Outreach [0.0] 本稿では,量子技術(QT)教育の領域で活動する草の根組織における目標と価値の交わりについて検討する。
この分析は、これらの組織が、持続的な成長と開発を目標にしながら、基礎的な価値に固執するという2つの課題に悩まされる、初期段階の段階をナビゲートする方法を明らかにしている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:02:46 GMT)
TokenSHAP: Interpreting Large Language Models with Monte Carlo Shapley Value Estimation [0.0] TokenSHAPは、大規模言語モデルを解釈する新しい方法である。
これは、協調ゲーム理論から自然言語処理へのシェープリー値の適応である。
トークンの重要性を解釈可能で定量的に測定する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:07:50 GMT)
Research Experience of an Undergraduate Student in Computer Vision and Robotics [0.0] 本稿では,コンピュータビジョンとロボティクスの分野に精通するコンピュータ工学の学部生の教育経験に焦点を当てる。
カメラが翻訳動作を行うとき、光学フローとその応用がどのように移動物体を検出するのかを探求し、遭遇した課題とそれらを克服するための戦略を強調した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 02:01:50 GMT)
Reduction of Class Activation Uncertainty with Background Information [0.0] マルチタスク学習は、一般化を改善したハイパフォーマンスニューラルネットワークをトレーニングするための一般的なアプローチである。
マルチタスク学習と比較して,より低い計算量での一般化を実現するためのバックグラウンドクラスを提案する。
本稿では,背景画像の選択手法を提案し,今後の改善について論じる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:40:22 GMT)
Quantum weak values and the 'which way?' question [0.0] 不確実性原理は、量子系が旅行した2つの経路のどれかを決定することを禁ずる。
弱いポインタが同時に不正確なポインタであることを示し、個々の試行においてシステムによって取られた経路に関する情報が必然的に失われることを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 23:41:24 GMT)
Integrating AI Tutors in a Programming Course [0.0] RAGManはLLMベースのチューターシステムで、様々なコース特化および宿題特化AIチューターをサポートする。
本稿では,AI教師とのインタラクション,学生のフィードバック,および比較グレード分析について述べる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 00:42:39 GMT)
Insecurity of Quantum Two-Party Computation with Applications to Cheat-Sensitive Protocols and Oblivious Transfer Reductions [0.0] 我々は、不正な当事者が不正行為をすることができるが、検出されるリスクがある、不正に敏感なOTの可能性を厳格に確立する。
セキュアな関数評価に必要なプリミティブのエントロピー境界を提供する。
我々の結果は、特に有限個のプリミティブ間の変換と任意の誤差に対して成り立つ。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:48:17 GMT)
Hierarchy of emergent cluster states by measurement from symmetry-protected-topological states with large symmetry to subsystem cat state [0.0] 逐次サブシステム射影測定により相関状態間に出現する測定生成階層を提案する。
また,大規模システムおよび大規模対称クラスタSPT状態に適用した逐次サブシステム射影測定により,対称性-縮小階層を検証した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 09:38:33 GMT)
Harnessing Feature Clustering For Enhanced Anomaly Detection With Variational Autoencoder And Dynamic Threshold [0.0] 北極圏の融雪のような極端な気候現象に影響を及ぼす臨界期間と特徴を識別する異常検出手法を導入する。
この方法は動的しきい値と相関に基づく特徴クラスタリングと統合された変分オートエンコーダを利用する。
この枠組みは、VAEが局所的な依存関係を識別し、気候データにおける時間的関係を学習する能力を高める。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 01:52:10 GMT)
Explainable bank failure prediction models: Counterfactual explanations to reduce the failure risk [0.0] 銀行失敗予測モデルの正確性と理解性が重要である。
ランダムフォレスト、サポートベクターマシン、ディープラーニングのような複雑なモデルは、高い予測性能を提供するが、説明性は低い。
この課題に対処するためには, 対実的な説明を用いることが提案されている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:27:27 GMT)
Emergent World Models and Latent Variable Estimation in Chess-Playing Language Models [0.0] 我々は,Othelloゲーム上でGPTモデルをトレーニングし,ボード状態の内部表現を学習した。
この作業をチェスのより複雑な領域に拡張し、実際のゲームでトレーニングし、モデルの内部表現を調査します。
Li et al. の以前の合成データセットアプローチとは異なり、我々の分析では、このモデルがプレイヤースキルのような潜伏変数を推定し、次のキャラクタをより正確に予測する方法も学んでいる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:23:19 GMT)
Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? [0.0] スタイラスパッケージは、テキスト間の距離を計算するために使用できる周波数テーブルを含む。
研究課題とより関係のあるテキスト上で,本手法の性能を検証した。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 19:28:48 GMT)
Deep learning architecture for decrypting information on the event horizon [0.0] 深層学習アルゴリズムを用いて、AdSブラックホールの事象の地平線上の情報の断片が、どのように整合境界に復号されるかを示すモデルを見つける。
可換性とAdS/CFTを組み合わせることで、共形境界がホログラフィックスクリーンを実装しているという視点を超えて進むことができる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 20:15:59 GMT)
Deep Learning Algorithms for Early Diagnosis of Acute Lymphoblastic Leukemia [0.0] 急性リンパ性白血病(英語: acute lymphoblastic leukemia、ALL)は、白血球に影響を及ぼす血液がんの一種である。
本研究では,ALの診断過程を支援するバイナリ画像分類モデルを提案する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 15:35:39 GMT)
Artificial Intelligence from Idea to Implementation. How Can AI Reshape the Education Landscape? [0.0] 論文は、AI技術が理論的構成から、教育的アプローチや学生のエンゲージメントを変える実践的なツールへとどのように移行してきたかを示す。
このエッセイは、教育におけるAIの可能性について議論し、技術的進歩と社会的意味の両方を考慮するバランスのとれたアプローチの必要性を強調することで締めくくられている。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 04:40:16 GMT)
An Interpretable Neural Network for Vegetation Phenotyping with Visualization of Trait-Based Spectral Features [0.0] UPWINS スペクトルライブラリーで訓練された解釈可能なニューラルネットワークで, 種, 健康, 成長段階, 年次変動, 環境条件など, 13種の指標種, 天然の共通背景種を多種多様なメタデータで分析した。
ネットワーク内のニューロンは, ネットワーク重量の可視化を通じて, 化学的および生理的特性のスペクトル指標を学習し, それらの特性が, 実験セット上で90%の精度で, 種同定のためのネットワークによってどのように結合されているかを示す。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 21:20:37 GMT)
A Study on Internet of Things in Women and Children Healthcare [0.0] IoT(Internet of Things)は、患者のデータを絶え間なく収集する機能を持つ。
医師は、合併症を避けるために患者を早期に診断することができ、必要に応じてさらなる修正を提案することができる。
本稿では,女性や子どもの医療分野におけるIoTに関するいくつかの方法,実践,プロトタイプについて述べる。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 17:34:00 GMT)
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second [0.0] フィールド認識ファクトリゼーションマシン(FFM)はクリックスルー率予測の強力なモデルとして登場した。
我々は、社内のRustベースのDeep FFM実装を詳細に分析し、CPUのみのマルチデータセンタスケールへの展開について詳述する。
論文参考訳(メタデータ) (Sun, 14 Jul 2024 08:10:20 GMT)