Aurora-M: The First Open Source Multilingual Language Model Red-teamed according to the U.S. Executive Order [123.7] Aurora-Mは、英語、フィンランド語、ヒンディー語、日本語、ベトナム語、コードで訓練された15Bパラメータの多言語オープンソースモデルである。
これは、人間がレビューした安全命令を微調整した初めてのオープンソース多言語モデルである。
様々なタスクや言語で厳格に評価されており、破滅的な忘れ物に対する頑丈さを示している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:38:54 GMT)
Traffic Scene Parsing through the TSP6K Dataset [109.7] 高品質なピクセルレベルのアノテーションとインスタンスレベルのアノテーションを備えた,TSP6Kと呼ばれる特殊なトラフィック監視データセットを導入する。
データセットは、既存の運転シーンの何倍ものトラフィック参加者を持つ、より混雑した交通シーンをキャプチャする。
交通シーンの異なるセマンティック領域の詳細を復元するシーン解析のためのディテールリフィニングデコーダを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:21:22 GMT)
Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Grounding [108.8] ビデオグラウンドイングは、入力テキストクエリに対応するビデオ内の時間セクションをローカライズすることを目的としている。
本稿では,現在のビデオグラウンドリング手法において,オープン語彙時空間ビデオグラウンドニングタスクを導入することにより,限界に対処する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:30:14 GMT)
Learing Trimaps via Clicks for Image Matting [103.7] Click2Trimapは,ユーザクリックの最小限の入力で高品質なトリマップとアルファ行列を予測できる対話型モデルである。
ユーザスタディでは、Click2Trimapは高品質なトリマップとマッティング予測を、1画像あたり平均5秒で達成している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:10:34 GMT)
Fair Abstractive Summarization of Diverse Perspectives [103.1] 公平な要約は、特定のグループを過小評価することなく、多様な視点を包括的にカバーしなければなりません。
はじめに、抽象的な要約における公正性は、いかなる集団の視点にも過小評価されないものとして、正式に定義する。
本研究では,対象視点と対象視点の差を測定することで,基準のない4つの自動計測手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:54:06 GMT)
Conceptual and Unbiased Reasoning in Language Models [98.9] 本稿では,抽象的質問に対する概念的推論をモデルに強制する,新しい概念化フレームワークを提案する。
既存の大規模言語モデルは概念的推論では不足しており、様々なベンチマークでは9%から28%に低下している。
ハイレベルな抽象的推論が不偏で一般化可能な意思決定の鍵となるので、モデルがどのように改善できるかについて議論する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:53:53 GMT)
Reusable Architecture Growth for Continual Stereo Matching [92.4] 我々は、教師付きおよび自己監督型の両方で、新しいシーンを継続的に学習するための、再利用可能なアーキテクチャ成長(RAG)フレームワークを紹介します。
RAGは、前のユニットを再利用し、良好な性能を得ることにより、成長中の高い再利用性を維持することができる。
また、推論時にシーン固有のアーキテクチャパスを適応的に選択するScene Routerモジュールを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:24:58 GMT)
First Order Methods with Markovian Noise: from Acceleration to Variational Inequalities [91.5] 本稿では,一階変分法の理論解析のための統一的アプローチを提案する。
提案手法は非線形勾配問題とモンテカルロの強い問題の両方をカバーする。
凸法最適化問題の場合、オラクルに強く一致するような境界を与える。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:50:06 GMT)
Similarity, Compression and Local Steps: Three Pillars of Efficient Communications for Distributed Variational Inequalities [91.1] 変分不等式は平衡探索から逆学習まで様々な応用で用いられている。
ほとんどの分散アプローチには、通信コストというボトルネックがあります。
通信ラウンドの総数と1ラウンドのコストを削減する3つの主要な手法は、ローカル関数の類似性、送信された情報の圧縮、ローカル更新である。
本稿では,通信複雑性の理論的保証が最良であり,分散変動不等式に対する他の手法よりもはるかに優れていることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:00:07 GMT)
Auto MC-Reward: Automated Dense Reward Design with Large Language Models for Minecraft [88.8] 本稿では,Large Language Models (LLMs) を利用して高密度報酬関数を自動設計する,Auto MC-Rewardという高度な学習システムを提案する。
実験では、Minecraftの複雑なタスクにおいて、エージェントの成功率と学習効率が大幅に向上したことを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:35:16 GMT)
Can I Trust Your Answer? Visually Grounded Video Question Answering [88.1] 本稿では,ビデオ言語理解のための事前学習技術を活用したビデオQAについて検討する。
NExT-GQA - NExT-QAの拡張で、10.5$K$の時間的グラウンドラベルを元のQAペアに結び付ける。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:50:28 GMT)
Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment [84.3] 人間の好みの調整は、大きな言語モデルが誤解を招くか有害なコンテンツを生成するのを防ぐ。
本研究では, 微調整後のLLMの最終性能と線形相関を示唆し, 即時多様性の新たな定式化を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:48:16 GMT)
SceneGraphLoc: Cross-Modal Coarse Visual Localization on 3D Scene Graphs [81.2] SceneGraphLocはシーングラフ内の各ノード(つまりオブジェクトインスタンスを表す)に対する固定サイズの埋め込みを学習する。
画像を利用する場合、SceneGraphLocは、大規模な画像データベースに依存する最先端技術に近いパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:25:16 GMT)
Dr$^2$Net: Dynamic Reversible Dual-Residual Networks for Memory-Efficient Finetuning [81.0] 本稿では,メモリ消費を大幅に削減した事前学習モデルを微調整するために,動的可逆2次元ネットワーク(Dr$2$Net)を提案する。
Dr$2$Netは2種類の残差接続を含み、1つは事前訓練されたモデルの残差構造を維持し、もう1つはネットワークを可逆的にしている。
Dr$2$Netは従来の微調整に匹敵する性能を持つが、メモリ使用量は大幅に少ない。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:06:01 GMT)
OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0] 本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:08:43 GMT)
Tram: A Token-level Retrieval-augmented Mechanism for Source Code Summarization [76.6] ニューラルモデルの性能を高めるために,デコーダ側で詳細なTokenレベル検索強化機構(Tram)を提案する。
文脈的コードセマンティクスの取得におけるトークンレベルの検索の課題を克服するために,コードセマンティクスを個々の要約トークンに統合することを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:45:22 GMT)
Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.4] マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:29:13 GMT)
QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs [73.9] ローテーションに基づく新しい量子化方式であるQuaRotを紹介する。
LLMは、すべての重み、アクティベーション、KVキャッシュを含む、エンドツーエンドのLSMを4ビットで定量化することができる。
我々の量子化LLaMa2-70Bモデルは、少なくとも0.29 WikiText-2パープレキシティの損失があり、ゼロショット性能の99%を維持している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 19:20:06 GMT)
Heterogeneous Contrastive Learning for Foundation Models and Beyond [73.7] ビッグデータと人工知能の時代において、新しいパラダイムは、大規模な異種データをモデル化するために、対照的な自己教師付き学習を活用することである。
本調査は基礎モデルの異種コントラスト学習の現況を批判的に評価する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:55:49 GMT)
When Does Monolingual Data Help Multilingual Translation: The Role of Domain and Model Scale [73.7] 自動符号化(DAE)と逆翻訳(BT)が機械翻訳(MMT)に与える影響について検討する。
モノリンガルデータは一般的にMTMに役立つが、モデルは驚くほどドメインミスマッチ、特により小さなモデルスケールでは不安定である。
スケールが大きくなるにつれて、DAEは並列のみのベースラインを90Mで過小評価することから、BTのパフォーマンスを1.6Bで収束させ、低リソースでそれを上回るものへと移行する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:49:04 GMT)
Are Multilingual LLMs Culturally-Diverse Reasoners? An Investigation into Multicultural Proverbs and Sayings [73.5] 大規模言語モデル (LLM) は質問への回答や推論に非常に適している。
本研究は,多言語多言語LLMの会話文脈における証明や言説の推論能力について考察する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:13:58 GMT)
VRP-SAM: SAM with Visual Reference Prompt [73.1] そこで我々は,Segment Anything Model (SAM) を利用した新しいVisual Reference Prompt (VRP) エンコーダを提案する。
本質的には、VRP-SAMは注釈付き参照画像を使用して特定のオブジェクトを理解し、ターゲット画像内の特定のオブジェクトのセグメンテーションを実行することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:35:47 GMT)
Clustering for Protein Representation Learning [72.7] 本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。
我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。
タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:51:09 GMT)
Exploiting Self-Supervised Constraints in Image Super-Resolution [72.4] 本稿では,SSC-SRと呼ばれる単一画像超解像のための新しい自己監督制約を提案する。
SSC-SRは、安定性を高めるために指数移動平均によって更新された二重非対称パラダイムとターゲットモデルを用いることで、画像の複雑さのばらつきに一意に対処する。
SSC-SRフレームワークはさまざまなベンチマークデータセットに対して,EDSR平均0.1dB,SwinIR平均0.06dBの大幅な拡張を実現している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:18:50 GMT)
Finding needles in a haystack: A Black-Box Approach to Invisible Watermark Detection [68.9] WaterMark Detection (WMD) は、ブラックボックスとアノテーションなしの設定下で最初に目に見えない透かし検出法である。
我々はオフセット学習の基礎を用いてWMDを開発し、クリーンな非透かしデータセットにより、透かしサンプルのみの影響を分離することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:42:02 GMT)
Ito Diffusion Approximation of Universal Ito Chains for Sampling, Optimization and Boosting [64.1] 我々は、ある微分方程式のオイラー・マルヤマ離散化のように見える、より一般で幅広いマルコフ連鎖、伊藤鎖を考える。
伊藤鎖の法則と微分方程式の間の$W_2$-距離の有界性を証明する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:21:39 GMT)
Free3D: Consistent Novel View Synthesis without 3D Representation [63.9] Free3Dは単分子開集合新規ビュー合成(NVS)の簡易的高精度な方法である
同様のアプローチを採った他の作品と比較して,明快な3D表現に頼らずに大幅な改善が得られた。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:02:45 GMT)
LangNav: Language as a Perceptual Representation for Navigation [63.9] 視覚・言語ナビゲーション(VLN)における知覚表現としての言語の利用について検討する。
提案手法では,画像キャプションや物体検出に市販の視覚システムを用いて,エージェントのエゴセントリックなパノラマビューを各ステップで自然言語記述に変換する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:00:22 GMT)
Initialization Matters for Adversarial Transfer Learning [61.9] 我々は、逆向きに頑健な事前訓練モデルの必要性を発見する。
本稿では, 対向線形探索により得られる重み付き線形ヘッドを初期化する対向微調整のためのロバスト線形初期化法(RoLI)を提案する。
5つの異なる画像分類データセットにおいて,RoLIの有効性を実証し,新しい最先端結果を得た。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:04:15 GMT)
Instruction-Driven Game Engines on Large Language Models [59.3] IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:02:16 GMT)
3DGSR: Implicit Surface Reconstruction with 3D Gaussian Splatting [59.0] 本稿では,3次元ガウス散乱(3DGS),すなわち3DGSRを用いた暗黙的表面再構成法を提案する。
重要な洞察は、暗黙の符号付き距離場(SDF)を3Dガウスに組み込んで、それらが整列され、共同最適化されるようにすることである。
実験により, 3DGSの効率とレンダリング品質を保ちながら, 高品質な3D表面再構成が可能な3DGSR法が実証された。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:35:38 GMT)
ST-LLM: Large Language Models Are Effective Temporal Learners [58.8] 大規模言語モデル(LLM)は、テキストの理解と生成において印象的な能力を示した。
ビデオベースの対話システムでビデオを効果的にエンコードし、理解する方法は、まだ解決されていない。
LLM内部の時空間シーケンスをモデル化したビデオLLMベースラインST-LLMを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:11:26 GMT)
Linguistic Calibration of Language Models [57.8] 言語モデルの長大な世代に対する言語キャリブレーションを形式化する。
教師付き微調整ステップはLMをブートストラップして、自信のある文で長文世代を出力する。
下流の意思決定においてユーザが行う予測の領域で目標を構築することにより、長大な世代がエンドツーエンドに校正されることが分かる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:47:55 GMT)
EMAGE: Towards Unified Holistic Co-Speech Gesture Generation via Expressive Masked Audio Gesture Modeling [57.1] 音声とマスクによるジェスチャーから全身の人間のジェスチャーを生成するためのフレームワークEMAGEを提案する。
まずBEAT2(BEAT-SMPLX-FLAME)というメッシュレベルの音声合成データセットを紹介した。
実験により、EMAGEは最先端のパフォーマンスで総合的なジェスチャーを生成することが示された。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:15:34 GMT)
Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.4] Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:29:48 GMT)
An Analysis of BPE Vocabulary Trimming in Neural Machine Translation [56.4] 語彙トリミング(vocabulary trimming)は、まれなサブワードをコンポーネントサブワードに置き換える後処理のステップである。
ボキャブラリトリミングは性能向上に失敗し,さらに大きな劣化を招きやすいことを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:29:49 GMT)
ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.1] タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:32:42 GMT)
Video Self-Stitching Graph Network for Temporal Action Localization [54.1] ビデオセルフスティッチグラフネットワーク(VSGN)と呼ばれるマルチレベルクロススケールソリューションを提案する。
VSGNにはビデオセルフスティッチ(VSS)とクロススケールグラフピラミッドネットワーク(xGPN)という2つの重要なコンポーネントがあります。
我々のVSGNは、特徴表現を強化するだけでなく、短いアクションとより短いトレーニングサンプルのためのよりポジティブなアンカーを生成する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:24:13 GMT)
SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [54.0] 本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:22:44 GMT)
GlORIE-SLAM: Globally Optimized RGB-only Implicit Encoding Point Cloud SLAM [53.6] フレキシブルなニューラルポイントクラウド表現シーンを用いたRGBのみの高密度SLAMシステムを提案する。
また,単分子深度とともに暗黙のポーズと深さを最適化する新しいDSPO層を導入する。
我々のシステムは、Replica、TUM-RGBD、ScanNetデータセットの追跡、レンダリング、正確性において、既存の高密度ニューラルネットワークRGB SLAM手法により良い、あるいは競争力がある。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:24:44 GMT)
MaGRITTe: Manipulative and Generative 3D Realization from Image, Topview and Text [52.3] ユーザ特定条件からの3Dシーンの生成は、3Dアプリケーションの生産負担を軽減するための有望な道を提供する。
以前の研究では、限られた制御条件のため、望まれるシーンを実現するためにかなりの努力が必要だった。
部分画像,トップビューに表現されたレイアウト情報,テキストプロンプトを用いて,マルチモーダル条件下での3Dシーンの制御と生成を行う手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:50:25 GMT)
GaussianAvatar: Towards Realistic Human Avatar Modeling from a Single Video via Animatable 3D Gaussians [51.5] 一つのビデオから動的に3D映像を映し出すリアルな人間のアバターを作成するための効率的なアプローチを提案する。
GustafAvatarは、公開データセットと収集データセットの両方で検証されています。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:22:34 GMT)
Total-Decom: Decomposed 3D Scene Reconstruction with Minimal Interaction [51.4] 人間のインタラクションを最小限に抑えた3次元再構成法であるTotal-Decomを提案する。
提案手法は,Segment Anything Model (SAM) とハイブリッド型暗黙的なニューラルサーフェス表現をシームレスに統合し,メッシュベースの領域成長技術を用いて正確な3次元オブジェクト分解を行う。
提案手法をベンチマークデータセット上で広範囲に評価し,アニメーションやシーン編集などの下流アプリケーションの可能性を示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:36:17 GMT)
IPoD: Implicit Field Learning with Point Diffusion for Generalizable 3D Object Reconstruction from Single RGB-D Images [50.5] シングルビューRGB-D画像からの3Dオブジェクトの汎用化は依然として難しい課題である。
本稿では,暗黙の場学習と点拡散を調和させる新しい手法IPoDを提案する。
CO3D-v2データセットによる実験では、IPoDの優位性が確認され、Fスコアは7.8%、チャンファー距離は28.6%向上した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:17:37 GMT)
STBA: Towards Evaluating the Robustness of DNNs for Query-Limited Black-box Scenario [50.4] 本研究では,クエリ制限シナリオにおいて,悪意のある逆の例を作成するために,空間変換ブラックボックス攻撃(STBA)を提案する。
そこで本研究では,STBAが対向例の認識不能性を効果的に改善し,クエリ制限条件下での攻撃成功率を大幅に向上できることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:28:53 GMT)
Do Vision-Language Models Understand Compound Nouns? [50.0] CLIPのようなオープン語彙の視覚言語モデル(VLM)は、対照的な損失を用いて訓練され、テキストから画像への検索のための有望な新しいパラダイムとして登場した。
我々は400個のユニークなCNを持つ新しいベンチマークであるCompunをキュレートし、CNの解釈におけるVLMの有効性を評価する。
テキストプロンプトのための手書きテンプレートを超えて、CLIPのようなモデルで広く使われている別のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:54:45 GMT)
Latent Code Augmentation Based on Stable Diffusion for Data-free Substitute Attacks [47.8] ブラックボックス代替攻撃では対象モデルのトレーニングデータが利用できないため、近年のスキームではGANを用いて代替モデルのトレーニングデータを生成する。
本稿では,SD(Stable Diffusion)に基づくデータフリー代替攻撃方式を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:59:35 GMT)
Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [47.0] 本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:05:00 GMT)
CoDa: Constrained Generation based Data Augmentation for Low-Resource NLP [47.0] CoDaは、低リソース(データスカース)NLPのための制御可能で、効果的で、トレーニング不要なデータ拡張技術である。
提案手法は,市販の命令追従型大規模言語モデルに基づく。
CoDaは、拡張生成プロセスに対する明示的な制御を提供する最初のフレームワークである。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:47:06 GMT)
Pricing4SaaS: Towards a pricing model to drive the operation of SaaS [46.0] 本稿では,SaaS(Software as a Service)ライセンスモデルを適用したシステム価格構造に関する汎用仕様モデルを提案する。
Pricing4SaaSは、その実証された表現力によって、価格駆動型ISエンジニアリングの基盤になることを目指している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:23:55 GMT)
A minimax optimal control approach for robust neural ODEs [45.0] 我々は、頑健な制御の観点から、ニューラルなODEの敵対的訓練に対処する。
我々はポントリャーギンの最大原理の形で一階最適条件を導出する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:43:19 GMT)
NTO3D: Neural Target Object 3D Reconstruction with Segment Anything [44.5] NTO3Dは,新しい高品質なニューラルターゲットオブジェクト3D (NTO3D) 再構成法である。
まず、SAMの多視点2Dセグメンテーションマスクを統一された3D占有領域に引き上げるための新しい戦略を提案する。
3D占有領域は2次元空間に投影され、SAMの新しいプロンプトを生成する。
NTO3DはSAMの2Dマスクと特徴を3Dニューラルフィールドに持ち上げ、高品質なニューラルターゲットオブジェクト3D再構成を行う。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:36:06 GMT)
Spread Your Wings: A Radial Strip Transformer for Image Deblurring [44.4] 動き情報の探索は、動きを損なう作業において重要である。
最近のウインドウベースのトランスフォーマーアプローチは、画像劣化において優れた性能を実現している。
回転運動と翻訳情報を共に探索するための角度と距離を持つ極座標変換器を導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:20:04 GMT)
Seeing the Unseen: A Frequency Prompt Guided Transformer for Image Restoration [44.4] 本研究では,FProと呼ばれる周波数プロンプト画像復元手法を開発し,この手法により周波数パースペクティブ・コンポーネントを効果的に提供し,復元モデルを誘導する。
5つの画像復元作業において,SOTA法に対するパイプラインの良好な性能を示す実験結果が得られた。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:42:34 GMT)
Harmonizing Light and Darkness: A Symphony of Prior-guided Data Synthesis and Adaptive Focus for Nighttime Flare Removal [44.4] インセンス光源は、夜間に撮影画像にフレアを発生させることが多く、視覚的品質を劣化させ、下流の用途に悪影響を及ぼす。
効果的なフレア除去ネットワークをトレーニングするためには、信頼できるデータセットが不可欠である。
フレアの明るさが照明法則に合致するマルチフレア画像を含むフレア7K*という先行誘導型データセットを合成する。
クリーンな背景領域を適応的にマスキングし,フレアに強く影響された領域にフォーカスするモデルを支援するためのプラグイン・アンド・プレイ適応型フォーカス・モジュール (AFM) を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:37:56 GMT)
Is Factuality Decoding a Free Lunch for LLMs? Evaluation on Knowledge Editing Benchmark [43.5] 大規模言語モデル(LLM)の急速な開発により、より人間的な方法で現実的な知識を伝達することができる。
事実の復号化によるLLMの修正により, 事実の幻覚を減らそうとする努力が盛んに行われている。
しかし、モデルが既知の事実を過度に確信させるため、知識更新を妨げるリスクもある。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:08:28 GMT)
I'M HOI: Inertia-aware Monocular Capture of 3D Human-Object Interactions [42.9] イムホイ(I'm-HOI)は、人間と物体の両方の3Dの動きを、新しい環境で忠実に捉えようとするモノクラースキームである。
一般的な動き推論とカテゴリー認識の洗練を兼ね備えている。
私たちのデータセットとコードはコミュニティにリリースされます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:23:20 GMT)
Reaction dynamics with qubit-efficient momentum-space mapping [42.4] 線形応答によって支配される異なる反応を記述することに関連する応答関数の量子アルゴリズムについて検討する。
我々は、運動量空間基底状態を用いて効率的に実行できる格子上の量子ビット効率の写像を考える。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:21:46 GMT)
EventGround: Narrative Reasoning by Grounding to Eventuality-centric Knowledge Graphs [41.9] 本研究では,事象中心の知識グラフに自由文を接地する問題に対処するため,EventGroundと呼ばれる初期包括的フレームワークを提案する。
これらの問題に対処するために、単純で効果的な解析と部分的な情報抽出方法を提案する。
基礎知識を取り入れた我々の枠組みは、解釈可能な証拠を提供しながら最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:16:37 GMT)
Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians [41.9] 軽量なスパースビュー設定のための制御可能な3次元ガウスヘッドアバターを提案する。
提案手法は,超過大表現下でも2K解像度での超高忠実なレンダリング品質を実現するため,最先端のスパースビュー法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:19:10 GMT)
Cross-domain Fiber Cluster Shape Analysis for Language Performance Cognitive Score Prediction [41.0] 脳画像における形状解析は、人間の脳の構造と機能の相関を解釈するのに役立ちます。
拡散磁気共鳴画像(dMRI)による脳の3D点配列の再構成を行った。
本稿では,マルチヘッド型クロスアテンション機能融合モジュールを利用して,対象言語の性能を予測する新しいフレームワーク,シェイプフューズファイバクラスタトランス (SFFormer) を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:42:08 GMT)
MetaIE: Distilling a Meta Model from LLM for All Kinds of Information Extraction Tasks [40.8] 我々は「重要な情報」を抽出することを学ぶことで、メタモデルとして小さなLMを構築するための新しいフレームワークであるMetaIEを提案する。
特にMetaIEはラベル・ツー・スパン方式に従ってLDMからシンボル蒸留により小型のLMを得る。
本研究では,言語モデルの事前学習データセットから文を抽出し,蒸留データセットを構築する。
数ショットの適応設定でメタモデルを評価する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 19:43:45 GMT)
CLIP-driven Outliers Synthesis for few-shot OOD detection [40.6] OOD検出は、トレーニング中に見つからないクラスに属するOOD(out-of-distriion)画像を認識することに焦点を当てている。
今のところ、主要な戦略はCLIPのような大規模ビジョン言語モデルに基づいている。
信頼性の高いOOD監視情報の欠如を克服するために,CLIP-OS(CLIP-driven Outliers Synthesis)を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:28:05 GMT)
Unifying Top-down and Bottom-up Scanpath Prediction Using Transformers [40.3] 本研究では,注意制御の両形態を予測する単一モデルであるヒューマン・アテンション・トランスフォーマー(HAT)を提案する。
HATは、有効性、一般性、解釈可能性を強調する、計算的注意の新たな標準を定めている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:22:34 GMT)
Shortcuts Arising from Contrast: Effective and Covert Clean-Label Attacks in Prompt-Based Learning [40.1] 本稿では、アクティベーション値を活用し、トリガ設計とデータ選択戦略を統合して、より強力なショートカット機能を実現するContrastive Shortcut Injection (CSI) を提案する。
フルショットおよび少数ショットのテキスト分類タスクに関する広範な実験により、CSIの高有効性と高い盗聴性を低毒性率で実証的に検証した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:02:36 GMT)
DiffHuman: Probabilistic Photorealistic 3D Reconstruction of Humans [38.9] DiffHumanは1枚のRGB画像から3次元人物再構成を行う確率的手法である。
我々の実験は、DiffHumanが入力画像に見えない、あるいは不確実な人物のために、多種多様な詳細な再構成を作成できることを示している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:28:29 GMT)
Orchestrate Latent Expertise: Advancing Online Continual Learning with Multi-Level Supervision and Reverse Self-Distillation [38.4] オンライン連続学習(OCL)は、1パスのデータストリームでCLを実行する、より難しいが現実的な設定である。
マルチレベルオンラインシーケンスエキスパート(MOSE)という新しいアプローチを導入する。
MOSEは、モデルを積み重ねたサブエキスパートとして育成し、マルチレベルの監督と逆の自己蒸留を統合する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:53:10 GMT)
SpikingJET: Enhancing Fault Injection for Fully and Convolutional Spiking Neural Networks [37.9] SpikingJETは、完全に接続された畳み込み型スパイキングニューラルネットワーク(SNN)用に特別に設計された新しいフォールトインジェクタである。
我々の研究は、SNNのハードウェア障害に対するレジリエンスを評価するための重要な必要性を、現実世界のアプリケーションにおけるその優位性を考える上で、浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:51:01 GMT)
Image-to-Image Matching via Foundation Models: A New Perspective for Open-Vocabulary Semantic Segmentation [37.0] Open-vocabulary semantic segmentation (OVS)は、クラスラベルやキャプションによって指定された任意のカテゴリのイメージをセグメンテーションすることを目的としている。
過去のベストパフォーマンス手法は画像特徴とカテゴリラベルの誤一致に悩まされていた。
視覚基盤モデルに基づくOVSのための新しい関係認識型モーダルマッチングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:29:59 GMT)
Language Models are Spacecraft Operators [36.9] 大規模言語モデル(LLM)は、ユーザのテキストプロンプトの内容に基づいてアクションを行う自律エージェントである。
我々は,KSPDG(Kerbal Space Program Differential Games)チャレンジに対して,純粋なLLMベースのソリューションを開発した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:43:59 GMT)
Dual-View Visual Contextualization for Web Navigation [36.4] 本稿では,HTML 要素を Web ページのスクリーンショットの "デュアルビュー" を通じてコンテキスト化することを提案する。
Web開発者は、ユーザエクスペリエンスを向上させるために、Webページの近くにタスク関連の要素を配置する傾向があります。
結果として生じるHTML要素の表現は、エージェントがアクションを取るためのより情報的です。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:18:05 GMT)
DOCMASTER: A Unified Platform for Annotation, Training, & Inference in Document Question-Answering [36.4] 本稿では,PDF文書の注釈付け,モデルトレーニング,推論のための統一プラットフォームを提案する。
アノテーションインターフェースにより、ユーザは質問を入力し、PDFファイル内のテキストスパンを回答としてハイライトし、レイアウト情報とテキストスパンを保存できる。
このプラットフォームは、カリフォルニア大学サンディエゴ校(UCSD)国際サービス・エンゲージメントオフィス(ISEO)が相当量のPDF文書を処理するために使用しているAIアシスタントなど、文書分析に関するいくつかの研究プロトタイプの推進に役立っている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:11:39 GMT)
SiTH: Single-view Textured Human Reconstruction with Image-Conditioned Diffusion [35.7] SiTHは、イメージ条件付き拡散モデルと3Dメッシュ再構築ワークフローを統合する、新しいパイプラインである。
我々は、入力画像に基づいて、見えないバックビューの外観を幻覚させるために、強力な生成拡散モデルを用いる。
後者では,入力画像とバックビュー画像から全身のテクスチャメッシュを復元するためのガイダンスとして,肌付きボディーメッシュを利用する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:21:40 GMT)
NICP: Neural ICP for 3D Human Registration at Scale [35.6] 3Dヒューマンポイントクラウドへのテンプレートのアライメントは、アニメーションや再構築、教師付き学習パイプラインの有効化といったタスクにおいて、長年の課題である。
最近のデータ駆動手法は予測された表面の対応を利用するが、様々なポーズ、アイデンティティ、ノイズに対して堅牢ではない。
ダウンストリームアプリケーションのスケーラビリティを制限し、3Dヒューマン登録の標準と見なす方法はない。
本研究では,数千の形状と10以上の異なるデータソースにまたがる一般化とスケールを行うパイプラインであるNSRを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:39:06 GMT)
Learned Scanpaths Aid Blind Panoramic Video Quality Assessment [34.2] 本稿では,視覚的スキャンパスによるユーザ・ビューング・パターンの明示的なモデリングを用いた,エンドツーエンドで最適化された視覚的パノラマ映像品質評価手法を提案する。
視覚的PVQA法は,パノラマ画像を同一フレームからなるビデオとして扱うことにより,直接品質評価を可能にする。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:42:17 GMT)
Composite Backdoor Attacks Against Large Language Models [33.5] 本稿では,バックドア攻撃のレンズによる大規模言語モデル(LLM)の脆弱性について検討する。
複合バックドア攻撃(CBA)は、同じ複数のトリガーキーを単一のコンポーネントに埋め込むよりもステルス性が高い。
CBAは自然言語処理(NLP)とマルチモーダルタスクの両方に有効であることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:09:34 GMT)
Synthesize, Diagnose, and Optimize: Towards Fine-Grained Vision-Language Understanding [33.3] 視覚言語モデル(VLM)は、様々な下流タスクで顕著な性能を示した。
しかし、属性やオブジェクト間の関係など、きめ細かい視覚言語概念を理解することは、依然として重要な課題である。
他のすべての面において一貫性を確保しつつ、特定の属性で異なる画像を合成するプログレッシブパイプラインを導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:45:08 GMT)
Understanding Emergent Abilities of Language Models from the Loss Perspective [32.8] モデルサイズやトレーニング計算の代わりに,事前学習損失のレンズの創発能力について検討した。
学習前損失が特定の閾値以下になると,あるタスクに対して,モデルが創発的能力を示すことが判明した。
これにより、事前学習の損失が低いモデルで現れるような、創発的能力を再定義するインスピレーションがもたらされる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:55:12 GMT)
MMA-Diffusion: MultiModal Attack on Diffusion Models [32.7] MMA-Diffusionは、T2Iモデルのセキュリティに顕著で現実的な脅威をもたらす。
オープンソースモデルと商用オンラインサービスの両方において、現在の防御措置を回避している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:35:17 GMT)
Memory-Scalable and Simplified Functional Map Learning [32.1] 本稿では,メモリスケーラブルで効率的な関数型マップ学習パイプラインを提案する。
関数マップの構造を利用することで、メモリにポイントワイズマップを格納することなく、同じ結果が得られる可能性を提供します。
このアルゴリズムを後処理のステップで使用する多くの関数型マップ学習法とは異なり、列車時に簡単に利用できる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:01:04 GMT)
Planning and Editing What You Retrieve for Enhanced Tool Learning [32.0] 本稿では,P&R' と Edit-and-Ground (E&G) のパラダイムを包含した新しいモデル名(モデル意味)アプローチを提案する。
実験の結果,これらのパラダイムはツール検索タスクにおけるリコールとNDCGを大幅に改善することが示された。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:41:51 GMT)
Instrument-tissue Interaction Detection Framework for Surgical Video Understanding [31.8] 本稿では,手術ビデオ理解のための機器間相互作用検出ネットワーク(ITIDNet)を提案する。
具体的には,Snippet Consecutive Feature (SCF) レイヤを提案し,ビデオスニペット内のグローバルコンテキスト情報を用いて,現在のフレームにおける提案の関連性をモデル化することによって機能を強化する。
楽器と組織間の関係を推論するために、同じフレーム内の楽器と組織間の関係と、同じインスタンスの時間情報をモデル化するためのフレーム間関係を利用するための時間グラフ(TG)層が提案されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:21:11 GMT)
The Devil is in the Edges: Monocular Depth Estimation with Edge-aware Consistency Fusion [30.0] 本稿では,高品質な単分子深度を鮮明なエッジで推定し,単一のRGB画像から全体構造を検証し,新しい単分子深度推定手法 ECFNet を提案する。
我々は,MDEネットワークのエッジ深度推定に影響を及ぼす重要な要因について徹底的な調査を行い,エッジ情報自体が深度予測において重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:58:19 GMT)
Robust Active Speaker Detection in Noisy Environments [29.8] 雑音環境下での頑健なアクティブ話者検出(rASD)問題を定式化する。
既存のASDアプローチは、音声と視覚の両モードを利用するが、周囲の環境における非音声は、性能に悪影響を及ぼす可能性がある。
雑音のない音声特徴を学習するためのガイダンスとして,音声・視覚的音声分離を利用した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:00:27 GMT)
From Learning to Analytics: Improving Model Efficacy with Goal-Directed Client Selection [29.3] フェデレートラーニング(FL)は、分散クライアント間でグローバルモデルを学ぶための魅力的なパラダイムである。
クライアントのローカルデータを用いて訓練されたグローバルモデルの効果的な評価を可能にするクローズドループモデル分析フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:49:59 GMT)
A Simple Yet Effective Approach for Diversified Session-Based Recommendation [29.0] 本稿では,DCA-SBRS(Diversified category-aware Attentive SBRS)と呼ばれる,既存の代表(精度指向)SBRSに適用可能なエンドツーエンドフレームワークを提案する。
モデルに依存しない多様性指向の損失関数と、非侵襲的なカテゴリー認識の注意機構の2つの新しい設計で構成されている。
提案フレームワークは,推薦精度を著しく低下させることなく,既存のSBRSが推薦の多様性と包括的性能で素晴らしいパフォーマンスを達成するのに役立つ。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:21:56 GMT)
TTD: Text-Tag Self-Distillation Enhancing Image-Text Alignment in CLIP to Alleviate Single Tag Bias [28.9] 現代のCLIPモデルにおける重要なバイアスを同定し,そのバイアスをテキスト化タグバイアスと表現する。
このバイアスは、他の関連するタグを無視しながら、特異タグに不均等な焦点として現れます。
テキストから画像関連タグを抽出する2段階のファインチューニング手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:51:07 GMT)
NumeroLogic: Number Encoding for Enhanced LLMs' Numerical Reasoning [27.6] 言語モデルは数値データを扱い、算術演算を行うのに苦労する。
本稿では,各数字の前に数字の個数を含めることで,数がどのように表現されるかを簡単に調整する。
モデルにまず数字の数を考慮させることで、実際の数字を生成する前に推論プロセスを強化する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 19:46:59 GMT)
Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning [27.2] 本稿では,論理駆動型データ拡張手法AMR-LDAを提案する。
AMR-LDAは元のテキストを抽象的意味表現(AMR)グラフに変換する。
修正されたAMRグラフは、拡張データを作成するためにテキストに変換される。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:14:55 GMT)
Revisiting Random Weight Perturbation for Efficiently Improving Generalization [26.3] ディープニューラルネットワーク(DNN)の一般化を改善する2つの方法が提案されている。
本稿では,一般化のためのRWPの利用を再考し,二つの観点から改善を提案する。
拡張RWP法は,特に大規模問題において,一般化の効率化に有効であることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:18:27 GMT)
Assessing and Enhancing the Robustness of Large Language Models with Task Structure Variations for Logical Reasoning [25.5] 我々は「ReClor-plus」、「LogiQA-plus」、「LogiQAv2-plus」という3つの新しい論理推論データセットを開発した。
実験により、これらの単純な拡張がモデルの性能を著しく損なうことが示されている。
微調整とプロンプトのためのロジック駆動型データ拡張の適用は、識別モデルと生成モデルの両方における一般化を促進することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:49:19 GMT)
Can LLMs Master Math? Investigating Large Language Models on Math Stack Exchange [25.4] 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて例外的な機能を示した。
本稿では、複雑な数学的問題解決をナビゲートする上でのLLMの限界について考察する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:48:31 GMT)
Communication Efficient Distributed Training with Distributed Lion [25.4] 分散トレーニング環境に対するLionの革新的な適応であるDistributed Lionを紹介します。
視覚と言語の問題の両方で、タスク、ワーカ数、バッチサイズにまたがる堅牢性を示します。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:07:29 GMT)
MMVP: A Multimodal MoCap Dataset with Vision and Pressure Sensors [25.4] 既存のデータセットは、しきい値との視覚的マッチングや圧力信号の導入によって、密接な足の接触に注釈を付ける傾向がある。
MMVPと呼ばれるビジョンと圧力センサーを備えたマルチモーダルMOCapデータセットを提案する。
MMVPは、RGBD観測と同期した正確で高密度なプランター圧力信号を提供する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:46:10 GMT)
As-Plausible-As-Possible: Plausibility-Aware Mesh Deformation Using 2D Diffusion Priors [25.1] 本稿では2次元拡散を利用したAs-Plausible-as-Possible(APAP)メッシュ変形手法を提案する。
我々のフレームワークは、メッシュの変形を表現するために、顔ごとのジャコビアンを用いており、メッシュ座標は微分可能なPoisson Solveによって計算される。
変形メッシュを描画し、得られた2D画像をスコア蒸留サンプリング(SDS)プロセスで使用することにより、事前訓練された2D拡散モデルから有意義な可視性を抽出することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:08:08 GMT)
Causal Inference for Human-Language Model Collaboration [24.1] 動的人間-LM協調における様々な相互作用戦略のISEを推定するアルゴリズムであるCausalCollabを開発した。
3つの異なる人間とLMのコラボレーションシナリオに関する実証的な調査は、CausalCollabが効果的にコンバウンドを減らすことを示しています。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:08:25 GMT)
How Robust are the Tabular QA Models for Scientific Tables? A Study using Customized Dataset [23.8] SciTabQAは、科学的異種データに対する質問応答を研究する革新的なデータセットである。
3つの最先端のタブラルQAモデルをベンチマークした結果、最良のF1スコアは0.462であることがわかった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:48:49 GMT)
Privacy Backdoors: Stealing Data with Corrupted Pretrained Models [23.5] 実践者は、オープンリポジトリからトレーニング済みの機械学習モデルをダウンロードして、特定のアプリケーションに適合するように微調整する。
このプラクティスによって、プライバシーバックドアの新たなリスクがもたらされることが示されています。
トランスフォーマーを含む、さまざまなモデルのプライバシバックドアを構築する方法を紹介します。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:43:53 GMT)
Efficient Automatic Tuning for Data-driven Model Predictive Control via Meta-Learning [23.5] AutoMPCは、データ駆動モデル予測制御の自動化と最適化を行うPythonパッケージである。
本稿では,BOを温めることでAutoMPCの効率と安定性を向上させる,Portfolioというメタ学習手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:26:51 GMT)
Collaborating Foundation Models for Domain Generalized Semantic Segmentation [23.4] ドメイン一般化セマンティック(DGSS)は、ラベル付きソースドメイン上でモデルをトレーニングする。
我々はDGSSにアプローチし、CLOUDS(Domain Generalized Semantic)のためのCoLlaborative FOUndationモデルの組立を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:21:42 GMT)
Addressing Both Statistical and Causal Gender Fairness in NLP Models [22.8] 統計的公正性は、保護されたすべてのグループに対して同等の結果を規定するが、因果公正性は、モデルが保護された特性に関係なく、個人に対して同じ予測を行うことを規定する。
統計的および因果的脱バイアス法の組み合わせにより,両指標間の偏差を低減できることを実証した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:05:41 GMT)
DeFT: Flash Tree-attention with IO-Awareness for Efficient Tree-search-based LLM Inference [22.7] 現在のツリーデコード戦略と推論システムは、計算の冗長性、メモリフットプリント、メモリアクセスのために互いに適していない。
メモリフットプリントの少ないメモリ効率なアテンション計算を2段階に維持するIO対応ツリーアテンションアルゴリズムであるDeFTを提案する。
DeFTは、SOTAアテンションアルゴリズムによる2つの実用的な推論タスクに対して、エンドツーエンドのレイテンシで1.7-2.4$times$のスピードアップを達成できる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:34:54 GMT)
Correlation-guided Query-Dependency Calibration in Video Representation Learning for Temporal Grounding [22.6] 相関ガイドによる検出TRansformerは、クエリ関連ビデオクリップのヒントを提供する。
CG-DETRは時間的接地のための様々なベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:01:17 GMT)
An Empirical Study of Automated Vulnerability Localization with Large Language Models [21.8] 大規模言語モデル(LLM)は、様々な領域において可能性を示しているが、脆弱性のローカライゼーションにおけるその有効性は未解明のままである。
本調査では,ChatGPTや各種オープンソースモデルなど,コード解析に適した10以上のLLMを対象とする。
ゼロショット学習,ワンショット学習,識別的微調整,生成的微調整の4つのパラダイムを用いて,これらのLCMの有効性を検討する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:42:10 GMT)
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models [21.6] IllusionVQA: 難解な錯視と難解なシーンのデータセットを提示する。
人間の評価は、人間が理解と局在において91.03%と100%の精度を達成することを明らかにしている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:21:42 GMT)
Tracing Hyperparameter Dependencies for Model Parsing via Learnable Graph Pooling Network [21.5] 本稿では,LGPN(Learningable Graph Pooling Network)と呼ばれる新しいモデル解析手法を提案する。
LGPNには、モデル解析に適した学習可能なプールアンプール機構が組み込まれている。
提案手法をCNN生成画像検出と協調攻撃検出に拡張する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:50:25 GMT)
Towards Variable and Coordinated Holistic Co-Speech Motion Generation [21.2] 本稿では,3次元アバターの音声合成におけるライフライクな音声合成の問題点について述べる。
ProbTalkは,音声における顔,手,体の動きを協調的にモデル化する統合確率的フレームワークである。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:41:57 GMT)
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation [21.2] Mamba-UNetは,医療画像のセグメンテーションにおいてU-Netとマンバの能力を相乗化する新しいアーキテクチャである。
Mamba-UNetは純粋にVisual Mamba(VMamba)ベースのエンコーダデコーダ構造を採用しており、ネットワークのさまざまなスケールで空間情報を保存するためにスキップ接続を注入している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:51:35 GMT)
Constrained Layout Generation with Factor Graphs [21.1] 本稿では,各室に4つの潜伏変数ノード,各制約に1つの因子ノードを持つ因子グラフに基づくアプローチを提案する。
ファクタノードは、それらが接続されている変数間の依存関係を表し、より高い順序の可能性のある制約を効果的にキャプチャする。
我々のアプローチはシンプルで、ユーザ要求に忠実なレイアウトを生成し、既存のメソッドよりもIOUスコアが大幅に改善されていることを実証しています。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:58:40 GMT)
Topologies of Reasoning: Demystifying Chains, Trees, and Graphs of Thoughts [21.0] 利用構造の基本クラスを特定することに集中し、これらの構造表現を分析する。
本研究は,提案した分類法を用いて既存のプロンプト方式と比較し,特定の設計選択が性能とコストの異なるパターンにどのように寄与するかを論じる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:33:36 GMT)
AttackNet: Enhancing Biometric Security via Tailored Convolutional Neural Network Architectures for Liveness Detection [20.8] アタックネット(AttackNet)は、生体認証システムにおける偽りの脅威に対処するために設計された、難解な畳み込みニューラルネットワークアーキテクチャである。
低レベルの特徴抽出から高レベルのパターン識別へシームレスに移行する、階層化された防御機構を提供する。
多様なデータセットにまたがってモデルをベンチマークすることは、その長所を証明し、現代のモデルと比較して優れたパフォーマンス指標を示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:04:10 GMT)
DiLM: Distilling Dataset into Language Model for Text-level Dataset Distillation [20.7] 本稿では,Distilling dataset into Language Model (DiLM) と呼ばれる新しいテキストデータセット蒸留手法を提案する。
DiLMは、合成サンプルを直接最適化するのではなく、テキストデータとして情報的合成トレーニングサンプルを生成するために、言語モデルを訓練する。
私たちのコードはhttps://github.com/arumaekawa/DiLM.comで公開されます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:40:54 GMT)
MAPSeg: Unified Unsupervised Domain Adaptation for Heterogeneous Medical Image Segmentation Based on 3D Masked Autoencoding and Pseudo-Labeling [20.7] Masked Autoencoding and Pseudo-Labeling (MAPSeg) は医療画像セグメンテーションのための$textbfunified$ UDAフレームワークである。
MAPSegは、$textbfcentralized$, $textbffederated$, $textbftest-time$ UDAに適用できる最初のフレームワークである。
我々は、MAPSegを、プライベート幼児脳MRIデータセットとパブリック心臓CT-MRIデータセットの最先端手法と比較し、MAPSegは大規模で他者より優れる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:10:36 GMT)
SA-LSPL:Sequence-Aware Long- and Short- Term Preference Learning for next POI recommendation [19.4] Point of Interest(POI)推奨は、特定のタイミングでユーザに対してPOIを推奨することを目的としている。
提案する手法は,SA-LSPL(Sequence-Aware Long- and Short-Term Preference Learning)である。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:40:25 GMT)
Fun with Flags: Robust Principal Directions via Flag Manifolds [19.0] 主成分分析(PCA)はコンピュータビジョンと機械学習において不可欠である。
我々はPCAとその変種に対する統一的な形式論を示し、線形部分空間のフラグに基づくフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:05:52 GMT)
Enhancing Content-based Recommendation via Large Language Model [19.0] 本稿では,2つの主要コンポーネントを含む意味的知識伝達手法であるtextbfLoIDを提案する。
実世界のデータセットをベースラインとしたSOTAによる広範囲な実験を行い、本手法のLoIDを大幅に改善したことを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:56:53 GMT)
UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause [18.8] 会話におけるマルチモーダル感情認識(MERC)とマルチモーダル感情原因ペア抽出(MECPE)は近年注目されている。
我々は、感情と感情の原因の因果関係と相補性を探るため、統一マルチモーダル感情認識・感情因果分析フレームワーク(UniMEEC)を提案する。
UniMEECは、MERCとMECPEのタスクを2つのマスク予測問題として再構成し、感情と原因の相互作用を強化する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:59:17 GMT)
Long-Tailed Recognition on Binary Networks by Calibrating A Pre-trained Model [18.6] 高リソース効率のバイナリニューラルネットワークをバックボーンとして使用することで、長い尾の分布を学習するという課題に対処する。
そこで本研究では,バランスの取れたデータセットでトレーニングされた既訓練完全精度モデルを用いて,蒸留の教師として使用するキャリブレート・アンド・ディスティルフレームワークを提案する。
種々のデータセットをより一般化するために,目的関数の項間の新たな対角バランスと,効率的な多分解能学習手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:37:19 GMT)
Maximal quantum interaction between free electrons and photons [18.5] 自由電子量子光学は電子-光子絡み合いを可能にし、非自明な光子状態を生成するポテンシャルを保持する。
我々は、自由電子と単一モード光子の間の量子真空相互作用強度に上限を与え、最も強い相互作用の条件を照らす。
標準測地解析および数値計算によりその限界を検証し、強い量子相互作用の実現可能性を示す準最適設計を提供する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:11:00 GMT)
FineFake: A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detecction [18.5] FineFakeは、フェイクニュース検出のためのマルチドメイン知識強化ベンチマークである。
FineFakeは6つのセマンティックトピックと8つのプラットフォームにまたがる16,909のデータサンプルを含んでいる。
FineFakeプロジェクト全体がオープンソースリポジトリとして公開されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:39:09 GMT)
All Rivers Run to the Sea: Private Learning with Asymmetric Flows [18.1] 我々は、非プライベートな集中型トレーニングとしてモデルパフォーマンスに匹敵する、新しいプライベートトレーニングと推論フレームワークであるDeltaを提案する。
デルタは情報に敏感な表現を低次元空間に埋め込み、情報に敏感な部分を高次元の残留物に押し込む。
理論的には、Deltaは公共環境における差分プライバシーを保証し、プライベート環境における複雑さを大幅に低減する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:11:28 GMT)
Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks [17.4] 我々は,70億個のパラメータを持つ新しい医療AIシステムであるMeerkat-7Bを紹介する。
Meerkat-7Bは18の医学教科書から得られた高品質なチェーン・オブ・シーリングパスからなる,我々の新しい合成データセットを用いて訓練された。
GPT-3.5を13.1%上回り、MedTron-7BやBioMistral-7Bを13.4%、BioMistral-7Bを9.8%上回った。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:09:00 GMT)
ParallelPARC: A Scalable Pipeline for Generating Natural-Language Analogies [16.9] 複雑な段落に基づくアナロジーを作成するパイプラインを開発する。
我々は人によって検証された金のセットと銀のセットを自動生成する。
私たちは、銀のセットがトレーニングモデルに役立つことを実証します。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:40:03 GMT)
HSIMamba: Hyperpsectral Imaging Efficient Feature Learning with Bidirectional State Space for Classification [16.7] HSIMambaは、双方向の逆畳み込みニューラルネットワークパスを使用して、スペクトル特徴をより効率的に抽出する新しいフレームワークである。
提案手法は,CNNの動作効率と,トランスフォーマに見られる注意機構の動的特徴抽出機能を組み合わせたものである。
このアプローチは、現在のベンチマークを超えて分類精度を改善し、トランスフォーマーのような高度なモデルで遭遇する計算の非効率性に対処する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:27:36 GMT)
SD-NAE: Generating Natural Adversarial Examples with Stable Diffusion [16.4] 本研究では, 現状の安定拡散を利用して, 自然適応例(NAE)を積極的に合成することを提案する。
制御された最適化プロセスを定式化し、特定のクラスに対応するトークン埋め込みを摂動させてNAEを生成する。
SD-NAE (Stable Diffusion for Natural Adversarial Examples) と呼ばれるこの手法は有効なNAEの生成に有効である。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:18:21 GMT)
Scale Alone Does not Improve Mechanistic Interpretability in Vision Models [16.0] マシンビジョンは、データセットとモデルサイズの前例のないレベルまでニューラルネットワークをスケールすることで、目覚ましい進歩を見せている。
9種類のモデルからなる多種多様なスイートに対して、機械論的解釈可能性の1つの形態を定量化する。
調査対象の最先端モデルは,ほぼ10年前のGoogLeNetモデルよりも解釈が容易ではない。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:06:36 GMT)
Self-Improved Learning for Scalable Neural Combinatorial Optimization [15.8] 本研究は、ニューラルネットワーク最適化のスケーラビリティを向上させるための新しい自己改善学習(SIL)手法を提案する。
我々は,ラベル付きデータを使わずに大規模問題インスタンス上での直接モデルトレーニングを可能にする,効率的な自己改善機構を開発した。
さらに,計算モデルに対する線形注意複雑化機構を設計し,オーバヘッドの少ない大規模問題インスタンスを効率的に処理する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:47:25 GMT)
Learning truly monotone operators with applications to nonlinear inverse problems [15.7] 本稿では,新たに定義されたペナル化損失を通じてモノトーンニューラルネットワークを学習するための新しいアプローチを紹介する。
The Forward-Backward-Forward (FBF) algorithm is used to address monotone inclusion problem。
次に,非線形逆問題の解法が成功したシミュレーション例を示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:03:52 GMT)
Egocentric Scene-aware Human Trajectory Prediction [15.3] 本研究では,周囲の静的なシーン上での人間の動作条件を予測する手法を提案する。
本モデルでは,衝突回避および軌道モードカバレッジの重要な指標について,既存の手法よりも優れる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:15:36 GMT)
Attesting Distributional Properties of Training Data for Machine Learning [15.3] いくつかの管轄区域は、機械学習の規制フレームワークを準備している。
ドラフト規則は、トレーニングデータセットが特定の分散特性を持つことを示すために、モデルトレーナーが必要であることを示している。
本研究では,証明者がデータを明らかにすることなく,学習データの適切な分布特性を検証者に示すことのできる特性証明の概念を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:48:00 GMT)
MCTS: A Multi-Reference Chinese Text Simplification Dataset [15.1] 漢文の簡体化に関する研究は、古くからほとんど行われていない。
マルチ参照中国語テキスト単純化データセットであるMCTSを紹介する。
いくつかの教師なし手法と高度な大規模言語モデルの性能を評価する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:55:41 GMT)
Generative AI for Architectural Design: A Literature Review [14.9] ジェネレーティブ・人工知能は、建築設計における新しい方法論パラダイムを開拓した。
本稿では,建築設計におけるジェネレーティブAI技術の広範な応用について考察する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:25:11 GMT)
Learning Orbitally Stable Systems for Diagrammatically Teaching [14.8] ダイアグラム教育はロボットが新しいスキルを身につけるためのパラダイムであり、ユーザーはロボットの動きを形作るシーンの画像に2Dスケッチを提供する。
本研究では,ロボットに表面への接近を指示し,その上でサイクリック動作を追従する問題に取り組む。ロボットのカメラからの画像に対して,ユーザが提供する1つのスケッチによって,動きのサイクルを任意に指定することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:11:04 GMT)
SVGCraft: Beyond Single Object Text-to-SVG Synthesis with Comprehensive Canvas Layout [14.8] この研究は、テキスト記述からシーン全体を描写したベクトルグラフィックスを作成するための新しいエンドツーエンドフレームワークを導入する。
SVGCraftは、訓練済みエンコーダと不透明度変調によるLPIPS損失を使って最適化され、類似性を最大化する。
抽象化、認識可能性、細部において、以前の作品を上回ることが示されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:43:40 GMT)
U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation [14.5] 医用画像分割のための新しい堅牢で効率的なU-Net変種であるU-Net v2を紹介する。
セマンティックな情報を低レベルの機能に注入し、同時に細かな詳細で高レベルの機能を改善することを目的としている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:51:33 GMT)
Bayesian Exploration of Pre-trained Models for Low-shot Image Classification [14.2] 本研究はガウス過程に基づくシンプルで効果的な確率的モデルアンサンブルフレームワークを提案する。
平均関数をCLIPとカーネル関数で指定することで,事前知識の統合を実現する。
提案手法は,予測性能に関する競争アンサンブルベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:25:28 GMT)
Approximation of a Pareto Set Segment Using a Linear Model with Sharing Variables [14.2] 最適性と変数共有を両立させる性能指標を開発した。
次に、ユーザの要求を満たすためのメトリックを最小限に抑えるモデルを見つけるアルゴリズムを設計する。
実験結果から,選好ベクトルから局所領域の解への写像を近似した線形モデルが得られることが示された。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:42:07 GMT)
vid-TLDR: Training Free Token merging for Light-weight Video Transformer [14.1] ビデオトランスフォーマーは、ビデオフレーム全体にわたる大量のトークンによって引き起こされる計算コストに悩まされる。
軽量ビデオ変換器(vid-TLDR)のための学習自由トークンマージを提案する。
背景トークンをドロップし,オブジェクトスコアをシャープにすることで,サリエンシを意識したトークンマージ戦略を導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:45:38 GMT)
PROMPT-SAW: Leveraging Relation-Aware Graphs for Textual Prompt Compression [14.1] ProMPT-SAW: Prompt compresSion via Relation AWare graphs。
PROMPT-SAWはプロンプトのテキスト情報を使ってグラフを構築する。
GSM8K-AUGも提案する。タスクに依存しないプロンプトのための既存のGSM8kベンチマークの拡張版である。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:07:58 GMT)
Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods [14.0] 大規模言語モデル(LLMs)は強化学習(RL)への有望な道として出現する
本稿では,従来のRL法と比較して,$textitLLM-enhanced RL$における既存文献の包括的レビューを行い,その特徴を要約する。
本稿では,情報処理装置,報酬設計装置,意思決定装置,ジェネレータの4つの役割を含む,RLにおけるLLMの機能を体系的に分類する構造的分類法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:28:08 GMT)
Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation [13.9] 自然言語で表現された多段階推論のための反復型ニューラルネットワークであるIMA-GloVe-GAを紹介する。
本モデルでは,RNNに基づく反復型メモリニューラルネットワークを用いて推論を行う。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:18:15 GMT)
LLM-as-a-Coauthor: Can Mixed Human-Written and Machine-Generated Text Be Detected? [13.8] 現在の研究は主に、混合シナリオに適切に対処することなく、純粋なMGT検出に焦点を当てている。
AIと人為的コンテンツの両方を含む混合テキストの形式であるmixtextを定義します。
既存の検出器はミックステキストの識別に苦慮し,特に微妙な修正やスタイル適応性に対処している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:15:50 GMT)
Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning [13.7] 本稿では,Large Language Models(LLMs)における知識注入手法としてのスーパーバイザードファインタニング(SFT)の有効性について検討する。
さまざまなデータセット生成戦略 – トークンベースとファクトベースのスケーリング – を比較して,モデルが新たな情報を学ぶためのトレーニングデータを生成します。
その結果、ドメイン外知識に関連するQ&Aタスクのパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:56:07 GMT)
Privacy at Scale: Introducing the PrivaSeer Corpus of Web Privacy Policies [13.1] PrivaSeerは、100万以上の英語ウェブサイトのプライバシーポリシーのコーパスです。
本稿では,可読性テスト,文書類似性,キーフレーズ抽出の結果を示し,トピックモデリングによるコーパスの探索を行った。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:21:59 GMT)
Your Co-Workers Matter: Evaluating Collaborative Capabilities of Language Models in Blocks World [13.0] 2つのエージェントがそれぞれ独自の目標とスキルを持ち、ターゲット構造を一緒に構築するブロックワールド環境を設計する。
目標を達成するために、彼らは世界で行動し、自然言語でコミュニケーションすることができる。
パートナーの状態をモデル化し、実行エラーを特定し、修正するための中間的推論ステップを含む、チェーンオブ思想のプロンプトを採用しています。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:48:38 GMT)
ReGround: Improving Textual and Spatial Grounding at No Cost [13.0] 空間的接地は、ゲートされた自己意図から横断的な意図への逐次的な流れによって、しばしばテキスト的接地よりも優れている。
このようなバイアスは、ネットワークアーキテクチャを単に書き換えることによって、どちらも精度を犠牲にすることなく、大幅に軽減できることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:53:31 GMT)
Partially-Observable Sequential Change-Point Detection for Autocorrelated Data via Upper Confidence Region [12.6] 逐次変化点検出のための状態空間モデル(AUCRSS)を用いたアダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・
SSMのオンライン推論のために部分的に観測可能なカルマンフィルタアルゴリズムを開発し、一般化された確率比テストに基づく変化点検出スキームを解析する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:32:53 GMT)
Kernel Multigrid: Accelerate Back-fitting via Sparse Gaussian Process Regression [12.6] 本稿では,加法GPをトレーニングするためのKernel Multigrid (KMG) アルゴリズムを提案する。
KMG は時間と空間の複雑さを保ちながら、必要な反復を $mathcalO(log n)$ に減らす。
数値的には、KMGは5回の反復で高次元目標の正確な近似を生成することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:58:59 GMT)
A Review of Predictive and Contrastive Self-supervised Learning for Medical Images [12.4] 本稿では,自然画像と医用画像への適応に基づいて,最先端のコントラストSSLアルゴリズムについて検討する。
医療分野における対照的なSSLの適用における最近の進歩、現在の制限、今後の方向性について議論することで締めくくられる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:50:28 GMT)
MONAL: Model Autophagy Analysis for Modeling Human-AI Interactions [12.0] 大規模モデルの自己消費説明のためのモデルオートファジー分析(MONAL)を提案する。
MONALは、人間とAIシステム間の交換における人為的な情報の抑制を解明するために、2つの異なる自己食ループを使用している。
生成したモデルのキャパシティを,情報作成者とディスセミネータの両方として評価する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:05:59 GMT)
Optimization of utility-based shortfall risk: A non-asymptotic viewpoint [11.9] ユーティリティ・ベース・ショートフォールリスク(UBSR)の推定と最適化の問題点を考察する。
UBSR推定の文脈では、UBSRの古典的サンプル平均近似(SAA)の平均二乗誤差に基づく非漸近境界を導出する。
UBSR最適化のための勾配アルゴリズムの速度を定量化する非漸近境界を導出する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:53:49 GMT)
Facilitating Reinforcement Learning for Process Control Using Transfer Learning: Perspectives [11.8] 本稿では,伝達学習の観点からプロセス制御のための深層強化学習(DRL)の知見を提供する。
プロセス産業の分野でDRLを適用することの課題と、トランスファーラーニングの導入の必要性について分析する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:58:59 GMT)
Geometrically-driven Aggregation for Zero-shot 3D Point Cloud Understanding [11.4] ゼロショット3Dポイントクラウド理解は2Dビジョンランゲージモデル(VLM)によって達成できる
既存の戦略は、ヴィジュアル・ランゲージ・モデル(Vision-Language Model)をレンダリングまたはキャプチャされた2Dピクセルから3Dポイントにマッピングし、固有かつ表現可能な雲の幾何学構造を見渡す。
本稿では, 点雲の3次元幾何学的構造を利用して, 移動したビジョン・ランゲージモデルの品質を向上させるための, 初となるトレーニングフリーアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:49:41 GMT)
Auditing Counterfire: Evaluating Advanced Counterargument Generation with Evidence and Style [11.2] GPT-3.5 ターボは高いパラフレーズとスタイルの忠実さで議論の質で最高位にランクインした。
ノ・スタイルの反論は、平均して最も説得力があることを証明した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:08:39 GMT)
Nesting Particle Filters for Experimental Design in Dynamical Systems [11.2] 最適設計を推論するネスト型シーケンシャルモンテカルロ法を開発し,それを粒子マルコフ連鎖モンテカルロフレームワークに埋め込み,勾配に基づくポリシー補正を行う。
提案手法は, コントラスト推定器に頼らないため, 他のアモータイズされた実験設計手法と異なる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:31:53 GMT)
Design as Desired: Utilizing Visual Question Answering for Multimodal Pre-training [11.1] VQA(Visual Question Answering)をマルチモーダル・プレトレーニングに利用して,対象とする病態の特徴に着目したフレームワークのガイドを行う。
テキスト領域に近い準テキスト空間に視覚的特徴を変換するモジュールである準テキスト特徴変換器を用いた新しい事前学習フレームワークを提案する。
私たちのフレームワークは、レポート生成、分類、セグメンテーション、および5つのデータセットにわたる検出の4つのダウンストリームタスクに適用されます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:56:54 GMT)
Rethinking Attention-Based Multiple Instance Learning for Whole-Slide Pathological Image Classification: An Instance Attribute Viewpoint [11.1] マルチプル・インスタンス・ラーニング (MIL) は、WSI解析のための堅牢なパラダイムである。
本稿では,これらの問題に対処する属性駆動型MIL(AttriMIL)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:04:46 GMT)
DE-HNN: An effective neural model for Circuit Netlist representation [11.1] 設計者は、ツールの実行よりもはるかに短い時間で、設計に対するフィードバックを提供する高速なツールを望んでいる。
本稿では,方向同変型ハイパーグラフニューラルネットワーク(DE-HNN)を提案する。
我々のDE-HNNは、有向ハイパーグラフに対して自然に、ある置換同変および不変性を満たす任意のノードまたはハイパーエッジ基底関数を普遍的に近似できることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 21:54:01 GMT)
Matrix-Transformation Based Low-Rank Adaptation (MTLoRA): A Brain-Inspired Method for Parameter-Efficient Fine-Tuning [11.0] マトリックス変換に基づく低ランク適応(MTLoRA)は、脳の機能はその幾何学的構造によって形成されるという考えから着想を得ている。
MTLoRAは8つのタスクでパフォーマンスが約1.0%向上する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:36:54 GMT)
A Survey on Safe Multi-Modal Learning System [10.9] マルチモーダル学習システム(MMLS)は、様々なモーダル入力から情報を処理し統合する能力で注目を集めている。
安全に関する体系的な研究が欠如していることは、この分野の進歩にとって重要な障壁である。
MMLSの安全性を体系的に分類し評価する最初の分類法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:31:11 GMT)
Reducing of the Uncertainty Product of Coherent Light through Multi-Photon Interference [10.9] マッハ・ツェンダー干渉計を用いて、従来の干渉パターンの周縁幅の低減を観察する。
我々のスキームは、標準量子限界を克服するために、圧縮または絡み合った光を必要としない。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:28:07 GMT)
The Shape of Word Embeddings: Recognizing Language Phylogenies through Topological Data Analysis [10.2] 我々は、トポロジカルデータ解析から永続的ホモロジーを用いて、ラベルなし埋め込みの形状から言語ペア間の距離を測定する。
81のインド・ヨーロッパ語に言語系統樹を構築した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:51:25 GMT)
Edinburgh Clinical NLP at SemEval-2024 Task 2: Fine-tune your model unless you have access to GPT-4 [10.0] 各種大規模言語モデル (LLM) を複数戦略で評価する。例えば、Chain-of-Thought, In-Context Learning, Efficient Fine-Tuning (PEFT) などである。
その結果,2つのPEFTアダプタはF1スコア(+0.0346)とLLMの一貫性(+0.152)を改善した。
3つの指標を平均して、GPT-4は0.8328との競争で1位となった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:27:21 GMT)
LLMs and Finetuning: Benchmarking cross-domain performance for hate speech detection [10.0] 本研究では,ヘイトスピーチの同定における事前学習および微調整型大言語モデル(LLM)の有効性と適応性について検討した。
LLMは、事前トレーニングなしでも最先端技術に対して大きな優位性を提供します。
我々は、ドメイン間の一般化性を強調し、ヘイトスピーチ検出の未来に対するビジョンで締めくくる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:01:08 GMT)
Discovering Effective Policies for Land-Use Planning with Neuroevolution [9.9] 森林、都市部、農業など、異なる用途の土地がどのように配分されているかは、地球上の炭素収支に大きな影響を及ぼす。
意思決定者が利用できるさまざまな選択肢を効率的に評価できるようにする代理モデルを学ぶことができる。
進化的探索プロセスは、特定の場所に対する効果的な土地利用政策を発見するために使用できる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 19:16:29 GMT)
Dialectical Alignment: Resolving the Tension of 3H and Security Threats of LLMs [9.6] 既存のアライメント手法は、外部エビデンスとパラメトリックメモリが競合する場合、大きな言語モデル(LLM)をアダプティブ・シャメレオン(Adaptive Chameleon)に導くことができる。
我々は、AIフィードバックを利用してLLMの最適戦略を特定し、コンテキスト間の競合をナビゲートする新しいフレームワーク、Dialectical Alignment(DA)を提案する。
実験の結果,DAは有毒なデータ攻撃防御を20倍に改善し,追加のプロンプトエンジニアリングを必要としないことがわかった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:41:05 GMT)
SAGE: Bridging Semantic and Actionable Parts for GEneralizable Manipulation of Articulated Objects [9.5] 本稿では,自然言語命令下での汎用的な操作を実現するために,意味的および動作可能なオブジェクトをブリッジする新しいフレームワークを提案する。
パーシャルグラウンドモジュールは、セマンティックな部分を「ジェネリザブル・アクティブル・パート(GAParts)」と表現し、パートモーションに関する情報を本質的に保持する。
インタラクティブなフィードバックモジュールが障害に対応するために組み込まれており、ループを閉じ、全体的なフレームワークの堅牢性を高める。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:46:34 GMT)
YOLOOC: YOLO-based Open-Class Incremental Object Detection with Novel Class Discovery [9.4] オープンワールドオブジェクト検出(OWOD)は最近注目を集めています。
従来のアプローチは、新しいクラス検出のための強い教師付きまたは弱い教師付き新しいクラスデータにヒンジする。
推論段階でのみ新しいクラスが遭遇する新しいベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:17:39 GMT)
Brain Decodes Deep Nets [9.3] 我々は、脳にマッピングすることで、大きな訓練済み視覚モデルの可視化と解析を行うツールを開発した。
私たちのイノベーションは、画像に反応して脳のfMRI測定を予測する脳エンコーディングの驚くべき利用から生まれます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:30:18 GMT)
Differential Privacy with Higher Utility by Exploiting Coordinate-wise Disparity: Laplace Mechanism can Beat Gaussian in High Dimensions [9.2] 我々は、i.n.d. Gaussian と Laplace のメカニズムを研究し、これらのメカニズムがプライバシーを保証する条件を得る。
我々は、i.n.d.ノイズが座標降下によるプライベートな経験的リスク最小化の性能をいかに向上させるかを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:30:11 GMT)
Automatic detection of relevant information, predictions and forecasts in financial news through topic modelling with Latent Dirichlet Allocation [9.1] 我々は、関連するテキストを特定するための財務ニュースの分析と、そのテキストの中で予測と予測に焦点を当てる。
本稿では、投資家が関連する金融事象を検出するのを支援するために、新たな自然言語処理(NLP)システムを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:49:34 GMT)
LatentEditor: Text Driven Local Editing of 3D Scenes [9.0] テキストプロンプトを用いたニューラルネットワークの精密かつ局所的な編集のためのフレームワークであるtextscLatentEditorを紹介する。
現実のシーンを潜伏空間に埋め込むことに成功したので、より高速で適応性の高いNeRFバックボーンが編集に役立ちます。
提案手法は既存の3D編集モデルと比較して高速な編集速度と出力品質を実現する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:01:27 GMT)
SKDF: A Simple Knowledge Distillation Framework for Distilling Open-Vocabulary Knowledge to Open-world Object Detector [9.0] 我々は、オープンワールドの知識を言語に依存しない検出器に蒸留することでOWODタスクのためのVLMモデルを特化する。
我々は,単純なtextbfknowledge蒸留法とOWODの自動擬似ラベル機構を組み合わせることで,未知の物体検出に優れた性能が得られることを観察した。
オープン世界の未知の物体を検知するオープンワールド検出器の能力を評価するための2つのベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:05:40 GMT)
MoEController: Instruction-based Arbitrary Image Manipulation with Mixture-of-Expert Controllers [8.8] 拡散モデルのテキスト誘導能力と異なる種類の人的指示とを一致させるため,MOE(Mix-of-expert)コントローラを用いた手法を提案する。
提案手法は,オープンドメイン画像や任意のヒューマンインストラクションを扱う場合,様々な画像操作タスクにおいて驚くほどよく機能する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 05:05:52 GMT)
Boosting Flow-based Generative Super-Resolution Models via Learned Prior [8.6] フローベース超解像(SR)モデルは、高品質な画像を生成する際に驚くべき能力を示した。
これらの手法は、グリッドアーティファクト、爆発する逆数、固定サンプリング温度による最適以下の結果など、画像生成中にいくつかの課題に遭遇する。
本研究では、フローベースSRモデルの推論フェーズ前に学習した条件を導入する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:56:05 GMT)
Targeted aspect-based emotion analysis to detect opportunities and precaution in financial Twitter messages [8.5] 同じツイートで、異なる株式市場資産の金銭的感情(肯定的、否定的な予測)を個別に識別できる新たなTABEA(Targeted Aspect-Based Emotion Analysis)システムを提案する。
自然言語処理(NLP)技術と機械学習ストリーミングアルゴリズムに基づいている。
ターゲットの感情、財務的機会、そしてTwitterの予防のために90%以上の精度を達成している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:46:25 GMT)
Detection of Temporality at Discourse Level on Financial News by Combining Natural Language Processing and Machine Learning [8.5] Bloomberg News、CNN Business、Forbesといった金融関連のニュースは、市場スクリーニングシステムにとって貴重なデータ源である。
談話レベルでの財務関連ニュースの時間性を検出する新しいシステムを提案する。
この分野の知識を持つ研究者によって注釈付けされた金融関連ニュースのラベル付きデータセットを用いて,本システムを検証した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:40:10 GMT)
Detection of Small Holes by the Scale-Invariant Robust Density-Aware Distance (RDAD) Filtration [8.1] 確率密度関数の高密度領域で囲まれた雑音や小さな穴を識別するために,新しいトポロジカル・データ解析法(TDA)を提案する。
ロバスト密度認識距離 (RDAD) フィルターと呼ばれる別の濾過法が提案され、高密度領域の小さな穴の永続性を延長する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:10:55 GMT)
RS-DPO: A Hybrid Rejection Sampling and Direct Preference Optimization Method for Alignment of Large Language Models [7.7] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデルとユーザの意図を結びつけるために広く採用されている。
DPOは、ポリシーモデルではなく、人間のアノテーションと代替LDMから生成される対照的な反応に依存している。
本稿では,サンプリングリジェクション(RS)とDPOを体系的に組み合わせることで,両課題に対処する。
提案手法は,資源環境が制限されたLLMを効果的に微調整し,ユーザ意図との整合性を向上する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:10:47 GMT)
An Examination of the Compositionality of Large Generative Vision-Language Models [7.6] GVLM(Generative Vision-Language Models)はマルチモーダル・インストラクション・チューニングによって構築されている。
本稿では,GVLMの構成性を評価するための評価指標(VisualGPTScoreなど)と現在のベンチマークについて検討する。
我々は,GVLMの言語的能力を利用して,現在のベンチマークにおける構文バイアスを同定する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:09:14 GMT)
DHR: Dual Features-Driven Hierarchical Rebalancing in Inter- and Intra-Class Regions for Weakly-Supervised Semantic Segmentation [7.5] 弱教師付きセマンティックセマンティックセマンティクス(WSS)は、限られたデータによる高品質セマンティクスを保証する。
WSSは、隣接する複数のクラスを持つイメージで見過ごされているため、マイナークラスに関連する課題に直面します。
まず、従来の手法ではなく、教師なしで弱い教師付き特徴写像を用いてこの問題に対処する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:35:31 GMT)
Noise-Aware Training of Layout-Aware Language Models [7.4] ドキュメントから名前付きエンティティを識別するカスタム抽出器をトレーニングするには、テキストとビジュアルのモダリティで注釈付けされたターゲットドキュメントタイプの多数のインスタンスが必要である。
本稿では,ノイズアウェアトレーニング手法,NATを提案する。
NATでトレーニングされたモデルは、パフォーマンスにおいて堅牢であるだけでなく、マクロF1スコアの点で、トランスファーラーニングベースラインを最大6%上回ります。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:06:34 GMT)
Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space [7.1] 既存の手法は、透かしの堅牢性と画質のジレンマに直面している。
潜時空間における透かしの注入と検出を両立させるための段階的学習戦略を備えた潜時透かし(LW)を提案する。
私たちのコードはGitHubで公開されます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:19:50 GMT)
Jetsons at FinNLP 2024: Towards Understanding the ESG Impact of a News Article using Transformer-based Models [7.0] 本稿では,Jetsonsチームによる多言語ESG影響時間推定タスクにおける様々なアプローチについて述べる。
共有タスクデータセットは、英語、フランス語、韓国語、日本語の2,059のニュースタイトルと記事で構成されている。
インパクト型分類タスクでは,XLM-RoBERTaモデルを英語で最初にランク付けしたカスタム微調整戦略を用いて微調整した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:58:44 GMT)
LLM-Resistant Math Word Problem Generation via Adversarial Attacks [6.9] 大型言語モデル(LLM)は教育の景観を大きく変えた。
現在の盗作検出ツールがLDMのペースを維持するのに苦労しているため、教育コミュニティは学生の真の問題解決能力を評価するという課題に直面している。
評価を目的とした質問の構造と難易度を保持する逆例を生成するが,LLMでは解けない。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 04:16:20 GMT)
Secret Keepers: The Impact of LLMs on Linguistic Markers of Personal Traits [6.9] 本研究では,Large Language Models (LLMs) が,人口動態や心理的特徴の言語マーカーに与える影響について検討する。
筆者らの個人的特徴に対する言語パターンの予測能力は, LLMの使用によってわずかに低下するが, 顕著な変化は稀である。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 06:49:17 GMT)
Controllable and Diverse Data Augmentation with Large Language Model for Low-Resource Open-Domain Dialogue Generation [6.7] LLMを用いたtextbfSummary-based textbfDialogue textbfAugmentationを提案する。
提案手法は,対話要約を計画ツールとして利用することにより,LCMの制御性を向上させる。
要約に基づいて、SDAは小さなシードデータセットであっても、高品質で多様な対話データを生成することができる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:28:51 GMT)
Contextual AI Journaling: Integrating LLM and Time Series Behavioral Sensing Technology to Promote Self-Reflection and Well-being using the MindScape App [6.5] MindScapeは、時系列の行動パターンをLarge Language Models (LLMs)と統合することの利点を研究することを目的としている。
我々は、LLMと行動センシングを用いて、自己回帰と感情発達を促進するために作られた、コンテキスト的かつパーソナライズされたジャーナリングプロンプトを生成するMindScapeコンテキストジャーナル「App Design」について論じる。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:01:34 GMT)
Automatic explanation of the classification of Spanish legal judgments in jurisdiction-dependent law categories with tree estimators [6.4] この研究は、自然言語処理(NLP)と機械学習(ML)を組み合わせて、法的テキストを説明可能な方法で分類するシステムに寄与する。
木構造決定経路の閾値分岐値と決定に関わる特徴を解析する。
法の専門家は我々の解決策を検証しており、この知識は「ループのエキスパート」辞書として説明のプロセスにも組み込まれている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:59:43 GMT)
Continual Learning for Autonomous Robots: A Prototype-based Approach [5.8] Continually Learning Prototypes (CLP)は、ロボットのための自律的な生涯学習のプロトタイプである。
CLPは新規性を検出し、監督なしで新しいアイテムを学習する。
CLPは、超低消費電力、リアルタイム処理能力、オンチップ学習を特徴とするニューロモルフィックハードウェアと互換性がある。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:54:35 GMT)
Subgraph Networks Based Contrastive Learning [5.7] グラフコントラスト学習(GCL)は、注釈付きデータ不足の問題を解決する。
既存のGCL手法の多くは、グラフ拡張戦略や相互情報推定操作の設計に重点を置いている。
サブグラフネットワークに基づくコントラスト学習(SGNCL)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:39:13 GMT)
Open Vocabulary Semantic Scene Sketch Understanding [5.6] フリーハンドシーンスケッチの機械的理解における未探索だが基本的な視覚問題について検討する。
本研究では,意味的に認識可能な特徴空間を実現するスケッチエンコーダを導入し,その性能を意味的スケッチセグメンテーションタスクでテストすることで評価する。
提案手法は,セグメンテーション結果のゼロショットCLIP画素精度を37ポイント上回り,FS-COCOスケッチデータセットの精度が85.5%に達した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:35:52 GMT)
Denoising Monte Carlo Renders With Diffusion Models [5.2] 物理的にベースとしたレンダリングはモンテカルロノイズを含み、ピクセル当たりの光の数が増えるにつれてばらつきが増す。
拡散モデルが低忠実度レンダリングをうまくデノベートできることが示される。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:19:40 GMT)
Cross-Modal Entity Matching for Visually Rich Documents [4.8] 視覚的にリッチなドキュメントは、視覚的な手がかりを使ってセマンティクスを強化します。
これらのドキュメントの構造化クエリを可能にする既存の作業は、これを考慮に入れない。
この制限に対処するクロスモーダルなエンティティマッチングフレームワークであるJunoを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 21:13:14 GMT)
Computation and Communication Efficient Lightweighting Vertical Federated Learning [4.7] 本稿では,LVFL(Lightweight Vertical Federated Learning)の概念について紹介する。
このアプローチには、特徴モデルの分離された軽量化戦略、計算効率の向上、および通信効率の向上のための機能埋め込みが含まれる。
画像分類データセット上でのアルゴリズムの評価により,LVFLは頑健な学習性能を維持しつつ,計算と通信の要求を大幅に軽減することがわかった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:19:28 GMT)
A Transformer approach for Electricity Price Forecasting [4.5] 本稿では、純粋なトランスフォーマーモデルを用いた電力価格予測(EPF)に対する新しいアプローチを提案する。
他の選択肢とは対照的に、アテンション機構と組み合わせて他のリカレントネットワークは使用されない。
その結果、トランスフォーマーモデルは従来の手法よりも優れており、信頼性と持続可能な電力系統運用のための有望なソリューションを提供することがわかった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:46:29 GMT)
Multi-Conditional Ranking with Large Language Models [4.4] 大規模言語モデルを用いて項目をランク付けすることは、レコメンデーションと検索システムにおいて一般的なアプローチとなっている。
しかし、現実のシナリオは、比較的小さな項目のセットをランク付けするなど、異なる課題を呈することが多い。
本稿では, 条件を抽出し, ソルティングし, 項目を反復的にランク付けする, 分割推論手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 01:26:05 GMT)
Towards minimizing efforts for Morphing Attacks -- Deep embeddings for morphing pair selection and improved Morphing Attack Detection [4.3] 顔埋め込みは、大規模なモルフィング攻撃生成のための画像の選択と、潜在的なモルフィング攻撃を検出する2つの目的がある。
顔の埋め込み類似性に基づいて個人をペアリングする事前選択アルゴリズムを用いる。
モーフィング・アタックを検出する能力の観点から、2つの最先端の顔認識システムからの埋め込みを比較した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:00:18 GMT)
Visualizing Routes with AI-Discovered Street-View Patterns [4.2] 本稿では,視覚的特徴の定量化にセマンティック潜在ベクトルを用いる手法を提案する。
街路ビュー画像の集合間の画像類似度を計算し,空間像パターンの探索を行う。
インタラクティブな可視化プロトタイプであるVivaRoutesを紹介し、これらのパターンで視覚化がどのように活用され、ユーザーが複数のルートを効果的かつインタラクティブに探索するのに役立つかを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:32:26 GMT)
Incentivizing News Consumption on Social Media Platforms Using Large Language Models and Realistic Bot Accounts [4.1] 本研究は,Twitter上での検証およびイデオロギー的にバランスの取れたニュースに対するユーザの露出とエンゲージメントを高める方法について検討する。
われわれは、スポーツ、エンターテイメント、ライフスタイルについてツイートするユーザーに対して、文脈対応で返信する28のボットを作った。
ロボットの性別による差分効果をテストするために、治療対象のユーザはランダムに、女性または男性として提示されたボットの応答を受信するように割り当てられた。
治療を受けたユーザーは、より多くのニュースアカウントをフォローし、女性のボット治療を受けたユーザーは、コントロールよりもニュースコンテンツを好む傾向にあった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:10:48 GMT)
A Likelihood Ratio Test of Genetic Relationship among Languages [3.9] そこで本研究では,単語リスト内の不変文字サイトの比率に基づいて,言語が関連しているかどうかを判定する確率比テストを提案する。
我々は,いくつかの言語族を評価し,提案したテストが偽陽性の問題を解くことを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:35:08 GMT)
TACO -- Twitter Arguments from COnversations [3.9] 引数マイニングは、情報と推論として表される議論の構造的要素を特定することを目的としている。
TACOは、200の会話全体をカバーする1,814のツイートを利用した、Twitter Argumentsの最初のデータセットです。
われわれのデータによると、Twitterユーザーはインフォームド推論や情報に関する議論をしがちだ。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:14:46 GMT)
Recursive Joint Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition [3.6] 本稿では,RJCMA(Recursive Joint Cross-Modal Attention)を導入し,音声,視覚,テキストの両モード間の相互関係を次元的感情認識のために捉える。
特に,共同音声・視覚・テキスト特徴表現と個々のモーダルの特徴表現との相互相関に基づく注目重みの計算を行う。
Affwild2データセット上で提案した核融合モデルの性能を評価するために大規模な実験を行った。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:14:03 GMT)
A Survey of using Large Language Models for Generating Infrastructure as Code [3.5] インフラストラクチャ・アズ・コード(Infrastructure as Code, IaC)は、業界で注目されている革新的なアプローチです。
この問題に対処するために,Large Language Models (LLM) の適用可能性について検討する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:57:55 GMT)
WaveMix: A Resource-efficient Neural Network for Image Analysis [3.5] WaveMixはリソース効率が高く、汎用的でスケーラブルです。
ネットワークは、最先端の畳み込みニューラルネットワークと同等またはより正確な精度を達成する。
WaveMixはCityscapesのセグメンテーションのための新しいベンチマークを確立する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:49:58 GMT)
Imaging a Chain of Rydberg Superatoms Enabled by Förster-Resonance-Enhanced Interaction [3.4] 我々は、個々のRydberg超原子の単発およびテキチンシチュー吸収イメージングを実証した。
3$mu$sの露光時間で、リドベルク超原子の線形鎖を1次元に励起することに成功した。
最小限の破壊力を持つこの手法は、量子計算や量子シミュレーションの応用において、アンサンブルに符号化された量子ビットを利用するのに大きな関心を持つだろう。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:56:03 GMT)
Leveraging Intelligent Recommender system as a first step resilience measure -- A data-driven supply chain disruption response framework [3.4] 本研究は、インテリジェントレコメンデータシステム技術に基づく、データ駆動型サプライチェーン破壊応答フレームワークを提案する。
結果から,本フレームワークは,第1の応答句において有効なSC破壊緩和尺度として実装可能であることが示された。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:07:02 GMT)
Learning Service Selection Decision Making Behaviors During Scientific Workflow Development [3.3] 本稿では、ワークフロー開発プロセスにおける次のサービスを推奨するために、コンテキスト対応の新しいアプローチを提案する。
次のサービスのレコメンデーションの問題は、次のワード予測にマップされます。
実単語リポジトリの実験では、このアプローチの有効性が実証されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:58:42 GMT)
A direct optimization algorithm for input-constrained MPC [3.1] この技術ノートは、入力制約付きMPC問題を考察し、その結果のボックス制約付きQPの構造を利用する。
提案アルゴリズムの反復回数はテキストのみに依存していることを示す。
提案アルゴリズムの実行時認証能力は,オープンループ不安定AFTI-16例を用いて理論的,数値的に検証する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:15:05 GMT)
Semi-supervised Predictive Clustering Trees for (Hierarchical) Multi-label Classification [2.7] 本稿では,予測クラスタリング木の半教師付き学習に基づく階層型マルチラベル分類手法を提案する。
また,この手法をアンサンブル学習に拡張し,ランダムな森林アプローチに基づく手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:55:26 GMT)
Leveraging Pre-trained and Transformer-derived Embeddings from EHRs to Characterize Heterogeneity Across Alzheimer's Disease and Related Dementias [2.7] アルツハイマー病は進行性の神経変性疾患であり、世界中で5000万人に影響を与える。
かなりの健康上の負担にもかかわらず、この病気に対する治療は限られており、その根本原因はよく分かっていない。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:11:34 GMT)
Grid Diffusion Models for Text-to-Video Generation [2.5] 既存のビデオ生成手法の多くは、時間次元を考慮した3D U-Netアーキテクチャまたは自己回帰生成を使用する。
アーキテクチャにおける時間次元を伴わないテキスト・ビデオ生成と大規模なテキスト・ビデオ・ペア・データセットのための,単純だが効果的な新しいグリッド拡散法を提案する。
提案手法は,定量評価と定性評価の両方において既存手法より優れている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:50:43 GMT)
A Deep Learning Method for Optimal Investment Under Relative Performance Criteria Among Heterogeneous Agents [2.3] グラフゲームは、重み付けされた相互作用グラフを通して相互作用する多くのプレイヤーとゲームを研究するために導入された。
本稿では,相対的な性能基準下での最適投資を目的としたグラフゲームに着目し,ディープラーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:29:01 GMT)
Accurate Cutting-point Estimation for Robotic Lychee Harvesting through Geometry-aware Learning [2.1] Fcaf3d-lycheeネットワークモデルを提案する。
自然環境におけるライチーピックポイントのポイントクラウドデータは、MicrosoftのAzure Kinect DKタイム・オブ・フライカメラを使用して取得される。
完全畳み込み型アンカーフリー3Dオブジェクト検出(Fcaf3d)モデルと圧縮励起(SE)モジュールを併用する。
トレーニングされたネットワークモデルは、ライチーピッキングの試験セットで評価され、88.57%という印象的なF1スコアを達成している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:34:54 GMT)
A Context-Sensitive, Outlier-Based Static Analysis to Find Kernel Race Conditions [2.0] 大きなコードベースでは、ロックが必ずしも明確でないフィールドにアクセスするための正確なルールがある。
フィールドアクセスのロック方法のルールを推論し,これらのルールに対してコードをチェックする,新しい静的手法を提案する。
我々はこの解析をLLIFで実装し、Linux v5.14.11で不正に保護されたフィールドアクセスを見つけるために評価した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:02:20 GMT)
Combined Static Analysis and Machine Learning Prediction for Application Debloating [2.0] 我々は静的保証付き予測デブロット(PDSG)の枠組みを開発する。
PDSGは、呼び出し元から発せられる動的な呼び出し元セットを予測し、誤った予測を解決するために、コールチェーンの静的不変量に基づいた軽量な監査を使用する。
SPEC CPU 2017において、同様の技術の中で最高のガジェット削減を実現し、平均して82.5%のガジェットを削減した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:14:17 GMT)
94% on CIFAR-10 in 3.29 Seconds on a Single GPU [2.0] CIFAR-10のトレーニング手法を導入し,3.29秒で94%,10.4秒で95%,46.3秒で96%の精度を実現した。
これらのトレーニング速度に寄与する要因の1つとして、水平反転増強のデランドマイズした変種を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:42:23 GMT)
Understanding the Transit Gap: A Comparative Study of On-Demand Bus Services and Urban Climate Resilience in South End, Charlotte, NC and Avondale, Chattanooga, TN [2.0] 都市デザインは持続可能性に大きな影響を及ぼし、特に公共交通機関の効率と二酸化炭素排出量の削減という文脈においてである。
本研究は, 南端, シャーロット, NC, 動的混在型都市デザインパターンを特徴とする2つの地区と, 郊外グリッドレイアウトを有するチャタヌーガ, アヴォンデールの2つの地区を探索する。
これらの異なる都市環境におけるバス利用の増加が交通とCO2排出量に与える影響を評価する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:25:21 GMT)
Cross-lingual Named Entity Corpus for Slavic Languages [1.9] この作業は、スラヴ自然言語処理ワークショップの一部として2017-2023年に行われた一連の共有タスクの結果である。
コーパスは、7つのトピックに関する5つの017文書から構成されており、その文書には5つの名前付きエンティティのクラスが注釈付けされている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:20:08 GMT)
Entanglement Swapping Using Hyperentangled Pairs of Two-Level Neutral Atoms [1.8] ハイパーエンタングルド・スワッピング(Hyperentangled swapping)は、ハイパーエンタングルド状態の交換を含む量子通信技術である。
我々は、原子ブラッグ回折の数学的枠組みを通じて、異なる中性原子対間のハイパーエンタングルメントスワップのスキーマを実証する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:46:13 GMT)
Augmenting NER Datasets with LLMs: Towards Automated and Refined Annotation [1.7] 本研究では,Large Language Models(LLMs)の能力と人間の努力を相乗化する,新しいハイブリッドアノテーション手法を提案する。
ラベルミキシング戦略を用いることで、LCMベースのアノテーションで遭遇するクラス不均衡の問題に対処する。
本研究は,LLMを活用してデータセットの品質を向上する可能性を照らし,クラス不均衡を緩和する新しい手法を導入し,高性能なNERを低コストで実現可能であることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:13:57 GMT)
From attention to profit: quantitative trading strategy based on transformer [1.6] この研究は2010年から2019年にかけて、中国資本市場における4,601株の5000,000以上の転がるデータを集めている。
市場感情情報とともに要因を確立するために,このモデルの革新的利用変換器は,取引信号の精度を著しく向上させることが示されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:18:00 GMT)
Classification of Short Segment Pediatric Heart Sounds Based on a Transformer-Based Convolutional Neural Network [1.6] 今回の研究では、RMSSDとZCRインジケータに適した信号を得るためには、0.4が理想的なしきい値であることが示されている。
短い信号(3sの心臓音)は、心臓音を正確に分類するのに十分な情報を持っておらず、長い信号(15sの心臓音)はより多くのノイズを含むことがある。
最も精度の高い93.69%の5s信号が得られ、心臓の音を識別する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:32:35 GMT)
Attention-based Shape-Deformation Networks for Artifact-Free Geometry Reconstruction of Lumbar Spine from MR Images [1.4] 腰椎の輪郭を再構築する新しい注意型深層学習手法であるTransDeformerを提案する。
また、誤り推定のためのTransDeformerの変種も提示する。
実験結果から,TransDeformerはアーチファクトフリーな幾何出力を生成し,その変種は再構成された幾何の誤差を予測する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:23:52 GMT)
Information Security and Privacy in the Digital World: Some Selected Topics [1.4] スパイラルで偽の情報を識別し、機密データのプライバシーを保護する上で、新たな課題に直面している。
この本は、コンピュータと通信における暗号とセキュリティの分野における最先端の研究成果をいくつか紹介する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:52:58 GMT)
TG-NAS: Leveraging Zero-Cost Proxies with Transformer and Graph Convolution Networks for Efficient Neural Architecture Search [1.3] TG-NASは、アーキテクチャのパフォーマンス予測のためのトレーニング不要プロキシを作成することを目的としている。
TG-NASはトランスフォーマーベースの演算子埋め込みジェネレータとグラフ畳み込みネットワーク(GCN)を利用してアーキテクチャ性能を予測する新しいモデルベースユニバーサルプロキシである。
TG-NASは従来のSOTA ZCプロキシ手法に比べて最大300倍の検索効率向上を実現している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:25:30 GMT)
Beyond One-Size-Fits-All: Multi-Domain, Multi-Task Framework for Embedding Model Selection [1.2] 本稿では,自然言語処理(NLP)タスクにおいて,最も効果的な埋め込みモデルの選択を支援するフレームワークを提案する。
プロプライエタリエンコーダモデルとオープンソースエンコーダモデルの台頭によって引き起こされる課題に対処する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 19:45:04 GMT)
CONCERT: Covariate-Elaborated Robust Local Information Transfer with Conditional Spike-and-Slab Prior [1.1] 本研究では,ローカル情報転送を堅牢にするための新しいベイズ変換学習手法"CONCERT"を提案する。
情報伝達のためのターゲットパラメータとソースパラメータの共分散には,新しい条件付きスパイク・アンド・スラブが導入された。
アルゴリズムをスケーラブルにするため,実装を容易にするために変分ベイズフレームワークを採用した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 07:32:58 GMT)
Classification and Clustering of Sentence-Level Embeddings of Scientific Articles Generated by Contrastive Learning [1.1] 提案手法は,科学論文から文レベルの埋め込みを生成するための微調整変換言語モデルで構成されている。
対照的な学習で3つのデータセットでモデルをトレーニングしました。
比較学習と下流タスクへの埋め込みを併用した微調整文変換器は,学術論文における文分類への実現可能なアプローチであることを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:52:14 GMT)
Exploring Unseen Environments with Robots using Large Language and Vision Models through a Procedurally Generated 3D Scene Representation [1.0] 本研究は,人間の認知を模倣して物体目標ナビゲーション問題を解決することに焦点を当てる。
対象の探索に慣れない環境を探索できる包括的フレームワークを提案する。
LLMを使ってハイレベルなサブゴールを生成する場合の課題は、ロボットの周囲の環境を効率的に表現することである。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:54:59 GMT)
Unlocking Criminal Hierarchies: A Survey, Experimental, and Comparative Exploration of Techniques for Identifying Leaders within Criminal Networks [0.8] 本稿では,犯罪ネットワーク内の犯罪指導者の識別に使用される手法とアルゴリズムを網羅的に分析する。
それぞれの技術について,その有効性,限界,改善の可能性,今後の展望について検討する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 21:46:48 GMT)
Evaluating Neighbor Explainability for Graph Neural Networks [0.8] この出版物は、ノードを分類するときに各GNNがどの程度重要かを決定する問題に対処する。
様々な説明可能性の手法を改良して近隣の重要度を高め, 4つの新しい指標を提示する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:49:19 GMT)
Interactive Multi-Robot Flocking with Gesture Responsiveness and Musical Accompaniment [0.8] この研究は魅力的なマルチロボットタスクを示し、その主な目的は熱意と関心を喚起することである。
このタスクでは、人間と一緒に動き、ダイナミックで表現力のあるロボット群に参加することが目標である。
この目的に向けて、研究チームはロボットの動きとジェスチャーや音といった対話モードを関連づけるアルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:16:28 GMT)
Ontology in Holonic Cooperative Manufacturing: A Solution to Share and Exchange the Knowledge [0.7] 共同作業ロボットは、共有作業環境において、人間の同僚と安全に操作することができる。
この協力の間、協調ロボットと作業員の間で大量の情報を交換する。
この情報は、生産要素と環境を記述する協調生産知識を構成する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:38:47 GMT)
Worker Robot Cooperation and Integration into the Manufacturing Workcell via the Holonic Control Architecture [0.7] 作業者とロボットとの協調製造は、製品部品や製造ツールなどの他の要素を含む。
製造管理システムは、これらの協調的な要素を1つの体で結合する手段である。
本稿では,協調型ワークセルの製造概念として,ホロニック制御アーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:44:17 GMT)
Right or Wrong -- Understanding How Novice Users Write Software Models [0.6] 本稿では, 初心者がアロイを学習しようとする場合, 97,000モデル以上のモデルについて実証的研究を行った。
本研究では,ユーザが将来使用するための総合的なベンチマークを作成するために,正しいモデルと間違ったモデルの両方を記述する方法を検討する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:45:40 GMT)
A Comprehensive Study on NLP Data Augmentation for Hate Speech Detection: Legacy Methods, BERT, and LLMs [0.6] 本研究は,確立されたレガシーアプローチと,大規模言語モデル(LLM)のような現代的プラクティスの両立を探求する。
本稿では,コンテキストコサイン類似度フィルタを用いたBERTベースのエンコーダモデルの最適化利用を提案する。
提案したBERTによる文脈コサイン類似度フィルタはラベル変更をわずか0.05%に低下させ,その効果を0.7%高いF1性能で証明した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:55:58 GMT)
Rapid post-disaster infrastructure damage characterisation enabled by remote sensing and deep learning technologies -- a tiered approach [0.5] 重要なインフラは戦争や大規模な自然災害で体系的に標的にされている。
複数スケールの損傷を総合的に特徴づける手法は存在しない。
本稿では,この能力ギャップを埋めるためのマルチスケール階層化手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:46:35 GMT)
Advancing Multimodal Data Fusion in Pain Recognition: A Strategy Leveraging Statistical Correlation and Human-Centered Perspectives [0.4] 本研究は、痛み認識領域内において、特定の行動認識のための異種データを統合することの課題に取り組む。
統計的相関を人間中心の手法と調和させる新しい手法を提案する。
私たちの貢献は、モダリティ融合と人間中心のコンピューティングアプリケーションに対する新たな洞察を提供することによって、痛み認識の分野を超えて拡張されます。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 11:13:18 GMT)
Deep Learning with Parametric Lenses [0.4] 本稿では、レンズ、パラメトリックマップ、および逆微分カテゴリの観点から機械学習アルゴリズムの分類的意味論を提案する。
この財団は強力な説明と統一の枠組みを提供する。
我々はPythonの実装でフレームワークの実用的重要性を実証する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:34:28 GMT)
Multi-Stage Fusion Architecture for Small-Drone Localization and Identification Using Passive RF and EO Imagery: A Case Study [0.2] 本研究では、受動無線周波数(RF)と電気光学(EO)画像データを用いた多段階融合アーキテクチャを開発する。
教師なしの深層学習に基づく手法と、教師なしの地上/後方分離手法を探索し、挑戦的な環境に対処する。
提案した融合アーキテクチャを検証し,その範囲で追跡性能を定量化する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 22:53:28 GMT)
A PPO-based DRL Auto-Tuning Nonlinear PID Drone Controller for Robust Autonomous Flights [0.0] 本プロジェクトは,従来の線形積分導関数(PID)コントローラの代替として,非線形ディープ強化学習(DRL)エージェントを実装することで,ドローンの飛行制御に革命をもたらすことを目的としている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:46:43 GMT)
X-LoRA: Mixture of Low-Rank Adapter Experts, a Flexible Framework for Large Language Models with Applications in Protein Mechanics and Molecular Design [0.0] 低ランク適応(LoRA)に基づくディープ・レイヤ・ワイド・トークン・レベル・アプローチを用いて、微調整された大規模言語モデルを作成するための専門家戦略の混合を報告する。
このデザインは、ニューラルネットワーク構築ブロックをさまざまな階層的な表現で再利用する、普遍性と多様性の生物学的原則にインスパイアされている。
我々は, バイオマテリアル分析, タンパク質力学, 設計に焦点をあてた, フォワード/逆解析タスク, 推論能力の強化など, 科学的能力を提供するX-LoRAモデルを開発した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 20:18:54 GMT)
Visually Evaluating Generative Adversarial Networks Using Itself under Multivariate Time Series [0.0] MTS 生成タスク下で GAN を視覚的に評価するための一般フレームワークである Gaussian GAN を提案する。
実験では,UniMiBデータセットを用いて,ガウスGANとチスカウレ視覚化を用いた正規性試験が有効で信頼性が高いことを示す実証的証拠を提供する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:49:29 GMT)
Video-Based Autism Detection with Deep Learning [0.0] 感覚刺激に反応する子供の映像クリップを解析する深層学習モデルを開発した。
以上の結果から,本モデルは子どもの運動における重要な違いを効果的に一般化し,理解していることが明らかとなった。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:38:44 GMT)
Uniqueness of steady states of Gorini-Kossakowski-Sudarshan-Lindblad equations: a simple proof [0.0] ゴリーニ-コサコフスキー-スダルシャン-リンドブラッド方程式の非平衡定常状態の特異性に対する十分条件の証明を示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 12:55:16 GMT)
Twisted charged particles in the uniform magnetic field with broken symmetry [0.0] 本稿では, 軌道角運動量(OAM)の非ゼロ射影を持つ荷電粒子を, ベクトルポテンシャルの対称性が破れた均一磁場中で理論的に記述する。
代数的な観点から非対称ハミルトニアンを解析し、ねじれ状態のOAM射影が対称性の破れによってどのように修正されるかを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:34:55 GMT)
Toward the application of XAI methods in EEG-based systems [0.0] 脳波信号の非定常性は、BCI分類システムにおける一般化性能の低下につながる可能性がある。
XAI法は、分類の目的のために、入力の関連する特性を特定し、変換することができる。
結果は、XAIメソッドで見つかる多くの関連コンポーネントがセッション間で共有され、より良い一般化が可能なシステムを構築するのに使用できることを示している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:56:26 GMT)
The quantum state of light in collective spontaneous emission [0.0] 集団自然放出は、複数の量子エミッターが共通の放射モードに崩壊する際に起こる。
我々は、放出中に量子相関が失われず、代わりに出力光に転送される条件で明らかにする。
本研究は, 連続可変型量子計算, 通信, センシングにおけるボソニック符号のための多光子量子光の生成と操作のための新しい経路を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:04:12 GMT)
TRABSA: Interpretable Sentiment Analysis of Tweets using Attention-based BiLSTM and Twitter-RoBERTa [0.0] 既存のモデルは言語的多様性、一般化可能性、説明可能性に関する課題に直面している。
本稿では,トランスフォーマーアーキテクチャ,アテンション機構,BiLSTMネットワークを統合したハイブリッドフレームワークTRABSAを提案する。
感情分析ベンチマークのギャップを埋め、最先端の精度を確保します。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:20:43 GMT)
Stochastic correction to the Maxwell-Bloch equations via the positive P-representation [0.0] 我々は,Jaynes-Cummings型のボソニック系とフェルミオン系に正のP表現を適用した。
我々は、非直交フェルミオン基底状態の選択において有利な自由度を特定する。
このアプローチは、光-物質相互作用の半古典的処理と場量子化処理の関連について検討する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 15:49:11 GMT)
Saturation effect in confined quantum systems with energy-dependent potentials [0.0] エネルギー依存ポテンシャルを持つ3つの量子モデルのエネルギーまたは質量スペクトルにおける飽和効果について検討する。
これらの系は、エネルギー依存効果を含むと飽和効果を示す可能性がある。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:50:44 GMT)
Safe and Robust Reinforcement Learning: Principles and Practice [0.0] 強化学習は比較的複雑なタスクの解決に顕著な成功を収めた。
現実のシナリオにおけるRLシステムのデプロイは、安全性と堅牢性に関する重大な課題を生じさせる。
本稿では, アルゴリズム, 倫理的, 実践的考察を含む安全で堅牢なRL景観の主次元について考察する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 10:07:21 GMT)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階の個人に対する最適な治療課題を個人の歴史に基づいて導く,最適な動的治療体制(DTR)の統計的学習について検討する。
逐次的無知を前提とした観測データを用いて最適なDTRを学習するためのステップワイド・ダブル・ロバスト手法を提案する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 02:33:39 GMT)
Optimizing Sparse Convolution on GPUs with CUDA for 3D Point Cloud Processing in Embedded Systems [0.0] 3次元の点雲は、三次元環境内の物の空間的な描写を提供する。
写真とは対照的に、点雲は空間性を示し、正規の格子を持たないため、異なる処理と計算上の問題を引き起こす。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 09:20:36 GMT)
Number of steady states of quantum evolutions [0.0] 境界は系の次元にのみ依存し、力学の詳細には依存しないことを示す。
マルコフ進化に関する最近のスペクトル予想から導かれる同様の境界との比較も提供される。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:12:09 GMT)
Noncommuting charges' effect on the thermalization of local observables [0.0] 近年の研究では、非交換電荷はいくつかの点で熱化を妨げるが、他の方法ではそれを促進することが示唆されている。
本研究では,非可換電荷が局所的な可観測物の数を減らし,熱化を促進することを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 14:40:06 GMT)
Keep your memory dump shut: Unveiling data leaks in password managers [0.0] この研究は、2ダースのパスワードマネージャ、12のデスクトップアプリケーション、12のブラウザベースのアプリケーションが、秘密の認証情報の秘密性を効果的に保護する能力を評価する。
これらのアプリケーションにはセンシティブな性質があるにもかかわらず、すべてのシナリオにおいて、3つのデスクトップPMアプリケーションと2つのブラウザプラグインだけがシステムメモリにパスワードを格納していないことを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:03:13 GMT)
Going Forward-Forward in Distributed Deep Learning [0.0] 本稿では,Geoffrey Hinton の Forward-Forward (FF) アルゴリズムを用いた分散ディープラーニングの新しい手法を提案する。
フォワードパスとバックパスに依存する従来の手法とは異なり、FFアルゴリズムはデュアルフォワードパス戦略を採用している。
本研究では,分散環境でのFFアルゴリズムの実装について検討し,ニューラルネットワークレイヤの並列トレーニングを容易にする能力に着目した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 16:02:53 GMT)
Extracting Manifold Information from Point Clouds [0.0] カーネルベースの手法は$mathbbRd$のサブセットのシグネチャ関数を構成するために提案される。
点雲の解析と解析が主な応用である。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 17:21:07 GMT)
Extending the self-discharge time of Dicke quantum batteries using molecular triplets [0.0] Dickeモデルに基づく量子電池の提案は、有機マイクロキャビティを用いて検討されている。
分子三重項状態を用いたDicke量子電池のエネルギー貯蔵寿命を延ばすための有望なアプローチを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 00:17:56 GMT)
Efficient Multi-branch Segmentation Network for Situation Awareness in Autonomous Navigation [0.0] この研究は、海上の港湾環境でUSVや無人航空機から視点を捉えたデータセットを構築した。
統計的解析により、海と空の分布と行の位置情報の間に高い相関が示された。
列位置符号化モジュール(RPEM)を用いた3分岐セマンティックセマンティックセマンティクスネットワークを提案し,海と空の間の予測精度を向上した。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 13:38:07 GMT)
Discrete Scale Invariance and $U(2)$ Family of Two-Body Contact Interactions in One Dimension [0.0] 1つの空間次元に非恒等粒子間の2体接触相互作用のU(2)$族が存在する。
対応する同一粒子問題とは対照的に、2体境界状態の幾何列を許容する2つの異なるチャネルが存在することを示す。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 08:00:00 GMT)
Configurable Safety Tuning of Language Models with Synthetic Preference Data [0.0] State-of-the-art language model fine-tuning techniqueは、事前に定義された振る舞いをモデルにハードコーディングすることで、ユーザー制御を制限する。
そこで我々は,DPOを合成選好データを用いて拡張する新しい手法であるSafety Tuningを提案する。
CSTはバニラDPOの制約を克服し、安全設定を指示するシステムを導入している。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 23:28:05 GMT)
ComplexityNet: Increasing LLM Inference Efficiency by Learning Task Complexity [0.0] 本稿では,タスクの複雑さを評価するために設計された言語モデルであるComplexityNetを紹介する。
私たちは、タスクの複雑さを定義するために、最初のラベルセットを作成しました。
ComplexityNetは、最も高い複雑性モデルを使用する場合と比較して、計算リソースの使用量を90%削減する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 03:01:42 GMT)
A new method for the solution of the two-body Dirac equation: Estimation of the weights of $C$, $P$ and $CP$ symmetry violating terms in positronium [0.0] ポジトロニウムの2体境界状態ディラック方程式の解法として新しい理論法を開発した。
2体のディラック・ハミルトン多様体は、四進数 4$ の大きさのエルミート行列形式で書けることが示されている。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 18:18:27 GMT)
A Natural Language Processing-Based Classification and Mode-Based Ranking of Musculoskeletal Disorder Risk Factors [0.0] 本研究は,NLP(Natural Language Processing)とモードベースランキングを併用して,筋骨格障害(MSD)のリスク要因を解明する。
目的は、集中した予防と治療のための理解、分類、優先順位付けを洗練することである。
8つのNLPモデルを評価し、事前訓練されたトランスフォーマー、コサイン類似性、距離メトリクスを組み合わせて、因子を個人、生体力学、職場、心理学、組織クラスに分類する。
論文参考訳(メタデータ) (Sat, 30 Mar 2024 21:14:37 GMT)