Logic Query of Thoughts: Guiding Large Language Models to Answer Complex Logic Queries with Knowledge Graphs [102.4] LGOT(Logic-Query-of-Thoughts)は知識グラフ推論と大規模言語モデルを組み合わせた最初の方法である。
実験の結果,ChatGPTよりも20%向上した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:14:10 GMT)
GeoGalactica: A Scientific Large Language Model in Geoscience [95.2] 大規模言語モデル(LLM)は、自然言語処理(NLP)における幅広いタスクを解く一般的な知識と能力で大きな成功を収めている。
我々は、LLMを地学に特化させ、さらに、地学の膨大なテキストでモデルを事前訓練し、また、カスタム収集した指導チューニングデータセットで得られたモデルを教師付き微調整(SFT)する。
我々はGeoGalacticaを65億のトークンを含む地球科学関連のテキストコーパスで訓練し、最大の地球科学固有のテキストコーパスとして保存する。
次に、100万対の命令チューニングでモデルを微調整する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:05:03 GMT)
Generative AI Agent for Next-Generation MIMO Design: Fundamentals, Challenges, and Vision [76.4] 次世代の多重入力多重出力(MIMO)はインテリジェントでスケーラブルであることが期待される。
本稿では、カスタマイズされた特殊コンテンツを生成することができる生成型AIエージェントの概念を提案する。
本稿では、生成AIエージェントをパフォーマンス分析に活用することの有効性を示す2つの説得力のあるケーススタディを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 02:39:36 GMT)
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation [73.6] 本稿では,確率分布を理解するための大規模言語モデルの能力について検討する。
LLMエージェントは,プログラムツールを用いても確率分布をサンプリングすることはできない。
分析の結果,LLMエージェントはプログラムツールを用いても確率分布をサンプリングできないことがわかった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 16:59:28 GMT)
NICEST: Noisy Label Correction and Training for Robust Scene Graph Generation [65.8] 我々は,SGG:NICESTのための新しいNoIsyラベルCorrEction and Sample Training戦略を提案する。
NICEはまずノイズのあるサンプルを検出し、さらに高品質な述語ラベルを割り当てる。
NICESTは任意のSGGアーキテクチャにシームレスに組み込んで、さまざまな述語カテゴリのパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:39:29 GMT)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.2] 本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:52:04 GMT)
BooookScore: A systematic exploration of book-length summarization in the era of LLMs [53.4] 我々は,識別されたエラータイプを一切含まない要約文の割合を計測する自動測度BooookScoreを開発した。
GPT-4 や 2 のようなクローズドソース LLM は,オープンソースモデルよりも BooookScore の高いサマリーを生成することがわかった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 22:02:23 GMT)
On the Relation between Internal Language Model and Sequence Discriminative Training for Neural Transducers [52.9] 内部言語モデル(ILM)のサブトラクションは、RNN-Transducerの性能向上に広く応用されている。
列識別訓練は, 理論的, 経験的両面からILMサブトラクションと強く相関していることを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:06:37 GMT)
Motion2VecSets: 4D Latent Vector Set Diffusion for Non-rigid Shape Reconstruction and Tracking [52.4] Motion2VecSetsは点雲列からの動的表面再構成のための4次元拡散モデルである。
グローバルな潜在符号の代わりに、潜在集合で4Dダイナミクスをパラメータ化する。
時間的コヒーレントな物体追跡のために、変形潜在集合を同期的に認知し、複数のフレーム間で情報を交換する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:23:21 GMT)
EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM [52.0] EIVENは暗黙的な属性値抽出のためのデータおよびパラメータ効率の良い生成フレームワークである。
本稿では,モデル混同を減らすための新しい学習・比較手法を提案する。
実験の結果,EIVENは暗黙的属性値の抽出において既存の手法よりも有意に優れていることがわかった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:15:56 GMT)
Adapting Fake News Detection to the Era of Large Language Models [48.6] 我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:52:01 GMT)
Voice Attribute Editing with Text Prompt [48.5] 本稿では,テキストプロンプトを用いた音声属性編集という新しい課題を紹介する。
目標は、テキストプロンプトに記述された動作に応じて、音声属性を相対的に修正することである。
この課題を解決するために,エンドツーエンド生成モデルであるVoxEditorを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 00:07:40 GMT)
PILOT: Legal Case Outcome Prediction with Case Law [43.7] 判例法を用いて判例結果の予測を行う際の2つのユニークな課題を同定する。
第一に、意思決定において裁判官の基本的な証拠となる関連する前例を特定することが重要である。
第二に、初期の事例は異なる法的文脈に従う可能性があるため、時間とともに法原則の進化を考慮する必要がある。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 01:59:17 GMT)
Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach [43.1] 本稿では,効率的な再帰的理解を実現するための新しいモデル ERU を提案する。
まず,履歴書中のセグメントをテキスト情報,視覚情報,レイアウト情報を統合して符号化するレイアウト対応マルチモーダル融合変換器を提案する。
次に、履歴書から構造化情報を取り出すために、多粒度シーケンスラベリングタスクでモデルを微調整する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:31:24 GMT)
CoLLaVO: Crayon Large Language and Vision mOdel [42.2] 現在のビジョン言語モデルが本当に品質の高いオブジェクトレベルの画像理解能力を持っているかどうかは、まだ解明されていない。
その結果,現在のVLMのイメージ理解能力は,視覚言語(VL)タスクにおけるゼロショット性能と強く相関していることが判明した。
オブジェクトレベルの画像理解を強化するために,Crayon Large Language and Vision mOdel (CoLLaVO)を提案する。
本稿では,視覚的指導指導中に,オブジェクトレベルのイメージ理解を忘れずに維持するためのDual QLoRAの学習戦略を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:11:44 GMT)
Ab-Initio Calculations of Nonlinear Susceptibility and Multi-Phonon Mixing Processes in a 2DEG-Piezoelectric Heterostructure [41.9] 固体弾性波フォノンは、幅広い量子情報応用のための有望なプラットフォームである。
圧電半導体ヘテロ構造を用いた汎用アーキテクチャを提案する。
このシステムでは, 強い3階非線形性により, 音響キャビティ内でのシングルフォノンKerrシフトが可能であることを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:54:08 GMT)
X-Eval: Generalizable Multi-aspect Text Evaluation via Augmented Instruction Tuning with Auxiliary Evaluation Aspects [32.5] X-Evalは、エンドユーザーがカスタマイズした視覚的側面と見えない側面の両方でテキストを評価するための2段階のインストラクションチューニングフレームワークである。
X-Evalは2つの学習段階から構成されており、モデルの性能を向上させるバニラ命令チューニング段階と、微粒化評価面間の接続を利用してテキスト品質を評価する拡張命令チューニング段階である。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:41:24 GMT)
Recent Advances in 3D Gaussian Splatting [31.4] 3次元ガウススプラッティングは、新規なビュー合成のレンダリング速度を大幅に高速化した。
3D Gaussian Splattingの明示的な表現は、動的再構成、幾何学的編集、物理シミュレーションなどの編集作業を容易にする。
本稿では,3次元再構成,3次元編集,その他の下流アプリケーションに大まかに分類できる最近の3次元ガウス散乱法について,文献的考察を行う。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:40:52 GMT)
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System [30.9] 過大評価問題は、強化学習(RL)に基づく対話政策において広く知られている問題である。
本稿では,基底真理最大作用値の動的部分平均推定器(DPAV)を提案する。
DPAVは、予測された最大アクション値と最小アクション値との間の部分平均を計算する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:51:55 GMT)
Smart Help: Strategic Opponent Modeling for Proactive and Adaptive Robot Assistance in Households [30.3] Smart Helpは、多様な障害を持つ人間のエージェントに対して、積極的にかつ適応的なサポートを提供することを目的としている。
本稿では,主エージェントの能力と目標の微妙な理解を提供する,イノベーティブな対戦相手モデリングモジュールを紹介する。
この結果から,AIを組み込んだ支援ロボットが,脆弱なグループの健康向上に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:03:59 GMT)
When and How: Learning Identifiable Latent States for Nonstationary Time Series Forecasting [30.0] 識別可能なlatEnt stAtes (IDEA) を学習し、分布シフトの発生を検知する。
さらに、定常状態と非定常状態とを十分な観測仮定で切り離して、潜在状態がどのように変化するかを学ぶ。
これらの理論に基づいて,自己回帰型隠れマルコフモデルを用いて潜伏環境を推定するIDEAモデルを考案した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 20:03:26 GMT)
Understanding Multimodal Deep Neural Networks: A Concept Selection View [29.1] 概念に基づくモデルは、ディープニューラルネットワークによって抽出されたブラックボックスの視覚表現を、人間の理解可能な概念のセットにマッピングする。
人間の先入観を導入することなくコア概念をマイニングするための2段階概念選択モデル(CSM)を提案する。
提案手法は,エンドツーエンドのブラックボックスモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:06:49 GMT)
Seeing Text in the Dark: Algorithm and Benchmark [28.9] そこで本研究では,暗黒領域におけるテキストのローカライズのための,効率的かつ効果的な単一ステージアプローチを提案する。
テキスト検出器の訓練段階において,制約付き学習モジュールを補助機構として導入する。
様々な場面や言語を含む任意の字形テキストのための包括的低照度データセットを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:07:10 GMT)
No Need to Lift a Finger Anymore? Assessing the Quality of Code Generation by ChatGPT [28.7] 本稿では,ChatGPTを用いたコード生成の質について検討する。
私たちは5つの言語(C、C++、Java、Python、JavaScript)で728のアルゴリズム問題と、コード生成タスクの54のコードシナリオを持つ18のCWEを活用しています。
この結果から,ChatGPTベースのコード生成に生じる潜在的な問題や限界が明らかになった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 04:58:47 GMT)
Segment Anything Model for Road Network Graph Extraction [27.8] 衛星画像から大規模でベクトル化された道路網グラフを抽出するためのSAM-Roadを提案する。
SAM-Roadは単純で単純で最小限の設計で、最先端のRNGDet++で同等の精度を実現している。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 01:19:39 GMT)
RoNID: New Intent Discovery with Generated-Reliable Labels and Cluster-friendly Representations [27.8] New Intent Discovery (NID)は、オープンワールドシナリオにおける新しい意図グループを特定することを目的としている。
現在の手法は、不正確な擬似ラベルと表現学習に問題がある。
本稿では,EMスタイルの手法により最適化されたロバスト・ニューインテント・ディスカバリー・フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:58:28 GMT)
Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment [26.9] 既存の3Dビジュアルグラウンドのアプローチでは、テキストクエリのバウンディングボックスアノテーションがかなり必要になります。
textbfVisual textbfLinguistic textbfAlignment に基づいたtextbf3Dビジュアルグラウンドの弱教師付きアプローチである textbf3D-VLA を提案する。
我々の3D-VLAは、テキストと2D画像間のセマンティクスの整合において、現在の大規模視覚言語モデル(VLM)の優れた能力を利用する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:51:33 GMT)
Evaluating Spatial Understanding of Large Language Models [26.4] 大規模言語モデルは、様々なタスクにまたがる顕著な能力を示している。
近年の研究では、LLM表現は基礎となる基礎概念の側面を暗黙的に捉えていることが示唆されている。
自然言語ナビゲーションタスクを設計し,空間構造を表現・推論するLLMの能力を評価する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 01:59:06 GMT)
Active Learning for Control-Oriented Identification of Nonlinear Systems [26.2] 本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:40:39 GMT)
MCPNet: An Interpretable Classifier via Multi-Level Concept Prototypes [24.3] 我々は、低レベルの特徴の意思決定プロセスに関する洞察が欠如している説明は、完全に忠実でも有用でもないと論じる。
本稿では,クラス認識概念分布(CCD)の損失を通じて,分類目的のマルチレベル概念のプロトタイプ分布を学習・調整する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:13:56 GMT)
Large Language Models for Mobile GUI Text Input Generation: An Empirical Study [24.3] 大規模言語モデル(LLM)は優れたテキスト生成機能を示している。
本稿では,UIページに対するAndroidテキスト入力生成における9つの最先端LCMの有効性を広範囲に検討する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:56:50 GMT)
Probing Large Language Models from A Human Behavioral Perspective [24.1] 大規模言語モデル(LLM)は、現代のNLPにおいて支配的な基礎モデルとして登場した。
フィードフォワードネットワーク (FFN) やマルチヘッド・セルフアテンション (MHSA) などの予測プロセスや内部メカニズムの理解はいまだに未解明のままである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:22:39 GMT)
Rethinking Channel Dependence for Multivariate Time Series Forecasting: Learning from Leading Indicators [23.5] 本稿では,まず,各段階における先行指標とその先行ステップを効率的に推定するLIFTという新しい手法を提案する。
LIFTは任意の時系列予測メソッドとシームレスに協調できるプラグインとして機能する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 04:26:56 GMT)
CodeCloak: A Method for Evaluating and Mitigating Code Leakage by LLM Code Assistants [23.5] LLMベースのコードアシスタントを使用する場合、コード漏洩のリスクを軽減するための2つの補完手法を提案する。
1つ目は、コードアシスタントサービスに送信されたコードセグメントから、開発者のオリジナルを再構築するテクニックである。
2つ目は、コードアシスタントサービスに送信する前にプロンプトを操作する、新しいディープ強化学習エージェントであるCodeCloakである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 19:30:58 GMT)
Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery [23.4] Generalized Class Discovery (GCD) はラベルを非ラベルデータに動的に割り当てることを目的としている。
本稿では,学習可能な潜在的なプロトタイプを導入し,クラスタプロトタイプを拡張する適応型探索機構を提案する。
我々の手法は、最も近い競争相手をかなりの差で上回っている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:41:40 GMT)
MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts [22.6] 本稿では,MING-MOE(Mixture-of-Expert)をベースとした医療用大規模言語モデルを提案する。
タスク固有のアノテーションを必要とせずに、多種多様な複雑な医療タスクを管理するように設計されている。
20以上の医療タスクで最先端(SOTA)のパフォーマンスを達成し、既存のモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:28:52 GMT)
Nonstationary Reinforcement Learning with Linear Function Approximation [19.5] ドリフト環境下での線形関数近似によるマルコフ決定過程(MDP)における強化学習について考察する。
まず、周期的再起動を伴う最小二乗値の楽観的な修正を開発し、変動予算が分かっている場合にその動的後悔を束縛する。
非定常線型 MDP に対する最初の minimax dynamic regret lower bound を導出し、副生成物として Jin らによって未解決の線型 MDP に対する minimax regret lower bound を定めている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 06:52:10 GMT)
ComCLIP: Training-Free Compositional Image and Text Matching [19.4] コントラスト言語-画像事前訓練は画像とテキストのマッチングに優れたゼロショット性能を示した。
我々は新しいtextbftextittraining-free compositional CLIP model (ComCLIP) を提案する。
ComCLIPは、入力された画像を被写体、オブジェクト、アクションのサブイメージに切り離し、CLIPのビジョンエンコーダとテキストエンコーダを構成して、合成テキスト埋め込みとサブイメージ埋め込みに対する進化的なマッチングを実行する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 00:14:03 GMT)
WikiSplit++: Easy Data Refinement for Split and Rephrase [19.1] Split と Rephrase は複雑な文を同じ意味を持つ複数の単純文に分割する。
我々は、WikiSplitのインスタンスを削除してWikiSplit++を作成し、複雑な文は、より単純な文の少なくとも1つを含まない。
本手法は,幻覚測定の指標である分割数とエンテーメント比において有意な利得を得た。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:07:32 GMT)
UAV-Rain1k: A Benchmark for Raindrop Removal from UAV Aerial Imagery [19.0] UAVのレンズに付着した雨滴は、背景の視認性を阻害し、画質を低下させる。
まず,UAV画像から雨滴を除去するUAV-Rain1kというベンチマークデータセットを構築した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:56:11 GMT)
On the Computational Complexity of Private High-dimensional Model Selection [19.0] プライバシー制約下での高次元疎線形回帰におけるモデル選択の問題点を考察する。
そこで本研究では,よく知られた指数モデルを用いて,高い効用性を有する微分プライベートなベストサブセット選択法を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:32:26 GMT)
Is Next Token Prediction Sufficient for GPT? Exploration on Code Logic Comprehension [18.9] 我々は、先進的な事前訓練タスク「Next Token Prediction+」を提案する。
この事前トレーニングに続いて、コードドメイン事前トレーニングモデルであるCode LlamaとStarCoderの両方が、論理的に等価なコード選択タスクとコード補完タスクに大幅に改善されている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:11:07 GMT)
Reformulating Sequential Recommendation: Learning Dynamic User Interest with Content-enriched Language Modeling [18.3] 本稿では、事前学習した言語モデルの意味理解機能を活用してパーソナライズされたレコメンデーションを生成するLANCERを提案する。
我々のアプローチは、言語モデルとレコメンデーションシステムの間のギャップを埋め、より人間的なレコメンデーションを生み出します。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 16:32:33 GMT)
Countering Mainstream Bias via End-to-End Adaptive Local Learning [17.8] CF(Collaborative Filtering)ベースのレコメンデーションは、主流のバイアスに悩まされる。
主流ユーザとニッチユーザの両方に高品質なレコメンデーションを提供するために,新しいエンドツーエンド適応型ローカル学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:17:33 GMT)
Objects With Lighting: A Real-World Dataset for Evaluating Reconstruction and Rendering for Object Relighting [16.9] 写真からオブジェクトを再構成し、仮想的に新しい環境に配置することは、標準的な新しいビュー合成タスクを超えます。
この研究は、リライトのためのオブジェクトの再構築とレンダリングを測定するための実世界のデータセットを提供する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 16:43:01 GMT)
Toward Informal Language Processing: Knowledge of Slang in Large Language Models [16.4] 我々は,スラングの自動処理に関連するタスクセットの評価を支援するデータセットを構築した。
評価と微調整の両面で,2つのコアアプリケーションにおけるデータセットの有効性を示す。
GPT-4のようなLCMはゼロショット設定で優れた性能を発揮するが、我々のデータセットで微調整された小さなBERTのようなモデルは同等の性能を得る。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 02:17:01 GMT)
SmartPathfinder: Pushing the Limits of Heuristic Solutions for Vehicle Routing Problem with Drones Using Reinforcement Learning [14.4] Vehicle Problem with Drones (VRPD)は、トラックとドローンの両方のルーティングパスを最適化しようとしている。
我々は、VRPDの解決、蒸留、およびコア要素への標準化のために設計された手法を網羅的に検討する。
次に、ソリューションコンポーネントとシームレスに統合された、新しい強化学習フレームワークを開発します。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 19:10:54 GMT)
LoopGaussian: Creating 3D Cinemagraph with Multi-view Images via Eulerian Motion Field [13.8] シネマグラフ(Cinemagraph)は、静止画と微妙な動きの要素を組み合わせた視覚メディアの一種である。
本稿では,3次元ガウスモデルを用いて,2次元画像空間から3次元空間への撮影画像の高次化を提案する。
実験の結果,提案手法の有効性を検証し,高品質で視覚的に魅力的なシーン生成を実証した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:07:53 GMT)
PM2: A New Prompting Multi-modal Model Paradigm for Few-shot Medical Image Classification [12.6] 本稿では,PM2と呼ばれるマルチモーダル基盤モデルに基づく医用画像分類のための新しいマルチモーダルモデルパラダイムを提案する。
画像のモダリティに加えて、PM2はプロンプトとして知られる別の補足的なテキスト入力を導入し、対応する画像や概念クラスを記述している。
我々のPM2は、プロンプトスキームによらず、かなり優れており、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:27:06 GMT)
On Speculative Decoding for Multimodal Large Language Models [11.2] MLLM(Multimodal Large Language Models)による推論は,大規模な言語モデルのバックボーンのため遅い。
言語のみのモデルがLLaVA 7Bを用いて投機的復号化のための優れたドラフトモデルとして機能することを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 00:02:36 GMT)
Multi-scale Attention Network for Single Image Super-Resolution [10.7] ConvNetsは、より大きな受容場を利用することで、高いレベルのタスクでトランスフォーマーと競合することができる。
本稿では,従来のマルチスケール機構と新たなカーネルアテンションを結合したマルチスケールアテンションネットワーク(MAN)を提案する。
我々のMANはSwinIRと同等に動作し、最先端のパフォーマンスと計算とのトレードオフを多種多様なものにすることができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:36:29 GMT)
LIGHTCODE: Light Analytical and Neural Codes for Channels with Feedback [10.6] 我々は,通信システムに適した低複雑さの符号化方式を設計することに注力する。
まず,Schalkwijk-Kailath (SK) および Gallager-Nakiboglu (GN) スキームにインスパイアされた解析的符号化スキームである POWERBLAST が,SK および GN スキームに対して顕著な信頼性向上を実現していることを示す。
次に、低SNR領域の信頼性を高めるために、メモリと計算の一部を使用しながら最先端の信頼性を実現する軽量ニューラルネットワークであるLIGHTCODEを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 20:09:41 GMT)
Meply: A Large-scale Dataset and Baseline Evaluations for Metastatic Perirectal Lymph Node Detection and Segmentation [10.3] 今回,Meply という大規模な直腸転移性リンパ節CT画像データセットを初めて紹介した。
本稿では,新しいリンパ節分節モデルであるCoSAMを紹介する。
CoSAMは、直腸癌における転移性リンパ節の分節を誘導する配列に基づく検出を利用する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:30:16 GMT)
Stability and Generalization in Free Adversarial Training [9.8] 本稿では,アルゴリズム的安定性フレームワークを用いた対向学習手法の一般化性能について検討する。
証明された一般化境界は, 自由対数学習法が, トレーニングとテストサンプル間の一般化ギャップを低くすることができることを示している。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:07:20 GMT)
Shifting Spotlight for Co-supervision: A Simple yet Efficient Single-branch Network to See Through Camouflage [9.7] Co-Supervised Spotlight Shifting Network (CS$3$Net)は、コンパクトだが効率的なシングルブランチネットワークである。
私たちの研究は、シフトするスポットライトの下で動物のカモフラージュが容易に明らかにできるという効果を再現しています。
効率のよいCODモデルと比較して、MAC(Multiply-Accumulate)操作を32.13%削減する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:10:33 GMT)
The Method of Detecting Flying Birds in Surveillance Video Based on Their Characteristics [9.6] 本稿では,Surveillance Video(FBOD-SV)におけるFlying Bird Object Detection法を提案する。
新しい特徴集約モジュールである相関注意特徴集約(Co-Attention-FA)モジュールは、飛行する鳥の物体の特徴を集約するように設計されている。
ダウンサンプリングとアップサンプリングを併用したフライングバードオブジェクト検出ネットワーク(FBOD-Net)が設計されている。
また,SimOTA動的ラベル割り当て手法をワンカテゴリオブジェクト検出に適用した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:56:09 GMT)
Fidelity of Wormhole Teleportation in Finite-qubit Systems [9.3] ホログラフィーの双対性は、重力と時空が強く相互作用する系から現れることを記述し、重力物理学の実験的な研究のための自然な道のりを提供する。
顕著な例はワームホールテレポーテーションプロトコルによるワームホールのシミュレーションである。
我々は、$N$-qubitシステムにおけるワームホールテレポーテーションの忠実度を計算するための理論的枠組みを開発する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:03:11 GMT)
Towards Enhancing Health Coaching Dialogue in Low-Resource Settings [9.2] 患者と会話し,特定の目標を創り,達成し,共感をもって感情に対処する対話システムを構築することを提案する。
我々は, より共感的で, 流動的で, 一貫性のある応答を生成し, アノテーションを必要とせずとも, NLUタスクにおける最先端のタスクに優れることを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:23:15 GMT)
Early detection of disease outbreaks and non-outbreaks using incidence data [9.2] 我々は、アウトブレイクやアウトブレイクを正確に予測する、現実世界のトレーニングデータを持たない一般的なモデルを開発する。
アウトブレイクとアウトブレイクを区別する統計的特徴は,アウトブレイクが起こるずっと前から存在する。
人工的なデータセットと実世界のデータセットの違いは、発生のずっと前に検出できる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:57:14 GMT)
A Mathematical Theory for Learning Semantic Languages by Abstract Learners [9.1] 大規模言語モデルの最近の進歩は、システムパラメータの数とトレーニングデータのサイズが一定の閾値を超えると、能力(学習スキル)が出現することを示した。
我々は、学習(または訓練)過程を考慮して、学習スキルの出現を説明する数学的理論を開発する。
本稿ではセマンティック圧縮の手法を提案し,そのセマンティックコミュニケーションへの応用について論じる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 06:43:47 GMT)
Systematic Assessment of Tabular Data Synthesis Algorithms [9.1] データ合成アルゴリズムを評価するための体系的評価フレームワークを提案する。
それらの制限に対処するために、フィリティ、プライバシ、ユーティリティの観点から、一連の新しいメトリクスを導入します。
また,提案手法に基づいて,合成データの質を継続的に向上する,チューニングのための統一的な目標も考案した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:11:56 GMT)
Topology-induced symmetry breaking: a demonstration in antiferromagnetic magnons on a Möbius strip [8.9] 非自明な境界条件により、ハミルトニアンによって保存された特定の局所対称性が励起固有状態で破られるような位相誘起対称性の破れのメカニズムを提案する。
実演として、2つの反強磁性結合スピン鎖からなるM"ビス帯上のマグノン励起について検討した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:19:32 GMT)
Large Transformers are Better EEG Learners [8.9] AdaCT - 時系列データを2次元の擬似画像やテキスト形式に変換するためのプラグアンドプレイアダプタ。
AdaCTIは、マルチチャネルまたは長さの単一チャネル時系列データを擬似画像に変換して、微調整された事前学習された視覚変換を行う。
AdaCT-Tは、短い単一チャネルデータをテキストに変換し、訓練済み言語変換器を微調整する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:11:03 GMT)
Lower bounds on bipartite entanglement in noisy graph states [8.6] 我々は、初期量子ビットがCZ演算の適用前に非偏極雑音を受けるノイズモデルを考える。
任意の量の(最大でない)偏極ノイズに対して厳密な正のコヒーレント情報を保持するグラフ状態の族を見つける。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:01:45 GMT)
Mixture of Experts Soften the Curse of Dimensionality in Operator Learning [8.4] 我々は,専門的ニューラル演算子のネットワーク上に分散した関数空間間のニューラル演算子(MoNO)の混合を構成する。
L2,[0,1]d)$空間の間の任意のリプシッツ非線型作用素がソボレフ単位球上で、与えられた任意の$varepsilon>0$精度に対して等しく近似できることを保証するテキスト分散普遍近似定理である。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 23:20:16 GMT)
Multimodal Cross-Document Event Coreference Resolution Using Linear Semantic Transfer and Mixed-Modality Ensembles [8.2] イベントコア参照解決(英: Event coreference resolution、ECR)とは、イベントの別個の参照が、実際に同じ基礎となる発生にリンクされているかどうかを決定するタスクである。
本稿では,視覚モデルと言語モデル間の単純な線形写像と,視覚的およびテキスト的手がかりを統合したマルチモーダル・クロスドキュメント・イベント・コア参照分解法を提案する。
本研究は,ECRにおけるマルチモーダル情報の有用性を示すものである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 10:01:58 GMT)
NeurIT: Pushing the Limit of Neural Inertial Tracking for Indoor Robotic IoT [7.7] 慣性トラッキングは、ロボットIoTにとって不可欠であり、低コストの慣性計測ユニット(IMU)とディープラーニングによるトラッキングアルゴリズムのおかげで人気を博している。
我々は,追跡精度を新たなレベルに高めるシーケンス・ツー・シーケンス・フレームワークNeurITを紹介する。
NeurITはコアにTF-BRT(Time-Frequency Block-Recurrent Transformer)を採用し、リカレントニューラルネットワーク(RNN)とTransformerのパワーを組み合わせて、時間領域と周波数領域の両方で代表的な特徴を学習する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:24:50 GMT)
A Parametric Rate-Distortion Model for Video Transcoding [7.2] パラメトリックレート歪み(R-D)トランスコーダモデルを提案する。
ビデオのエンコーディングを必要とせず,様々な速度で歪みを予測できるモデルを開発した。
トランスサイズにより視覚的品質改善(PSNR)を達成するために使用できる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:37:57 GMT)
On the best approximation by finite Gaussian mixtures [7.1] 一般ガウス位置混合を有限混合で近似する問題を考える。
所定の精度を達成する有限混合の最小順序は定数係数で決定される。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 06:57:44 GMT)
PraFFL: A Preference-Aware Scheme in Fair Federated Learning [6.7] フェアフェデレーション学習パラダイム(PrafFL)における優先度認識方式を提案する。
PraFFLは、ニーズを満たすために、各クライアントの好みに基づいてモデルを適応的に調整することができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:40:05 GMT)
Content-based Controls For Music Large Language Modeling [6.2] Coco-Mullaは、音楽大言語モデリングのためのコンテンツベースの制御方法である。
トランスフォーマーベースのオーディオモデルに適したパラメータ効率細調整法(PEFT)を用いる。
提案手法は,低リソース半教師付き学習による高品質な音楽生成を実現する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 20:19:46 GMT)
Tackling Structural Hallucination in Image Translation with Local Diffusion [5.1] 本稿では,複数の局所拡散プロセスによる幻覚を緩和する学習自由拡散フレームワークを提案する。
本手法は,実世界の医療・自然画像データセットの40%と25%の誤診を減らし,ベースラインモデルに対する幻覚を定量的かつ質的に緩和する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 18:10:00 GMT)
Airship Formations for Animal Motion Capture and Behavior Analysis [4.9] 複数の角度から野生の馬を追跡し、追跡し、視覚的に記録するために、飛行船の形成を使用するように設計されたシステムを紹介します。
本研究では,複数の角度から野生の馬を追跡し,追跡し,視覚的に記録するための飛行船形成システムを紹介する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:18:19 GMT)
When are Lemons Purple? The Concept Association Bias of Vision-Language Models [4.9] 概念アソシエーションバイアス(CAB)と呼ばれる視覚言語モデルの興味深い現象を報告する。
CABのモデルは、入力を概念の袋として扱い、他の欠落した概念をクロスモーダルに埋めようとする傾向にある。
CABは、自己回帰的損失を併用しても、対照的な損失で訓練された視覚言語モデルで一般的である。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:02:25 GMT)
No Easy Way Out: the Effectiveness of Deplatforming an Extremist Forum to Suppress Hate and Harassment [4.8] オンラインハラスメントやハラスメントを抑えるために、アクティブなコミュニティを非プラットフォーム化することは困難である。
ケーススタディでは、2022年後半に最大で最長のハラスメントフォーラム「キウイ・ファームズ」が中断された。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 22:45:12 GMT)
ChangeAnywhere: Sample Generation for Remote Sensing Change Detection via Semantic Latent Diffusion Model [4.7] ChangeAnywhereはセマンティック潜伏拡散モデルと単一時間画像を用いた新しいCDサンプル生成手法である。
ChangeAnywhereは2つのCDサンプルをキャプチャする。つまり、変更は意味的に異なることを意味し、非変更は同じ意味的制約の下で合理的な変更を意味する。
ChangeAnywhere-100Kは、さまざまなディープラーニングベースのCDモデルのための2つのCDベンチマークデータセットにおいて、ゼロショットと少数ショットの両方のパフォーマンスを著しく改善した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:46:35 GMT)
DeDoDe v2: Analyzing and Improving the DeDoDe Keypoint Detector [4.6] 我々は最近提案されたDeDoDeキーポイント検出器の解析と改良を行った。
まず、DeDoDeキーポイントが一緒にクラスタ化される傾向があることに気付きます。
第2に、データ拡張に関する問題に対処する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:36:13 GMT)
Trustworthy Multimodal Fusion for Sentiment Analysis in Ordinal Sentiment Space [4.6] マルチモーダルビデオ感情分析は、話者の意見や態度を分析するために複数のモーダル情報を統合することを目的としている。
以前のアプローチでは、異なるモダリティを平等に扱うことができ、主に異なる貢献を無視している。
本稿では,TMSON(Multimodal sentiment Ordinal Network)を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:15:57 GMT)
MaSkel: A Model for Human Whole-body X-rays Generation from Human Masking Images [4.5] マスク画像から2次元の人体X線を直接生成することを提案する。
予測された画像は、同じイメージスタイルと解剖学的構造を持つ実際のものに似ている。
高度な生成技術を活用することで、我々のモデルMaSkelは、人間のマスク画像から高品質なX線画像を生成することができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:03:19 GMT)
Three Disclaimers for Safe Disclosure: A Cardwriter for Reporting the Use of Generative AI in Writing Process [4.4] 『カードライター』は、執筆過程における生成AIの使用を宣言する短い報告書を執筆者に向けて作成する。
デモはhttps://cardwriter.vercel.app.comで公開されている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 16:55:50 GMT)
Getting Bored of Cyberwar: Exploring the Role of Low-level Cybercrime Actors in the Russia-Ukraine Conflict [4.1] 我々は、この2つの国に言及したHackフォーラムで、358kウェブサイトの偽装攻撃、1.7M UDP DDoS攻撃、1764のユーザーによる1764の投稿を分析した。
この論争は短期間ではあるが、低レベルのサイバー犯罪俳優たちの注目を集めた。
現在進行中のハイブリッド戦争におけるこれらのプレイヤーの役割はマイナーであり、国家が支援する作戦において、永続的で動機づけられた「ハックティビスト」から分離されるべきである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 22:42:17 GMT)
Bullion: A Column Store for Machine Learning [4.1] Bullionは、機械学習ワークロードに適した列指向ストレージシステムである。
データコンプライアンスの複雑さに対処し、長いシーケンススパース機能の符号化を最適化し、拡張可能なプロジェクションを効率的に管理し、ストレージに機能量子化を導入する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:01:54 GMT)
A Specific Task-oriented Semantic Image Communication System for substation patrol inspection [3.5] Imag-STSCIのための特定のタスク指向セマンティック通信システムは、弱い信号の下でインテリジェントロボットがより鮮明な画像を得るように設計されている。
このようなサブステーションパトロール検査作業において,画像の特定の詳細しか必要としない点に着想を得て,セマンティックエンハンスメントの新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:20:03 GMT)
An evaluation framework for synthetic data generation models [3.4] 高品質な合成データを開発するための合成データ生成モデルの能力を評価するための新しいフレームワークを提案する。
2つのユースケースシナリオは、合成データ生成モデルが高品質なデータを生成する能力を評価するための提案フレームワークの適用性を示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 01:16:45 GMT)
Adapting Mental Health Prediction Tasks for Cross-lingual Learning via Meta-Training and In-context Learning with Large Language Model [3.4] モデルに依存しないメタラーニングと,このギャップに対処するために大規模言語モデル(LLM)を活用する。
まず,自己超越型メタラーニングモデルを適用し,迅速な適応と言語間移動のためのモデル初期化を改良する。
並行して、LLMのインコンテキスト学習機能を用いて、スワヒリのメンタルヘルス予測タスクにおけるパフォーマンスの精度を評価する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:11:35 GMT)
Optimized Dynamic Mode Decomposition for Reconstruction and Forecasting of Atmospheric Chemistry Data [3.1] 適応的かつ効率的な縮小順序モデルと予測ツールを構築するために最適化された動的モード分解を導入する。
DMDアルゴリズムは,夏季の大気汚染やバイオマス燃焼など,大気化学の既知の特徴を抽出することに成功した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:44:12 GMT)
Audio is all in one: speech-driven gesture synthetics using WavLM pre-trained model [2.8] diffmotion-v2は、WavLM事前学習モデルを用いた音声条件拡散に基づく生成モデルである。
生音声のみを使用して、個人的でスタイリングされたフルボディの音声合成ジェスチャを生成することができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:22:53 GMT)
Introducing Super RAGs in Mistral 8x7B-v1 [2.6] Super Retrieval-Augmented Generation (Super RAGs)は、大規模言語モデル(LLM)の性能を高めるために設計された新しいアプローチである。
本稿では,8x7B v1へのスーパーRAGの統合について述べるとともに,精度,速度,ユーザ満足度の改善について検討する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:33:00 GMT)
Observation of a time crystal comb in a driven-dissipative system with Rydberg gas [2.5] 時間結晶は、時間翻訳対称性を破る安定かつ周期的な挙動を示す。
オープン量子系では、散逸する多体相互作用により、前例のない方法で時間結晶秩序を発達させることができる。
本稿では, 連続駆動型, 強く相互作用するRydberg熱ガス中の時間結晶コムの観察について報告する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 07:33:35 GMT)
GauU-Scene V2: Assessing the Reliability of Image-Based Metrics with Expansive Lidar Image Dataset Using 3DGS and NeRF [2.5] 本稿では,新しい3次元表現手法を用いたマルチモーダルな大規模シーン再構築ベンチマークを提案する。
GauU-Sceneは6.5平方キロメートル以上をカバーし、LiDARの地上真実と組み合わせた総合的なRGBデータセットを備えている。
ドローンによるデータセットのためのLiDARおよび画像アライメント手法を最初に提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 08:53:28 GMT)
Improving Personalisation in Valence and Arousal Prediction using Data Augmentation [2.4] 本稿では、データ拡張を利用したパーソナライズ戦略の強化について述べる。
提案手法であるDWA(Distance Weighting Augmentation)では,対象者のデータセットを拡大する重み付けに基づく拡張手法を採用している。
MuSe-Personalisation 2023 Challengeデータセットの実験結果から,提案手法は特徴セットの性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 16:57:37 GMT)
Pirates: Anonymous Group Calls Over Fully Untrusted Infrastructure [2.4] Piratesは、通信不能という強力な匿名性を保証する最初のグループボイスコールプロトコルである。
単一のサーバを持つPiratesは、11人の同時ユーザから3人のグループメンバによるグループコールをサポートし、365ms未満のレイテンシを持つことを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 22:39:07 GMT)
Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification [1.9] Deep Active Learning (AL)は、ディープニューラルネットワークのトレーニングに要するアノテーションコストを最小限にすることを目指している。
Fisher Informationをベースにした最近提案されたAL戦略であるBAITは、さまざまなデータセットで素晴らしいパフォーマンスを示している。
本稿では,BAITの計算効率とスケーラビリティを向上する2つの手法を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:09:37 GMT)
Deep Reinforcement Learning based Online Scheduling Policy for Deep Neural Network Multi-Tenant Multi-Accelerator Systems [1.8] 本稿では,マルチテナント環境におけるDNNのオンラインスケジューリングを目的とした低オーバーヘッド深層強化学習アルゴリズムRELMASを提案する。
ヘテロジニアス多加速器システムへのRELMASの適用により、SLAの満足度は最大で173%向上した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 10:13:07 GMT)
Part-Attention Based Model Make Occluded Person Re-Identification Stronger [1.8] PAB-ReIDは,問題に効果的に対処するための部分認識機構を組み込んだ新しいReIDモデルである。
まず、より正確な人的部分注意マップの生成を導くために、人間のパーシングラベルを導入する。
また、背景干渉を抑えつつ、きめ細かい人間の局所的特徴表現を生成するための細粒度特徴焦点器を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 10:00:28 GMT)
PV-SSD: A Multi-Modal Point Cloud Feature Fusion Method for Projection Features and Variable Receptive Field Voxel Features [1.5] 非常にスパースな3Dデータからのリアルタイム推論は、非常に難しい課題だ。
この問題に対処するため、典型的なアプローチのクラスは、点雲のキャストを正規のデータ表現に変換する。
本稿では,射影特徴と可変受容野ボクセル特徴に対するマルチモーダル点雲特徴融合法を提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:39:51 GMT)
Learning Decentralized Linear Quadratic Regulator with $\sqrt{T}$ Regret [1.5] 本稿では,システムのモデルが未知な場合,分散線形二次制御系を適応的に設計するオンライン学習アルゴリズムを提案する。
我々のコントローラは、部分的にネストされた情報パターンの場合、時間軸の$T$で$sqrtT$までスケールする期待された後悔を楽しんでいます。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:02:47 GMT)
OOVs in the Spotlight: How to Inflect them? [1.0] 語彙外条件(OOV)における形態的屈折に着目した。
LSTMとTransformerに基づく2つのシーケンス・ツー・シーケンス(Sequence-to-Sequence:seq2seq)モデルである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:40:06 GMT)
Deep Reinforcement Learning-Based Approach for a Single Vehicle Persistent Surveillance Problem with Fuel Constraints [0.8] 永続的な監視任務では、1機の無人航空機が同じ優先順位で標的のセットを何度も訪問する必要がある。
燃料や飛行時間制限のため、車両は定期的に燃料を補給するか、あるいは補給所で電池を充電する必要がある。
この問題に対処するための深層強化学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:58:53 GMT)
On the critical path to implant backdoors and the effectiveness of potential mitigation techniques: Early learnings from XZ [0.8] XZ Utilsのバックドアによる新たなサプライチェーン攻撃が特定されている。
バックドアにより、攻撃者は事前認証なしでSSHを使用する脆弱なサーバ上でリモートでコマンドを実行することができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:18:36 GMT)
BioImage.IO Chatbot: A Community-Driven AI Assistant for Integrative Computational Bioimaging [0.7] 我々は、大規模言語モデルを利用したAIアシスタントであるBioImage$.$IOツールセットを提示する。
BioImage.IOは、ユーザーの総合的な専門知識と革新を活用することで、生命科学の進歩を促進する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 04:48:30 GMT)
Quantum conjugate gradient method using the positive-side quantum eigenvalue transformation [0.4] 量子固有値変換(QET)を用いた量子共役勾配(QCG)法を提案する。
数値的な結果から,本アルゴリズムは回路深度を大幅に改善し,QETに基づく別のアルゴリズムよりも3~4桁の精度で性能を向上する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 02:11:16 GMT)
A Fourier-enhanced multi-modal 3D small object optical mark recognition and positioning method for percutaneous abdominal puncture surgical navigation [0.3] 針挿入点として小さな単環の中心を識別するミューティモーダル3D小物体マーカー検出法を提案する。
実験により,本手法は高精度かつ高安定性な位置決めを実現することを示す。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 12:28:40 GMT)
Using Letter Positional Probabilities to Assess Word Complexity [0.0] いくつかのLPPと複雑性の間には強い統計的関連性がある。
単純な単語はw, b, s, h, g, k, j, t, y, f で始まる傾向が著しく(p.001)、複雑な単語は i, a, e, r, v, u, d で始まる傾向が著しく(p.001)である。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 00:02:25 GMT)
Toward an Ethics of AI Belief [0.0] 我々は、AIの信念の倫理である、AIにおける哲学研究の新たな領域を追求する必要があると主張している。
我々は、AI信念の倫理に適用可能な(人間)信念の倫理における、現存する研究における4つのトピックを提案する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 00:12:16 GMT)
Toward an Artist-Centred AI [0.0] 本稿では、芸術におけるAIの使用に関する原則、実践、ツールの適合性と望ましい概念を文脈的に分析する。
AIがアート制作、流通、消費、収益化にもたらす課題を調べることで構成された。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 09:43:23 GMT)
Theoretical research on generative diffusion models: an overview [0.0] 生成拡散モデルは、強力な理論的背景を持つ多くの分野で高い成功を収めた。
データ分布をノイズに変換し、ノイズを取り除き、同様の分布を得る。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 14:08:56 GMT)
Rethinking Iterative Stereo Matching from Diffusion Bridge Model Perspective [0.0] 本稿では,拡散モデルを反復最適化プロセスに組み込む新しいトレーニング手法を提案する。
我々のモデルはScene Flowデータセットで第1位であり、競合する手法と比較して7%以上の改善が達成されている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:31:11 GMT)
Relativistic single-electron wavepacket in quantum electromagnetic fields: Quantum coherence, correlations, and the Unruh effect [0.0] 量子電磁場に結合した荷電相対論的粒子のガウス波束記述を用いた線形化有効理論を提案する。
自由空間における空飛ぶ電子の脱コヒーレンスの問題と、アンルー効果が電子に与える影響に対処する。
一様電場で加速される1つの電子に対して、電子の古典軌道からの偏差の2点相関子におけるアンルー効果を同定する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:50:07 GMT)
One-Way Quantum Repeater with Rare-Earth-Ions Doped in Solids [0.0] 一方向量子リピータは、二方向古典通信の必要性を排除している。
希土類イオンを固体にドープし、ナノキャビティと結合することで、フォトニッククラスター状態を効率的に生成することができる。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 21:08:18 GMT)
Not as Simple as It Looked: Are We Concluding for Biased Arrest Practices? [0.0] この研究は、説明を場所の種類、人物の種類、両方の組み合わせに分類する。
暴力的逮捕結果の分析では、近隣のレベル特性に起因する観察結果の約40%が明らかとなった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 18:50:59 GMT)
Navigating the Landscape of Large Language Models: A Comprehensive Review and Analysis of Paradigms and Fine-Tuning Strategies [0.0] 本稿では,大規模モデルの微調整手法について概観する。
本稿では,タスク適応型微調整などにおける最新の技術進歩と高度な手法の適用について検討する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 15:03:03 GMT)
Latent Distance Guided Alignment Training for Large Language Models [0.0] 外部アノテーションを頼らずにアライメントの改善を追求するために,潜在距離ガイドアライメントトレーニング(LD-Align)を導入する。
このアプローチは、潜在空間からのガイダンスを用いて、高品質な教師付き微調整データセットとモデルを整合させる。
我々は,DPOに基づくアライメントトレーニングを誘導するために,潜時空間におけるサンプルペア間の距離を利用する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 05:20:45 GMT)
LaVy: Vietnamese Multimodal Large Language Model [0.0] LLM(Large Language Models)とMLLM(Multimodal Large Language Models)は、複雑な推論と言語理解において印象的な能力を持つ嵐によって世界を席巻している。
本稿では,ベトナムの最先端MLLMであるLaVyを導入することで,この問題に対処する。
また,ベトナムの視覚言語タスクに対するMLLMの理解を評価するためのLaVy-Benchベンチマークも導入した。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 13:57:51 GMT)
LLMSat: A Large Language Model-Based Goal-Oriented Agent for Autonomous Space Exploration [0.0] 本研究は,宇宙船の高レベル制御システムとしてのLarge Language Models (LLMs)の適用について検討する。
一般的なゲームエンジンであるKerbal Space Programでシミュレートされた一連の深宇宙ミッションシナリオをケーススタディとして使用し、要求に対する実装を評価する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 03:33:17 GMT)
Energy Transfer Mechanism Under Incoherent Light Excitation in noisy Environments: Memory Effects in Efficiency Control [0.0] ノイズの多い環境では、ゆらぎは量子コヒーレンスを含むいくつかの要因を通してエネルギー伝達の効率を制御することができる。
近年の研究では、光誘起定常量子コヒーレンスが光励起を指定された「トラップ」状態に転送する効率に与える影響が研究されている。
励起の減衰(基底状態)と励起の運動の方向を与える所望のトラップの効果を紹介する。
光誘起ポンプの存在下では, 平均生存時間, 効率, および浴槽誘起変動の相関減衰時間との関係を確立する。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:02:56 GMT)
Concentration properties of fractional posterior in 1-bit matrix completion [0.0] この研究は、しばしば1ビット行列完備化と呼ばれるバイナリ観測のシナリオに特に対処する。
一般の非一様サンプリング方式を考慮し、分数後方の有効性に関する理論的保証を提供することにより、このギャップに対処する。
我々の結果は、頻繁な文献に見られるものと同等であるが、制限的な仮定は少ない。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 11:22:53 GMT)
ChatGPT Can Predict the Future when it Tells Stories Set in the Future About the Past [0.0] 本研究は,OpenAIのChatGPT-3.5とChatGPT-4が,2つの異なるプロンプト戦略を用いて,将来の事象を正確に予測できるかどうかを検討する。
私たちは、直接予測と将来の物語と呼ばれる2つの促進戦略を採用しています。
100個のプロンプトを解析した結果,将来の物語的プロンプトはChatGPT-4の予測精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 01:58:13 GMT)
ALICE: Combining Feature Selection and Inter-Rater Agreeability for Machine Learning Insights [0.0] 本稿では,新たなPythonライブラリであるAutomated Learning for Insightful Comparison and Evaluation(ALICE)を提案する。
これは、ブラックボックス機械学習モデルに対する洞察を求めるために、従来の特徴選択と、ユーザフレンドリなシンプルな方法で、ラタ間適合性の概念を融合する。
このフレームワークは、MLにおける解釈可能性の主要な概念の概要に続いて提案されている。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 17:34:58 GMT)
A biologically inspired computational trust model for open multi-agent systems which is resilient to trustor population changes [0.0] この研究は、シナプスの可塑性とヒト脳内の集合体の形成にインスパイアされた、分散化された計算信頼モデルであるCAに基づいている。
我々はCAモデルとFIREを比較し,オープンMASのための分散型信頼と評価モデルを構築した。
主な発見は、FIREが受託者人口の変化よりも優れているのに対して、CAは受託者人口の変化に対して回復力があることである。
論文参考訳(メタデータ) (Sat, 13 Apr 2024 10:56:32 GMT)