ホーム
ニュース詳細

Alibabaは、より効率的なQWEN3-Next人工知能モデルを起動します

ソース: Htx
Huobi HTXによると、AlibabaのTongyi Qianwenは次世代の基本モデルアーキテクチャQWEN3-NEXTをリリースし、このアーキテクチャに基づいてQWEN3-NEXT-80B-A3Bシリーズモデルをオープンしました。 QWEN3のMOEモデル構造と比較して、この構造により、ハイブリッド注意メカニズム、高sparsed性MOE構造、一連の安定したフレンドリーなトレーニングの最適化、および推論効率を改善するマルチトークン予測メカニズムなど、次のコア改善が行われました。 QWEN3-Nextのモデル構造に基づいて、AlibabaはQWEN3-NEXT-80B-A3Bベースモデルを訓練しました。このベースモデルは、QWEN3-32B密度モデルと同様またはわずかに優れたパフォーマンスを達成し、そのトレーニングコスト(GPU時間)はQWEN3-32Bの10分の1未満です。 32Kを超えるコンテキストでの推論スループットは、QWEN3-32Bの10倍以上であり、究極のトレーニングと推論の費用対効果を達成しています。
リンクがクリップボードにコピーされました