23/10/18 13:20:55.40 uUQLRLpU.net
NECの大規模言語モデルが一般初公開 現地の様子は
URLリンク(www.itmedia.co.jp)
NECのLLMは、GPU928基・580PFLOPSの演算能力を備えたAIスーパーコンピュータを1カ月稼働して構築しており「世界トップクラスの日本語処理能力」をうたう。
パラメーター数は130億で、1750億の「GPT-3」や700億の「Llama2」などに比べると軽量だ。ただし、LLMはパラメーター数を増やすと、推論速度が低下しモデル運用に必要なGPUの数と消費電力が増える傾向にある。NECも「大ボリュームで高性能」ではなく、安さと精度の両立など、コンパクトさや取り回しの良さを強調している。
提供形態も複数用意。オンプレミスやNECのデータセンター、米Microsoftのクラウドサービス「Microsoft Azure」上で運用可能という。