単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場