DeepMindAI 的這一研究表明,當用于訓練分類器(數據增強)時,GAN 生成在看起來真實的樣本的能力有限。初始分數與分類表現呈負相關。
我們探討了矢量量化變分自動編碼(VQ-VAE)模型在大規模圖像生成中的應用。為此,我們對VQ-VAE 中使用的自回歸先驗進行了縮放和增強,目的是生成比以前具有更高相關度和保真度的合成樣本。我們使用簡單的前饋編解碼器網絡,這讓我們的模型對于編碼\解碼速度至關重要的應用非常有用。此外,VQ-VAE 僅僅只需要在壓縮潛在空間中對自回歸模型進行采樣,這比在像素空間中的采樣在速度上快一個數量級,對于大型圖像尤其如此。我們證明了一個 VQ-VAE 的多尺度層次組織,加上強大的先驗潛在代碼,能夠在多種數據集(如 ImageNet)上生成質量與最先進的生成對抗網絡相媲美的樣本,同時不受 GAN 的已知缺點,如模式崩潰、多樣性的缺乏等的影響。