簡単なテキストから写実的な動画を生成する拡散モデル「W.A.L.T」が登場