使用nunchaku加速模型,大大降低显存占用,速度提高4倍以上。