This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
原始链接: https://github.com/cumulo-autumn/StreamDiffusion
给定材料:名为“STREAAMDIFFUSION:实时交互式生成的管道级解决方案”的开源项目随附的自述文件。 该项目的主要目的:引入一种名为“STREAAMDIFFUSION”的新工具,它允许通过文本到图像生成来创建视觉内容,同时提供纹理合成、随机相似性过滤器等选项,以便 加快生成时间并优化资源。 该项目旨在将最新的计算机视觉研究与最新的深度学习框架相结合,允许用户通过命令行界面、Web 应用程序或 Python API 使用任何预训练的生成神经网络模型以流分辨率生成视频。 此外,该项目旨在提供添加定制训练数据集的潜在功能,以允许用户根据特定需求微调模型。 先决条件:在开始使用StreamDiffusion之前,建议具备深度学习的基础知识并熟悉Python编程语言。 但是,自述文件中包含的指南和文档应提供足够的详细信息,以便初学者能够遵循。 强烈建议仔细阅读并仔细执行所有说明,因为由于某些功能的复杂性,它们通常需要多次重复。 所需软件:用户必须安装并设置: 1)基本Python库,如numpy、pandas、opencv、pillow; 2) 用于 LuaJIT、ONNX 和 ONNXRuntime 等后端的 Torcha。 此外,根据所使用的功能,可能需要一些额外的流行第三方库。 其中包括用于进度条的 tqdm、用于tensorboard集成的tensorboardx、用于GPU加速的accelerate-with-tensorrt、用于显示目的的matplotlib。 值得注意的组件:STREAAMDIFFUSION 提供的一些值得注意的组件和功能包括: 1) 利用 TinyBERT、StyleGAN、StyleStacking、CLIP、BigDecision、Phenakiotiko、StarGAN、NeuralStylesGAN 的文本到图像生成器; 2)利用LDM、Pix2pixHD、CycleGAN、PhotographicWarpingFlow、CoFlow、FlowGAN等的图像到图像生成器; 3) 视频转-
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.