ZeroGPU 是 Hugging Face的免费GPU,免费用户每天最多五分钟

发布时间:2026/6/20 4:31:07

ZeroGPU 是 Hugging Face的免费GPU,免费用户每天最多五分钟 ZeroGPU 是 Hugging Face Spaces 的动态 GPU 共享基础设施免费用户 就2分钟认证免费用户五分钟只能用于演示 | 每日 GPU 配额https://huggingface.co/docs/hub/spaces-zerogpuhttps://huggingface.co/spaces/enzostvs/zero-gpu-spaces好的我来整理一下 Hugging FaceZeroGPU的最新官方文档信息ZeroGPU 概述ZeroGPU 是 Hugging Face Spaces 的动态 GPU 共享基础设施通过按需分配和释放 GPU 来优化资源利用率。核心优势免费 GPU 访问降低 AI 模型部署成本多 GPU 支持单个应用可同时使用多个 GPU相比传统单 GPU 独占模式最大化资源利用和能效硬件规格已升级GPU 尺寸背板硬件显存配额成本large默认半个 NVIDIA RTX Pro 6000 Blackwell48GB1×xlarge完整 NVIDIA RTX Pro 6000 Blackwell96GB2×注早期版本使用 NVIDIA H20070GB 显存现已升级至 RTX Pro 6000 Blackwell使用方式方式一免费使用现有 ZeroGPU Spaces对所有用户免费开放浏览精选列表ZeroGPU Spaces 列表方式二托管自己的 ZeroGPU Space账户类型条件托管上限个人账户订阅PRO$9/月最多10 个组织账户订阅Team或Enterprise最多50 个创建步骤订阅相应计划创建新 Space → 选择Gradio SDK硬件选项中选择ZeroGPU代码示例importspacesfromdiffusersimportDiffusionPipeline# 模型在根模块层面加载到 CUDApipeDiffusionPipeline.from_pretrained(...)pipe.to(cuda)# 用 spaces.GPU 装饰真正需要 GPU 的函数spaces.GPUdefgenerate(prompt):returnpipe(prompt).images gr.Interface(fngenerate,inputsgr.Text(),outputsgr.Gallery(),).launch()关键要点先import spaces模型在根模块层面pipe.to(cuda)加载利用 PyTorch CUDA 仿真模式无需真实 GPU 即可执行 CUDA 操作不建议在spaces.GPU函数内部做懒加载效率明显更低spaces.GPU在非 ZeroGPU 环境中安全无效果GPU 尺寸选择默认使用large48GB可显式指定xlarge96GBspaces.GPU(sizexlarge)defgenerate(prompt):returnpipe(prompt).images注意xlarge消耗配额是large的2 倍例如 45 秒任务消耗 90 秒配额xlarge排队概率更高、等待时间更长仅在真正需要额外计算或内存时使用持续时间管理默认函数最大运行时间为60 秒可自定义spaces.GPU(duration120)defgenerate(prompt):returnpipe(prompt).images动态时长根据输入动态计算defget_duration(prompt,steps):step_duration3.75returnsteps*step_durationspaces.GPU(durationget_duration)defgenerate(prompt,steps):returnpipe(prompt,num_inference_stepssteps).images持续时间越短队列优先级越高使用配额与优先级账户类型每日 GPU 配额队列优先级未认证2 分钟低免费账户5 分钟中PRO 账户40 分钟可扩展最高Team 组织成员40 分钟可扩展最高Enterprise 组织成员60 分钟可扩展最高每日配额在首次使用 GPU 后 24 小时重置剩余配额直接影响队列优先级配额越多优先级越高超额使用PRO、Team、Enterprise 用户可通过预付费积分超出每日配额每 10 分钟 GPU 时间 $1每日配额用完后自动扣减信用余额通过账单设置添加积分兼容性项目说明SDK仅支持 Gradio SDK框架大多兼容 PyTorch GPU SpaceHF 库transformers、diffusers兼容性较好注意事项兼容性不如标准 GPU Space可能出现意外问题支持版本Gradio4PyTorch2.8.0 至最新版本查看完整列表Python3.12.12 / 3.10.13性能优化建议提前编译AOT CompilationZeroGPU 不支持torch.compile但支持 PyTorch 预编译Torch 2.8Flash Attention 3加速注意力计算参考官方博客文章了解 ZeroGPU 提前编排的完整指南托管限制个人账户PRO最多10 个ZeroGPU Space组织账户Team/Enterprise最多50 个ZeroGPU Space相关资源官方文档Hugging Face ZeroGPU 文档ZeroGPU Spaces 列表精选列表社区反馈在对应 Space 的社区标签页分享

相关新闻