产品概述
GPU服务器是配备独享GPU卡的高性能云计算服务,可以帮助您快速、便捷地获得高质量的GPU计算资源,能够大幅提高机器学习及科学计算等大规模计算框架的运行速度,为搭建人工智能及高性能计算平台提供基础架构支持。
产品功能
高配计算节点
多种GPU卡
将GPU云服务器上的CPU、内存、本地磁盘配置与GPU数量按照最优比例组合,确保GPU保持最优计算性能。 每台GPU云服务器均独享物理GPU卡,确保GPU性能稳定可靠。
提供Nvidia Tesla V100、P40、P4、K40M等多种高性能计算卡供用户自由选择。 每台GPU云服务器可选配置1、2、4块GPU卡,V100实例更可支持最多8卡,CPU、内存、磁盘配置随GPU数量线性增加。
集成GPU驱动
公共镜像
自定义镜像
在Ubuntu和CentOS标准镜像基础上,集成最新的GPU驱动和CUDA 9.2,帮助用户解决底层兼容问题,加速业务上云。同时也会陆续支持更多镜像。
提供更多公共镜像支持,用户可自行选择发行版公共镜像,并根据需要自行安装GPU驱动和相应软件。
可基于已部署好服务的GPU云服务器的系统盘生成自定义镜像,再通过自定义镜像创建更多GPU云服务器,从而实现业务的快速复制和部署。
私有网络VPC
私有网络VPC,基于百度智能云构建一个安全隔离的网络环境,支持用户可自定义网络地址空间、多VPC之间(同城、跨城)对等高速连接,通过VPN/专线的方式,与用户的数据中心构建安全、定制的混合云网络,实现原有业务轻松、安全的迁移到云端。
云磁盘CDS
对象存储BOS
在GPU云服务器本地磁盘容量不能满足使用需求时,可通过购买CDS云磁盘来实现存储资源的扩展。
当需要将本地大量需要处理的数据上传云端时,可使用更具性价比的对象存储BOS。在使用数据时可选择通过存储网关BSG或BOS FS功能,将BOS数据作为共享数据在多台GPU云服务器间共享使用。
BCM监控
针对GPU云服务器,提供细粒度的GPU卡状态监控和报警机制,包括GPU使用率、内存使用率、温度、状态等一系列监控项。
产品优势

节约成本
支持包年包月和按需购买 提供最新Nvidia GPU卡 低服务器运维成本

性能最优
保持GPU性能无损 分钟级创建资源 最佳服务器资源配比

易用性
对接云产品 提供专业镜像 提供完整GPU监控

安全性
租户间VPC隔离 完善的安全组控制 对接云平台安全
使用场景
简单深度学习场景
复杂深度学习场景
其他GPU应用场景

- 场景描述
基于GPU云服务灵活的异构计算资源,配置EIP后提供的公网访问能力,同时结合对象存储BOS提供的云对象存储服务,您可以将需要训练的数据上传BOS后,再分发给GPU云服务器进行训练任务,从而搭建自己的简单深度学习模型。此场景下,也同样适用于您结合自身业务进行在线预测工作。

- 场景描述
将GPU离线训练与在线预测在云端实现时,可使用GPU云服务器或具有更高性能的GPU物理服务器来搭建后端离线集群,数据从对象存储BOS中获取,线上业务系统将服务产生的数据存入BOS,并使用GPU云服务器将预测模型与业务系统结合,完成业务数据的实时预测。

- 场景描述
您也可以利用GPU服务器的异构计算加速能力,处理更多计算场景的业务。例如图片视频的编解码、数字货币计算、气象预测、到金融分析、地质勘探、计算化学等高性能计算领域。