了解最新公司动态及行业资讯
【深圳商报讯】(首席记者 吴吉)新学期开学,深大全国产化、本地化部署的满血版DeepSeek-R1(671B)正式上线!深圳大学大数据系统计算技术国家工程实验室、深圳大学信息中心联合华为基于昇腾平台部署满血版DeepSeek-R1(671B)大模型,为全校师生提供高效、稳定的本地化AI服务。
相较于蒸馏版模型,满血版DeepSeek-R1具备显著优势——性能更强,基于671B参数量级,支持复杂逻辑推理与长文本深度交互;功能更全,支持私有知识库融合,为教学科研提供定制化服务。
据介绍,深圳大学选择本地化部署Deepseek-R1彰显了三大核心价值。其一是服务高可用性,基于校内昇腾算力平台(85P算力储备),规避外部服务中断风险,保障7x24小时稳定响应,满足教学、科研及办公的连续性需求;其二是数据隐私零泄露,所有用户问答数据仅限本地存储,不用于任何模型优化或第三方共享,严格保障科研机密与个人隐私,为学术探索筑牢安全防线;其三是定制化服务扩展,未来可快速接入校本知识库(如学术资源、课程体系),打造“AI+教育”“AI+X科研”垂直领域解决方案,赋能学科交叉创新。
据悉,深圳大学大数据国家工程实验室长期从事大模型理论及应用相关研究,2023年4月在LLaMA框架基础上开源首个百亿参数大规模中文语言模型伶荔,联合腾讯续推出首个模块化大语言模型训练框架TencentPretrain,大大推动了国内大语言模型技术的发展。在开源伶荔模型基础上,相关团队陆续推出了可以与人真实互动的2D/3D数字人与数字客服,人脸细粒度分析多模态大模型、病理/超声/腹部CT多模态诊断大模型以及金融领域软件需求分析大模型等垂直领域大模型。后续将在DeepSeek基础上持续提升相关系统性能。
大数据国家工程实验室正在承建深大自己的智算中心(投资超过一个亿,算力达330P Flops),相关IT/GPU设备已经完成招标采购,机房建设正在紧锣密鼓进行中。
除了为全校师生教学科研提供算力服务,智算中心团队将会把满血版DeepSeek系列部署在高性能GPU上,提供安全可靠、数据隐私零泄露的国产化大模型服务。