华为云盘古安全护栏获信通院满级评分,全链路筑牢企业大模型可信

举报
华为云头条 发表于 2024/03/15 18:48:05 2024/03/15
【摘要】 3月15日,在中国人工智能产业发展联盟(AIIA)第十一次全会上,中国信通院发布大模型标准符合性验证结果,华为云盘古凭借大模型安全解决方案——盘古安全护栏完成软硬件、数据、模型、应用等可信模块测试,成为业界首个在大模型可信领域获得卓越级(5级)评分的大模型产品。▲华为云盘古大模型获得信通院可信要求5级评分▶全新盘古安全护栏,信通院可信满级认证近年来,我国人工智能产业在《“十四五”数字经济发展...

3月15日,在中国人工智能产业发展联盟(AIIA)第十一次全会上,中国信通院发布大模型标准符合性验证结果,华为云盘古凭借大模型安全解决方案——盘古安全护栏完成软硬件、数据、模型、应用等可信模块测试,成为业界首个在大模型可信领域获得卓越级(5级)评分的大模型产品。

图片1.png

▲华为云盘古大模型获得信通院可信要求5级评分

▶全新盘古安全护栏,信通院可信满级认证

近年来,我国人工智能产业在《“十四五”数字经济发展规划》《“十四五”国家信息化规划》等政策引导下蓬勃发展。大规模预训练模型作为人工智能新基建的关键技术,在自然语言处理、计算机视觉等领域取得显著突破。然而,随着技术应用深入发展而来的数据投毒、不当应用等风险也逐渐凸显。

自2021年起,中国信通院开始研究大规模预训练模型标准,与多方共同建立技术和应用标准体系,推动人工智能发展。

华为云盘古大模型在2022年首批参与,“模型开发”和“模型能力”两个模块达到优秀级(4+级),在2023年大模型标准符合性验证结果中,成为业界首个在模型应用模块获得卓越级(5级)评分的大模型产品。

在本次大模型标准符合性验证中,华为云大模型安全解决方案覆盖了基础设施、训练数据、生成内容的端到端安全合规全场景,有效应对大模型数据治理、模型可信、内容合规等三大维度风险,并以文本审核、Prompt攻击检测、AIGC鉴伪、个人隐私脱敏等新型可信能力,确保应用中的可信可靠。此外,在软硬件和数据方面,盘古安全护栏保证了基础软硬件的安全性、可靠性和兼容性,以采集、预处理和使用控制实现数据可信性,并从多角度构筑数据可信能力,打造稳健、可控、合规且符合价值观的应用服务。

为引导产业发展和规范行业自律,华为云还与中国信息通信研究院联合其他相关单位共同开展编制《大规模预训练模型技术和应用评估方法 第5部分:可信要求》,为国家人工智能产业的健康发展贡献力量。

▶全新盘古安全护栏,筑牢大模型新防线

大模型逐渐深入行业核心系统,成为推动数字化转型的关键力量,伴随而来的还有端到端的可信挑战。盘古安全护栏,进一步强化了大模型的全链路保障,基于华为云在盘古大模型实践中积累的丰富经验和技术优势,开放兼容,能够服务于多样化的模型形态,助力企业实现大模型全链路合规。

华为云盘古安全护栏凭借四道防线,全面覆盖大模型使用的全生命周期,兼容开源、三方大模型,为企业用户提供最佳的大模型安全解决方案。

  • 数据防护防线

通过数据脱敏、数据血缘、数据防毒等技术手段,从预训练模型的数据集,直至数据治理阶段,全方位保障企业构建高质量、安全合规的数据集,确保数据多样性和公平性。

  • 模型防护防线

针对模型训练阶段可能遭遇的数据投毒风险,以及推理阶段训练数据、用户隐私信息泄露等风险,采用模型混淆、模型加密等先进技术,软硬件结合,加密模型,有效保障企业大模型资产安全。

  • 内容防护防线

通过Prompt攻击检测等新型防御能力,实现对多种直接与间接攻击手段的有效检测,并通过对模型输入输出内容严格审核,严防生成有害或不当信息,有效应对新型安全风险。

  • 应用防护防线

保护大模型在应用插件场景下的安全可靠性,确保大模型在各类应用场景中都能稳定、高效地发挥作用。

据悉,盘古安全护栏四道防线的综合拦截率超过90%,能够为企业大模型提供坚实的保障。未来,华为云将持续致力于AI技术与行业实践深度融合,护航大模型技术的创新与发展,为企业用户提供更加可信的人工智能解决方案,让企业创新安心无忧。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。