0871-64605728
您当前位置:网站首页 >> 新闻资讯
《大模型安全研究报告(2024年)》正式发布
文章来源:中国信通院  上传时间:2024-9-27  浏览量:233

全球大模型技术竞赛正推动人工智能向通用强智能发展,引发人机交互和应用研发模式变革。大模型在各行业的广泛应用为第四次工业革命提供动力,但同时也带来安全风险,如模型“幻觉”和指令注入攻击。国际组织和主要国家通过制定治理原则、法律法规和技术标准来应对这些挑战。同时,大模型在逻辑推理、任务编排等方面的卓越能力,为解决网络空间安全瓶颈问题带来了新的机遇。

为有效防范和消减大模型的安全风险,并促进其在安全领域的应用,阿里云联合中国信息通信研究院等30余家行业单位共同编制《大模型安全研究报告(2024年)》,并于2024年9月19日云栖大会AI治理与安全论坛上发布。

报告凝聚业界专家共识,聚焦当前大模型突出安全风险和网络空间安全瓶颈问题,从大模型自身安全和大模型赋能安全两个维度,提出涵盖安全目标、安全属性、保护对象、安全措施四个方面的大模型自身安全框架,以及大模型赋能安全框架。期待这些框架能为社会各方提供有益参考,共同推动大模型技术产业的健康发展。

报告主要内容包括:

1. 大模型安全风险地图

为尽可能全面应对大模型领域的基础共性安全挑战,本报告优先对语言、多模态等各类基础大模型系统的安全风险进行系统梳理。与此同时,参考ISO/IEC 5338-2023 《人工智能系统生命周期过程》国际标准,将基础大模型系统抽象为训练数据、算法模型、系统平台和业务应用4个重要组成部分,并通过描绘这四个组成部分面临的重要和一般安全风险,形成大模型安全风险地图,共涵盖21个安全风险。

2. 大模型自身安全框架

为消减大模型面临的基础共性安全风险出发,提出了涵盖安全目标、安全属性、保护对象、安全措施四个层面的大模型自身安全框架,构建了保障大模型安全的整体解决方案。同时,提出训练数据、模型算法、系统平台、业务应用四方面中共计16项安全保护措施。

3. 大模型赋能安全框架

结合行业实践情况,本报告重点阐述大模型在网络安全、数据安全、内容安全三个领域的潜在应用方向。网络安全领域,大模型可应用于安全威胁识别、保护、检测、响应、恢复等多个保护环节中的关键场景。数据安全领域,大模型可应用于数据分类分级、APP(SDK)违规处理个人信息检测等场景。内容安全领域,大模型可应用于文本内容安全检测、图像视频内容安全检测和音频内容安全检测等场景。

编 辑:路金娣

06

2024-12

中国自主量子算力首次出口销售,“本源悟空”机时开放海外订阅

中国自主量子算力首次出口销售,“本源悟空”机时开放海外订阅

12

2022-08

博通软件业务总裁离职:2个月前主导收购VMware交易

博通软件业务总裁离职:2个月前主导收购VMware交易

27

2024-09

《大模型安全研究报告(2024年)》正式发布

《大模型安全研究报告(2024年)》正式发布

17

2022-06

工信部韩夏:我国建成了全球最大、最完整的光通信产业体系

工信部韩夏:我国建成了全球最大、最完整的光通信产业体系

14

2025-02

智库观点:解码DeepSeek

智库观点:解码DeepSeek

27

2017-05

云南富源:公安派出所使用消防移动执法终端 成执法好帮手

云南网讯(记者杨之辉通讯员肖直平)近日,云南富源县公安消防大队为基层派出所配置了消防移动执法终端,终端可随时随地无线登录公安网,进行网上查询、网上执法、网上办公和信息采集等移动式办公,极大地提高了消防监督执法工作效率。

13

2022-05

屏下摄像技术商用:熟了

屏下摄像技术商用:熟了

17

2023-11

消息称日本正考虑针对苹果、谷歌等厂商征收游戏 App 销售税

消息称日本正考虑针对苹果、谷歌等厂商征收游戏 App 销售税
返回顶部
客服电话
0871-64605728
用微信扫一扫关注我们
请各公司推销人员注意:我单位拒绝任何方式、任何形式的电话推销,请勿拔打我单位客服热线进行电话推销,谢谢合作!
公司名称:云南昂略科技有限公司
联系地址:云南省昆明市官渡区永平路188号鑫都韵城写字楼6栋1004号
联系电话:0871-64605728、传真号码:0871-64605728
电子邮箱:19701580@qq.com
关键词:新闻资讯:《大模型安全研究报告(2024年)》正式发布,云南昂略科技有限公司,云南移动执法平台建设,云南智慧安防调度系统,云南头戴式安全终端,昂略科技
云南网站建设,云南网页设计,昆明网站建设,昆明网页设计  网站管理
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。