197个大模型通过备案,北京竟独占鳌头

截至2024年7月30日,全国已有197项生成式人工智能服务通过备案审核。这标志着我国在规范人工智能市场和推动技术健康发展方面取得了显著进展。大模型备案主要集中在北京,数量达85款,占全国总数的40%以上。上海、广东、浙江、江苏则分别备案43款、26款、13款和6款,反映出东部沿海地区的强劲技术发展势头。

在大模型类型中,行业大模型占主导地位,共136款,占总量的69%,涵盖了教育、金融、办公、政务、医疗等多个领域。这表明人工智能正从通用领域向各行业细分领域深化渗透,满足不同领域的特定需求。

特别是在教育、金融、办公和政务领域,备案的大模型数量分别为19款、18款、15款和11款,显示了这些领域对人工智能的高度需求。此外,行业大模型的应用范围正逐步扩展至传媒、招聘、家装、心理等场景,预示着人工智能将更加多样化。

IMG_256

2024年新增的126款大模型中,行业大模型占比高达83%,反映了其快速增长与通用大模型市场的趋于饱和。这一趋势显示出人工智能技术正加速与各行业融合,为解决行业痛点和提升效率提供了新路径。

备案制度的推出是为了确保大模型技术的安全性和可靠性,同时促进技术规范和市场秩序的建立。在人工智能技术快速发展的背景下,备案不仅有助于监管部门掌握技术进展,也能防范潜在风险,保障技术健康有序发展。

01 模型为什么需要备案?

满足国家网信办合规要求:大模型具备舆论属性和社会动员能力,按照《互联网新闻信息服务新技术新应用安全评估管理规定》,必须进行安全评估,才能合法提供服务。

公司能力背书:备案证明公司符合国家安全标准,有助于在投标中获得优势,并提升公司品牌的公信力和市场形象。

其他战略需求:备案是公司战略的一部分,确保在市场竞争中合规发展,并满足政策对创新技术应用的要求。

02 大模型备案流程一览

(1)报请属地网信办,拿到备案表;

(2)企业根据表格及评估要点准备填写材料;

(3)企业内部展开评估,编写相关材料,准备测试账号;

(4)材料附件及测试账号提交属地网信办审核;

(5)属地网信办材料审核及技术测试审核通过后,属地上报中央网信办;未通过,修改材料或调整模型能力后再次提审,具体调整哪方面根据属地网信反馈进行;

(6)中央网信办进行材料复审及技术评审,通过,企业下发备案号;未通过,需重新进行上线备案。

IMG_257

03 大模型备案材料一览

大模型上线备案表,包含以下具体内容:

1)基本情况:模型名称、主要功能、适用人群、服务范围等。

2)模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。

3)服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。

4)安全评估:基本情况、评估情况。

5)自愿承诺:承诺所填信息真实性,并签字确认。

6)附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。

(1)安全评估报告:提交的报告应包含语料安全评估、模型安全评估以及安全措施评估,并应在评估报告中形成整体评估结论。每一类评估的要求可参考《基本要求》中的具体条款。

(2)模型服务协议:一般包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交。

(3)语料标注规则:包括标注团队介绍、功能性及安全性标注细则,标注流程等。

(4)拦截关键词列表:总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。

(5)评估测试题集:

1)该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。

2)测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。

3)测试题建议是“问题”(包含主谓宾),不可只是短词、长文章。

4)生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。

04 大模型备案注意事项

1.在准备备案材料时,务必直接从官方网站下载所有所需的表格和指南,避免从非官方途径获取文件,以免因版本差异导致内容不一致,影响备案流程的顺利进行。

2.若需将纸质标准文档转化为电子版进行填报,切记保持原始文件的完整性和准确性,不可擅自删改、调整原有内容或格式,确保电子文档与纸质版完全一致。

3.提交的所有备案信息应基于事实,做到真实、客观且公正,坚决杜绝任何虚假陈述或与实际情况不符的描述,维护备案资料的严肃性和可靠性。

4.对于利用第三方开源模型作为基础,进行二次开发形成自家大模型的情况,务必在“模型研制”章节详细列出所用开源基座的具体信息,包括但不限于模型名称(精确到B级别)、备案单位、备案时间、备案编号以及采用的模式(如商业合作或免费开源)。在介绍训练数据时,只需聚焦于新增部分,同时确保训练和推理所需算力资源、并发服务等能力与模型规模相匹配。

5.一旦完成备案并获得备案号,企业有责任在其官方网站或其他公开渠道的显著位置,明确标示该备案号,以便公众查阅和监督,彰显透明度和合规性。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容