蚂蚁集团百灵大模型通过备案,采用 Transfromer 架构

11月6日,界面新闻从蚂蚁集团获悉,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,将向公众开放。

本次通过备案的是蚂蚁百灵语言大模型,该大模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度达32K。

目前,蚂蚁大模型已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。

蚂蚁集团正式开源 CodeFuse 代码大模型 蚂蚁集团证实正研发语言和多模态大模型,命名“贞仪”

国内第二批通过备案的 AI 大模型包括 11 家公司,部分已面向全社会开放服务。加上首批的 10余个大模型,目前已有超过 20个大模型获得备案。

新一批备案名单包括:网易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、面壁智能(“面壁露卡 Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图 AI”模型)、月之暗面(moonshot)、金山办公(WPS AI)、好未来(MathGPT 大模型)等。

8 月 31 日首批通过备案的 AI大模型包括百度文心一言、百川智能、商汤商量 SenseChat、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、上海 MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)、“360 智脑”等等。

挑战 ChatGPT,国产有这 8 款 AI 大模型产品

据悉,今年 8 月 15 日正式施行的《生成式人工智能服务管理暂行办法》 ,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。