北大开源代码大模型 CodeShell,提供了配套的 IDE 插件

北京大学知识计算实验室联合四川天府银行 AI 团队,正式开源 70 亿参数的代码大模型CodeShell,并提供了与 CodeShell 配套的部署方案与 IDE 插件,具体查看CodeShell代码库。

官方介绍称,CodeShell 具有 70 亿参数,采用五千亿 Tokens 进行了训练,上下文窗口长度为 8192。CodeShell 的原始训练数据基于自己爬取的 GitHub 数据、Stack 和 StarCoder 数据集,以及少量高质量的中英文数据。

在权威的代码评估 Benchmark(HumanEval 与 MBPP)中,CodeShell 取得同等规模最好的性能。

本次开源的模型如下:

下图是 CodeShell 代码助手的 VS Code 插件截图:

IDEA 插件:


已发布

分类

来自

标签: