全新开源生成平台大模型曝光 Code Llama 免费并且薄纱GPT-4
刘政帆

机锋资讯:近日,Meta 公司开发的全新语言大模型 Code Llama,为开源项目,可以支持所有人的研究与使用,预计最快可能在本周内推出。

根据最新的消息,这套新的编码模型将与 OpenAI 打造的 Codex 正面抗衡,并基于 Meta 的 Llma 2 软件——这是一种能够理解并生成会话文本的大语言模型。

这场革命性的对决,可能对于AI编程这个项目又是一次全新的巨大突破。

大家对于GPT肯定已经不在陌生,那么我为大家解释一下什么是Code Llama。

Code Llama是基于Llama 2 编码的一种全新大型AI框架,并且由于其开源的性质,对于所有人都是公开且免费的,不需要像open AI 谷歌newbing那样有专门的平台,可能还需要支付一定的费用。

并且这种开源的性质是史无前例的,这意味着可以无缝衔接所有的AI语音助手,不需要麻烦琐碎的节点建立过程,这一举措,将会从目前的大模型生成平台中夺取大量的原生用户。

有网友将这俩个模型进行了编码比赛,实测得出,目前Code Llama 距离GPT4.0还有一些距离

于是不久后,基于 Code Llama 微调的 WizardCoder 34B,在 HumanEval 基准上,直接打败了 GPT-4。

关于目前的Code Llama,暂且只有以下信息。

1. Code Llama 在 500B 的 token 上训练而来,而 Llama 2 是在 2T 的 token 上训练而来。

由于 Code Llama 训练的数据和 Llama 2 相比只有 1/4,可能因为没有足够的训练数据,再加上 LLM 的 Scaling Laws 的限制,导致 CodeLlama70B 性能不太行。

2. Code Llama 模型支持 100k 的上下文大小,这个能力在处理代码任务时非常有用。

关于Code Llama的最新消息,机锋网也会持续保持关注,作为一款开源的大模型,我们都期待着它能为AI生成平台带来全新的变革。

相关文章
全部评论
钱纪韫
发表评论
回复:
发表回复