标签: LLaMA

  • 《LLAMA 3.1 405B:Meta发布高性能人工智能模型》

    Meta发布LLAMA 3.1 405B开源AI模型

    Meta 公司发布 LLAMA 3.1 405B 开源人工智能模型,首席执行官马克·扎克伯格称之为“最先进的”,并表示将与 OpenAI 和谷歌等竞争对手的类似产品相媲美。新模型花费了数月时间和数亿美元的计算能力进行训练。该模型具有多种新功能,包括改进的推理能力,可帮助解决复杂的数学问题或立即合成整本书的文本。还具有生成式人工智能功能,可以通过文本提示按需创建图像。名为“想象自己”的功能允许用户上传自己的脸部图像,然后可以用来创建在不同的场景和情形中的形象。另外,Meta 公司推出 Llama 模型 8B 和 70B 型号的升级版本,将上下文长度扩展至128K,增加了对8种语言的支持。

    —— 彭博社、META

  • “零一万物”回应 LLaMA 抄袭事件

    “零一万物”回应 Yi 开源大模型“抄袭 LLaMA”事件:承认做法不妥,将修改争议张量名

    针对开源 Yi 大模型抄袭 LLaMA 的事件。“零一万物” 正式公开回应了此事,该公司开源团队总监 Richard Lin 承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。

    Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。

    另一名开发者 JosephusCheung 声称,既然官方已经宣布修改 Yi 大模型的张量名称,那么开源大模型 Yi 便是 LLaMA 的衍生作品,而这显然构成了许可证冲突,因为代码的推理部分和模型定义都是“LLaMA”的一部分。

    —— IT之家、OSCHINA

  • 李开复旗下公司被指抄袭 Meta 的 LLaMA 模型

    李开复旗下 AI 公司 “零一万物” 开源 Yi 大模型被指抄袭 LLaMA

    11 月 14 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。

    然而在 Yi-34B 的 Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了 Meta LLaMA 的架构,只对两个张量(Tensor)名称进行了修改,分别为 input_layernorm 和 post_attention_layernorm。

    ehartford 表示开源社区肯定会重新发布 Yi 大模型,并重命名张量以符合 LLaMA 架构。他希望该公司在模型获得大量采用之前考虑将这一更改应用到官方模型中,下方则引来了多方议论。

    此外,网上今日流传着一张原阿里首席 AI 科学家贾扬清的朋友圈,该内容称“某国内大厂新模型 exactly 就是 LLaMA 的架构,但是为了表示不一样,把代码里面的名学从 LLaMA 改成了他们的名字,然后换了几个变量名”。

    —— IT之家