标签：大模型

上海交通大学发布蛋白质设计大模型Venus实现功能定向进化

上海交通大学特聘教授洪亮团队近日发布了蛋白质设计大模型Venus，该模型的核心功能是实现蛋白质的功能”定向进化”。与传统依赖经验与高通量实验的方法不同，Venus能够快速完成从蛋白质序列到功能的预测，使蛋白质改造从低效的”大海捞针”转向精准设计。

据介绍，使用这一创新工具，研究人员只需提供目标蛋白质的序列信息，Venus即可迅速生成一批改造方案。通过结合实验室验证，最终可获得最优解决方案。目前基于该模型设计的多款蛋白质已进入产业化阶段，例如在PET降解酶和高活性碱性磷酸酶等关键生物技术领域的突破。

这一突破性的研究进展将极大提升酶分子改造效率，有望解决传统酶进化和设计的技术难题，为生物制造系统的关键共性技术研发提供重要助力。专家表示，该成果将推动化学-酶法级联合成设计领域的发展，为天然产物及手性药物分子合成开辟新路径。

2025年3月23日
香港首个自研生成式AI大模型即将推出

香港首个自研生成式AI大模型今年将推出

世界互联网大会国际组织今天在中国北京举行新闻发布会，介绍2025年世界互联网大会亚太峰会的基本情况、总体筹备进度及亮点特色。香港特区政府创新科技及工业局局长孙东透露，首个由香港自主研发的生成式AI大模型今年将正式推出给全社会应用。孙东强调，开发的同时也注重治理，专家小组经过一年多仔细研究，即将推出生成式人工智能指引，对象包括人工智能技术开发者、服务提供商及应用者。世界互联网大会秘书长任贤良介绍，今年二月，香港生成式人工智能研发中心发布了首个人工智能大模型，并计划成立香港人工智能研发院。

—— 大湾区之声

2025年3月17日
百度文心大模型4.5及深度思考模型X1发布

百度发布文心大模型4.5及支持深度思考的X1

百度今日正式发布文心大模型4.5和文心大模型X1，目前，两款模型已在文心一言官网上线，免费向用户开放。同时，文心大模型4.5已上线百度智能云千帆大模型平台，企业用户和开发者登录即可调用API；文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品，将陆续接入文心大模型4.5和文心大模型X1，为用户带来更多元的体验。文心大模型4.5是百度首个原生多模态大模型，在多模态理解、文本和逻辑推理等方面有显著提升，多项测试表现优于GPT4.5，API调用价格仅为GPT4.5的1%；文心大模型X1则是一款深度思考模型，同时还支持多模态、多工具调用能力，API调用价格约为R1的一半。

—— 百度

2025年3月16日
富士康推出台湾首个推理人工智能大模型

富士康推出台湾首个推理人工智能大模型

富士康当地时间周一表示，该公司推出自有大语言模型，该模型具有推理能力，由公司内部开发，仅用四周时间就完成了训练。富士康称，这款名为FoxBrain的人工智能模型最初是为公司内部应用而设计，涵盖数据分析、数学、推理和代码生成等功能。富士康表示，英伟达提供了其台湾超级计算机的支持和技术咨询，使模型训练取得成功，并打算将该模型开源。该公司表示，栗永徽的团队使用120块英伟达H100图形处理器，在大约四周时间内完成了FoxBrain的训练。模型以Meta Llama 3.1为基础架构，是台湾首个具有先进推理能力的大语言模型，专为繁体中文设计和优化，富士康表示，其模型的部分性能略逊于中国DeepSeek部分模型。

—— 华尔街日报

2025年3月10日
大模型工具Ollama存在安全风险

大模型工具 Ollama 存在安全风险

3月3日，据清华大学网络空间测绘联合研究中心分析，开源跨平台大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患。多数用户使用Ollama私有化部署且未修改默认配置，存在数据泄露、算力盗取、服务中断等安全风险。使用Ollma在本地部署大模型时，会在本地启动一个Web服务，并默认开放11434端口且无任何鉴权机制。该服务直接暴露在公网环境，而攻击者可利用Ollama框架历史漏洞，直接调用模型接口实施数据投毒、参数窃取、恶意文件上传及关键组件删除等操作。建议更新至最新安全版本、配置防火墙规则、仅允许11434端口本地访问，并验证端口状态等。

—— 国家网络安全通报中心

2025年3月3日
百度宣布新版文心大模型4.5即将发布

百度宣布文心大模型4.5将于3月16日发布

百度宣布，文心大模型4.5将于3月16日正式上线。据百度介绍，最新版不仅在基础模型能力上有大幅提升，且具备原生多模态、深度思考等能力。在此前的百度财报后的电话会上，百度董事长李彦宏透露，文心大模型4.5将开源，4.5 将是百度有史以来最强大的大模型。李彦宏表示，开源4.5系列的决策源自于对技术领先地位的信心，开源将进一步促进文心大模型的广泛应用，并在更多场景中扩大其影响力，但我想强调的是，无论开源闭源，基础模型只有在大规模解决现实问题时，才具备真实价值。未来，百度将加速推动文心大模型的性能升级与成本降低。

—— 百度、界面新闻

2025年2月28日
阿里万相视频生成大模型开源

阿里旗下万相视频生成大模型宣布开源

阿里云旗下视觉生成基座模型万相2.1(Wan)宣布开源，开源采用的Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务。据介绍，14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，在权威评测集VBench中，万相2.1以总分86.22%的成绩超越Sora、Luma、Pika等国内外模型，稳居榜首位置。1.3B版本测试结果不仅超过了更大尺寸的开源模型，甚至还接近部分闭源模型，同时能在消费级显卡运行，仅需8.2GB显存就可以生成高质量视频，适用于二次模型开发和学术研究。

—— Github、HuggingFace、魔搭社区

2025年2月26日
Grok大模型新logo unveil

Grok大模型有了新logo 灵感来自黑洞

2月24日，由设计师Jon Vio制作的新logo，目前已用于Grok官方X账号和网站页面。同时，马斯克也将该logo的灵感来源——黑洞换成了自己的头像。

据logo设计师Jon Von所说，该设计基于奇点的概念，并从黑洞的神秘和力量中汲取灵感。

—— 凤凰网科技

2025年2月24日
马斯克的 Grok 3 仍未能回答经典用来刁难大模型的问题

马斯克的 Grok 3 答不对9.11和9.9哪个大

北京时间2月18日，马斯克与 xAI 团队，在直播中正式发布了 Grok 最新版本 Grok3。从现场展示的数据来看，Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型。然而测试最新的 Beta 版 Grok3，并提出了那个经典的用来刁难大模型的问题：「9.11 与 9.9 哪个大？」遗憾的是，在不加任何定语以及标注的情况下，号称目前最聪明的 Grok3，仍然无法正确回答这个问题。在海外也有很多类似问题的测试，例如「比萨斜塔上两个球哪个先落下」这些基础物理/数学问题，Grok3 也被发现仍然无法应对。

—— 极客公园

2025年2月19日
大模型创新不再依赖最先进硬件

官媒：大模型创新不一定要依赖最先进硬件

OpenAI以规模作为大模型的制胜法宝：为追求更高的性能，模型体积不断膨胀，参数数量呈现指数级增长。这种开发模式，带来了惊人的能源消耗和训练成本，难以为继。而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术，开启了大模型瘦身新风尚，走出一条“小而强”的新路径。以DeepSeek公司为例，R1在多个基准测试中与OpenAI的o1持平，但成本仅为o1的三十分之一。DeepSeek的成功证明，大模型创新不一定要依赖最先进的硬件，而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗，更重要的是为AI技术普惠化铺平了道路。

—— 中国官媒《经济日报》

2025年1月26日

标签： 大模型

标签：大模型