微闻

标签: 大模型

  • 上海交通大学发布蛋白质设计大模型Venus实现功能定向进化

    上海交通大学发布蛋白质设计大模型Venus实现功能定向进化

    上海交通大学特聘教授洪亮团队近日发布了蛋白质设计大模型Venus,该模型的核心功能是实现蛋白质的功能”定向进化”。与传统依赖经验与高通量实验的方法不同,Venus能够快速完成从蛋白质序列到功能的预测,使蛋白质改造从低效的”大海捞针”转向精准设计。

    据介绍,使用这一创新工具,研究人员只需提供目标蛋白质的序列信息,Venus即可迅速生成一批改造方案。通过结合实验室验证,最终可获得最优解决方案。目前基于该模型设计的多款蛋白质已进入产业化阶段,例如在PET降解酶和高活性碱性磷酸酶等关键生物技术领域的突破。

    这一突破性的研究进展将极大提升酶分子改造效率,有望解决传统酶进化和设计的技术难题,为生物制造系统的关键共性技术研发提供重要助力。专家表示,该成果将推动化学-酶法级联合成设计领域的发展,为天然产物及手性药物分子合成开辟新路径。

  • 香港首个自研生成式AI大模型即将推出

    香港首个自研生成式AI大模型今年将推出

    世界互联网大会国际组织今天在中国北京举行新闻发布会,介绍2025年世界互联网大会亚太峰会的基本情况、总体筹备进度及亮点特色。香港特区政府创新科技及工业局局长孙东透露,首个由香港自主研发的生成式AI大模型今年将正式推出给全社会应用。孙东强调,开发的同时也注重治理,专家小组经过一年多仔细研究,即将推出生成式人工智能指引,对象包括人工智能技术开发者、服务提供商及应用者。世界互联网大会秘书长任贤良介绍,今年二月,香港生成式人工智能研发中心发布了首个人工智能大模型,并计划成立香港人工智能研发院。

    —— 大湾区之声

  • 百度文心大模型4.5及深度思考模型X1发布

    百度发布文心大模型4.5及支持深度思考的X1

    百度今日正式发布文心大模型4.5和文心大模型X1,目前,两款模型已在文心一言官网上线,免费向用户开放。同时,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品,将陆续接入文心大模型4.5和文心大模型X1,为用户带来更多元的体验。文心大模型4.5是百度首个原生多模态大模型,在多模态理解、文本和逻辑推理等方面有显著提升,多项测试表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1则是一款深度思考模型,同时还支持多模态、多工具调用能力,API调用价格约为R1的一半。

    —— 百度

  • 富士康推出台湾首个推理人工智能大模型

    富士康推出台湾首个推理人工智能大模型

    富士康当地时间周一表示,该公司推出自有大语言模型,该模型具有推理能力,由公司内部开发,仅用四周时间就完成了训练。富士康称,这款名为FoxBrain的人工智能模型最初是为公司内部应用而设计,涵盖数据分析、数学、推理和代码生成等功能。富士康表示,英伟达提供了其台湾超级计算机的支持和技术咨询,使模型训练取得成功,并打算将该模型开源。该公司表示,栗永徽的团队使用120块英伟达H100图形处理器,在大约四周时间内完成了FoxBrain的训练。模型以Meta Llama 3.1为基础架构,是台湾首个具有先进推理能力的大语言模型,专为繁体中文设计和优化,富士康表示,其模型的部分性能略逊于中国DeepSeek部分模型。

    —— 华尔街日报

  • 大模型工具Ollama存在安全风险

    大模型工具 Ollama 存在安全风险

    3月3日,据清华大学网络空间测绘联合研究中心分析,开源跨平台大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患。多数用户使用Ollama私有化部署且未修改默认配置,存在数据泄露、算力盗取、服务中断等安全风险。使用Ollma在本地部署大模型时,会在本地启动一个Web服务,并默认开放11434端口且无任何鉴权机制。该服务直接暴露在公网环境,而攻击者可利用Ollama框架历史漏洞,直接调用模型接口实施数据投毒、参数窃取、恶意文件上传及关键组件删除等操作。建议更新至最新安全版本、配置防火墙规则、仅允许11434端口本地访问,并验证端口状态等。

    —— 国家网络安全通报中心

  • 百度宣布新版文心大模型4.5即将发布

    百度宣布文心大模型4.5将于3月16日发布

    百度宣布,文心大模型4.5将于3月16日正式上线。据百度介绍,最新版不仅在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。在此前的百度财报后的电话会上,百度董事长李彦宏透露,文心大模型4.5将开源,4.5 将是百度有史以来最强大的大模型。李彦宏表示,开源4.5系列的决策源自于对技术领先地位的信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力,但我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。未来,百度将加速推动文心大模型的性能升级与成本降低。

    —— 百度、界面新闻

  • 阿里万相视频生成大模型开源

    阿里旗下万相视频生成大模型宣布开源

    阿里云旗下视觉生成基座模型万相2.1(Wan)宣布开源,开源采用的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。据介绍,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集VBench中,万相2.1以总分86.22%的成绩超越Sora、Luma、Pika等国内外模型,稳居榜首位置。1.3B版本测试结果不仅超过了更大尺寸的开源模型,甚至还接近部分闭源模型,同时能在消费级显卡运行,仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

    —— Github、HuggingFace、魔搭社区

  • 马斯克的 Grok 3 仍未能回答经典用来刁难大模型的问题

    马斯克的 Grok 3 答不对9.11和9.9哪个大

    北京时间2月18日,马斯克与 xAI 团队,在直播中正式发布了 Grok 最新版本 Grok3。从现场展示的数据来看,Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型。然而测试最新的 Beta 版 Grok3,并提出了那个经典的用来刁难大模型的问题:「9.11 与 9.9 哪个大?」遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的 Grok3,仍然无法正确回答这个问题。在海外也有很多类似问题的测试,例如「比萨斜塔上两个球哪个先落下」这些基础物理/数学问题,Grok3 也被发现仍然无法应对。

    —— 极客公园

  • 大模型创新不再依赖最先进硬件

    官媒:大模型创新不一定要依赖最先进硬件

    OpenAI以规模作为大模型的制胜法宝:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种开发模式,带来了惊人的能源消耗和训练成本,难以为继。而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型瘦身新风尚,走出一条“小而强”的新路径。以DeepSeek公司为例,R1在多个基准测试中与OpenAI的o1持平,但成本仅为o1的三十分之一。DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。

    —— 中国官媒《经济日报》