标签：数学

月之暗面的新一代数学推理模型发布

月之暗面发布新一代数学推理模型

月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示，Kimi k0-math的数学能力可对标OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型和Kimi探索版，未来几周将会分批上线Kimi网页版和Kimi智能助手APP。

—— 界面新闻

2024年12月5日
谷歌 DeepMind 人工智能可解数学奥林匹克

谷歌 DeepMind 称其人工智能可以解决数学奥林匹克问题

字母表公司的人工智能研究部门 DeepMind 表示，该部门在解决复杂数学问题方面取得了进展，而这一领域对于当今的人工智能程序来说仍然具有挑战性。当地时间7月25日，谷歌推出了专注于数学推理的 AlphaProof 和 AlphaGeometry 2，后者是该公司今年早些时候推出的专注于几何模型的升级版。谷歌在一篇博客文章中表示，这些模型在国际数学奥林匹克竞赛的六道题中四道都取得了优异成绩。在产品之间难以进行比较的人工智能行业中，解决数学问题已成为一个关键的证据点。

—— 彭博社

2024年12月5日
中国数学水平不及美国1940年代

数学家丘成桐：中国数学水平尚不及美国1940年代

丘成桐说，中国要在科技上成为强国，就须掌握基础科学，而数学是物理学和一切工程理论的基础，但目前中国数学界对中国数学水平处在世界上什么位置并没有搞清楚。

他说，任何一个强大的现代化国家，数学成就必须名列前茅，英国、法国、美国、俄罗斯、日本等国都有很高水平，中国数学还没有到达这个成就。丘成桐直指，中国数学的水平尚不及美国上世纪40年代。

他指出，中国评估奖项和晋升大部分意见由国内同行决定，而重要学者年纪偏大，往往因循守旧。在此背景下，年轻学者会继续因循守旧，逐渐和世界前沿发展脱轨。丘成桐又批评，中国诱导学者做学问的方法太过注重物质奖励，没有照顾到学问本身的成就。年轻人不敢去做最前沿的学问，因为部分评委不懂这些前沿学问，也怀抱私心，他们恐怕前沿学问在中国流行以后，自己没有一席之地。

—— 联合早报

2024年12月5日
谷歌DeepMind破解了著名数学难题

谷歌 DeepMind 利用大型语言模型解决了一个长期困扰人类的数学难题

谷歌 DeepMind 利用一大型语言模型成功破解了一项著名的未解数学难题。研究人员发表在《自然》杂志上的一篇论文中表示，这是首次使用大型语言模型发现长期科学难题的解决方案，产生了可验证且有价值的新信息，这些信息之前并不存在。“这不在训练数据中，甚至以前都不知道，”谷歌 DeepMind 研究副总裁 Pushmeet Kohli 说道。

它结合了一个名为Codey的大型语言模型，这是Google的PaLM 2的一个版本，经过对计算机代码进行了精细调整，还与其他系统结合使用，拒绝不正确或荒谬的答案，并将正确的答案重新插入其中。

经过数百万次建议和几十次总体过程的重复——这花了几天的时间——FunSearch能够提出代码，产生了一个正确且以前未知的解决方案，解决了cap set 问题，涉及找到某一类型集合的最大大小。

—— 麻省理工科技评论

2024年12月5日

标签： 数学

月之暗面的新一代数学推理模型发布

谷歌 DeepMind 人工智能可解数学奥林匹克

中国数学水平不及美国1940年代

谷歌DeepMind破解了著名数学难题

标签：数学