请注意,本文编写于 32 天前,最后修改于 32 天前,其中某些信息可能已经过时。
目录
DeepSeek-Prover-V2发布,数学推理能力显著提升

DeepSeek-Prover-V2发布,数学推理能力显著提升
简报:
- DeepSeek团队发布了DeepSeek-Prover-V2模型,包含7B和671B两种参数规模版本。
- 671B版本基于DeepSeek-V3-Base训练,在MiniF2F-test数据集上达到88.9%通过率。
- 7B版本支持32K token上下文长度,在某些问题上表现优于671B版本。
- 模型采用递归定理证明管道和强化学习技术,将复杂问题分解为子目标进行推理。
- 团队同时发布了ProverBench基准数据集,包含325个形式化数学问题。
- 模型已在Hugging Face和GitHub开源,技术报告同步发布。
Prover
/ˈpruː.vər/
n. 证明器
▶ "DeepSeek-Prover-V2 model adopts recursive theorem proving pipeline."
[例句] DeepSeek-Prover-V2模型采用递归定理证明管道。
◼
衍生词
prove (v.)
证明
proof (n.)
证据
阿里发布开源AI模型Qwen3,性能超越全球顶尖模型
简报:
- 阿里巴巴于4月29日发布新一代通义千问模型Qwen3,登顶全球最强开源模型
- Qwen3采用混合专家(MoE)架构,总参数量235B,激活仅需22B
- 性能超越DeepSeek-R1、OpenAI-o1等全球顶尖模型,在AIME25测评中斩获81.5分
- 首创"混合推理模型"架构,支持快思考(毫秒级响应)和慢思考(深度推理)模式
- 部署成本大幅降低,仅需4张H20即可部署满血版,显存占用为性能相近模型1/3
- 支持119种语言,开源2小时内GitHub星数达17k
- 华为昇腾、NVIDIA等多家芯片厂商已成功适配Qwen3
Architecture
/ˈɑːr·kɪ·tek·tʃər/
n. 架构
▶ "Qwen3 adopts a novel Mixture of Experts (MoE) architecture with 235B total parameters."
[例句] Qwen3采用新颖的混合专家(MoE)架构,总参数量达2350亿。
◼
衍生词
architect (n.)
建筑师
architectural (adj.)
建筑学的
AI智能体能力每4个月翻一番
简报:
- AI编程智能体的能力正以指数级速度增长,最新研究揭示了「新摩尔定律」。
- 2024到2025年,AI智能体的任务处理能力每4个月翻一倍;2019到2025年,这个翻倍周期是7个月。
- 顶尖AI系统可以完成的任务长度呈指数级增长,每7个月翻一番。
- 如果按照当前趋势推算,AI智能体将能够完成:2026年2小时的任务;2027年1个工作日(8小时)的任务;2028年1个工作周(40小时)的任务;2029年1个工作月(167小时)的任务。
- 如果按照2024-2025年加速的趋势(每4个月翻倍)推算,AI智能体可能在2027年就能完成月级任务(167小时)。
Exponential
/ˌek·spəˈnen·ʃəl/
adj. 指数的
▶ "AI agents' capabilities are growing at an exponential rate."
[例句] AI智能体的能力正以指数级速度增长。
微软CEO称公司30%代码由AI生成,扎克伯格预测明年AI生成代码比例将达50%
简报:
- 微软CEO萨蒂亚·纳德拉在Meta首届LlamaCon大会上透露,微软代码库中20%-30%的代码由AI生成,且比例持续上升
- Meta CEO马克·扎克伯格表示,Meta正在开发能自主构建下一代Llama系列AI模型的系统,预测明年50%的开发工作将由AI完成
- 谷歌CEO桑达尔·皮查伊此前披露,谷歌超过30%的新代码由AI生成
- 微软CTO凯文·斯科特预测,到2030年95%的代码将由AI生成
Generate
/ˈdʒen·əˌreɪt/
v. 生成
▶ "Microsoft CEO revealed that 30% of the company's code is generated by AI."
[例句] 微软CEO透露公司30%的代码由AI生成。
◼
衍生词
generation (n.)
生成
generative (adj.)
生成的
简报:
- Meta发布独立AI应用,扎克伯格强调开源重要性,与DeepSeek、Qwen等开源模型共同对抗闭源AI(来源:itbear.com.cn)
- Meta开源大语言模型LLaMA,参数规模从7B到65B,向研究社区开放(来源:网易)
- 扎克伯格在SIGGRAPH 2024与黄仁勋对谈,表示Meta最新开源模型Llama 3.1在16000个NVIDIA H100 GPU上训练(来源:虎嗅网)
- 扎克伯格批评闭源AI公司"试图创造上帝",Meta旗下Llama-3是全球最强开源AI大模型之一(来源:搜狐)
- Meta发布计算机视觉开源项目DINOv2,支持深度估计、语义分割等自监督训练(来源:36氪)
Open-source
/ˌoʊ.pənˈsɔːrs/
adj. 开源的
▶ "Meta emphasizes the importance of open-source AI to compete with closed-source models."
[例句] Meta强调开源AI的重要性以对抗闭源模型。
◼
衍生词
open-source software (n.)
开源软件
本文作者:topwind
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA
许可协议。转载请注明出处!