编辑
2025-08-14
Brief News
00

![[349c762a-9391-4916-9e4e-591ec72f5af1.mp3]]

华人研究揭示:扩散模型数据学习潜力三倍于自回归模型

简报:

  • 一项由华人团队完成的研究表明,在Token数量受限的情况下,扩散语言模型的的数据学习潜力是传统自回归模型的三倍。
  • 研究中,一个10亿参数的扩散模型使用10亿Token训练480个周期后,在HellaSwag和MMLU基准测试上分别达到56%和33%的准确率,且性能未现饱和。
  • 该模型强大的数据学习能力归因于其双向建模机制和更高的计算密度,使其能更全面地从数据中提取信息。
  • 研究还发现,即使模型在训练中出现过拟合,其在下游任务中的性能也并未立即下降,有时甚至会继续提升。
  • 这一发现为AI模型在数据有限情况下的训练提供了新思路。

相关链接:

编辑
2025-08-13
Brief News
00

![[b921d8e1-a4e3-4832-9171-7b9d174ffb02.mp3]]

华人团队新发现:扩散模型数据学习能力远超自回归

简报:

  • 一项由华人团队主导的研究显示,在Token数量有限的情况下,扩散语言模型的数据学习潜力是传统自回归模型的三倍。
  • 研究将扩散模型的优势归因于其双向建模能力和更高的计算密度,使其能更全面地挖掘数据信息,即使在数据重复训练下性能也未饱和。
  • 研究中一个10亿参数的扩散模型在HellaSwag和MMLU基准测试中分别达到了56%和33%的准确率。
  • 该发现为未来AI模型在有限数据环境下的训练方法提供了新思路,尤其是在Token数量受限的场景中。

相关链接:

编辑
2025-08-12
Brief News
00

![[640e10cf-5b22-4f70-a021-e5f2f55d3719.mp3]]

OpenAI通用AI模型首夺信息学奥赛金牌,位列总榜第六

简报:

  • 在2025年国际信息学奥林匹克竞赛(IOI)中,OpenAI的AI模型获得金牌,在所有参赛AI中排名第一,总榜位列第六。
  • 该模型的成绩超过了98%的参赛者,相较于去年仅取得49百分位的成绩有显著提升。
  • 据OpenAI研究员称,参赛模型为通用的“模型集群”,并未针对IOI赛事进行专门训练,其参赛流程与人类选手一致。
  • 此模型此前也曾在国际数学奥林匹克竞赛(IMO)中获得金牌,并在AtCoder编程竞赛中取得第二名。

相关链接:

编辑
2025-08-11
Brief News
00

![[b537ef81-3061-41fe-8853-bb6aa2cdf8a3.mp3]]

首个隧道建造AI大模型问世,赋能行业数智化转型

简报:

  • 由中国中铁隧道局研发的我国首个隧道与地下空间垂直大模型正式发布,旨在推动隧道建造行业的数智化。
  • 该模型基于773条工程线路和1200亿条工程数据构建,其核心技术体系为“通用大模型调度中小模型”。
  • 模型集成了“隧道侠AI助手”,可提供专业问答、标准查询、方案辅助编制等功能,并实现了设计BIM可视化、施工评估等智能化决策。
  • 目前,该大模型已在高原铁路隧道、崇太长江隧道等多个国家重大工程中完成验证,实现了安全、优质、高效、绿色的建造目标。

相关链接:

编辑
2025-08-11
Brief News
00

![[3c9506bb-b4d7-4c41-8abf-7df0897eb479.mp3]]

OpenAI发布免费GPT-5,微软生态同步全面集成

简报:

  • OpenAI正式发布GPT-5系列模型,并向全球用户免费开放。其核心是集成了文本、图像和语音的多模态推理架构,能根据任务复杂度自动切换模式。
  • GPT-5被称为“博士生水平的AI”,在推理、编程和创意写作方面实现重大突破,在AIME2025评测中表现优于竞争对手。
  • 微软宣布旗下Copilot、Microsoft 365 Copilot、Azure AI Foundry及GitHub Copilot等核心产品已全面深度整合GPT-5。
  • 开发者可通过Azure AI Foundry直接调用新模型,付费GitHub Copilot用户也可使用GPT-5提升代码生成和逻辑优化效率。
  • 模型引入了“安全完成”机制以智能过滤不当内容,并提供更多个性化设置,支持与Gmail、谷歌日历等外部服务集成。

相关链接: