编辑
2025-12-12
Brief News
00

谷歌抢发Gemini研究代理,与OpenAI上演AI卡位战

简报:

  • 谷歌在OpenAI发布GPT-5.2前夕,抢先上线了基于最新Gemini 3 Pro模型的AI研究代理“Gemini Deep Research”。
  • 该工具专为处理海量信息和复杂研究任务设计,并首次通过Interactions API向开发者开放,允许将研究能力嵌入第三方应用。
  • 为应对AI“幻觉”,Gemini 3 Pro特别优化了事实准确性,并推出了新的基准测试DeepSearchQA来验证其能力。
  • OpenAI随后正式发布GPT-5.2,其CEO萨姆·奥尔特曼表示,曾因Gemini的威胁在内部拉响“红色警报”,但其实际影响小于预期,警报将于明年1月结束。

相关链接:

编辑
2025-12-12
Brief News
00

Runway推出世界模型GWM-1,进军通用人工智能赛道

简报:

  • AI视频公司Runway发布其首个通用世界模型(GWM-1),旨在通过预测视频像素来构建一个可理解物理规律的动态仿真环境,与谷歌、OpenAI等巨头竞争下一代人工智能基础设施。
  • GWM-1初期将以三个分支落地:用于生成交互式动态世界的GWM-Worlds、辅助机器人训练的GWM-Robotics,以及生成数字人的GWM-Avatars,最终目标是融合成统一模型。
  • Runway同时升级了其Gen4.5视频生成模型,新增了原生音频生成、一分钟多镜头视频合成、保持角色一致性等功能,并已向所有付费用户开放。

相关链接:

编辑
2025-12-10
Brief News
00

单词学习:![[c4ebb875-79ff-4686-ac29-80bc843a5291.mp3]]

新闻播报:![[7f9021ae-502c-4122-9fd1-6279e833cf04.mp3]]

阿里千问月活破3000万,发力C端推AI PPT等新功能

简报:

  • 阿里巴巴宣布旗下大模型应用“千问”自公测23天后,月活跃用户数已突破3000万。
  • 官方同步向所有用户开放四项新功能:AI PPT、AI写作、AI文库和AI讲题。
  • 为加速C端业务发展,阿里已组建“千问C端事业群”,由集团副总裁吴嘉负责,并整合了夸克、UC浏览器等业务。
  • 该事业群的目标是将千问打造为AI时代的超级App,并计划将服务拓展至眼镜、PC、汽车等多种终端。

相关链接:

编辑
2025-12-09
Brief News
00

单词学习:![[607f9a83-eace-46e2-9ad6-78347e3940f2.mp3]]

新闻播报:![[1ff3e1f9-432f-4688-9e04-095335fa69fc.mp3]]

MIT新技术让大模型按需“思考”,计算量减半

简报:

  • 麻省理工学院(MIT)研究团队发布名为“实例自适应缩放”的新技术,旨在根据问题复杂性动态调整大型语言模型(LLM)的计算资源。
  • 该方法通过重新设计推理过程奖励模型(PRMs),使模型在处理简单问题时使用更少资源,处理复杂问题时获得更多推理支持。
  • 研究显示,新技术可将计算资源使用量减少一半,同时保持与现有模型相当的回答准确率。
  • 该研究得到了 MIT-IBM 沃森人工智能实验室、MIT-Amazon 科学中心及 MIT-Google 计算创新项目等的支持。

相关链接:

编辑
2025-12-08
Brief News
00

单词学习:![[c2f8083b-dd72-4a36-8d12-76500dd49f36.mp3]]

新闻播报:![[aceacda4-6104-4327-b699-f9dcca81adec.mp3]]

小模型大胜利:英伟达凭合成数据与低成本策略击败GPT-5 Pro

简报:

  • 英伟达的4B小模型NVARC在ARC-AGI 2公开榜上以27.64%的成绩登顶,击败了得分18.3%的GPT-5 Pro。
  • 该模型完成单任务的成本仅为20美分,约为GPT-5 Pro(超过7美元)成本的1/36。
  • NVARC的获胜策略是零预训练深度学习方法,通过离线生成大规模高质量的合成数据来训练基于Qwen3-4B的小模型。
  • 关键技术为“测试时微调”(TTFT),即在评估阶段针对每个新问题都使用LoRA技术进行快速微调,以适应新规则。

相关链接: