编辑
2025-05-30
Brief News
00

![[5eab4c94-a1e2-416c-a0eb-951d0d9cbba9.mp3]]

DeepSeek-R1-0528开源,编程能力直逼OpenAI o3

简报:

  • DeepSeek-R1-0528模型于5月29日凌晨在HuggingFace开源,采用MIT协议
  • 新模型在LiveCodeBench基准测试中性能接近OpenAI o3-high和o4-mini
  • 编程能力显著提升,实测超越Claude 4 Sonnet,首次运行即可生成完美代码
  • 支持长时间思考,单任务处理时长可达30-60分钟,实测思考时间超过25分钟
  • 基于DeepSeek-V3-0324训练,总参数685B,支持BF16格式
  • 在文本生成、推理能力和前端设计等方面均有明显改进

相关链接:

编辑
2025-05-29
Brief News
00

![[576cb290-fce3-4f77-9d39-e7d4ec70a15e.mp3]]

Meta拆分AI部门为两大团队:消费产品与AGI研究

简报:

  • Meta于2025年5月正式将AI部门拆分为两个独立方向:面向消费者的AI产品团队和追求通用人工智能(AGI)的AGI Foundations基础组
  • AI Products团队将直接对接Facebook、Instagram、WhatsApp等社交平台及独立AI应用,将Llama模型转化为用户可感知的产品
  • AGI Foundations团队专注于改进Llama模型架构、探索多模态能力和评估推理效率,对标DeepMind与Anthropic的研究模式
  • 此次拆分源于Meta在AI领域研究导向与产品落地之间的长期矛盾,Llama系列虽在开源界获得声誉但未转化为用户增长或商业闭环

相关链接:

编辑
2025-05-28
Brief News
00

![[eb8c96fa-3c9c-4282-8ca8-0aaad94c4ea6.mp3]]

腾讯混元开源新模型,简化数字人语音驱动视频生成

简报:

  • 腾讯今日宣布开源混元语音数字人模型 HunyuanVideo-Avatar,该模型由腾讯混元视频大模型与腾讯音乐天琴实验室 MuseV 技术联合研发,仅需上传一张人物图像和一段音频,便可生成图中人物自然说话或唱歌的视频。
  • HunyuanVideo-Avatar 支持头肩、半身与全身等多种景别,并具备多风格、多物种及双人场景能力,适用于短视频、电商、广告等创作领域。
  • 模型可自动理解图片和音频内容,实现自然表情、唇形同步及全身动作,提升数字人视频生成的真实性和动态性,大幅降低内容制作难度与成本。
  • 目前该模型单主体能力已开源,用户可在腾讯混元官网体验,支持上传不超过14秒的音频并生成相应视频,后续将继续拓展功能与开源范围。

相关链接:

编辑
2025-05-28
Brief News
00

![[fcf5c4e6-a780-4935-a82a-afe1ba9b81ab.mp3]]

SAP与阿里通义千问合作推动AI生态集成

简报:

  • SAP宣布正式接入阿里巴巴的大模型平台“通义千问”,成为该平台的企业级生态合作方。
  • 此举旨在推动SAP与中国本土AI生态的深度融合,为企业客户提供更智能化的数字化解决方案。
  • 双方合作将促使SAP在智能应用与本地AI能力的结合上取得新进展,助力企业加速实现数智化转型。

相关链接:

编辑
2025-05-27
Brief News
00

![[8f63a542-9cf3-485c-bb2f-59a0f4643efb.mp3]]

研究揭示大语言模型数学推理存在严重缺陷

简报:

  • 最新研究发现大型语言模型(LLM)在数学推理方面存在严重缺陷,表现为"答案正确但过程错误"的现象
  • 研究团队提出MAPLE评估框架,系统检测到LLM在数学问题中频繁出现公式误用、逻辑混乱等问题
  • 实验显示LLM在处理基础加法时依赖记忆而非规则学习,符号替换测试中准确率从99.8%暴跌至7.5%
  • 简单问题如"13.8和13.11哪个大"难倒多数LLM,GPT-4o等主流模型均给出错误答案
  • 苹果公司研究证实LLM在数学问题中加入无关细节后表现急剧下降,显示其缺乏真正理解能力

相关链接: