编辑
2025-05-30
Brief News
00

![[767d95ce-e270-4bd2-ab78-b7a26e118058.mp3]]

华为昇腾大模型实现无需GPU极速解答高数题

简报:

  • 华为最新发布的“昇腾 + Pangu Ultra MoE”系统,展示了近万亿参数的MoE大模型在无GPU环境下,仅用2秒即可理解并解答一道高等数学题,突显了华为在自主可控算力和模型训练方面的突破。
  • 技术上,华为通过优化并行策略、通信机制和负载均衡,有效提升集群训练效率,并在CloudMatrix384超节点等硬件上实现高效负载均衡与通信开销极低。
  • 华为还优化了单节点计算能力,提升了微批处理规模,显著增强了系统处理复杂计算任务的资源利用率。
  • 这些创新不仅大幅提升了大模型训练效率,还为未来AI大规模应用和复杂任务处理开辟了新前景。

相关链接:

编辑
2025-05-30
Brief News
00

![[5eab4c94-a1e2-416c-a0eb-951d0d9cbba9.mp3]]

DeepSeek-R1-0528开源,编程能力直逼OpenAI o3

简报:

  • DeepSeek-R1-0528模型于5月29日凌晨在HuggingFace开源,采用MIT协议
  • 新模型在LiveCodeBench基准测试中性能接近OpenAI o3-high和o4-mini
  • 编程能力显著提升,实测超越Claude 4 Sonnet,首次运行即可生成完美代码
  • 支持长时间思考,单任务处理时长可达30-60分钟,实测思考时间超过25分钟
  • 基于DeepSeek-V3-0324训练,总参数685B,支持BF16格式
  • 在文本生成、推理能力和前端设计等方面均有明显改进

相关链接:

编辑
2025-05-29
Brief News
00

![[576cb290-fce3-4f77-9d39-e7d4ec70a15e.mp3]]

Meta拆分AI部门为两大团队:消费产品与AGI研究

简报:

  • Meta于2025年5月正式将AI部门拆分为两个独立方向:面向消费者的AI产品团队和追求通用人工智能(AGI)的AGI Foundations基础组
  • AI Products团队将直接对接Facebook、Instagram、WhatsApp等社交平台及独立AI应用,将Llama模型转化为用户可感知的产品
  • AGI Foundations团队专注于改进Llama模型架构、探索多模态能力和评估推理效率,对标DeepMind与Anthropic的研究模式
  • 此次拆分源于Meta在AI领域研究导向与产品落地之间的长期矛盾,Llama系列虽在开源界获得声誉但未转化为用户增长或商业闭环

相关链接:

编辑
2025-05-28
Brief News
00

![[eb8c96fa-3c9c-4282-8ca8-0aaad94c4ea6.mp3]]

腾讯混元开源新模型,简化数字人语音驱动视频生成

简报:

  • 腾讯今日宣布开源混元语音数字人模型 HunyuanVideo-Avatar,该模型由腾讯混元视频大模型与腾讯音乐天琴实验室 MuseV 技术联合研发,仅需上传一张人物图像和一段音频,便可生成图中人物自然说话或唱歌的视频。
  • HunyuanVideo-Avatar 支持头肩、半身与全身等多种景别,并具备多风格、多物种及双人场景能力,适用于短视频、电商、广告等创作领域。
  • 模型可自动理解图片和音频内容,实现自然表情、唇形同步及全身动作,提升数字人视频生成的真实性和动态性,大幅降低内容制作难度与成本。
  • 目前该模型单主体能力已开源,用户可在腾讯混元官网体验,支持上传不超过14秒的音频并生成相应视频,后续将继续拓展功能与开源范围。

相关链接:

编辑
2025-05-28
Brief News
00

![[fcf5c4e6-a780-4935-a82a-afe1ba9b81ab.mp3]]

SAP与阿里通义千问合作推动AI生态集成

简报:

  • SAP宣布正式接入阿里巴巴的大模型平台“通义千问”,成为该平台的企业级生态合作方。
  • 此举旨在推动SAP与中国本土AI生态的深度融合,为企业客户提供更智能化的数字化解决方案。
  • 双方合作将促使SAP在智能应用与本地AI能力的结合上取得新进展,助力企业加速实现数智化转型。

相关链接: