编辑
2025-08-01
Brief News
00

![[9be78505-5564-425c-8c0d-d92a9c84d5d9.mp3]]

阶跃星辰开源3210亿参数MoE大模型Step 3

简报:

  • 阶跃星辰(StepFun)宣布正式开源其最新一代基础大模型Step 3,该模型专为追求性能与成本均衡的企业和开发者设计。
  • Step 3采用MoE架构,总参数量达3210亿,激活参数量380亿,具备强大的视觉感知和复杂推理能力。
  • 模型通过自研MFA注意力和AFD优化,大幅提升了推理效率,并可在8×48GB显卡上完成大吞吐量推理。
  • Step 3在MMMU、MathVision等多个权威评测集上表现领先,能够处理复杂的图文理解和逻辑推理任务。
  • 模型及配套的StepMesh通信库已在Github、Hugging Face和魔搭ModelScope平台开源,API也已上线其开放平台。

相关链接:

编辑
2025-07-31
Brief News
00

![[6399c79e-e753-4b74-87e0-9d97d103eb4a.mp3]]

网信办:中国AI个人用户注册破31亿,模型数量全球第一

简报:

  • 国家网信办透露,我国个人用户注册的大模型应用数量已超过31亿,服务通过网页、移动应用、API接口、本地及云服务等多种方式提供。
  • 全球已发布3755个大模型,其中中国企业贡献1509个,占全球总数的40%,位居世界首位。
  • 截至今年3月,中国已有346款生成式人工智能服务完成备案;到6月,用户使用AI产品进行问答的比例高达80.9%。
  • 预计到2024年,我国人工智能产业规模将突破7000亿元,并连续多年保持20%以上的增长率。

相关链接:

编辑
2025-07-31
Brief News
00

![[102dbe4d-dc57-405c-97f9-9b143be705e0.mp3]]

万兴天幕大模型文生视频能力位列国内第四

简报:

  • 根据大模型评测平台SuperCLUE发布的《7月文生视频大模型全球榜单》,万兴科技旗下万兴天幕音视频多媒体大模型2.0的基模能力(基于华为盘古大模型)综合评估位列国内第四。
  • 万兴科技与华为云已于7月29日举行“AI视频大模型实验室”揭牌仪式,双方将共同探索大模型创新及AI在数字创意场景的应用。

相关链接:

编辑
2025-07-30
Brief News
00

![[585dfd12-3a05-45bf-afc2-a2746fa76e37.mp3]]

OpenAI GPT-5发布在即,核心参数与功能前瞻

简报:

  • OpenAI的下一代大语言模型GPT-5预计将于2025年年中至晚些时候发布,具体时间可能在8月或更晚。
  • GPT-5的参数规模预计将显著超越前代模型,可能达到3至50万亿参数,甚至支持高达80万亿参数的模型,并采用统一架构。
  • 新模型将进一步增强多模态处理能力(文本、图像、语音、视频),显著提升高级推理能力和上下文窗口(可能达500万个token)。
  • GPT-5旨在将“幻觉”率降至10%以下,并可能引入自主AI代理功能和更强大的Canvas工作空间。
  • 模型训练成本高昂(超5亿美元),开发面临技术、资源、伦理和安全挑战。

相关链接:

编辑
2025-07-29
Brief News
00

![[28958c67-e560-4d0b-beb6-9bf87fb7cbf4.mp3]]

智谱AI发布GLM-4.5开源模型,原生融合推理、编码与智能体能力

简报:

  • 智谱AI于2025年7月28日发布新一代旗舰模型GLM-4.5,并已在Hugging Face与ModelScope平台开源。
  • 该模型是全球首个在单个模型中原生融合推理、编码和智能体三大核心能力的开源模型。
  • GLM-4.5在12个权威评测基准的综合评估中,取得全球第三、国产第一、开源模型第一的成绩。
  • 模型采用混合专家(MoE)架构,提供GLM-4.5(3550亿参数)和GLM-4.5-Air(1060亿参数)两个版本,具备高参数效率。
  • API调用价格大幅降低,输入定价为0.8元/百万tokens,输出为2元/百万tokens。
  • 用户可通过BigModel.cn开放平台调用API,或在智谱清言(chatglm.cn)和z.ai上免费体验。

相关链接: