编辑
2025-07-20
Brief News
00

![[74906824-aa5a-48fd-901f-a11648c5e83d.mp3]]

中国开源大模型包揽全球前三,Kimi K2夺冠

简报:

  • 据全球大模型竞技场LMArena消息,在最新开源模型排行榜中,来自中国的Kimi K2、DeepSeek R1和Qwen3分列全球前三,超过谷歌Gemma3和Meta旗下Llama4。
  • Kimi K2位居第一,成为全球最强开源模型,该榜单由数千位开发者通过动态盲测投票产生。
  • 英伟达CEO黄仁勋近期在北京表示,DeepSeek、Qwen和Kimi为全球领先的开源模型。

相关链接:

编辑
2025-07-18
Brief News
00

![[b940349a-43bf-4bfd-8259-e2c38fde4ff7.mp3]]

OpenAI发布新一代ChatGPT智能体,开启AI自动化办公新时代

简报:

  • 2025年7月18日,OpenAI正式发布新一代ChatGPT Agent,集成了Operator网页交互与Deep Research深度分析能力,实现从对话助手迈向自主任务执行者的跨越。
  • ChatGPT Agent支持主动作业,包括浏览网页、自动购物、生成可编辑PPT、处理复杂的办公和个人任务,并可访问Gmail、GitHub等应用进行多样化办公自动化。
  • 在行业多项基准测试中,Agent表现优越:如“Humanity's Last Exam”测试准确率41.6%,在金融建模、电子表格编辑及Web任务等场景均超越微软Co-pilot等竞品。
  • 用户通过自然语言指令即可启用Agent,享受包括自动报告生成、会议安排、数据分析等自动化生产力服务,且执行敏感操作需用户授权,保证数据安全与隐私。
  • 此功能现已向ChatGPT Pro、Plus、Team用户开放,企业与教育用户将于7月后陆续获取权限,欧盟及瑞士地区暂未上线。未来计划集成更多功能,有望影响办公行业新格局。

相关链接:

编辑
2025-07-17
Brief News
00

![[44b5e654-7b70-4f57-9891-3a7766fb09a6.mp3]]

OpenAI推出Agent Mode,集成浏览器与云端文件高效生成智能报告

简报:

  • OpenAI即将发布全新Agent Mode(代理模式),融合Operator的浏览器自动化与Deep Research的深度研究功能。
  • 用户通过简单指令可自动完成网页任务、分析Google Drive、Dropbox等云端文件,并一键生成结构化、带引用的专业报告。
  • Agent Mode适用于个人旅行规划、企业数据分析等多场景,支持市场主流云存储服务,无需额外API即可与网页交互。
  • 技术基础为OpenAI的CUA和预期o3大模型,具备多重安全措施,支持多用户与企业集成,未来还将开放API和SDK供开发者自定义应用。
  • 该功能预计将逐步向ChatGPT Plus、Team和Enterprise用户开放,标志着OpenAI在AI代理领域的技术突破和生态扩展。

相关链接:

编辑
2025-07-16
Brief News
00

![[f5e9eef3-2026-4f18-b553-9be46c87b431.mp3]]

字节跳动POLARIS新方法让4B小模型数学推理能力媲美超大模型

简报:

  • 字节跳动Seed团队联合高校推出强化学习训练方法POLARIS,通过Scaling RL等创新手段,使4B参数开源模型Qwen3-4B在AIME数学测试中的表现接近闭源235B大模型,并实现轻量级本地部署;
  • POLARIS核心在于定制训练数据和动态超参数调整、多阶段RL训练、采样温度控制及长度外推技术等,显著提升了小模型的数学推理与长上下文处理能力;
  • 相关训练方法、数据和模型已全量开源,验证了在不同模型规模和家族中的推广效果。

相关链接:

编辑
2025-07-15
Brief News
00

![[a849c8e2-f399-4d06-a924-fa9df63d792d.mp3]]

Grok4人工智能模型展现强大编程与多模态推理能力

简报:

  • 马斯克旗下xAI发布的新一代AI模型Grok4在不到24小时内引发网络热潮,成功完成六边形小球等编程测试,表现出色。
  • Grok4不仅游刃有余地应对多层推理、法律分析、跨语言编程和年龄定制解释,还能生成动画和进行SVG视觉推理。
  • 在与OpenAI o3等竞争对手的比拼中,Grok4表现更优异,获得开发者与业界关注,被评价为通向通用人工智能的关键一步。
  • 用户和行业专家认为Grok4多领域、多模态能力将为工作与生活带来显著便利。

相关链接: