编辑
2025-07-20
Brief News
00

![[d503908f-8148-498a-9ae8-24755ad49365.mp3]]

马斯克xAI将研发面向儿童的AI应用Baby Grok

简报:

  • 2025年7月20日,埃隆·马斯克在社交平台X宣布,其人工智能公司xAI将开发一款专门为儿童设计的应用“Baby Grok”。
  • 马斯克表示“Baby Grok”将为儿童提供“友好型内容”,但尚未透露该应用的具体功能细节。

相关链接:

编辑
2025-07-20
Brief News
00

![[74906824-aa5a-48fd-901f-a11648c5e83d.mp3]]

中国开源大模型包揽全球前三,Kimi K2夺冠

简报:

  • 据全球大模型竞技场LMArena消息,在最新开源模型排行榜中,来自中国的Kimi K2、DeepSeek R1和Qwen3分列全球前三,超过谷歌Gemma3和Meta旗下Llama4。
  • Kimi K2位居第一,成为全球最强开源模型,该榜单由数千位开发者通过动态盲测投票产生。
  • 英伟达CEO黄仁勋近期在北京表示,DeepSeek、Qwen和Kimi为全球领先的开源模型。

相关链接:

编辑
2025-07-18
Brief News
00

![[b940349a-43bf-4bfd-8259-e2c38fde4ff7.mp3]]

OpenAI发布新一代ChatGPT智能体,开启AI自动化办公新时代

简报:

  • 2025年7月18日,OpenAI正式发布新一代ChatGPT Agent,集成了Operator网页交互与Deep Research深度分析能力,实现从对话助手迈向自主任务执行者的跨越。
  • ChatGPT Agent支持主动作业,包括浏览网页、自动购物、生成可编辑PPT、处理复杂的办公和个人任务,并可访问Gmail、GitHub等应用进行多样化办公自动化。
  • 在行业多项基准测试中,Agent表现优越:如“Humanity's Last Exam”测试准确率41.6%,在金融建模、电子表格编辑及Web任务等场景均超越微软Co-pilot等竞品。
  • 用户通过自然语言指令即可启用Agent,享受包括自动报告生成、会议安排、数据分析等自动化生产力服务,且执行敏感操作需用户授权,保证数据安全与隐私。
  • 此功能现已向ChatGPT Pro、Plus、Team用户开放,企业与教育用户将于7月后陆续获取权限,欧盟及瑞士地区暂未上线。未来计划集成更多功能,有望影响办公行业新格局。

相关链接:

编辑
2025-07-17
Brief News
00

![[44b5e654-7b70-4f57-9891-3a7766fb09a6.mp3]]

OpenAI推出Agent Mode,集成浏览器与云端文件高效生成智能报告

简报:

  • OpenAI即将发布全新Agent Mode(代理模式),融合Operator的浏览器自动化与Deep Research的深度研究功能。
  • 用户通过简单指令可自动完成网页任务、分析Google Drive、Dropbox等云端文件,并一键生成结构化、带引用的专业报告。
  • Agent Mode适用于个人旅行规划、企业数据分析等多场景,支持市场主流云存储服务,无需额外API即可与网页交互。
  • 技术基础为OpenAI的CUA和预期o3大模型,具备多重安全措施,支持多用户与企业集成,未来还将开放API和SDK供开发者自定义应用。
  • 该功能预计将逐步向ChatGPT Plus、Team和Enterprise用户开放,标志着OpenAI在AI代理领域的技术突破和生态扩展。

相关链接:

编辑
2025-07-16
Brief News
00

![[f5e9eef3-2026-4f18-b553-9be46c87b431.mp3]]

字节跳动POLARIS新方法让4B小模型数学推理能力媲美超大模型

简报:

  • 字节跳动Seed团队联合高校推出强化学习训练方法POLARIS,通过Scaling RL等创新手段,使4B参数开源模型Qwen3-4B在AIME数学测试中的表现接近闭源235B大模型,并实现轻量级本地部署;
  • POLARIS核心在于定制训练数据和动态超参数调整、多阶段RL训练、采样温度控制及长度外推技术等,显著提升了小模型的数学推理与长上下文处理能力;
  • 相关训练方法、数据和模型已全量开源,验证了在不同模型规模和家族中的推广效果。

相关链接: