编辑
2025-07-17
Brief News
00

![[44b5e654-7b70-4f57-9891-3a7766fb09a6.mp3]]

OpenAI推出Agent Mode,集成浏览器与云端文件高效生成智能报告

简报:

  • OpenAI即将发布全新Agent Mode(代理模式),融合Operator的浏览器自动化与Deep Research的深度研究功能。
  • 用户通过简单指令可自动完成网页任务、分析Google Drive、Dropbox等云端文件,并一键生成结构化、带引用的专业报告。
  • Agent Mode适用于个人旅行规划、企业数据分析等多场景,支持市场主流云存储服务,无需额外API即可与网页交互。
  • 技术基础为OpenAI的CUA和预期o3大模型,具备多重安全措施,支持多用户与企业集成,未来还将开放API和SDK供开发者自定义应用。
  • 该功能预计将逐步向ChatGPT Plus、Team和Enterprise用户开放,标志着OpenAI在AI代理领域的技术突破和生态扩展。

相关链接:

编辑
2025-07-16
Brief News
00

![[f5e9eef3-2026-4f18-b553-9be46c87b431.mp3]]

字节跳动POLARIS新方法让4B小模型数学推理能力媲美超大模型

简报:

  • 字节跳动Seed团队联合高校推出强化学习训练方法POLARIS,通过Scaling RL等创新手段,使4B参数开源模型Qwen3-4B在AIME数学测试中的表现接近闭源235B大模型,并实现轻量级本地部署;
  • POLARIS核心在于定制训练数据和动态超参数调整、多阶段RL训练、采样温度控制及长度外推技术等,显著提升了小模型的数学推理与长上下文处理能力;
  • 相关训练方法、数据和模型已全量开源,验证了在不同模型规模和家族中的推广效果。

相关链接:

编辑
2025-07-15
Brief News
00

![[a849c8e2-f399-4d06-a924-fa9df63d792d.mp3]]

Grok4人工智能模型展现强大编程与多模态推理能力

简报:

  • 马斯克旗下xAI发布的新一代AI模型Grok4在不到24小时内引发网络热潮,成功完成六边形小球等编程测试,表现出色。
  • Grok4不仅游刃有余地应对多层推理、法律分析、跨语言编程和年龄定制解释,还能生成动画和进行SVG视觉推理。
  • 在与OpenAI o3等竞争对手的比拼中,Grok4表现更优异,获得开发者与业界关注,被评价为通向通用人工智能的关键一步。
  • 用户和行业专家认为Grok4多领域、多模态能力将为工作与生活带来显著便利。

相关链接:

编辑
2025-07-14
Brief News
00

![[c40a7700-3081-4e96-a67d-121b664b53b4.mp3]]

Liquid AI开源高效LFM2模型,推动边缘AI性能和能效革新

简报:

  • Liquid AI正式开源其下一代Liquid Foundation Models(LFM2)系列,该模型专为边缘设备设计,涵盖350M、700M和1.2B三种参数规模,采用创新的结构化自适应算子架构。
  • LFM2推理速度比Qwen3快2倍,训练速度较前代提升3倍,在指令跟随和函数调用等关键任务中平均性能超越同类模型。
  • 模型支持32K上下文长度、bfloat16精度、65K词汇表,并优化本地化隐私保护和低能源消耗,适用于智能手机、笔记本、汽车等边缘场景。
  • LFM2模型权重已全部开源,开发者可在Hugging Face获取,并支持在Liquid Playground平台测试,进一步推动全球AI创新与普及。

相关链接:

编辑
2025-07-14
Brief News
00

![[992a2834-8949-4f4f-b99b-9746e2c54c8a.mp3]]

Perplexity CEO称计划用Kimi K2大模型进行后训练

简报:

  • 美国AI搜索初创公司Perplexity的CEO Aravind Srinivas表示,将利用月之暗面刚开源的Kimi K2模型进行后训练,此前已经将DeepSeek R1纳入模型训练体系。
  • Kimi K2为基于MoE架构、参数量达1万亿的开源大模型,在多项全球主流性能基准测试中成绩领先,目前模型权重和API已在HuggingFace等平台开放。
  • Perplexity此次引入Kimi K2,反映出业界对国产开源大模型性能和技术的高度认可和关注。

相关链接: