![[57877f4c-aa96-4c9f-b179-6c5a03494d51.mp3]]

智谱AI发布开源多模态视觉语言大模型GLM-4.1V-Thinking,性能对标国际顶尖产品
简报:
- 智谱AI正式开源通用视觉语言模型GLM-4.1V-Thinking,支持图像、视频及文档等多模态输入,采用创新思维链推理机制与课程采样强化学习策略,显著提升跨模态因果推理能力与稳定性。
- GLM-4.1V-Thinking轻量化实现(9B参数),在28项权威多模态评测中23项成绩达10B级模型最佳,18项持平或超越72B参数级的Qwen-2.5-VL,关键任务表现与OpenAI等全球顶尖模型比肩甚至超越。
- 新模型支持64K上下文与4K图像处理,具备中英文双语能力,广泛应用于长视频理解、图像问答、学科解题、GUI操作等领域,免费商用授权,单张3090显卡可部署。
- 模型权重已在Hugging Face与魔搭社区同步开源,进一步推动中国AI产业国际影响力提升,与OpenAI、Google等国际巨头正面竞争。
相关链接: