北京智谱华章科技有限公司今日宣布,旗下智谱GLM-PC正式开放体验,标志着自主操作电脑的多模态Agent技术再升级。GLM-PC基于智谱多模态大模型CogAgent,是全球首个面向公众、回车即用的电脑智能体,能够像人类一样“观察”和“操作”计算机,协助用户完成各类任务。
GLM-PC v1.0于2024年11月29日发布并开放内测,新增“深度思考”模式,强化逻辑推理和代码生成功能,同时支持Windows系统。其核心能力包括代码生成与逻辑执行、图像与GUI认知等。例如,GLM-PC可综合分析目标与资源,生成执行路径并自动分解任务;支持实时调整与自我纠错,确保任务精确完成。此外,它还能准确识别图形界面元素,结合用户行为认知提供智能推荐操作,并通过多模态信息融合实现精准操作规划。