“把客厅收拾一下,再给客人做杯奶茶。”随着指令下达,机器人环顾四周,识别出散落的物品。机械臂精准抓取扫帚,沿着计算好的路径清扫地面;任务完成后,它转向操作台,取杯、加茶、加奶、搅拌、递送,动作行云流水,一气呵成。整个过程没有人工干预,仿佛一位训练有素的管家。
这是近日记者在天津大学深度强化学习实验室里看到的一幕。机器人的“聪明劲”来自天津大学具身团队自主研发的具身基座模型Embodied-R1.5。在这间实验室里,一群年轻人正用行动让人工智能从“会算”走向“会干”,让实验室里的创新成果加速落地转化。
“大脑决策,小脑控制”
该实验室青年骨干汤宏垚副研究员告诉记者,让机器人收拾房间、制作奶茶,听起来不稀奇,但这背后的技术突破,并非那么简单。
传统的机器人只能在固定环境里按固定程序干活——工厂流水线上的机械臂,换个位置就不会动了;家里的扫地机器人,遇到障碍物常常“卡壳”。要让机器人像人一样灵活应对真实世界的变化,必须给它换一套“大脑”。
汤宏垚打了个比方:“我们给机器人设计了‘大脑+小脑’的分工架构。大脑是一个多模态大模型,负责理解任务意图、感知环境、进行长时序推理和规划。比如‘取水杯’这个指令,大脑要拆解成多个步骤,判断哪个杯子能用、有没有障碍物、先拿杯子还是先走过去。”
“小脑则是基于强化学习的决策控制模块,负责具体动作的精准执行。”他解释道,机械臂用多大力气拿杯子、怎么拿才能稳当又不捏碎、移动过程中如何保持平衡——这些精细活,都是小脑在实时计算和调整。
该实验室副教授马亿补充道,团队近期的攻关重点,正是“大脑+小脑”的协同配合。“大脑决策,小脑控制,两者配合好了,机器人在真实的居家环境里,就能自己琢磨着把活干好。”
搭载了新模型的机器人,不仅能收拾客厅、制作奶茶,还能按照指令擦花瓶、给手机充电、为客人冲咖啡、打包礼物。更关键的是,面对从没见过的场景,它也能“零样本适应”——不用提前学习,直接上手干活。
“这正是目前具身智能领域的前沿方向,也是未来家庭管家的雏形。”马亿说。
科研成果加速向产业一线延伸
走进这间实验室,记者感受到的不仅是技术的突破,更是一种向“实”而生的氛围。团队的科研成果正加速向产业一线延伸。
不久前,深度强化学习实验室凭借《基于强化学习的智能决策关键技术及应用》项目,荣获2025年度中国图象图形学学会科技进步奖一等奖。
这一荣誉的背后,是实实在在的应用成效:在芯片设计领域,项目成果成功应用于国产芯片设计软件的研发,支撑国内企业实现关键工具的自主可控;在文娱产业,技术落地于大型商业游戏,成为国内首个实现自动化测试的强化学习技术,极大提升了游戏开发和测试效率。
“我们希望能让人工智能技术真正走进生活。”该实验室成员、副教授郑岩说。未来,团队的研究成果将广泛应用于物流仓储、分拣运输、自动驾驶等工业场景,也将在家居收纳、公共区域卫生清扫等民生领域落地。
采访结束时,该实验室里的机器人仍在忙碌。它刚刚完成一杯奶茶的制作,机械臂稳稳地将杯子递到记者面前。在它身后,一群年轻人围在屏幕前,讨论着下一次迭代的方向。
从实验室的一行行代码,到真实世界里的智能管家,天津大学深度强化学习实验室的青年科研团队将进一步聚焦具身智能关键核心技术攻关,让前沿创新成果走出实验室、走进产业一线、融入百姓生活。(记者 陈 曦 通讯员 梁绍楠)




