人类专家设计的奖励! 从此,LLM+机器人又有了新玩法。 同往常一样,代码是开源的。 图片 全体RL社区,起立! AI学者惊呼:全体RL社区都应该对Eureka论文感到敬畏和震惊。 图片 如果按他们的...