在智能体的语言用开拓中 ,强化学习与狂语言模子 、先验学习视觉语言模子等根基模子的不同进一步融会事实能擦出奈何样的火花?google DeepMind 给了咱们新的谜底。
不断以来,强化DeepMind 引领了强化学习(RL)智能体的智能择走睁开 ,从最先的体D条通 AlphaGo、AlphaZero 到其后的语言用多模态 、多使命 、先验学习多具身 AI 智能体 Gato ,不同智能体的强化磨炼措施以及能耐都在不断演进。
从中不难发现 ,智能择走随着大模子越来越成为家养智能睁开的体D条通主流趋向,DeepMind 在智能体的语言用开拓中不断试验将强化学习与做作语言处置 、合计机视觉规模融会,先验学习自动实现差距模态使命的不同不同。Gato 很好地剖析了这一点 。
克日,google DeepMind 在一篇新论文《Towards A Unified Agent with Foundation Models》中