而下一阶段的标志之一将是数据生产。 每个实验室将如何生成所需的数据以实现更高的智能水平这将是一个关键问题我们如何朝着数据丰富迈进?这将需要多个领域的前沿研究。 我认为首先是推动数据复杂性的提升迈向前沿数据。我们希望在模型中构建的许多能力其最大的障碍其实是数据的缺乏。
比如说过去两年内 一直是一个热门话题 突尼斯 whatsapp 数据 但实际上几乎没有 能很好地运作。 原因是网络上根本没有大量有价值的 数据。这些数据不在那里所以我们需要生产高质量的 数据。 : 能举个例子说明我们需要生产什么样的数据吗? : 我们即将发布的一项研究表明目前所有前沿模型在工具组合上的表现都很差。
比如它们需要先查找信息然后编写一个 h 脚本再绘制图表使用多个工具串联起来解决问题时模型表现得非常糟糕。而这对人类来说是非常自然的。 v : 是的但这些操作没有被记录下来是这个意思吗?也就是说模型无法学习到这些步骤。 : 完全正确。这些推理链条在人类解决复杂问题时非常常见我们会自然地使用一系列工具思考问题并推理下一步需要做什么。