当你教孩子如何解决难题时,你可以让他们通过反复试验来解决问题,也可以用一些基本规则和技巧来指导他们。同样,将规则和技巧纳入人工智能训练(例如物理定律)可以使它们更加高效并且更能反映现实世界。然而,帮助人工智能评估不同规则的价值可能是一项棘手的任务。
研究人员于 3 月 8 日在《Nexus》杂志上报道称,他们已经开发了一个框架,用于评估“知情机器学习模型”中规则和数据的相对价值,并将两者结合起来。他们表明,通过这样做,他们可以帮助人工智能融入现实世界的基本规律,并更好地解决科学问题,例如解决复杂的数学问题和优化化学实验中的实验条件。
“将人类知识嵌入人工智能模型有可能提高其效率和推理能力,但问题是如何平衡数据和知识的影响,”北京大学的第一作者徐浩说。 “我们的框架可用于评估不同的知识和规则,以增强深度学习模型的预测能力。”
ChatGPT 和 Sora 等生成式 AI 模型纯粹是数据驱动的——这些模型会获得训练数据,并通过反复试验进行自学。然而,由于只有数据可供使用,这些系统无法学习物理定律,例如重力或流体动力学,而且它们在与训练数据不同的情况下也很难执行。另一种方法是知情机器学习,研究人员为模型提供一些基本规则来帮助指导其训练过程,但人们对规则与数据在驱动模型准确性方面的相对重要性知之甚少。
“我们正在尝试教授人工智能模型物理定律,以便它们能够更好地反映现实世界,这将使它们在科学和工程中更有用,”宁波东部理工学院的资深作者云天陈说。
为了提高知情机器学习的性能,该团队开发了一个框架来计算单个规则对给定模型预测准确性的贡献。研究人员还研究了不同规则之间的相互作用,因为大多数明智的机器学习模型都包含多个规则,而规则太多可能会导致模型崩溃。
这使他们能够通过调整不同规则的相对影响来优化模型,并完全过滤掉冗余或干扰规则。他们还确定了一些协同作用的规则以及完全依赖于其他规则存在的其他规则。
“我们发现规则具有不同类型的关系,我们利用这些关系来使模型训练更快并获得更高的准确性,”陈说。
研究人员表示,他们的框架在工程、物理和化学领域具有广泛的实际应用。在论文中,他们展示了该方法的潜力,利用该方法优化机器学习模型来求解多元方程并预测薄层色谱实验的结果,从而优化未来的实验化学条件。
接下来,研究人员计划将他们的框架开发成可供人工智能开发人员使用的插件工具。最终,他们还希望训练模型,以便模型可以直接从数据中提取知识和规则,而不是由人类研究人员选择规则。
“我们希望通过将模型打造成真正的人工智能科学家来使其成为一个闭环,”陈说。 “我们正在努力开发一种模型,可以直接从数据中提取知识,然后利用这些知识来创建规则并改进自身。”