平衡训练数据和人类知识使人工智能更像科学家

阅读量：113

2024-03-24

当你教孩子如何解决难题时，你可以让他们通过反复试验来解决问题，也可以用一些基本规则和技巧来指导他们。同样，将规则和技巧纳入人工智能训练（例如物理定律）可以使它们更加高效并且更能反映现实世界。然而，帮助人工智能评估不同规则的价值可能是一项棘手的任务。

平衡训练数据和人类知识使人工智能更像科学家 (https://www.qianyan.tech/) 科学第1张

研究人员于 3 月 8 日在《Nexus》杂志上报道称，他们已经开发了一个框架，用于评估“知情机器学习模型”中规则和数据的相对价值，并将两者结合起来。他们表明，通过这样做，他们可以帮助人工智能融入现实世界的基本规律，并更好地解决科学问题，例如解决复杂的数学问题和优化化学实验中的实验条件。

“将人类知识嵌入人工智能模型有可能提高其效率和推理能力，但问题是如何平衡数据和知识的影响，”北京大学的第一作者徐浩说。 “我们的框架可用于评估不同的知识和规则，以增强深度学习模型的预测能力。”

ChatGPT 和 Sora 等生成式 AI 模型纯粹是数据驱动的——这些模型会获得训练数据，并通过反复试验进行自学。然而，由于只有数据可供使用，这些系统无法学习物理定律，例如重力或流体动力学，而且它们在与训练数据不同的情况下也很难执行。另一种方法是知情机器学习，研究人员为模型提供一些基本规则来帮助指导其训练过程，但人们对规则与数据在驱动模型准确性方面的相对重要性知之甚少。

“我们正在尝试教授人工智能模型物理定律，以便它们能够更好地反映现实世界，这将使它们在科学和工程中更有用，”宁波东部理工学院的资深作者云天陈说。

为了提高知情机器学习的性能，该团队开发了一个框架来计算单个规则对给定模型预测准确性的贡献。研究人员还研究了不同规则之间的相互作用，因为大多数明智的机器学习模型都包含多个规则，而规则太多可能会导致模型崩溃。

这使他们能够通过调整不同规则的相对影响来优化模型，并完全过滤掉冗余或干扰规则。他们还确定了一些协同作用的规则以及完全依赖于其他规则存在的其他规则。

“我们发现规则具有不同类型的关系，我们利用这些关系来使模型训练更快并获得更高的准确性，”陈说。

研究人员表示，他们的框架在工程、物理和化学领域具有广泛的实际应用。在论文中，他们展示了该方法的潜力，利用该方法优化机器学习模型来求解多元方程并预测薄层色谱实验的结果，从而优化未来的实验化学条件。

接下来，研究人员计划将他们的框架开发成可供人工智能开发人员使用的插件工具。最终，他们还希望训练模型，以便模型可以直接从数据中提取知识和规则，而不是由人类研究人员选择规则。

“我们希望通过将模型打造成真正的人工智能科学家来使其成为一个闭环，”陈说。 “我们正在努力开发一种模型，可以直接从数据中提取知识，然后利用这些知识来创建规则并改进自身。”

THE END

年轻一代的大脑更大了

大脑越大，说明大脑越健康，认知功能越强。自 20 世纪 30 年代以来，我们的大脑一直在增大。现在，一项新的研究显示了这是如 ...

阅读量：96

2024-04-02

大型语言模型的新兴能力

研究表明，法学硕士能力的突然提升既不令人惊讶，也不不可预测，而实际上是我们衡量人工智能能力的结果。

阅读量：102

2024-04-02

科学简单点：什么是纳米科学？

纳米科学是一门研究不可思议的微小物体的科学--只有最高科技的显微镜才能看到的微小物体。它是所有科学中最热门的话题之一， ...

阅读量：114

2024-03-31

科学简单点：什么是暗物质和暗能量？

神秘的影响因素似乎正在以意想不到的方式将宇宙拉伸开来，并将一些东西聚拢在一起，但我们却看不到或摸不到它们。科学家们把 ...

阅读量：105

2024-03-31

研究人员表明，引入缓步动物蛋白可以减缓人体细胞的新陈代谢

由威斯康星大学分子生物学系助理教授 Thomas Boothby 实验室的高级研究科学家 Silvia Sanchez-Martinez 领导的这项研究提供 ...

阅读量：107

2024-03-27

平衡训练数据和人类知识使人工智能更像科学家

发表回复取消回复