手机游戏巴士

机器学习有毒!被指让科学家更自欺欺人,给科学界带来危机

发表于:2024-05-02 作者:游戏编辑
编辑最后更新 2024年05月02日,乾明编译自BBC量子位报道|公众号QbitAI机器学习技术,正在占领科学界,成为核心研究方法。但在这股浪潮背后,有成千上万的科学家,正在用它来产生误导...

乾明 编译自 BBC

量子位 报道 | 公众号 QbitAI

机器学习技术,正在占领科学界,成为核心研究方法。

但在这股浪潮背后,有成千上万的科学家,正在用它来产生误导性的结果。

这一结论,来自休斯顿莱斯大学的副教授Genevera Allen。

她说,科学家们大量使用机器学习系统,导致了一场“科学危机”。科学家们如果不改进技术,将会浪费大量的时间和金钱。

科学研究危机

最直接的问题,在于机器学习软件识别的模式,只存在于数据集中,而不是面向真实的世界。

如果没有人使用不同的数据集去复现模型,很难发现使用机器学习技术得出的结论是错误的。

随着机器学习在科学研究中应用愈加广泛,相关的研究越来越难以复现。一项分析表明,世界上85%的生物医学研究都是白费力气。

其次,机器学习系统和大数据集的使用加速了科学危机。这场危机已经持续了20年,根本原因在于,研究的实验设计不够好,无法确保科学家们不会自欺欺人。

最后,回到机器学习本身上,机器学习是专门为在数据集中发现有趣的东西而开发的。不管数据怎样,只要应用到数据中,就会发现相应的模式,具体模式怎样,也无法保证。

为了解决这个问题,她正在和研究团队开发下一代机器学习和统计技术,这种技术不仅可以分析大量数据,找出结果,还可以给出结果的不确定性以及复现的可能性。

锅该由机器学习背吗?

Allen在美国科学促进会(AAAS)年会上发表了自己的观点,BBC报道之后,在AI圈引发了广泛的讨论。

Facebook的机器学习科学家Edward Grefenstette评论称,这篇文章的确反映了机器学习存在的问题。因为对机器学习的炒作和大肆宣传,使用机器学习做研究的科学家,都只是关注研究中使用了机器学习技术,反而不太关注科学研究应有的标准了。

也有人指出,机器学习与科学研究相反,是基于数据发现模型,而不是基于模型,寻找数据去否定或验证模型,很容易理解它为什么会导致不可复现的模型出现。

这些观点虽然有不少人赞同,但隔空之间,也有不少反对之声。不少人认为,这个锅不应该由机器学习来背。

前谷歌大脑员工研究员Denny Britz说,这不是机器学习的问题,而是使用机器学习的人的问题。

另外一种说法是,科学研究难复现,这是一个长期以来一直存在的问题,机器学习不应该背锅。

对于这件事,你怎么看?欢迎在留言区与我们互动。

作者系网易新闻·网易号“各有态度”签约作者

加入社群

量子位现开放“AI 行业”社群,面向AI行业相关从业者,技术、产品等人员,根据所在行业可选择相应行业社群,在量子位公众号(QbitAI)对话界面回复关键词“行业群”,获取入群方式。行业群会有审核,敬请谅解。

此外,量子位AI社群正在招募,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式。

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

喜欢就点“好看”吧 !





0