“我为什么反对AI论文强制开源代码”

晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI

AI论文,到底该不该强制开源代码?

NeurIPS 2020官方近日发布了一份开源指南。从2019开始,NeurIPS就“强烈建议”提交论文代码,不过仍非强制。

但无论如何,官方传达出了一种信号:AI学术顶会开源代码已是行业趋势。

NeurIPS此举也引发了一场“年经”式的讨论:如果将来学术会议要求必须开源,投稿人应该拒绝吗?

而让人始料未及的是,不少网友认为:不开源,我有理。

“我为什么反对AI论文强制开源代码”

反对一:代码并没有那么重要

首先,开源代码的目的是什么?是为了让其他研究者可以复现结果。

如果一篇论文包含足够多的细节,那么别人就可以根据其中的公式自己写出代码,对于这类论文,可以不公开代码。不过前提必须是提供足够多的细节。

比如谷歌的AlphaGo就没有开源代码,但是没有人怀疑它的正确性,事实上也有很多人根据谷歌论文复现了AlphaGo。

“我为什么反对AI论文强制开源代码”

而且作者本人的代码可能会出现错误,不开源的一个好处就是让其他研究者独立复现。

万一作者在代码里挖了个不明显的“坑”,其他人也可以规避,防止被带到沟里。

另外,也不要高估代码的价值,经典论文可以几十年长盛不衰,但是代码很可能十年后就难以运行了。

当然,还有一种观点就是,对于AI来说,数据集更重要。没有数据的代码是没有价值的,而很多数据集没法开放,这意味着你即使拿到代码,也无法复现SOTA结果。

反对二:要为作者考虑

不开源同时也是为了照顾作者的种种特殊情况。

比如一些研究者是从事纯理论的研究。有一个网友就说,他甚至都不知道怎么构建Docker容器,虽然发表了多篇论文都在GitHub上开源了代码,但它从来不维护。

“我为什么反对AI论文强制开源代码”

所以,论文是否开源应该根据代码对于文章的重要性而定,不该一刀切。

还有一些商业公司的研究者,他们在写论文的时候用到了公司内部专有软件库,如果强制开源,他们必须从头再写一遍代码,费时费力,对这些人也是不公平的。

还有一些作者,本身并不是不想开源,而是希望能够将成果保护一段时间,在论文发布几个月后再开源代码,这对于从事医疗、法律领域的学者很重要。

综上所述,反方网友认为,强制开源过于极端,应该对论文开源持鼓励态度,而不是强制。

支持开源:不开源怎能让人信服

首先是一名从事石油行业的网友说,他们行业的数据都是商业机密,所以不会发布任何数据和代码,甚至会在文章中丢掉一些公式来隐藏成果,还声称98%的正确率。结果怎能让人信服。

他认为不公开数据和代码,就像把一篇论文中所有的关键要素都删了,这样的研究即使发表出来也毫无价值。

还有一些人认为,强制开源会改变其他行业对机器学习的偏见。

很多其他学科的人都把机器学习看成伪科学,这是为什么?因为AI领域的论文发布过程非常不成熟。

科学方法的关键是一致性和可重复性。追逐单一的指标,每个人都对SOTA着迷,这是一个巨大的问题。

而开源是解决此问题的一种方法。

去年,AI知名女学者Anima Anandkumar曾在个人博客里公开喊话,强烈反对发论文却不给代码的行为,呼吁学术会议强制要求投稿同时必须公开代码。

“我为什么反对AI论文强制开源代码”

她认为不开源代码不利于评审论文,不利于对论文造假的追责,更不利于行业开放竞争。

你觉得公开的学术论文也应该公开代码么?

参考链接:

https://www.reddit.com/r/MachineLearning/comments/fzss9t/d_if_a_paper_or_project_doesnt_publicly_release/

https://www.reddit.com/r/MachineLearning/comments/fzp8bu/d_official_neurips_2020_guidelines_for_making/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2024年5月14日 上午9:05
下一篇 2024年5月14日 上午9:17

相关推荐

  • 新县政务办公oa系统

    新县政务办公oa系统:提升政务效率,推进数字化转型 近年来,随着数字化技术的飞速发展,政务办公oa系统已经成为了许多政府单位必备的办公工具。在新冠疫情的影响下,政务办公oa系统的作…

    联系我们 2024年12月5日
    0
  • 在暂停键下,业务连续性(BCM)的重要性

    在过去的几年里,有关业务连续性的事件一直是常态新闻。 新冠袭来,很多工作都按下暂停键… 贸易冲突,芯片供应紧张… 苏伊士运河被堵,俄乌冲突,原油供应紧张,油价上升… BCM的定义?…

    联系我们 2022年5月22日
    272
  • 查看参加的科研项目

    查看参加的科研项目 近年来,随着科技的飞速发展,越来越多的科研项目正在涌现。作为一名研究人员,参加科研项目是我职业生涯中不可或缺的一部分。为了查看参加的科研项目,我使用了各种科技手…

    联系我们 2024年12月5日
    0
  • 科研启动经费招聘虚高

    科研启动经费招聘虚高是当前学术界和工业界普遍关注的问题。科研启动经费是指用于支持科学研究和技术创新的资金,其招聘虚高现象已经成为一个全球性的问题,不仅涉及到学术机构的招聘和经费管理…

    联系我们 2024年12月8日
    0
  • 【砥砺奋进的五年·发展成就巡礼】资源环境学院:党建引领提质量 聚焦发展谱新篇

    自学校第一次党代会召开以来,资源环境学院以习近平新时代中国特色社会主义思想为指导,深入贯彻落实新时代党的建设总要求,凝心聚力、真抓实干,围绕立德树人根本任务,以高质量党建引领高质量…

    联系我们 2023年2月23日
    346
  • 科研项目中期检查专家评审意见

    科研项目中期检查专家评审意见 随着科技的不断进步,科研项目的中期检查已成为项目研究中不可或缺的一部分。中期检查旨在确保项目在预定时间内按计划完成,并达到预期的目标。在中期检查过程中…

    联系我们 2024年12月8日
    25
  • 科研创新申请理由

    科研创新申请理由 随着科技的不断发展,科研创新已经成为推动社会进步和经济发展的重要力量。在当今社会,科研创新已经成为了一种必备的素质,也是每个科学家和研究人员应该具备的基本要求。本…

    联系我们 2024年12月6日
    0
  • 采购管理总流程(采购管理流程包括哪些内容)

    我始终坚信: 管理就是走流程 没有规范流程,管理一切为零 ★按流程来做 流程为各项工作提供程序化的流程 保证办事有指导 ★用制度来管 制度为企业运行制定规范化的制度 保证事事有规范…

    联系我们 2022年5月23日
    304
  • 上网行为管理软件

    上网行为管理软件:帮你控制你的上网行为 随着互联网的普及,越来越多的人开始上网。然而,上网行为也带来了许多问题,如沉迷游戏、社交媒体成瘾、浏览不良信息等。上网行为管理软件可以帮助你…

    联系我们 2024年11月30日
    0
  • 课题验收时达到的经济指标

    课题验收时达到的经济指标 在课题验收过程中,每个课题都需要一定的经济指标来确保课题的完成情况和质量。这些指标通常包括课题的进度, 课题的成果, 课题的质量等。以下是一些课题验收时可…

    联系我们 2024年12月10日
    0