首页 资讯 正文

AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%

体育正文 215 0

AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%

AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%

大(dà)模型的发展(fāzhǎn)落地日新月异,就在年初,业界还在担心AI生产的学术垃圾充斥论文库,年中,AI生成的论文已经可以被顶会认可了。 5月29日,海外初创(chūchuàng)公司Intology 宣布,他们的(de)“AI科学家”Zochi的论文(lùnwén)被顶会ACL主(zhǔ)会议录用,成为首个独立通过 A* 级别科学会议同行评审的AI,同时宣布开放Zochi的Beta 测试。 这一发布的(de)(de)含金量在于(zàiyú),ACL是自然语言处理领域全球排名第一的顶会(dǐnghuì),其主会议平均录用率通常低于20%,论文需具备突破性创新。据悉,Zochi的论文获得评审最终评分4分,在所有投稿论文中排名前8.2%。 Intology是一家较为陌生的初创公司,从目前(qián)官网和博客的信息梳理来看(láikàn),这家公司是在(zài)2025年初(niánchū)新成立的,定位是一个研究智能科学的实验室,两名联创分别是连续创业者Ron Arel和前Meta华人研究员(yánjiūyuán)Andy Zhou,两人均毕业于伊利诺伊大学厄巴纳-香槟分校(UIUC)。 Intology成立后,此前(cǐqián)3月团队就(jiù)推出了智能体Zochi,称其为AI科学家,并宣布(xuānbù)其研究成果已被ICLR 2025研讨会接收。不过,此前的这(zhè)一研讨会的论文接收率在60%-70%,要求比顶会的主会低了不少,官方认为,此次更进一步的顶会突破(tūpò)标志着AI达到博士级(jí)科研水平,人类博士通常需数年才能在此类会议发表。 具体看(kàn)此次(cǐcì)AI科学家Zochi“写”的(de)论文,主题是关于大(dà)模型安全(ānquán)的,名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,直译(zhíyì)过来是《Tempest:基于树搜索的大模型自主多轮越狱》,简单来说,Zochi利用了一种(yīzhǒng)“树搜索”技术,来探索多种对话路径,逐步突破大模型的安全防线。 研究提出的Tempest框架,能通过多轮对话(duìhuà)逐步瓦解模型的安全防线,绕过安全检测,通过小让步(ràngbù)的累积完成违规(wéiguī)的内容输出。例如,直接让模型回答敏感信息“制作炸弹(zhàdàn)”,基于安全机制模型会直接拒绝,但通过多轮委婉地引导提问(tíwèn),最终却可以让模型回答出正确的信息。 评估结果显示,Tempest在(zài)OpenAI的(de)旧模型GPT-3.5-turbo上的成功率为(wèi)100%,在GPT-4上的成功率为97%。这一研究(yánjiū)主要是揭示了多轮对话攻击的漏洞,可以为设计更佳的AI安全防御提供参考。 值得一提的是,论文的署名是两位联创,但官方博客表示(biǎoshì),除论文格式调整与绘图外,内容全程无人工参与,“我们对(duì)这项工作负责,但主要的智力贡献(gòngxiàn)是由AI系统完成的” 。 据官方介绍,人类仅输入(shūrù)研究(yánjiū)(yánjiū)领域,Zochi就(jiù)可以独立完成后续全流程。Zochi 首先会采集并分析数千篇研究论文,以确定特定领域内有潜力的研究方向。其检索系统能够识别文献中的关键(guānjiàn)贡献、方法论、局限性以及新兴模式,识别论文之间不明显的联系,并提出创新的解决方案。从提出假设到完成实验,就像一个(yígè)真正的科学家。 AI科学家并非个例,除了(chúle)Intology外,Transformer作者(zuòzhě)Llion Jones去年创立的Sakana AI,也(yě)推出了一个(yígè)基于AI的科研系统“AI Scientist”,论文也已被ICLR 2025研讨会接收,分数为6/7/6。 AI for Science(AI4Science)一直是(shì)AI行业最前沿的落地领域之一,人工智能可以(kěyǐ)极大地促进科学的进步,提高科学家(kēxuéjiā)的效率、准确性和创造力。不过,新事物的出现也伴随着合理性和规则适配的争议(zhēngyì)。 此前3月Intology 推出Zochi、宣布论文被会议接收时,就被不少学术界人士批评,认为这是对科学同行(tóngháng)评审(píngshěn)过程的滥用,在提交论文前,团队并未知会相关(xiāngguān)方是AI生成的论文,也(yě)未获得同行评审者的同意。 在(zài)此次博客最后,官方提到了AI带来的学术伦理问题,认为AI驱动的研究给科学问责(wènzé)和可重复性(kěchóngfùxìng)带来了挑战。但他们认为,虽然 Zochi 自主运营,但人类研究员仍然是作者,并负责验证方法、解释结果并确保符合伦理规范(guīfàn)。对于论文(lùnwén),人类作者进行多轮内部审查,并在提交前仔细核实了所有结果和代码。 “我们鼓励在致谢(zhìxiè)中列出AI系统,而不是(shì)将其列为(lièwèi)作者。虽然AI驱动的研究提出了关于归属、透明度和问责制的重要问题,但我们认为,智力贡献应该以实质内容而非来源来评判。”Intology官方表示,他们的主要关注点是通过AI工具(gōngjù)协助人类研究者。 (本文(běnwén)来自第一财经)
AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~