Nature的拒稿意见被投到会议室屏幕上,放大了几十倍。蒋遥感到刺眼,目光移向落地窗外的纽约第五大道。永远无法满足审稿人的绝望感,让她崩溃,哭了1个小时。 这个来自广州、1999年出生的“小女生”,从不掩饰自己爱哭,也坦言常会因为一个代码卡住感到沮丧,但对研究的初心和热爱,就是她瘦小身体里的“永动机”。 蒋遥
(资料图)
6月7日,那项曾被Nature拒稿的研究,终于在Nature正式发表了。美国纽约大学数据科学学院二年级博士生蒋遥是该论文的第一作者,他们开发的大型语言模型NYUTron,可以准确预测病人出院后30天内再入院的风险。 虽然在直博第二年就发了Nature,但蒋遥甚至想晚点毕业,她太珍惜当学生的时光。一提到能向各领域的学者学习,同样爱笑的蒋遥,眼神里闪着光。 2021年,蒋遥(右二)与本科同学合影。
合作是最大的挑战
如果没有至亲的病故,蒋遥本科毕业后,或许会继续数学和计算机的理论研究。
2021年,在国内的外公外婆因病相继离世,给了蒋遥很大的打击。老人去世前,在视频里对她的一声声呼唤,如今提起,依然让她泪流满面。 或许从那时起,为病人减轻痛苦的梦想,便在蒋遥心中生了根。 在美国,将近15%的病人在首次出院后的30天内会再次入院,而感染、抗生素处方过量等都可能是罪魁祸首。如果及时发现这些风险,医生或许可以提前干预。 令人尴尬的是,医生要想判断病人再次入院的风险,不仅需要手动在一张“大表”中输入各种指征参数,还时常会遇到数据库不能及时更新的窘境。 而纽约大学数据科学学院教授Kyunghyun Cho和罗斯曼医学院的助理教授Eric Karl Oermann想做的,就是开发一款准确又好用的大语言模型,帮助医生提前预知这些风险。 这项研究吸引了刚本科毕业的蒋遥。一想到能把自己计算机方向的研究用来帮助病人,她果断地加入这个团队,并转到医疗自然语言处理方向。 为此,他们使用了纽约大学朗格尼医院10年里的30多万名患者的临床记录,训练后的NYUTron不仅能在医生录入病例的同时预测患者再入院的风险,准确率也比基于结构数据的模型提升了5%以上。 不仅如此,NYUTron还能在一周左右的时间推测出患者住院时间、住院死亡率、保险索赔被拒的可能性等。 蒋遥等发表论文 图源:Nature网站
对于蒋遥来说,NYUTron成功开发的关键,在于20多位不同领域研究者间的合作,但这也是她面临的最大挑战。 在这之前,蒋遥习惯于独自待在地下室看论文,也常常为了证明一个定理而忘记时间,“刚开始开发NYUTron时,我一想到早上要发十封邮件,开三个会就头大。”蒋遥笑着说。 慢慢地,她学会把碎片化的任务集中在一天来做,也学着将任务分配给有能力和愿意帮忙的同事,也只有这样才能不让自己被累垮。 更重要的是,因为这项研究涉及自然语言处理、软件工程、医学、数据管理等多学科的交叉。在发现不可能深入学习每个领域后,蒋遥学着培养自己跟不同领域专家合作的能力,并且信任他们的意见。 “他们从不会因为年龄而轻视我的观点。只要我说的有道理,大家都很配合,也很信任我。”蒋遥说。 抢发,也可以是一种欣慰
向Nature投稿,其实是一场阴差阳错。
经过一年多的研究,蒋遥原计划向自然语言处理领域的顶会EMNLP投稿,却错过了摘要提交期限。但这也让Oermann敏锐地意识到,或许应该投给Nature。 2022年10月,蒋遥兴奋又忐忑地将文章投给了Nature。两个月后,她却收到了拒稿消息。 更令人不安的是,三个审稿人中,除了“一正一负”的意见外,还有一个审稿人拒绝审稿。蒋遥不由得想,拒绝审稿的原因会不会是正在做同样的研究。 寒假里的纽约大学有些冷清,蒋遥有些沮丧地走进“大导师”Kyunghyun Cho的办公室,他们要商量如何修改被拒的论文。 拒稿人的意见在诺大的屏幕上显得尤为刺眼,审稿人认为NYUTron只能做单一任务,并没有显示它的多用性。 长时间积攒的压力和情绪,刹那间让蒋遥泪如泉涌。当时的她认为模型功能应该在应用中不断迭代,而不是提出之初就遭到“封杀”。如果是这样,似乎自己无论做多少,都无法满足审稿人的要求。 Cho没有安慰她,只是递来一盒纸巾和一瓶汽水。在蒋遥哭了将近1个小时后,他才说道,做科研本身就是有做不完的工作和改进,如果所有问题都解决了,“我们做科研的人就可以回家了”。 Cho还告诉她,做科研是枯燥甚至是痛苦的。“但在某个时刻,我们会发现一个别人从来不知道的现象和原理,而这个闪光瞬间就是坚持下去的理由。” 蒋遥坦言自己是个很爱哭的女生,也常常会因为遇到困难沮丧,但一想到这些闪光瞬间,身体里的“小宇宙”就会再次充满能量。 接下来的3个月,蒋遥一头扎进实验室补充数据。常常走出实验室时,街头的早餐车都已就位。 在一次与Cho交流之后,蒋遥感到如释重负。她突然意识到,如果论文被抢发,说明有很多志同道合的人在关注着这些病人,“反倒是一件欣慰的事。” 在她眼中, Cho不仅对自己的思维和心态有很大启发,还非常务实,“他常说,自己来是帮大家解决问题的,没有问题就不要去找他开会。” 蒋遥的成长还离不开37岁的“小导师”Oermann,这是一个让她感到非常“神奇”的老师。 Oermann是兴趣的忠诚追逐者。本科做数学研究的他,在直博的第二年转向了更感兴趣的医学;成为一名外科医生后,他对人工智能交叉研究萌生了极大兴趣,又去了谷歌研究抑郁症诊断的大语言模型。 由于谷歌这类商业机构的医疗数据不完善,且没有医院落地语言模型,Oermann又回到了医院,再次成为一名外科医生。 Oermann不但思维活跃,还非常擅长合作。只要蒋遥提到对某个话题感兴趣,他都能立即帮她找到可以进一步交流的人。 今年3月,正当蒋遥在实验室邀请同事参与研究合作时,Oermann带来了论文被Nature接收的好消息,两人兴奋地直接手拉手跳了起来。 有趣的是,蒋遥和在纽约大学神经计算科学读博的老公刘煦锦,是Oermann首届且“唯二”的两名博士生。
蒋遥坦言,很多导师并不太愿意招夫妻档。Oermann也曾对她说,很多夫妻档会是两个极端,如果分手很容易走向最坏的一端,“他希望我们是最好的那一端。” 2020年11月,蒋遥与刘煦锦订婚。
蒋遥和刘煦锦在美国卡内基梅隆大学读本科时成为了同学,并在毕业后结了婚。他们是最好的朋友,最好的同事,也同样是有很多爱好的“斜杠”青年。 瑜伽、钢管舞、滑冰都是蒋遥的最爱。喜欢烹饪的她,还会突发奇想把西瓜掏空,做一碗西瓜面条。她煲的汤是朋友们的最爱,“他们不知道,其实我放了方便面调料。”蒋遥笑得有些脸红。 刘煦锦在照片上标注了自己的一天
刘煦锦喜欢鼓捣各种乐器,经常披着一头长发,一路吹着长笛漫步回家;他会给蒋遥做各种“奇怪”的键盘,初中酷爱化学的他还曾险些把宿舍点燃。 与很多科研夫妻档不同,在蒋遥快被压力击垮时,刘煦锦并不会给她端来一碗“心灵鸡汤”,反倒认真地说,“老婆,不行我们就休学半年,我陪你周游世界去。” 但越是这样,蒋遥反而觉得机会来之不易。不管是卡住的代码,还是堵住的想法,刘煦锦总能陪她慢慢理出思路,“没有他的陪伴和帮助,我可能很难走过很多沮丧的时刻。”蒋遥说。 由于他们的研究一个偏基础,一个偏应用,两人最初也会争论“哪个更重要”,但后来紧密的配合,也让他们更加理解并尊重彼此的研究。 对于未来,蒋遥希望围绕自己的兴趣,要么继续做研究,要么创业把模型落地应用;而刘煦锦则想一直留在科研界,满足自己无边无际的好奇心。 https://www.Nature.com/articles/s41586-023-06160-y