李航:做本质的、严谨的、有意思的研究,纪念我的导师长尾真教授

Datawhale
 Datawhale干货 
作者:李航,东京大学计算机博士,来源:机器之心


本文为清明之际,字节跳动人工智能实验室总监李航纪念导师之作。

2021年5月24日收到师弟的邮件,告知我们的导师、原京都大学教授长尾真先生于5月23日不幸去世,享年84岁。看到邮件时简直不敢相信自己的眼睛,确认是事实后,内心感到无比的悲痛。最后一次见到长尾老师是2012年11月,当时他看上去身骨硬朗,说经常去打高尔夫球,觉得他身体状况应该很好。本想疫情结束之后,再去京都看望他,汇报近况,聆听他的指导。没想到那次见面变成了永别。
 
长尾老师一生从事自然语言处理、人工智能的研究,为领域的发展作出了重大贡献,为此他获得了许多荣誉,比如于2003年获得了ACL终生成就奖。他晚年致力于中日两国自然语言处理界的交流,产生了很大的影响。长尾老师也是我进入自然语言处领域的启蒙人和引路人,他对我的指导和帮助令我终生难忘。在他逝世一周年之际,撰写此文,纪念先生对后辈们的教诲。
 

1987年5月长尾实验室赴奈良旅行,右一为长尾真教授,右二为笔者

我是在京都大学读的本科,大四的时候,进入到长尾老师的实验室,开始接触自然语言处理。后来又在实验室攻读硕士学位,研究的方向是自然语言生成。没有长尾老师,可能自己不会进入这个领域。长尾老师在如何做研究方面也对我产生了很大的影响。
 
一、做本质的研究
 
长尾老师对我们要求非常严格,在研究例会上经常会挑战我们,指出我们工作中的问题。我印象非常深的是,他经常说,一定要看到问题的本质,我们做研究的时候要不断问自己:问题的本质是什么?受他的影响,探求问题的本质也成为了我做研究的基本态度和思维方式。
 
本质的研究应该有几个特点,首先,它的结果应该是简单的,因为无论是哪个领域的基本原理和方法,其核心内容应该都是非常简单的。其次,本质的研究应该有好的数学理论基础,能保证其系统性和逻辑性。还有,在应用领域本质的研究应该能很有效地解决实际问题。本质的研究应该经得起实践的严格考验。本质的研究,无论什么人看上去都觉得应该是这样。我们做研究,应该争取产生这样的效果,当你的工作发表时,很多人感到:为什么自己没有想到。
 
二、做严谨的研究
 
长尾老师很强调术语使用的规范性和准确性。经常提醒我们,做研究时往往不需要创造新的术语,一般情况使用已有术语就能把事情说清楚。他认为,只有必要时去创造新的术语才是正确的作法。有一些研究人员误以为发明了一些新的词汇就代表取得了研究的突破,其实是他们的误解。
 
跟他讨论问题的时候,他非常注意术语使用的准确性,如果术语使用不正确,他就会马上指出,有的时候会告诉你术语的正确定义。记得有一次早晨到他办公室找他讨论问题。过程中提到“参数”这个概念,他给我详细讲述了如何理解“参数”,正确使用这个术语。
 
三、做有意思的研究
 
长尾老师经常说,不一定要做难的研究,而要做有意思的研究(日文:おもしろい研究)。他说的有意思的研究,是指在领域中提出崭新的问题,开发出崭新的方法,给大家很大启发的研究。研究突破的机会在领域中并不是均匀分布的,好的研究人员应该能够抓住突破的机会,并取得真正的突破。
 
长尾老师在自然语言处理,图像处理等领域,做了许多开创性的工作。比如,他在自然语言处理领域的一个核心想法是,我们应该利用类推(analogy)来进行语言处理。他提出了基于类推原理的机器翻译,和我的师兄一起开创了利用样例进行机器翻译的范式。当时机器学习、深度学习技术都还很不成熟,数据规模也不是很大,但是利用样例的机器翻译,对后续的翻译工作产生了很大的影响。至今仍然是实现机器翻译的一个重要途径。从这个工作中,可以看出长尾老师所说的有意思的研究是指什么。
 
长尾真(Makoto Nagao)教授生平
1936年
出生于日本三重县
1959年
毕业于京都大学
1966年
获得京都大学博士学位
1973年-2003年
京都大学教授
1997年-2003年
京都大学校长
2003年
ACL终生成就奖
2007年-2012年
日本国会图书馆馆长
 
四、结语
 

后辈的研究人员,无论是中国人还是日本人,还是其他国家的人,都能不断提高自己的研究能力,为自然语言处理、人工智能领域的发展做出贡献,这应该是长尾真先生最大的期待吧。谨祝先生冥福!

干货学习,三连

文章推荐