计算机体系结构,处于软硬这一“接口”位置,对计算机指令、硬件功能分配和对软件、硬件界面确定等,承担着基本的“规划”功能。
随着摩尔定律放缓和新兴应用不断涌现,如何改进计算机体系结构来满足应用不断增长的需求,成为一个重要课题。
对此,图灵奖得主约翰·轩尼诗(John Hennessy)和大卫·帕特森(David Patterson)指出了计算机体系结构未来发展趋势——“领域定制的软硬件协同设计”,并称“计算机体系结构领域将迎来下一个黄金时代”。
这也是北京大学高能效计算与应用中心副教授孙广宇(1999级电子;2003级硕,微所)从研十余年以来一直在努力的方向。
孙广宇(中)获2021 CCF-IEEE CS青年科学家奖
寻寻觅觅:微光点亮的梦想
孙广宇在清华电子系和原微电子所度过自己的本科和硕士阶段,并在学校专项资金的支持下获得了参与国际学术会议的机会。
在一次学术会议中,孙广宇遇到了同样毕业于清华大学电子系、在计算机体系结构领域赫赫有名的谢源教授。“和谢老师的交流让我受益颇多。”孙广宇回忆道。
在谢源教授的建议下,孙广宇申请了美国宾夕法尼亚州立大学的博士学位,并于2006年成为计算机体系结构方向的新晋博士生。
然而孙广宇的博士研究并不是一帆风顺的。“与我所学的集成电路设计不同,我第一位导师是典型的计算机系背景出身的专家,在研究中他更偏向系统的相关环节。尽管都在体系结构的大领域,但这种学习背景带来的差别仍是当时的我难以在短时间内逾越的。”
更严重的是,孙广宇初期欠佳的表现让他的导师要放弃对其研究经费的资助。研究进展缓慢、时刻面临“断费”,这样窘迫的境况几乎浇灭了孙广宇的斗志。
就在这个时候,谢源向他伸出了援手。经过一番深入交谈,谢源主动提出,让孙广宇转投自己名下。谢源相信,只要让孙广宇回到“合适的轨道”上,他一定可以取得不错的成绩。
时隔多年,回忆起当时的经历,孙广宇仍难掩感激之情:“谢老师对我的帮助,不是一个简单的、慷慨的故事,他对我研究经费、学习方法、论文写作乃至生活细节方方面面的帮助,是我得以继续攻读博士最主要的力量。如果当时没有谢老师的帮助和认可,可能我走的路就和现在完全不同了。”
孙广宇也没有让谢源失望。“转换赛道”之后,他终于打破了博士初期的“沉默”状态,一系列论文相继发表。在与包括杜克大学陈怡然教授在内的业内翘楚合作的过程中,孙广宇得以触摸计算机体系结构的前沿理论和全新器件,他的毕业论文《基于新型非易失存储的体系架构设计探索》,更是荣获2012年欧洲设计自动化协会优秀博士论文奖。
这段求学从研经历,开拓了孙广宇的科研视野,也让他笃定地走在自己所选的研究道路上。面对未来的选择,他没有犹豫:“我出国的时候就决定,我毕业之后一定要回国。”
2011年,在导师谢源的推荐下,刚刚成立的北京大学高能效计算与应用中心向孙广宇递出了橄榄枝。感佩于恩师和北京大学的肯定,孙广宇即刻打点行装,回到了暌违5年的祖国。
兢兢业业:青春在科研中闪光
入职后,孙广宇开始思考“新型计算机体系结构”这一关键核心技术的破题思路,他决定在新型存储架构和定制计算架构两个方向开展跨层次的研究。
计算机系统中存储引起的性能开销和所消耗的能量逐渐增加,而各种新型的非易失存储器件(NVM)具备大容量、低功耗的优点。
就此,孙广宇团队首先对新型NVM的设计空间进行量化抽象建模,根据模型实现性能、能耗等设计目标优化的快速架构探索,进一步提出可扩展、可重构的宏单元代替传统的固定器件建模单元;并首次提出基于STT-RAM+SRAM的“混合缓存架构”,根据数据请求的优先级优化“混合缓存架构”中的数据管理,设计了相应的数据分配、替换以及迁移策略,有效地提升了新型NVM数据访存性能,同时降低了访存功耗;此外针对新型NVM独有的错误机制,提出“定位纠错编码(p-ECC)”缓存等纠错架构,实现了可靠性和能效之间的设计权衡。
同时,孙广宇构建的高能效、高安全性存储系统架构对于数据中心带来了提升。
孙广宇团队和百度合作提出将键值对存储(KV存储)和开放通道式固态硬盘(SSD)整合在一起,利用开放式通道SSD高并发的优点,对I/O调度和分发策略进行优化;同时提出了能够将多种应用进行混合部署的高效分布式存储系统,有效提升存储系统利用率并节省成本;在数据中心可信计算场景下,针对不经意随机存储(ORAM)安全协议实际应用中存在大量冗余访存等问题,以路径合并、缓存优化与数据复本技术,将ORAM系统的访存性能显著提升;此外针对内存数据库的索引与跨步访问等问题,利用新型NVM的特点,设计出一种同时支持行和列访问的对称内存架构,可以降低设计成本并提升能效。
随着深度学习等新兴应用领域的拓展,孙广宇开始针对其应用特点设计定制化的计算机体系结构。由“通用”转向“专用”,是他在这一方向的主要研究形式。
以深度学习领域为例,孙广宇与丛京生教授等合作,提出基于Roofline模型的卷积神经网络加速器设计方法,对计算单元、片上存储、带宽等资源进行抽象来构造设计空间,并根据优化目标自动探索空间寻找最优方案;为提高基于现场可编程逻辑门阵列(FPGA)的神经网络加速器芯片设计效率,提出一系列自动化设计方法,将深度学习框架(如Caffe、TensorFlow)输出的网络模型自动化部署到FPGA上,达到同时期最好水平加速性能;同时结合新型NVM相关研究成果,提出针对深度学习存内计算架构,可显著提升深度学习网络处理能效。
目前,孙广宇累计发表论文百余篇,获最佳论文奖3次、最佳论文提名奖3次,获CCF-IEEE CS青年科学家奖和“CCF-Intel青年学者提升计划”支持,并主持和参与多项科研项目。
这个执着于构建新型计算机体系结构的“设计师”,正以他自己的形式,推动这一领域的发展。
日日夜夜:照亮前行的方向
以10年为期,孙广宇这样概括自己在北京大学工作的时光:“5年的沉淀积累,5年的实践摸索。”
前5年时间,孙广宇用来探索行业的前沿地带,同时适应高校教师的新身份。在他看来,这段时光“和创业很像”。与学生一道摸索前行,探秘科研的“无人区”。
谈及与学生的相处,孙广宇笑称:“他们是团队的成员,也是同行的战友。我对他们的唯一要求,就是要明确自己未来的规划是怎样的。科学研究是很苦的,尤其是博士阶段的‘深研究’。这不是一种技能的培训,我更希望培养他们解决问题的勇气和魄力。在这个过程中,或许有弯路,但是我们一起走过,功不唐捐。在这个过程中,学生对我的信任也帮助我更好地理解了教师这个角色,不断壮大的团队也让我对于科研更有信心。”
此外,孙广宇也深知“纸上得来终觉浅”的道理,在北京大学高能效计算与应用中心工作的第二个5年,他积极推动技术转化,领域定制的存储与加速器系统等成果已在实际平台和产品上进行验证和应用,关于高能效计算机体系结构的研究课题得到华为、百度、美国超微半导体公司(AMD)、微软、字节跳动等公司项目的支持。
在孙广宇看来,面向新兴计算应用,结合集成电路设计和新型器件等内容的新型计算机体系结构领域,能为我国解决“卡脖子”难题提供新思路。
“就像盖房子一样,或许我们目前无法获得顶尖的建筑材料,但可以通过更巧妙的结构设计,在现有条件下盖出顶尖的房子。回到计算机体系结构领域,在我国芯片制造工艺与国际顶尖水平有一些差距的情况下,通过结构设计,使整体效果同样达到国际领先水平,这就是我要做的事情。”