人工智能多元研发模式研究
人工智能科技突破亟须探究研发模式系统布局。本文从研发组织方式和战略导向两个维度构建人工智能研发模式理论分析框架,运用多案例比较法,研究发现:人工智能研发组织聚焦创新链不同环节,在理论原创、关键核心技术攻关、开放生态建设、行业前沿探索上各有侧重,形成“创新探索者”“攻关主导者”“生态赋能者”“行业引领者”四类研发角色。通过对研发角色的画像分析,发现研发主体间存在角色差异性。研究结论对我国从国家创新体系层面推进人工智能研发系统布局、提升人工智能科技创新体系协同效能具有参考意义。
人工智能是新一轮科技和产业变革的重要驱动力量。在国际形势日趋复杂、科技发展快速迭代的新形势下,在全球人工智能竞争赛道上,保持我国人工智能技术领先意义重大。以国家实验室、科技领军企业、研究型大学等为主的多种研发机构积极推动人工智能创新。在人工智能研发中,这些组织发挥何种作用,存在哪些研发模式?如何通过研发系统布局提升人工智能科技创新体系协同效能?这些关键性问题亟待研究。
现有关于研发模式的研究主要从技术攻关[1][2]、技术追赶[3]、研发国际化[4][5]等视角出发,对推动高水平科技自立自强[6]、构建新型举国体制[7][8]以及实现后发企业创新追赶[9]具有重要价值。这些研究大多关注企业研发或者产学研合作[10][11],对国家科研机构、国家实验室、研究型大学等不同研发组织展开系统性模式分析存在不足。同时,这些研发模式大多针对传统技术领域分析[12][13],对于人工智能这一新兴技术的指导意义有限,特别是,人工智能领域研发活动逐渐呈现出算力算法数据一体协同、科学技术工程融合、技术场景双轮驱动等特点,亟待探索适用于人工智能创新活动的研发模式。
鉴于此,本文聚焦人工智能领域,探索多元研发模式,并对其特征和适用性展开分析。研究选取美国、加拿大、德国、英国等国典型研发机构为案例对象,从研发组织方式和战略导向两个维度刻画研发模式。本文的核心创新点在于建构人工智能多元研发模式理论分析框架,识别出“创新探索者”“攻关主导者”“生态赋能者”“行业引领者”四类研发角色。本文研究结论拓展了研发模式的经典研究,推动了人工智能研发活动的理论收敛,对我国人工智能研发的系统布局具有参考意义。
一是从技术攻关视角探索适合关键核心技术突破的研发模式。葛爽和柳卸林从关键核心技术路线、技术发展水平识别不同关键核心技术,探索出新型举国体制、放权型产学研合作、核心企业领导、非营利机构主导四类研发模式[14]。陈光华基于主体间互动形式、研发需求来源以及研究领域维度,提炼出“一体式”“合同式”“平台式”三种高技术机构研发模式[15]。同时,有研究基于会聚视角得出“场景需求牵引+技术内部类别融合+领军企业带动产业链”“技术创新驱动+跨技术部类间融合+产学研创新联合体”两条关键核心技术突破路径[16]。
二是从技术追赶视角分析后发企业技术研发模式。在技术差距和制度差距的影响下,后发企业实施研发走出去战略,建立全球研发系统组织架构和技术架构[10]。通过研发网络边界拓展,后发企业可以获取互补性资源、开展交互式学习、获取并创造知识,进而实现创新追赶[9]。例如华为走出了一条从“城市”(发达国家)到“农村”(发展中国家)研发全球化道路[17]。后发企业研发活动也体现出产学研联合、自主研发、外部企业合作研发等多元研发模式的动态演进[18]。
三是从研发国际化视角识别跨国组织研发模式。根据研发活动分散性和研发单位间合作程度,可以将研发模式划分为民族集中型、地理集中型、多中心分散型、研发枢纽型和综合型研发网络五类[19]。Zedtwitz和Gassmann依据接近市场和接近科学两个维度,识别出本地研发型、市场驱动型、技术驱动型和全球型研发国际化模式[5]。
结合上述相关研究,本文从国家创新体系视角考察人工智能多元研发模式。从人工智能领域看,其研发活动涉及不同主体,且不同主体主导的研发活动具有独特性和差异性。
研发组织方式分为分布式网络和集中式组织两类,前者通过建构合作网络实现多主体连接,不断积累异质性、广泛性的知识;后者通过实体化研发组织建设集聚各类创新要素,形成组织体系化的研发能力。
研发战略导向划分为使命导向和行业导向两类,使命导向是指研发组织面向国家战略、人才培养以及知识创新等开展研发活动,行业导向是指研发组织面向市场需求、行业发展以及生态建设等开展研发活动。
模式I:构建分布式网络组织、以使命为导向,开展人工智能基础理论研究,通过知识创新引领技术发展,属于创新探索者;
模式II:构建集中式组织、以使命为导向,开展人工智能关键核心技术/共性技术研发,通过技术攻关突破关键瓶颈,属于攻关主导者;
模式III:构建分布式网络组织、以行业为导向,推动人工智能生态建设,通过搭建平台打通创新生态,属于生态赋能者;
模式IV:构建集中式组织、以行业为导向,开展人工智能行业前沿技术探索,通过重大需求突破牵引产业发展,属于行业引领者。
本文所刻画的四类研发模式本质上是人工智能研发组织的多重角色(图1)。对不同研发组织而言,其角色存在程度差异,角色间并非完全独立。本文在案例中将侧重介绍研发组织的特定突出角色,以对其差异进行比较。
说明:核心大圈为人工智能研发组织,周围小圈为合作伙伴。指向核心大圈的箭头代表以资源集聚为主,指向周围小圈的箭头代表以资源拓展为主,无箭头代表资源双向流动。实线代表资源流动相对频繁,虚线代表资源流动相对较低。
本文选取多案例开展比较研究,一是多案例分析有利于呈现不同研发模式的差异性,二是多案例的反复验证可以提升多元研发模式的理论普遍性。结合图1分析框架,本文进行理论抽样,遵循典型性、差异性以及数据可获得性原则,选择典型的人工智能研发组织(表1)。研发组织性质多元,尽可能覆盖人工智能领域各类研发活动。本文主要基于二手数据进行分析,这些数据客观地反映了研发组织发展现状,避免了人为主观判断影响。同时,本文尽可能扩大资料搜集范围通过多来源数据相互验证,包括官网、新闻媒体报道、第三方研究机构、组织年报等。下文所涉及的人员和组织数据来源于官网公开报道。
艾伦·图灵研究所(Alan Turing Institute,ATI)成立于2015年3月,由剑桥大学、爱丁堡大学、牛津大学、伦敦大学学院、华威大学以及英国工程和物理科学研究委员会联合创建,后于2018年吸纳了其他8所大学 (利兹大学、曼彻斯特大学、纽卡斯尔大学、伦敦玛丽女王大学、伯明翰大学、埃克塞特大学、布里斯托尔大学和南安普顿大学)。ATI旨在推进世界级研究并将其应用于现实世界问题、培养未来的领导者、引导对话公众。斯坦福人工智能实验室(SAIL)成立于1963年,自约翰·麦卡锡教授创立以来,SAIL一直是科学家和工程师引以为豪的领先知识中心、学生培养的教育圣地以及尖端研究工作的卓越中心。
为应对人工智能挑战,2020年美国国家科学基金会与其他联邦机构、高等教育机构和其他利益相关者合作,投资1.4亿美元建立7个新的国家人工智能研究所。2021年,进一步投资2.2亿美元建立11个国家人工智能研究所。美国橡树岭国家实验室(ORNL)成立于1943年,原属于曼哈顿计划的一部分。在80年发展历程中,ORNL始终贴合国家最紧迫的研发需求,当前聚焦人工智能、量子计划、先进制造、新材料、新能源等领域重大问题。
蒙特利尔算法研究所(Mila)由图灵奖获得者Yoshua Bengio教授创立,如今是全球最大的深度学习研究中心之一,2018年获得非营利组织身份。德国人工智能研究中心(DFKI)成立于1988年,是一家非营利性公私合作机构,在凯泽斯劳滕、萨尔布吕肯、不来梅、下萨克森州设有研究机构,在柏林、达姆施塔特设有实验室,在吕贝克、特里尔设有分支。DFKI开展面向应用的基础研究,推进研究生态系统成果向商业生态系统转化。
OpenAI是美国人工智能领域新兴的研发组织,由非营利组织OpenAI Inc和其营利组织子公司OpenAI LP组成,聚焦通用人工智能的行业前沿和应用。2015年,OpenAI由萨姆·阿尔特曼、里德·霍夫曼、伊隆·马斯克、伊尔亚·苏茨克维等人投资10亿美元成立,先后发布ChatGPT、GPT-4等全球领先的大模型,当前在全球大模型研发活动中处于领先地位。
组织方式有分布式网络和集中式组织两个变量,战略导向有使命导向和行业导向两个变量。具体而言,分布式网络涉及合作网络形态和创新资源拓展方式等关键概念;集中式组织涉及研发体系化和创新资源集聚方式等关键概念;使命导向涉及研发组织在国家战略、知识创新和人才培养等方面关键概念;行业导向涉及研发组织聚焦行业前沿和AI生态建设等关键概念。本文将按表2关键词列表展开案例分析,并依据典型证据绘制研发角色画像。
创新探索者是以使命为导向、形成分布式网络的研发组织,角色画像如图2所示。这类研发组织创新资源相对分散、聚焦人工智能基础理论研究,以研究型大学居多,部分国家科研机构也具备创新探索者角色。典型案例包括ATI、SAIL等。
ATI开展理论科学问题的基础研究,将尖端科学应用于现实世界问题,并研究这些技术在法律、伦理和社会方面的影响。ATI聚焦12个具体研究领域(算法、人工智能、机器学习等),以及3方面重大挑战(国防和、环境与可持续性、医疗保健转型)。作为国家机构,ATI拥有完善的大学合作伙伴网络,与大合培养博士,2016—2019年共招收了67名学生。SAIL开展知识创新和人才培养,通过跨学科合作,SAIL促进知识新发现,开展计算机教学、人工智能领域基础研究和创新应用。2009年,李飞飞教授发布了ImageNet,创造了机器理解视觉世界能力的基准。此外,SAIL注重创新型人才培育、下一代人才培养,结合技术发展和社会导向,提出了“以人为中心的人工智能计划”;2015年SAIL提出AI4ALL计划,面向9年级学生开设为期三周的暑期课程,培养后备力量。
ATI与13所英国顶尖大学开展合作研究,每个大学都任命了一名和ATI对接的大学负责人,作为研究所与创始大学之间的接口。目前有超过400名研究人员开展合作项目研究。这些研究项目以科学理论为解释支持,设定了明确的项目目标,由研究人员与合作伙伴共同推进完成项目,降低了跨学科项目研究的不确定性与风险性[20]。SAIL形成“核心-边缘”研究网络,不仅聚焦人工智能核心技术设立自然语言处理组、视觉与学习实验室、统计机器学习组三大核心组;而且以社区为导向,建立开创性研究的多元化研究小组,18个独立教师实验室(小组)为研究合作和创新提供了多样机会。SAIL在发展中与产业界紧密合作,例如SAIL通过SAIL-丰田研究中心、SAIL-JD研究计划帮助学院和研究者发展和创造具有实际应用的转化技术(translational technologies)。
攻关主导者是以使命为导向、形成集中式的研发组织,画像如图3所示。这类研发组织通常研发资源高度集中、研发体系完备、聚焦人工智能关键核心技术/共性技术攻关,以国家实验室和国家科研机构居多。典型案例包括美国国家人工智能研究所、ORNL等。
国家人工智能研究所是美国联邦政府应对AI相关机遇和风险的战略力量,为国家经济竞争力、和国防做出贡献;研究所储备多样化人工智能劳动力,如人工智能未来边缘网络和分布式智能研究所(AI-EDGE)启动一项从K-12到大学生、教职员工的多元劳动力队伍计划;此外,人工智能研究所发展道德和可信赖的人工智能系统和技术,开发新的网络安全方法,确保美国处于全球人工智能的前沿。ORNL聚焦能源和等领域,探索科学前沿、突破重大技术,保障经济利益和。实验室下属的计算与计算科学理事会(CCSD)聚焦高性能计划、人工智能、边缘计算等重大科技问题。ORNL人才培养多措并举,向青少年开放虚拟课堂、中学生开放科学竞赛和夏季工作坊等、本科生开放实习,依托国家能源部专项开展研究生培养计划。
国家人工智能研究所依托顶尖研究型大学等机构实体化运作,形成高度有组织的团队组织模式,如AI-EDGE围绕AI for Networks和Networks for AI两个主题开展8个方向研究和攻关。研究所以主任为核心,形成了科层组织结构,汇聚各类顶尖AI人才,形成跨学科和高度协同的研究团队。同时,建立基础设施研究平台,支撑实验室研究并向合作伙伴开放。ORNL由UT-Battelle管理,由实验室主任、副主任和各机构的部门主管组成,实行主任负责制,任务明确、方向集中。例如计算机科学和工程部门聚焦先进计算方法和量子信息科学,推动物理科学、工程系统、精准医疗和量子信息科学领域的发现。ORNL构建重大科技基础设施实现任务攻关和科学前沿探索。2022年,ORNL推出了世界上第一台百亿亿级超级计算机Frontier,为可扩展的计算和模拟、数据和分析以及可扩展的科学网络安全基础设施提供世界上最强大的开放式高级计算生态系统。ORNL集聚了全球各类顶尖人才,拥有员工6000多名,包括100多个学科的科学家和工程师,每年用户和访问科学家达到3200多名。
生态赋能者以行业为导向、形成分布式网络的研发组织,画像如图4所示。这类研发组织研发资源相对分散、面向人工智能生态建设,推动人工智能产业生态形成发展,以国家科研机构、非营利研究机构居多。典型案例包括加Mila、DFKI等。
Mila引领技术前沿、加速技术转化,开展人工智能在健康、环境和气候变化等领域的基础研究,以及AI伦理研究;加速人工智能创新,使其造福所有社区,设立创业实验室、出台年轻企业家发展项目计划,为社区初创企业的发展提供支持;同时,Mila赋能行业发展、塑造产业生态,2022年6月,Mila启动了人工智能激活计划,帮助中小企业等组织采用高级机器学习等人工智能工具,引导企业利用人工智能提高生产力。2022年4月,Mila创客空间开始运营,支持3D打印机、机器人和其他创新。DFKI面向行业提供卓越的研究服务,特别是将基础研究成果转化为商业和社会应用。DFKI设立了8个生活实验室,为面向应用的研发活动提供测试平台 。(这些实验室主要分为三类:1)DFKI独自设立,如机器人探索实验室;2)联合第三方设立实验室,如智能办公空间生活实验室;3)依托外部单位的力量,如智慧工厂实验室。)同时为推进AI生态快速形成,DFKI设立了9个转移实验室,将合作伙伴的知识和技术成功转出研究系统。合作伙伴员工可以在DFKI工作,与AI研究场景的直接接触增强了员工的专业技术知识,同时DFKI科学家获得了对行业场景的深刻理解。迄今为止,DFKI已经产生100多家衍生企业和2500多个工作岗位。
Mila依托蒙特利尔当地7所顶尖大学开展研究,汇集了1000多名研究者。这些研究主要以项目形式展开,2022年研究项目数量达到447个,增长了39%。实验室机器学习研究团队与行业伙伴合作开展高影响力的项目,自2021年4月以来,已有49家企业从技术转移中受益;此外,Mila积极拓展创新资源,仅2022年,产业合作伙伴达到105家,增长25%,有67个为加拿大本土企业,推动蒙特利尔AI生态快速崛起。DFKI在德国多地设置分支机构,与当地研究型大学形成紧密合作。DFKI的研发项目分散在28个研究部门、9个能力中心和8个生活实验室,迄今为止已开展近1000项研究项目。这些项目资金来源于政府、企业、行业机构、欧盟等,合作伙伴包括大学、企业、政府部门等,DFKI研究汇集了超过76个国家/地区的930名研究人员、630名研究生。
行业引领者是以行业为导向、形成集中式的研发组织,画像如图5所示。这类研发组织研发资源集中、创新质量和效率高、开展人工智能行业前沿技术探索、实施技术产业化,主要以科技领军企业为主。典型案例包括OpenAI、Google Deepmind等。
OpenAI引领行业技术前沿,聚焦通用人工智能。围绕GPT系列大模型,OpenAI布局了Codex(编程模型)、DALL·E(文本生成图像模型)、CLIP(图文匹配模型)等,并在2022年11月发布语言大模型ChatGPT,2023年3月发布多模态大模型GPT-4。OpenAI在大模型安全和伦理研究上走在行业前列,将AI Alignment作为重点,并成立专门团队开展研究。在实现大模型重大突破后,OpenAI加速人工智能创新生态的建设,一方面融入微软现有的客户生态系统,将GPT模型整合到其不同产品中,包括搜索引擎、Office套件、Azure云平台以及GitHub Copilot等;另一方面开放API、发布ChatGPT Plugins,面向人工智能开发者生态,打造类App Store的平台生态系统,吸引众多开发者塑造产业创新生态系统,目前GPT大模型已应用在教育、法律、金融等多个领域。
OpenAI经过数年发展,已在其内部形成了一套适合大模型研发的组织结构、工程体系与协同模式,从而保障了技术的快速演进。GPT-4研发涉及700多人次,共计250人左右直接参与其中。这些人员主要分为六大板块,52个技术功能模块,不同模块间高度耦合。在数据方面上,OpenAI对数据实现全流程把控,有效串联需求发布、标注执行、质检返工、数据安全等环节。在基础设施方面,OpenAI一直致力于推动高效地利用大规模计算资源,形成对模型训练的设施系统化部署,联合Azure重塑AI计算底层架构。在人才方面,OpenAI成员大部分具有名校背景,如斯坦福、MIT、加州伯克利分校等。这些顶尖AI人才精准分工并高度协同实现了重大任务突破。OpenAI当前大量招聘大模型应用、对齐安全、政策影响专家,为大模型广泛应用和产业生态建设奠定基础。
综上分析,本文对人工智能多元研发模式的创新目标、主要特点、面临挑战以及适用研发主体进行比较(表3)。研究表明,不同研发组织聚焦人工智能创新链不同环节,在理论原创、关键核心技术攻关、开放生态建设、行业前沿上各有侧重,形成“创新探索者”“攻关主导者”“生态赋能者”“行业引领者”四类研发角色。国家实验室、国家科研机构、高水平研究型大学、科技领军企业等各类研发组织在研发角色上存在差异。高水平研究型大学(国家科研机构)较多体现出创新探索者角色,国家实验室(国家科研机构)较多体现攻关主导者角色,国家科研机构(非营利机构)较多体现生态赋能者角色,科技领军企业较多体现行业引领者角色。
本文运用多案例比较法,选取国际典型的人工智能研发组织为对象,探索人工智能多元研发模式,主要得到以下三点结论:
第一,人工智能研发组织聚焦创新链不同环节,在理论原创、关键核心技术攻关、开放生态建设、行业前沿探索上各有侧重,形成“创新探索者”“攻关主导者”“生态赋能者”“行业引领者”四类研发角色。
第二,人工智能研发组织角色画像分析表明,各研发主体在创新目标、主要特点、面临挑战上存在显著差异,高水平研究型大学(国家科研机构)较多体现出创新探索者角色,国家实验室(国家科研机构)较多体现攻关主导者角色,国家科研机构(非营利机构)较多体现生态赋能者角色,科技领军企业较多体现行业引领者角色。
第三,人工智能多元研发模式覆盖基础研究、应用研究、产业生态等各方面,共同构工智能研发体系。
一是贡献于人工智能研发组织模式研究,对已有研究大多关注企业研发组织或者产学研合作形成有效补充,从人工智能研发组织方式和战略导向两个维度构建了人工智能研发模式理论分析框架。
二是探索了人工智能研发组织角色画像及其适用情境,为人工智能研发组织的功能发挥提供了研究依据。
本文为我国从国家创新体系层面统筹推进人工智能研发系统布局、提升人工智能科技创新体系协同效能提供了实践参考。国家创新体系涉及政产学研各类创新主体,人工智能多元研发模式表明各类创新主体可结合自身优势和特点开展深入研究,通过多元模式相互协同,贯通人工智能创新链和产业链,实现从理论原创、关键核心技术攻关、开放生态建设、行业前沿探索的系统布局。
第一,本文主要通过多案例比较法识别人工智能多元研发模式,后续研究可结合单案例研究深化特定研发模式;第二,本文侧重人工智能研发组织特定突出角色,未来研究可探索人工智能研发组织的多重角色混合;第三,本文对国际典型人工智能研发组织进行案例分析,未来研究可结合中国案例开展比较研究。
本文来源于《科学学研究》网络首文,2023-08-25。施锦诚,上海人工智能实验室治理研究中心助理研究员,博士后;王迎春,上海人工智能实验室治理研究中心研究员。文章观点不代表本机构立场。