K说联盟|万字长文:从旧金山到上海,解码全球科创中心兴衰史
资讯
资讯 > 社会 > 正文
站内

K说联盟|万字长文:从旧金山到上海,解码全球科创中心兴衰史

K说联盟|万字长文:从旧金山到上海,解码全球科创中心兴衰史

作者:田丰,快思慢想研究院院长、商汤智能产业研究院院长,凤凰网“K说联盟”成员

一、世界科创中心的起源:2030年呼唤新的“世界科学中心”

公元1000年,世界科技创新的中心在中国,北宋为全世界贡献了火药、指南针与传播导航技术、活字印刷术、风力水车、纺织机、钢铁冶金术、高次方程数值解法、建筑技术(《营造法式》与《元祐法式》)与桥梁技术、陶瓷技术、桨轮船与船舶设计、农业工具(曲辕犁、秧马和筒车)、天文技术(水运仪象台、浑仪、浑象)、,以及儿科/产科/针灸科、医药学(《开宝本草》、《嘉祐本草》)、法医(《洗冤录》)等医学成果,科技中心带来商贸中心,耶鲁大学韩森教授在《公元1000年:全球化的开端》一书中提出:“公元1000年标志着全球化的开始,中国宋朝是全球化的中心。”以至于马克思在《机械、自然力和科学的应用》中评价中国科学对西方世界的贡献时说:“火药、指南针、印刷术———这是预告资产阶级社会到来的三大发明。火药把骑士阶层炸得粉碎,指南针打开了世界市场并建立了殖民地,而印刷术则变成了新教的工具,总的来说变成了科学复兴的手段,变成对精神发展创造必要前提的最强大的杠杆。”而这三大发明都在宋代完成。”

表 世界科学中心与时期

表 世界科学中心与时期

到了最近500年,按照英日等国学者的分析,当一个国家的科学成果超过全世界总数的25%,则称为“世界科学中心”,超过25%科学成果持续的时间,则是该科学中心的大发展时期。包括文艺复兴时期的意大利(14-16世纪)、工业革命时期的英国(18世纪)与法国(19世纪)、第二次工业革命时期的德国(19世纪)、信息革命时期的美国(20-21世纪),顺序成为世界科学中心。每个国家的科学兴盛期是60-110年,平均约80年。换句话说,最近十年中,下一个世界科学中心将会脱颖而出,而且伴随科学、技术、经济、文化一体化融合的历史趋势,该科学中心有较大概率成长为世界经济中心、世界金融中心、世界贸易中心、世界航运中心,同时吸引全球人才加入。

二、现代世界科创中心的启示:人才第一

图 世界新生独角兽区域分布图

图 世界新生独角兽区域分布图

截至目前,美国仍是世界科创中心。投资界将估值超过10亿美元的科创公司称为“独角兽”,根据2023年9月发表的《Unicorn Market Cap 2023: Rise of AI》报告分析,全球40%的科创独角兽位于美国的三个城市,旧金山湾区(26%)、纽约(8%)、洛杉矶(6%)。最近三年,欧洲独角兽数量提升很快,已经追上中国,从2021年到2023年,伦敦的独角兽数量翻了一番,并继续成为欧洲的主要科技产业城市。巴黎和柏林是欧洲新一代独角兽的两大孵化土壤。而从国家独角兽总市值角度来比较,美国第一、中国第二、欧洲第三,北京和上海占中国独角兽总市值的“三分之二”(64%)。另一方面,该报告认为中美部分城市独角兽呈现“一枝独秀”(头部单一公司所占比重偏大),例如字节跳动占北京独角兽总市值(3870亿美元)的58%,SHEIN占深圳独角兽总市值的64%,SpaceX占洛杉矶独角兽总市值的62%,上海独角兽市值分布相对均衡。

图 全球各国独角兽总市值排行榜(前15个国家,数据来源同上图)

图 全球各国独角兽总市值排行榜(前15个国家,数据来源同上图)

虽然生成式人工智能(以下简称GenAI)尚处于产业变革的初期阶段,美国旧金山湾区已成为排名第一的科创中心,该区域的GenAI独角兽市值占美国的81%。这与湾区当地科创产业密度正相关,正如纽约是互联网金融(FinTech)与加密货币(Crypto)独角兽的沃土。虽然该排行中尚没有纳入2023年底至2024年初中国GenAI独角兽最新一轮融资数据,但旧金山湾区凭借OpenAI、Anthropic、Scale AI、Character.AI、Cerebras Systems、Adept、Groq、Snorkel AI、Weights & Biases等涌现出的GenAI创业企业,依然可以作为我国科创中心发展的比较研究对象。

图 全球生成式人工智能独角兽市值城市排行榜(数据来源同上图)

图 全球生成式人工智能独角兽市值城市排行榜(数据来源同上图)

第一,因为AI科研人才第一,人工智能科创中心依赖当地高校输送人才,并培育校友创立更多科技公司,构建多层次、丰富的AI人才供给与需求市场。例如旧金山湾区中,涉及人工智能专业的顶尖高校和AI名师是源源不断输送AI人才的“发动机”,斯坦福大学、加州伯克利分校、加州理工学院、圣何塞州立大学、圣克拉拉大学、旧金山大学、卡内基梅隆大学硅谷校区、加州大学旧金山分校、加州州立大学东湾分校、加州州立大学圣马特奥分校等,并拥有全球一流的人工智能教授学者、AI科技企业家校友网络。据《旧金山纪事报》(San Francisco Chronicle)数据显示,在2023年7-10月数月期间,共有579家公司发布了1958个AI岗位,其中59%的AI招聘职位来自于旧金山湾区的科技公司,既包括谷歌、苹果、英伟达等大型公司,也包括Adept AI、Notion等AI创业组织,而且数据显示,旧金山湾区的AI工程师招聘岗位平均工资比其他地区高出21%。而AI科研机构,则凭借显著上涨的薪资待遇从包括全球互联网巨头在内的科研机构吸引人才,例如OpenAI人均年限86万美元,新人起薪即为Google Research的1.6倍,而另一家创业公司Anthropic招聘起薪则相当于微软实验室的近2倍,且不用短期绩效目标妨碍基础科研创新。按照科技人员时薪,美国排名前十位的城市都在加州(旧金山湾区范围内),所以吸引了大批亚洲、欧洲的AI科研人才投身旧金山湾区的世界科创中心。

图 美国顶尖AI公司研究人员薪资(数据来源:硅谷公开消息)

图 美国顶尖AI公司研究人员薪资(数据来源:硅谷公开消息)

第二,世界级科创中心通过法律保障科技人才自由流动,例如硅谷文化促使人才在科技巨头、AI科研团队、初创企业之间跳槽,雇主不得设立“竞业协议”限制,这一举措在促进人才流动的基础上,加速科研经验知识的扩散传播、激发创新和创业潜能、增强市场竞争活力、避免形成垄断、提高行业整体效率、减少法律纠纷与运营成本、建立健康的行业生态、加速前沿技术的组合式创新。加州大学伯克利分校信息学院院长 AnnaLee Saxenian 在《区域优势:硅谷与 128 号公路的文化和竞争》一书中认为,波士顿地区的科技产业逐渐消亡,原因是工程师一生只在一家企业工作,而硅谷却蓬勃发展,是因为湾区的员工常常跳槽到另一家公司,甚至创办新的公司来跟老东家竞争,法律上的保护来自于加州是美国最早立法禁止竞业协议的地方(1872年),所以才从肖克利半导体诞生了“仙童八叛逆”和英特尔等芯片公司,以及Paypal出来的“Paypal帮”,创立了Tesla、SpaceX、LinkedIn、500 Startups、Slide、YouTube等知名科技企业。在2023年 1 月,美国联邦贸易委员会发布声明,拟在全国范围禁止用人单位与雇员签订竞业禁止性条款。

第三,世界科创中心“基础科研人才”与“应用型开发人才”比例均衡,才能形成人工智能的自主创新能力,中国人很擅长做人工智能科研,人才归巢计划刻不容缓,长期培养和留住科技人才就能持续增强我国新一代人工智能国家竞争力。据MacroPolo、清华大学多份人才报告的数据显示,2020年在人工智能领域,美国23%的人才从事AI基础科研,40%的人才从事AI应用产品开发,“基础-应用人才比”约为1:2,而中国3%的人才从事AI基础科研,而65%的人才从事AI应用开发,“基础-应用人才比”约为1:22,若要改变中国人才不愿做基础科研的现状,还应像美国旧金山湾区的OpenAI一样给与科研型人才优厚的待遇和科研发挥的较大空间。另一方面,中国是全球最大的AI人才培养和输出国,有两个“1/3”的数字来证明,世界顶级AI会议发表论文的作者中中国人占1/3,中国AI科研人才1/3在美国工作。而全球最大的AI科研人才流入国是美国,全球60%的AI人才为美国科创中心服务,AI杰出人才数量中美人数对比为1:5,AI顶级研究人才中美人数对比为1:6,基础科研人才的储备和吸引是新一代人工智能科技取得突破的前提条件。应从现在开始,以归巢政策、特殊津贴吸引、保障、安置华人AI科学家、AI工程师归国,如上世纪50年代,中科院特批政策诚邀钱学森、郭永怀、华罗庚、邓稼先、李四光、程开甲、叶笃正、沈善炯、赵忠尧、徐光宪、涂光炽、王德宝、罗沛霖、郑哲敏等一批爱国优秀科研人才,为新中国在短短十几年间,在一穷二白的科学基础上拓荒取得基础科研突破,孕育出核物理技术(“两弹一星”)、稀土科技、气象科技、材料科技、通信科技、航空科技、正如1950年华罗庚踏上中国国土发表的《致中国全体留美学生的公开信》中呼吁:“为了抉择真理,我们应当回去;为了国家民族,我们应当回去;为了为人民服务,我们也应当回去;就是为了个人出路,也应当早日回去,建立我们的工作基础,为我们伟大的祖国的建设发展而奋斗!”

第四,依靠“精英领军”配套工程化小团队,就能取得新一代人工智能的突飞猛进。以OpenAI为例,Sora团队仅为15人,领军人物2位(其中一位刚博士毕业一年),平均年龄约30岁,华人科研人员占比20%,Dall-E团队共14人,华人科研人员占比57%,ChatGPT团队共87人,平均年龄32岁,华人科研人员占比10%。在OpenAI科学家出版的《为什么伟大不能被计划》一书中提出“创造力是一种‘搜索’”,即科研是在人类未知领域中深入搜索,并找到看似与最终目标不相关的“踏脚石”,才能离正确答案越来越近——“新奇事物的重要性在于,它们往往可以成为踏脚石探测器,因为任何新奇的东西,都是催生更新奇事物的踏脚石。”即鼓励科研人员大胆去探索新奇性的踏脚石,往往能够开辟全新的可能性。钱学森提出:“正确的结果,是从超多错误中得出来的;没有超多错误作台阶,也就登不上最后正确结果的高座。”如何让中国AI基础科研人才“敢于创新、敢于突破、不害怕失败”、“敢于质疑、敢于挑战权威、不断探索未知”(钱学森语),是国家新一代人工智能科研机制的真命题。

三、上海AI科创中心:未来之路

1956年,中国航天事业奠基人钱学森在《从飞机、导弹说到生产过程的自动化》一书中写到:“用机器代替人的体力劳动,是第一次工业革命,即机械化;用机械系统来替人作非创造性的脑力劳动,是第二次工业革命,即自动化。”并在80年代任国防科委副主任期间多次强调“21世纪,一定要攻下人工智能、第五代计算机的关,我们的做法要有中国特色”、“更重要的是独立自主,就像原子弹、氢弹、洲际导弹一样,在智能机方面,一定要下苦功夫建立自己的基础”、“人工智能的研究是当务之急”,现在回顾,不禁钦佩中国科学家的远见和胆识。

60多年后,习近平总书记深刻指出,“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的‘头雁’效应”和“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。” 西方通过前几次工业革命赢得了300年世界经济红利,如果中国能够抓住人工智能这个新一代科技的“牛鼻子”,就能为14亿人赢得未来300年的经济与产业战略机遇。在2024年十四届全国人大二次会议上,李强总理在《政府工作报告》中提出:“深化大数据、人工智能等研发应用,开展‘人工智能+’行动,打造具有国际竞争力产品的数字产业集群。”

图 2019-2021年上海市与全国人工智能产业人才供需比指数(数据来源:《上海市重点产业人才紧缺指数报告(2021)》)

图 2019-2021年上海市与全国人工智能产业人才供需比指数(数据来源:《上海市重点产业人才紧缺指数报告(2021)》)

陈吉宁书记指出“科技是第一生产力,人才是第一资源,创新是第一动力”,上海在AI人才培养的战略目标上投入巨大,呈现供需两旺特征。从供给侧看,如旧金山湾区科创中心一样,上海的上海交通大学、同济大学、上海理工大学、华东理工大学、上海师范大学、上海大学等至少9所高校开设人工智能学科专业,其中6所单独设立了人工智能研究院所。从需求侧看,根据《上海市“十四五”产业人才需求调研报告(2020)》预测,AI应用类人才(13.8-15万)、AI基础类人才(10.2-13.1万人)需求最大。“十四五”末上海人工智能产业人才需求规模在34.3万-41.4万人之间。据领英Linked in发布《2019年全球人工智能人才数据》报告显示,上海地区拥有全国33.7%的AI人才资源,且硕士研究生以上学历需求旺盛,而在传感器与智能芯片人才、知识图谱与自然语言处理人才、服务机器人人才、智能网联汽车类人才子类存在较大人才缺口。建议上海借鉴美国评估AI人才需求、吸引全球AI人才的相关政策,例如美国商务部在《人工智能研究和发展战略计划(2023更新版)》中提出的两大战略:

战略7:充分了解人工智能研发人才需求;明确10项事项,具体包括:描述和评估人工智能劳动力;各学习阶段制定人工智能教学材料研发策略;支持人工智能领域的高等教育从业者;培训/再培训劳动力、探索多元化和多学科专业知识的影响;识别和吸引世界顶尖优秀人才;发展区域人工智能专业知识;研究策略以加强联邦人工智能劳动力;将伦理、法律和社会影响纳入人工智能教育和培训;将联邦劳动力优先举措传达给外部利益相关方。”

战略8:扩展公私合作(学术界/工业界/国际伙伴等)以加速人工智能发展;分为3项举措“实现更好的公私合作协同增效”、“扩大与更多不同利益相关者的合作伙伴关系”、“完善、扩大和创建研发伙伴关系机制“。

Sora是OpenAI信仰的“尺度定律(Scaling Laws)”的又一次验证成功。2020年OpenAI 在《Scaling Laws for Neural Language Models》中提出“随着训练数据集、训练算力、模型参数量持续增加,语言模型性能持续提高,为了获得最佳性能,所有三个因素必须同时放大。”这一科学规律已被逐步验证,中国和美国都会沿着这条路走下去。

首先,从AI算力的发展策略来看,应加速国产化AI芯片研发进程,以补贴型芯片、补贴型能源供给,加速超大规模智算中心扩容,以跟上国际最领先的大模型所需的算力规模。美国按照“算力常胜”战略,即充分发挥GPU芯片算力优势与全球互联网数据规模, 不断训练更大参数量的大模型,从千亿、万亿向数十万亿参数规模发展,以逼近AGI目标。所以近期英伟达又发布了新一代GPU芯片GB300,是H100算力的10倍以上,而H100算力是A100算力的3倍,以目前国产GPU对标A100来看,美国在AI算力方面已取得长足进展,我国在DeepSeek工程优化算力通讯基础上,AI科研工作者将摸索出一条独特的人工智能发展路径,即在AI算力只有美国1/20的条件下实现更好的科研目标和模型效果突破。Sam Altman提出“只要有足够的计算资源,就能够建立超越人类的AGI”,以及“我越来越确信,计算将成为未来最重要的货币”,所以各大海外科技厂商纷纷采购最领先的大批量GPU芯片,建立更大规模的智能计算集群,以期望加速逼近AGI蓝图目标,例如亚马逊、Meta、微软、特斯拉都在大量采购GPU(同时自研芯片),最终将达到60-200万张H100卡的目标,并将2-3万张GPU卡组成一个集群。OpenAI甚至筹集5至7万亿美元资金投产AI芯片。根据2023年9月美国商务部发布的《芯片和科学法案》,提供约527亿美元资金补贴、税收优惠政策,用于吸引各国芯片产业转移到美国本土,同时限制拿补贴的企业在中国投资,该法案还拨款2800亿美元用于投资前沿科技的研发。回到我国,正在大规模建设以提升晶圆与芯片产能。根据2020年国务院发布的《新时期促进集成电路产业和软件产业高质量发展的若干政策》中提出目标——到2025年,中国芯片自给率计划要达到70%的发展目标。上海具有良好的AI芯片与算力产业基础,浦东新区的智能芯片产品设计、闵行马桥的芯片生产制造、临港的超级智算中心,正在加速满足快速增长的国产化AI算力需求。按2023年《计算能力和人工智能报告》数据分析,2023年每1.5-2个月,大模型对算力的需求翻一番,远超摩尔定律的算力增速。所以上海地区,以临港超大规模智算中心为基础,应参考中国光伏、新能源车等产业扶持政策,为了持续降低国产芯片采购成本,应对智算中心建设方、使用方实施长期补贴——以用促研,通过前期补贴、国产芯片规模化生产与半导体技术创新,推动普惠AI算力释放AI应用开发者、科技初创团队的创新潜力,据IDC数据预测,2023年以AI训练算力(58.7%)为主,AI推理算力为辅(41.3%),而2024年中国AI推理算力将达到67.7%,反超AI训练算力(32.3%),证明中国AI2.0商业应用将大量涌现,而更便宜的AI算力价格,对应用开发、应用运营都有显著帮助。

其次,从训练数据发展策略来看,我国数据资源潜力巨大,在国家数据局、上海数据集团逐步实现“让数据供得出、流得动、用得好”的过程中,将长期支撑新一代人工智能技术的可持续发展。据EPOCH权威机构分析,全球高质量文本数据将在2024年“用光”(被大模型训练完),理论上将会导致“尺度定律”失效(大模型发展停滞)。OpenAI也做出预判“从长远来看,人类产生的数据可能会变得不足。因此,熬一个能够用更少的数据学习更多东西的模型。”从中期来看,我国拥有比美国更大规模的数据产生“源头”,我国14亿人口、106亿终端设备每天都在源源不断产生增量数据,而美国3.3亿人口、35亿终端设备则略逊一筹,如我国能够持续降低传感器成本、数据收集与标注成本,在上海率先落地数据开放、共享、流通、交易模式,就能让长三角乃至全国的数据成为人工智能的催化剂和生产要素。另一方面,中美两国都在加紧投入AI合成数据研发,或逐步形成新的高质量数据源,例如Sam Altman提出地球上所有人每天产生100万亿个词,而OpenAI现在每天产生超过1000亿个词,即已经达到1%的内容产出,而凭借人工智能技术和算力的指数级发展,Gartner预测在2030年合成数据将取代真实数据用于AI训练。

最后,从模型发展策略来看,大模型科研是长期重资本投入,且具有庞大的未知领域需要探索,多模态大模型、端侧大模型、模型安全技术已成为2024年人工智能发展三大趋势,长期扶持AI基础研发机构与相关科研创企,是新一代人工智能技术突破的关键成功因素。Sam Altman在推出Sora之后坦言“集成了文本、语音和视频等各种形式的多模态AI,结合广泛可用的视频等数据集,不断生成新颖的视频内容,预计将出现重大飞跃。”这一重大飞跃包括GPT-5,“许多初创公司认为,GPT-5的进步只会是小幅度的,因此他们假设进展会缓慢,但我认为这是一个严重错误。在技术巨变的情况下,像往常一样,他们将被下一代模型‘压倒’。”不论下一代是否叫GPT-5,对GPT-4都是压倒性的优势,会直接改变AI2.0应用开发的游戏规则。任何“创造性”都是对过去发生的事情加上一个误差项的一种重新组合,乘以反馈循环的质量和选代次数,人们认为他们应该最大化误差项,但实际上,诀窍在于最大化其他两个因素。纵然OpenAI在人工智能领域不断推陈出新,而上海也孕育出商汤科技、壁仞科技、燧原科技、智元机器人、达阔机器人、嬴彻科技等一批人工智能科创企业。同时,由上海人工智能实验室与众多知名高校合作开展科学研究,共同推动新一代人工智能基础理论、基础软件、基础硬件、核心技术、开放平台、应用、伦理与政策研究,2024年2月底HuggingFace发布开源大模型排行榜上,上海人工智能实验室与商汤科技联合研发的InternLM2(书生·浦语2.0)取得第一名,在综合能力、推理能力、数学能力、编程能力等方面,超过谷歌Gemma、Meta Llama-2、Mistal三个国外领先的开源大模型。另一方面,商汤科技在长期重度科研投入中,研发出的“日日新”大模型,具有和Sora一样的扩散型Transformer架构,且在机器视觉领域积累了长达10年的基础研发经验、多模态数据高质量标签能力,并依托上海临港超大规模智能计算中心基础设施,从开源和闭源两条路径快速迭代升级基础模型能力,不断推出“商量”语言大模型、“秒画”AI绘画大模型、“如影”数字人视频生成大模型、“琼宇”3D空间建模大模型、“格物”3D小物体建模大模型、“大医”辅助医疗大模型、“代码小浣熊”辅助编程大模型等国产人工智能科研成果与商业服务。

图 中国人工智能高质量发展之路(信息来源:商汤智能产业研究院)

图 中国人工智能高质量发展之路(信息来源:商汤智能产业研究院)

人工智能作为上海三大先导产业之一,具有“人才、算力、模型研发、数据”四大先发优势,凭借上海智慧城市、智慧产业、智慧科研场景中海量设备采集的超模态数据,国产大模型正在驱动千行百业的“新质生产力”,尤其是“人工智能+”制造业、服务业、科研、基建四大板块,是中国独有的全工业品类、大服务市场、广谱基础科研、重投入基建优势领域,也是中国新一代人工智能科技的高质量发展方向。人工智能计算什么不是最重要的,控制什么更重要,能解决实际问题的科研就是国之重器。

K说联盟|万字长文:从旧金山到上海,解码全球科创中心兴衰史

书名:《AI商业进化论:“人工智能+”赋能新质生产力发展》

出版社:人民邮电出版社

作者:田丰

定价:99.8元

帮助你定位AI当下发展坐标的指南针

帮助你洞察AI未来演进趋势的航海图

通俗化解读AI的原理、特性和四大发展规律、提供AI赋能商业、引发新质生产力变革的一手案例分析。既有宏观视角的全局观照,又有各行业应用层面的下探记录,聚焦AI的原理与实践、现在与未来,是当下AI应用的全景图、更是身处AI技术浪潮之中的探路书。

[责任编辑:吴文乐 PX331]

推荐2

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载