基金委邀请13位专家，深度解读2021年“十大突破性技术”

　　2021 年 2 月 24 日，MIT Technology Review 一年一度的 “十大突破性技术” 榜单正式发布。自 2001 年起，该杂志每年都会评选出当年的 “十大突破性技术”，这份在全球科技领域举足轻重的榜单曾精准预测了脑机接口、量子密码、灵巧机器人、智慧传感城市、深度学习等诸多热门技术的崛起。

　　本年度 MIT Technology Review “十大突破性技术” 分别为：mRNA 疫苗、生成式预训练模型、数据信托、锂金属电池、数字接触追踪、超高精度定位、远程技术、多技能型人工智能、TikTok 推荐算法、绿色氢能。

　　为了让广大读者深入了解这十项技术的科学价值及其背后的科学故事，近日，国家自然科学基金委员会特邀请各领域著名科学家分别对其进行深入解读，以激发科研人员的创新思维，并促进科学界的学术交流。该系列解读也被推荐为《中国科学基金》2021年第3期封面文章。（图片均来源于来源：MIT Technology Review 官方 APP）

　　一、mRNA 疫苗（Messenger RNA vaccines）

　　在 1918 年大流感 100 年后，全球爆发了又一次呼吸道病毒传染病大流行，罪魁祸首是一种具有包膜的正链单股 RNA 病毒 —— 严重急性呼吸系统综合征冠状病毒 2（SARS-CoV-2）。根据世界卫生组织的统计，截止到 2021 年 6 月 17 日，全球已有 176693988 人确诊，造成 3830304 人失去了生命。面对病毒的挑战，人类最有力的对抗武器是疫苗。针对这次疫情，从疫苗研发到实际应用的速度空前。截止到 2021 年 6 月 15 日，全世界已接种了 2377780590 剂次针对 SARS-CoV-2 的各种疫苗。其中包括有首次应用就一战成名的 mRNA 疫苗，它被 MIT Technology Review 评选为 2021 年 “全球十大突破性技术” 之一。

　　专家点评：

　　专家简介：祁海清华大学医学院院长，教授，“长江学者” 特聘教授，国家杰出青年科学基金获得者，霍华德休斯医学研究所国际学者。曾获教育部高等学校科学研究优秀成果奖自然科学一等奖以及北京市自然科学奖二等奖。曾获美国免疫学会研究者奖、树兰医学奖、吴阶平 — 保罗杨森医学药学奖、谈家桢生命科学创新奖等奖项。长期研究抗体免疫应答调控，开创性成果包括发现抗体亲和力成熟的细胞间正反馈机制、鉴定了记忆 B 细胞前体、揭示抗体应答雌雄二态性的细胞学基础、以及定义了第一条调控获得性免疫应答的脑 — 脾轴神经通路。

　　mRNA（Messenger RNA）被称为信使 RNA，是携带编码蛋白遗传信息的单链 RNA。在细胞内，mRNA 指导把单个氨基酸按特定序列组成蛋白质，是细胞内 “蛋白工厂” 生产的 “指导员”。很久以来，许多人都曾设想把在体外人工合成的 mRNA “指导员” 导入细胞内从而指导 “蛋白工厂” 的工作。第一例证明体外转录的 mRNA 可在体内指导蛋白质合成的研究发表于 1990 年，Wolff 等将编码 β- 半乳糖苷酶（β-galactosidase）的 mRNA 注射到小鼠的骨骼肌，成功检测到了 β- 半乳糖苷酶的活性。

　　两年后，Jirikowski 等在大鼠中成功的用 mRNA 表达出了有功能的抗利尿激素（vasopressin）。虽然这些早期研究显示出 mRNA 作为潜在治疗载体的原理可行，其实际应用的缺陷也变得十分明显。mRNA 本身不够稳定，在体内易降解，不易靶向递送，而且可以导致强烈的免疫激活和炎症反应。因此，在而后的许多年中，核酸治疗领域都没有把 mRNA 作为开发重点。近十年的技术进步，通过对 mRNA 的人工修饰，大幅降低了 mRNA 本身的免疫原性，提高了安全性。通过脂质纳米粒包裹 mRNA 的递送技术，大幅提高 mRNA 在体内的表达效率。加之 mRNA 只需体外转录就可人工合成，快速价廉，实用性随之增高。

　　通过 mRNA 表达蛋白抗原来诱导机体针对蛋白产生免疫应答，可能达到疫苗效果。机制上，脂质纳米粒包裹的 mRNA 可有效的进入树突状细胞中，一方面使树突状细胞按 mRNA 指导表达蛋白抗原，另一方面通过脂质纳米粒类似佐剂的作用激活树突状细胞。作为免疫系统中最重要的抗原递呈细胞，树突状细胞可将蛋白抗原消化分解成肽段，并呈递于细胞表面的一类、二类组织相容性复合体，引起 CD4、CD8 T 细胞的特异性应答。

　　CD4 阳性 T 细胞可分化成不同的亚群，分泌细胞因子，促进机体的免疫反应。CD8 阳性 T 细胞可分化成杀伤性 T 细胞，从而在感染发生时杀伤感染细胞。在接种疫苗一段时间后，CD4 和 CD8 T 细胞都会分化成为记忆 T 细胞。

另外，mRNA 表达的蛋白抗原也可以被 B 细胞抓取，促使其活化，在 CD4 阳性 T 细胞的帮助下这些 B 细胞分化成为记忆 B 细胞和产生高亲和力抗体的长效浆细胞。

　　这次新冠肺炎疫情中，mRNA 疫苗展现出了惊人的保护效果。在临床前研究阶段，Moderna 开发的 mRNA 疫苗 mRNA-1273 在恒河猴中可诱导强烈的免疫应答。

　　在第二剂接种后四周，血清中可检测到高滴度中和抗体，表达白介素 - 21 的滤泡性辅助 T 细胞显著增多。在包含了 30420 志愿者的三期临床研究中，mRNA-1273 的有效率达 94.1%。这款疫苗对保存条件要求较为严苛，需在 - 20 ℃条件下运输。

　　中国科学家开发的耐高温 mRNA 疫苗 ARCoV 表现不俗，在动物实验中可以诱导抗体和细胞免疫，并显著降低病毒载量；它只需在 2—8 ℃保存。目前这款国产 mRNA 疫苗正在墨西哥进行 III 期临床实验。

　　使用外源 mRNA 导入人体实现细胞内蛋白表达的本质就是让人体自身细胞成为 “工厂”，生产所需的蛋白分子。该技术显然不局限于新冠病毒疫苗。多国研究者还在针对其他诸如 HIV 和 Zika 病毒设计和开发 mRNA 疫苗。

　　该技术也不局限于抗感染疫苗，比如也有针对黑色素瘤的 mRNA 疫苗正在临床试验中。事实上，使用 mRNA 表达技术也不局限于做疫苗。比如通过表达正确的血红蛋白来作为治疗性蛋白分子，同样思路可能用于治疗镰状红血球贫血症。

　　时势造英雄，mRNA 疫苗在这次新冠肺炎疫情中显示出了巨大潜力。同时，我们也要注意到，mRNA 技术的第一个概念性实验证明距今 30 年，再一次说明投入源头创新，回报不一定是立竿见影；但假以时日，金子总要发光。mRNA 技术未来还会给我们带来什么新的治疗突破？我们拭目以待。

二、生成式预训练模型 (GPT-3)

　　具有写作和对话功能的大规模自然语言模型使人工智能朝着更好地理解人类的自然语言与人机交互这一目标迈出了坚实的一步。在众多语言模型中，OpenAI 公司开发的 GPT-3 是目前为止参数最多、规模最大、能力最强的模型。

　　通过利用大量的互联网文本数据和成千上万的书籍进行模型训练，GPT-3 模型对人类自然语言的模仿到了一个不可思议的地步，极具真实性，也因此成为迄今为止令人印象最深刻的语言模型。

　　虽然 GPT-3 模型建模能力、描述能力非常强，但是也存在众多问题和局限性。首当其冲的就是 GPT-3 模型不能理解什么是真正意义上的写作（自然语言生成），因此有时会生成一些不可控的内容。

　　其次，训练 GPT-3 模型需要大量的算力、数据和资金投入，并会产生大量的碳排放，只有资源充足的实验室才有能力开发类似的模型。此外，由于 GPT-3 模型在充斥错误消息和偏见的互联网文本数据上进行训练，往往会产生与训练数据类似，即带有偏见的篇章段落。

　　专家点评：

　　专家简介：张民苏州大学特聘教授，博士生导师，计算机科学与技术学院院长。国家杰出青年科学基金获得者， “国家百千万人才工程” 入选者，国家级有突出贡献中青年专家，享受国务院政府特殊津贴。主要研究领域为自然语言处理、机器翻译和人工智能。

　　专家简介：李俊涛苏州大学计算机科学与技术学院副教授。2020 年于北京大学获博士学位，主要研究方向为文本生成和对话系统。

　　（1）为什么GPT-3可以入选 10 大技术

　　人工智能已经成为人类社会经济和社会发展的重要支撑技术，是引领新一轮科技革命、产业和社会变革的战略性技术，自然语言理解是下一代人工智能的核心技术之一，其关键技术的突破极具科学意义和产业价值。

　　语言模型是利用计算机对自然语言进行抽象数学建模，是自然语言理解最核心的科学问题。广义上，任何自然语言理解模型都可称之为语言模型，因为都要进行数学建模。狭义上讲，语言模型要完成对一段文字的概率估计，或者给定上下文估计某个语言片段的出现概率或者抽象数学表示。

　　通常所指的语言模型是狭义语言模型。语言模型的历史从 1948 年提出的 N-Gram 模型、1954 年的分布式理论词袋模型、1986 年的分布式表示、2013 年的 Word2Vec 模型直到 2018 年提出的预训练模型。

　　预训练语言模型（最具有代表性的模型包括 ELMo、BERT 和 GPT）对自然语言处理领域产生了深远的影响，是深度学习时代自然语言处理领域里程碑式的研究成果。

　　这一系列基于深度学习技术的模型只需要利用非监督的语言模型训练目标函数即可从海量的文本中捕捉和学习到各种类型的有效信息，能够动态生成更加准确的具有上下文信息建模能力的字、词、短语乃至句子和篇章的向量表示和生成概率，并可以在多种下游任务上取得惊艳的效果。

　　例如问答、阅读理解、文本蕴含、语义相似度匹配、文本摘要、代码生成、故事创作等。除了强大的表示学习能力和多任务泛化属性以外，这些预训练语言模型还具有强大的小样本学习能力，只需要很少数据样本（甚至是在零样本学习的设置下），即可理解特定的任务并取得和监督学习模型相当甚至更好的表现。在众多模型中，2020 年 5 月 OpenAI 公司所提出的第三代 GPT 模型（GPT-3）凭借其当时最大的参数规模、非凡的模型能力、多任务泛化表现以及小样本学习能力入选 2021 年 MIT Technology Review 的 “全球十大突破性技术”。

　　（2） GPT 等系列模型发展过程和能力变化

　　预训练语言模型数量众多，其中具有里程碑意义的典型模型包括 ELMo、BERT 和 GPT。限于篇幅，在此只选择 GPT 系列模型进行代表性介绍。

　　在对 GPT-3 模型进行解读之前，我们首先对预训练语言模型的初衷和中间发展过程进行回顾。以 N-Gram 为代表的传统语言模型是计算给定语言片段的概率或者给定上文预测下一个词的出现概率，采用的是传统的基于频率的离散统计概率模型。

　　其主要问题是离散的词表示方法描述能力差，参数空间成指数级增长，基于频率的统计概率模型建模能力差，导致最终语言模型描述能力不足、鲁棒性差、准确率不高。

　　为解决上述问题，以 ELMo、BERT 和 GPT 为代表的预训练语言模型利用大规模甚至全网数据，基于生成式语言模型或者掩码语言模型，用神经网络方法训练语言模型。

　　这样，预训练语言模型既有传统模型的概率输出，也可生成语言片段的向量表示。由于采用神经网络的方法，可以利用可导、可微等强大的数学工具和极大规模的数据，所以预训练语言模型上下文建模能力超强，可计算出更加准确的概率和上下文强相关的语言片段的动态向量表示。

　　ELMo 开启了第二代预训练语言模型的时代，即上下文相关和 “预训练 + 微调” 的范式。ELMo 是一种生成式模型，以双向 LSTM 作为特征提取器，利用上下文信息动态建模，较好地解决了以 Word2Vec 为代表的第一代预训练语言模型存在的一词多义问题，在自然语言生成任务上表现尤为出色。

　　BERT 是一种掩码式语言模型，以 Transformer Encoder 为特征提取器，在自然语言分析和理解任务上表现尤为出色。GPT 是一种生成式模型，以 Transformer Decoder 为特征提取器，在自然语言生成任务上表现更为突出。

　　在上述系列模型提出以前，以自然语言理解为代表的下游任务主要采用监督学习的方式在相应的标注数据集上训练模型。这就需要每一个目标任务有充足的标注数据，并且在特定任务上训练的模型无法有效地泛化到其他任务上。

　　在数据不足的情况下，这类判别式模型就无法取得令人满意的效果。针对这一问题，OpenAI 团队提出了第一代的生成式预训练语言模型（GPT-1）是基于 Transformer Decoder 的生成式语言模型，对该模型结构没有新颖改动，但扩大了模型的复杂度。

　　该类生成式预训练模型只需要利用非监督的语言模型目标函数即可进行训练，因此可以利用海量的无标注数据进行模型学习。除此以外，GPT-1 模型在增强下游任务时对各种输入数据的格式进行了统一，以实现最小的模型结构修改。

　　基于以上两个特点，GPT-1 只需要简单的微调监督训练即可用于下游任务，并取得显著的效果提升，展示了生成式预训练语言模型强大的泛化能力。额外的评测发现 GPT-1 在零资源的设置下仍然具有一定的泛化能力。

　　这些结果展示了生成式预训练的强大威力，为后续参数规模更大、所需训练数据更多的模型版本奠定了基础。

　　GPT-2 在 GPT-1 的基础上，对模型结构进行了 5 点微小改进，增加更多的训练数据，进一步提升了生成式预训练语言模型的泛化能力，重点解决 GPT-1 在下游任务使用时需要监督微调训练的问题。

　　通过在模型训练时引入任务信息、利用比 GPT-1 模型更多的训练数据（40GB vs. 5GB）、搭建更大参数规模的模型（15 亿 vs. 1.17 亿），GPT-2 模型在零资源的设置下超越了多种下游任务上的前沿模型，例如机器翻译、阅读理解、长距离依赖关系建模等。

　　GPT-2 模型的这些特点揭示了更大的模型容量和更多的训练数据可以进一步提升模型的泛化能力以及减少对监督训练的依赖。此外，GPT-2 模型的容量和训练数据相比，还处于欠拟合的状态，这就需要进一步增大模型的参数规模。

　　GPT-3 在 GPT-2 模型的基础上进一步扩大了参数 (1750 亿 vs. 15 亿) 和数据规模（45TB vs. 40GB），是目前为止最大的语言模型，无需微调训练即可用于下游任务，在零资源（Zero-shot）和小样本（Few-shot）设置下具有出色的表现。

　　在 GPT-2 的多任务泛化能力基础上，GPT-3 在新的任务上取得了惊艳的结果，包括数学加法、新闻文章生成、词汇解读、代码编写等，并且这种模型表现会随着参数量的进一步增加而提升。

　　（3）成功和局限性背后的根本原因讨论

　　通过对比 GPT 三代模型的设计初衷和发展过程可以发现，三代模型都是基于 Transformer Decoder 结构，GPT-3 模型的强大能力建立在规模效应的基础上，即超强的泛化能力仅来自于增加模型和训练数据的规模。

　　也就是说，GPT-3 的本质还是一种数据驱动的模型，通过利用超大容量的模型来拟合海量的数据，最终实现模型的收敛。因此，数据驱动模型的特点都会体现在 GPT 系列模型上，即模型的能力取决于所拟合数据的覆盖范围、分布情况以及质量。

　　无论是新的数据还是不同的数据分布亦或是数据中的噪声都会给模型带来灾难性的问题。最新的测试结果显示，GPT-3 模型无法在自然语言推理、填空、长文本生成和一些阅读理解任务上取得较好的表现，表明 GPT-3 模型更多的是停留在数据拟合阶段，而非真正理解自然语言。

　　除此以外，受限于互联网文本数据的质量，GPT-3 模型会生成一些带有偏见且令人厌恶的内容。这些都表明，GPT-3 依然停留在感知智能阶段，距离通用智能和认知智能还有遥远的距离。

　　因此，GPT-3 被认为 “具有一定泛化能力的记忆”，更容易获得并记住陈述性知识，而不是理解知识，不具备真正的逻辑推理能力和明辨是非的能力。

　　（4） GPT-3 的意义

　　虽然 GPT-3 模型还不具有意图或对现实世界中的请求做出响应的能力，但是其对人工智能领域的影响是深远的。

　　从 2012 年深度学习在各个领域开始爆炸式的发展到现在已经有将近 10 年的时间，新技术和新算法的发展也进入了瓶颈期，数据驱动模型的效果和能力似乎也遇到了天花板，而 GPT-3 模型的出现为深度学习领域注入了一支强心剂并引发了新的思考。

　　最直接的问题就是这种随着模型规模增加而实现的能力扩展是否具有稳定性和可预测性？从短期的结果来看，这种规模效应还会随着计算机硬件算力的提升，继续提高深度学习的天花板。

　　第二个问题是深度学习的极限在哪里？这种数据驱动模型是否最终能真正地理解语言？最后，深度学习的尽头是否会是真正的人工智能？是否能实现认知能力和通用智能？

　　从实际应用的角度来看，GPT-3 的功能非常强大，可以完成问答、阅读理解、摘要生成、自动聊天、搜索匹配、代码生成以及文章生成等。

　　鉴于 GPT-3 模型所面临的安全性和不可控性，包括在自然语言理解时遇到鲁棒性的问题、在内容生成时会输出虚假内容和充满偏见信息的问题等，在某些应用场景，其应用价值主要还体现在智能辅助任务上，不能直接面对最终的用户。

　　例如，在总结报告生成、创作写作等任务中，利用 GPT-3 根据用户的任务描述生成相应的内容，再引入人工校验编辑，将最终编辑后的内容呈现给最终用户。除此以外，GPT-3 可以用于开发游戏应用等无明确任务定义和完成目标的场景。

　　（5）未来研究方向和中国的相关情况

　　总的来说，以 GPT-3 为代表的的预训练模型还存在各种工程应用问题、道德问题和社会问题。同时，在推动该类模型的发展时还面临着跨学科合作、开放共享、资源不平衡和安全防护等挑战。

　　中国在这方面亦有相应的布局和长远规划，目前已经取得了非常好的前期成果，以 “悟道” 和 “盘古” 为代表的超大规模智能模型系统已经在模型效果、领域移植和泛化、小模型、模型训练效率、多语言、弱相关多模态预训练、通用、可控、知识融入、蛋白质序列预测等场景中取得了突破。

　　相信在未来的 10 到 20 年，中国在人工智能基础技术创新、人才和团队建设、社区开源等方面会达到世界领先的水平。

　　三、数据信托（Data trusts）

　　数据信托是信托类型化研究和当代信托立法中典型的新生事物，信托制度起源于英国，发展于美国，从法律角度看，信托是指基于对受托人的信任，委托人从其自身利益出发，将资产交给受托人管理的行为。

　　数据信托则是受托人管理一群人的数据或数据权利的行为，这就像医生有责任依据病人的利益来行事一样，数据受托人管理委托人的数据或数据权利，同时要对其利益负责。理论上，数据信托允许用户行使其作为数据生产者的权利。

　　专家点评：

　　专家简介：张小松电子科技大学网络空间安全研究院院长，博士生导师，教育部长江学者特聘教授，中国电子学会区块链分会副主任委员。长期从事计算机网络与系统安全技术的研究，以第一完成人先后获国家科技进步奖一等奖、二等奖各 1 项，另获省部级科技进步奖一等奖 2 项，发明奖 2 项。

　　数据的价值和资产属性已经被社会熟知和认可，但是数据资产存在一个特殊性，即和实体资产相比，数据只要在控制人手里，几乎可无成本进行分析、挖掘、复制和扩散并获利，并且其中个人隐私信息无法得到保护。

　　典型的例子是当我们通过电商平台完成交易后，后期总会看到和前期交易内容有关联的选择性推送商品广告信息，因此带来一个严重的问题，即在数据生产者及数据权属所有者（如广大公民个体）、数据实际控制者（如提供各类服务的单位部门）、以及数据利益的享有者（如能获取各类数据的机构企业）相互分离的情况下，生产者的数据在采集、分析、挖掘、使用全生命周期中，其隐私如何能得到更好的保护，价值如何能得到更好的保障。

　　基于此，信托理论被引入用来保护数据主体所遭受的敏感信息侵害，加强数据安全保护，有效应对境内外数据安全风险。2016 年，美国耶鲁大学教授杰克・巴金（Jack M. Balkin）在隐私数据保护领域首次提出采用信托工具解释数据主体与数据控制人之间关系的主张。

　　2017 年，《英国人工智能产业发展报告》明确提出了 “Data Trust” 一词，并建议利用数据信托制度建立数据投资治理架构，以确保数据交换安全互利。2018 年 10 月，英国开放数据研究所（Open Data Institute，ODI）首次明确将数据信托定义为 “提供独立数据管理权的法律结构”。

　　数据信托是数据资产信托财产的一个闭环：数据持有者首先要将自己所持有的某一个数据资产作为信托财产设立信托；再进行信托受益权转让，委托方通过信托受益权转让获得现金收入；随后，受托人继续委托数据服务商对特定数据资产进行运用和增值，产生收益；最后，向社会投资者进行信托利益分配。

　　数据信托的实质是在数据主体与数据控制人之间创设出信托法律关系，数据控制人基于数据主体的信任对数据享有更大的管理运用权限，同时也承担更严格的法律信义义务。

　　数据控制人的数据管理运用权限包括但不限于访问控制、访问审核以及数据的匿名化处置等重要内容，以此平衡数据主体的隐私保护与数据可交易价值之间的紧张与冲突。与此同时，数据控制人还应履行对数据主体的信义义务，这主要表现为信托法上的谨慎义务、忠实义务、保密义务等，不得损害数据主体的根本利益。

　　数据信托主要解决两大问题：

　　（1）解决数据资产的授权使用问题。数据主体既是数据信托的委托人也是受益人，数据控制人则是数据信托的受托人。数据控制人的数据管理运用权限包括但不限于访问控制、访问审核以及数据的匿名化处置等重要内容，以此平衡数据主体的隐私保护与数据可交易价值之间的紧张与冲突。

　　（2）数据信托还可以明确数据资产的收益安排，使得数据资产增值部分的利益归属可以按照委托人意愿进行设计和分配。通过重置数据主体与数据控制人之间的权益结构，把数据控制人的数据权限与数据义务有效链接起来，促进数据的合理有效利用。

　　应该清楚地看到，数据信托作为大数据时代的新生事物，无论在法律层面还是保障数据信托实施的技术层面仍不是完备的。

　　首先，在法律层面，针对数据使用的用途限制、安全与隐私保护政策及风险管控问题，数据信托仍需要法定信托属性、数据信托的信托财产范围、数据信托中的信义义务的具体规制，建立更加完善的法律法规。

　　其次，在保障数据信托实施的技术层面，针对数据在流转各环节都可能面临的安全风险，需要从数据隐私保护、数据确权、数据追溯、权益可信分配等多方面提供更加全面、系统、可信的技术手段，除传统的数据加密、身份认证、安全接入、应用保护、访问控制技术外，还需要结合信息技术的应用和发展，研究如下关键技术：

　　（1）隐私保护数据发布，敏感数据在进入流通市场之前进行必要的隐私检验和脱敏处理。

　　（2）区块链技术的应用，有效保证数据的可信性、数据流通与使用的可追溯性，区块链技术也是目前进行数据确权的最佳解决方案。利用区块链技术，可以使得登记、交易转让、清结算、查询举证更加透明、高效、低成本。

　　（3）隐私保护的联邦学习，结合安全多方计算、差分隐私或同态加密技术实现分布式的深度学习，在智能化学习的同时保障用户的隐私。

　　四、锂金属电池（Lithium-metal batteries）

　　制约电动汽车产业发展的一大难题就是电池技术。目前，电动汽车普遍使用的是锂离子电池，这种电池昂贵、笨重、能量密度低，并且其所依赖的液体电解质在碰撞时极易起火。电池的一系列缺点体现在电动汽车上就是：价格高、续航低、充电慢，而且还存在安全隐患，这些正是让众多车主对电动汽车望而却步的原因。显然，要使电动汽车比汽油汽车更具竞争力，就需要一种突破性电池来弥补这些缺陷。硅谷初创公司 QuantumScape 声称已经开发出全新的锂金属电池，其采用固体电解质（陶瓷）克服了传统锂离子电池存在的这些缺陷。

　　专家点评：

　　专家简介：张强清华大学长聘教授，长期从事能源化学与能源材料的研究，致力于将国家重大需求与基础研究相结合，面向能源存储和利用的重大需求，重点研究锂硫电池的原理和关键能源材料。提出了锂硫电池中的锂键化学、离子溶剂复合结构概念，并根据高能电池需求，研制出复合金属锂负极、碳硫复合正极等多种高性能能源材料，构筑了锂硫软包电池器件。曾获得国家杰出青年科学基金、教育部自然科学一等奖、教育部青年科学奖、英国皇家学会 Newton Advanced Fellowship、国际电化学会议 Tian Zhaowu 奖。在 Advanced Materials、Journal of the American Chemical Society、Angewandte Chemie 等发表 SCI 收录论文 200 余篇，授权发明专利 50 余项。

　　当代社会生产和生活方式高度依赖于能源的利用。二次电池是一种可以实现化学能与电能高效可逆转化的器件。

　　锂离子电池是一种典型的二次电池，具有能量密度高、循环寿命长、无记忆效应、便携等特点，方便电能的移动存储、输运和利用，支撑现代生产生活进入 “无线” 模式，促进社会朝着清洁、便携不断发展。

　　随着便携式电子设备、电动汽车、储能电站等新生事物的不断涌现，锂离子电池成为当下二次电池的 “主力军”。锂离子电池获得 2019 年诺贝尔化学奖，是对整个行业的认可和激励。

　　然而，锂离子电池受制于自身材料的嵌入式能源存储机制，历经 30 余年发展后，其能量密度逐渐接近极限值。研发具有更高能量密度的二次电池成为社会共识。

　　此次入选 MIT Technology Review 2021 “全球十大突破性技术” 的基于固态电解质的锂金属电池正是突破锂离子电池能量密度上限的新体系电池。锂金属电池的能量密度可以超过 400 Wh/kg，相比于现在锂离子电池提升 30% 以上。

　　这意味着电子设备和电动汽车等可以具有更长的续航，缓解人们的里程焦虑。锂金属电池能量密度高的主要原因是采用转化型储能机制的锂金属为负极。锂金属具有极高的理论比容量和极低的电极电势。

　　事实上，早在 20 世纪 60 年代就提出了锂金属电池的概念，80 年代也做过商业化尝试。由于在有机电解液中，锂金属负极不均匀锂沉积引起安全隐患，金属锂电池未能在各种应用场合中广泛应用。

　　为了克服锂金属负极的安全隐患，此次入选突破性技术采用固态电解质来匹配正极材料和负极材料构筑锂金属电池。固态电解质可以克服液态电解液易泄露、易燃的问题。

　　在能量密度和安全性之外，此次入选的突破性技术对电池快充性能尤为关注。快充性能的提升，将使得充电和加油一样方便，是另外一个缓解里程焦虑的方式。基于固态电解质的锂金属电池如能够兼顾能量密度、安全性和快充性能，将有望实现与锂离子电池相互补充甚至替代。

　　突破性技术所展示的固态锂金属电池性能是基于电芯水平。如果要应用于电子设备、电动汽车及储能设备上，仍需要考虑电芯大规模、标准化生产以及多电芯串并联组装成电池组的电池管理问题。

　　此外，实际工况远比实验室条件复杂，如高低温、倍率切换、过充、过放、撞击挤压等条件下是否保障安全的问题。针对固态金属锂电池，需要建立一系列性能评价原则，经过充分的性能验证和安全保障继承，才能满足实际工况的要求。

　　尽管目前固态锂金属电池展示优异的前景，但距离固态锂金属电池真正实用化仍还有许多科学和技术问题需要解决。例如，界面接触电阻大、固态电解质界面稳定性、锂枝晶内部生长、固态电解质厚度和固态电池的成本等。固态锂金属电池仍需要在不断探究和摸索中发展。

　　目前中国在固态锂金属电池方面的基础研究基本与国际同步，产业研究和技术工艺方面甚至领先。

　　在国家政策和科技项目的支持下，中国在固态锂金属电池研究方面建立起了从原子、分子，到材料，再到器件的多尺度的认识，并在应用示范上取得了一些实际经验，为固态锂金属电池的研究和推广奠定了坚实的基础。

　　同时，在项目推进的过程中，一大批有志于从事固态锂金属电池研究的青年成长起来，为固态锂金属电池及其他新型电池体系的持续推进储备了人才。

　　固态锂金属电池是极具前景的下一代高能量密度电池，在世界范围内获得了广泛研究和投入。固态锂金属电池的突破，对现有的锂离子电池将是有力的补充或替代，从而能够为消纳间歇性的可再生能源发电提供技术基础，有利于可再生能源的大规模推广利用，从而促进能源消费和生产转型，为实现碳中和目标提供强有力支撑。

　　五、“数字接触追踪” 技术（Digital contact tracing）

　　2020 年全球都在经历的新冠肺炎疫情让 “数字接触追踪” 引起人们的关注。新冠疫情之下，科技为公共卫生调查人员追溯感染者的行踪提供新思路 —— 数字接触追踪。

　　使用该技术，卫生调查人员不再需要依靠病人的记忆对其行踪进行追踪，这减轻了对疾病监控的压力。这一技术对应到实际应用被称为 “曝光通知”（Exposure Notification）。

　　对于该数字接触追踪系统，程序员在几周内完成了建立和运行，并将代码开源共享，以保证全球各地的、苹果和安卓的用户都可以使用这一功能。

　　专家点评：

　　专家简介：程学旗中国科学院计算技术研究所研究员、博士生导师，国家杰出青年基金获得者。主要研究方向：数据科学基础理论，大数据分析技术与系统，网络与社会治理大数据应用等。在国内外学术期刊与会议上发表论文 200 余篇，授权发明专利 80 余项。在网络大数据表征学习、异构大数据广谱关联、信息检索与排序、群体分析与群智众包系统等方面取得突出研究成果，五次获得本领域国际学术会议最佳论文奖（SIGIR、CIKM、PKDD 等），多次担任本领域学术会议主席或副主席（ACM WSDM、ACM SIGIR、ACM CIKM、CCIR 等）。获国家科技进步奖二等奖 3 次、技术发明二等奖 1 次。

　　为应对新冠病毒肺炎疫情，2020 年 5 月苹果和谷歌公司联合推出基于 iOS 和 Android 操作系统的智能手机应用 “暴露通知（Exposure Notification）”，借助数字设备和技术助力新冠肺炎密切接触者追踪工作，这一技术入选 MIT Technology Review 2021 年 “十大突破性技术”。

　　该技术的原理是通过手机应用程序使用蓝牙来匿名连接附近运行同一程序的其他手机设备，在本地对高风险接触行为进行记录，一旦某用户被确诊为新冠肺炎患者，该应用将会通知其接触过的其他用户，从而有利于尽早展开排查和隔离。相比于传统的流行病学调查方式，数字接触追踪技术可以有效提升追踪效率并降低人力成本。

　　事实上，“暴露通知” 并非首个针对新冠疫情的数字接触追踪应用。早在 2020 年 3 月，韩国开发了 “新冠肺炎疫情智能管理系统”，主要通过采集手机用户的 GPS 定位数据来判断用户与确诊患者间是否存在密切接触的可能。

　　同样采用 GPS 定位数据的还有以色列开发的 “TheShield” 应用，由于位置信息属于敏感信息，这类应用都面临着隐私安全方面的问题。

　　新加坡开发的 “TraceTogether” 应用，则是采用蓝牙匿名连接的方式进行接触追踪，由于蓝牙连接只会记录匿名接触信息而不采集用户地理位置等敏感信息，数据也只会分散式地存储在用户设备本地，因而在隐私保护方面具有显著的优势。

　　与 “暴露通知” 有所不同，新加坡可依据当地法规从新冠肺炎患者的 TraceTogether 应用中读取存储数据并获得密切接触者的手机号信息，具有一定的集中式特点。

　　中国采用的技术路线与前述略有不同，从疫情爆发以来中国推出的 “健康码” 应用，是通过个体主动的扫码上报，利用全国一体化政务服务平台实现接触追踪。

　　而 “通信大数据行程卡” 则是利用多家运营商的 “手机信令数据” 为用户提供快速的行程追踪服务，这两类数字追踪更多地基于集中式服务平台、侧重于区域接触追踪而非直接的个体接触追踪。

　　迄今为止，尽管有许多国家应用数字接触追踪技术应对新冠疫情，这些应用对于抗击疫情的价值仍存在争议。

　　一方面，许多应用程序仅为自愿使用，总体使用率偏低使其很难发挥作用。这其中的原因是多方面的，包括用户对程序安全性的担忧、部分软件运作异常、智能手机普及率有限等。

　　另一方面，分散式应用程序虽然能够有效保护用户隐私，但也使得密切接触者的检测和隔离完全取决于个人意志，无法保障防疫效果。对于前者，需要研究合适的宣传引导策略，并保障应用程序获取和使用的通畅。

　　对于后者，需要探索隐私保护和防疫效果之间更优的权衡方案。从抗疫成果上来看，中国所采用技术路线是较为成功的案例，国家的宣传与引导保障了总体使用率，相对集中式的信息获取和存储保障了医疗卫生部门对密接者的高效排查和处理，当然这其中配合了强隐私保护机制以防止数据被滥用。

　　对于新冠肺炎疫情期间产生的数字接触追踪这一突破性技术，目前仍然处于早期发展阶段，技术本身的应用范围未来也不仅限于疫情防控，对很多应用领域可能带来新的启示。我认为以下方向值得进一步研究探索：

　　（1）数字接触追踪隐私保护理论探索。数字接触追踪涉及到以人为目标的数据采集、存储、使用和销毁等流程，需要着重考虑隐私保护问题，探索隐私保护的相关理论，并在技术的设计阶段即予以解决。采集阶段如何做到最小化采集，非必要的数据不采集；采集的数据哪些应当存储在本地，非必要不上传、不公开；数据的使用应当限定授权给哪些单位和个人；如何设定数据的存储期限，过期数据如何保障其尽快被销毁。

　　（2）隐私保护与应用效果的权衡机制探索。在涉及公共安全和国家安全的应用场景，过于追求对隐私的保护可能将难以发挥应用的效果，而让渡部分隐私信息可能有效提升应用效果，这就需要探索两者之间的最优权衡机制。

　　数字接触追踪这一实例中，完全分散式的方案完整地保护了隐私，但密接者的响应只能依靠自觉，对防疫的作用有限；而部分集中式的方案则允许国家介入获得确诊者和密接者的部分关键信息，使得密接者能够获得及时妥当的处理，但存在隐私泄露的风险。因此，高安全、高效率的数字接触追踪技术与机制仍然值得深入探索。

　　（3）在其他领域的应用探索。数字接触追踪是追踪技术在医疗卫生领域的一项应用，实现了对历史数据的有效记录和对关键数据的高效查询。类似的需求在社会治理和国家安全方面同样存在，值得探索数字追踪技术在更加广阔的社会场景中的应用价值。

　　六、超高精度定位（Hyper-accurate positioning）

　　全球卫星定位系统的精度正在从 “米” 提高到 “厘米” 级别，这将为自动驾驶汽车、送货机器人等在街道上安全行驶提供更大支撑。

　　2020 年正式开通的北斗三号全球卫星导航系统可实时捕获地面上几米的位置变化，甚至其处理精度能够达到毫米级。

　　该系统已用于检测中国各地山体滑坡易发地区地表的细微变化，并于当年预测到中国湖南省将遭遇数十年来最严重的山体滑坡，使村民得以提前撤离。中国科学院航天信息研究所专家表示，如果卫星定位精度仍然在米或分米的水平，对此，这是不可能实现的。

　　其实，北斗和全球卫星定位系统（GPS）精度的进一步提升都需要通过地面设施来提高定位精度。

　　在目前广泛使用的方法中，一种是实时动态（Real Time Kinematic，RTK）定位，精度可达 3 cm 以下；另一种是精确点定位（Precise Point Positioning，PPP），也可以达到厘米级别的精度。此外，中国科学院航天信息研究所专家表示：“我们正在开发 PPP-RTK 技术，结合二者的优势，有望在几年后投入使用。”

　　专家点评：

　　专家简介：杨元喜西安测绘研究所研究员，中国科学院院士，北斗全球卫星导航系统副总设计师，美国导航协会会士。长期从事大地测量与卫星导航技术研究，发表论文 400 余篇，SCI 论文 60 余篇。曾获何梁何利科技进步奖，国家科技进步奖二等奖两项，省部级科技进步奖一等奖以上 7 项。

　　专家简介：任夏西安测绘研究所助理研究员，博士，主要从事导航卫星自主定轨技术研究。

　　卫星导航定位技术是目前最广泛、最廉价、最便捷的定位导航和定时（PNT）手段，是国家经济建设、国防建设、交通运输的重要基础设施，为智慧城市、物联网、智能交通等体系建设提供了全球覆盖、全天候的时间与位置服务。

　　中国自主研发建设的北斗全球卫星导航系统（BDS-3）不仅向全球用户提供标准定位导航和授时（PNT）服务，还向中国及周边提供精度更优的星基增强（BDSBAS）和星基精密单点定位（B2b-PPP）服务，可以实现米级、分米级和厘米级精度定位。当然，用户也可以通过地基差分定位获得毫米级精度定位。

　　此次超高精度定位技术入选 “MIT 全球十大突破性技术”，不仅得益于北斗系统设计和功能的创新，各类地基定位技术和算法的改进也为高精度北斗定位提供了重要支撑。

　　(1) 特色混合星座设计。北斗卫星导航系统创造性地设计了包括 3 颗地球静止轨道卫星（GEO）、3 颗倾斜地球同步轨道卫星（IGSO）和 24 颗中圆轨道卫星（MEO）的混合星座。地球静止轨道卫星星座为星基增强、星基精密单点定位提供了重要平台；倾斜轨道卫星星座为局部观测几何增强提供了支持；中圆轨道星座实现了全球 PNT 服务，并为特定用户提供国际搜救、全球短报文服务。

　　(2) 高精度卫星星历。要提供高精度定位服务首先需要实现高精度的导航卫星轨道测定和时间同步。受多方因素影响，中国仅能在境内布设北斗卫星地面跟踪站，严重制约着北斗卫星轨道测定精度和时间同步精度。

　　为此，北斗三号卫星搭载了星间链路载荷进行星座卫星间的测距和通信，优化观测几何，从而实现高精度卫星轨道测定和时间同步。北斗星间链路采用 Ka 波段双单向测距体制，测量精度为分米级，对北斗全球星座的轨道测定和时间同步发挥了重要作用。

　　2020 年 6 月，Inside GNSS 引用多篇国内学者文献，评价 “北斗成为 GNSS 中唯一具备星间链路这一精度提升功能的系统”；2020 年 9 月，Oliver Montenbruck 在文章中对四大全球导航卫星系统（GNSS）系统的服务性能进行评估，作者认为 BDS-3 和 Galileo 的空间信号精度相对更优，而 BDS-3 空间信号精度结果得益于星间链路支持下获得的高稳定钟差。

　　在星间链路的支持下，北斗 MEO 卫星广播轨道精度优于 30 cm，广播钟差精度优于 0.6 ns。目前，北斗全球系统广播星历每 1 小时更新一次，星历的高频更新在一定程度上降低了预报星历累积误差对定位精度的影响。

　　(3) 标准定位服务。北斗全球卫星导航系统建成以来，服务性能稳步提升。根据国际 GNSS 监测评估中心（iGMAS）的监测结果，正常情况下，北斗单频定位精度在水平方向优于 3 m，高程方向优于 5 m，授时精度优于 15 ns，服务性能远优于设计指标。

　　(4) 星基精密单点定位服务。传统的精密定位需通过互联网获取国际 GNSS 服务中心（IGS）或其他机构提供的精密卫星星历产品，才能进行高精度定位解算，沙漠、高原、海上等无网络覆盖地区用户无法使用此类服务。

　　BDS-3 创新性地将精密单点服务嵌入三颗 GEO 卫星，通过 B2b 频点向中国及周边地区播发北斗和 GPS 卫星的精密星历和码间偏差（DCB），用户接收信息后，可以根据需要，进行单频或双频精密单点定位解算。

　　目前，星基实时精密单点定位服务的水平分量精度优于 0.3 m，高程分量精度优于 0.5 m。最新报道表明，将快速动态定位与精密单点定位组合（RTK-PPP）1 分钟内即可实现动态厘米级定位。如果采用事后精密定位的方式，可以获得毫米级精度的定位。

　　(5) 星基增强服务。在标准定位服务的基础上，北斗系统可向中国及周边地区用户提供星基增强服务，满足民航、高铁等高安全、高精度用户需求。

　　北斗 SBAS 将卫星轨道、钟差、电离层延迟等各项误差模型化处理后，通过地球静止轨道卫星（GEO）播发至用户，从而实现米级至分米级增强定位。从 2020 年的测试结果来看，单频增强定位精度水平分量优于 1.5 m，高程分量优于 2 m；双频增强定位精度水平分量优于 1 m，高程分量优于 1.5 m。

　　(6) 地基差分技术。除了依靠北斗卫星自身提供的星基精密单点定位服务和星基增强服务，用户也可在地面通过差分 GNSS 技术实现分米、厘米甚至毫米级高精度定位。国内多个省份和多个行业都已经建立了北斗差分服务网络，向服务区内的广大用户提供精密定位和定时该服务。

　　(7) 未来发展。北斗高精度定位导航和授时服务取得了举世瞩目的进步，但是，卫星导航具有天然的脆弱性。

　　未来，还将建设国家综合 PNT 体系，包括低轨导航卫星增强、天基导航与地基无线电通信组合增强、以及与海面、海底定位系统的组合服务等。在自主定位导航和定时方面，微型化惯性导航、微型化原子钟、量子导航定位、量子时钟等也会得到快速发展。

　　用户获取超高精度定位服务的方式更加灵活，手段更加便捷，定位服务的精度、连续性、可用性和可靠性也将得到进一步提升。

　　七、远程技术（Remote everything）

　　远程技术是指利用无线 / 有线网络通信技术，通过将分布在不同空间位置的多个终端有效互联，实现高效的信息传播和共享，进而提高远程工作、学习的便捷性和效率。

　　自 20 世纪 70 年代以来，随着传感器技术、信息与通讯技术（ICT）、人工智能（AI）等相关技术的快速发展，远程技术得到了长足进步，并被广泛应用于教育、医疗等领域。

　　特别是受新冠肺炎疫情的影响，远程技术得以短时间内迅速发展，导致诸多行业工作方式以及普通民众生活方式上的重大变革。因此远程技术入选 2021 年 MIT Technology Review “全球十大突破性技术”。

　　专家点评：

　　专家简介：丛杨中国科学院沈阳自动化所研究员，博士生导师。主要从事机器人视觉、机器学习、医学影像分析等研究。获得国家优青，中国科学院青年创新促进会优秀会员，担任中国图象图形学会理事，中国自动化学会青年工作委员会副主任等职务。主持国家重点研发计划项目、国家自然科学基金优青、重点项目多项。获得辽宁省自然科学一等奖（排名 1），中国自动化学会自然科学奖一等奖（排名 1）、中国自动化学会青年科学家奖，辽宁省青年科技奖。

　　近年来，随着 5G 通信、工业互联网和人工智能技术的快速发展，以及智能移动终端的普及，为以远程教育、远程医疗为代表的远程技术的广泛应用奠定了基础。

　　其中，远程教育，也称在线教育，是指利用电视、电话、互联网等传播媒体的新型教学模式，该模式更具灵活性，突破了线下教育在时间、空间上的限制。通过结合 5G 通讯、高清成像、虚拟现实等信息技术，可以实现优质课堂资源的快速远程共享，一定程度上避免了教育资源分配不均等问题。

　　通过对教育相关大数据的采集，如考试问卷、师生表情、生理电信号、动作姿态等信息，利用人工智能技术可进行学习状态监测、学习质量评估、学习行为建模等处理，有望提高学习效率并改善教学质量。

　　远程医疗以先进信息和通信、VR/AR、遥操作等技术为依托，发挥发达地区医疗优势，可为医疗条件较差的地区、海岛或舰船上的人员提供远程医疗培训、医疗诊断、手术、治疗、康复和咨询等服务，对于医疗资源均衡分配具有重要意义。

　　特别是随着 5G 通讯、“互联网 + 医疗” 的兴起，云挂号、云咨询、云问诊、云处方等远程医疗技术让人们就医变得更加便利。例如，5G 网络通讯技术的高速率及低延迟，让基于遥操作技术的机器人手术成为可能。

　　新冠肺炎疫情以来，各种基于远程技术的机器人系统在远程手术、远程急救、移动查房、移动送药送餐、移动消毒等领域发挥重要作用。

　　因此，世界各国政府均加强了远程教育、远程医疗上的政策保障和资金投入。远程教育方面，英国是最早实行大学远程教育的国家，其中最具代表性的英国开放大学（The Open University）全部课程采用远程教学。

　　该学校 1969 年建校至今已培养超过 220 万名毕业生。1998 年，美国国会通过了《高等教育法修正案》, 取消了对远程教育的多种限制。远程医疗方面，美国、法国、德国等国家为远程医疗制定了相关法律法规，并逐步完善了电子处方、数字医疗建档、数字医疗保险等相关体系和制度的建设。

　　此外，比利时、意大利、新西兰、西班牙、英国等国家的医疗保健体系也为远程医疗制定了相关规定。2021 年发布的中国 “十四五” 规划中，明确将推广数字化教育、在线医疗等远程技术应用列入未来五年计划。

　　近年来，在市场、技术、政策的多重推动下，远程教育、远程医疗产业愈发活跃，特别是新冠疫情加速了远程教育、远程医疗产业的爆发式发展。

　　例如，微软、IBM、谷歌、Cisco 等大型国际科技公司均推出了自己的远程技术解决方案。IBM 开了放 IBM Skills, Open P-TECH 以及 IBM AI Education series for teachers 三个教育平台，提供在线课程资源、结业认证等服务。远程办公软件 Zoom 支持多终端视频会议，可提供线上教学。

　　Cisco 公司为医院、诊所等医疗机构提供电子病历、工作流程等解决方案，应用于远程初级诊疗、远程病房监控等场景。LG CNS 将远程技术应用于电子医疗档案、移动通讯照护、老年公寓监护等领域。

　　美国 Mercy Virtual 虚拟医疗中心，提供远程全天候值班护士、陪护、急诊、家庭监护、重症监护等远程医疗服务。国内，腾讯、阿里、华为等大型科技公司也纷纷推出了远程个性化在线解决方案。

　　例如，钉钉提供教育、医疗等多个领域的数字化解决方案，2020 年实现用户增长量 100%，达到了 4 亿用户。中国的国家远程医疗中心逐步形成 “国际 — 国内 — 省 — 市 — 县 — 乡 — 村” 的 7 级医疗服务体系。

　　疫情期间，国家远程医疗中心与华为等公司合作，建成了基于 5G SA 与固网融合的疫情防控与远程医疗综合服务体系。此外，国内的 VIPKID、51Talk、猿辅导、妙手医生、企鹅杏仁、好大夫在线等新兴远程技术企业也开发了相关平台并实现快速发展。

　　总体而言，目前远程技术已在某些特定场景实现广泛应用，未来市场需求旺盛。

　　但是，在技术方面依然存在诸多挑战，例如，感知方面，远程技术无法对微表情、触觉、嗅觉、味觉等信息进行采集和反馈；交互方面，远程技术无法理解人的复杂意图，且情感交互能力缺失；大数据方面，数据安全、隐私保护等面临的问题依旧严峻。此外，相关法律、法规的建立，各种保障制度的完善以及远程技术人才的培养等方面还有很多工作需要完成。

　　八、多技能 AI（Multi-skilled AI）

　　2012 年底，人工智能科学家首次弄清了如何让神经网络 “拥有视觉”，随后，他们还掌握了如何让神经网络模仿人类推理、听觉、语言和写作的方式。虽然人工智能在完成特定任务方面已经变得非常像人类，甚至是超越人类，但它仍然没有人类大脑的 “灵活性”，即人脑可以在一种情境中学习技能，并将其应用到另一种情境中。

　　受儿童成长过程的启发，如果将感官和语言结合起来，并让人工智能拥有更接近于人类的方式来收集和处理信息，那么它能否发展出对世界的理解？答案是肯定的。

　　这些可同时获得人类智能的感官和语言的 “多模态” 系统，应该会生成一种更强大的人工智能，也更容易适应新情况、以及解决新问题。如此一来，我们便可以使用这样的算法来解决更复杂的问题，或者将其移植到机器人中去，使得机器人能够在日常生活中与我们交流协作。

　　2020 年 9 月，艾伦人工智能研究所 AI2 的研究人员创建了一个可以从文本标题生成图像的模型，展示了算法将单词与视觉信息关联的能力；2020 年 11 月，北卡罗来纳大学教堂山分校的研究人员开发了一种将图像纳入现有语言模型的方法，此举提高了模型的阅读理解能力；2021 年初，OpenAI 对 GPT-3 进行了扩展，发布了两个视觉语言模型，其中一个将图像中的对象与标题中描述它们的单词联系起来，另一个则根据它所学的概念组合生成图像。

　　从长远来看，“多模态” 系统取得的重大进展可以帮助突破人工智能的极限，不仅会解锁新的人工智能应用，也会让它们的应用变得更加安全可靠，更加精密的多模态系统也将使更先进的机器人助手成为可能。总而言之，多模态系统可能会成为第一批我们可以真正信任的人工智能。

　　专家点评：

　　专家简介：纪荣嵘厦门大学南强特聘教授，国家杰出青年科学基金获得者。主要研究方向为计算机视觉。近年来发表 TPAMI、IJCV、ACM 汇刊、IEEE 汇刊等论文百余篇。曾获 2016 年教育部技术发明奖一等奖、2018 年省科技进步奖一等奖、2019 年福建省青年科技奖。任中国计算机学会 A 类国际会议 CVPR 和 ACM Multimedia 领域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。

　　人工智能正成为推动人类进入智能时代的决定性力量。让机器能够像人一样思考、感受和认识世界，是人工智能科学家们孜孜以求的终极目标。

　　算法、算力、数据规模的迅速提升，让面向特定任务的人工智能技术迎来了爆发式的发展。目标检测与识别、人机对弈、无人驾驶等技术实现了前所未有的突破，在局部智能水平的单项测试中甚至超越人类。

　　然而，这样的智能系统局限在任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单的场景中。例如， DeepMind 的 AlphaGo 可以击败世界上最好的围棋大师，但它并不能将这种能力扩展到棋盘之外。

　　可以预见，多技能人工智能（Multi-skilled AI）将是下一代人工智能发展的趋势，也是研究和应用领域的重大挑战。多技能 AI 旨在拓展现有人工智能技术的感知边界，赋予智能系统多种能力，多技能相互协同，完成复杂任务。

　　其中，多感官的结合非常关键，可以预想，当机器开始将语言与视觉、听觉等其他感官信息相关联时，它们就能够描述越来越复杂的现象和动态。从仅反映相关性的内容中推理因果关系，并构建复杂的世界模型。这样的模型可以帮助它们在陌生的环境中导航，并在上下文中添加新的知识和经验。

　　多技能 AI 的发展，对于人工智能技术突破现有局限，以及它的落地和普及都具有非常重要的意义。具备多种技能的系统可以胜任更多的应用场景，协同、高效地完成复杂任务，让高智能机器人的出现成为可能。

　　当前一代的人工智能驱动的机器人主要使用视觉数据来引导并与周围环境进行交互，这在有限的环境中完成简单的任务十分灵活，但是在更为复杂的场景中将失灵。

　　多技能 AI 将给未来的技术带来灵活性和安全性，筛选简历的算法不会将性别和种族等无关的特征视为能力的标志，自动驾驶汽车不会在陌生的环境中迷失方向，不会在黑暗或下雪的天气中坠毁。

　　它的发展将直接赋能医疗，教育，航天等其他领域，推动智能时代的进程。由于具备的深远影响力以及广泛的应用前景和发展前景，多技能人工技能被 MIT Technology Review 评选为 2021 年 “全球十大突破技术” 之一。

　　国际上已经逐步开始关注到多技能 AI 技术方向，目前被广泛称为通用人工智能。

　　早在 2016 年 10 月，美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》，提出在美国的人工智能在中长期发展策略中要着重研究通用人工智能。微软在 2017 年成立了通用人工智能实验室，众多感知、学习、推理、自然语言理解等方面的科学家参与其中。

　　腾讯的董事会主席兼 CEO 马化腾在 2019 世界人工智能大会上表示：“实现从专用人工智能向通用人工智能的跨越发展，这也是下一阶段的重要趋势。”

　　目前着手这个领域研究的团队主要是大型研究机构，包括微软的 AI 研究所、Alphabet 旗下的 DeepMind 和 Google Brain、特斯拉 CEO Elon Musk 和风投大亨 Peter Thiel 支持的 OpenAI，以及捷克的 GoodAI 等。

　　2019 年 10 月，DeepMind 推出的新版 AlphaStar [1]，可以实现与真实世界中的玩家实现了复杂场景交互中的对战，并且排名超越了 99.8% 的玩家。

　　2020 年，OpenAI 开发出包含 1750 亿个神经的 GPT-3 [2]，以此为基础开发出全能的 “通才”，可以同时具备数据库工程师、会计、运维、智能客服等 30 多种功能，俨然一副取代人类的架势。目前，国内也逐渐开始关注到这个领域，拥有大量的人才和资金优势，并在专项领域有雄厚的积累，未来的发展一片光明。

　　多技能人工智能必将成为未来的主流趋势，拥有广阔的应用前景和发展空间，但是目前仍有很长的一段路要走。

　　首先，最主要的问题是目前研发的成本过高，导致研究团队主要集中在少数几家龙头企业，这有待于硬件技术和模型紧凑压缩技术的进一步发展。

　　其次，该项技术需要解决对于标注数据高度依赖问题，尽可能使用更少的特定领域数据，看好无（自）监督技术的发展可以成为这个问题的解。最后，如何增量更新经验与新任务，动态改正错误，不断的在自我学习中变的强大，将是模型不断变强的根本路线。

　　九、TikTok 推荐算法（TikTok recommendation algorithms)

　　TikTok 是全球最具吸引力、增长最快的社交媒体平台之一。截至目前，TikTok 在全球范围内已超过 26 亿次下载量，在美国拥有 1 亿用户。TikTok 发现和提供内容的独特方式是其具有吸引力的 “秘密武器”。

　　TikTok 将网红博主的视频与新人博主的视频混合放在 “为你推荐” 页面，然后以浏览量奖励优质创作内容，用这种方式将更多新人博主的视频推给广大用户。

　　该应用不同于其他社交媒体平台的是，任何人在 “为你推荐” 页面都有可能 “一举成名”。视频将通过 TikTok 的推荐算法向与视频博主有共同兴趣、爱好或特定身份的用户不断推荐，从而使优质的创作内容快速传播。

　　视频博主有多少粉丝、是否走红过等因素并不会作为 TikTok 推荐算法的判断依据，它的推荐取决于视频标题、声音和标签，结合用户拍摄内容、点赞过的视频领域等进行推荐。

　　概括来说，TikTok 增强用户粘性的技能越来越 “炉火纯青”，不仅能够精准地为用户推荐感兴趣的视频，还能通过推荐算法帮助他们拓展与其有交集的新领域。

　　专家点评：

　　专家简介：刘奕群清华大学计算机系教授、党委书记。主要研究领域集中在信息检索、互联网搜索技术以及自然语言处理研究方面。担任信息检索领域知名国际期刊 Foundations and Trends in IR 主编、信息检索领域重要会议 ACM SIGIR2018（CCF A）程序委员会主席等学术职务。获得北京智源学者、北京市科学技术奖一等奖、钱伟长中文信息处理科学技术奖一等奖等奖励，并作为项目负责人获得国家重点研发计划、国家自然科学基金委员会优秀青年科学基金和重点基金支持。

　　专家简介：张敏清华大学计算机系特别研究员，清华大学计算机系人工智能实验室副主任。主要研究领域为互联网搜索、个性化推荐、用户建模及机器学习应用。担任顶级国际期刊 ACM Transactions on Information Systems (TOIS) 主编、信息检索重要学术组织 ACM SIGIR 执行委员会成员。发表的学术论文引用累计 6000 余次。

　　随着互联网应用水平的提高，用户对于互联网内容的需求越来越具体和精准，这使得个性化的信息服务越来越受到用户的青睐。个性化推荐旨在对用户的特定兴趣偏好和需求进行理解，并进而满足这种不同类型的信息需求。近年来，个性化推荐越来越成为学术研究和实际应用中的热点领域。

　　个性化推荐的目的，是为用户提供符合其兴趣或需求的内容，例如商品、电影、音乐、视频、新闻、图书、旅游景点、课程、餐馆等等。

　　而衡量个性化推荐结果好坏的评价指标，除了人们所容易想到的精准度 (Precision) 以外，还包括多样性 (diversity)、新颖性 (novelty)、惊喜性 (serendipity)、可解释性 (explainability)，以及近几年来新提出的公平性 (fairness)。个性化服务的目的，也从传统的满足大众普遍的爱好，越来越强调满足长尾用户、个体用户的细分的兴趣领域。

　　为用户提供符合兴趣需求的细分领域的内容（niche item，与热点内容 popular item 相对），就成为近些年来人们提出的一个挑战性的也是重要的问题。

　　这一点在社交媒体应用中体现得尤其明显。TikTok 是近年来新兴起的以短视频为主的社交媒体平台，增长速度极快，目前在全球范围内已经超过 26 亿次下载量，在美国拥有 1 亿用户，被认为是全球最具有吸引力的社交媒体平台之一。

　　TikTok 将新博主的视频和网红博主的视频混合放在 “为你推荐” 频道，以浏览量来奖励优质创作内容，因而任何人都有可能在该平台上 “一举成名”。

　　由于其所使用的推荐算法会将视频推送给与视频博主有相似的兴趣、爱好或特定身份的用户，这种 “投其所好” 的行为很大程度上鼓励了视频被观看，因而使优质的创作内容快速地传播。

　　在算法中，作为推荐依据的不仅仅靠博主的粉丝数、是否有过热门视频，更重要的还有视频标题、声音、内容标签属性等等，与用户观看或点赞过的视频、拍摄过的内容等的细分的兴趣领域相结合，基于个性化推荐领域经典的协同过滤及内容推荐方法做出最终的推荐因此 TikTok 不仅能够精准地为用户推荐感兴趣的视频，还能通过推荐算法帮助他们拓展其可能感兴趣的新的细分领域的内容，从而提升了用户在新颖性和惊喜性方面的需求。

　　TikTok 的推荐算法入选 MIT Technology Review 2021 的 “全球十大突破技术”，正是因为算法满足了每位个体用户的具体的细分兴趣需求，而不再仅强调追随热点的 “从众效应”。

　　其实这一评选结果也是对近几年来国际社会越来越关注的推荐系统的 “公平性” 问题的直接反映。

　　从 2012 年起，研究者们开始发现和讨论不同推荐场景下存在的公平性问题。例如，在工作推荐场景中，与同能力水平的男性相比，女性可能会被推荐薪酬较低的工作岗位；在电影推荐场景中，不同性别、年龄的人可能会被推荐不同质量的电影；在图书推荐场景中，女性作者的书籍在评分上受到不公平的对待等。

　　2019 年还有研究者提出基于热门内容的推荐会带来推荐系统的偏差，将其称为 “热点偏差”（Popularity bias）。推荐系统中的不公平性不仅存在于信息的接受者即观看内容的用户端，还存在于信息的创造者即发布内容的用户端，例如在传统方法中非网红明星的优质内容提供者的作品被推荐的机会往往不如明星的作品多。

　　从 2018 年研究者们提出 “有责任的推荐”(Responsible Recommendation, FAccTRec 2020）, 2019 年研究者们专门组织了 “第一届多媒体中的公平、责任、透明研讨会”（1st International Workshop on Fairness, Accountability, and Transparency in MultiMedia, FAT 2019）。

　　2021 年，“公平性” 已经成为信息检索领域主流学术会议（如 SIGIR，theWebConf 等）中最热点的研究话题之一，相关研究已经开始受到广泛的重视。目前研究界和产业界已经开始提出越来越多用于解决或至少缓解推荐系统公平性的模型和方法。

　　从用户公平性和内容公平性的两个角度来推进，分别从数据、模型、结果、评价指标等多个层面进行优化。除了个性化推荐的算法以外，不少经济学和社会科学的理论和知识也被综合利用进来，例如经济学的帕累托优化方法、边际效益、最低工资、嫉妒公平等理论、社会学的基尼系数、垄断指数等等。

　　因此，TikTok 推荐方法中，非知名新博主的新作品与网红明星的视频一样有机会被广大用户所看到，是推荐算法在公平性方面的一个代表性的成功的产业应用。随着相关领域研究者和产业界的共同努力，将会有越来越多精准的、多样的、新颖的、惊喜的、可解释的、公平的推荐方法得到发展，互联网个性化信息服务的质量也必然会越来越好。

　　十、绿色氢能（Green Hydrogen）

　　面对全球性的能源危机与环境污染，开发绿色、可持续、低成本的能源成为了全人类的共识。氢气一直是重要的清洁能源，但到目前为止，大多数氢气是由化石能源制备而来，这个过程是高污染和高耗能的。可喜的是，利用太阳能和风能发电的成本迅速下降，意味着可用通过耦合可再生能源利用技术与电催化分解水技术制备 “绿色氢能”。“绿色氢能（Green Hydrogen）” 作为未来能源发展的重要方向入选 2021 年 MIT Technology Review 的 “全球十大突破性技术”，展现出广阔的发展前景，成为学界与业界共同关注的焦点。

　　专家点评：

　　专家简介：巩金龙天津大学北洋讲席教授。国家杰出青年科学基金获得者、教育部长江学者特聘教授、英国皇家化学学会 Fellow。主要从事能源化工领域研究，先后主持国家重点研发计划项目、国家自然科学基金重点项目 30 余项。在 Science 等国际重要学术期刊发表论文 300 余篇；申请美国、中国发明专利 100 余项。曾获国家自然科学奖二等奖（第一完成人）、首届科学探索奖、第十五届中国青年科技奖 — 特别奖、高等教育国家级教学成果一等奖、三项省部级科技奖一等奖等奖励。

　　伴随着社会的进步，人类对能源的利用沿着由高碳到低碳、由低能量密度到高能量密度的路径发展。在此趋势下，氢能被认为是下一代清洁能源的代表，成为 21 世纪的 “终极能源”。

　　这主要源于氢能的诸多优点：首先，氢能中不含碳原子，其利用过程一般不释放温室气体或有害物质，是清洁的能量载体；其次，氢能是高密度的能量载体，具有高于汽油、柴油等传统燃料的质量能量密度。

　　当前，全球氢能需求旺盛，氢能产量约达每年 70 兆吨。其中，绝大多数氢能来源于煤、石油、天然气等化石燃料，相关制备路线具有成本低廉、技术成熟、可大规模应用等优势，但制备过程伴随着二氧化碳等温室气体的排放，不利于实现 “碳中和” 目标。

　　因此，采用该路径制备的氢能被称为 “灰色氢能”。如果能够将上述氢能生产方法中所产生的二氧化碳进行补集、利用和封存（Carbon Capture and Utilization or Storage, CCUS），则能够间接达成 “碳中和” 的目标，从而获得 “蓝色氢能”。

　　然而，“蓝色氢能” 不可再生，生产成本与 “灰色氢能” 相比仍然较高，制备系统成熟度较低，距大规模应用还有一定的距离。从环境与资源利用效率的角度来看，以上制氢方法均不是清洁高效的选择。

　　因此，通过零污染、低成本、可持续的方式制取 “绿色氢能” 是未来能源发展的重点。

　　制取 “绿色氢能” 的方法主要有生物质制氢、光催化分解水制氢、电催化分解水制氢等。其中，电解水制氢技术具有悠久的历史，是相对成熟的制氢方法。

　　近年来，新能源发电技术（如太阳能发电、风力发电、水力发电等）得到了快速地发展，促使可再生电能的成本不断下降，这使得利用可再生电能进行大规模电解水生产氢能成为可能。

　　可再生电能解水过程基本不会耗费化石能源或产生温室气体，能够满足 “碳中和” 系统的要求。

　　另一方面，可再生电能解水制氢技术能够克服光电、风电等可再生电能由于昼夜、气候、区域等因素带来的间歇性、随机性、不均衡性的缺点，可有效利用难以并网的可再生电能，分布式地生产 “绿色氢能”。

　　伴随技术的发展，世界上可再生电能解水制氢示范项目的数量和电解槽容量不断增加，电解槽总容量从 2010 年的不足 1 兆瓦增加到 2019 年的 25 兆瓦以上。

　　同时，项目规模也逐步加大，在 2010 年前后，多数项目的容量均低于 0.5 兆瓦，而在 2017—2019 年间，项目规模可达 6 兆瓦。

　　可再生电能解水制氢技术在近年来更是得到了长足的发展。2020 年 3 月，日本福岛的 FH2R 项目正式投入运行，该项目将 20 兆瓦的太阳能发电站与 10 兆瓦的电解水装置耦合，每小时可生产 1 200 标方氢气。

　　加拿大法液空公司也正在建造容量高达 20 兆瓦的 “绿色氢能” 工厂。除此之外，多国也宣布将在十年内建成数百兆瓦的可再生电能解水制氢项目。

　　中国一直致力于推动传统能源向低碳清洁能源的转型，在太阳能发电与风能发电领域的年增长量与装机量均已跃升至世界第一，在新能源领域具有丰富的研发与产业基础。

　　习总书记庄严承诺中国将在 2060 年前实现 “碳中和”，国家相关部委也相继出台氢能相关政策及发展纲要，大力推动氢能产业的发展，促进了 “绿色氢能” 项目的落地。

　　2019 年 7 月，山西省榆社县政府与合肥阳光新能源科技有限公司共同计划建设 300 兆瓦的光伏发电站与 50 兆瓦的制氢综合示范项目。

　　2020 年 4 月，宁夏宝丰能源集团的太阳能电解制氢储能及综合应用示范项目开工建设，预计建成后合计年产氢气 1.6 亿标方，每年可减少煤炭资源消耗 25.4 万吨，减少二氧化碳排放约 44.5 万吨。

　　中国在 “绿色氢能” 应用领域也走在世界的前沿。基于李灿院士团队技术的 “液态太阳燃料合成示范项目” 采用总功率为 10 兆瓦的光伏发电站配套电解水制氢工艺，所生产的 “绿色氢能” 用于二氧化碳加氢合成甲醇，实现了 “液态太阳燃料” 的生产。

　　“绿色氢能” 技术为解决能源与环境问题勾画出了美好蓝图，但其未来发展仍面临诸多挑战。学界与业界可以从 “绿色氢能” 的制取、储运、使用以及配套基础建设等方面出发，为实现 “绿色氢能” 技术的大规模应用打下理论与应用基础。

　　首先，应开发高性能制氢系统，降低制氢成本。以可再生电能解水制氢系统为例，可以基于对催化活性中心作用机制与调控规律的认识，在进一步提升催化剂性能的同时，降低催化剂中贵金属用量或其价格，使得 “绿色氢能” 的成本更具有竞争力。

　　与此同时，可以通过强化可再生能源转化系统与产氢系统之间的耦合与匹配，达到提高能源综合利用效率的目的。其次，应研发高效储氢新材料和储氢新技术。一方面，从理论的角度进一步明确化学储氢机理，并以此为基础设计高效储氢材料；另一方面，提升液化储氢技术，以终端使用为导向开发物理储氢新技术。

　　再次，应继续发展以燃料电池技术为代表的氢能使用方法。以较为成熟的质子交换膜燃料电池为例，应基于对应用场景（如交通运输、固定式发电等）特定需求的理解，优化电池结构和催化剂设计，以满足对功率密度和耐久度的要求。

　　最后，应在基础设施建设方面为未来 “绿色氢能” 的利用提供支持。如提前布局分布式加氢站的建设；调研氢能管道输送的可行性方案和安全性方案等。

　　尽管 “绿色氢能” 的全面应用还面临着巨大挑战，我们仍然相信在相关科研工作者、企业和政府的共同努力下，“绿色氢能” 的高效利用系统将在不久的将来得以建立和完善，“绿色氢能” 将作为常规能源，融入人类的生产和生活中，为构建绿色、清洁的未来社会提供重要支撑。

　　责任编辑：宫在芹

基金委邀请13位专家，深度解读2021年“十大突破性技术”

煤问提

煤传媒

煤视界

科技创新50强

会员中心