平安首席科学家肖京:科技如何战疫 AI从计算至
2020-08-15 07:09 来源:未知
平安首席科学家肖京:科技如何战疫 AI从计算至
阳江日报

  截至目前,Covid-19在中国被基本遏制,但全球确诊病例达1300万多;而且疫情仍在加速蔓延,防控病毒几成关乎国运的当务之急。很多传统防疫策略需要依靠举国之力、封城隔离、居家隔离等传统方式,经济代价高昂;而在大数据、

  如果人类不得不与病毒长期共存,则更需运用信息数据科学和生物工程领域的最新科技成果,探索一条有效防控疫情平衡发展之路,一边管控疫情一边恢复经济;这可能是当下的一种科技信仰——致力于解决现实难题。按照平安首席科学家肖京的话说,大数据、AI赋能需与产业应用结合起来。

  近期发布的2020年全球金融科技专利排行榜TOP100中,平安集团整体以1604件专利申请数,再次荣获全球第一,而排行榜前十中,有一半为平安旗下子公司,其中,平安科技、金融壹账通位列前三。这家有着五大生态圈、丰富业务场景的“金融+科技”巨头如何看科技战疫?怎样评估AI?

  不妨与在数据和人工智能的理解及应用上有着深厚的理论基础和实战经验、博士毕业于梅隆大学计算机学院的肖京对话,试图发现或接近现阶段AI赋能的。

  经济观察网:没有人会想到全球疫情如此演变,且仍不见拐点……对此,该如何应用科技的力量去面对防控疫情的挑战?做到经济发展与疫情防控两不误?目前的做法多依靠全民皆兵、“敲门”行动、追溯排查、封城闭区、隔离禁足等,社会经济成本很高。而亚马逊云服务AWS副总裁Swami Sivasubramanian表示,在与新冠疫情的斗争中,观察到机器学习的应用主要集中在以下几个领域:一是拓展与客户沟通的方式,二是理解新冠病毒的传播机理,三是加快新冠病毒研究和对症治疗。你对此如何看?

  如何应用科技的力量去面对防控疫情的挑战,以平安为例,在这次抗击新冠疫情的过程中,平安的AI技术发挥了很好的作用。我们的智能机器人,自动外呼居民电话,通过多轮语音对话,收集居民的健康相关资料,减轻了武汉等地基层工作人员的工作量,也降低了交叉感染的风险;平安的智能医疗技术,聚合了疫情相关信息,通过智能对话技术帮助广大人民群众了解新冠病毒相关信息,做好自我防护,纾解心理压力,并通过大数据等手段预测疫情相关发展变化,为领导决策提供帮助;平安的新冠CT影像AI, 能精准地检测和分割病变区域,计算病灶部位体积以及占比,15秒出具智能分析结果,给医生定量信息辅助诊断,已经在多家医疗机构使用;另外,还有自动测温、检测和识别等技术助力监管。平安在防控疫情中所用到的这些AI技术,既提高了疫情期间的防控效率和效果,同时也显著降低了社会经济成本。在以上这些应用当中,我们都有运用到顶尖的机器学习技术,提高算法研究效率,构建专业的知识图谱,输出可快速落地的智能化解决方案,辅助决策层进行决策,为疫情防控提供强有力的技术支撑。

  经济观察网:似乎现在的平安更像科技公司,其也是AI时代的一个领跑者。而AI时代,既要懂场景、懂需求,也要懂痛点等,谁最懂它们谁才能够最终取胜,那么为了这个“懂”,平安下一步还会做哪些前瞻性的布局和探索?

  肖京:对,是这样,跟别的互联网技术或业务不一样,AI确实需要懂业务、懂场景、然后能够对其原有业务生产流程去做重构,之后才能起到赋能传统业务的效用。

  布局而言,围绕“金融服务、医疗健康、汽车服务、房产服务、智慧城市”五大生态圈,我们具体要做的有这几点:

  一是人才,既要有技术专家,也要有业务专家。“两种人”在一起产生化学反应,将技术和业务深入融合,形成高效的联合团队。

  其次是知识、数据、技术的积累,要形成覆盖整个行业的知识体系,建立丰富的知识图谱,突破传统行业的最大壁垒;在数据方面,要搭建标准化的数据平台;同时要注重基础能力的建设,比如图像识别、语音识别、自然语言理解等技术。

  第三是解决方案落地,要融入场景中去做产品,并不断迭代。加上前面两点因素,即“人才储备与基础知识及数据积累”,形成端到端的专业解决方案。

  当然,这里还涉及到一个战略问题。如果要实现一个新领域或新行业的智能化,比如公司计划开拓新业务,我们会先花时间做深入细致的战略分析规划,这也是布局的一部分。

  最后,在行业布局方面,深化上述五大生态圈,AI赋能金融,AI赋能生态,生态反哺金融,实现各参与方的互利共赢。

  经济观察网:平安如何在确保金融主业稳健增长的基础上,不断加大创新科技的投入,全方位提升公司的数据化的智慧经营水平?

  肖京:主业稳健增长才能保障科技创新研发上的资源投入。平安这么多年坚持不断加大科技创新的投入,所依托的正是金融主业上的成功,目前在全球财富500强中排名第29位,全球保险集团市值排名第一位。同时,科技创新成果也不断赋能金融主业,不但持续强化金融主业的市场竞争力,保障核心金融系统的安全稳定,还孵化形成金融科技等新业务模式或市场。因此,在32年的发展过程中,平安的科技和业务相辅相成、融合并进,形成双向正循环。 截止目前,平安的科技战略不断深化,各项业务保持快速发展,2020年第一季度科技业务总收入198.44亿元,同比增长6.0%。同时,平安发展创新科技,非常注重技术和业务的紧密结合。纯科技公司往往缺乏行业的具体业务场景,这样脱离业务场景研发的技术产品往往难以充分应对业务的实际需求。平安自身拥有最全面且大规模的金融业务场景,围绕这些业务场景的实际需求,技术与业务深度融合,研发端到端的解决方案,从而可以真正实现业务赋能。

  经济观察网:平安在研究新技术时追求的是什么?因为,高风险高收益总是并存的,可能有些科技公司不一定会去做?

  肖京:平安是一家结果导向和价值导向的公司,在做科研时,会清楚地知道要做什么,追求的最后价值是什么,通常包括以下三种:社会价值、技术价值和业务价值。

  首先是社会价值,就像我们的疾病预测是公益性项目,不以盈利为目的,是为了帮助国家相关部门实现精准的疾病预测防控管理,减少传染病和慢性病带来的社会负担和经济负担,具有重大的社会意义。

  其次是技术价值。比如我们的AI创作项目,让AI去作曲、绘画、写诗作词。艺术创作是智能的高级阶段,我们的AI技术能够创作出优秀的音乐、绘画、诗词作品,充分体现了技术上的进步,及其带来的领先性。

  再者是业务价值。我们通过人工智能技术及业务解决方案的研发应用,解决传统行业中存在的实际痛点需求,切实产生巨大的商业价值。

  这三种“追求”都属于我们可以接受的科技“信仰”。当然,平安的研究院也会从事长期性的基础科研项目,比如,我们也有很多关于语音识别、自然语言理解、医疗影像分析、机器学习理论等方面的基础研究。

  肖京:以平安为例。为实现智能化应用,我们搭建了平安脑智能引擎,包括数据层、画像层、技术层和解决方案层。

  解决方案层是指提供多种端到端的解决方案,以金融为例,平安的智慧解决方案全面覆盖金融核心场景,包括风控反欺诈、精准营销、客户服务、运营管理、投研量化等。最终这些方案全面应用于各项金融业务场景之中,诸如、银行、资管、证券、信托、以及普惠、陆金所等互联网金融场景。通过各种人工智能技术的应用,平安切实实现了三提两降,即提效率、提效果、提用户体验、降风险、降成本。

  在风控领域,AI通过对用户交易行为、信用状态等度数据进行智能分析,完善整体风险管控能力;在营销领域,AI结合知识图谱与用户画像技术,针对不同用户的具体需求进行精准推荐;在运营领域,平安有180多万人,提高1%的效率,就是一百亿的利润。通过AI技术能够提升管理效率,降低运营成本,像寿险300多万人都曾通过AI进行面试;在服务领域,平安的智能语音全年累计服务量达8.5亿人次,已覆盖集团83%金融销售场景、81%的客户服务场景,可实现每年坐席成本下降11%。

  经济观察网:注意到,腾讯公司曾表态说要开放它们的源代码,为构建全球金融科技的共同体,你怎么看这事?

  肖京:开源的话,是指对开发者共享技术能力,对于这些解决性的基础平台型,尤其是做开发的工程师来说,大家很乐意共享技术;开源更偏向于底层技术的共享,但不涉及业务系统。全世界最大的开源平台之一是GitHub,而平安是GitHub的战略合作伙伴和在中国的代理。

  肖京:平安是业务规模庞大的科技型综合金融集团。金融机构对合规和安全稳定等方面的要求是最高等级的,属于强监管的范畴,严格遵守最高标准的相关管理规范。这也是国家各级监管部门为了保障金融体系安全稳定运行的必要举措。金融机构底层核心系统开源,可能带来难以预知的风险隐患,造成极其严重的后果。因此我们不能简单地开源底层系统平台。但我们在技术算法实践等方面也积极参与开源共享,并通过学术论文的发表和论坛交流等方式分享我们的创新技术和实践经验。

  肖京:这方面我们并没有限制。我们和科技公司的合作可能选择任何形式,投资、收购、成立合资公司、产品购买、技术合作等方式都可以。只要能切实解决问题满足需求,形成共赢的模式就会考虑。

  经济观察网:此外,不知你是否注意到去年上海世界人工智能大会上“马云和马斯克关于AI的对话”?马云说机器是由人创造的,而人不可能创造比自身更聪明的生物……但马斯克对此不赞成,认为人可以创造出更聪明的。

  肖京:我想,这得看马云讲的“聪明”具体指的是什么。如果马云讲的是认知推理等人脑的能力,目前由人创造的机器确实还有很大的差距,基于大数据机器学习的智能大多缺乏逻辑性,几乎类似死记硬背,而人的认知推理往往有很强的逻辑性,二者区别很大,我们在脑工作机理和认知原理等方面甚至没找到明确的突破方向,因此他推断死记硬背难以创造逻辑推理,也有一定的道理。如果马云讲的聪明是记忆计算等能力,那机器早就远远超过人了,目前的人工智能是计算厉害算计不行,这样看马云讲的就过于夸张了。以上是我对马云说法的客观分析。

  马斯克肯定不赞成马云的观点,无论他说的“聪明”指什么,因为马斯克是未来学家。我觉得他俩的对话是成家和未来学家的对话。前者更加关注以积极的态度努力解决当下面临的问题,达成现实的成功目标。后者更善于前瞻性的思考,预言未来可能出现的机会或挑战,即便离现实很远,也会为此兴奋或担忧。这二者各有各的道理。AI的发展和应用确实需要建立严格规范的管理机制,否则有被滥用甚至恶用的风险。同时,目前还处于弱人工智能阶段,AI还有很大的发展和应用空间,应鼓励其发展并切实赋能各行各业,解决好当下的问题,而不应过度担心未来风险以致阻碍其发展。

  肖京:“人工智能”是指人工制造出来的系统所模拟、延伸、和扩展的人类智能,是自然科学和社会科学的交叉学科。人工智能可以分为弱人工智能、强人工智能和超人工智能,目前人工智能尚处在弱人工智能阶段,这意味着它只是某些方面比人强,而有些方面还差得很远,它的能力是有限定领域的;弱人工智能能够在计算、简单推理等方面完成一些任务,提升人类的工作效率,但在复杂推理决策、创造、管理、沟通交流等方面能力还远未及人类水平。所以人工智能的价值在于最大化辅助人类,而不能完全取代人类。

  肖京:任何技术都有两面性,AI也一样。在人工智能的应用上应该有边界,并不是只要技术能做到的地方就可以应用,而是要制定完善的标准规范,以合理管控人工智能技术应用,避免其误用、滥用、及恶用。通过研发可信AI技术,从整体视角解释AI的决策过程,判断并纠正可能发生的错误,让AI技术变得更加可靠、安全、负责。在赋能行业服务生态的过程中,也应该避免技术导致的偏见与歧视。具体来说,要做到底层管好数据,充分保护隐私和安全,中层实现算法可靠透明可解释,前端应用遵守遵循人类的价值观和伦理道德。行业需要坚持以人为本、安全可控、公平公正和公开透明的伦理准则,在数据使用、算法研发和行业应用等层面全面把控AI伦理问题。

  经济观察网:AI目前处于一个什么样的阶段?其与大数据的关系如何?现在的海量大数据是否没有实现结构化?

  肖京:AI分为三个阶段:弱人工智能,强人工智能和超人工智能。弱人工智能只能在某一个领域达到或者超过人类水平,强人工智能才可全面达到人类水平,而超人工智能则全面超越人类。AI目前还处于只解决特定领域问题的弱人工智能阶段。发展至今,主要依据算法模型从数据中分析挖掘出的关联关系来作出判断,但在基于符号主义的因果关系分析方面,水平还比较弱。

  人工智能是自然科学和社会科学的交叉学科,涵括了大量的科学和技术领域,数据分析挖掘是其中一个技术领域。进入新世纪以来,随着互联网和移动应用的兴起,数据量增长极其迅猛,种类源头繁多,且高速更新变化,这就构成了我们所说的“大数据”。这些数据只有通过分析挖掘产生价值才有意义,否则只是“大”负担。在这样的背景下,围绕业务需求,利用人工智能技术对大数据进行分析挖掘,进而赋能业务提升认知、判断、决策等水平,产生实际业务价值,逐渐成为人工智能技术应用的主流方向之一。也由于大数据的特性,基于联结主义的关联分析技术成为主流,取代了早期基于符号主义的因果关系分析。

  目前大数据智能分析技术高速发展,帮助业务解决了大量实际问题。我们可以分别从结构化和非结构化这两个数据类型来看。结构化数据主要就是报表数据,每一个字段都有明确含义。这类数据过去主要通过BI商务智能进行统计分析,帮助了解业务现状并作为判断及决策的线索和依据。利用更先进的机器学习及深度学习等技术,可以对数据进行更精准的聚类、分类、拟合、图谱等分析,从而做出更有效准确的业务判断和决策。大数据中绝大部分是非结构化数据,包括图像、语音、视频、文本等,传统的BI(商业智能)分析难以挖掘这类数据的有效信息。利用人工智能中的视觉、语音、自然语言理解等技术,可以实现对海量非结构化数据的关联分析,从中挖掘有效信号线索,进而帮助业务评估、判断、决策。如前所述,这些大数据分析技术一定要和业务深度融合,共同构建完整的智能化解决方案,这样才能真正打通底层大数据、人工智能分析技术、和业务场景应用,切实通过数据分析赋能业务产生实际价值。

  肖京:从“计算”到“算计”,意味着人工智能需要形成分析、思考、理解、判断和决策的能力。人工智能现阶段以联结主义为主,在感知、认知、决策方面都具备一定的能力,主要依据算法模型从数据中分析挖掘出的关联关系来作出判断,但在基于符号主义的因果关系分析方面,水平还比较弱。因此目前人工智能还不擅长推理,做不到举一反三,从而大大限制了其思考、判断、和决策等能力。从终极目标来看,这个问题的解决有待人脑功能结构、认知机理、类脑模型、计算科学等方面的理论和技术突破。短期来看,我们需要关联分析和因果分析两条技术路径同步前进,目前一条腿走路的模式不足以解决认知决策的问题。具体来说,一方面需要加强因果推理等技术的研发,另一方面要推进关联分析和因果推理技术的融合。其中很重要的工作是知识挖掘提炼及知识表达相关技术的研发和应用,从而形成完善高效的数字化知识体系,以及知识表达、检索、推理传导等能力和基于机器学习的分析判断能力的有效结合。

  肖京:这个很难预测,过去的几十年在脑认知科学等关键领域都没有太大的基础理论研究突破,在应用上取得成果尚需时日。

  当然,还有一些可以帮助AI实现快速突破的技术,例如量子计算。量子计算如果能够实现在AI应用的话,计算速度可实现指数级的增长,那么进步的时间可能大大缩短。此外包括通讯、以及脑认知科学全面发展取得突破后,才有可能到达强人工智能时代。

  肖京:有情绪是自主意识的体现。首先要有自主意识,才会有情绪和感情,我觉得在未来脑认知科学出现突破后可能会有。机器人、AI会越来越像人,但现在的AI只能实现特定领域的一些功能。在人类的设定下,它可能完成一些有关情绪的识别和反应任务,但做不到自己思考和产生情绪。

  肖京:通用AI指的是能够主动思考、主动学习,解决通用问题的AI吗?目前的人工智能只是专用型,解决某一类特定问题。通用AI起码要到强人工智能这个阶段才会出现,现在还没有出现通用AI。

  经济观察网:另外,现实而言,相信每个人都感同身受,就是大数据、互联网时代,人们的隐私也容易被泄露……有人甚至对人脸识别等提出质疑。

  肖京:需要加强信息保护的管理,互联网时始时就存在着信息泄露的问题,因此我们应该规范数据的治理与监管。相信所有在数据使用方面合规的企业都会欢迎监管,因为更加规范的环境能让这些企业更好地体现出自己的价值。如果监管不力,就容易劣币驱逐良币。所以,法规的制定和执行非常重要。另一方面,也不能因为潜在的风险就限制科技的发展,现在有的人觉得不应该发展人脸识别和语音识别等技术,但如此一来,我们是否会因噎废食呢?

  以平安为例,平安作为一家大型金融企业,属于强监管单位,遵循各相关单位的法律法规监管,在信息数据安全、用户隐私保护等方面都符合最高标准和最严格的管理规范。我们对原始数据自动化进行脱敏、整合、清洗、标准化等处理,并对这部分数据采取严格保密管理,建立有关数据安全、隐私保护的管理规范。

  现在的AI,很多时候都需要把数据集合在一起训练,这样做自然存在着信息泄露的风险,所以我们也在研究一些别的技术,比如联邦学习,允许从跨数据所有者分布的数据中构建集合模型,可被广泛应用于各种领域,具有安全性、隐私性、合法性的特点,这样既兼顾了AI的训练也避免了数据泄露的风险。

  肖京:监管的目的是保障行业运行安全稳定,创新的目的是应用新的业务模式或新技术取得增长;创新的过程必然带来一些不确定性和风险,这些本身就属于监管范畴——可以说创新和监管是同一个行业的两面,并非不好调和。如果业务上采用了新的技术或者商业模式,那么监管也需要跟进出台相应的制度和规程,保证行业运行稳定、风险可控。业务中的科技手段提高的同时,监管的科技水平也要提升,最好的办法或许是在业务和监管层面同步应用最新的科技。

  有时候监管与大金融机构合作更容易发现问题。金融业务的核心是风控,而风险有一定的“滞后期”,累积到一定程度后才会爆发。但机构一开始做业务时,并不知道这些风险,比如估值定价,商业模型等,没有一年或几年的时间,很难知道效果如何;但是等知道效果不好时,可能已经产生亏损。当然,大体量、高执行力的平台机构有可能把累积风险的“时间”缩短,比如在某些项目上,平安可能花几个月就能知道研发方向是否可行,是否存在问题,并针对问题进行迅速迭代和调整。