安永合伙人Beatriz Sanz Sáiz:垃圾数据 是大数据分析行业的毒瘤
AI是什么?
深度学习技术?机器人?还是大数据?
其实很多人都不能给出准确的答案。
安永合伙人兼全球数据分析与咨询主管Beatriz Sanz Sáiz说,“其实,AI是一系列不同技术的整合。它就是在人类已有的基础上,学习人类大脑、身体等各部位的功能,做进一步增强。”
而学习,数据便不可或缺。
用优质数据和算法,输出优质分析内容
在AI刚刚火起来的时候,大数据公司经常会用到一个词,叫“海量数据”,以显示手握庞大资源。
但实际上,随着产业对大数据输出内容要求的提升,这似乎已经不是一个具有“正能量”的词了,反而是例如“小数据”、“知识图谱”等越来越受欢迎。
可以看到,因大数据产业市场规模可期,很大公司蜂拥而至,信息平台、数据库、各类研究院等层出不穷。相关数据统计显示,到2022年的时候,全球将有90%的公司发展战略都将变成以数据为核心,它将成为一项非常重要的资产,而数据分析也将成为不可或缺的能力。
但在Beatriz看来,现在的大部分公司并没有理解大数据及数据分析真正的价值所在。
“很多公司都会说他们有海量数据,但数据质量却不怎么样。加之算法不够简化,输出的数据质量必定大多不到位。所以,品质,才是数据的关键。”
而由于对大数据价值认识不够清晰,行业也逐渐形成两大趋势,一种喜欢标榜海量数据,实际输出的分析内容实用价值不大,Beatriz称之为垃圾数据;一种是非常看重数据价值,甚至把数据分析作为企业文化的核心之一,如新型的互联网企业、银行等。而后者,显然已在AI方面领先了。
亚太地区数据分析与咨询主管Cameron Wall补充说,“数据分为两类,结构化数据和非结构化数据。前者表示问题已知,而后者则表示问题是未知的。”
具体来说,以审计行业,在处理报表业务时,结构化的数据通常意味着已经将各项数据分门别类,甚至已经理清了各个数据间的逻辑关系;而非结构化数据则只是面前一堆数据,如一团乱麻,需要先一一理清将其变成结构化数据,再做进一步分析处理。
Cameron解释称,“在安永,我们会基于图片和文件做智能化处理,建立自己的数据库,以保证数据的优质。”
目前,安永在内部已经建立了强大且优质的数据库,因应用AI技术,每年所节省的人工时间超300万小时。
那么,大数据和AI技术究竟能做哪些事情呢?
AI正在重新审视、修正一些传统概念
2018年AI行业有个词非常火,就是“赋能”。有了这个功能,AI几乎在所有传统行业都能起到促进升级、推动发展的作用。可以说,AI赋能,对于传统行业来说就是新生。
但Bertriz不这么认为,“AI赋能取决于你对AI的理解是否成熟。”
在她看来,由于AI赋能作用的日益凸显,很多公司在AI发展上都只强调一个字,“快”,甚至将其列入到了CIO的工作日程中。
但实际上,以当前AI技术及产业的发展状况看,AI技术最适合赋能的应该是自动化产业,特别是在工业4.0的当下,对AI技术做大量整合,并具备足够的洞察力将其结合到创新应用上,才能真正AI赋能。
因此,AI技术在更多层面上看其实是一种方法,它给了传统产业一个机会,用语修正已经“老旧”、传统的概念,例如健康医疗、制造业、金融行业等。
Beatriz强调,“我们不是在卖AI,而是以AI为媒介,把它当成一种工具,为传统产业客户提供针对性的思路与方法。”
以智能投顾为例,安永通过建立大数据平台及相关技术,让AI替代人工,处理大量数据整理及分析工作,而投资顾问节省了大量时间,以从专业的角度给客户提供更好的投资建议。
再者,例如在大型超市中,通过数据分析帮助超市对客户进行分析预测,提前预判消费者可能的消费行为,以科学安排商品进货量、摆放位置及相关促销活动,并适当加以引导。
但这其中又涉及到一个问题,如何给予客户信心,让他们愿意把数据共享出来?
保障数据安全,是企业道德底线
去年年初,因Facebook泄漏了5000万用户信息,全球范围内大数据产业几乎都面临了一个问题:该如何保障数据安全?
对此,Beatriz以安永为例,“在安永内部有着非常严格的规定,仅数据监控方面,我们就共设有55个监控平台。除此之外,因为我们是审计出身,对于审计师来说,数据保护是天职。再加上我们的品牌效应,足以给予客户信心。”
Cameron还补充说,“Facebook的数据泄露,在很大程度是因为他们没有用以户为导向,没有在充分考虑用户隐私保护的意愿。只能说,这是一个道德层面的问题。”
最后
在安永看来,持续以数据为中心、以AI算法为驱动,通过形成内部数据库,为客户提供创造性的解决方案,是可以更加高效为客户提供服务的。
而谈及中国市场与海外市场的差别,Cameron表示,“中国客户的胃口更大,亚太地区很多国家的目标只是‘赶超’,而中国客户是希望成为‘领头羊’。这让我们感到非常兴奋。”