图像进阶史︱从给人看到机器读懂视界

CPS中安网:罗超

这视界,没有什么不能再次定义!

监控本初,追求图像,那什么是摄像机图像的新未来?

一场新品发布会,揭晓答案。

3月29日,以“创视纪Ⅱ • 智见不凡,定义图像未来”为主题的好望新一代摄像机暨2021新品发布会在珠海成功举办。华为机器视觉总裁段爱国提出图像将从“给人看”到“给机器看”,隆重发布SuperColor、SuperCoding、AI Turbo三大根技术,以及好望新一代摄像机等七大新品。

好望,行业初来乍到,而每一次发声,都是一阵涟漪。算力换图像是行业首创,图像给机器看又是全新突破。这一次,好望再次定义图像未来。

“给人看”的“穷途末路”

时代在变革,技术在演进,与之相悖的,终将渐趋式微。

世界即视界,人眼看视界,或许都一样。

人眼有着很强观察能力,能够在复杂及变化的环境中识别目标,同时由大脑赋予了最高级的智能分析能力,可以运用逻辑分析和推理能力去识别变化目标。为此,长久以来,在监控室里死盯屏幕,成了监控人员的日常,这也是视频监控时代最为传统与普遍的工作方式。但,人眼看到的视界,就是真实视界吗?

人眼看视界,或许真不一样。

人非机器,先天性有所短板,带有主观性,容易心里误导,产生误判。

与文字、声音相比,视频承载了更多信息量,而要从大量丰富信息当中去读取有用数据,这是非常繁琐复杂的工作,这种被动应对方式,并不能主动预防,并受制于人员数量和能力,比如:长时间易疲劳、错看漏看、看得不及时。此外,在显示终端方面也因各种原因受制,你看到的视界,不一定为实。

视频监控产生数据,有三大内涵:海量、非结构化和低价值密度。众所周知,市场激增,视频监控数据体量巨大,并以惊人速度不断快速膨胀,随着视频监控图像不断联网和整合,以及视频分辨率和帧率不断提高,实时视频数据的存储已经从TB级别开始跃升到PB级别;而且,视频监控所涉及数据以非结构化为主,以往平安城市主要有视频、图片、地理位置信息等类型数据,但是随着智能安防各类监控以及相关物联系统不断整合,数据类型越来越多,这些数据作为一个整体,构成视频监控数据基础;此外,视频监控数据整体蕴含的价值密度低,但是价值高。在7×24小时连续不间断监控过程中,可能有用的数据仅仅几分钟,甚至是几秒。这些信息更新频率很快,每时每刻都有大量数据产生。对于这些复杂的非结构化数据,人眼看和查询的依据只能是空间与时间两个维度,这样的数据利用方法不仅效率低下,其中隐含的价值信息也会被大量冗余的信息所覆盖。

更严峻的现实是,从视频监控到智能安防再到机器视觉,产业变迁后,千行百业都在数字化转型和智能化改造。如果说智能安防摄像机更多解决的是“眼睛”看的问题和“是什么”的感知层面,主打海量数据存储和分析。那么,在机器视觉时代,摄像机识别内容对象更加广泛,全场景和全天候的覆盖,解决更多是“大脑”想的问题,也就是“怎么做”的认知层面,主打基于数据的分析、理解、决策和行动,让数据关联看、全面看甚至自动看。

可想而知,依靠人眼和大脑去检索、查看、分析和研判图像数据,仿佛“天方夜谭”。

以此来看,“从给人看”到“给机器看”,顺势而为而已。

好望“给机器看”,见人所未见

若摄像机图像,从给人看到给机器看,是一个剧本,那时代变局就是最佳导演。

做机器视觉,感知是第一步,也是最为关键一步,是机器视觉应用的最佳落脚点。

为此,好望新品发布会再次“创视纪”,主打“定义图像未来”,揭秘未来摄像机成像的正确打开方式:给机器看。

走进机器视觉时代,大量视频数据“受众”已不再是人,而是机器和算法。“给机器看”可以实现海量视频的快速分析,大幅提升效率及发现更多目标细节。对于摄像机拍摄的海量数据,机器处理将是后续发展的唯一选择,因为单纯依靠人力识别需要大量的人力投入且效率低下,而机器算法可以 7×24 小时全天不间断分析,大幅减少操作人员浏览视频数据的时间,快速自动定位敏感信息并进行结构化的存储,减少疲劳等原因造成的审查疏忽,从而极大的提升效率;同时,依靠算法模型的优化和海量数据训练的优势,智能算法已经表现出超越人眼的性能,在目标检测、目标识别等多项指标上都达到新的高度,因此利用机器可以发现更多人眼忽略的细节,找出更多隐藏的目标。

总之,给机器看与给人看的不同在于:更为准确、更多检测与识别、更多图像处理、更多数据分析与应用。作为未来数字世界的眼睛,图像从“给人看”到“给机器看”,看似简单一句,好望要做的,却很多。

架构方面,在图像采集环节的镜头以及Sensor从可见光到多光谱支持,大幅提升红外QE性能和宽动态技术,以适应全天候;图像ISP从简单面向人眼视觉到面向机器视觉任务增强图像质量,现有的ISP大部分环节都是面向人眼视觉,需要针对机器视觉识别率重构和增强;在编码环节,从传统面向人眼感知模型的编码到面向机器视觉模型的编码,同时在识别率做提升;在质量评价环节,从主观到客观,体现评价场景与真实场景一致,评价指标与实际效果一致,评价结果与主观感受一致。

在这种背景下,好望业务模型设计也在从面向人眼视觉到面向机器视觉进行重构,以“看、存、用”三个方向,打造机器视觉三大根技术:SuperColor、SuperCoding、AI Turbo,贯穿图像数据的全生命周期管理和使用,进行产品和场景化解决方案的增强。

SuperColor:依托“墨子”系列镜头、“烛龙”系列Sensor、ISP算力换图像,打造全天候极致图像体验,让人看更舒适、让机器看的更准。

SuperCoding:通过精细化ROI分析、视频流像素级分割、分层质量评估、智能精准码控等方式,打造价值视频最长留存方案,1TB当3TB存储。

AI Turbo:将视频类AI算子硬件化,让硬件能力发挥最大效果;通过增强型推理引擎,节省资源消耗;优化算法模型高压缩比,适配复杂的场景化应用。

从人到机器,图像进阶是一个体系变革,涉及到摄像机体系架构、数据管理与分析应用。

从人到机器,摄像机的“进化论”,除了“端的进化”,还需“物的融合”即依托好望生态伙伴将更多物联网数据进行融合,使得数据多元化;最后还需“云的协同”。云是资源整合者、能力提供者,通过端、边、云、生态的高效协同,来真正实现机器看懂视界。所以,3月4日“好望上云”,是为先行一步。

对于好望,时代变了,对手变了,观众变了,玩法也得变一变。

视界,每当变幻时,总会多些精彩。好望新品发布,定义图像未来,就是浓墨重彩一笔。