Page 193 - 安防19年1月刊
P. 193
接口提供强大的定制和扩展能力,让更多的合作厂 中提取结构化和半结构化数据,使数据更易于检索
商和业务集成商参与进来。从成本和开发效率考虑, 和分析。
接口 SQL 化无疑是十分合适的。SQL 作为传统关系 早在上世纪中叶,神经网络模型就已经提出,它
型数据库的查询语言,兼具简洁的语法和强大的数 通过模拟大脑认知的机理,实现机器学习,限于当时
据表达能力,是开发人员、数据分析师广泛使用的 的硬件条件未能得到广泛的运用。近年 GPU 的大规
分析工具,即使没有编程基础的人也能通过简单培 模并行计算、分布式、大数据技术的完善,神经网络
训快速掌握。目前大数据开源技术中,对 SQL 的支 在图形图像识别领域应用日趋成熟。以人脸识别为
持也日趋完善,基于 HBase 的 Phoenix、Hive、Spark 例,人脸图片数据入库前,要从中提取特征向量,所
SQL、Kylin、ES SQL、Crate 等。借助这些技术,大数 谓特征向量,就是一组用于描述或概括图形特点的
据平台可以被封装地像一个传统关系型数据库,它 数据,特征提取的算法多种多样,不同的算法侧重点
拥有大数据高性能和海量数据处理能力,同时兼具 也不尽相同,有基于颜色特征的颜色直方图算法,基
传统关系型数据库易用性,业务开发人员在开发业 于纹理特征的 Tamura 纹理特征算法和基于形状特
务时不必再需要关心大数据平台内部复杂的实现细 征的傅立叶形状描述符算法。而对于人脸来说,我们
节,对业务开发开发人员的素质要求也会宽松得多。 当然更希望它能更好地区分开不同人的面部特征。
传统的模式识别采用手工设计的算法,依赖先
验知识,需要人工对参数进行调优从而是特征提取
更精确的反映目标图片的特点,而且参数也不宜过多,
否则将难以调优。而结合深度学习与海量训练数据,
计算机可以通过神经网络对海量输入数据实现自动
学习,它能自动调整各个参数的比重,最终归纳出计
算模型,通常来说,数据集越大,其模型准确度也
相应的越高,更能反映图形的本质。实现人脸检索
时,需要比较特征之间的相似度,特征数据很难像
结构化数据一样,利用 Hash、B 树创建高效查询索
图形图像处理与人工智能 引,而基于暴力比对算法对 CPU、内存资源依赖极
在智能交通、公共安全领域,图片、视频这些非 大,限制了数据规模。基于这种情况,我们可以使用
结构化数据也占用了很大的比重,与结构化数据一样, KNN、KMeans 聚类算法对数据进行归类,从而缩小
非结构数据也包含了的大量信息,但这些信息更难 比对范围,或者使用 LSH(局部敏感哈希)之类的算
提取和利用。早年图像、视频数据更多的是归档备查, 法对数据进行降维,以牺牲精确度提升数据的检索
公安侦破重大案件时往往需要对数百上千小时的录 性能。
像数据做人工比对,耗时低效。借助人工智能,我们
可以由计算机从图像和视频中自动提取大量有价值 作者单位:浙江宇视科技有限公司
的信息,如智能交通领域车牌、车型识别、违章识别、
以及公安领域人脸识别、人脸标签化、以图搜人、以
图搜车等业务。这些业务的特点是从非结构化数据
2019第四届深圳国际无人机展览会(2019.6.20-22 深圳会展中心) www.china-drone.com.cn 157
భခඌ JOEE ྒ௹၂