Page 192 - 安防19年1月刊
P. 192

C    前沿技术
                           Cutting-edge Technology










                     能的结果是:周六、夜晚、滨江、盗窃、盗窃案,部分                     网距离。如两点之间相距 10km,我们假设最快车速
                     分词器还可以根据字典匹配同义词,如夜晚可以替                       100km/h,可以得出 6 分钟以上是合理的通过时间。
                     换为晚上或者夜间,盗窃可以替换为偷盗,分词完                       显然这是不够准确的,实际生活中我们常遇到,从 A
                     毕后在倒排索引中查找这些词元对应的文档,并根                       点到 B点与从 B点到 A 所花费时间大相径庭的情况,
                     据多种策略评估文档的匹配程度然后排序,这种检                       路况、交通信号灯、早晚高峰、车道封闭及施工等都

                     索方式对词元顺序不敏感,更具弹性,更符合汉语                       会影响到两点之间的预期通过时间。使用 Hadoop
                     表达习惯。而传统模糊匹配技术,通常直接对所有                       MapReduce 或者当前热门 Spark 等分布式计算框架,
                     文档扫描,在每个文档中匹配查询条件,性能差且不                      通过分析海量历史过车数据,对他们的行为进行统
                     谈,对查询条件的要求也较高。                               计,可以根据不同时段、天气、车型对路网连通性做
                         目前主流的开源搜索引擎如 ElasticSearch、Solr          精准建模,从而为其他业务提供可靠数据支撑。 近
                     都不仅仅用于全文检索,其支持的多条件查询、聚                       年来,安防数据类型接入的越来越丰富,从最早的
                     合查询功能也是对类 HBase 的 NoSQL 数据库的重                车辆信息,到现在的 Mac、Rfid,环境数据,半结构
                     要补充。                                         化数据等等,多维数据融合与碰撞逐渐成为安防应
                                                                  用需求的热点,公安机关曾多次利用 Mac 与 Rfid 的
                                                                  时空轨迹碰撞破获电动车盗抢案,从单维度到多维
                                                                  度,借助大数据技术违法犯罪将更加无处遁形。然
                                                                  而以人脸为代表的半结构化特征数据的兴起为也带
                                                                  来了新的技术挑战。 半结构化数据的特点是:体积
                                                                  大,一条人脸特征数据通常是几百到上千维的向量;

                                                                  难索引,与结构化数据不同,即使是同一个人的两次
                                                                  特征提取都是不同的,很难对半结构化数据做精确
                                                                  索引。因此基于人脸的技战法业务带来的技术挑战
                                                                  是空前的,业内利用机器学习,通过降维、聚类、标
                                                                  签化等方式也取得较大的进展。
                     数据分析与挖掘                                      SQL化

                         安防数据特点是,数据量大,信息密度小,在公                        PaaS( 平台即服务 ) 是大数据平台是近年的发
                     安交警的业务中,我们经常需要在上亿数据中挖掘                       展趋势。分布式架构带来的处理能力增长也激发了
                     高价值信息。以套牌分析为例,如果一个车牌先后                       用户提出越来越多的业务需求,不同的用户的使用
                     在时刻 t1 和 t2 在区域 A 和区域 B 被抓拍到,并且              场景差异较大。通用的技战法业务已经越来越难以
                     一辆车不可能在 t2-t1 的时间内从 A 到 B,那么我                满足客户的定制化需求,用户有很多好的想法,而平
                     们可以认为这两次抓拍的车辆中至少有一个套牌。                       台提供商却疲于应对,需求响应速度和质量也无法
                     这里面存在一个难题,如何知道从区域 t1 到 t2 的                  尽如人意。PaaS 的大数据平台应该像一个传统关系
                     合理时间?可以根据经纬度坐标计算两点直线距离;                      型数据库一样,屏蔽内部复杂的实现细节,用户无需
                     更精确地,也可以结合地图技术,计算两点之间的路                      关心集群内部的组件关系、数据流程。通过完善的




                     156   2019第八届深圳国际智能交通与卫星导航位置服务展览会(2019.6.20-6.22深圳会展中心)www.its-expo.com




          భခ࠯ඌ JOEE                                                                                                       ྒ௹၂
   187   188   189   190   191   192   193   194   195   196   197