Page 192 - 安防19年1月刊
P. 192
C 前沿技术
Cutting-edge Technology
能的结果是:周六、夜晚、滨江、盗窃、盗窃案,部分 网距离。如两点之间相距 10km,我们假设最快车速
分词器还可以根据字典匹配同义词,如夜晚可以替 100km/h,可以得出 6 分钟以上是合理的通过时间。
换为晚上或者夜间,盗窃可以替换为偷盗,分词完 显然这是不够准确的,实际生活中我们常遇到,从 A
毕后在倒排索引中查找这些词元对应的文档,并根 点到 B点与从 B点到 A 所花费时间大相径庭的情况,
据多种策略评估文档的匹配程度然后排序,这种检 路况、交通信号灯、早晚高峰、车道封闭及施工等都
索方式对词元顺序不敏感,更具弹性,更符合汉语 会影响到两点之间的预期通过时间。使用 Hadoop
表达习惯。而传统模糊匹配技术,通常直接对所有 MapReduce 或者当前热门 Spark 等分布式计算框架,
文档扫描,在每个文档中匹配查询条件,性能差且不 通过分析海量历史过车数据,对他们的行为进行统
谈,对查询条件的要求也较高。 计,可以根据不同时段、天气、车型对路网连通性做
目前主流的开源搜索引擎如 ElasticSearch、Solr 精准建模,从而为其他业务提供可靠数据支撑。 近
都不仅仅用于全文检索,其支持的多条件查询、聚 年来,安防数据类型接入的越来越丰富,从最早的
合查询功能也是对类 HBase 的 NoSQL 数据库的重 车辆信息,到现在的 Mac、Rfid,环境数据,半结构
要补充。 化数据等等,多维数据融合与碰撞逐渐成为安防应
用需求的热点,公安机关曾多次利用 Mac 与 Rfid 的
时空轨迹碰撞破获电动车盗抢案,从单维度到多维
度,借助大数据技术违法犯罪将更加无处遁形。然
而以人脸为代表的半结构化特征数据的兴起为也带
来了新的技术挑战。 半结构化数据的特点是:体积
大,一条人脸特征数据通常是几百到上千维的向量;
难索引,与结构化数据不同,即使是同一个人的两次
特征提取都是不同的,很难对半结构化数据做精确
索引。因此基于人脸的技战法业务带来的技术挑战
是空前的,业内利用机器学习,通过降维、聚类、标
签化等方式也取得较大的进展。
数据分析与挖掘 SQL化
安防数据特点是,数据量大,信息密度小,在公 PaaS( 平台即服务 ) 是大数据平台是近年的发
安交警的业务中,我们经常需要在上亿数据中挖掘 展趋势。分布式架构带来的处理能力增长也激发了
高价值信息。以套牌分析为例,如果一个车牌先后 用户提出越来越多的业务需求,不同的用户的使用
在时刻 t1 和 t2 在区域 A 和区域 B 被抓拍到,并且 场景差异较大。通用的技战法业务已经越来越难以
一辆车不可能在 t2-t1 的时间内从 A 到 B,那么我 满足客户的定制化需求,用户有很多好的想法,而平
们可以认为这两次抓拍的车辆中至少有一个套牌。 台提供商却疲于应对,需求响应速度和质量也无法
这里面存在一个难题,如何知道从区域 t1 到 t2 的 尽如人意。PaaS 的大数据平台应该像一个传统关系
合理时间?可以根据经纬度坐标计算两点直线距离; 型数据库一样,屏蔽内部复杂的实现细节,用户无需
更精确地,也可以结合地图技术,计算两点之间的路 关心集群内部的组件关系、数据流程。通过完善的
156 2019第八届深圳国际智能交通与卫星导航位置服务展览会(2019.6.20-6.22深圳会展中心)www.its-expo.com
భခඌ JOEE ྒ௹၂