今天想聊聊人工智能和犯罪预测。
2011年前后,因为本.拉登的终结,美国政府9.11之后反恐行动终于有了一个交代,之后对恐怖和犯罪行动的预防转化成为美国联邦政府的主要工作。
CompStat,是COMPuter STATistics(计算机统计)的缩写,现在已经演变成为一个专有名词,特指一种警务管理模式。1994年,纽约市的警察部门启用了一个新的治安信息管理系统,是一个以地图为基础的统计分析系统,随着它的出现,纽约城的治安开始逐年好转。
CompStat系统通过分析纽约76个警区日常犯罪的数据,得出地区犯罪报告、逮捕报告以及预测出地区犯罪趋势图,告知警方哪些地段可能会发生暴力事件。在系统预测的案件多发地,多派警力巡查。这个系统运行后,仅仅用一年的时间,纽约的犯罪率就下降了60%。到2003年,谋杀案件降到了1964年以来的历史最低水平。
由于Compstat系统的成功运用,纽约市公民对警察的满意度也上升到了历史最高点。现在美国三分之一以上的警察局都采用该系统,芝加哥、新奥尔良和明里波利斯的警察局自从采用Compstat模式后,犯罪率出现了双位数的下降。
到了2013年,全美已有超过90%的警方布置了街头和公共场合摄像头,个人数据库渐渐完善,警察的预知能力更是不受地域限制。比如,纽约警察局受Compstat系统成功的激励,2012年首次与微软公司合作,又引进了一款更先进的预测工具,这款工具信息检索系统能分析和及时显示超过3000个监控仪、911电话,车牌和其他资源的数据。
2014年,这款系统第一次出击,取得的成绩就令人惊叹。通过追踪100万脸书网页、4万个来自臭名昭著的赖克斯岛监狱的通话记录和数百小时来自大楼电梯、走廊和庭院的监控录像,警方突击了一个住宅区,在那儿逮捕了103个黑帮成员,这是纽约历史上最大规模的一次帮派逮捕行动,这个帮派被指控涉嫌2起谋杀、19个致命枪击案和50件其他的枪击事件,大规模的逮捕行动成功地阻止了未来可能的犯罪行为。在没有计算机的过去,这一庞大的数据侦查活动是无法想象的。
在预测犯罪分子方面,世界各地的警察局根据自身需要,设计出了不同类型的预测软件。在英国,毒品和抢劫一直是社会难题,警察部门现在使用“预测性警务”(PredPol)软件程序,根据过去三年区域的犯罪记录,PredPol会绘制出一份城市地图,用小红框标出热点犯罪区域,这个区域大概占到一个城市街区一半的面积,警察们会按照这份带有标记的地图,到那些小红框区域巡逻。在德国,预测的重点是防偷窃案。
警察局利用Precobs预测软件,通过搜集犯罪现场、时间、失窃物及窃贼的特定行为等数据做分析,辨別出高失窃风险区,预先部署警力来防止窃案发生。
强大数据资源的支撑下,利用先进算法的计算机不难形成较准确的预测系统。过去,在学校门口发现一个可疑车辆,警局接到报案后,会根据车牌搜索信息,但搜索结果只是出现车牌的主人姓名、电话、住址等少部分信息。而现在,假如幼儿园附近有个可疑车辆被报告给了警察局,预测系统就会根据已建立的车牌管理数据库,查出谁拥有了这辆车,车主的逮捕记录,和这个区域的犯罪情况,它不仅能知道这辆车现在在哪里,而且通过调动车牌记录,还可以知道它这几天、几个星期,甚至几个月去过哪里。根据摄像头显示,脸部识别系统又将识别此时开车的人是否是车主本人,通过合理的推测,这个数据可能有助于让犯罪念头扼杀在萌芽中。
相较而言,Predpol是一个比较成熟的产品。
- Making predictive policing practical
- The science behind predictive policing
- Testing predictive policing in the field
这套系统的设计理念也很合乎情理,Data + Criminal behaviors + Advanced mathematics = Highest probabilities of crime,但没琢磨懂将犯罪模式抽象成的数学模型。
相较于Predpol的实用性,Palanti更像是个科研项目,当然其实它是个实用系统。Palanti采用了动态本体论(Ontology)的概念,在自然语言理解层面以及系统的体系结构设计(为了配合Ontology的表示以及异质结构数据导入)上显示了相当的功力。
我们知道,建立好本体之间的关系之后就可以进行语义层面上的推理,推理的结果可以映射回语言层面形成新的组合,本体还能比如定义同义词、反义词,对属性的值域施加约束等等。这些手段都是为了加强对大数据的理解,从而更深层次挖掘有用信息。Palanti主要是对人在社会组织中的各种复杂关系做了本体层面的抽象,这样可以全面掌握一个人包含社会关系在内的复杂属性。Palanti的学术资料也非常丰富,附件只是一小部分。
瑞士苏黎世警方正使用德国开发的Precobs软件,应用这款软件的地区,盗窃案发生率降低了30%。Precobs相对简单,感觉是个线性预测模型,trigger和anti-trigger有点点现在流行的生成对抗网络的意思,但很粗糙和浅显。
我认为,当我们理解人工智能作为未来科技发展趋势的时候,特别是其中自然语言理解部分的时候,我们不能只是想到虚拟个人助理、语音识别技术,这里本体论的应用场景就是一个让人眼前一亮的选择。未来更多的应用还需要我们脑洞大开地将科学与应用相结合。
其次,犯罪预测也是当下智慧城市建设中不可或缺的一部分。目前一些地方政府部门特别是公安系统也在做相应的研发工作,但单靠自己的有限的科研力量很难有高水平的成果,适当引入外部力量包括资源和产品也是刻不容缓的事情。抛开上述英美国家的产品,国内的海云也在数据分析和可视化方面有了比较成熟的产品可供借鉴了。