“重点人员”并不是指职位岗位很重要的人员,而是易引发重要关注的人员群体。事实上,各国对“重点人员”均有不同的管控方式,本文以罗马尼亚和塞尔维亚等东欧地区国家的相关素材为主进行探讨。其中一些思路,颇值得其他领域大数据模型借鉴和思考。首先要做的基础性工作,就是对“重点人员”进行分类。这里的分类既不能像打标签那样随意和繁多,也不能过于简单。比如,对一名“重点人员”,首先要确定唯一性编号,比较通行的做法是社会保险号、身份证号。其所附带的基础信息包括:性别、年龄、户籍所在地、学历、结婚以及结婚对象、联系方式。但这些都不属于真正的分类,真正的分类是专业机构或者有关部门明确制定的关键词,而这些关键词往往与“较易引起重点关注”的事务相关,比如:事故相关人、拆迁上访人、刑事被害人、不同政见人、特殊活动参与人、同信仰人、同兴趣爱好人……。其次,明确对社会行为进行预警的方法模式。现代社会的规模性社会行为相比以前丰富了很多,区域性聚集、街头“革命”、网络呛声等线下与线上结合,但线下的聚集行为更加敏感,易引发不可控后果。毕竟,不管网络空间怎么吆喝,总归还得“人到位”才有效果。因此对线下聚集行为的预警尤为重要。由于现代通信技术的发展,通过对“重点人员”手机通信的位置进行聚类,能够有效发现线下聚集的苗头性信息。第三,技术路线的选择和实施。这其中就有一个技术方法的选择问题,是对所有的基站数据进行分析,还是对所有“重点人员”进行分析,实践中一般采用后者。(1)以本地区全部“重点人员”的号码(社会保险号、身份证号)为数据集P;(2)定期以P中的信息为索引,对基站号进行聚类;(3)对定期情况进行历史分析。对(2)的聚类结果进行预警,也可以对(3)的历史分析结果进行研判。通过以上大数据模型分析,能够发现相同分类的人群聚集苗头信息,有时候也能够发现不能分类的“重点人员”联合行动……第四,对核心人员开展信息分析。历史是由人民创造的,但“核心人员”的作用无疑是非常关键的。因此,绝不能放松对核心关键人员的信息开展分析,那里的信息价值甚至远大于大数据分析的结果。第五,不使用现代通信工具行不行? 悲观地告诉您,这只是您的一厢情愿。在一个组织松散的群体之中,或许会有人员这么做,但遗憾的是,大部分都是乌合之众,既不服管、又不担当,还容易坏事。古语有云,成事不足败事有余。根据大数据规律(APRIORI关联规则),个别对象的异常行为并不影响整体大数据规律和结果的产生。第六、有的童鞋可能会问,这个模型能发现“独狼行动”吗?优秀的狼,无论如何也无法预警,愚蠢的狼,用不用数据模型都能搞定。 【注】以上观点均翻译自:《Information Communication & Society Sociological Theory》