简单的数据技术找到“嫖客” 和“小姐”

大数据技术非常领先,我们来看一下最简单的通过统计和历史账单的方式抓到小姐的新报报道。下面就是通过支付历史的统计账单找到嫖客的权威新闻报道:

近日江苏宜兴警方掀起扫黄风暴,且凡在被抓浴室扫码付款超过600元者,都要去警局报到。24日下午,宜兴警方向北京时间记者表示,传唤这些人到派出所仅仅是接受调查、说明情况,至于是否真的嫖娼,警方会根据证据来认定。

网传信息称,江苏省宜兴市公安局近日掀起扫黄风暴,抓了1200多个“嫖客”,而警方抓这么多嫖客的秘诀是——调查涉黄浴室付款二维码的转账记录,凡给这些二维码转账超过600元的,全部接到短息要求去警局报到。

其实通过以上的这种办法来找到嫖客,其实太过于简单。我们根据兴趣爱好,通过暗网中透露出来的开房信息,建立了一组大数据的匹配模型。

这样一组匹配模型是由国内领先数据安全小组将所有用户数据进行脱敏、真实名称和身份证号码进行数据技术处理后进行的。不会侵害到用户的个人隐私。开维创数据分析专家对数据进行了建模。最后得到了一个这样好玩的结论。我们来看看数据样本和数据特点。

一、小姐有以下数据特点:

1. 根据女性生理周期特点,通常一个月有7天左右不开房;

2. 一个月的开房的数量会比一般女性的要大;

3. 会在不同的酒店、不同的时间开房;

4. 会和不同的男性开房。

符合以上特点的一定概率的是:“性工作者”。

二、嫖客有以下数据特点:

1. 与小姐画像中的小姐有开房交集;(只需要这一条即可命中目标)

符合以上特点的一定概率的是:“嫖客”。

三、出轨有以下数据特点:

1. 如果有可能拿到结婚数据,开房的不是自己的老婆即为出轨;(需要拿民政的数据,不在开房数据样本中)

2. 如果一名成年男性,定期的与几名固定女性在不同的区域开房;(脚踏几条床的渣男)

3. 如果一名30岁以上的男性,有规律的和一名女性在同一区域开房;(大概率的是出轨)

4. 如果一名30岁以上的男性,与一名女性在不同区域开房;(小概率的是出轨)

符合以上数据特点的,一定概率是:“出轨”。

我们总结了通过大数据技术找到了“小姐”的:

1. 生理周期

2. 匹配出同时开房的男性(即大概率的嫖客)

3. 大概率的小姐

4. 出轨的男性。

建立好画像后,使用大数据技术将所有的开房技术实时传过来,使用到Spark  streaming 或者 Flink 流式计算都可以帮助公安部门实时抓嫖。

下面还有各种通过大数据招嫖的图片,其实拿到腾讯的聊天记录后,这些通过科学的算法都能找出来,以后听我们来进行数据分析。