不知道说些什么

前言

这是我对上一份工作的一个记录,不一定能提供到一些有效信息,请随缘观看。

注意:从实习到离职的完整时间仅有一年半,对整个行业的了解还是偏片面的,所以下面的描述在客观事实上不一定是完全准确的,仅保证主观上没有刻意误导。

背景

前司是一家在广州市海珠区的一家科技公司,我在里面的 title 是数据分析师,我所在的部门可以简单的分为两个组,一个是 DPI,一个是 DMP,我在 DPI。

先说背景,前司和某运营商有合作,可以从那边合法的拿到数据(基站、家庭带宽的上网行为日志)

上网行为日志:可以简单的理解为手机等设备请求了什么网站,访问了什么图片、视频的一个记录,从 开始 DNS 解析到建立 TCP 连接 到响应 HTTP 请求到断开连接。

对我们来说,有用的其实只有 HTTP 请求的数据,别的数据没多大意义,或者说用处不大。

HTTP 协议的请求,可以获取到域名 (Host) 和 Uri、User Agent。

HTTPS 协议的请求,只能通过别的方式推算出 Host(不一定准确)

HTTPS 确实是会比 HTTP 安全,下图这个例子不太准确,但是用来理解倒是挺方便的。

那会做的事情就是先进行测试(抓包),然后总结出口径,提单拿数据回来。如果发现数据/口径不对,那就得重来。

  1. 举一个简单例子,比如想知道拼多多的日活,我们对拼多多这个 app 进行测试(抓包),测试出 *.pinduoduo.com、*.yangkeduo.com 这样的 host 是拼多多的,访问了这些 host 就是访问了拼多多。那么从某运营商那边可以拿到访问了符合这些特征的数据(数据包括但不限于 uv、pv、用户画像、用户年龄层次、设备型号、性别)。

上面这种是针对于整个应用的,可以获取到某一个或者某一类app的数据,或者用某一个或者某一类app的用户的数据(网购用户、手游用户、传奇类游戏用户、看车的用户),找到买房意向、买车意向、氪金意向的用户。

  1. 某些情况下 (http),我们能够做到监测用户在应用里面的某种行为,比如说付费、点赞、评论、搜索之类的。

  2. 我们还可以拿到栅格人流的数据 (基站),就是说某一个小区/广场/园区的数据。先画个格子,然后拿相关的数据。

DPI

DPI (Deep Packet Inspection), 是一种基于数据包的深度检测技术,针对不同的网络应用层载荷(例如HTTP、DNS等)进行深度检测。

举个例子,假如微信这个应用用的域名是:wx.qq.com,且只有微信在用,那么就可以统计出微信的日活跃用户数、月活跃用户数。 如果加上位置、时间等数据,那就可以统计出什么时候、什么地方用微信的人有多少。

这就是运营商数据,所谓的上帝视角能做的事情,但我仍认为这个上帝有点残废。

DMP

DMP (Data Management Platform),数据管理平台,用于收集分析大数据,并将其连接到营销手段的平台。

根据某些方式 / 算法来打标签、画用户画像,从而划分人群(孕妇/宝妈/氪金大佬),然后对合适的用户进行营销(发短信/推送广告) 数据源有:运营商数据、SDK数据、手机厂商数据、内部数据、路由器数据等。

个人认为,这算是大数据营销,不算是精准营销。好的营销是把合适的商品/信息在合适的时间推给了合适的用户。

数据