基于运营商数据的用户关系模型建立示例

天翼云开发者社区
• 阅读 1

本文分享自天翼云开发者社区《基于运营商数据的用户关系模型建立示例》,作者:石泽涛

从社交的角度来看,一种典型的用户关系网络即交往圈。一个用户的交往圈定义为“与用户在一段时间内存在双向联系的所有个体”。根据不同社会群体性质,交往圈又可以分为家庭圈、工作圈、密友圈等。基于运营商数据,可识别的用户之间的关联主要为:通信关联、地域关联及身份关联。通信关联指通信的频繁性,地域关联指地理位置上的相近性,身份关联则指用户号码之间的主副关系。

以通信关联指数定义举例通过分析计费详单通话数据,进行正负样本训练,根据训练结果,总结提取特征。结合通话时长、通话频率、通话次数3个方面的特征,定义通信关联指数。

例如现在需要建立用户交往圈关系模型,根据运营商数据中主要存在的用户关联分别计算各类关联指数,并形成总用户关系视图,如下图:

基于运营商数据的用户关系模型建立示例

由于交往圈的定义中包括“双向联系”,故剔除仅有单向联系的噪声数据和无价值的离网用户。 基于运营商数据的用户关系模型建立示例

对于交往圈来说,快递、中介等服务人员属于噪声数据,影响用户群体圈定,故需要一并剔除。这类人员通常联系人数较多,且平均通话时长较低,可根据这类人员的通话特征进行剔除。

基于运营商数据的用户关系模型建立示例

对于关联指数等于0的用户,也应进行剔除。最终得到用户的交往圈关系模型。 基于运营商数据的用户关系模型建立示例

最终交往圈确认为: 基于运营商数据的用户关系模型建立示例

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
3年前
SEO生态圈的资源如何建设呢?
今天讲的SEO(https://www.oschina.net/action/GoToLink?urlhttp%3A%2F%2Fwww.xusseo.com)资源生态圈跟网站站群是不一样的,站群很容易成为黑帽手法而被百度惩罚的,如果你现在还在想着如何研究站群排名,那么你做SEO很难做了。主要原因是SEO生态资源圈会产生一些对用户有价值的内容,而站群不会
Aidan075 Aidan075
4年前
那些为学校刷屏的人,刷的是什么?|无用但有趣
校门外店铺招牌总是换了又换,就像时间的年轮转了一圈又一圈。——《HDcity》经我们不负责任的观察,能看到朋友圈为学校集体刷屏的场面如下:
Stella981 Stella981
3年前
Opencv之LBP特征(算法)
LBP(LocalBinaryPattern),即局部二进制模式,对一个像素点以半径r画一个圈,在圈上取K个点(一般为8),这K个点的值(像素值大于中心点为1,否则为0)组成K位二进制数。此即局部二进制模式,实际中使用的是LBP特征谱的直方统计图。在旧版的Opencv里,使用CvHaarClassifierCascade函数,只支持Har
Wesley13 Wesley13
3年前
P1162 填涂颜色
题目描述由数字0组成的方阵中,有一任意形状闭合圈,闭合圈由数字1构成,围圈时只走上下左右4个方向。现要求把闭合圈内的所有空间都填写成2.例如:6×6的方阵(n6),涂色前和涂色后的方阵如下:00000000111101100
Stella981 Stella981
3年前
Hadoop生态圈
Hadoop生态圈CentOs7.5单机部署ClickHouse作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任。到了新的公司,认识了新的同事,生产环境也得你去适应新的集群环境,我新入职的公司的大数据开发同时并不看好hbase,而是对clickhouse青睐有加,听他们口头把ClickHouse吹的
Wesley13 Wesley13
3年前
2019年度总结与2020展望【文末送书活动】
点击上方“中间件兴趣圈”,选择“设为星标”做积极的人,越努力越幸运!时光匆匆而过,2019即将逝去,迎来充满希望的2020年。回顾2019,中间件兴趣圈公众号始终坚持初心:为大家分享优质的原创技术文章,共同构建高质量的技术交流圈。2019中间件兴趣圈不仅陆续发表了Dubbo、ElasticJob、RocketMQ、
竞速榜实时离线对数方案演进介绍 | 京东云技术团队
竞速榜是大促期间各采销群提供的基于京东实时销售数据的排行榜,同样应对大促流量洪峰场景,通过榜单撬动品牌在京东增加资源投入。竞速榜基于用户配置规则进行实时数据计算,榜单排名在大促期间实时变化,相关排名数据在微博、朋友圈广泛传播,相关计算以及排名的准确性至关重要
商场商圈潜客挖掘模型
本文分享自天翼云开发者社区《》,作者:石泽涛超速数据清洗算法:1)针对同一用户,顺次选取两条记录(第n条、第n1条),根据第n条记录的停留时间TSn(两停留点时间差),以及与第n1条记录的距离Dn(两记录点经纬度距离),计算第n条记录的穿越速度(Dn/
构建多维打标签算法
本文分享自天翼云开发者社区《》,作者:石泽涛针对各类主题,通过对用户DPI访问数据深度解析,体现数据价值,丰富云产品形态与应用范围;建立行业的标签,能够对用户访问各类APP和网站的行为和内容有深入细致的刻画,为主题运营工作提供必要的数据支撑。在获客成本越来
天翼云开发者社区
天翼云开发者社区
Lv1
天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。
文章
859
粉丝
16
获赞
40