人群手机使用数据分析(手机用户行为特征分析)
摘 要: 随着智能手机的兴起,合理有效地使用手机已成为社会共性需求。不同的用户具有不同的信息消费行为特征,其需求动向也常常发生变化。描述了手机客户行为分析与用户特征标签刻画的方法,通过对客户使用特定业务的行为、互联网访问行为、指令位置信息、终端使用情况、行业关注等有效信息的收集并运用合适的数学模型进行分析,能获取客户的各种偏好程度,进而对客户进行特征分类,为企业、政府等机构的相关决策及应用提供依据。
0 引言
当前手机已经普及,企业如果能够充分利用收集到的客户基本信息和消费行为信息,跟踪并分析不同客户的需求及其对新产品的接受程度,就能采取相应的措施完善客户使用体验并提升企业收益。
目前国内外对移动互联网中用户的研究一直比较关注,国内的研究侧重于用户偏好现象分析,国外的研究则侧重于用户满意度、接受行为建模与仿真研究,主要以TAM模型作为基础,整合创新扩散等其他理论[1]。已有多种新型用户偏好提取算法被提出,如传统用户偏好提取技术与马尔可夫决策过程建模方法相结合的用户偏好评估模型[2]、文本挖掘算法[3-4]等。
本文重点讨论用户特征标签的刻画方法。通过建立适当的模型,在收集到客户的使用特定业务行为、互联网访问行为等有效信息之后,对客户在不同时间段的行为变化与频次进行综合分析,就能为客户打上特征标签,并应用于企业决策。
1 用户行为评价模型
在分析用户的偏好程度时,既要关注用户对某类产品的使用次数,也要关注其近期使用该产品的连续性,结合这两个因素进行综合评分。
1.1 次数评分法
次数评分法即对用户在某段时间内对业务的使用次数进行评分。由于用户对不同业务的使用频次不同,直接用使用次数进行评价,在不同的业务之间可比性不强。因此,可以将次数统一映射为0~100之间的分值来统一评价。如何合理地评分是关键,需要选择合理的函数,本文设计了以下几种评价函数。
次数评分法有两个主要原则:第一,用户使用某种产品的次数越多则评分越高;第二,由于很多用户每月只使用数次,那么函数曲线应为上凸的。
常见的次数评分法有根号法、反正切法、指数法等,具体使用哪种方法应根据具体情况来确定。
(1)根号法
设计一个函数,将用户的使用次数映射到区间[0,100]上的一个数值即分数。由于实际使用次数的非均匀性,同时对少数使用次数很多的用户不需单独进行分类,因此该映射函数可定义为:
其函数曲线如图1所示。这种模型保证了y随x单调递增,并且函数曲线上凸,随着x的增大曲线变得平缓,因为当使用次数足够多时该用户已经拥有较高的评分,说明为活跃用户,则其分值的变化率应越来越小,接近于0。当x=0时(用户拨打次数为0)评分为0,当x=100时分值最大为100。
由于y最大为100,那么当x超出100时仍取分值y=100。这种函数模型适用于x的值分布范围较小(最好在0~100之间)的情况。
(2)反正切法
假设次数为x,评分公式为:
y=100×arctan(x/10)/π/2
=200×arctan(x/10)/π
函数图像如图2所示。其中x/10是为了在x属于[0,50]范围内的函数曲线不至于太过平缓。这种函数也是单调递增的,并且随着x的增大曲线变得平缓,当x=0时y=0,当x趋于正无穷时y取最大值100。这种模型适用于x的分布范围较广(0~ ∞)的情况。
(3)指数法
假设次数为x,评分公式为:
y=100(1-a-x/b)
这里a的大小可以适当调整,一般可设定在1.1~2之间,本文取1.5;b根据基数大小取适当值,本文取10。如图3所示,y随x单调递增,并且曲线逐渐变得平缓,当x=0时y=0,当x趋于正无穷时y取最大值100。这种模型适用于x分布范围较广的情况(0~ ∞),注意到反正切法的模型中当x较小时y的变化率非常大,而指数法中y随x的变化相对慢一些。
1.2 连续性评分法
评价假定:如果一个用户在近几个月内都使用某项业务,那么可以判断该用户为此项用户的忠实用户;如果仅在前期偶尔使用过,近期均未用过,则属于该业务流失用户。
基于此假设,可以对用户在近3个月内使用某项业务的情况进行连续性评分。设当前月份为m,则m-2、m-1、m 3个月份使用连续评价规则可按表1进行定义。
(表中前3列的“1”表示在本月使用过该项业务,“0”表示未使用过)
1.3基于分数的用户分类
基于评分模型得到的分数,可对用户进行分类,一种可能的分类方法如表2所示。
1.4 各类偏好地址综合统计
借助从运营商获得的数据可以统计出各类偏好地址(把得到分数不小于75即中度爱好程度以上的地址认定为用户的偏好地址)的用户数量,从而判断各类网站的受欢迎程度。
2 网站主题评价
2.1 基于宽带上网的网站主题评分
依据手机用户利用宽带上网对网站主题的访问用户数对网站主题进行评分。评分方法可以采用指数法,a取1.5,根据用户数的规模,b取2 000。
2.2 基于手机上网的网站主题评分
依据手机直接上网用户对网站主题的访问用户数对网站主题进行评分。评分方法与基于宽带上网用户的评分方法相同。
3 数据统计分析及特征标签刻画
根据某运营商一个月的数据,利用前文所定义的分析模型,可对用户、网站主题进行以下特征刻画。
3.1 上网方式偏好程度
统计得到的数据及其评价如表3所示。
3.2 手机换购用户预测
根据对相关主题网站的访问统计,依据最近一周访问量来分析手机换购用户。
由于是对最近一周的用户数据集中分析,那么不宜采用打分的方法对用户分层。可以考虑使用定阈值的方法。如最近7天有3天以上访问天数,且平均访问同类偏好地址2次以上的用户,当其在上月的偏好月表中不存在,则判断其为有手机换购意向的用户。以某一星期数据为例,统计总用户数104 227,有换购意向的用户数达318,表4列出了统计分布表(只列出用户数大于20的分布情况,天数是针对某特定主题,总天数是针对所有主题)。
3.3 手机爱好者判定
对手机用户一段时间内的访问次数、访问天数,分别根据前面的模型进行评分,得到一个总分:
得分=(天数得分 次数得分)/2,其中定义天数得分=100×(1-2-访问天数/1.106 8),次数得分=100×(1-2-访问天数/1.106 8)。
根据某运营商一周的统计数据,对用户是否为体育迷进行分析,得到表5所示结果。
3.4 各类偏好地址综合统计
3.4.1 移动宽带上网偏好统计
参照从运营商获得的某个月数据,找出曾经访问过各类偏好地址的宽带用户191 613个,其中“3G达人”、“iphone4s”、“iphone相关网站”、“手机综合”、“手机软件下载”的访问用户数量较大(高于10 000),列出用户数大于1 000的偏好分布如表6所示。
为了找出用户访问频率较高的地址而不仅仅是用户数量大的地址,再统计出有5天和5天以上访问频率的用户1 583个,分布如表7所示。
3.4.2 手机直接上网偏好统计
根据运营商提供的月数据可以找出访问各类地址的手机直接上网用户193 148个,其中访问次数最多的为13,列出用户数大于1 000的偏好地址分布如表8所示。由统计结果可以看出,分布频率较大的是“360手机卫士”、“Android天气通”、“天翼阅读”、“安卓市场”、“手机酷狗”。
4 结论
移动互联网逐渐成为大众生活必不可少的部分,移动互联网服务已成为网络服务发展的主流方向。为了提升客户的使用体验并为企业赢得更多的用户,本文介绍了通过固网用户的互联网访问行为以及手机用户的访问行为进行偏好分析并准确定位“手机发烧友用户”的方法,提供了3种常用的评分模型,描述了宽带上网、手机上网数据分析的步骤和分析用户特征的策略,以某运营商提供的数据为例找出了比较受欢迎的用户偏好地址。企业可以以此进行用户特征标签的刻画并将其应用于营销服务活动,从而提升服务质量。
参考文献
[1] 徐潇.移动软件产品的用户接受研究——以苏宁Android手机软件为例[D].南京:南京理工大学,2014.
[2] 黄海清,张平,张曦文.用户偏好提取算法[J].无线电工程,2006,36(13):16-19.
[3] 吴双.客户需求信息管理与用户偏好分析[J].科技致富向导,2013,25(17):409-431.
[4] 张欢.网络用户偏好分析方法的研究[D].北京:北京交通大学,2010.
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com