用户画像简介

1-1简介

基本概念

1.基本属性:每个人都有一些基本属性(性别、年龄、婚否、收人、教育程度)。

行为记录:网上购买行为、查看网页行为、点击行为、购物车行为,从这些行为中判断出用户的一些信息,假如经常网上购买小孩的物品,从此之后可以不判断出小孩的年龄、小孩的性别、等等的一些信息。

2.去购买能力:可以可以确定出用户的购买能力,最终达到打上购买力的等级标志。

3.行为特征:是可以判断用户的行为特征,比如说用户的活跃程度、购物类型。

4.社交网络:这个可以可以确定出他的社交网络。

5.心理特征:比如报出促销的敏感度,购物的真心诚意度。

6.兴趣爱好:颜色的偏好,品牌的偏好。

用户画像的用途

1.精准营销:邮件、短信、

2.用户统计数据:地域、时段

3.数据挖掘:特征、行为

学习目标:

1.知道一点hive数据仓库的特点

2.学会了在用hive并且数据开发

3.进入到解释用户数据的特点

4.完全掌握要如何构建体系用户画像

5.亲密接触换算项目的开发

6.靠积累项目实战经验

主要内容:

1.用户画像项目介绍

2.用户画像建模

3.不使用hive进项数据开发

4.用户画像数据开发

1-2用户画像简介

定义

用户画像(UserProfile)也叫用户信息标签化,客户标签。根据基本信息和行为,用一些标签把用户描绘出出,

具体描述用户的标签就是消费者画像。

最终形成用户画像的技术

1.数据收集:网络日志数据、用户行为数据、网站交易数据

2.行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法

3.用户画像:基本属性、可以购买能力、行为特征、兴趣爱好、心里特征、社交网络

源数据

1.动态和静态信息数据:来源于用户填好的个人资料,或是从而反算的数据。要是有不判断的。可以确立模型来判断。比如用户性别如果不填,可以不组建性别模型,实际用户的行为来推测其性别是什么船舶概论概率。

人口属性:性别、生日、年龄、婚否、收人、城市、教育程度、职业、是否是有小孩(数量)、星座、月收入

商业属性:消费等级、消费周期

2.动态信息数据:用户行为再产生的数据:注册、打开浏览器、点击、去购买、签收后、评价。

比较比较重要的行为:购买商品、浏览的网页商品、放入购物车、参与商品。

注册时间、首单时间、潮妈族,纠结啊商品、大消费、退货数量、败家指数、品牌偏好。

用户相互点(TouchPoint)

行为类型:网页、搜索、发表文章、点赞数

外界点(Tag):女装单品页面、女鞋单品页面……

标签分类

1.确认的标签

2.根据算法猜测的标签

标签举例子:

1.用户活跃度:未定购、异常活跃、沉睡、大量流失

2.用户分群:电脑达人、数码潮人、家庭用户、有房一族、网购达人、单身贵族、时尚男女、奶爸奶妈、

拼购用户、超级用户。(参照用户去购买的品类情况,比如说一级品类、二级品类)

1-3用户画像用途

用户画像的作用:

1.分类统计:12星座对雾霾天气的防范指数;奶爸当家指数;

访客画像(男女比例;新老用户比;年龄分布;学历分布)

2.营销帮我推荐:邮件营销;短信营销;push信息。

例确认你有小孩的话,推荐一下一些母婴产品

3.数据挖掘:据用户的数据挖掘出一些用处不大的信息以支持决策。

利用关联规则计算:比较喜欢红酒的人常见喜欢什么品牌?利用聚类算法讲:喜欢红酒的人,年龄段分布情况。

数据挖掘

1.属性再次筛选:属性筛选后、基于组件信息增益的属性打分、属性重要性打分、主成分分析、实现卡方检验的属性再次筛选;

2.具体分类分析预测:决策树、神经网络分类、贝叶斯网络、归类重临树、支持向量机分类、逻辑回归、朴素贝叶斯、分类组合模型;

3.回归预测:20块多项式回归、神经网络回归、广义线性回归、支持向量机轮回、回归两种模型;

4.聚类分析:K均值聚类、基于条件K均值的层次聚类、分布肯定聚类、两阶段聚类;

5.关联分析:购物篮分析、属性关联分析、序列模式分析;

6.时间序列:ARX时间序列

数据挖掘

比较喜欢什么东西的人往往很喜欢什么?

做了这个事的人接下来好象会干什么?

最比较经典例子:啤酒与尿布的关系。

扫码免费用

源码支持二开

申请免费使用

在线咨询