(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 108596720 A(43)申请公布日 2018.09.28
(21)申请号 201810367578.9(22)申请日 2018.04.23
(71)申请人 广东奥园奥买家电子商务有限公司
地址 510000 广东省广州市南沙区进港大
道10号101室自编C区(仅限办公用途)(72)发明人 杨胜文 刘丽萍 邓凤云 (74)专利代理机构 北京东方盛凡知识产权代理
事务所(普通合伙) 11562
代理人 (51)Int.Cl.
G06Q 30/06(2012.01)G06F 17/30(2006.01)
权利要求书1页 说明书4页 附图2页
(54)发明名称
一种根据用户的行为数据进行商品推荐的方法
(57)摘要
本发明公开一种根据用户的行为数据进行
(1)通过用户商品推荐的方法,包括有以下步骤:
的行为记录来对用户进行画像;(2)根据用户和商品的关系生成用户对商品的评分,然后根据协同过滤生成一个用户对商品的评分矩阵;(3)结合用户画像和用户对商品的评分矩阵生成推荐数据。通过利用本发明方法,使得商品推荐更加的精细,能够真正反映用户真正实际想要的商品,更加系统化,实际推荐的商品更加的贴合是用户真正想要的,为商家和用户都带来了方便。
CN 108596720 ACN 108596720 A
权 利 要 求 书
1/1页
1.一种根据用户的行为数据进行商品推荐的方法,其特征在于:包括有以下步骤:(1)通过用户的行为记录来对用户进行画像;
(2)根据用户和商品的关系生成用户对商品的评分,然后根据协同过滤生成一个用户对商品的评分矩阵;
(3)结合用户画像和用户对商品的评分矩阵生成推荐数据。
2.如权利要求1所述的一种根据用户的行为数据进行商品推荐的方法,其特征在于:所述用户的行为记录为浏览、下单、收藏、支付和加入购物车。
3.如权利要求1所述的一种根据用户的行为数据进行商品推荐的方法,其特征在于:所述生成推荐数据包括有在线生成推荐数据和离线生成推荐数据。
4.如权利要求3所述的一种根据用户的行为数据进行商品推荐的方法,其特征在于:所述在线生成推荐数据的步骤:通过读取flume或者Kafka的数据生成实时推荐数据的阵列,主要通过用户标签分组和浏览记录生成推荐数据,推荐数据:
A:用户浏览了商品A,直接推荐相关类型商品B给用户;B:根据用户选择的喜好的商品类型推荐;B:热门商品;C:用户是男的,就推荐男士的商品,用户是女士就推荐女士的商品;推荐权重:A>B>C;A占:50%;B占:40%;C占:10%。
5.如权利要求3所述的一种根据用户的行为数据进行商品推荐的方法,其特征在于:所述离线生成推荐数据的步骤:
(3.1)获取用户数据;
(3.2)生成用户和商品的评分;
(3.3)根据协同过滤生成用户和商品的评分矩阵;(3.4)根据评分来推荐数据。
6.如权利要求1所述的一种根据用户的行为数据进行商品推荐的方法,其特征在于:所述用户画像字段来源:用户基本属性、用户消费特征、用户价值特征和用户生命周期。
2
CN 108596720 A
说 明 书
一种根据用户的行为数据进行商品推荐的方法
1/4页
技术领域
[0001]本发明涉及电子商务领域技术,尤其是指一种根据用户的行为数据进行商品推荐的方法。
背景技术
[0002]随着互联网技术的发展和上网用户人数的激增,网上信息呈指数级增长,信息过载问题日益严重。近年来,作为解决信息过载问题的主要技术——推荐系统得到了广泛的发展和应用。[0003]目前,现有的商城商品推荐不够精细,主要是基于点击次数进行商品推荐,用户对某一商品点击查看次数多,在用户再次打开网页时,该商品的显示顺序就靠前,但此种推荐方法分析考量的维度少,不能真正反映用户真正实际想要的商品,不够系统,实际推荐的商品可能不是用户真正想要的。
发明内容
[0004]有鉴于此,本发明针对现有技术存在之缺失,其主要目的是提供一种根据用户的行为数据进行商品推荐的方法,其能有效解决现有之商品推荐方法不够精细的问题。[0005]为实现上述目的,本发明采用如下之技术方案:[0006]一种根据用户的行为数据进行商品推荐的方法,包括有以下步骤:[0007](1)通过用户的行为记录来对用户进行画像;[0008](2)根据用户和商品的关系生成用户对商品的评分,然后根据协同过滤生成一个用户对商品的评分矩阵;[0009](3)结合用户画像和用户对商品的评分矩阵生成推荐数据。[0010]优选的,所述用户的行为记录为浏览、下单、收藏、支付和加入购物车。[0011]优选的,所述生成推荐数据包括有在线生成推荐数据和离线生成推荐数据。[0012]优选的,所述在线生成推荐数据的步骤:通过读取flume或者Kafka的数据生成实时推荐数据的阵列,主要通过用户标签分组和浏览记录生成推荐数据,推荐数据:[0013]A:用户浏览了商品A,直接推荐相关类型商品B给用户;[0014]B:根据用户选择的喜好的商品类型推荐;[0015]B:热门商品;[0016]C:用户是男的,就推荐男士的商品,用户是女士就推荐女士的商品;[0017]推荐权重:[0018]A>B>C;[0019]A占:50%;[0020]B占:40%;[0021]C占:10%;[0022]优选的,所述离线生成推荐数据的步骤:
3
CN 108596720 A[0023]
说 明 书
2/4页
(3.1)获取用户数据;
[0024](3.2)生成用户和商品的评分;[0025](3.3)根据协同过滤生成用户和商品的评分矩阵;[0026](3.4)根据评分来推荐数据。[0027]优选的,所述用户画像字段来源:用户基本属性、用户消费特征、用户价值特征和用户生命周期。
[0028]本发明与现有技术相比具有明显的优点和有益效果,具体而言,由上述技术方案可知:
[0029]通过利用本发明方法,使得商品推荐更加的精细,能够真正反映用户真正实际想要的商品,更加系统化,实际推荐的商品更加的贴合是用户真正想要的,为商家和用户都带来了方便。
[0030]为更清楚地阐述本发明的结构特征和功效,下面结合附图与具体实施例来对本发明进行详细说明:
附图说明
[0031]图1是本发明之较佳实施例的总体流程示意图;[0032]图2是本发明之较佳实施例中商品评分生成流程图。
具体实施方式
[0033]本发明揭示了一种根据用户的行为数据进行商品推荐的方法,其特征在于:包括有以下步骤:[0034](1)通过用户的行为记录来对用户进行画像;所述用户的行为记录为浏览、下单、收藏、支付和加入购物车等。[0035](2)根据用户和商品的关系生成用户对商品的评分,然后根据协同过滤生成一个用户对商品的评分矩阵;[0036](3)结合用户画像和用户对商品的评分矩阵生成推荐数据。
[0037]所述生成推荐数据包括有在线生成推荐数据和离线生成推荐数据。[0038]所述在线生成推荐数据的步骤:通过读取flume或者Kafka的数据生成实时推荐数据的阵列,主要通过用户标签分组和浏览记录生成推荐数据,推荐数据:[0039]A:用户浏览了商品A,直接推荐相关类型商品B给用户;[0040]B:根据用户选择的喜好的商品类型推荐;[0041]B:热门商品;[0042]C:用户是男的,就推荐男士的商品,用户是女士就推荐女士的商品;[0043]推荐权重:[0044]A>B>C;[0045]A占:50%;[0046]B占:40%;[0047]C占:10%;
[0048]所述离线生成推荐数据的步骤:
4
CN 108596720 A[0049]
说 明 书
3/4页
(3.1)获取用户数据;
[0050](3.2)生成用户和商品的评分;[0051](3.3)根据协同过滤生成用户和商品的评分矩阵;[0052](3.4)根据评分来推荐数据。[0053]所述用户画像字段来源:用户基本属性、用户消费特征、用户价值特征和用户生命周期。具体是:[0054]1、用户基本属性:[0055]·人口统计:用户标识、姓名、手机、邮箱、性别,通过用户的基本信息获取;[0056]·用户年龄:离散处理年龄(15岁以下、15岁-22岁、22岁-30岁、30岁-40岁、50岁以上),通过用户信息的生日获得;[0057]·地域属性:国家、省份、城市、区县,通过用户的收货地址获取。[0058]·社会属性:家庭成员关联、是否有老人/小孩、子女年龄、职业属性(IT用户、公司白领等),通过用户购买的特定产品来获取是否有老人或者小孩,例如有纸尿布就是有0-3岁的小孩,有保健品就是有老人等等。[0059]2、用户消费特征:[0060]·类目偏好:用户类目偏好(含商品分类1、2、3级类目),根据用户购买的商品得出商品的分类;
[0061]·品牌偏好:商品/品牌偏好标签,根据用户购买的商品得出商品的品牌;[0062]·下单习惯:下单时间、下单地理位置、下单设备,根据用户下单记录汇总得出;[0063]·周期购:日用品、快速消费品购买周期标签,根据用户购买的记录得出多次重复购买的商品;
[00]·用户消费特征:按品类区分用户特征(如手机数码达人、美妆达人等)、用户的触达偏好、用户的促销敏感等--暂无,根据用户购买的商品种类汇总得出。[0065]3、用户价值特征:[0066]·消费档次:根据金额段、购买品类型进行划分(一般消费用户、价值用户、高端消费档次用户),获取用户的下单记录,然后匹配系统设置的消费阶段。[0067]4、用户生命周期:[0068]·注册转首购:注册转首购用户标签,实现价值客户的转变,判断用户是否只是成功第一次支付;
[0069]·购买平台转变:PC转移动、H5→APP→小程序,跟踪用户购物习惯,实现多平台推荐,判断用户的注册平台和浏览,购买平台是否有区别。[0070]Flume介绍:[0071]Apache Flume是一个分散式日志收集系统,是由Cloudera公司开发的一款高效能、高可靠性和高恢复性的系统。它能从不同来源的大量日志资料进行高效收集、聚合、移动,最后储存到一个资料中心储存系统当中。架构经过重构后,从原来的Flume OG到现在的Flume NG。Flume NG更像一个轻量化的小套件,简单使用且容易适应不同方式收集日志,且支援Failover和Load Balancing。[0072]架构角色说明:
[0073]Flume架构中主要有以下几个核心:
5
CN 108596720 A[0074][0075]
说 明 书
4/4页
·Event:一个资料单元,会附带一个可选的讯息来源。Ex:日志纪录、avro。·Client:操作位在原点的Event且将它传送到Flume Agent,主要是产生资料,运
行在一个程式。
[0076]·Agent:一个的Flume程式,包含Source、Channel、Sink。[0077]·Source:用来消费从Client端收集资料到此的Event,然后传送到Channel。[0078]·Channel:转换Event的一个临时储存空间,保有从Source传送过来的Event。[0079]·Sink:从Channel中读取并且移除Event,将Event传递到Flow Pipeline的下一个Agent(如果存在的话)。[0080]Kafka说明:
[0081]Kafka是一个消息系统,原本开发自LinkedIn,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。现在它已被多家不同类型的公司作为多种类型的数据管道和消息系统使用。
[0082]活动流数据是几乎所有站点在对其网站使用情况做报表时都要用到的数据中最常规的部分。活动数据包括页面访问量(Page View)、被查看内容方面的信息以及搜索情况等内容。这种数据通常的处理方式是先把各种活动以日志的形式写入某种文件,然后周期性地对这些文件进行统计分析。运营数据指的是服务器的性能数据(CPU、IO使用率、请求时间、服务日志等等数据)。运营数据的统计方法种类繁多。[0083]近年来,活动和运营数据处理已经成为了网站软件产品特性中一个至关重要的组成部分,这就需要一套稍微更加复杂的基础设施对其提供支持。主要设计目标如下:[0084]·以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间复杂度的访问性能。[0085]·高吞吐率。即使在非常廉价的商用机器上也能做到单机支持每秒100K条以上消息的传输。
[0086]·支持Kafka Server间的消息分区,及分布式消费,同时保证每个Partition内的消息顺序传输。
[0087]·同时支持离线数据处理和实时数据处理。[0088]·Scale out:支持在线水平扩展。[00]本发明的设计重点是:通过利用本发明方法,使得商品推荐更加的精细,能够真正反映用户真正实际想要的商品,更加系统化,实际推荐的商品更加的贴合是用户真正想要的,为商家和用户都带来了方便。
[0090]以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
6
CN 108596720 A
说 明 书 附 图
1/2页
图1
7
CN 108596720 A
说 明 书 附 图
2/2页
图2
8