简介 本项目通过淘宝用户数据集进行统计分析 使用技术 Hadoop、Hive、Spark、Hbase、python matplotlib(数据展示) 数据来源 本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens-20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔 数据量 原始csv文件2.05G 所有行为数量 100,150,807 操作流程 数据集下载 创建hive表 create table user_behaviors(userId int,itemId int,categoryId int,behaviorType string,times string) row format delimited
2021-10-28 19:40:41 473KB Scala
1
钉钉 Java SDK 钉钉官方提供了统一的SDK,使用SDK可以便捷的调用服务端API。注意:此SDK包含原有TOP接口,原有TOP接口可以继续正常调用,没有影响。下面是使用SDK调用API的请求示例: JAVA: DingTalkClient client = new DefaultDingTalkClient("https://oapi.dingtalk.com/user/get"); OapiUserGetRequest req = new OapiUserGetRequest(); req.setUserid("userid1"); req.setHttpMethod("GET"); OapiUserGetResponse rsp = client.execute(req, accessToken); 请求示例说明: (1)定义Client对象,设置接口地址URI。一般地,无需拼接URL后面的参数,比如access_token;需要注意部分Post接口,需要在URI后拼接除access_token外的个别参数。 (2)构造Request对象,接口对应的request对象,一般规则是Oapi+接口Path驼峰形式+Request,如/user/get接口,请求对象是OapiUserGetRequest。 (3)调用Request的方法设置参数,注意参数HttpMethod,默认是POST,如果是GET类型接口,需要这样设置request.setHttpMethod("GET")。 (4)调用client.execute执行,其中access_token同样可以使用SDK获取到。同时,/gettoken,/sns/gettoken, /service/get_suite_token等获取token的接口在调用execute时,无需再传token参数。 (5)执行后得到Response对象,是与Request对应的,然后可获取执行结果。 环境依赖 (1)JAVA SDK 需要依赖 Java SE/EE 1.5及以上。 (2).NET SDK 需要依赖 .NET Framework 2.0及以上 (不支持Windows Phone平台)。 (3)Python SDK需要依赖python2
2021-10-15 13:25:12 2.66MB 钉钉 钉钉SDK 钉钉 Java
1
某宝最新的sdk,带源码,某宝需要认证以后才能下载最新的api包,福音。
2021-10-15 12:06:36 2.79MB taobao-sdk taobao-api
1
taobao-sdk-java,淘宝自己封装的sdk最新版
2021-10-10 10:24:15 3.99MB taobao-sdk
1
淘宝优惠券 淘口令解析,转链,生成自己的推广淘口令 前端框架原型框架 演示地址
2021-09-22 04:41:44 37KB Python
1
Hadoop基本概念 Hadoop的应用范围 Hadoop底层实现原理 Hive与数据分析 Hadoop集群管理 典型的Hadoop离线分析系统架构 常见问题及解决方案
2021-09-06 13:13:19 1.99MB 淘宝网 Hadoop 数据分析 数据平台
taobao_cookieman 定时登陆淘宝获取有效cookie,用于爬虫请求淘宝相应数据平台 文件: login_robot.py 提供Restful服务 template/login-cfg.ctp 配置模板基本不用更改 template/platform_login.ctp 爬虫脚本模板,通过配置后生成 ${店铺名}_login.js 爬虫文件 依赖: python 2.6+ casperJs 1.0+ 注意:casperJs 依赖 PhantomJS 1.8.2 以上版本 配置: 服务入口: login_robot.py 缺省端口: 9080 使用: 具体API请查看 class TaobaoLoginAPI(): 中的请求方法 已注释 基本流程: template -.
2021-09-06 09:51:42 12KB Python
1
taobao-sdk-java-auto.jar工具类,taobao-sdk-java-auto.jar工具类
2021-08-20 13:27:59 569KB taobao sdk
1
了利用html css样式还原taobao登录页面
2021-07-22 09:13:20 1.77MB 淘宝 html
1
API服务java开发SDK包
2021-07-21 23:57:03 1.43MB taobao sdk api
1