中国移动专题赛
行业算法赛
  • 赛题规则
  • 赛题背景
  • 数据及任务描述
  • 评估指标
  • 数据下载

一:关于初赛

行业算法赛的初赛提交测试结果、《方案说明文档》和完整的程序代码:

1)测试结果命名按赛题说明中的要求提交,格式为csv;

2)《方案说明文档》是对整体方案的说明,包括参赛者对数据分析,算法原理,方案设计及模型效果等各个环节的相关说明,。提交的标准格式为PPT或PDF格式;

3)程序代码支持python和Java,具体要求见第三点规则;

4)三份材料放至同一文件夹并压缩,命名方式为“赛题序号+团队名称”,例如“模型挑战赛赛题一+团队名称”,提交作品方式为在网站上传提交压缩文件。

根据评测指标得分排名,前10名团队队伍进入决赛。

 

二:关于决赛

行业算法赛的决赛阶段,选手将使用权限更大的各题目大量数据,进行模型调优提交最终测试结果、《调参文档》和完整的程序代码:

1)测试结果命名按赛题说明中的要求提交,格式为csv;

2)《调参文档》是由于数据量增大,针对模型的一些调参内容,提交的标准格式为PPT或PDF格式;

3)程序代码支持python和Java,具体要求见第三点规则;

4)三份材料放至同一文件夹并压缩,命名为“赛题+团队名称”,例如“模型挑战赛赛题一+团队1”,提交压缩文件。


三:评估环境要求

Python 环境

Python2.7.12

支持numpy, scipy, pandas, tensorflow1.4, tflearn, keras


操作系统:Ubuntu16

内存:128GB

GPU:Nvidia Quadro M4000 8G


Java环境

JDK1.8

操作系统:Ubuntu16

内存:128GB

GPU:Nvidia Quadro M4000 8G



现代社会,电成为每个人不可缺少的消费品。社会用电量变化有一定规律性,也能够在一定程度上反映区域经济发展情况。如能结合房地产投资、签约等房产数据,更精准地预测区域内电量变化,对发现经济运行的潜在规律、赋能经济发展有较大意义。


一:训练数据

某区域新房交易及土地交易数据;分类用户总用电量。

初赛:提供2016年1月-2018年6月每个月的数据。

决赛:提供2014年1月-2018年6月每个月的数据。

1. 新房项目销售数据:

ENT_SALES_COUNT_YYYY_MM

销售套数

 枚举值,单位:平方米

ENT__SALES_AREA_YYYY_MM

销售面积

 枚举值,单位:平方米

HOUSE_Application

房屋用途

枚举值,按照0-3表示:
  0:住宅、1:商业、3:其他

SALES_DATE

签约时间

枚举值,按照月度








2. 土地成交数据:

LAND_FLOOR­_AREA

出让面积

 枚举值,单位:平方米

LAND_GRANT_AREA

建筑面积

 枚举值,单位:平方米

LAND_PREMIUM

出让金额

枚举值,单位:万元

LAND_USE_TERM

土地性质

枚举值,按照0-3表示:

 0:商业、1:住宅、2、商住、3:其他

SIGN_DATE

约时间

枚举值,按照月度


3. 分类电量汇总:

序号

字段名称

1

时间(年月)

2

大工业用电(kWh)  

3

一般工商业用电及其他(kWh)  

4

农业用电(kWh)

5

居民用电 (kWh)



4. 参赛选手也可自行选择利用其他有关的公开数据,但应对数据及来源进行说明。


二:预测数据

预赛:预测该区域2018年7月至9月,每月总用电量。

(即:大工业、一般工商业及其他、农业、居民4类用电量之和)

决赛:预测该区域2018年7月至11月,每月各类用电(大工业、一般工商业及其他、农业、居民)的用电量。


三:任务描述

参赛选手从数据中自行组成特征和数据格式训练数据,建立预测算法模型(如有部分数据质量问题,请参赛者自行处理)。完成预测之后,需要同时提交算法模型及结果数据。数据提交格式及字段要求如下:

预赛:表名为:DIS_ECONOMY_Predict

时间

用电量

年.月

单位kWh(千瓦时)

决赛:表名为:DIS_ECONOMY_Predict

时间

用电类别

用电量(单位)

年.月

枚举值,按照0-4表示:
  0:大工业用电、1:一般工商业用电及其他、2:农业用电、3:居民用电

单位kWh(千瓦时)

将各参赛选手通过算法模型计算得出的结果与该区域实际电量数据比较,根据偏差情况排名。

实际电量数据由国网杭州供电公司提供。


估计指标


请至个人中心的赛题下载页面下载,登录账户