我拼命想要下载Ta-Feng杂货数据集几天,但似乎所有链接都被破坏了.我需要为我的msc论文进行数据挖掘/机器学习研究.我还有微软杂货数据库,比利时商店和Weka的Supermarket.arff.然而在研究中他们说Ta Feng是所有公共数据集中最大和最有趣的.
http://recsyswiki.com/wiki/Grocery_shopping_datasets
我会非常感谢任何帮助:)干杯!
投票的人不理解为超市场景相关的机器学习找到这条有价值的信息的难度.这是最大的公开数据集,包含了大丰超市4个月的购物交易.我是从春南教授那里得到的,他非常友好地把它送给我,因为他以前在台湾的研究所的服务器不再支持它了.以下是每个需要它的人的链接:https://sites.google.com/site/dataminingcourse2009/spring2016/annoucement2016/assignment3/D11-02.ZIP
如果使用此"Ta Feng"数据集的任何人在列名称时都会遇到重大问题.所以我想分享这个.希望这会极大地帮助某人.
它包含这些文件
D11:2000年11月收集的交易数据
D12:2000年12月收集的交易数据
D01:2001年1月收集的交易数据
D02:2001年2月收集的交易数据
交易数据的格式
第一行:繁体中文的列定义
第二行和其余部分:数据列以";"分隔
列定义
交易日期和时间(时间无效且无用)
顾客ID
年龄:10个可能的值,
A <25,B 25-29,C 30-34,D 35-39,E 40-44,F 45-49,G 50-54,H 55-59,I 60-64,J> 65
居住面积:8个可能值,AF:邮编区域:105,106,110,114,115,221,G:其他,H:未知距离商店,距离最近:115,221,114,105,106,110
产品子类
产品编号
量
财富
销售价格