0%

“大数据” | 我到底在华科吃了些啥

起因

今天在东一一楼烧腊窗口恰饭,我点的是鸡排饭,然后我没说要啥汁,那个姐姐(感觉叫阿姨不太对:0)直接说:番茄是吧。我:?,我挺疑惑的,然后在她把饭递给我的时候问了句:你知道的?她:经常吃啊(笑)。

想了下好像也没有经常吃吧,虽然之前高中也有过类似的经历,那是因为吃拉面不要香菜、热干面不要葱、炒面炒粉不要葱,然后天天吃就被老板记住了。

很有趣的一次是吃热干面,老板没抬头看,就调好葱姜蒜芝麻酱准备递给我,然后看到我,说:哎呀,你不要葱,这碗给后面的同学,重新给你下一碗 2333。

扯远了,因为挺好奇的,于是就打算把今年这一年的吃饭记录都爬下来康康,我这一年都吃的是啥?

数据获取

校园卡服务平台 可以查到流水,开始我以为所谓的“导出所有”是把所有记录导出,结果跟“导出当前页流水”是一样的。

所以直接用 Python 写了个爬虫直接把今年(2019)所有月份数据都爬下来,去掉多余的信息,仅保存 时间价格食堂 这三项数据,然后存为 CSV 文件。

  • 过程:

  • 结果:

数据分析

所以这一年到底吃了啥?下面就见分晓!

首先将这些 csv 文件合并,使用 pandas 库很简单,下面就是:

1
2
3
4
def merge_all_files():
files = glob.glob("csv/*.csv")
df = pd.concat([pd.read_csv(file) for file in files])
df.to_csv("csv/2019.csv", index=False, encoding='utf-8-sig')

截止到今天,每个月使用一卡通的消费次数(包括超市和自动售卖机):

1
{1: 95, 2: 50, 3: 142, 4: 121, 5: 131, 6: 111, 7: 104, 8: 138, 9: 150, 10: 102, 11: 125, 12: 104}

各个食堂窗口的食用情况(指的是刷卡次数,吃个晚饭可能会刷几次卡)TOP10

1
2
3
4
5
6
7
8
9
10
集贤楼食堂红案: 249
集贤楼蒸菜净荤组: 123
东一二楼特色菜品: 108
集贤楼食堂商店: 99
东一二楼华科速7: 84
东一一楼蒸点稀食: 81
东一二楼湘味小钵: 70
东一一楼烧腊饭: 68
东一二楼大众菜(一): 66
集贤楼食堂煎烙: 65

各个食堂的食用情况

1
{'东一': 581, '集贤楼': 575, '自助售货机': 9, '西一': 139, '百品屋': 8, '集锦园': 4, '校园网': 6, '图书馆': 1, '东学超市': 3, '东三': 27, '紫荆园': 4, '百景': 12, '喻园': 4}

Welcome to my other publishing channels