起因
今天在东一一楼烧腊窗口恰饭,我点的是鸡排饭,然后我没说要啥汁,那个姐姐(感觉叫阿姨不太对:0)直接说:番茄是吧。我:?,我挺疑惑的,然后在她把饭递给我的时候问了句:你知道的?她:经常吃啊(笑)。
想了下好像也没有经常吃吧,虽然之前高中也有过类似的经历,那是因为吃拉面不要香菜、热干面不要葱、炒面炒粉不要葱,然后天天吃就被老板记住了。
很有趣的一次是吃热干面,老板没抬头看,就调好葱姜蒜芝麻酱准备递给我,然后看到我,说:哎呀,你不要葱,这碗给后面的同学,重新给你下一碗 2333。
扯远了,因为挺好奇的,于是就打算把今年这一年的吃饭记录都爬下来康康,我这一年都吃的是啥?
数据获取
从 校园卡服务平台 可以查到流水,开始我以为所谓的“导出所有”是把所有记录导出,结果跟“导出当前页流水”是一样的。
所以直接用 Python 写了个爬虫直接把今年(2019)所有月份数据都爬下来,去掉多余的信息,仅保存 时间、价格、食堂 这三项数据,然后存为 CSV 文件。
- 过程:
- 结果:
数据分析
所以这一年到底吃了啥?下面就见分晓!
首先将这些 csv 文件合并,使用 pandas
库很简单,下面就是:
1 | def merge_all_files(): |
截止到今天,每个月使用一卡通的消费次数(包括超市和自动售卖机):
1 | {1: 95, 2: 50, 3: 142, 4: 121, 5: 131, 6: 111, 7: 104, 8: 138, 9: 150, 10: 102, 11: 125, 12: 104} |
各个食堂窗口的食用情况(指的是刷卡次数,吃个晚饭可能会刷几次卡)TOP10
1 | 集贤楼食堂红案: 249 |
各个食堂的食用情况
1 | {'东一': 581, '集贤楼': 575, '自助售货机': 9, '西一': 139, '百品屋': 8, '集锦园': 4, '校园网': 6, '图书馆': 1, '东学超市': 3, '东三': 27, '紫荆园': 4, '百景': 12, '喻园': 4} |