食品和安全检查:它们是否像人们想象的那样公平?

我一直对食品和安全行业感兴趣。 本身不是专业,而是更多地研究和分析不同的餐馆/咖啡馆及其对食品安全法规的总体遵守情况。 了解NYC字母等级系统的工作原理不仅很有趣,而且每个等级具有的标准以及有多少家餐厅违反了这些标准和规定绝对令人着迷。 经常阅读有关餐厅评级和违规情况的信息,找到描述餐厅结果的完整数据集不仅是使用数据集的有趣学习工具,而且通读起来也很有趣。 我花了无数个小时来阅读这些报告,但我对此没有任何遗憾。

当我想在python中使用数据集时,这是我想到的第一件事,因为我不仅可以在python上进行练习,而且可以阅读并发现越来越多的东西。关于此数据集的事情比我以前将其读取为原始数据要多。 这也使我有机会看到整个数据集中的任何趋势,因为使用python可以更轻松地按我希望的方式对数据进行分组。

首先,为了读取.json格式的实际数据文件,我从使用熊猫的命令开始。

一旦使用了熊猫,我就用它来读取.json文件,并最终将原始数据描述给我。 但是,在这里使用python确实很方便,因为一旦我描述了原始信息数据,便能够使用.groupby和.count代码来对特定变量或数据方面进行分组和计数。 在这里,我想根据美食描述来解决违规问题,因为一直以来都有这样的观念,即卫生检查员对中国餐馆有偏见。 为了对此进行检查,我使用了.value_counts代码,以展示每种美食描述收到了多少次违规。

由此,我还想分析一下这些中餐餐厅收到的违规类型。 为此,我将变量“ Chinese”设置为中餐的美食描述。 然后,我再次使用.value_counts来描述“中国”的违规情况,以了解在这些检查期间对中国餐馆最常见的违规情况。 之后,我使用了相同的代码,但是这次添加了“。 plot(kind =“ bar”)”” ,以便在条形图中可视化此数据。

从中我们可以看出,最常见的违规行为是非食品表面的不正确构造,尽管这不是很关键,但如果不注意,最终可能会降低该餐厅的档次。

在这里,我们可以清楚地看到,中国食品餐馆在纽约市的违规计数第二高,这可能导致人们对特定群体的偏见产生更多疑问。 在这里,我了解了在检查诸如餐厅检查结果之类的重要数据时,了解python和pandas的重要性,因为它们不仅使您能够查看自己喜欢的当地餐厅的等级,而且更重要的是,它可以用作寻找差异的工具,否则这些差异将不会被实现并引起质疑。