![](https://cos-cdn.shuashuati.com/pipixue-web/2020-1231-2005-12/ti_inject-812ce.png)
考虑下表的数据集。 顾客 ID 性别 车型 衬衣尺码 类 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 男 男 男 男 男 男 女 女 女 女 男 男 男 男 女 女 女 女 女 女 家用 运动 运动 运动 运动 运动 运动 运动 运动 豪华 家用 家用 家用 豪华 豪华 豪华 豪华 豪华 豪华 豪华 小 中 中 大 加大 加大 小 小 中 大 大 加大 中 加大 小 小 中 中 中 大 C0 C0 C0 C0 C0 C0 C0 C0 C0 C0 C1 C1 C1 C1 C1 C1 C1 C1 C1 C1 ( 1 )计算整个数据集的 Gini 指标值。 ( 2 )计算属性性别的 Gini 指标值 ( 3 )计算使用多路划分属性车型的 Gini 指标值 ( 4 )计算使用多路划分属性衬衣尺码的 Gini 指标值 ( 5 )下面哪个属性更好,性别、车型还是衬衣尺码?为什么?