健康保险
预测健康保险将涵盖的医疗费用(收费)的项目
链接到数据集( )
目的
建立机器学习模型以预测由保险公司支付的费用(作为费用),作为健康保险的保障范围。
评估指标:RSq
该解决方案包含七个线性模型。 发现吸烟者的受益人为保险公司支付了大量医疗费用。 对于吸烟者,BMI与收费量(正)密切相关。 随着BMI的增加,医疗费用也随之增加。
多项式特征和特征相互作用
仅使用原始功能不足以预测收费金额。 结果,年龄和吸烟者=“ Y”以及BMI和吸烟者=“ Y”之间的相互作用。 作为基准,RSq。 对所有七个模型而言,大约是测试集的75%。 功能交互改善了RSq。 (模型解释的方差量)在79-80%之间。作为一种最终技术,添加了年龄和BMI或受益人的二阶多项式作为特征。 这使RSq稍微增加了约0.03%。
其他改善技术
由于数据集很小,因此可以使用诸如决策树和随机森林之类的非线性模型
如果
1