2021年美国大学生数学建模竞赛C题思路分析
下载链接
2021美赛题目下载:链接:https://pan.baidu.com/s/1yFdg3vBMS4MY7CnQ3PMG9Q
提取码:6666
2021立方米
问题C:确认黄蜂的嗡嗡声
在2019年9月,在加拿大不列颠哥伦比亚省温哥华岛发现了一群(又称亚洲巨型马蜂。
巢迅速被摧毁,但事件的消息迅速传遍了整个地区。自那时以来,在邻近的华盛顿州
发生了几起确认的害虫目击事件,以及大量的错误目击事件。有关探测图、马蜂手表
和公众视线,请参见下面的图1。
图1:描绘亚洲巨蜂探测的地图,以及大黄蜂观察和公共地点。
马蜂是世界上最大的马蜂种,巢的发生令人震惊。此外,巨蜂是欧洲蜜蜂的捕食者,入侵和摧毁它们的巢穴。少数大黄蜂能够在短时间内摧毁整个欧洲蜜蜂群。同时,它们是其他昆虫的贪婪捕食者,被认为是农业害虫。这种马蜂的生命周期与许多其他黄蜂相似。受精的蜂王在春天出现,开始了一个新的殖民地。秋天,新王后离开巢穴,将在土壤中度过冬天,等待春天。一位新女王的范围估计为30公里,以建立她的巢穴。关于亚洲大黄蜂的更详细信息包括在问题附件中,也可以在网上找到。由于对当地蜜蜂种群的潜在严重影响,的存在会引起大量的焦虑。华盛顿州建立了热线和一个网站,供人们报告看到这些大黄蜂的情况。根据这些来自公众的报告,国家必须决定如何优先考虑其有限的资源,以跟进更多的调查。虽然一些报道被确定为虫,但许多其他目击事件被证明是其他类型的昆虫。这个问题的主要问题是“我们如何解释公共报告提供的数据?”和“在政府机构资源有限的情况下,我们可以使用什么策略来优先考虑这些公共报告进行额外的调查?”你的论文应该探讨和解决以下几个方面:
- 处理和讨论是否可以预测这种害虫随着时间的推移而传播,以及具有什么样的精度。
- 大多数报道的目击事件都把其他黄蜂误认为是马蜂侠。只使用提供的数据集文件和(可能)提供的图像文件来创建、分析和讨论预测错误分类可能性的模型。
- 使用您的模型来讨论您的分类分析如何导致优先调查报告最有可能是积极的发现。
- 解决如何更新您的模型,给定更多的新报告随着时间的推移,以及更新应该发生的频率。
- 使用你的模型,什么将构成证据表明害虫已经在华盛顿州被根除?最后,你的报告应该包括一个两页的备忘录,总结你的结果给华盛顿州农业部。您的PDF解决方案不超过25页,应包括:
- 一页汇总表。
- 目录。
- 你的解决方案。
- 两页备忘录。
- 参考资料清单。
注:MCM比赛现在有25页的限制。您提交的所有方面都计算到25页的限制(摘要表、目录、参考列表和任何附录)。
您不应使用未经授权的图像和材料,其使用受到版权法的限制。确保你引用你的想法的来源和你的报告中使用的材料。问题C的一般准则除了上面列出的具体要求外,请记住这是一个统计建模练习。提交的材料应遵守与使用数据有关的最佳做法。这些期望的一些例子包括但不限于以下方面:- 定义您使用的所有度量和成本函数。
- 参数的任何估计都应包括区间估计。
- 任何结果都应包括对结果的拟合优度的估计。
- 所有假设都应明确说明,特别是与数据或错误相关的分布。
- 应检查与数据有关的所有假设,并检查技术对这些假设的稳健性。
- 与一种方法或技术有关的所有假设都应清楚地说明。附件我们为这个问题提供以下四种材料。提供的数据文件包含您应该用于此问题的唯一数据。
- 2021MCM_ProblemC_Vespamandarinia.pdf
来自宾夕法尼亚州立大学分校的背景信息,描述了这种昆虫。 - 2021MCM_ProblemC_DataSet.xlsx
具有以下字段的4440个目击报告的电子表格:
全局ID:每个观察记录的唯一标签。
探测日期:探测的报告日期。
注:报告提交人提供的意见。这可以是公众的成员,也可以偶尔是州雇员。实验室状况:由国家农业部分析后对视力进行官方分类。阳性ID意味着它被确认为亚洲巨蜂。否定ID意味着它被排除在外。未处理意味着它尚未被分类。未经核实意味着由于缺乏信息,没有作出任何决定。
实验室点评:州昆虫学实验室分析后添加到记录中的内容。
提交日期:向国家提交报告的日期。此日期可以在检测日期之后显著。
纬度(optioning):这些数据在转换报告提供的地址后由国家提供。
经度(视线):这些数据是由国家在转换报告提供的地址后提供的。 - 2021MCM_ProblemC_Files.rar
一个带有3305张图片的rar文件,与目击报告一起提交。
可从:下载662MB文件:
http://www.comapmath.com/MCMICM/2021MCM_ProblemC_Files.rar 打
开文件需要一个密码:Af6SP7rdm33PxPJmDb4wZq7cw - 2021MCM ProblemC_Images_by_GlobalID.xlsx
用以下字段将图像映射到瞄准镜的电子表格:
文件名:rar文件夹中图像的名称。
全局ID:每个观察记录的唯一标签。这在两个电子表格中是一致的。
文件类型:图像以.jpg、.pdf、.png、.jfif、八进制流、xml打开格式或.zip
文件的形式到达。视频以.mp4或快速时间文件的形式到达。
参考资料 - 华盛顿州农业部。2020亚洲巨型大黄蜂公共仪表板。
https://agr.wa.gov/departments/insects-pests-andweeds/
insects/hornets/data访问11/5/2020。思路分析
问题中心:对excel数据进行时空预测、对图片数据进行黄蜂分类,需要深度学习基础(个人感觉传统模型对预测、分类结果的真确率、召回率、解释性说服力不强,但仍然可以建模)。
简要思路:大数据问题,首先花时间了解附件数据,探索性分析,通过简单的拟合预测性的给出模型的建立方向以及答案。
个人的习惯是大数据问题第四章单独写数据清洗,具体流程看群中研究生数模的国奖论文。
首先要分析三个附件,提取有用的变量、删除字段缺失的数据条、分类变量归一化等,进一步处理等待更新。
(1)预测模型
讨论分析大黄蜂的出现量随时间的变化、创新点:考虑空间分布的差异。
(2)分类模型
训练图像分类模型,模型需要构建深度学习框架,对有深度学习基础的同学来讲并不难,给出常用的建模指标即可求解,创新点在于分析召回率、正确率等的空间特性。
(3)模型评价
预测(LSTM、RNN、ARIMA、MLR、SVR)、分类(CNN、SVM、决策树)的结果是否有利于总结建设性建议,如何提升结果对建议的有效性?
(4)模型优化
解释模型的更新机制、复杂度、时效性、不同区域的适用性等。
(5)建议方案
给出黄蜂数量减少至认定的安全范围的证据
该问题相对较难,大数据问题虽有吸引力,但因为文本数据门槛较关键,对于没有数据分析高阶经验的同学可能难以做出成果,慎重考虑。
- 点赞
- 收藏
- 关注作者
评论(0)