数学建模备赛
写在前面一套完整的建模题通常包括以下部分1.问题分析题目问什么数据给了什么限制条件是什么2.模型假设为了简化问题需要合理假设哪些条件3.符号说明把变量参数指标定义清楚4.模型建立选择数学方法比如评价预测优化分类仿真等5.模型求解用Python、MATLAB得到结果6.结果分析解释结果是否合理7.灵敏度分析/误差分析说明模型稳定性8.模型评价与改进写优缺点9.论文摘要与正文排版把整个过程写成竞赛论文1.一套题应该怎样拆解首先明确数学建模到底在考什么它靠的是能不能完成下面的这个流程现实问题-提炼关键因素-建立数学模型-编程求解-分析结果-写一篇逻辑完整的论文所以拿到一套题的时候应该先问这个题到底需要我解决什么问题输入是什么输出是什么中间需要建立哪些关系如何读题第一遍先读背景了解这是哪个现实场景的问题第二遍圈出题目真正问了什么把每一个问题翻译为“建模语言”题目问法建模语言哪个方案最好综合评价 / 排序问题未来几年会怎样预测问题如何安排资源最合理优化问题哪些因素影响最大敏感性分析 / 相关性分析如何分类管理聚类 / 分类问题某过程如何随时间变化动态模型 / 微分方程 / 仿真第三遍找输入、输出和约束将题目变成可以求解的问题拆题模版1.用一句话概括题目背景例如本题研究的是新能源汽车电池状态评估与寿命预测问题这一句话可以直接写进论文的“问题重述”2.分析题目给了哪些数据一种是表格数据Excel文件CSV文件一种是文字条件题目里描述的规则、限制、要求看到文字等级类指标要想到需要先量化。要把数据分成几类时间数据年份、月份、小时空间数据经纬度、距离、区域指标数据成本、销量、能耗、人口、温度状态数据是否故障、是否拥堵、是否达标约束数据容量上限、时间限制、预算限制这一步对应后面的数据预处理。3.弄明白每一问属于什么类型这是建模最关键的一步问题类型常见关键词常用模型评价类最优、排名、综合评价、优劣AHP、熵权法、TOPSIS、灰色关联预测类未来、趋势、预测、估计回归、时间序列、灰色预测、机器学习优化类最小成本、最大收益、最佳方案线性规划、整数规划、遗传算法、粒子群分类类分类、分级、识别、聚类K-means、SVM、随机森林机理类变化规律、传播过程、动态演化微分方程、仿真模型、状态空间模型4.弄明白每一问之间是什么关系很多模型不是三个孤立的问题而是层层递进常见的结构有三种第一种评价-预测-优化这是最常见的结构第二种建模-求解-改进这种题目通常适合写得比较完整第三种分析-分类-决策这种题目适合于社会、经济、管理类问题2.模型分析方法1.第一个常用模型综合评价模型熵权法TOPSIS综合评价最核心的两个问题1不同指标的量纲不一样要如何比较所以第一步要做的就是指标标准化也就是把所有指标变成统一的尺度例如都变成0到1之间的数。2每个指标的主要程度一样吗答案是否定的所以我们需要给每一个指标分配一个权重。权重越大表示这个指标对最终评价影响越大。而第二个问题就引出了熵权法。1.熵权法根据数据本身的差异程度自动计算每个指标的权重。一个指标的数据差异越大它能够提供的信息就越多而一个指标的数据差异越小它提供的信息就越少。他的核心思想就是差异越大权重越大差异越小权重越小熵权法适用于题目给了一堆数据但是没有明确告知每个指标的重要程度。当然也具有优点和缺点所以在实际比赛中熵权法经常和其他方法结合使用优点解释客观不依赖个人主观判断操作简单有固定计算流程适合表格数据对 Excel/CSV 数据很友好论文好写很多建模论文都会用缺点解释只看数据差异不一定符合现实重要性容易忽略专业经验某些指标虽然差异小但现实中可能很关键对异常值敏感极端数据可能影响权重2.TOPSIS逼近理想排序法核心思想TOPSIS会构造两个虚拟对象一个叫“最优理想方案”它在所有指标上面都最好第二个叫“最差理想方案”它在所有的指标上表现都最差一个好方案应该满足离最优方案越近越好离最差方案越远越好。核心判断逻辑越接近理想最优越远离理想最差综合表现越好。3.为什么使用这两种方法的结合因为它们分工明确。方法解决的问题熵权法计算每个指标的权重TOPSIS根据权重计算每个对象的综合得分和排名完整流程就是原始数据↓指标标准化↓熵权法计算权重↓TOPSIS 计算接近程度↓得分排序↓得出评价结果所以在论文里可以写本文首先构建评价指标体系并对原始数据进行无量纲化处理随后采用熵权法确定各指标的客观权重最后利用 TOPSIS 方法计算各候选方案与理想方案的相对接近度从而得到综合评价排序。4.使用步骤介绍了方法理论我们接下来详解一下该怎么使用首先明确指标分为两种正向指标越大越好负向指标越小越好当然还存在一种适度型指标这个既不是越大越好也不是越小越好后续再详讲。第二步进行指标标准化将他们都转换到0到1之间对于正向指标常用方法是当前值越接近最大值标准化结果越接近 1当前值越接近最小值标准化结果越接近 0。公式是对于负向指标方向反过来当前值越小越好所以最小值应该变成 1最大值应该变成 0。公式是第三步用熵权法计算权重第四步用TOPSIS计算综合得分TOPSIS会计算每个地点与“最优方案”和“最差方案”距离最后得到一个叫“相对接近度”的值一般在0到1之间越接近1什么越接近理想方案5.这类模型在论文中应该怎么写1. 问题分析充电站选址受到人口密度、交通流量、建设成本和电网接入条件等多种因素影响属于典型的多指标综合评价问题。由于各指标量纲和属性不同需先对指标进行标准化处理同时不同指标对选址结果的影响程度不同因此需要确定指标权重。本文采用熵权法计算指标客观权重并结合 TOPSIS 方法对各候选地点进行综合评价和排序。2. 模型建立首先构建由人口密度、交通流量、建设成本和电网接入条件组成的评价指标体系。其中人口密度、交通流量和电网接入条件为正向指标建设成本为负向指标。对原始数据进行无量纲化处理后采用熵权法计算各指标权重并利用 TOPSIS 方法计算各候选地点与正理想解和负理想解之间的距离最终得到各候选地点的相对接近度。3. 结果分析由综合评价结果可知A 地点的相对接近度最高说明其综合条件最接近理想建设地点适合作为优先建设对象。B 地点虽然交通流量和电网条件表现较好但建设成本相对较高因此综合得分略低于 A。C 地点人口密度较高但建设成本和电网条件表现较差综合排名最低。2.数据处理方法1.从原始数据表到标准化矩阵后面用“熵权法”、TOPSIS回归、聚类、机器学习等第一步几乎都绕不开把题目中的原始数据整理成一个可以计算的数据矩阵所以今天的这节课可以理解为数学建模里的数据整理入门课。在数学建模中我们需要把表格变成计算机能处理的形式也就是将表格写成一个矩阵而这个矩阵叫做原始数据矩阵这个矩阵中的每一行代表一个评价对象而每一列代表一个评价指标。上节课我们学到不同的指标单位和含义不一样所以不能直接用原始数据进行计算而要进行指标标准化也叫无量纲处理通过上次学到的公式先将指标划分为正向指标与负向指标然后使用标准化公式计算得到一个标准化矩阵现在所有的指标都有了一个统一的含义数值越大说明这个学生在该指标上表现得越好。论文表达由于各评价指标的量纲、数量级和属性方向存在差异直接使用原始数据进行综合评价会导致结果偏差。因此本文首先对原始指标数据进行无量纲化处理。对于课程成绩、论文数量、竞赛得分和志愿服务时长等正向指标采用极差标准化方法进行处理对于违纪次数等负向指标采用反向极差标准化方法进行处理。经过标准化后所有指标均转化为数值越大表示表现越优的同向指标为后续权重计算和综合评价奠定基础。2.熵权法计算指标权重熵权法一般分为五步标准化矩阵-计算指标比重-计算信息熵-计算差异系数-计算权重上一步完成了标准化矩阵的计算接下来要用熵权法来判断每个部分的权重了。熵权法不是直接用标准化值而是先把每一列转换成“占比”公式如下这个公式的意思是在第j个指标下第i个对象占这一列总量比例是多少。也可以理解为某个对象在某个指标中的“贡献比例”。经过这个公式计算后就能得到一个比重矩阵这个矩阵的每一列加起来都等于1。接下来计算信息熵信息熵 用来衡量第 j个指标内部的数据分布是否均匀。信息熵含义权重倾向熵越大数据越平均区分度越弱权重越小熵越小数据差异越大区分度越强权重越大如果一个对象在该指标下没有贡献即因此这一项对熵的贡献记为 0。以后写代码时也要特别处理这个问题。接下来计算差异系数差异系数公式是他的意思是信息熵越小差异系数越大权重越大·信息熵越大差异系数越小权重越小。接下来就是最后一步计算权重了熵权法在论文中怎么写为避免主观赋权对评价结果产生影响本文采用熵权法确定各指标的客观权重。首先将标准化后的指标矩阵转化为比重矩阵计算各评价对象在不同指标下的相对贡献随后根据信息熵公式计算各指标的信息熵。若某一指标在不同评价对象间差异较大则其信息熵较小说明该指标提供的信息量较大应赋予较高权重反之若某一指标取值较为接近则其信息熵较大区分能力较弱权重较低。最终根据差异系数归一化得到各指标权重。3.TOPSIS综合评价与排序TOPSIS——逼近理想解排序法它会构造两个虚拟方案1.正理想解每个指标都表现最好的方案正理想解可以理解为每一列的最大值。2.负理想解每个指标都表现最差的方案负理想解可以理解为每一列的最小值。TOPSIS判断一个方案好不好就看它离正理想解有多近离负理想解有多远。应该好的方案应该离最好的方案越近越好离最差的方案越远越好。这里需要解答一个问题为什么不直接使用每一行乘权重求和这当然也可以但是TOPSIS更强调一个方案在多指标空间中是否接近整体最优状态。这两种方法有时结果相近但TOPSIS在综合评价论文中更加常见也更有“模型感”。计算流程标准化矩阵-构造加权标准化矩阵-确定正理想和负理想解-计算每个方案到正负理想解的距离-计算相对接近度并排序。1标准化矩阵前面已经介绍过了2构造加权标准化矩阵加权标准化矩阵的意思是每个标准化后的指标值都乘以这个指标对应的权重。3计算每个地点到正理想解的距离TOPSIS通常采用的是欧氏距离可以理解为“空间中的直线距离”4计算每个地点到负理想解的距离5计算相对接近度TOPSIS最后的综合得分叫“相对接近度”经过以上的步骤我们就走完了TOPSIS的全过程。在论文中可以这样写在得到各指标权重后本文采用 TOPSIS 方法对各候选地点进行综合排序。首先将标准化矩阵与指标权重相乘得到加权标准化矩阵随后分别确定各指标下的正理想解和负理想解。由于所有指标已统一转化为正向指标因此正理想解由各指标最大值组成负理想解由各指标最小值组成。进一步计算各候选地点到正、负理想解的欧氏距离并根据相对接近度公式得到综合评价得分。相对接近度越大说明该候选地点越接近理想建设方案其建设优先级越高。4.适度性指标如何处理其中x表示当前候选点到已有充电站的距离表示理想距离比如3km根据上面的公式就能计算出这种适度性指标的权重越接近理想值得分越高。用“两两比较法”确定指标的重要性.