数学建模2006年获全国一等奖论文B.doc
《数学建模2006年获全国一等奖论文B.doc》由会员分享,可在线阅读,更多相关《数学建模2006年获全国一等奖论文B.doc(22页珍藏版)》请在三一文库上搜索。
1、2006高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置
2、报名号的话): B甲1304 所属学校(请填写完整的全名): 山东理工大学 参赛队员 (打印并签名) :1. 周利庭 2. 张洪雷 3. 杨丽娜 指导教师或指导教师组负责人 (打印并签名): 丁树江 日期: 2006 年 9 月 18 日赛区评阅编号(由赛区组委会评阅前进行编号):2006高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): 艾滋病疗法的评价及疗效的预测摘要 本文利用美国艾滋病医疗试验机构ACTG公布的
3、ACTG320和193A数据,在合理的假设基础上,通过线性插值拟合均匀的模拟出每个被调查者每周身体中CD4细胞计数和HIV浓度,对所有的被调查者每周的CD4细胞计数和HIV浓度求平均值,这样可以得到一个关于该疗法的从时间序列角度来说较为完全的数据。用SPSS模拟出最优曲线,得出该疗法对人体CD4细胞计数影响近似为三次曲线,而对人体HIV浓度的影响在四十周以前与四十周以后可以分别用S曲线和三次曲线较好的模拟,从而可以更好的预测未来疗效。由于现行实验室艾滋病入选标准为CD4细胞计数,所以我们根据CD4细胞计数的拟合曲线,参考HIV拟合曲线,得出应该在二十七周左右终止该疗法。针对问题二中被随机分组的
4、1300多名被调查者分别服用不同的药物组合的跟随检测数据,沿用问题一的数据处理方法,用均匀插值填充从第零周到最后一周的数据,得到四种疗法被调查者每周的CD4细胞计数时间序列数据,计算出使用各种疗法的所有被调查者在每个周次的CD4细胞计数的均值,合出较优的针对经过用SPSS多次模拟,拟每种疗法的模型,继而可用此模型分别预测每种疗法继续使用的疗效。由于这些数据是在随机分组的人群中获得的,所以我们假设这些样本是独立的,这样我们就可以采用统计学中的多个独立样本的非参数检验法,利用SPSS11.5软件中的多个独立样本比较秩和检验功能完成,运用Kruskal-Wallis H Test和中位数检验法在统计
5、学意义上给出每种疗法的相对疗效大小。在仅以CD4细胞计数为标准下,该四种疗法的疗效为:疗法四最好,疗法三次之,疗法二较差,疗法一最差。服用疗法三的患者应该在二十五周左右停药,而服用疗法四的最好在十九周左右停止用该种药。作为问题二的延伸,考虑不同疗法对不同年龄的艾滋病患者有不同的疗效,将年龄分为三组来找出不同年龄段的最佳治疗方法。同上运用SPSS中的Kruskal-Wallis H Test和中位数检验法给出了适合于不同年龄段的最优疗法:第一个年龄段(1525岁)疗法1第二个年龄段(2540岁)疗法3第三个年龄段(40岁以后)疗法4如果患者还要考虑治疗费用,这样就有费用和疗效两个因素影响最优疗法
6、的选择问题。我们给出了多准则决策方法层次分析法对四种疗法的价格和疗效进行了定量的综合评价。得出对于不发达国家和地区,疗法一优于其余三种方法。运用疗法一的模型四(同时参考人民网、搜狐网、安徽新闻网等多家权威网站的消息的只要CD4细胞计数能够维持在350/ul就不应该停用药这一原则),用计算机模拟出用疗法一的最佳终止此疗法时间是在三十四周左右。关键词SPSS11.5 非线性曲线拟合 线性插值 层次分析法 非参数检验一 问题重述1、 背景本题目来源于世界人们都很关注的艾滋病的治疗问题。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文
7、简称HIV)引起的。艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。医学入选标准临床主要依靠体格检查和病史,实验室标准(CD4200/mm3),则主要依靠CD4细胞计数,如果无法进行CD4检测,也可检测总淋巴细胞计数(TCL1200/mm3)。CD4细胞计数优于总淋巴细胞计数,如果条件允许应尽可能采用CD4细胞计数。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地
8、降低CD4减少的速度,以提高人体免疫能力。然而,迄今为止,只有几种公认的能够抑制和延缓其病程的药外,尚无治愈艾滋病的特效药物。目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。2、问题现有美国艾滋病医疗试验机构ACTG公布的两组数据。第一组数据是300多名病人同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir(茚地那韦)每隔几周测试的CD4细胞计数和HIV浓度(每血液里的数量);第二组是是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(具体
9、数据见附件1和附件2;数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:600mg zidovudine或400mg didanosine(去羟基苷),这两种药按月轮换使用;600 mg zidovudine加2.25 mg zalcitabine(扎西他滨);600 mg zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。现需解决以下三个问题:(1)、利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。(2)、利用附件2的数据,评价4种疗
10、法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)、如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变?(艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元)二 基本假设通过对该问题的分析,我们认为,题目给出的部分数据是不具备参考价值的。由于检测的时间比较长,经过统计,大部分被调查者都可以做四到五次检测,而题目给出的数据
11、有很多被调查者只做了一次检测,还有一部分缺省值,在此我们考虑可以将这一部分数据剔除,而不会影响总的结果。对此,我们做出如下一些合理的假设:1、 假设所有的数据都是可靠的,不包括人为造成的不合理因素。2、 假设数据中的奇异数据和缺省值忽略后对总体信息不会有显著的影响。3、 假设在两次相邻的测试时间段内,病人血液中CD4和HIV的含量是均匀变化的。4、 假设在问题二中我们认为随机分成的四组被调查者的CD4细胞计数的四组数据样本是分别独立的。三 参数设置为了叙述的方便,我们把题目中所用的变量用下列参数来代替:问题一中的CD4细胞计数;(个/ul):问题一中的HIV浓度:(单位不详):问题一中的周次数
12、:问题二中的按疗法一治疗的患者的CD4细胞计数;(个/ul):问题二中的按疗法二治疗的患者的CD4细胞计数;(个/ul):问题二中的按疗法三治疗的患者的CD4细胞计数;(个/ul):问题二中的按疗法四治疗的患者的CD4细胞计数;(个/ul)四 问题分析1、 问题1的分析我们仔细研究过附件一的数据之后,发现在三百多名被检测者近一年的检测数据中,由于是抽样检测的数据,存在不连续的特点,且从周次的角度来看,检测的次数过少,不适合做进一步的预测,于是用线性插值拟合,来均匀的模拟出每个被调查者每周身体中CD4细胞计数和HIV的浓度(具体的数据见附件excel表),在此我们假设被调查者体中CD4和HIV的
13、浓度是均匀变化的,在对所有被调查者的CD4和HIV每周的含量求平均值。另外,由于某些客观原因使得部分数据失真或没有统计的信息价值,如存在-2、-1周的数据、某些被调查者只有一次检验数据等,我们统计了将近5%的无信息价值的数据,在此我们决定舍去这些数据。最后,用VC+做线性拟合(具体程序见附录),将差值补起。然后计算出每周的所有的被调查者的CD4和HIV的浓度的平均值,这样我们可以得到一个关于该疗法的从时间序列角度来说较为完全的数据。最后,做出均值散点图,用SPSS做出最优的模型模拟曲线,得出该疗法对人体CD4细胞计数影响近似三次曲线,而对人体HIV的浓度影响可以综合利用S曲线和三次曲线较好的模
14、拟。2、 问题二的分析问题二是针对1300多名被调查者随机分四组分别服用不同药物组合的四十周跟随检测疗效。经过研究附件二的数据,考虑到给出的数据是比较散乱的,沿用问题一的思想,我们认为该数据同样存在不连续,且从检测次数的角度来说,数据的完备性不足,不宜预测。为此,我们用同样的方法作数据处理,用线性插值填充从第零周到最后一周的数据,同样在这里我们假设在治疗期间的变化是均匀的。这样我们就能得到四种疗法的每周的时间序列数据,从而计算出所有被调查者每周的平均值,用SPSS经过多次模拟,拟合出较优的针对每种疗法的模型,即可用此模型分别预测每种疗法继续使用的疗效。由于这些数据是在随机分组的人群中获得的,所
15、以我们假设这些数据样本是独立的,这样我们就可以采用统计学中的多个独立样本的非参数检验法,对这四个数据样本进行比较,在此我们利用SPSS11.5软件中的多个独立样本比较秩和检验功能完成,具体包括中位数检验法和Kruskal-Wallis H Test,并在统计学意义上给出每种疗法的相对疗效大小分析。同时我们根据附件二的数据也给出了有关不同年龄段与疗法及治疗时间的可能关系。3、 问题三的分析问题三是在问题二的基础上,进一步考虑到不发达国家一些患者要考虑治疗费用问题,这样除了要考虑艾滋病本身的医学指标(CD4细胞计数)外,还要考虑费用问题,即主要有CD4细胞计数和费用这两个因素影响四种疗法疗效的综合
16、评价问题。在此我们用到了美国运筹学家T. L. Saaty 教授于70年代初期提出的一种简便、灵活而又实用的多准则决策方法-层次分析法(Analytic Hierarchy Process,简称AHP)。目标层是针对不发达国家的最佳治疗方案,准则层包含了CD4细胞计数和费用含量两个元素,在决策层将4种治疗方法作为4个元素来考虑。这样便建立了递阶层次结构,然后建立判断矩阵进行分析,得到针对不发达国家的最优治疗方案。五 模型的构建与求解1、 数据线性插值模型 将原355名患者的CD4计数和HIV浓度数据中的奇异数据和缺升值剔除后,按顺序从1到重新编号为(1) 参数假设 :剔除缺升值和奇异数据之后患
17、者的人数;: 第名患者 ();:第名患者最后一次检测的周次;:第名患者检测的总次数; :第名患者第次检测时CD4的细胞计数;:第名患者第次检测的周次;:第名患者第周的插值数据(CD4细胞计数);(2) 线性插值模型建立我们假设第周位于第次与第次间,建立线性插值模型如下: 模型一: ,2、 问题一模型的构建(1)、通过前述分析思路,先计算出每周所有被检测者的CD4和HIV的平均含量(见附录excel表),在用SPSS模拟CD4细胞计数变化的最优拟合曲线的方程为: 摸型二:我们用SPSS模拟的曲线拟合图,从直观上和统计检验指标上,可以看出拟合及预测的效果较为理想。检验统计量指标如下:拟合优度: R
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 2006 全国 一等奖 论文
链接地址:https://www.31doc.com/p-8872070.html