Upload
grant-henry
View
102
Download
0
Embed Size (px)
DESCRIPTION
2013 年赛区数学建模竞赛模拟题. “ 关于 某竞赛网评结果的建模与 分析 ” 解题思路. 2013-7-8. 一、各问要点. 1. 第一问:评委一致性度量指标. 大部分 队 结论 : 1- λ = (1- α ) 3 , α( 1/2 ) = 0.2063 α( 2/3 ) = 0.3066. 一、各问要点. 点评: 首先,将 α 当作 任 一 篇论文的通过概率是错误的,每篇论文按照水平高低不同,其通过的概率是不同的。 α 应当是通过文章数量的平均值 。 - PowerPoint PPT Presentation
Citation preview
2013-7-8
2/20
1. 第一问:评委一致性度量指标
大部分队结论: 1- λ = (1-α)3 ,
α ( 1/2 ) = 0.2063 α ( 2/3 ) = 0.3066
3/20
点评:首先,将 α 当作任一篇论文的通过概率是错误的,每篇论文按照水平高低不同,其通过的概率是不同的。 α 应当是通过文章数量的平均值。 其次,实际上, α=0.48 , λ=0.7 (按上式计算: λ=0.86 ),没有发现此结果与数据统计结果差距太大。前者反映了思考深度不足,后者反映了严重缺乏建模经验,模型检验意识缺失。
4/20
介绍一种解题思路。 设每一评委的通过率均为 α ,任意两评委的一
致率为 β ,显然 β 与通过率 α 无关。 根据数据统计可得:
题目 一致率均值β
一致率标准差
相同论文数均值
A 0.6964 0.2387 7.7922
B 0.6771 0.2809 4.7968
C 0.7288 0.1803 12.8242
D 0.7245 0.2374 7.3992
据此取 β=0.707 。
5/20
假设:1. 评委个人通过率为 α ,评委一致率为 β ,且 β 与 α 无关;2. S1+S2+S3+S4=1 ;3. S3+S4=α ;4. S1 与 S4 中的论文不会发生误判,即 S1 中的论文一定被判为“不通过”,而 S4 中的论文一定被判为“通过”;5. S2 , S3 两个区域中的论文各有 50% 的误判率,并且 S2=S3.
6/20
推导:
记 S2=S3=S ,据假设 1 、 2 、 4 、 5 有:
β = S1+S4+(S2+S3)/2 = 1-S S = 1- β
1-λ = S1+(S2+S3)/23 = S1+S/22 = 1- α-S+ S/22
= 1- α –3/4 (1- β)
所以, λ = α +3/4 (1- β)
α = λ – 3/4(1- β)
α (1/2) = 0.28 α (2/3) = 0.45
7/20
验证:由数据统计得到: α =0.49 , β =0.707 ,代入得: λ = α + 3/4(1- β) = 0.709
实际最终平均通过率为: λ = 0.7
误差在合理范围内,结果可以接受。
8/20
第二问:相关性结论
通过数 一等奖 二等奖 三等奖 成功参赛奖
1 0 3.15%30.04
%66.80%
2 2.87%21.00
%35.72
%40.39%
3 8.40%43.73
%33.33
%14.52%
9/20
第三问:公正性与评阅水平的度量公正性:上偏差与下偏差比较,后者是否明显大,即
是否有“主观压分”现象评阅水平:与最终成绩的偏差大小,逆序单用网评一致度来评价水平不妥,用通过率偏差也不
妥主要与最终成绩做比较,而且应分轻重,仅计算次数
是不合适的。
10/20
第一组: β1=24 , β2=4 , β3=3
好: 42,54,86,08,38 差: 09,24,61,37,57
第二组:无效评分比例 差: 32,37,61,57,85
第三组:偏差
好: 88,87,89,17,27 差: 82, 24,57,13,84
11/20
第四组
不落窠臼,思维有深度的表现
12/20
13/20
14/20
•第四问:整体表现分析是否符合实际整体表现差异指题目差异,而非评委差异。A :有杆抽油系统的数学建模及诊断B :基因识别问题及其算法实现(较难评)C :基于卫星云图的风矢场度量模型与算法探讨D :基于卫星无源探测的空间飞行器主动段轨道估计与
误差分析(有唯一正确结果,较好评)
15/20
题目开放性的排名由高至低为: B A C D (第四组)
题目 一致率均值β
一致率标准差
相同论文数均值
A 0.6964 0.2387 7.7922
B 0.6771 0.2809 4.7968
C 0.7288 0.1803 12.8242
D 0.7245 0.2374 7.3992
16/20
第五问:评阅区分度不降,工作量节省多少
各种计算方案,大致为20%
17/20
第六问:想法合理性
首先说清楚纳入网评成绩的利弊所在。
不在乎你提什么方案,而在乎你如何分析你的方案。
要说服别人,先说服自己
18/20
题目技术要求不高,重在思考能力与分析能力。但是在此项上总体得分较低,反映不善于深入思考,流于表面、浅显,珍惜训练机会,习惯养成很重要。
数据信息发掘是考点之一,也是数学建模竞赛的趋势之一,例如一致率,上偏差,下偏差,超常评判等。
19/20
模型检验意识不强。
单向思维要避免,综合思维要加强。例
如,各种评阅水平指标的引入,应当有切合
实际的利弊分析,否则,显得青涩,缺乏成
熟度。
写作规范性及流畅性存在不同程度的问
题。
20/20
谢 谢!