SAS中文论坛

 找回密码
 立即注册

扫一扫,访问微社区

查看: 552|回复: 0
打印 上一主题 下一主题

试验需要设计的理由

[复制链接]

49

主题

76

帖子

1462

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1462
楼主
 楼主| 发表于 2006-5-19 21:38:44 | 只看该作者

试验需要设计的理由

试验是科学研究的重要手段
试验(experiment),指人工控制条件下重现自然现象并对其观测的科学研究方法,即人们按照研究的目的,利用仪器和设备,人为地控制对象,排出干扰,突出主要因素,暴露对象的特性,在有利条件下研究自然规律。试验,是探知未知世界的一种重要手段。
试验前,思谋控制那些因素,各个因素控制到哪个量值,各因素量值怎样组合,观测哪些因素、指标或变量,试验重复多少次等问题的决策规划,就是试验设计(experiment design)。变量观测值的整理,采用统计方法进行判断、推理和作出结论,就是统计分析(statistical analysis)。可见,试验、试验设计和统计分析三者密不可分,它们具有科学的内在联系。
人类社会各个领域都有着自己的特定试验内容和方法,其中不乏著名的科学试验。这些方面的例子比比皆是,旨在提高产量和品质以解决人类食物供给安全问题的育种试验,如水稻杂交试验、果蔬新品种选育试验、农作物新品种选育试验、畜禽新品种选育试验等;旨在检测和改进机电产品性能的试验,如发动机性能试验、农业机械性能试验、汽车行驶试验、飞机风洞试验等;旨在检验巨大工程或受限项目可行性的试验,如三峡大坝模型试验、核爆炸模拟试验、登月车模型试验等。试验概念的广义延伸,亦包括按照特定采样方法对自然现象进行的被动观测。
从系统的输入输出角度理解“试验”的涵义:
铧式犁的牵引阻力试验:研究对象为悬挂犁;控制的输入为土壤坚实度、土壤水分、土壤质地、土壤结构和土壤茬口;测定的输出为牵引阻力。
汽车的隔振试验:研究对象为汽车;控制的输入为路面质地和地面谱;测定的输出为汽车车体的振动频率和振动幅值。
土壤水分检测仪的检测精度试验:研究对象为土壤水分检测仪;控制的输入为土壤水分;测定的输出为标准方法的水分读数,仪器的水分读数。
小麦的施肥试验:研究对象为小麦与土壤系统;控制的输入为施肥量和施肥配方;测定的输出为小麦产量。
果树的栽植密度试验:研究对象为果树与土壤系统;控制的输入为栽植密度、土壤类型和肥力特征;测定的输出为果树产量。
植物的品种试验:研究对象为某植物的多个品种;控制的输入为土壤性状、种植密度、肥力特征、水分特征和气候特征;测定的输出为植物果实的产量。
果树的育苗扦插试验:研究对象为扦插苗与插床系统;控制的输入为扦插苗形态和尺寸、扦插苗处理、环境温度、基质温度和叶面水分;不控制的输入为插床基质、基质水分、扦插苗光照、扦插苗密度;测定的输出为扦插苗成活率和扦插苗生根势。
试验设计是做好试验的必要步骤
试验是为了解决问题,要求尽可能有效地挖掘对所研究问题有价值的信息,对变量(输入与输出)间的关系有一个客观真实和全面的了解。试验需要设计源于下述理由:
■针对特定的研究问题,需要筛选试验因素,确定其量值和范围,并注意可行性、充分性、重要性和代表性,使能够与所研究的问题匹配。
■针对特定的研究问题,需要筛选测定指标,并注意可行性、充分性、重要性和代表性,使能够与所研究的问题匹配。
■研究因素效应或变量间关系的通常做法是,假定或利用成熟理论推导一个或若干个数学模型,利用试验数据检验模型的合理性,选择检验达到要求的模型完成对问题的分析研究。
■由于任何试验都不可能考虑穷尽所有的因素,受未考虑因素影响,测定数据具有某种随机不确定性,于是统计模型(随机模型)成为唯一的选择,凭借它能最有效地逼近客观实际。
■每一种统计方法都对应于某种特定的统计模型和若干假设,将其应用于数据分析(模型求解)需满足一些特殊要求:(1)试验应符合统计模型的基本假设;(2)试验布点(包括因素的水平组合及其试验实施)需要满足模型要求的特定试验结构,才能有效地逼近客观实际,最大限度地获得丰富(全面完整)、可靠(真实)、精确的数据;(3)响应是激励效应的偶合结果,需要考虑便于解偶的试验结构,以分辨单个激励的效应,并对该效应进行统计检验;(4)选定的统计分析方法必须与相应的试验结构匹配,来源不明数据的随意统计分析,可能导致错误结论;(5)统计方法需要考虑减少或控制各种误差,如平衡系统误差、分离随机误差、减少试验误差和控制不试验因素的随机干扰等,以保障试验精度和挖掘信息的可靠性,这些也要求特定的试验结构;(6)欲获得全面丰富的必要信息、期望的结论和实现研究目标,需要考虑试验布点结构、试验容量和试验次数等。即具有代表性、充分性和可靠性。
■尽可能减少试验次数,以节约人力、财力、时间和物力(包括试材、仪器装备等)等资源消耗,即尽量减小成本,使试验具有经济性。
■有利于确定进一步试验的探索方向,促成有价值的科学发现;
■合理的研究手段才能有较高的研究效率,才可能使研究的问题得以快速解决。不经过设计的试验,既浪费资源又浪费时间,难于获得有用的试验结果,不能保证做出可靠、可信、充分与精确的判断或结论。
然而,采集的试验数据毕竟是自然过程的一个样本,而代表性、充分性和经济性对试验设计的要求常常是矛盾的。因此,所谓试验设计(experiment design),实质上就是根据研究问题的需要,选择合适的统计模型,按照统计分析对数据产生背景的要求,考虑试验误差的影响,选用尽可能少的试验次数和适当的样本容量,科学地规划试验规模、布点位置、布点容量和布点结构,以尽可能有效地采集所需信息。试验设计亦称作试验优化技术(experiment optimization)。
试验设计不是可有可无的,是做好试验的必要步骤。没有经过设计的试验,可能产生许多有害后果:(1)试验范围与问题的需要不匹配,不能准确解释所研究的问题;(2)试验布点不合理,代表性不足,采集信息集中于局部;(3)研究变量筛选不合理,或过多,或过少,或缺失重要变量,试验结论显得偏颇且不充分;(4)试验布点结构不合理,使统计方法不能发挥全部作用,进而信息挖掘不足,常分析不出欲考察的效应或关系,甚至不能应用某种方法,数据处理结果的误差较大;(5)试验规模要么过大造成不必要的资源浪费,要么过小得不到需要的试验结论。这些有害后果损害试验结论的可靠性。
试验设计是管理人员尤其是科技人员的必备技术。在科学研究、产品开发等领域有着广泛的应用。
只有经过设计的试验应用统计分析才是合理的
试验结果具有随机不确定性,导致不确定性的原因主要有三方面:(1)试验能够考虑的因素或变量有限,试验结果除了包含所考虑因素的影响外,还包含未考虑或不明因素的影响。不加控制的未考虑因素对试验结果的影响,表现为试验结果与理论预测结果的系统偏移和随机波动性;(2)试验仅仅是所研究问题的一次采样,只反映客观过程的一部分,没有、也不可能包含与所研究问题有关的全部信息;(3)试验的时间和空间包含控制因素和不控制因素的时空变化,样本的产生本身就具有随机性。试验分析能够做的只是“由部分推断整体”。
由于对研究对象的内部结构和运行机制知之甚少或一无所知,“由部分推断整体”也只能采用统计模型(statistical models)对其变量间的关系进行近似或逼近。统计模型,指含有随机变量的数学模型,是对研究对象变量间关系的一种假设或推断,由效应函数和随机偏差两部分组成。
效应函数亦称作效应模型(effect models),统计模型中的效应函数表征试验因素对指标变量的影响,随机偏差表征未考虑或不明因素对指标变量的影响,选择统计模型,就是确定效应函数与随机偏差的组合结构或形式。
效应函数中的参数或系数一旦确定,则该函数被决定。利用试验数据,确定效应函数中的参数或各个因素的效应,并检验效应的显著性,称作统计分析(statistical analysis)。统计分析,运用各种数学技巧辨识和检验统计模型,分辨哪些是因素效应、哪些是随机效应和因素对指标影响的大小,有效地挖掘试验数据里隐含的有用信息,进而对所考察对象(系统)整体的性质做出尽可能精确可靠的判断。
统计分析本质上就是“由部分推断整体”,应当选择合适的统计模型描述试验结果,使具有科学性、可行性和有效性,并能够获得较高可靠度的试验结论。评价一个统计模型对现实世界逼近的效果,一般以具有较小误差为标准。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|SAS中文论坛  

GMT+8, 2025-6-12 07:11 , Processed in 0.065895 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表