Skip to the content.

Chapter 1: Introduction

26 Feb 2019

任何对数值数据的收集、加工、分析和解读都属于统计学的范畴。在工程中,这包括各种各样的任务,如计算计算机平均宕机时长,收集和展示出席太阳能研讨会的人数数据,评估商业产品的有效性,预测运载火箭的可靠性,以及研究飞机机翼的震动。

在1.2,1.3,1.4和1.5小节中我们讨论统计学最近的发展,以及它在工程问题中的应用。统计学在任何产品或者服务质量的提升中扮演重要作用。使用本书中介绍的技术,工程师可以在与研究、开发、生产的所有工作阶段中变得更有效率。在1.6小节我们通过强调人口和样本之间的区别,开始对统计学概念的介绍。

1.1 统计学为什么重要

统计分析的答案可以为更好的行为决定/选择提供基础。例如,市官员可能想要知道供应水中的铅含量是否在安全标准之内。由于不能把所有的水都检查,结果必须基于专门收集的水样本中的部分信息。举另一个例子,工程师需要测定发电厂中发电机支架的强度。首先,拿几个支架测试它们的极限承受能力,她得到了这些支架的强度。这些数据为评估其他未测试支架的强度提供了基础。

当探究信息时,统计学式的想法是一个典型的集合处理过程,包括四个关键步骤。

1 为调研设定清晰定义的目标。
2 制定计划,决定收集哪些数据,怎么收集。
3 应用恰当的统计学方法,有效地从数据中提取信息。
4 解释信息然后得出结论。

这些不可或缺的步骤在我们发展统计学的关键思想中提供了一个贯穿的参考框架。统计学推理以及方法可以帮助你在获取信息以及总结实用结论方面变得高效。

1.2 现代统计学

统计学的起源可以追溯到两个在表面上没有什么共同点的领域:概率游戏以及现在被称为政治学的东西。18世纪中叶对概率论的研究,很大程度上是受概率游戏兴趣的驱动,导致了数学的方式处理测量误差,以及现代概率论基础理论的诞生。在同一世纪,对于政府部门的数字化描述的兴趣导致了现在成为描述统计学的诞生。最初,描述统计学仅仅包括在图表上展示数据;而现在,它包括了数字描述以及图示等方式的数据概括。

在最近几十年,统计学的发展使它融入了社会活动的几乎每个主要阶段。它的发展最主要的特点是由描述统计学到统计推断的转变。统计推断关心的是基于样本数据的泛化。它应用于以下这些问题:从试运行中估计引擎的平均污染排放,根据产品样本的测量数据测试工厂的信誉,根据运载火箭各部分的性能样本数据,预测火箭将通信卫星送入轨道的成功概率。

当进行统计推断,即推断数据集之外的信息时,务必小心进行。必须小心地决定从给定的数据集中泛化多远。必须小心地考虑,决定这样的泛化是否是合理或者正当的,以及是否需要明智地收集更多数据。的确,统计推断的一些最重要的问题是关于评估由样本泛化引起的风险及后果。这包括估计做出错误决定的概率、做出错误预测的几率、以及得到的估计没有合理地反映真实情况的概率。

我们时刻尽力以科学的方式讲述统计学的课题,我们从其概率基础引出每个统计学思想,然后立即将每个思想应用于物理学或工程学问题。我们在表述和解决这些问题的时候大多数方法都属于频率或者经典方法,其中统计推断关心的是固定但是未知的量。这个方法并没有正式地考虑前面提到的各种主观因素的影响。合适的时候,我们会提醒读者主管因素确实存在,并且指明他们在进行最终决策中可能扮演什么角色。这种实用的统计学方法已经在20世纪下半叶成功作用于工程学、自然和社会科学的课题,并且在21世纪初以及以后将一直持续下去。

1.3 统计学和工程学

最近统计学的发展,对于工程学和工业管理有巨大影响。确实,很难高估统计学对于解决产品问题、高效利用材料和人力、基础研究、以及新产品研发的贡献。和其他科学一样,统计学对于工程师已经是不可或缺的工具。它使得他们可以理解波动的现象,并且高效地预测和控制它们。

在本书中,我们的注意力将主要集中于工程学应用,但我们也提到了其他领域,以让读者对于大多数统计工具的广泛性有印象。用于估计金属热膨胀的平均参数的统计学方法,也用于估计医保工作人员进行给定任务的平均耗时,以及鹈鹕蛋壳的平均厚度,以及一年级大学生的平均IQ。类似地,用于比较两种合金强度的统计学方法,也用于比较两种教学方法的效率,以及两种昆虫喷剂的优点。

1.4 科学家和工程师在质量提升中的角色

在最近30多年,美国发现身处于一个越来越有竞争的全球市场。这种竞争掀起了国际的质量改进革命。W.Edwards Deming的教学和理念对于日本工业的复苏起到了帮助。他强调美国工业为了生存,必须不断地提高产品质量。从设计到生产,流程必须不断优化。具有技术知识的工程师和科学家,在数据收集和图像展示中的基本统计学技巧的帮助下,将会是达到这个目标中的主要参与者。

质量提升基于“一次做好”的哲学思想。进一步说,不应该满足于任何流程或者产品,应该持续寻找提升它们的方法。我们将会强调任何现代质量提升程序的关键统计学要素。在15章中,我们概述了质量提升的基本问题,展示了研究生产过程的一些特定统计学技术。13章中讨论的实验性设计也是质量提升过程的基础。

与质量提升技术紧密相关的统计学技术,是为了满足太空时代科技下的高度复杂产品的可靠性需求而发展的。16章提供了这个领域的介绍。

1.5 案例研究:通过目视检查数据提高产品质量

这项研究显著地展示了恰当地绘图并且监视生产数据的重要优势。它关心的是流行的咖啡机中的一个陶瓷部件。这个陶瓷部件通过使用粘土、水、油的混合物填充两个压力机的模具中间的空隙制成。在压制后,部件干燥为坚硬状态之前,需要测量关键指标。槽的深度是这里所关心的。

由于粘土-水-油混合物天生的不可控变化,压缩的环境,操作员的差异,等等,我们不能期望所有的槽的测量都是一样的结果。槽的深度的一些变化是无法避免的,但是深度需要控制在一定范围之内,这样部件才能适合组装。

槽的深度由从产品中选出的3个陶瓷部件上测量,从上午6点到下午3点每半小时测量一次。表1.1中的数据是在星期五收集的。第一条样本214,211和218(千分之一英尺)的样本平均,或者平均值是

\[\frac{214+211+218}{3}=\frac{643}{3}=214.3\]

这个值是标记为\(\overline x\)的行的第一个条目。

称为X-bar图的作图过程,是把样本平均按照时间顺序画出。这个图会显示何时发生了改变,以及为了矫正流程需要采取的行动。

前面的统计研究表明流程是稳定的,在217.5千分之一英尺的值左右浮动。这个值在图1.1中作为X-bar的中心线。

\[\text{中心线:}\overline{\overline{x}}=217.5\]

进一步表明如果样本的平均槽深度保持在某个控制限度之内的话,这个过程能够制造大部分合格的陶瓷部件。