发表于: 2019-05-03 22:13:26

0 555


今天完成的事情:复习
明天计划的事情:重新用jmeter和fiddler录制
遇到的问题:无
收获:

性能测试是一个很广泛的概念,通常情况下有如下分类:

性能测试分类

  • 负载测试(Load testing)
    负载测试是不断增加系统的负载,直到负载达到阈值——评估系统在预期工作负载下的性能的测试。
    这里增加负载的意思是在测试中增加并发用户数量、用户交互等,通常是在可控的环境下进行。典型的负载测试包括在负载测试过程中确定响应时间吞吐量误码率等。
    该方法可以找到系统的性能极限,可以为性能调优提供相关数据。该类方法通常要基于或模拟系统真实运行环境,且选取的业务场景也要尽可能地与实际情况相符。
    举例:
    对于具有预计1000并发用户负载的新开发的应用程序来说,则需要创建负载测试的脚本,配置1000个虚拟用户,然后持续运行1小时。负载测试完成后,再分析测试结果,确定应用程序将如何在预期的峰值负载下运行。

  • 压力测试(Stress Testing)
    压力测试是指当硬件资源如cpu、内存、磁盘空间等不充足时对软件稳定性的检查。
    压力测试属于负面测试(Negative testing),使大量并发用户/进程加载软件以使系统硬件资源不能应付。这个测试也被称为是疲劳测试(Fatigue testing),通过超出其能力的测试来捕获应用程序的稳定性。
    压力测试的主要思想是确定系统故障,关注系统如何优雅地恢复正常,这种质量被称为是可恢复性
    负面测试(Negative testing)是相对于正面测试(Positive testing)而言的。正面测试就是测试系统是否完成了它应该完成的功能;而负面测试就是测试系统是否不执行它不应该完成的操作。

  • 尖峰测试(Spike testing)
    尖峰测试(Spike testing)其实可以算作是压力测试(Stress Testing)的子集。
    尖峰测试是在目标系统经受短时间内反复增加工作负载,以至超出预期生产操作的负载量时,分析系统的行为,验证其性能特征。它还包括检查应用程序是否可以从突然增加的超预期负荷中恢复出来的测试。
    举例:
    在电商应用程序中经常有“整点秒杀”的活动,所以在整点时间前后的两三分钟时间里,会有巨大数量的用户进入到该活动中秒杀商品。尖峰测试就是为了分析这类场景。

  • 可扩展性测试(Scalability Testing)
    可扩展性测试(Scalability Testing)是一种非功能的测试,它测试软件应用程序以确定所有非功能能力的扩展能力,如用户负载支持、事务数量、数据量等。

  • 容量测试(Volume testing)
    容量测试是一种非功能的测试,它通过向应用程序中添加大量的数据来实现。可以通过向数据库插入大量的数据或让应用程序处理一个大型文件来进行测试应用程序。
    通过容量测试,可以识别应用程序中具有大数据时的瓶颈,检查应用程序的效率,进而得到不同数据量级下应用程序的性能。
    举例:
    在一个新开发的网络游戏应用程序中,在进行容量测试时,可以通过向数据库中插入数百万行的数据,然后在这些数据的基础上进行性能的测试。
    注意,这里所说的数据一定是符合其功能场景的,不是毫无关系的数据。

  • 持久测试(Endurance testing)
    持久测试(Endurance testing),也被称为是浸泡测试(Soak Testing),它也是一种非功能的测试。
    持久测试是指在相当长的时间内使用预期的负载量对系统进行测试,以检查系统的各种行为,如内存泄露、系统错误、随机行为等。
    这里的提到的相当长的时间是相对而言的,举例来说,如果一个系统设计为运行3个小时的时间,那可以使用6个小时的时间来进行持久测试;如果设计为5个小时的时间,不妨用10个小时的时间来进行持久测试。对于现在的许多网络类应用程序,通常情况下会持续运行好多天,那么进行持久测试时可以选择更长的时间段。

总结

其实很多时候并不需要把这些概念和分类搞得特别清楚,而且事实上也很少有人能搞得特别清楚。但这并不是说理清楚这些分类就没有意义。恰恰相反,理清性能测试的分类是为了能够有重点、有针对性地覆盖性能测试的方方面面。

比如容量测试,即便你不知道这个概念,也可能会根据实际的需求考虑到这种场景并进行测试。然而当你知道了这些具体的分类和侧重点,在设计性能测试方案时便会有针对性地覆盖这些方面。

在实际工作中,性能测试常常在口头上表达为压力测试,进而简称为压测。虽然这种称呼并不准确,但足以达到沟通的效果了。

而且实际工作中所做的性能测试方面的工作很多时候是上述分类的组合或衍生,以及根据实际工作的应用场景、产品的侧重点、用户的需求等综合考量后逐渐演变形成的一些测试方法和规则。因此,上述的分类更多是一种通用的、普世的分类,不必过多较真。



返回列表 返回列表
评论

    分享到