为什么一周的报告AWR在Azure中尺寸

在技​​术规模和优化实践中出现不同推荐的实践并不罕见。对于许多人来说,它在最佳数据和易于访问与生产环境的影响之间存在妥协,这与我们面临的何时没有什么不同 在Azure上荫的甲骨文.

正如我们所知,升力和移动工作量与移动硬件很重要,我们必须具有简单的方法来执行此任务。关于我们首选使用一周的自动工作负载存储库(AWR)报告的首选方法,请致力于。这篇文章将侧重于我的机会对AWR数据收集的不同Windows如何影响我们推荐的架构和Azure中的尺寸为Oracle的小测试。

使用的示例来自真实客户,使用数据库和主机信息屏蔽以保护客户的环境。这些客户为他们的AWR工作负载提供了每小时,峰值和/或一周的窗口报告。

例1

我们的第一个示例是RAC数据库,单个节点,具有两个提交的一个,一个小时的AWR和来自客户的一周报告。您将注意的是在一个小时的报告中,主机内存和CPU的尺寸在计算中非常接近。我们的挑战是,在Azure上与Oracle,在大多数情况下,它总是关于IOPS:

在一小时的报告中,需要收集多个报告,因为我们更有可能错过:

  • 什么是峰值工作量?
  • 发生什么夜间批量处理?
  • 备份在数据库上进行了哪些要求?
  • 随着时间的推移,最高性能是多少?
  • 发生了哪些长期运行的流程和从一小时报告运行的过程的计算?

如前所述,IOPS是Azure上的Oracle工作负载最受关注的最高问题之一。我们拥有相当大的VCPU和内存,我们可以分配,但随后需要仔细旨在满足这些IO饥饿数据库的需求。正如您所看到的第一个例子,IOPS在一小时报告和一周报告之间翻了一番。另请注意,从平均值计算的内容有不同的值,这是来自AWR的直接值以及我们计算峰值工作量的直接值。这些值旨在理解这些是平均值,并且可能存在在一周的报告中缺少的工作负载,并在计算中授予一些“Wiggle房间”。这是“峰值”值进入的位置,我们的大小,从来没有在工作表中显示的平均值。

这些数字使用由工作负载配置的单独表。可以调整内存,CPU或IOPS更重的工作负载,以授予输出的更多杠杆,这是基于Oracle专家的决定,指出我们预期给定区域中的更多工作量。

上面的示例数据库的尺寸将落到几个VM解决方案:

  • 4 vCPU
  • 39 GIB记忆

在内存中具有4个VCPU和32个GIB的重要VM。然后,我会向我的客户提供哪一个具有“S”指定的电子系列,(如果我们需要更多地条纹Redo,归档日志等),那么有32个Gib的内存将是最好的为他们的数据库。

对于存储,我们的计算状态我们需要:

  • 5K IOPS和3.2K Mbps。

只有一个 很少有托管磁盘解决方案 可以提供这一点。它不是一个确切的价值,它不需要。如果您查看存储桌以进行存储,则会快速看到这对应于此类重型IO工作负载的一些解决方案。即使是超级磁盘也将被推过,其限制:

  每个磁盘容量(gib) 每磁盘IOPS. 每盘吞吐量(MB / s)
矿物 4 100 1
最大限度 65536 160000 2000

 

这意味着我们自动引入不受托管磁盘的单个VM或限制的解决方案,即Azure,意味着Azure NetApp文件(ANF)。如果我们与1小时的AWR报告合作,我们会知道在此选项中携带吗?不 - 我们可能有很好的建议使用溢价或超磁盘,缺少工作量最终需要对IO限制限制的架构。

这并不是说客户必须使用建议。它们还可以占用强大的优化锻炼并消除数据库上的沉重IO,并能够降低云中的资源需求。作为优化专家,我永远不会从任何人那里拒绝在云中的长期满足。它始终有效地利用您的资源,但第一个课程就是升力和移动工作量,这意味着我需要架构师所需的。

例2.

该第二示例来自平均单个实例数据库以将其迁移到Azure。

在我的工作负载中,我编写了它们,使它们在输出中唯一,其中有三个已提交给Microsoft:

  1. 1小时工作量
  2. 一个1小时的峰值工作量
  3. 一个1周的工作量报告

工作负载也可以是管理和监视数据库的人的感知。我是有原因的关于数据的原因 - 您多久会见IT团队,他们确信一定时间是他们的应用程序或数据库的最繁忙的时间,如果您打开活动报告,则为一个非常不同的图片结果。峰值负载导致VCPU少于一周的报告,并且IO最终混合了 - 更高的MBP,但在1小时峰值中少IOPS。当我们考虑Wiggle房间时,我们可以看到我们超过了17156.98 MPB的一周峰值Mbps的9126.86 Mbps的峰值工作量。

换句话说,我将在我的“Wiggle房间”中捕获峰值工作量,即我作为一周报告的一部分使用,并再次满足了大小的练习,并正确大小大小为Azure。

例3.

第三个例子是来自exadata-另一个大的例子,但是一个有趣的例子。这位客户希望看到他们运行一次唯一,峰值工作负载之间的区别,(它们有一个awr for)及其正常的每周工作负载,它产生了相当混合的结果:

您可以从上述输出中看到,在IO中产生的一周输出远低于,但VCPU要求显着高。这是我们意识到所识别的峰值可以通过一个资源而不是另一个资源的峰值。它关于痛点,很少跨越所有资源。

在这种情况下,客户再次需要显着的IOPS和优化来满足他们的需求。他们已经从其他云供应商面临这一点,我们为基线制作了数据,以及优化建议是他们决定使用Azure的原因。这里的计划是优化onprem,然后重新评估工作负载,但是,再次提出这个例子的重要原因是峰值工作量可能不会为您提供所希望的结果。

再次,我们查看我们的工作量平均值并将它们与一周的工作负载峰值数字进行比较,我们比封面更覆盖,这是峰值数字的目标。

达成共识是

我们是否通过使客户运行一周的报告与运行多个报告来收集各种峰值和/或运行查询来收集任何东西,以收集峰值工作负载的数据?

98%的案件中的答案是 不。

我们是否减少了对不同工作负载的手动计算的需要,以便使用AWR尺寸的一周方法的工作负载提出确切的数字?我们也通过简化单个工作量报告来减少人类错误的机会吗?

是的,是的。

我们是否使用这些数字来尺寸为Azure NetApp文件,(ANF)或其他高级Azure服务或产品的存储要求?

。这些计算由ANF自己的脚本完成,并由客户理解,需要更多调查,以确保他们从服务中获得最佳性能。我们的计算只告诉我们,我们需要服务,以满足客户工作负载的IO需求,这是准确的。

一周的报告提供了最优化和简单的尺寸尺寸解决方案,用于估计Azure工作负载,而无需从客户资源中广泛的努力,而不会对客户的数据库施加额外的压力,并简化了为那些可能的蔚蓝的工作量尺寸不是熟悉Oracle作为我们中的一些人。

 

 

dbakevlar.

http://about.me/dbakevlar