AWS Certified Data Analytics – Specialty (DAS-C01) 考试指南
AWS Certified Data Analytics – Specialty (DAS-C01) 考试指南
版本 2.0 DAS-C01
简介 AWS Certified Data Analytics – Specialty (DAS-C01) 考试面向担任数据分析角色的个人。
该考试考查考 生对如何使用 AWS 服务来设计、构建、保护和维护分析解决方案以提供数据洞察的全面理解情况。 本考试还考查考生完成以下任务的能力: 定义 AWS 数据分析服务并了解它们如何相互集成 说明 AWS 数据分析服务在收集、存储、处理和可视化数据生命周期中所处的位置 目标考生说明 目标考生应至少具有 5 年的常见数据分析技术经验。目标考生还应具有至少 2 年使用 AWS 服务来设计、 构建、保护和维护分析解决方案的实践经验和专业知识。 哪些内容被视为超出目标考生的范围? 以下列出的是不要求目标应试者能够完成的相关工作任务(非详尽列表)。
以下内容被视为超出考试范 围: 设计和实施机器学习算法 实施基于容器的解决方案 利用高性能计算 (HPC) 设计在线事务处理 (OLTP) 数据库解决方案 要查看考试中可能涉及的具体工具和技术的详细列表,以及列入考试范围内和超出考试范围的 AWS 服务列 表,请参阅“附录”。
考试内容 答案类型 考试具有两种类型的试题: 版本 2.0 DAS-C01 2 | 页 单项选择题: 具有一个正确答案和三个错误答案(干扰项) 多项选择题: 在五个或更多答案选项中具有两个或更多正确答案 选择一个或多个最准确表述或回答试题的答案。干扰项或错误答案是知识或技能不全面的考生可能会选择 的答案选项。干扰项通常是与内容领域相符的看似合理的答案。 未回答的试题将计为回答错误;猜答案不会扣分。考试包括 50 道计分试题,这些试题将影响您的分数。 不计分内容 考试包括 15 道不计分试题,这些试题不影响您的分数。
AWS 收集这些不计分试题的考生答题情况以进行 评估,以便将来将这些试题作为计分试题。不会在考试中标明这些不计分试题。 考试成绩 AWS Certified Data Analytics – Specialty (DAS-C01) 考试成绩分为及格和不及格。考试按照 AWS 专业 人员遵循认证行业最佳实践和指南制定的最低标准进行评分。 您的考试成绩换算分数为 100 – 1000 分。最低及格分数为 750 分。您的分数表明您的总体考试答题情况以 及是否通过考试。换算评分模型有助于在难度水平可能略有不同的多种考试形式中换算分数。 您的成绩单可能包含一个分类表,其中列出您在每个部分的考试成绩。此信息旨在提供有关您的考试成绩 的一般反馈。本考试采用补偿评分模型,这意味着您无需在每个部分都达到及格分数。您只需通过整个考 试。 考试的每个部分具有特定的权重,因此,某些部分的试题比其他部分多。该表包含常规信息以重点说明您 的强项和弱项。在解读各个部分的反馈时,请务必小心谨慎。
内容大纲 本考试指南包括考试的权重、测试领域和目标,并未列出考试的全部内容。不过,为每个目标提供了额外 的背景信息,以帮助指导您为考试做好准备。下表列出了主要内容领域及其权重。该表位于完整考试内容 大纲之前,其中包括额外的背景信息。每个领域中的百分比仅代表计分内容。
版本 2.0 DAS-C01 3 | 页
领域 在考试中所占的百分 比 领域 1: 收集 18% 领域 2: 存储和数据管理 22% 领域 3: 处理 24% 领域 4: 分析和可视化 18% 领域 5: 安全性 18% 总计 100% 领域 1: 收集 1.1 确定收集系统的运行特征 评估发生故障时数据丢失是否在容差范围之内 评估与从各种来源向收集系统进行数据采集、传输和预置相关的成本(例如,网络、带宽、 ETL/数据迁移成本) 评估收集系统可能遇到的故障情况,并根据影响采取补救措施 确定数据捕获的各个点的数据持久性 确定收集系统的延迟特征 1.2 选择一个处理频率、卷和数据来源的收集系统 描述并确定传入数据的数量和流量特征(流式传输、交易、批处理) 将数据的流量特征与潜在解决方案匹配 在考虑可扩展性、成本、容错能力、延迟等因素的情况下,评估各种接收服务之间的权衡。 解释各种不同类型的数据收集的吞吐能力并确定瓶颈 选择满足源数据系统连接限制的收集解决方案 1.3 选择解决数据关键属性(例如顺序、格式和压缩)的收集系统 描述如何在源头捕获数据更改 讨论数据结构和格式、应用的压缩方法以及加密要求 区分无序交付数据、重复传送数据的影响,以及最多一次性、精确一次性和至少一次性处理之 间的权衡 描述如何在收集过程中转换和筛选数据
版本 2.0 DAS-C01 4 | 页
领域 2: 存储和数据管理 2.1 确定用于分析的存储解决方案的运营特征 根据成本与性能确定合适的存储服务 根据需求了解存储解决方案的持久性、可靠性和延迟特性 确定系统对存储系统的强一致性与最终一致性的要求 确定适当的存储解决方案来满足数据的新鲜度要求 2.2 确定数据访问和检索模式 根据更新模式(例如,批处理、事务处理、微批处理)确定合适的存储解决方案 根据访问模式(例如,顺序访问与随机访问、连续使用与临时使用)确定合适的存储解决方案 确定适当的存储解决方案来满足数据的更改特征(仅追加更改与更新) 为长期存储与临时存储确定合适的存储解决方案 为结构化数据和半结构化数据确定合适的存储解决方案 确定适当的存储解决方案来满足查询延迟需求 2.3 选择适当的数据布局、架构、结构和格式 确定适当的机制来满足架构演进要求 选择任务的存储格式 选择选定存储格式的压缩/编码策略 选择数据排序和分发策略以及存储布局,以实现高效的数据访问 解释不同的数据分配、布局和格式(例如,文件的大小和数量)对成本和性能的影响 实施数据格式化和分区方案以进行数据优化分析 2.4 根据使用模式和业务需求定义数据生命周期 确定满足数据生命周期要求的策略 将生命周期和数据保留策略应用于不同的存储解决方案 2.5 确定用于编制数据目录和管理元数据的适当系统 评估发现新数据源和更新数据源的机制 评估创建和更新数据目录和元数据的机制 解释搜索和检索数据目录和元数据的机制 解释对数据进行标记和分类的机制 领域 3: 处理 3.1 确定适当的数据处理解决方案要求 了解数据准备和使用要求
版本 2.0 DAS-C01 5 | 页
了解不同类型的数据源和目标 评估性能和编排需求 针对成本、可扩展性和可用性对相应服务进行评估 3.2 设计用于转换和准备数据以进行分析的解决方案 对批处理和实时工作负载应用适当的 ETL/ELT 技术 实施故障转移、扩展和复制机制 实施满足并发需求的技术 实施提高成本优化效率的技术 应用编排工作流 汇总和丰富下游消费的数据 3.3 自动化并实施数据处理解决方案 为可重复的工作流实施自动化技术 应用方法来识别处理失败并从中恢复 部署日志记录和监控解决方案以实现审计和可跟踪性
领域 4: 分析和可视化 4.1 确定分析和可视化解决方案的运行特征 确定与分析和可视化相关的成本 确定与分析相关的可扩展性 确定 RPO/RTO 中的故障转移恢复和容错能力 确定分析工具的可用性特征 评估动态、交互式和静态的数据演示 将性能要求转化为适当的可视化方法(预先计算和使用静态数据与使用动态数据) 4.2 为给定场景选择合适的数据分析解决方案 评估和比较分析解决方案 根据客户使用案例(流式传输、交互、协作、运营)选择正确的分析类型 4.3 为给定场景选择合适的数据可视化解决方案 评估给定分析解决方案的输出能力(指标、KPI、表格、API) 选择适当的数据传输方法(例如,Web、移动设备、电子邮件、协作笔记本) 选择并定义适当的数据刷新计划 为不同的数据新鲜度要求选择合适的工具(例如,Amazon Elasticsearch Service、Amazon QuickSight 和 Amazon EMR Notebooks) 了解交互式使用案例(例如,向下钻取、钻取和透视)的可视化工具的功能
版本 2.0 DAS-C01 6 | 页
实施适当的数据访问机制(例如,内存中访问与直接访问) 实施来自多个异构数据源的集成解决方案 领域 5: 安全性 5.1 选择适当的身份验证和授权机制 实施适当的身份验证方法(例如联合访问、SSO、IAM) 实施适当的授权方法(例如,策略、ACL、表/列级别权限) 实施适当的访问控制机制(例如,安全组、基于角色的控制) 5.2 应用数据保护和加密技术 确定数据加密和掩码需求 应用不同的加密方法(服务器端加密、客户端加密、AWS KMS、AWS CloudHSM) 实施静态加密和传输中加密机制 实施数据模糊处理和掩码技术 应用密钥轮换和密钥管理的基本原则 5.3 应用数据治理和合规性控制 确定数据治理和合规性要求 了解并配置跨数据分析服务的访问和审核日志记录 实施适当的控制以满足合规性要求 附录 本考试可能涵盖哪些关键的工具、技术和概念? 以下是考试中可能出现的工具和技术列表(非详尽列表)。该列表可能会有更改,用于帮助您了解考试涵 盖的服务、功能或技术的一般范围。AWS 服务根据其主要功能进行分组。尽管在本考试中对其中一些技术 的考查可能比其他技术多,但这些技术在该列表中的顺序和位置并不表明其相对的权重或重要性: AWS 服务和功能 分析: Amazon Athena Amazon CloudSearch Amazon Elasticsearch Service (Amazon ES)
版本 2.0 DAS-C01 7 | 页
Amazon EMR AWS Glue Amazon Kinesis(不包括 Kinesis Video Streams) AWS Lake Formation Amazon Managed Streaming for Apache Kafka Amazon QuickSight Amazon Redshift 应用程序集成: Amazon MQ Amazon Simple Notification Service (Amazon SNS) Amazon Simple Queue Service (Amazon SQS) AWS Step Functions 计算: Amazon EC2 Elastic Load Balancing AWS Lambda 客户参与: Amazon Simple Email Service (Amazon SES) 数据库: Amazon DocumentDB(与 MongoDB 兼容) Amazon DynamoDB Amazon ElastiCache Amazon Neptune Amazon RDS Amazon Redshift Amazon Timestream 管理和监管: AWS Auto Scaling AWS CloudFormation AWS CloudTrail Amazon CloudWatch AWS Trusted Advisor 版本 2.0 DAS-C01 8 | 页 机器学习: Amazon SageMaker 迁移与传输: AWS Database Migration Service (AWS DMS) AWS DataSync AWS Snowball AWS Transfer for SFTP 联网和内容分发: Amazon API Gateway AWS Direct Connect Amazon VPC(及相关功能) 安全性、身份与合规性: AWS AppSync AWS Artifact AWS Certificate Manager (ACM) AWS CloudHSM Amazon Cognito AWS Identity and Access Management (IAM) AWS Key Management Service (AWS KMS) Amazon Macie AWS Secrets Manager AWS Single Sign-On 存储: Amazon Elastic Block Store (Amazon EBS) Amazon S3 Amazon S3 Glacier 超出范围的 AWS 服务和功能 以下是考试中未涵盖的 AWS 服务和功能的列表(非详尽列表)。这些服务和功能并不代表考试内容中排除 的所有 AWS 产品/服务。与考试的目标工作职责完全无关的服务或功能被排除在此列表之外,因为它们被 认为与考试无关。 超出范围的 AWS 服务和功能包括以下这些: AWS IoT Core
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。