CompTIA DataX Certification Exam:DY0-001
CompTIA DataX 認證考試:DY0-001
CompTIA DataX 是經驗豐富的專業人士的頂級認證,旨在驗證其在快速發展的資料科學領域的能力。 DataX 旨在協助您掌握處理複雜資料集、實施資料驅動解決方案以及透過深刻的資料解讀推動業務成長所需的技能,並讓您自信地展現專業技能。
DataX(V1)考試目標
數學和統計學(17%)
·統計方法:應用 t 檢定、卡方檢定、變異數分析 (ANOVA)、假設檢定、迴歸指標、基尼係數、熵、p 值、接收者操作特性/曲線下面積 (ROC/AUC)、赤池資訊準則/貝葉斯資訊準則 (AIC/BIC) 和混淆矩陣。
·機率和建模:解釋分佈、偏度、峰度、異方差、機率密度函數 (PDF)、機率質量函數 (PMF)、累積分佈函數 (CDF)、缺失、過採樣和分層。
·線性代數與微積分:理解秩、特徵值、矩陣運算、距離測量、偏導數、鍊式法則和對數。
·時間模型:比較時間序列、存活分析和因果推論。
建模、分析和結果(24%)
·EDA 方法:使用探索性資料分析 (EDA) 技術,如單變量和多變量分析、圖表、圖形和特徵識別。
·資料問題:分析稀疏資料、非線性、季節性、粒度和異常值。
·資料豐富:應用特徵工程、縮放、地理編碼和資料轉換。
·模型迭代:進行設計、評估、選擇與驗證。
·結果溝通:建立視覺化、選擇資料、避免欺騙性圖表以及確保可訪問性。
機器學習(24%)
·基礎概念:應用損失函數、偏差-方差權衡、正規化、交叉驗證、整合模型、超參數調整和資料外洩。
·監督學習:應用線性迴歸、邏輯迴歸、k最近鄰(KNN)、樸素貝葉斯和關聯規則。
·基於樹的學習:應用決策樹、隨機森林、提升和引導聚合(裝袋)。
·深度學習:解釋人工神經網路 (ANN)、dropout、批量標準化、反向傳播和深度學習框架。
·無監督學習:解釋聚類、降維和奇異值分解(SVD)。
營運和流程(22%)
·業務功能:解釋合規性、關鍵績效指標 (KPI) 和需求收集。
·資料類型:解釋產生的、合成的和公共的資料。
·資料擷取:了解管道、串流、批次和資料沿襲。
·資料整理:實施清理、合併、歸納和基本事實標記。
·資料科學生命週期:應用工作流程模型、版本控制、清潔程式碼和單元測試。
·DevOps 和 MLOps:解釋持續整合/持續部署 (CI/CD)、模型部署、容器編排和效能監控。
·部署環境:比較容器化、雲端、混合、邊緣和本地部署。
數據科學的專業應用(13%)
·優化:比較約束優化和無約束優化。
·NLP 概念:解釋自然語言處理 (NLP) 技術,如標記化、嵌入、詞頻-逆文檔頻率 (TF-IDF)、主題建模和 NLP 應用。
·電腦視覺:解釋光學字元辨識(OCR)、物體偵測、追蹤和資料增強。
·其他應用:解釋圖形分析、強化學習、詐欺偵測、異常偵測、訊號處理等。