智能化運維實踐 — 從 Ansible 到 Kubernetes

吳文豪,孫靖翀

買這商品的人也買了...

商品描述

本書講解了自動化運維和智能化運維兩大內容,並且通過實驗環境搭建的方式,讓讀者能夠快速地掌握當前 Docker 和 Kubernetes 環境的使用。在講述相關的知識和技術的時候,以開箱即用的方式給讀者選擇了一些能夠實際增強智能化運維能力的 AIOps 工具包。

作者簡介

吳文豪,《自動化運維軟件設計實戰》作者、網思科技股份有限公司廣州研究院負責人。

孫靖翀,草根老碼農一枚,開源軟件生態成長的見證者,蹦躂在自動化運維一線的折騰者。

目錄大綱

第1章自動化運維的常見問題與發展趨勢
1.1 運維過程中的常見問題
1.1.1 設備數量多
1.1.2 系統異構性大
1.1.3 雲計算技術成熟後帶來更大的困難
1.1.4 信息安全要求帶來的挑戰
1.2 自動化運維主流工具
1.2.1 SaltStack
1.2.2 Ansible
1.3 自動化運維
1.4 新的趨勢—AIOps
1.5 小結

第2章使用Kubernetes快速搭建實驗環境
2.1 Docker
2.1.1 使用Docker搭建實驗環境的優點
2.1.2 安裝Docker
2.1.3 Docker的基礎使用方法
2.1.4 Docker常用命令與配置
2.1.5 定制Ansible鏡像
2.1.6 使用docker-compose編排實驗環境
2.1.7 docker-compose的常用配置項
2.2 鏡像倉庫
2.2.1 Docker Registry
2.2.2 Harbor
2.3 Kubernetes
2.3.1 Kubernetes簡介
2.3.2 Kubeasz
2.3.3 K3S
2.3.4 Kubernetes快速入門
2.3.5 使用Kubernetes Deployment搭建Ansible實驗環境

第3章集中化運維利器——Ansible
3.1 Ansible基礎知識
3.1.1 主機納管——inventory
3.1.2 動態inventory
3.2 在命令行中執行Ansible
3.2.1 指定目標主機
3.2.2 常用命令示例
3.3 Ansible常用模塊
3.3.1 文件管理模塊
3.3.2 命令執行模塊
3.3.3 網絡相關模塊
3.3.4 代碼管理模塊
3.3.5 包管理模塊
3.3.6 系統管理模塊
3.3.7 文檔動態渲染與配置模塊
3.4 自動化作業任務的實現—Ansible Playbook
3.4.1 Playbook示例
3.4.2 常用的Playbook結構
3.4.3 變量的使用
3.4.4 條件語句
3.4.5 循環控制
3.4.6 include語法
3.4.7 Ansible Playbook的角色roles
3.5 密鑰管理方案—ansible-vault
3.6 使用Ansible的API
3.7 Ansible的優點與缺點

第4章自動化運維
4.1 Ansible在自動化運維中的應用
4.1.1 ansible_fact緩存
4.1.2 ansible_fact信息模板
4.1.3 載入fact
4.1.4 set_fact的使用
4.1.5 自定義module
4.2 掛載點使用情況和郵件通知
4.2.1 任務目標
4.2.2 任務分析
4.2.3 任務的實現
4.3 操作系統安全基線檢查
4.3.1 任務目標
4.3.2 任務分析
4.3.3 任務的實現
4.4 收集被管理節點信息
4.4.1 任務目標
4.4.2 任務分析
4.4.3 Jinja2簡介
4.4.4 服務器巡檢任務
4.5 小結

第5章AIOps概述
5.1 AIOps概述
5.2 AIOps的落地路線
5.3 基於基礎指標監控系統的AIOps
5.4 基於日誌分析系統的AIOps
5.5 基於知識庫的AIOps
5.6 基於AI平台的AIOps

第6章AIOps工具包
6.1 應用系統參數自動優化
6.2 智能日誌分析
6.2.1 日誌模式發現
6.2.2 日誌模式統計分析
6.2.3 實時異常檢測
6.3 告警關聯分析
6.4 語義檢索
6.4.1 Bert-As-Service
6.4.2 Bert Fine-tuning
6.5 異常檢測
6.5.1 典型場景——監控指標異常檢測
6.5.2 異常檢測工具包——PyOD
6.6 時序預測
6.6.1 典型場景——動態告警閾值
6.6.2 時序預測工具包——Prophet

第7章加速AIOps落地——AI平台
7.1 AI平台與AIOps
7.1.1 為運維繫統插上AI的翅膀
7.1.2 Polyaxon
7.2 搭建AI平台的技術點
7.2.1 nvidia-docker
7.2.2 nvidia-device-plugin
7.2.3 KubeShare——顯卡資源調度
7.2.4 AI算法插件框架設計
7.2.5 KEDA——基於事件的彈性伸縮框架
7.2.6 Argo Workflow——雲原生的工作流引擎
7.2.7 Traefik
7.3 小結