DevOps

Порядок изучения технологий для DevOps: https://roadmap.sh/r/devops-fork-hzrp1 и комментарии к порядку изучения технологий:
- Выучить основы bash и python/go (дополнительная информация ниже в Базовые знания Linux, сетей и bash скриптов)
Из операционных систем советую поставить себе Ubuntu: https://ubuntu.com/desktop
Большинство серверов работают на linux и Ubuntu будет удобен в обычном пользовании и подготовке к работе
- Из текстовых редакторов научиться открывать файлы и редактировать в nano, а также в vim (если удобно)
- По терминалу вся информация будет в Базовые знания Linux, сетей и bash скриптов
- По системе контроля версий git ниже в Git система контроля версий и автоматизация с помощью GitLab CI/CD
- По контейнеризации изучать Docker, ниже в Контейнеризация с помощью Docker и Kubernetes
- Насчет Облачных провайдеров, в России лучше использовать Yandex Cloud, SberCloud или VK Cloud
- Сети изучать ниже в Базовые знания Linux, сетей и bash скриптов
- Изучать Terraform и Ansible как IaC (инфраструктуру как код, ниже в IaC - (Инфраструктура как код) создание серверов с помощью Terraform и настройка с помощью Ansible)
- CI/CD проще изучать на основе GitHub Actions, а потом GitLab CI/CD (автоматизация)
- Мониторинг ниже в пункте Мониторинг, золотые сигналы и логгирование
- Управление паролями, секретными данными или ключами с помощью Vault
- Мониторинг приложений: Jaeger Tracing, Sentry
- Управление логами Graylog и Loki, тоже ниже в Мониторинг, золотые сигналы и логгирование
- Под Kubenretes тоже отдельный пункт ниже совместо с Docker (в последних версиях Kubenretes отказались от Docker)
- Хранение собраных приложений, docker образов, helm чартов: Nexus и Artifactory
- Наблюдаемость и управление сетевым трафиком в Kubenretes: istio или linkerd (ниже в пункте с Kubenretes)
Полезные youtube каналы:
- Канал с плейлистами по которым учились многие devops инженеры: https://www.youtube.com/@ADV-IT/playlists
- Канал от создателей платных курсов Merion Academy на котором рассказывают про технологии из RoadMap выше простыми словами: https://www.youtube.com/watch?v=NtGN7Nz6I0c
- Хороший канал по devops, все видео смотреть на скорости 1.25 (если не хотите заснуть): https://www.youtube.com/@pavlenkoat/playlists
Базовые знания Linux, сетей и bash скриптов
| Цель и что нужно для изучения + Задания | Как поймем что цель достигнута? |
|---|---|
| Linux - ядро операционной системы, например Ubuntu построена на базе Linux. Пройти курс https://youtu.be/wdaHKwvNRuU?si=UnvTogPjiVOE5PEc и сделать все задания https://github.com/eabykov/devops-linux | Может устанавливать программы, знает основные команды и может их применять, что такое ядро linux, знает какие основные папки есть в /, отвечает на вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/linux и https://github.com/bregman-arie/devops-exercises#operating-system---self-assessment |
| Linux скрипты - простые сценарии, автоматизация рутинных задач. Задание: сделать скрипты для всех заданий https://github.com/eabykov/devops-linux и задания 2,5,9 в https://github.com/bregman-arie/devops-exercises/tree/master/topics/shell | Умеет создавать и использовать переменные, может применять условный оператор IF и использовать CASE, умеет использовать циклы, вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/shell |
| Сети и сетевые технологии - как сервера (настольные ПК и тд) обьединяются в общую сеть для обмена информацией, пример интернет, глобальная сеть обьединяющая компьютеры по всему миру. Прочесть статью https://habr.com/ru/post/326574/ , https://ru.wikipedia.org/wiki/Маска_подсети и https://habr.com/ru/post/711578/ , посмотреть про websocket https://youtu.be/19d4AXt3dSI | Как подключиться по SSH и как работает SSH, что такое 'пакет', уровни TCP/IP, что такое DNS, что такое HTTP/HTTPS протокол и REST API, что такое IP и маска подсети, как на linux посмотреть сетевые интерфейсы, сниффинг трафика, что такое Nginx (как выглядит конфиг) и round-robin балансировка, вопросы https://github.com/bregman-arie/devops-exercises#network и https://github.com/bregman-arie/devops-exercises/tree/master/topics/dns |
Git система контроля версий и автоматизация с помощью GitLab CI/CD
| Цель и что нужно для изучения + Задания | Как поймем что цель достигнута? |
|---|---|
| Git - система управления версиями для совместной работы над проектом и в случае чего удобному восстановлению к более старой версии https://youtu.be/EeARyFrZsnU . Пройти курс https://www.youtube.com/watch?list=PLg5SS_4L6LYstwxTEOU05E0URTHnbtA0l до 15 урока и создать свой репозиторий на github с несколькими ветками и тегами | Знает что такое commit и как его делать, умеет делать branch и tag и знает в чем между ними разница, знает что такое merge и как исправлять конфликты, знает как откатиться на более старую версию, как склонировать репозиторий локально и как загрузить свои изменения в github, в чем разница межу fetch и pull, вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/git |
| CI/CD - выполнение автоматически действий по триггеру, например commit в master, создание merge, создание tag или cron расписанию. В курсе https://www.youtube.com/watch?list=PLg5SS_4L6LYstwxTEOU05E0URTHnbtA0l 15й и 16й, https://youtu.be/tE3u1LquFcg?t=212 скорость 1.25, https://github.com/gitlabhq/gitlabhq/blob/master/doc/ci/docker/using_kaniko.md .gitlab-ci.yml как собирать Docker Image в GitLab правильно | Сделал автоматическую сборку своего Docker Image и отправку dockerhub хранилище образов (хранилище образов называют registry), GitLab CI/CD основные понятия, из каких шагов состоит идеальный CI/CD пайплайн, вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/cicd |
Контейнеризация с помощью Docker и Kubernetes
| Цель и что нужно для изучения + Задания | Как поймем что цель достигнута? |
|---|---|
| Docker - упаковка приложения в image в котором будет все что нужно для запуска https://youtu.be/aZTL2zRmOnA | Понимает зачем нужен docker, умеет создавать свой образ и пушить его в dockerhub, умеет запускать несколько образов вместе используя compose, вопросы https://habr.com/ru/company/southbridge/blog/528206/ |
| Kubernetes - приводит состояние кластера из пункта А в пункт С, нужно только обьяснить с помощью yaml манифестов чего хотим в пункте С. Пройти курс https://learn.microsoft.com/ru-ru/training/modules/intro-to-kubernetes/ вместе с https://github.com/eabykov/kubernetes и поставить локально linkerd (посмотреть какие сервисы взаимодействуют, есть ли ошибки, сколько запросов в секунду) | Понимает зачем нужен Kubernetes, как устанавливать приложения через helm, вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/kubernetes |
Примерный порядок изучения технологии:
- Docker: https://roadmap.sh/docker
- Kubernetes: https://roadmap.sh/kubernetes
Мониторинг, золотые сигналы и логгирование
| Цель и что нужно для изучения + Задания | Как поймем что цель достигнута? |
|---|---|
| Мониторинг - сбор исторических данных о нашей системе https://youtu.be/wDan20_WyNg использовать пример https://github.com/ruanbekker/docker-monitoring-stack-gpnc , Linux серверах, показателей приложений и их логов, сетевых метрик, и оповещение, если что-то пошло не так. Prometheus + Grafana + любые экспортеры, ELK стек https://youtu.be/ZcC3BTChCY0?t=110 и https://github.com/docker/awesome-compose/tree/master/elasticsearch-logstash-kibana , Трейсинг https://youtu.be/7Dyf4AiUAcQ | Понимает как создавать алерты (оповещения), может настроить мониторинг Docker, linux host, в Kubernetes установить https://github.com/prometheus-community/helm-charts/tree/main/charts/kube-prometheus-stack , вопросы https://github.com/bregman-arie/devops-exercises#prometheus , https://github.com/bregman-arie/devops-exercises#monitoring и https://github.com/bregman-arie/devops-exercises#elastic |
Логгирование в Kubernetes: https://kubernetes.io/docs/concepts/cluster-administration/logging/
Золотые сигналы: https://habr.com/ru/companies/southbridge/articles/688082/
- Процент успешных запросов
- RPS (requests per second) - количество запросов в секунду
- время обработки запросов
Автоматический мониторинг золотых сигналов (Golden metrics) с помощью Linkerd: https://linkerd.io/2.13/features/telemetry/
Пример алерта в AlertManager который срабатывает по условию из Prometheus
Готовые алерты брать тут: https://github.com/samber/awesome-prometheus-alerts/blob/master/_data/rules.yml
Примеры работы с логами в ELK:
- Приложения database записывает логи на диск в файл: 2023-10-11 18:45:01 INFO Application ready
- Приложения web-app записывает логи на диск в файл: 18:45:02 2023-10-11 error: failed to start
Логи которые попадут в Elasticsearch (формат JSON):
IaC - (Инфраструктура как код) создание серверов с помощью Terraform и настройка с помощью Ansible
| Цель и что нужно для изучения + Задания | Как поймем что цель достигнута? |
|---|---|
| Ansible - упарвляет конфигурацией хостов по SSH https://youtu.be/23Zec3ORJOY . Пройти курс https://www.youtube.com/watch?list=PLg5SS_4L6LYufspdPupdynbMQTBnZd31N 1,6,10,12,14,15,19 не по названию | Понимает зачем нужен Ansible, что такое идемпотентность, что такое playbook, умеет писать свои роли, вопросы https://github.com/bregman-arie/devops-exercises/tree/master/topics/ansible |
| Terraform https://youtu.be/ph4iNA0Uuko . Пройти курс https://www.youtube.com/watch?list=PLg5SS_4L6LYujWDTYb-Zbofdl44Jxb2l8 1,3,6,7,12,14,16,18 не по названию | Понимает зачем нужен Terraform, знает как создавать ресурсы (например виртуальную машину), где хранится состояние (информация) о том что сделал terraform, вопросы https://habr.com/ru/company/southbridge/blog/528206/ |
Генерация пары SSH ключей:
Файловая структура Ansible role:
Пример файла roles/prometheus/tasks/main.yml:
Вопросы на собеседовании
Хороший набор ответов: https://habr.com/ru/articles/775560/
Linux
Что такое systemd 1. Где находится конфигурация 1. Какие основные поля в конфигурации 1.
Какие есть kill сигналы? 1. Когда мы во время выполнения команды жмем Ctrl + C то какой сигнал отправляется? 1.
Что такое ядро Linux? 1. Как посмотреть веросию ядра Linux? 1. Что такое системные и вызовы и какие бывают?
- Какой командой посмотреть сетевые интерфейсы?
- Какой командой посмотреть какие приложения занимают те или иные порты?
- Как забрать права на доступ к файлу или директории в linux?
Как можно запланировать выполнение комманды по расписанию, например каждую минуту? 1. Как помотреть список уже запланированных заданий? 1.
Что такое SSH? 1. Что нужно чтобы подключиться к удаленному серверу через SSH? 1. Как посмотреть запущен ли SSH сервер на linux хосте? 1. Где находится конфигурация SSH сервера? 1. Где хранятся ssh ключи текущего пользователя?
- Как установить программму в Linux Ubuntu?
- Как обновить все программы?
- Как посмотреть информацию о комманде или программе?
- Как заменить одно слово на другое в файле?
Как редактировать файл в Linux? 1. Что такое файловый дискриптор?
- Как посмотреть запущенные процессы?
- Как завершить запущенный процесс grafana?
Git
Как создать новую ветку? 1. Как переключиться на другую ветку?
- Как откатиться на несколько версий назад чтобы последние изменения ищезли?
- Как отправить наши текущие изменения в удаленный репозиторий?
Как выполнить добавление изменений из одной ветки в другую? 1. Что делать если при этом возник конфликт?
- Как скачать себе локально последние изменения из удаленного репозитория (репозиторий уже есть на компьютере)?
- Чем отличается tag от branch?
- Чем отличается fetch от pull?
GitLab
Что такое GitLab CI/CD и CI/CD в целом? 1. Какие поля есть в шагах (stages)? 1. Как хранить пароли? 1. Как сделать так чтобы два или больше шагов запускались одновременно?
- Что такое артефакты и где они хранятся
- Что такое stage, preprod, prod окружения?
- Как склонировать себе локально git репозиторий из gitlab используя ssh?
Сеть и сетевые технологии
- Что такое прокси и чем отличается от VPN?
- Что такое балансировщик нагрузки?
- Что такое кэширующий сервер и какие проблемы решает?
Что такое выделенный IP адресс в cloud? 1. Как правильно ограничить трафик к нашему приложению чтобы оно было доступно только нам? 1.
Какие есть уровни модели TCP/IP и пример протоколов на каждом из них? 1.
В чем разница между TCP и UDP? 1. Что такое трехстороннее рукопожатие? 1.
В чем разница между HTTP и HTTPS? 1. Опишите жизненный цикл запроса HTTP 1. Какие существуют методы HTTP? 1. Какие существуют коды/статусы ответа HTTP? 1. Какие распространненые заголовки HTTP? 1. Что такое TLS и как работает? 1. Что такое SMTP и как работает? 1. В чем разница между IP и MAC адресами? Для чего они используется? 1. Какие основные виды HTTP запросов существуют?
- Что такое TTL (Time to Live)?
- Как работает DHCP?
Что такое DNS сервер? 1. По какому протоколу работает? 1. Что должен делать если не нашел запись у себя в конфигурации?
Docker и работа с упакованными в контейнер приложениями
- Чем контейнеризация Docker отличается от виртуализаии?
- Чем отличается контейнер от образа (image)?
Как создать свой образ docker? 1. Что такое базовый образ? 1. Чем хорошо образ alpine linux и чем он отличается например от образа ubuntu linux? 1. В чем отличия между COPY и ADD? 1. Есть ли отличия между CMD и ENTRYPOINT и можно ли их использовать вместе? 1. Где лучше хранить собраные образы docker? 1.
Как запустить несколько образов вместе на своем компьютере для тестирования? 1. Можно ли в docker compose ограничить использование RAM и CPU для отдельных контейнеров? 1. Сохранятся ли данные записанные приложением в контенйнере на диск после его перезапуска? 1. Что такое volumes и для каких приложений использовать их нужно? 1. Как настроить контейнер так чтобы он перезапускался сам если приложение внутри сломается?
- Где хранятся volumes и logs в docker?
Облачные технологии
- Для чего нам вообще нужны облака?
- Что такое SaaS, PaaS и IaaS, в чем между ними разница?
- Что такое VPC, Security Group и EIP например в AWS?
Ansible и Terraform (инфраструктура как код)
- VPC, виртуальные машины или например EIP каким бы инструментом создавал?
- Устанавливал бы docker на linux машину, обновлял сервис, давал права на директорию?
Kubernetes или коротко k8s
Какие компоненты должны быть установлены на master node? 1. А какие на worker node? 1.
Что такое etcd? 1. Какой тип у этой базы данных? 1. Почему в etcd должно быть нечетное количество реплик? 1.
Как настраивается сеть в k8s? 1. Что такое CNI? 1. Каким образом каждому pod выдается отдельный IP? 1.
Что такое service? 1. Как с помощью service обратиться к pod в другом namespace? 1. Является ли service DNS именем? 1. По какому правилу service будет распределять трафик между pod? 1. Чем отличаются service вида headless и clusterIP? 1.
Какие виды prob вы знаете? 1. Для чего нужна каждая из них? 1.
Сколько контейнеров может быть в одном pod? 1. Нужно ли создавать service для того чтобы контейнеры отправляли друг другу запросы в рамках одного pod? 1.
Какие ingress контроллеры вы знаете? 1. Что такое ingress, какие ресурсы он связывает на сетевом уровне? 1. Как в ingress использовать SSL сертификаты?
- Чем отличаются annotations от labels и приведите по одному примеру использования?
- Основные различия между Deployment, StatefulSet и DaemonSet?
Что такое lifecycle хуки? 1. Для чего используется preStop хук с sleep 10 функцией? 1.
Для чего нужны лимиты (limits) и запросы (requests) у pod? 1. HPA при расчетах использует limits или requests? 1. Планировщик при выборе на какую node размещать pod учитывает limits?
- Каким образом можем ограничить права пользователей в k8s?
- Чем так удобны helm charts?
- Какие основные компоненты чарта?
- Что находится в файле values.yaml и Chart.yaml?
- Для чего в папке templates создают файл _helpers.tpl?
- Как создать цикл который создаст несколько сущностей (например ports в service)?
- Как сделать условный оператор для boolean значений и для строк?
- Что будет записано вместо темплейта {{ divf .Values.replicaCount .Values.zones | ceil }}? Как может пригодиться читать тут https://github.com/eabykov/devops-kubernetes/blob/main/ЛУЧШИЕ_ПРАКТИКИ.md в коментарие к разделу Распределите ваши pod по разным node и разным зонам (датацентрам)
Vault
- Для чего нужен Vault?
- Что такое KV secrets engine в vault?
- Как сделать так чтобы в Kubernetes использовать например для Deployment секреты из Vault?
Сервисная сетка (service mesh)
Jaeger трейсинг запросов
- Что нужно сделать в приложении чтобы его трейсы появились в Jaeger?