NeverHard

Senior Linux Administrator / Infrastructure Administrator at Gaijin Games — NeverHard

Senior Linux Administrator / Infrastructure Administrator at Gaijin Games in Астана. Apply on NeverHard.

Company: Gaijin Games
Location: Астана
Type: not_specified

Remote: Yes

Gaijin Entertainment ищет Senior Linux Administrator в инфраструктурную команду. Мы делаем онлайн-игры класса ААА («War Thunder», «Enlisted»и др.) и поддерживаем внутреннюю инфраструктуру , на которой живет разработка, тестирование, CI/CD, сервисы для команд и часть production/support-систем. Это не позиция build engineer: у нас есть отдельные люди, которые занимаются логикой сборок. Здесь фокус на системном администрировании, надежности серверов, автоматизации, IaC и инфраструктуре вокруг разработки. Это senior-роль , где можно заметно влиять на то, как устроена инфраструктура большой игровой студии. У нас уже есть живой и мощный фундамент: серверы, виртуализация, build/test-парк, storage, сети, мониторинг, бэкапы, IaC и внутренние инструменты. При этом мы не считаем инфраструктуру “законченной”: ее можно и нужно делать проще, надежнее, понятнее, удобнее и измеримее. Чем предстоит заниматься: Администрировать Linux-инфраструктуру: серверы, сервисы, доступы, обновления, диагностику, сетевые настройки, системные проблемы и инциденты. Развивать Infrastructure as Code: описывать инфраструктуру кодом, поддерживать конфигурации ролей и хостов, делать изменения через Git/Gerrit, code review и CI. Участвовать в большом плановом переходе всей инфраструктуры с SaltStack на Ansible. Это не “переписать YAML ради YAML”, а возможность вместе с командой спроектировать современную IaC-платформу: inventory, роли, секреты, CI-проверки, rollout-процессы и правила эксплуатации. Поддерживать большой парк build/test nodes: Windows, Linux и macOS-машины, мощные workstation/server-class конфигурации, GPU-ноды и специализированные тестовые окружения. Build-команда отвечает за логику сборок, а инфраструктурная команда отвечает за то, чтобы этот парк был воспроизводимо подготовлен, доступен, мониторился и управлялся через IaC. Администрировать физическую инфраструктуру: серверы, сетевое оборудование, дисковые массивы и полки, shared storage для виртуализации, IPMI/iDRAC и сопутствующую датацентровую обвязку. Работать со storage-слоем: iSCSI, multipath, LVM, shared block storage, диагностика latency, корректность clone/backup/restore, плановые maintenance-процедуры. Поддерживать виртуализацию и серверные платформы: Proxmox, Linux VM, сетевые и storage-зависимости, шаблоны, provisioning и эксплуатационные процедуры. Работать с инфраструктурой вокруг CI/CD: Jenkins/Gerrit, агенты, системные зависимости, доступность машин, мониторинг, логи и базовая автоматизация. Поддерживать инфраструктурные сервисы: Docker, nginx, DNS, VPN, мониторинг, логирование, backup/restore, внутренние сервисы для команд разработки. Работать с частью серверов в AWS: эксплуатация, доступы, сеть, security groups, диагностика. Участвовать в улучшении внутренних инструментов: у нас много инженерного кода в Gerrit — IaC, мониторинг, backup tooling, access management, inventory, Jenkins-интеграции, automation scripts и shared libraries. Использовать AI-инструменты в повседневной работе: для анализа кода и конфигураций, генерации черновиков автоматизаций, ревью изменений, поиска аномалий и ускорения рутинных инженерных задач. Мы любим автоматизацию и хорошо относимся к людям, которые умеют превращать повторяющуюся ручную работу в код. Предлагать архитектурные улучшения: делать инфраструктуру проще, надежнее, наблюдаемее и удобнее для команды; снижать количество ручных операций; превращать повторяющиеся проблемы в автоматические проверки, понятные процедуры или устойчивые технические решения. Вести задачи прозрачно: фиксировать статус, закрывать выполненное, заранее поднимать blockers, обсуждать решения с командой. Что мы ожидаем: Опыт системного администрирования Linux от 5 лет. Глубокое понимание Linux: systemd, users/groups, permissions, storage, network stack, firewall, package management, logs, performance troubleshooting. Опыт с Infrastructure as Code / configuration management: SaltStack, Ansible, Puppet или похожие инструменты. Опыт эксплуатации серверного железа: bare metal, RAID/HBA, IPMI/iDRAC/iLO или аналоги, диагностика hardware-проблем. Понимание storage на уровне senior-админа: block devices, multipath, iSCSI, LVM, filesystems, влияние storage-проблем на виртуализацию и сервисы. Практическое понимание сетей: TCP/IP, VLAN, routing, NAT, firewall, VPN, DNS, диагностика через tcpdump, ss, ip, dig, traceroute. Опыт с Docker и Linux container runtime на уровне эксплуатации. Умение писать скрипты на Python или shell для автоматизации рутинных задач. Опыт работы с Git и code review-процессом. Понимание мониторинга, алертинга, логирования и incident response. Способность предлагать архитектурные решения, аргументировать их, обсуждать с командой и доводить до production. Интерес к AI-assisted engineering и автоматизации. Не нужно быть ML-инженером, но важно быть готовым использовать современные инструменты как часть инженерного процесса. Английский на уровне чтения документации и технической переписки. Будет плюсом: Опыт проектирования Ansible-инфраструктуры: inventory, roles, collections, secrets management, CI validation, безопасные rollout-процессы. Опыт с Proxmox, oVirt, VMware или другой виртуализацией. Опыт эксплуатации shared storage, дисковых массивов и полок. Опыт с Juniper/Dell или другим сетевым оборудованием. Опыт с Jenkins/Gerrit как с инфраструктурой: агенты, executors, credentials, nodes, системные проблемы, интеграции, мониторинг. Опыт поддержки больших парков build/test nodes или CI-агентов. Опыт с AWS: EC2, VPC/security groups, IAM basics, storage, troubleshooting. Опыт с Icinga, Grafana, Telegraf, Wazuh, Bacula или похожими инструментами. Опыт администрирования Windows/macOS как части инфраструктурного парка будет плюсом, но основная роль остается Linux/admin/IaC. Опыт миграций между CM-системами, особенно SaltStack -> Ansible. Что у нас есть: Большая инфраструктура игровой студии: серверы в нескольких локациях, Linux-сервисы, Proxmox, AWS, Jenkins/Gerrit, мониторинг, бэкапы, VPN, сетевое оборудование, дисковые полки и внутренние платформы для разработки и тестирования. У нас не “пара билд-агентов под столом”, а 200+ build/test nodes: много машин на AMD Threadripper с десятками потоков и большим объемом RAM, GPU-ноды NVIDIA RTX-класса, Apple Silicon для macOS-задач и отдельные стенды под специализированные тесты. Build-команда отвечает за логику сборок, а инфраструктурная команда делает так, чтобы этот парк был воспроизводимо подготовлен, доступен, мониторился и управлялся через IaC. Живая IaC-культура: инфраструктурные изменения проходят через Git/Gerrit, code review и CI. Сейчас большая часть инфраструктуры управляется через SaltStack, и мы начинаем большой плановый переход всей инфраструктуры на Ansible. Это шанс не поддерживать чужой “зоопарк ролей”, а вместе с командой спроектировать современную IaC-платформу для большой игровой студии. Мы активно используем AI в инженерной работе: анализируем конфигурации, ускоряем ревью, пишем и улучшаем автоматизации, разбираем инциденты и сокращаем ручную рутину. Нам нравятся инженеры, которые не боятся новых инструментов и умеют применять их прагматично. Сложные и интересные задачи: не “поставить nginx по инструкции”, а поддерживать систему, где много команд, сервисов, железа, CI-агентов, сетевых и storage-зависимостей. Команда без лишней бюрократии, где можно влиять на решения, улучшать процессы и делать инфраструктуру удобнее для себя и для других инженеров. Почему это может быть интересно: Здесь будет место для архитектурных решений, а не только для эксплуатации. Можно предлагать, проектировать и внедрять улучшения: как устроить Ansible-платформу для всей инфраструктуры, как сделать rollouts безопаснее, как улучшить наблюдаемость, как уменьшить ручные операции, как лучше описывать железо и сервисы кодом, как быстрее находить причины проблем и как превратить повторяющиеся инциденты в автоматические проверки или понятные процедуры. Мы ценим senior-подход: не просто “закрыть задачу”, а разобраться, почему она появилась, что можно улучшить вокруг нее и как сделать так, чтобы следующему инженеру было проще. Хорошие идеи здесь не обязаны ждать отдельного “архитектурного комитета”: если решение разумное, обсужденное и полезное для команды, его можно довести до production. Нет бюрократии. Формат работы - полная удаленка. P.S. Спасибо, что полностью ознакомились с вакансией. При отклике просим указать вашу реальную локацию и финансовые ожидания в евро гросс.