ИИ в разборе инцидентов: документ без понимания
9 июня 2026 г.
ИИ способен быстро создать красивый постмортем, но именно процесс написания даёт инженерам настоящее понимание инцидента — автоматизируя текст, вы автоматизируете исчезновение обучения.
9 июня 2026 г.
ИИ способен быстро создать красивый постмортем, но именно процесс написания даёт инженерам настоящее понимание инцидента — автоматизируя текст, вы автоматизируете исчезновение обучения.
9 июня 2026 г.
Agentgram — Go-мультиплексор, который объединяет агентов на REST, A2A и Google ADK за одним API-эндпоинтом с RBAC, персистентными сессиями и MCP-сервером.
9 июня 2026 г.
SlimFaas — минималистичная FaaS-платформа для Kubernetes с автомасштабированием 0→N по HTTP, Kafka-лагу и PromQL, встроенным KV-хранилищем и поддержкой scale-to-zero из коробки.
8 июня 2026 г.
В Kubernetes нет понятия «вход» в отличие от OpenShift с его OAuth-сервером. Авторы AuditRadar построили эвристику сессий через credential-id сертификата и сравнили оба подхода.
8 июня 2026 г.
Автор собрал отказоустойчивый k3s-кластер на четырёх узлах Proxmox с kube-vip, MetalLB, Traefik и Rancher, автоматизировав весь стек через Ansible за 15 минут развёртывания.
7 июня 2026 г.
Статья разбирает три ключевых аспекта production-эксплуатации PostgreSQL на Kubernetes с CloudNativePG v1.28: настройку резервного копирования через плагин Barman Cloud, восстановление на момент времени (PITR) с WAL-архивированием и пулинг соединений через PgBouncer.
6 июня 2026 г.
Перезапуск Atlantis в Kubernetes занимал 30 минут из-за рекурсивного chgrp на миллионах файлов при монтировании PV. Добавление fsGroupChangePolicy: OnRootMismatch сократило время до 30 секунд.
4 июня 2026 г.
19 мая 2026 Google Cloud ошибочно заблокировал аккаунт Railway, вызвав 8-часовой глобальный сбой. Каскадный отказ распространился за пределы GCP из-за централизованного сетевого управляющего уровня.
4 июня 2026 г.
25 марта в Discord упала голосовая и видеосвязь на 3+ часа: изменение конфигурации Kubernetes уничтожило 17% сессий, что перегрузило voice syncers через узкое место в супервизорах Erlang. Команда разобрала цепочку сбоев и внедрила архитектурные улучшения.
3 июня 2026 г.
GitHub переживает рекордное число сбоев из-за резкого роста нагрузки от ИИ-агентов, инцидента с потерей данных в merge queue и незавершённой миграции в Azure. Конкуренты — GitLab, Bitbucket и стартапы — справляются с аналогичным ростом без таких проблем.