Как построить надежную инфраструктуру для сервиса интеграции с маркетплейсами: опыт XWAY

Мы покажем вам, как сервис обеспечивает максимальную производительность и отказоустойчивость, гарантирует быстрые соединения и автоматизирует повседневное управление инфраструктурой.

Как построить надежную инфраструктуру для услуг рыночной интеграции: опыт XWAY

О компании

Компания XWAY разработала платформу управления рекламой и интегрировала ее с ведущими российскими торговыми площадками, такими как Wildberries, Ozon, Яндекс.Маркет и Мегамаркет.

Тысячи продавцов пользуются услугами XWAY, и каждый продавец продает свою продукцию на нескольких торговых площадках одновременно. Они все хотят единого окна для:

  • Обновляйте контент продукта (фотографии, описания и т д.) на всех платформах одновременно,
  • Обновляйте цены и остатки товаров на всех сайтах,
  • Получать данные о заказах со всех сайтов,
  • Получите комплексные данные анализа продаж,
  • Автоматически управляйте своими рекламными кампаниями.

Чтобы избежать интеграции с каждой торговой площадкой по отдельности, XWAY предоставляет единый кроссплатформенный API. Для решения вопросов, связанных с контентом — система PIM (управление информацией о продукте); для управления рекламой — сервис XWAY ADV, который обеспечивает интеллектуальное продвижение на основе системы искусственного интеллекта и анализа XWAY AI.

Помимо пользовательских сервисов, существует более десятка внутренних инструментов: систем, средств автоматизации и других элементов для сбора и хранения данных.

Задачи компании

  • Достижение максимальной производительности и отказоустойчивости.
  • Обеспечивает быстрые и надежные сетевые соединения.
  • Автоматизируйте повседневное управление инфраструктурой.

Вызовы и решения

На ранних этапах инфраструктура XWAY была распределена по различным хостинговым платформам и управлялась внешними подрядчиками. Такой подход начал приводить к трудностям в обеспечении согласованности, сложному масштабированию и возросшей зависимости от сторонних экспертов.

Осознав необходимость централизованного управления инфраструктурой, команда XWAY сформировала собственную команду ИТ-экспертов. Следующим шагом станет перенос ключевых компонентов сервиса в инфраструктуру одного провайдера и внедрение инструментов оркестровки. Это облегчает управление вычислительной мощностью.

Добиться максимальной производительности и отказоустойчивости

Инфраструктура платформы XWAY рассчитана на большой трафик, большие данные и высоконагруженные вычисления, включая обработку изображений и искусственный интеллект.

Каждую секунду сервис XWAY получает более 1000 запросов от продавцов. В этом случае нагрузка на платформу переменная. В течение маркетингового периода трафик услуг будет расти в геометрической прогрессии. В настоящее время необходимо оперативно наращивать вычислительную мощность для обеспечения стабильной работы платформы.

Платформа собирает и анализирует большой объем информации. Некоторые из этих записей превышают 1 000 000 000. В некоторых задачах продавцам необходимо загружать отчеты в виде больших XML-файлов, которые система анализирует и распределяет по полям в базе данных. Пользователи ожидают, что аналитика будет загружаться мгновенно, поэтому быстрое извлечение и обработка данных имеют решающее значение.

Кроме того, платформа включает в себя множество компонентов, требующих особой производительности. Например, нейронные сети были внедрены в PIM-системы, которые увеличивают изображения продуктов, если они слишком малы и не соответствуют минимальным требованиям рынка.

Эти и другие задачи предъявляют высокие требования к производительности инфраструктуры. При этом отказоустойчивость также является одним из ключевых приоритетов, поскольку любая недоступность сервиса, даже на несколько минут, может привести к финансовым потерям.

Мы взяли лучшее из разных видов хостинга

По мере развития платформы команда XWAY наращивает ее вычислительную мощность. Для достижения оптимальной производительности она решила объединить различные модели использования ресурсов.

Таким образом, производственная часть сервиса развернута на базе облачной платформы Selectel, включая облачные серверы, управляемые кластеры Kubernetes и базы данных. Вспомогательные компоненты и тестовые среды развернуты на выделенных серверах и собственном оборудовании компании. Он также размещен в центрах обработки данных Selectel.

Наиболее отказоустойчивые компоненты — кросс-маркетплейсный API и платформа управления рекламой — развернуты в управляемом Kubernetes. Сервис позволяет автоматически добавлять ресурсы при увеличении нагрузки и автоматически сворачивать ресурсы при уменьшении нагрузки. Главные узлы кластера расположены в разных частях пула, что делает инфраструктуру географически распределенной и отказоустойчивой. Кроме того, надежность кластера гарантируется автоматическим восстановлением узлов: если один из узлов не отвечает на проверку, для его замены автоматически создается новый.

На облаке и выделенных серверах развернут кластер PostgreSQL — это основная реляционная СУБД для хранения высокоцелостных и сложных данных, поддерживаемых транзакциями.

На собственных серверах мы развернули аналитическую систему на базе ClickHouse — СУБД, оптимизированной для быстрой обработки больших объемов данных и формирования отчетов в режиме реального времени. Мы также развернули на нашем оборудовании тестовый кластер с гипервизором Proxmox.

Мониторинг состояния вашей инфраструктуры является одним из важнейших аспектов поддержания стабильной работы сервисов. Благодаря инструментам мониторинга, регистрации и отслеживания команда XWAY может быстро выявлять узкие места и предотвращать потенциальные сбои, тем самым повышая общую устойчивость системы.

Объединив различные типы хостинга в одной инфраструктуре, команда XWAY получила:

  • Производительность и гибкость настройки ресурсов: ведь некоторые сервисы требуют большого количества ядер ЦП, некоторые — большого объема оперативной памяти, а некоторые — большого размера и скорости сетевых дисков;
  • Масштабируемость: возможность быстрого увеличения ресурсов в периоды высокой нагрузки и уменьшения ресурсов в периоды низкой нагрузки;
  • Отказоустойчивость: компоненты инфраструктуры, в которых размещаются производственные службы, имеют несколько уровней избыточности;
  • Оптимизация затрат: сервисы с переменной нагрузкой развертываются в облаке и оплачиваются по требованию, тогда как компоненты со стабильной нагрузкой развертываются на выделенных серверах и собственных серверах.

Обеспечить быструю и надежную стевую связность

Производительность сети играет ключевую роль в обеспечении стабильной и эффективной работы сервисов XWAY, особенно при наличии большого количества компонентов инфраструктуры, высоких нагрузок и больших объемов данных.

Производственная часть инфраструктуры размещена за сервером с балансировкой нагрузки и подключена к CDN для доставки контента

Сетевой запрос от пользователя поступает на сервер балансировки нагрузки, который затем передает запрос по локальной сети. Такой подход позволяет закрыть доступ к вашей инфраструктуре извне и защитить ее от DDoS-атак.

XWAY использует сетевое соединение с пропускной способностью 25 Гбит/с. Они обеспечивают быструю синхронизацию данных между узлами инфраструктуры и отказоустойчивость критически важных сервисов. Высокая скорость сети важна для:

  • Балансировка нагрузки между серверами;
  • Быстрая работа кросс-рыночных API для обработки больших объемов запросов;
  • Репликация баз данных и распределенных файловых систем.

Для оптимизации скорости обслуживания и ускорения загрузки используется комбинация объектного хранилища S3 и CDN. Объектное хранилище хранит статические и медиафайлы (например, изображения из PIM-системы и данные из CMS). Файлы помещаются в S3, а затем доставляются конечному пользователю через CDN.

Автоматизировать рутину в управлении инфраструктурой

ИТ-отдел XWAY стремится автоматизировать как можно больше ручной работы и процессов, чтобы сосредоточиться на стратегическом развитии инфраструктуры и внедрении новых технологий.

Внедрение инфраструктуры в качестве инструментов кода

По мере увеличения рабочей нагрузки команде становится важно быстро развертывать новые сервисы и обновлять существующие. Перейдя на решение Selectel, команда XWAY реализовала методологии «Инфраструктура как код» (IaC) и CI/CD. Это автоматизирует управление ресурсами и сокращает время, затрачиваемое на настройку среды. XWAY широко использует контейнеризацию и Kubernetes для управления микросервисами и распределенными системами. Управляемые сервисы Kubernetes помогают XWAY гибко управлять нагрузкой, балансировать ресурсы и ускорять развертывание новых компонентов.

Результаты

Как построить надежную инфраструктуру для услуг рыночной интеграции: опыт XWAY

Как построить надежную инфраструктуру для услуг рыночной интеграции: опыт XWAY

Как построить надежную инфраструктуру для услуг рыночной интеграции: опыт XWAY

Инфраструктура, с которой мы начинали, была довольно запутанной. По мере роста сервиса и расширения команды экспертов стала очевидной необходимость выбора надежного поставщика ИТ-услуг. Мы выбрали Selectel, потому что четко понимали, что нам нужно: возможность аренды облачных и выделенных серверов, большой выбор услуг, при этом для нас особенно важны управляемый Kubernetes и управляемые базы данных. Размещение сервиса на инфраструктуре Selectel обеспечивает нам высокий уровень отказоустойчивости, масштабируемости и безопасности, что крайне важно для работы в сфере электронной коммерции и интеграции с торговыми площадками.

Как построить надежную инфраструктуру для услуг рыночной интеграции: опыт XWAY

Вячеслав Щербаков XWAY CTO

Хотите получить такие же результаты? Переносите свои проекты в Selectel бесплатно и получайте до 1 000 000 бонусов за продукты в подарок!

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх