Тестирование Huawei Dorado5000 V3
Пару недель назад ко мне в руки попал массив Huawei Dorado5000 V3. Делать полноценный обзор я не вижу особого смысла, т.к. о нём неплохо рассказала компания КРОК в своём блоге на Хабре. Поэтому я ограничусь результатами нашего тестирования, сравнения с массивом NetApp, и своими замечаниями за время теста.
К нам попал точно такой же (а может и тот же) Huawei Dorado5000 V3 с 24 NVMe-дисками. Хочется сразу отметить, что поддержка NVMe реализована на сегодняшний день только на BackEnd’е, а вот когда она будет готова для FrontEnd’а — пока точной информации нет.
Ещё один интересный момент, который упустили в своём обзоре коллеги из КРОКа — массив использует технологию RAID2.0+, т.е. всё пространство виртуализируется, разбивается на чанки, а уже из них строится RAID. Аналогично и со spare-дисками, это пространство размазывается по всем дискам в массиве, и, при выходе из строя одного из дисков, ребилд идёт на все диски в системе, что ускоряет этот процесс по сравнению с классическими RAID, собранными из целых дисков.
Конфигурация стенда: 5 серверов Lenovo SR850
Подключены через коммутаторы Huawei 10Gb/s по iSCSI. VMware 6.5
Диски на массиве бились на 2 группы по 12 в каждой. Тестирование проводилось в R5 и R6, но разницы в производительности мы не заметили.
Но вернёмся к тестам и сравнению. В самом начале я сказал, что буду сравнивать его с NetApp FAS. Компания Huawei позиционирует Huawei Dorado5000 V3 как конкурента системе NetApp AFF A300.
Но дело в том, что с физической точки зрения AFF A300 и FAS 8200 — это одна и та же железка. Разница заключается лишь в версии ONTAP, которая для AFF серии оптимизирована под SSD диски — оттуда выброшена поддержка классических дисков и она показывает большую производительность на SSD нежели FAS. А как раз-таки FAS 8200 имеется в нашем арсенале оборудования и перед введением его в эксплуатацию мы проводили тестирование его производительности тем же профилем, что тестировали сейчас Huawei. Так что у нас есть неплохая возможность попытаться их сравнить, но с некоторыми оговорками, о которых чуть позже.
Начнём с главного:
Профиль сложный для любой СХД, тут и переменный блок и нагрузка на чтение и запись 50/50. На СХД нарезалось 6 лунов по 2Тб, по 3 луна на каждый контроллер. На каждом луне создавалось по 10 виртуальных машин и их диски предварительно заполнялись рандомными данными. После этого уже запускался сам тест. Тест проводился в 2 вариантах — с включенными и выключенными технологиями эффективности хранения (компрессия и дедупликация). Аналогичные тесты мы проводили и для FAS 8200 около 2 лет назад.
Как я уже говорил — на каждом луне запускались 10 виртуальных машин с запущенным тестом fio. Конечно этого количества для обоих массив было слишком много, поэтому мы постепенно снижали нагрузку на луны, добиваясь максимального показателя IOPS при адекватной задержке в 2-3 мс. Максимальное количество IOPS при таком отклике и указано на графике.
Тут стоит немного прокомментировать относительно NetApp FAS: два года назад мы были менее опытными в отношении массивов NetApp и не знали, что можно изменять блок, которым производится инлайновая компрессия. По-умолчанию его размер составляет 32k, но для получения бОльшей производительности рекомендуется использовать 8k. Так же стоит отметить, что мы включали и инлайн дедупликацию, которая по-умолчанию для гибридных систем отключена и не рекомендуется её использовать с точки зрения производительности. Дело в том, что в случае AFF систем, приоритет всегда отдаётся производительности и если ресурсов системы начинает не хватать, дедупликация и компрессия уходят на второй план и им отдаётся минимальный приоритет. Такая же ли схема работы механизма на гибридных системах — неизвестно.
Теперь перейдём к частностям:
- На графике помимо моделей массивов указаны так же и прошивки, на которых они тестировались. Дело в том, что для Huawei использовалась самая свежая на сегодняшний день для этого массива прошивка — V300R002C10. NetApp же 2 года назад тестировался на прошивке 9.1. Но не будет секретом то, что с выходом каждой новой прошивки — производительность увеличивается. К сожалению у меня нет такого графика именно для FAS систем, но есть для AFF
- Как я уже говорил ранее — производительность на SSD между FAS и AFF системами, даже на одной и то же платформе — отличается. График-сравнение мне найти не удалось, но по факту это так.
Можно сделать вывод, что даже на со старой прошивкой и без дополнительной оптимизации по Flash, конкурентные массивы NetApp выигрывают по производительности.
Но это ещё не всё. За время тестов было найдено и несколько функциональных недочётов в массиве Huawei Dorado5000 V3:
- Нет поддержки VLAN. Точнее невозможно изменить VLAN на порту. Но это уже мелочи, ведь изначально открыв документацию, я увидел необходимую мне вкладку, которую на массиве найти не удалось. Подумав, что на массиве не самая свежая версия прошивки и обновив его, к моему удивлению я не нашёл данной вкладки и после.
Из документации:
Мой скриншот: - Нет поддержки файлового доступа, хотя такая возможность так же заявлена в документации. Но как подсказали коллеги, файловый доступ будет доступен при покупке дополнительного NAS Unit, а по сути сервер-шлюз, который подключается к массиву и обеспечивает поддержку файловых протоколов.
- Отключение компрессии и дедупликации на луне возможность только путём пересоздания луна. Соответственно при запуске системы необходимо сразу определиться – требуется большая производительность или эффективность хранения.
- Процесс обновления системы осложняется наличием постоянных ошибок и варнингов о состоянии системы, с необходимостью ручной проверки логов на самом массиве. При этом ошибки и варнинги не относятся к текущему состоянию массива, а реагируют на любые несоответствия логов и состояния массива эталону (к примеру, не подключенные порты). Это осложняет процесс обновления и сильно затягивает процесс по времени.
- Показатели мониторинга на массиве (времени отклика) не соответствует действительности. В итоге мониторинг отклика по лунам производили со стороны VMware. Дикие задержки на дисковом домене:
Крайне низкие задержки на лунах (в тот же момент времени!): - Не смогли настроить CHAP авторизацию, т.к. поле для ввода на массиве поддерживает только от 16 до 20 символов, а наш пароль – длиннее. Возможность сменить пароль на хостах не представляется возможным, т.к. пришлось бы перенастраивать авторизацию на продуктивных массивах с отрыванием лунов.
Но давайте всё-таки добавим и немного хорошего, а именно плюсы:
- Простота интерфейса и использования. Даже в консоли мне не удалось найти каких-то глубоких настроек системы для тонкого тюнинга.
- Производительность. Учитывая цену примерно в 2 раза более низкую по соотношению с тем же AFF A300 — с точки зрения IOPS/$ получается неплохое соотношение.
- Компрессия и дедупликация. На наших тестовых рандомных данных, мы получили неплохой коэффициент — 1:4, при этом практически без влияния на производительность.
- RAID2.0+. Также как я считаю плюсом виртуализацию дисков у NetApp, также не могу отметить это и у Huawei. Хотя сейчас всё-таки большинство A вендоров уже реализовали такой подход так или иначе.
- Возможность использовать для импортозамещения. Не знаю писать ли это всё-таки в плюсы или в минусы, но для многих на сегодняшний день это крайне актуально.
Подводя итог, я могу сказать, что в целом система мне понравилась. Да, документация оставляет желать лучшего, поэтому по каждому чиху придётся отправляться к саппорту, хотя мне ребята из Huawei отвечали крайне оперативно, за что им отдельное спасибо. Простота развёртывания и поддержки также сделает эксплуатацию этой системы довольно простой, для тех, кто представляет что такое СХД, и не потребует много времени для какого-то тонкого тюнинга или сложной настройки дисков или сетей. Показатель IOPS/$ для нас оказался очень интересным (я как всегда делаю акцент на том, что цены для разных заказчиков могут отличаться как в большую, так и в меньшую сторону). Из интересных возможностей мне не удалось только познакомиться с HyperMetro, ввиду отсутствия второй системы, было бы очень интересно посмотреть на его работу. Но весь «основной» необходимый функционал есть, снепшоты работают, интеграция с Veeam имеется, так что в целом система как минимум достойна вашего внимания, если вы рассматриваете вопрос приобретения новой СХД. Ну и всегда можно договориться с дистрибьютером о проведении тестирования именно на ваших нагрузках, благо, как я понимаю, с демофондом Huawei проблем не имеет.