Главная - Блоги - Детали

QSFP-DD и OSFP: руководство по выбору трансивера 400G

ТЛ;ДР:QSFP-DD и OSFP — два ведущих форм-фактора трансиверов 400G, но они решают разные задачи. QSFP-DD обеспечивает обратную совместимость с QSFP28 и более высокую плотность портов, что делает его лучшим вариантом обновления. OSFP обеспечивает больший тепловой запас для высокомощной когерентной оптики и кластеров искусственного интеллекта. В этом руководстве описаны характеристики, пути миграции, общая стоимость владения, этапы развертывания и устранение неполадок, чтобы вы могли с уверенностью выбирать.

Выбор между QSFP-DD, QSFP28 и OSFP может показаться небольшой технической деталью. Это не. Это решение определяет всю вашу сетевую архитектуру, ваш будущий путь обновления и ваши долгосрочные-расходы. Выберите неправильный форм-фактор QSFP-DD или OSFP, и вы можете столкнуться с дорогостоящими циклами разрыва-и-замены или неисправными активами стоимостью в сотни тысяч долларов.
По мере того, как центры обработки данных стремятся перейти к 400G, 800G и выше, вопрос о форм-факторе продолжает вставать. Стоит ли вам придерживаться знакомой экосистемы QSFP? Сделать ставку-на OSFP для достижения максимальной производительности? Или выбрать средний путь с обратной совместимостью QSFP-DD?
ВКОБТЕЛ1, мы потратили более 20 лет на производствооптические трансиверы, Патч-корды МПО 2и высокоскоростные-оптические чипы. Мы помогли компаниям из списка Fortune 500 принять именно это решение. В этом руководстве вы найдете все необходимое: сравнение спецификаций, стратегии миграции, реальные цифры стоимости, пошаговые--инструкции по развертыванию и схемы устранения неполадок.

Quick Reference: QSFP-DD vs QSFP28 vs OSFP at a Glance

Краткий справочник: краткий обзор QSFP-DD, QSFP28 и OSFP

Прежде чем углубиться, приведем наиболее важные--сравнения:
Спецификация
КСФП28
QSFP-ДД
ОСФП
Максимальная скорость
100G
400G/800G
400G/800G/1.6T
Электрические дорожки
4×25G
8×50G/100G
8×50G/100G
Ширина
18,35 мм
18,35 мм
22,58 мм
Максимальная мощность
~6W
~15W
~25W
Обратная совместимость
КСФП+
КСФП+/28/56
Никто
Плотность портов 1RU
36 портов
36 портов
32 порта
Лучшее для
Существующие сети 100G
Плавный переход на 400G
Новые сборки AI/HPC
 
QSFP28 — сегодняшняя «рабочая лошадка». QSFP-DD – это вариант обновления, который защитит ваши существующие инвестиции. OSFP – это высокопроизводительный-вариант, созданный для развертывания с нуля. Сделайте неправильный выбор, и вы либо потратите слишком много денег, либо загоните себя в угол.

Что такое QSFP28 и где он находится сегодня?

QSFP28 (Quad Small Form-factor Pluggable 28) — это стандартный форм-фактор приемопередатчика 100G. Он использует четыре электрических линии 25G NRZ для обеспечения общей пропускной способности 100 Гбит/с в корпусе шириной 18,35 мм- и энергопотреблением до 6 Вт. С 2016 года он является основой сетей корпоративных и облачных центров обработки данных.
Основные функции:
4 электрических полосы 25G НРЗ
Ширина 18,35 мм (такая же, как у QSFP+ и QSFP-DD)
Максимальная потребляемая мощность около 6 Вт.
Развитая экосистема с широкой поддержкой поставщиков
QSFP28 доминирует в существующих корпоративных и облачных центрах обработки данных. Если вы сегодня используете сеть 100G, вы почти наверняка используетеМодули КСФП28. Вопрос не в том, заменять ли их. Это когда и как обновляться.
Форм-фактор QSFP283максимально достигает 100G без возможности обновления. Вы можете добавить больше портов, но вы не сможете добиться большей скорости с помощью одного модуля. Этот потолок и является причиной перехода на QSFP-DD или OSFP.

Что такое QSFP-DD и почему лучше всего-обновить его?

QSFP-DD (двойная плотность) удваивает количество электрических линий до восьми, сохраняя при этом ту же ширину 18,35 мм, что и QSFP28. Он поддерживает скорости 400G (8×50G) и 800G (8×100G) и обратно совместим с модулями QSFP28. Вы можете развернуть коммутаторы QSFP-DD сегодня, продолжать использовать существующую оптику 100G и перейти на 400G, заменяя модули, когда будете готовы.
Название «Двойная плотность» относится к электрическому интерфейсу, а не к физическому размеру. QSFP-DD достигает этого за счет добавления второго ряда электрических контактов в чуть более глубокий разъем. Снаружи, аQSFP-модуль DD 2выглядит почти идентично QSFP28.
Основные функции:
8 электрических линий 50G/100G PAM4
Та же ширина 18,35 мм, что и у QSFP28.
Поддерживает 400G (8×50G) и 800G (8×100G)
Обратная совместимость с модулями QSFP28.
Преимущество обратной совместимости огромно. Вы можете развернуть коммутаторы QSFP-DD прямо сейчас, запустить существующие модули QSFP28 100G в этих портах и ​​обновить отдельные каналы до 400G по мере роста требований к пропускной способности. Никаких замороженных активов. Никакой модернизации погрузчика.QSFP-DD MSA 4разработали эту совместимость с самого начала.

Что такое OSFP и когда его следует выбирать?

OSFP (восьмеричный подключаемый модуль малого форм-фактора) — это специально созданный-высокопроизводительный- форм-фактор. Его ширина 22,58 мм (на 23 % шире, чем у QSFP-DD), встроенная поддержка радиатора и мощность до 25 Вт. OSFP предназначен для обучающих кластеров искусственного интеллекта,-когерентной оптики дальней связи и будущих модулей 1,6T. Он не поддерживает модули семейства QSFP-.
OSFP использовал другой подход к проектированию. Вместо обеспечения обратной совместимости OSFP MSA5приоритетный запас тепла и-защищенность на будущее.
Основные функции:
8 электрических линий 50G/100G PAM4
Ширина 22,58 мм (на 23 % шире, чем QSFP-DD)
Максимальная мощность до 25 Вт.
Нулевая совместимость с модулями семейства QSFP-
OSFP показывает себя там, где запас тепла имеет наибольшее значение. Учебные кластеры искусственного интеллекта, использующие-мощные соединения графических процессоров, когерентные оптические системы ZR+ на больших-дальних расстояниях и будущиеМодули OSFP 800GВсе модули /1,6T выигрывают от дополнительного пространства и мощности охлаждения. Если вы создаете новую инфраструктуру без устаревшего оборудования QSFP28, OSFP заслуживает серьезного рассмотрения.

Как на самом деле работает обратная совместимость?

Обратная совместимость — одно-, а не двусторонняя-. Порт QSFP-DD принимает модули QSFP28, но порт QSFP28 не может принимать модули QSFP-DD. Никакой адаптер не сможет это изменить. OSFP полностью изолирован от семейства QSFP и имеет другое количество контактов, ширину и механизмы защелки.
Это самая запутанная часть сравнения QSFP-DD и OSFP. Давайте проясним это.

QSFP28 vs QSFP-DD port compatibility guide

Матрица совместимости

Тип порта
Модуль КСФП28
Модуль QSFP-DD
OSFP-модуль
Порт КСФП28
✅ Подходит
❌ Слишком глубоко
❌ Слишком широкий
QSFP-Порт DD
✅ Подходит
✅ Подходит
❌ Слишком широкий
OSFP-порт
❌ Несоответствие защелки
❌ Несоответствие защелки
✅ Подходит
 

Почему односторонняя совместимость-работает

Порты QSFP-DD принимают модули QSFP28, поскольку их физические размеры совпадают. Слот QSFP-DD более глубокий и позволяет разместить дополнительные электрические контакты. Модуль QSFP28 просто располагается в слоте меньше, и электрические сигналы совместимы.
Обратное не работает по двум причинам:
Физическое несоответствие:Модули QSFP-DD имеют большую глубину, чем слоты QSFP28. Они не подойдут.
Электрическое несоответствие:QSFP-DD необходимо 8 полос. QSFP28 предоставляет только 4. Даже если бы вы могли ввести его принудительно, это не сработало бы.

OSFP: полностью изолированный

OSFP использует 60-контактный разъем с другой распиновкой, шириной 22,58 мм, который не подходит для слотов QSFP, и другой конструкцией защелки. Он электрически и механически изолирован от семейства QSFP.
Модули адаптера QSFP28--OSFP существуют, но они увеличивают стоимость, сложность и количество точек сбоя. Они работают на несколько старых связей. Это не стратегия миграции.

Сравнение физических характеристик и производительности

Форм-фактор Размеры

Спецификация
КСФП28
QSFP-ДД
ОСФП
Ширина
18,35 мм
18,35 мм
22,58 мм
Высота
8,5 мм
8,5 мм
13,0 мм
Глубина
~30 мм
~35 мм
~40 мм
Объем
~4,7 см³
~5,4 см³
~11,8 см³
 
Разница в ширине между QSFP-DD и OSFP напрямую влияет на плотность портов. Коммутатор высотой 1RU поддерживает 36 портов QSFP-DD, но только 32 порта OSFP. Разверните 100 коммутаторов, и OSFP предоставит вам на 400 портов меньше, или вам понадобится 12 дополнительных коммутаторов для обеспечения соответствующей мощности.

Разница в мощности и температуре

Потребление энергии зависит от скорости и сложности:
Тип модуля
КСФП28
QSFP-ДД
ОСФП
SR (короткая дистанция)
3-4W
6-8W
6-8W
LR (большая дальность действия)
4-5W
12-15W
12-15W
ЗР (когерентный)
N/A
15-20W
15-25W
Максимальная поддерживаемая мощность
~6W
~15W
~25W
 
QSFP-DD без проблем обрабатывает стандартные модули 400G. Но когерентные модули ZR высокой-мощности приближают его к тепловому потолку. Встроенный радиатор OSFP и увеличенный объем обеспечивают удобный запас мощности для модулей мощностью более 20 Вт.

QSFP-DD handles standard 400G modules without issues. But high-power ZR coherent modules push it close to its thermal ceiling. OSFP's integrated heatsink and larger volume provide comfortable headroom for modules above 20W.

Дорожная карта скорости

КСФП28:Максимум достигает 100G. Нет пути обновления, кроме добавления портов.
QSFP-ДД:В настоящее время поддерживает 400G. С QSFP-DD800 он достигает 800G, используяЭлектрическая сигнализация 100G-на-полосу. 1.6T теоретически возможно, но термически сложно.
ОСФП:Сегодня поддерживает 400G и 800G. Это предпочтительный форм-фактор для модулей 1,6T.2наДорожная карта Ethernet Alliance.

Как перейти с QSFP28 на 400G?

Для большинства организаций рекомендуемый путь — от QSFP28 до QSFP-DD. Разверните коммутаторы QSFP-DD, поддерживайте работу модулей QSFP28 и сначала обновите магистральные каналы до 400G. Типичная миграция занимает от 12 до 24 месяцев и может сэкономить более 340 000 долларов США по сравнению с полной заменой оборудования.
Когда использовать:У вас есть существующие модули QSFP28, которые стоит сохранить.
Шаги:
Разверните коммутаторы QSFP-DD, продолжая использовать модули QSFP28.
Сначала обновите магистральные каналы-с высокой пропускной способностью до 400G QSFP-DD.
Постепенно обновляйте соединения верхних-из-стоек (ToR) по мере того, как серверы получают новые сетевые карты.
Хронология:12–24 месяца для полной миграции
Преимущество в стоимости:Вы сохраняете существующие оптические активы, не платите никаких затрат на адаптеры и распределяете капитальные затраты по бюджетным циклам.
Реальный-пример:Операционная группа финансовых услуг сохранила 340 000 сбережений.

Путь 2: QSFP28 → OSFP (редко используется)

Когда использовать:Вам нужны мощные-модули ZR+ и минимальный запас оптики.
Шаги:
Замените все оптические модули.
Развертывание адаптеров QSFP28-to-OSFP для устаревших подключений (по 400 каждый)
Все новые мощности используют OSFP
Хронология:Немедленное переключение; поэтапная миграция невозможна
Реальная стоимость:Полная замена модуля плюс 400 за каждое устаревшее соединение для адаптеров.

QSFP-DD и OSFP: руководство по выбору новой сборки

Выбирайте QSFP-DD, когда:

Создание корпоративных или облачных центров обработки данных
Выполнение смешанных рабочих нагрузок
Планирование будущей интеграции с существующей инфраструктурой
Мощность на-модуль остается ниже 15 Вт.

Выбирайте OSFP, когда:

Создание обучающих кластеров по искусственному интеллекту
DCI на большие расстояния-, требующие когерентных модулей ZR+
Никаких требований совместимости с устаревшими версиями
Нужен максимальный тепловой запас для будущих модулей

Блок-схема выбора

Шаг 1:Есть ли у вас существующая инфраструктура QSFP28?
Да→ Выберите QSFP-DD (значение обратной совместимости слишком велико, чтобы его можно было игнорировать). Сделанный.
Нет→ Перейдите к шагу 2.
Шаг 2:Нужна ли вам в ближайшем будущем когерентная оптика ZR+ или 1.6T?
Да→ Выберите OSFP (необходим тепловой запас). Сделанный.
Нет→ Выберите QSFP-DD (более широкая экосистема, более высокая плотность портов). Сделанный.

Как на самом деле выглядит совокупная стоимость владения?

В центре обработки данных со 100-стойками, где выполняется миграция 2000 портов со 100G на 400G, QSFP-DD экономит примерно 660 000 долларов США за три года по сравнению с OSFP. Экономия достигается за счет повторного использования 60 % существующей оптики QSFP28, необходимости на 12 % меньшего количества коммутаторов из-за более высокой плотности портов и устранения затрат на адаптеры.

Цены на модули

Цены на модули сопоставимы для разных форм-факторов:
Тип модуля КСФП28 QSFP-ДД ОСФП
СР (100Г/400Г) $200-500 $1,400-2,500 $1,400-2,500
ЛР (100Г/400Г) $400-800 $2,500-4,000 $2,500-4,000
ЗР (когерентный) N/A $8,000-15,000 $8,000-15,000
 
Цена не зависит от форм-фактора. Это зависит от объема, поставщика и спецификаций.

Факторы стоимости инфраструктуры

Стоимость переключения:Коммутаторы QSFP-DD стоят на 400 меньше за порт, чем OSFP, благодаря большим объемам поставок и более простой конструкции системы охлаждения.
Мощность и охлаждение:Модули OSFP в среднем потребляют немного больше энергии. За три года это добавляет 100 к затратам на электроэнергию за одно переключение.
Стоимость миграции:Обратная совместимость QSFP-DD означает отсутствие затрат на адаптеры. OSFP требует адаптеров (400 на порт) или полной замены модуля.

Пример использования ТШО: ЦОД на 100 стоек

Сценарий:2000 портов переходят со 100G на 400G.
QSFP-Подход DD:
Повторно используйте 60% оптики QSFP28, сэкономив 480 000 долларов США.
Нулевые затраты на адаптер
Более высокая плотность портов означает на 12% меньше коммутаторов, что позволяет сэкономить 180 000 долларов США.
Преимущество совокупной стоимости владения за три-года: ~660 000 долларов США.
OSFP-подход:
Полная замена модуля: 1 200 000 долларов США.
Устаревшие адаптеры подключения: 160 000 долларов США.
Для равной мощности необходимо больше коммутаторов: +180 000 долларов США.
Премия за трех-летнюю совокупную стоимость владения: ~1 540 000 долларов США.
Для новых проектов без существующих модулей разрыв сокращается. Но QSFP-DD по-прежнему выигрывает по стоимости коммутатора и плотности портов.

Реальные-сценарии развертывания сети 400G в мире

Сценарий 1. Обновление корпоративного центра обработки данных

Ситуация:Предприятие среднего-размера с инфраструктурой 100G, созданной 5-лет назад, и 200 модулями QSFP28 в эксплуатации.
Нуждаться:Обновите магистраль до 400G, сохраняя при переходе ToR на уровне 100G.
Решение:QSFP-ДД.
Результат:Плавная миграция в течение 18 месяцев без сбоев в работе бизнеса. Устаревшие модули вышли из эксплуатации естественным образом по мере обновления серверов. Экономия $300 000 по сравнению с полной заменой оборудования. Распределение бюджета по квартальным циклам.

Сценарий 2: Новый кластер обучения искусственному интеллекту

Ситуация:Стартап в области искусственного интеллекта создает свой первый кластер графических процессоров. Нет существующей инфраструктуры.
Нуждаться:Прямое соединение 400G-на каждый графический процессор. Для синхронизации-моделей на территории кампуса требуется когерентная оптика ZR+.
Решение:ОСФП.
Почему:Никакой устаревшей совместимости не требуется. Модули ZR+ мощностью 22 Вт требуют теплового запаса OSFP. Будущая дорожная карта 800G/1.6T согласуется с OSFP.
Результат:Развернуты 64-портовые коммутаторы OSFP. Модули ZR+ работали в пределах тепловых характеристик при мощности 22 Вт. Четкий путь обновления до 800G и выше.

Сценарий 3. Развертывание гипермасштабатора в нескольких-регионах

Ситуация:Крупный облачный провайдер, расширяющийся в новые регионы. Существующие объекты используют QSFP28/QSFP-DD.
Нуждаться:Стандартизируйте новые сборки, сохраняя при этом существующие сайты.
Решение:OSFP только для новых регионов.
Почему:Новые сборки не имеют устаревших ограничений. Новая емкость, стандартизированная по OSFP. Существующие объекты остаются на QSFP-DD.
Результат:Двойное-стандартное управление посредством стандартизированных закупок. Новые регионы используют OSFP, существующие предприятия — QSFP-DD. Цепочка поставок упрощена для новых мощностей.

400G OSFP: пошаговое--руководство по развертыванию

400G OSFP Step-by-Step Deployment Tutorial

Правильная установка 400G OSFP требует внимания к деталям, которые не всегда освещаются в технических характеристиках. Вот полный процесс от планирования до производства.

Предварительное-планирование развертывания

Проверка реальности бюджета мощности

В технических характеристиках поставщика указана мощность модуля 400G OSFP 12-15 Вт. Реальная производственная мощность выше. При производственных испытаниях отдельные модули потребляют около 15–20 Вт. Когерентные модули ZR/ZR+ достигают мощности 18-23 Вт.
Для полностью загруженного 32-портового коммутатора 400G OSFP:
Консервативная оценка:32 порта × 15 Вт × 2 (на обоих концах)=960 Вт только для оптики
Реалистичная оценка:32 порта × 18 Вт × 2=1, 152 Вт
Добавьте питание коммутатора ASIC(~300–400 Вт для коммутаторов 400G)
Итого на коммутатор: 1,300-1,550W
Перед покупкой оборудования проверьте распределение электропитания и охлаждающую способность вашего шкафа. Мы видели, как команды центров обработки данных пропускали тепловые расчеты, а затем сталкивались с проблемами регулирования после-развертывания, в результате чего для стабилизации в конечном итоге требовались перегородки для воздушного потока и более широкое расстояние между шкафами.

Проверка радиатора: плоский-верх или ребристый-верх

OSFP-400G-DR4 Comparison: Flat-Top vs Finned-Top

Именно эта деталь задержала множество реальных-проектов. 400Модули G OSFP выпускаются в двух вариантах физического радиатора:
Платформа
Тип радиатора
Примечания
Большинство коммутаторов Arista
Ребристая-верхняя часть
Стандартные коммутаторы для центров обработки данных
Самый Cisco Nexus 9000
Ребристая-верхняя часть
-
Коммутаторы NVIDIA Quantum-2
Ребристая-верхняя часть
-
Сетевые адаптеры NVIDIA ConnectX-7
Плоская-верхняя часть
Форм-фактор сетевой карты требует этого
Процессоры NVIDIA BlueField-3
Плоская-верхняя часть
-
 
При прямом подключении коммутаторов к сетевым картам сервера на каждом конце может потребоваться свой тип радиатора. Подтвердите и сделайте правильный заказ перед установкой. Модификации на месте аннулируют гарантию и могут привести к повреждению оборудования.

Оценка оптоволоконной инфраструктуры

Подтвердите, что существующее оптоволокно поддерживает 400G:
Для SR8 требуется многомодовое волокно OM4 или OM5 (OM3 не поддерживается).
DR4/FR4/LR4 требует OS2одномодовое-волокно
Оптоволокно, развернутое до 2015 года, может не соответствовать требованиям целостности сигнала 400G.
Разъемы MPO должны быть отполированы APC (угол 8 градусов); СКП не будет работать
Если у вас есть какие-либо сомнения в качестве волокна, проверьте его перед покупкой модулей.. 400G гораздо менее прощает дефекты волокна, чем 100G.

Типы и характеристики модулей 400G OSFP

Тип
Расстояние
Волокно
Разъем
Длина волны
Типичная мощность
Вариант использования
СР8
ОМ4: 100 м / ОМ5: 150 м
Многомодовый
МПО-16
850 нм
10-12W
Внутри-DC, кластеры искусственного интеллекта
ДР4
500m
Одиночный-режим
МПО-12
1310 нм
8-10W
Лист-корешок, здание-к-зданию
ФР4
2 км
Одиночный-режим
ЖК Дуплекс
CWDM4
10-12W
Доступ к метро
LR4
10 км
Одиночный-режим
ЖК Дуплекс
CWDM4
10-12W
Сеть метро
ЗР
80-120 км
Одиночный-режим
ЖК Дуплекс
ДВДМ
15-18W
DCI-дальней связи
ЗР+
480+ км
Одиночный-режим
ЖК Дуплекс
ДВДМ
18-23W
Сверх-дальняя-когерентная связь
 
SR8 и DR4 используют параллельную оптику (8 полос передачи одновременно). Мультиплексирование каналов FR4, LR4, ZR и ZR+ по меньшему количеству волокон с использованием CWDM/DWDM.

6-шаговый процесс установки

Шаг 1: Защита от электростатического разряда.Модули 400G OSFP чувствительны к электростатическим разрядам. Наденьте заземленный браслет, подключенный к точке заземления шкафа. Берите модули только за края. Никогда не прикасайтесь к золотым пальцам или ребрам радиатора.
Шаг 2. Проверьте тип радиатора.Дважды-проверьте радиатор на соответствие требованиям вашей платформы. Визуальная разница очевидна: ребристая-верхняя часть имеет вертикальные ребра охлаждения и расположена выше; плоская-верхняя часть имеет гладкую поверхность и нижний профиль. Неправильный тип? Останавливаться. Не снимайте и не модифицируйте радиаторы.
Шаг 3: Вставьте модуль.Совместите модуль со слотом OSFP и нажмите до щелчка защелки. Не заставляйте это делать. Если вы чувствуете сопротивление, проверьте ориентацию. Модуль должен вставляться плавно, с умеренным давлением.
Шаг 4. Очистите и осмотрите волокно.Этот шаг предотвращает 70% сбоев канала развертывания. Осмотритеразъем МПО 2торцевую поверхность с помощью волоконного микроскопа перед очисткой. Если все чисто, подключите напрямую. В случае загрязнения используйте специальный инструмент для очистки MPO- (а не стандартные инструменты диаметром 2,5 мм/1,25 мм). После очистки проверьте еще раз. Никогда не проводите чистку без предварительного осмотра, так как мусор может поцарапать торцевую поверхность. Целевые вносимые потери: менее 0,5 дБ на точку подключения.
Шаг 5: Подключите оптоволокно.Для соединений MPO (SR8, DR4): подтвердите полярность (тип B является стандартом для параллельной оптики), проверьте соответствие разъема «папа» и «гнездо», нажмите до тех пор, пока защелка разъема не зафиксируется, и соблюдайте минимальный радиус изгиба 30 мм. Для дуплексных соединений LC (FR4, LR4, ZR): подключите TX к удаленному RX и RX к удаленному TX и убедитесь, что защелка LC полностью зафиксирована.
Шаг 6: Проверьте ссылку.Проверьте состояние соединения на коммутаторе:
Arista: показать статус интерфейса eth1/1
Cisco: показать интерфейс eth1/1
NVIDIA: показать ссылку ibstat или ip
Ссылка должна появиться в течение 30 секунд. Если этого не произошло, приступайте к устранению неполадок.

Конфигурация волокна MPO и полярности

Полярность MPO — это-причина номер один сбоев соединения при включении сети 400G-. Понимание трехсхемы полярностиэкономит часы отладки.
МПО-16 против МПО-12:
MPO-16: 16 волокон, используются для 400G SR8 (8 TX + 8 RX). Не поддерживает прорыв.
MPO-12: 12 волокон, используемых для 400G DR4 (4 TX + 4 RX, 4 запасных волокна). Поддерживает прорыв до 4×100G.
Оба требуют полировки APC (угол 8 градусов). Полировка UPC вызывает обратное-отражение и нестабильность соединения.
Схемы полярности:
Схема
Конфигурация
Использование 400 г
Тип А
Прямой-сквозной
Не стандартно для 400G
Тип Б
Кроссовер (от клавиши-вверх до клавиши-вниз)
Стандарт для параллельной оптики 400G
Тип С
Пара-перевернута
Не стандартно для 400G
 
Полярность типа B (кроссовер)является отраслевым стандартом для 400G SR8 и DR4. Волокно TX 1 подключается к волокну RX 12, волокно TX 2 к волокну RX 11 и так далее.
Проверка мужчины/женщины:Разъемы MPO бывают «папа» (со штырьками) и «мама» (без штырей). Они должны спариваться с мужчиной-и-женщиной. Порты модуля обычно мужские.Патч-кабелиобычно это женщины-к-женщинам. Магистральные кабели обычно подключаются-к-гнездам. Проверьте перед подключением. Принудительное использование несоответствующих разъемов приводит к повреждению контактов.

Команды настройки коммутатора

Текст
 
настроить терминал
интерфейс Ethernet1/1
описание «Восходящий канал 400G OSFP к Spine-1»
скорость 400gполный
нет коммутатора
IP-адрес 10.1.1.1/31
МТУ 9216
фек rs-фек
нет выключения
 
! Проверка
показать статус интерфейса eth1/1
показать интерфейс трансивера eth1/1
Ключевые настройки: скорость 400Gfull явно устанавливает скорость 400G. mtu 9216 позволяет использовать большие кадры для трафика центра обработки данных. fec rs-fec включает RS-FEC (KP4), необходимый для 400G.
ОС Cisco NX- (например, Nexus 9000):
Текст
 
настроить терминал
интерфейс Ethernet 1/1
описание 400G OSFP Link
скорость 400000
МТУ 9216
нет коммутатора
IP-адрес 10.1.1.1/31
нет выключения
 
! Для когерентных модулей ZR/ZR+:
! zr-оптика fec cFEC мукспондер 1x400 модуляция 16QAM
 
! Проверка
показать интерфейс eth 1/1
показать детали интерфейса трансивера eth 1/1
NVIDIA (InfiniBand NDR/Ethernet):
Режим InfiniBand:
Текст
 
ibstat
ibstatus
Режим Ethernet:
Текст
 
IP-ссылка показать
эттул eth0
ethtool --show-fec eth0
NVIDIA ConnectX-7 по умолчанию использует NDR 400 Гбит/с.ИнфиниБэнд. Его можно переключить в режим Ethernet 400GbE. FEC в основном управляется автоматически-и редко требует ручной настройки.
Примечание ФЭК:На обоих концах должен использоваться RS-FEC (KP4) для 400G. Несоответствие FEC приводит к нестабильности канала или полностью блокирует соединение-.

Проверка и тестирование

Первоначальная проверка ссылки (в течение 5 минут после-подключения):Убедитесь, что канал находится в состоянии «UP», скорость согласована на уровне 400G, а FEC включен на обоих концах.
DOM (цифровой оптический мониторинг):Проверьте мощность передачи (обычно от -2 до +4 дБм для каждой спецификации модуля), мощность приема (обычно от -6 до -1 дБм) и температуру (ниже порога тревоги 70 градусов).
Предварительный-мониторинг FEC BER (5–10 минут):
Пас: < 1×10⁻⁶
Маржинальный: от 1×10⁻⁶ до 1×10⁻⁵
Неудачно: > 1×10⁻⁵
Высокий уровень pre-FEC BER обычно указывает на плохое качество волокна, загрязнение разъемов или ухудшение сигнала. Эти ссылки могут работать изначально, но не работать при полной нагрузке.
24-часовой тест на работоспособность:Прежде чем приступить к работе, проведите 24-стресс-тестирование. Генерация линейного-трафика (iperf3, TRex или моделируемого производственного трафика). Мониторинг счетчиков ошибок ежечасно. Подтвердите закрылки нулевой связи и сигналы тревоги нулевой температуры. Проверьте, не увеличивается ли количество поправок FEC (что указывает на ухудшение качества канала). Запишите окончательные показания DOM. Тестирование выявляет зарождающиеся сбои и маргинальные связи до того, как они повлияют на производство.

Стратегия поэтапной миграции

Не каждое развертывание напрямую связано с собственным 400G. Поэтапный подход снижает риск.
Этап 1: Обновление уровня позвоночника.Замените коммутаторы позвоночника на платформы с поддержкой 400G-. Использоватькабели для прорывадля подключения существующих коммутаторов 100G. Работайте стабильно в течение 30-60 дней.
Этап 2: Постепенное обновление листового слоя.Модернизируйте листовые коммутаторы стойку за стойкой. Используйте соединительные кабели для поддержания связи со старыми серверами. Перейдите к следующей партии после подтверждения стабильности.
Этап 3: Родной 400G.Как только все оборудование будет поддерживать 400G, отсоедините отводящие кабели и проложите от конца-к-конечным концам родную сеть 400G. Сохраняйте отводные кабели в качестве запасных.
Вариант прорывного кабеля:Модули 400G DR4 поддерживают коммутацию 4×100G с использованием дуплексных кабелей MPO-12 и 4×LC. Это позволяет магистральному коммутатору 400G подключаться к листовым коммутаторам 100G во время миграции. Мощность соединения на 100G падает примерно с 10 Вт до примерно 5,5 Вт. Такой подход позволяет развернуть инфраструктуру 400G до того, как все конечные точки будут готовы.
Около 70 % неисправностей QSFP-DD устраняются на физическом уровне: загрязнение разъемов, частично установленные модули и проблемы с кабелем. Прежде чем заменять какое-либо оборудование, выполните структурированный пятиэтапный-этапный процесс, включающий физический осмотр, проверку CMIS, проверку конфигурации, анализ качества сигнала и тестирование изоляции. Такой подход решает примерно 90% проблем.
Вот реальная история: инженер потратил два дня на обработку возвратов RMA для двенадцати модулей QSFP-DD на коммутаторе Cisco Nexus. Система продолжала показывать %SFP4UNSUPPORTED_SENSE. Замененные модули показали ту же ошибку. Коллега предложил проверить прошивку коммутатора. Основная причина? Новые модули CMIS 4.0 были несовместимы со старой прошивкой CMIS 3.0 коммутатора. Два дня работы потрачены зря.

Пятиэтапная-система устранения неполадок

Этап
Фокус
Приблизительная скорость разрешения
Этап 1
Проверка физического уровня
~40%
Этап 2
Идентификация модуля и CMIS
~25%
Этап 3
Проверка конфигурации
~15%
Этап 4
Качество сигнала, BER и тепловые характеристики
~10%
Этап 5
Тестирование изоляции
~10%
 
Всегда прорабатывайте этапы по порядку. Прежде чем переходить к этапу 2, убедитесь, что физический уровень исправен. Прежде чем анализировать BER на этапе 4, подтвердите идентификацию и конфигурацию модуля. Такой структурированный подход не позволяет инженерам гадать вслепую и тратить часы.

5-Phase QSFP-DD Troubleshooting Workflow

Этап 1: Проверка физического уровня

Модулю, который кажется «сломанным», часто достаточно 30 секунд и-очистки без ворса. Эффективное устранение неполадок всегда начинается с самой простой точки отказа.
Один техник центра обработки данных потратил 3 часа на устранение неполадок в канале 400G DR4, который не работал. Проверка конфигурации, обновление прошивки, замена портов: ничего не помогло. Наконец, они вытащили модуль и осмотрели разъем MPO под оптоволоконным микроскопом. Единственное крошечное волокно от ватного тампона застряло в множестве волокон. Чистка заняла 30 секунд. Ссылка появилась сразу. «Сломанный модуль» оказался просто грязным стеклом.
 
Контрольный список визуального осмотра:
Модуль полностью установлен:Нажимайте с усилием, пока не услышите щелчок защелки. Неполная вставка является основной причиной периодических ошибок полосы движения.
Золотые пальцы:Проверьте электрические контакты на наличие коррозии, мусора или погнутых контактов. Один погнутый штифт на дорожке 3 разрушает соединение 400G.
Повреждение разъема:Ищите трещины в наконечниках, отсутствующие чехлы и перегнутые кабели.. 400Разъемы G MPO-16 более хрупкие, чем MPO-12.
Пылезащитные колпачки:Модули, хранящиеся без пылезащитных колпачков, уже загрязнены.
Хорошая гигиена кабелей — основа эффективного устранения неполадок QSFP-DD. Одно лишь загрязнение разъема является причиной большинства сбоев оптических модулей в развертываниях 400G. Более подробную информацию о типах и совместимости кабелей можно найти в нашем руководстве по прокладке кабелей QSFP-DD.2.
 
Процесс очистки разъема MPO:
Загрязнение разъема является причиной 65-70% отказов линии 400G. При модуляции PAM4 даже крошечный мусор создает достаточные потери, чтобы закрыть глазок сигнала.
Сначала проверьте:Используйте оптоволоконный микроскоп с увеличением 400×. Проверьте торцевую поверхность на наличие пыли, масла или мусора. Никогда не проводите чистку без предварительной проверки.
Влажная---сухая протирка:Нанесите одну каплю жидкости для чистки волокон на безворсовую-салфетку. Проведите соединитель через влажную зону, затем через сухую зону.
Подтвердите полировку APC:В модулях 400G QSFP-DD используются разъемы APC (угловой физический контакт) с углом полировки 8 градусов. Если вы видите плоский синий торец, это UPC. Необходимо использовать зеленые разъемы APC.
Повторная-проверка:Очищайте до тех пор, пока торцевая поверхность не пройдет проверку. Одна повторная попытка занимает 30 секунд; сбой соединения стоит несколько часов.

MPO-16 APC FIber Array Inspection - Use a 400× fiber microscope. Check the end face for dust, oil, or debris. Never clean without inspecting first.

Проверка кабеля и окружающей среды:
Радиус изгиба:Для одномодового-волокна требуется радиус изгиба не менее 30 мм. Слишком-узкийуправление кабелямивызывает потерю микроизгибов, переменную, которую легко упустить из виду.
Снятие напряжения:Тяжелые магистральные кабели MPO, натягивающие модули, вызывают периодические проблемы с контактом. Лишь немногие инженеры проверяют это в первую очередь.
Воздушный поток и тепловое затенение:В конфигурациях от брюшной-до-нижневой клетки модули верхнего-ряда вдыхают предварительно нагретый отработанный воздух из модулей нижнего-ряда. Верхние порты нагреваются на 10-15 градусов выше.

Этап 2: Идентификация модуля и CMIS

Коммутаторы не всегда точно сообщают о состоянии модуля. «QSFP-DD не обнаружен» — одна из наиболее распространенных и досадных проблем на местах.
Спецификация общего интерфейса управления (CMIS) определяет, как модули QSFP-DD взаимодействуют с хост-коммутаторами. CMIS 4.0 (текущий стандарт для модулей 400G/800G) представляет сложное сопоставление памяти EEPROM, которое старые прошивки не могут правильно проанализировать. Коммутатор распознает оборудование, но не может считывать рабочие параметры, сообщая «неподдерживаемый трансивер» или вообще не обнаруживая модуль.
Команды обнаружения-отдельного поставщика:
Платформа
Команды
ОС Cisco IOS-XR/NX-
показать трансивер интерфейсов, показать детали трансивера интерфейсов, показать модуль
Ариста ЭОС
показать интерфейсы трансивера Ethernet1/1, показать интерфейсы трансивера eeprom
Можжевельник ЮнОС
показать аппаратное обеспечение шасси, показать изображение шасси fpc-изображение слота 0-слота 0
СОНИК/Линукс
показать интерфейсный приемопередатчик EEPROM Ethernet0, ethtool -m Ethernet0
 

 

Конечный автомат CMIS:
Состояние
Описание
Общий режим отказа
Низкая мощность
Модуль вставлен, минимальная мощность
Несоответствие класса мощности
PowerUp
Инициализация модуля
Мощность порта недостаточна
Готовый
Модуль готов к передаче данных
Ошибка разбора прошивки
Вина
Обнаружено ненормальное состояние
Аппаратная неисправность
 
Путь к данным гласит:
Состояние
Описание
Общий режим отказа
Деактивирован
Путь к данным не активен
Порт не включен
Инициализировать
Инициализация пути к данным
Несоответствие скорости/FEC
Активировано
Ссылка работает нормально
Должно показывать нормально
 
Застревание модуля в Init обычно означает несоответствие скорости или FEC между хостом и модулем. Несовместимость версий CMIS не позволяет модулям достичь состояния готовности, что приводит к постоянным ошибкам до тех пор, пока микропрограммное обеспечение не будет обновлено.
Блокировка поставщиков-в модулях и модулях сторонних-лиц:
OEM-переключатели проверяют поле EEPROM идентификатора поставщика. Модули сторонних-производителей с правильной кодировкой EEPROM работают нормально. Отсутствующие ошибки триггера-кодирования, специфичные для поставщика:
Juniper: неподдерживаемый трансивер
Arista: Обычно распознает их, но записывает предупреждение.
99 % сбоев модулей связаны с совместимостью встроенного ПО или проблемами кодирования EEPROM, а не с качеством модулей сторонних-производителей.
Обходные пути:
Cisco: обслуживание неподдерживаемого-трансивера (скрытая команда; может повлиять на гарантию)
Juniper: некоторые платформы поддерживают-неподдерживаемый-трансивер.
Arista: Наиболее открытая совместимость; Модули сторонних-обычно работают без специальных настроек.

Этап 3: Проверка конфигурации

Ссылка работает на 100G, но не на 400G? Сначала проверьте FEC.
Современные каналы 400G полагаются на упреждающую коррекцию ошибок (FEC) для обработки битовых ошибок сигнализации PAM4. Несоответствие FEC является распространенной причиной устранения неполадок 400G. Один конец с включенным FEC, а другой отключенным означает, что соединение либо не устанавливается, либо выдает серьезные ошибки.
ФЭК для400G Ethernet:RS-FEC RS(544,514), также называемый KP4 FEC. Это обязательно, а не по желанию.
Параметр
Нормальный порог
Действия в случае превышения
Предварительный-FEC BER
< 2.4 × 10⁻⁴
Отслеживать тенденции; ссылку еще могу поправить
Сообщение-FEC BER
< 1 × 10⁻¹²
Любые ошибки после-FEC имеют решающее значение.
Исправленные кодовые слова
Стабильная базовая линия
Быстрое увеличение=деградации сигнала
Неисправленные кодовые слова
0
Не-нулевая ссылка=вот-вот исчезнет
 
Команды статуса FEC:
Cisco: показать журнал событий FEC-; показать аппаратное обеспечение платформы, получая активную статистику FEC
Arista: показывать ошибки счетчиков интерфейсов; показать статус FEC
SONiC: показать счетчики интерфейса|grep -и фек
Конфигурация прорыва:
Разделение 400G QSFP-DD на 4×100G — распространенная причина путаницы. Отображение полос должно совпадать на ASIC коммутатора, кабеле и удаленном конце.
Стандартное отображение полос 400G → 4×100G:
Дорожки 0–1 → Коммутационный порт 1
Дорожки 2–3 → Коммутационный порт 2
Дорожки 4–5 → Коммутационный порт 3
Дорожки 6–7 → Коммутационный порт 4
Полярность MPO здесь тоже имеет значение. Коммутационные кабели обычно используют полярность типа B (кроссовер). Если некоторые коммутационные порты работают, а другие нет, первым подозреваемым является полярность.

Этап 4. Качество сигнала, BER и проблемы с температурой

Анализ тенденций BER до-FEC может предупредить вас о сбоях за 2–3 недели до того, как канал фактически выйдет из строя. Раннее обнаружение деградации модуля позволяет запланировать плановую замену вместо аварийных отключений в 2 часа ночи.
Интерпретация параметров DDM:
Цифровой диагностический мониторинг (DDM, также называемый DOM) обеспечивает-телеметрию в реальном времени от модуля. При расширенном устранении неполадок QSFP-DD показания DDM – это ваша самая ранняя система предупреждения.
Параметр
Нормальный диапазон
Предупреждающий знак
Мощность передачи
Спецификация каждого модуля (варьируется)
Более чем на 3 дБ ниже спецификации
Мощность приема
Чувствительность выше с запасом
Ниже чувствительности или выше перегрузки
Температура
Температура корпуса 25-70 градусов
>70°C warning, >Отключение при 85 градусах
Лазерный ток смещения
Стабильная базовая линия
>Увеличение на 20 % по сравнению с базовым уровнем
Напряжение
3.135-3.465V
Вне диапазона =, проблема с источником питания
 
Текущая тенденция смещения лазера — лучшее раннее предупреждение при устранении неполадок QSFP-DD. Когда лазеру требуется на 20% больше тока для поддержания той же выходной мощности, его срок службы приближается к концу. Замените его во время следующего периода технического обслуживания, а не после сбоя.

Laser bias current trend is the best early warning in QSFP-DD troubleshooting. When a laser needs 20% more current to maintain the same output power, it's approaching end of life. Replace it during the next maintenance window, not after an outage.

Тепловое затенение в брюшных-между-брюшных клетках:
Коммутаторы высотой 1RU с высокой-плотностью и портами 32+ QSFP-DD в соединительных---корпусных кожухах создают тепловую тень, которую легко не заметить. Инженеры замерили, что порты верхнего-ряда нагреваются на 10-15 градусов выше, чем порты нижнего ряда. Тепловое затенение вызывает сбои модулей в определенных диапазонах портов, в то время как идентичные модули работают нормально в других местах.
Диагностика:
Сравните температуры DOM по всем портам
Ищите кластеризацию температур по рядам клеток.
Проверьте направление и скорость воздушного потока
Убедитесь, что пустые панели установлены в пустые слоты.
Рассмотрите возможность использования оптики с меньшей-силой (например, FR4 вместо ZR) в термически ограниченных положениях.
Основы целостности сигнала PAM4:
400G и 800G используют PAM4 (4-уровень импульсно-амплитудной модуляции) вместо традиционного NRZ (без-возврата-к нулю). PAM4 передает вдвое больше данных за такт, но требует значительно более высокого качества сигнала.
Что это означает для устранения неполадок:
Глазковые диаграммы PAM4 имеют три глаза. Любое закрытие глаз вызывает битовые ошибки.
Ошибки на определенных линиях обычно указывают на проблемы ASIC хоста, электрического интерфейса или отдельных оптических каналов.
Перекрестные помехи между линиями внутри одного модуля хуже при 400G, чем при 100G.
Если ошибки концентрируются на определенных дорожках (например, только на полосах 2 и 3), следует подозревать электрический путь от ASIC коммутатора к модулю, а не оптический путь.

Этап 5: Тестирование изоляции

Замените правильный компонент, и вы обнаружите неисправность за 30 секунд.
После исключения физических проблем, проблем с CMIS, конфигурацией и качеством сигнала последним этапом является тестирование структурированной изоляции. Цель: определить неисправный компонент (модуль, порт, кабель или удаленный конец).
 
Дерево решений теста замены:
Переместите подозрительный модуль на заведомо-исправный порт.
Работает → Проблема в оригинальном порте или кабеле.
По-прежнему не работает → Скорее всего, модуль неисправен.
Установите заведомо-исправный модуль в подозрительный порт.
Работает → Оригинальный модуль неисправен.
По-прежнему не удается → Проблема с портом или кабелем.
Замените кабель.
Соединение восстанавливается → Кабель неисправен.
По-прежнему не удается → Проблема с портом или модулем.
Проверьте удаленный конец.
Все локальные тесты пройдены → Повторите шаги 1–2 на удаленном конце.
Этот четырехэтапный-процесс изолирует неисправности максимум в четырех операциях. Большинство инженеров пропускают этапы или заменяют несколько компонентов одновременно, что ухудшает четкость диагностики. Терпение имеет решающее значение при систематическом устранении неполадок QSFP-DD.
 
 
Тестирование модуля Loopback:
Модуль обратной связи внутренне соединяет полосы TX напрямую с полосами RX. Это самый быстрый способ отличить проблемы на стороне хоста-от проблем на стороне оптоволокна-.
Когда использовать петлю при устранении неполадок QSFP-DD:
Ссылка не открывается, и вам необходимо убедиться, что порт коммутатора работает.
Удаленный конец недоступен, и вам необходима локальная проверка.
Подозрение на сбой линии ASIC хоста.
Ожидаемое поведение:
Вставить петлю, включить порт
Порт должен немедленно подняться (оптоволокно не требуется)
DOM показывает высокую мощность приема (нормально для шлейфа)
BER должен быть около нуля
Порт не включается из-за замыкания на себя → проблема на стороне хоста-(ASIC, электрическая часть или конфигурация). Loopback работает, но реальный модуль нет → проблема в оптическом канале или удаленном конце.

A loopback module internally connects TX lanes directly to RX lanes. It's the fastest way to distinguish host-side from fiber-side issues.

Заключение

Не существует универсального «лучшего» форм-фактора 400G. Правильный выбор зависит от того, что у вас есть сегодня и куда вы пойдете завтра.
Ключевые выводы:
Есть ли инфраструктура QSFP28?Выберите QSFP-ДД. Обратная совместимость сохраняет активы и обеспечивает поэтапную миграцию.
Строите новый кластер AI/HPC?Рассмотрим OSFP. Тепловой запас ZR+ и дорожная карта 1,6T оправдывают переключение экосистем.
Планируете 800G?Оба форм-фактора работают. OSFP имеет температурное преимущество для модулей высокой-мощности.
Затраты-чувствительны?QSFP-DD обеспечивает более низкую совокупную стоимость владения в большинстве сценариев.
Прежде чем подписать заказ на покупку, проведите аудит существующего оборудования, подтвердите потребности в обратной совместимости и рассчитайте совокупную стоимость владения, включая затраты на миграцию.
Команда инженеров COBTEL помогла центрам обработки данных по всему миру перейти на технологии 400G и 800G. Как основной производитель высокоскоростных-оптических трансиверов2и патч-корды MPO, мы можем разработать правильное решение для вашей конкретной инфраструктуры.Заполните форму запроса внизу этой страницы, чтобы получить индивидуальную рекомендацию от нашей команды.

Часто задаваемые вопросы

Могу ли я подключить модуль QSFP28 к порту QSFP-DD?

Да. Порты QSFP-DD предназначены для приема модулей QSFP28. Вы можете развернуть коммутаторы QSFP-DD и продолжать использовать существующую оптику 100G. Совместимость односторонняя-: модули QSFP-DD не могут поместиться в порты QSFP28, поскольку они физически глубже и требуют 8 электрических линий вместо 4.

Какой форм-фактор имеет более низкую совокупную стоимость владения?

QSFP-DD обеспечивает более низкую совокупную стоимость владения для большинства корпоративных сред. Обратная совместимость с QSFP28 и более высокая плотность портов (36 против 32 портов на 1RU) сокращают количество коммутаторов и устраняют затраты на адаптеры. Преимущество OSFP в совокупной стоимости владения применимо только в определенных сценариях-мощности, где тепловой запас оправдывает дополнительные расходы на инфраструктуру.

Нужно ли заменять кабели при обновлении с QSFP28 на QSFP-DD?

Это зависит от типов модулей. QSFP28 SR4 использует MPO-12, а QSFP-DD SR8 использует MPO-16, поэтому для этой комбинации вам потребуются новые кабели. Однако QSFP-DD DR4 использует MPO-12 APC, который совместим с большинством одномодовых приложений QSFP28. Всегда проверяйте конкретные типы модулей перед заказом кабелей.

Могут ли QSFP-DD и OSFP сосуществовать в одной сети?

Они не могут подключиться напрямую. Вам понадобится коммутатор или маршрутизатор с обоими типами портов, чтобы соединить их, или используйте оборудование мультиплексирования/пересылки для преобразования между форм-факторами. Многие гиперскейлеры используют оба стандарта: QSFP-DD в существующих объектах и ​​OSFP в новых сборках.

Что лучше OSFP или QSFP-DD для 800G и 1,6T?

Оба форм-фактора сегодня поддерживают 800G (QSFP-DD800 и OSFP800 имеются в продаже). Для стандартных модулей 800G производительность сопоставима. Для мощных-модулей 800G тепловой запас OSFP дает преимущество. При 1,6Т2OSFP является предпочтительным форм-фактором в отрасли благодаря своей превосходной охлаждающей способности.

Отправить запрос

Вам также может понравиться