Перейти к основному содержанию

Компания Hewlett Packard Enterprise решила прекратить поддержку SMX-Provider VIB

Hewlett Packard Enterprise

HPE прекращает поддержку полезной утилиты SMX-Provider для ESXi, которая позволяет мониторить состояние контроллера и дисков Smart Array.

Начиная с VMware ESXi 7.0.3 Build 20036589 Oct 20 2022 и VMware ESXI 8 утилита исключена из кастомизированных образов ESXi и оффлайн бандлов. При попытке просмотреть данные по дискам получаем ошибку:

The Small Footprint CIM Broker Daemon (SFCBD) is not running. Storage health data is reported by this daemon. Please see this KB article (1025757) for information on enabling this service.

cim

SMX-Provider — это CIM Provider для контроллеров HPE SmartArray. Демон имеет проблемы, которые приводят к утечкам памяти и проблемам с выделением памяти, что приводит к падению провайдера. При работе с контроллерами HPE Smart Array SR Gen10 с прошивкой 3.53 (или старше) можно словить ошибку в SOB логах:

ERROR:is switch exp upstream

Может отображаться ошибка в GUI гипервизора в разделе сенсоров хранилища:

The physical element is failing errors

hpe

Проблема может наблюдаться на платформах HPE Gen10 и Gen10 Plus на гипервизорах VMware ESXi 6.5, VMware ESXi 6.7 или VMware ESXi 7.0 с контроллерами HPE Smart Array SR Gen10 с прошивкой 3.53 (или старше).

Список контроллеров

  • HPE Smart Array E208e-p SR Gen10 (8 External Lanes/No Cache) 12G SAS PCIe Plug-in Controller
  • HPE Smart Array E208i-a SR Gen10 (8 Internal Lanes/No Cache) 12G SAS Modular Controller
  • HPE Smart Array E208i-a SR Gen10 (8 Internal Lanes/No Cache) 12G SAS Modular LH Controller
  • HPE Smart Array E208i-c SR Gen10 (8 Internal Lanes/No Cache) 12G SAS Modular Controller
  • HPE Smart Array E208i-p SR Gen10 (8 Internal Lanes/No Cache) 12G SAS PCIe Plug-in Controller
  • HPE Smart Array P204i-b SR Gen10 (4 Internal Lanes/1GB Cache) 12G SAS Modular Controller
  • HPE Smart Array P204i-c SR Gen10 (4 Internal Lanes/1GB Cache) 12G SAS Modular Controller
  • HPE Smart Array P408e-p SR Gen10 (8 External Lanes/4GB Cache) 12G SAS PCIe Plug-in Controller
  • HPE Smart Array P408i-a SR Gen10 (8 Internal Lanes/2GB Cache) 12G SAS Modular Controller
  • HPE Smart Array P408i-a SR Gen10 (8 Internal Lanes/2GB Cache) 12G SAS Modular LH Controller
  • HPE Smart Array P408i-c SR Gen10 (8 Internal Lanes/2GB Cache) 12G SAS Modular Controller
  • HPE Smart Array P408i-p SR Gen10 (8 Internal Lanes/2GB Cache) 12G SAS PCIe Plug-in Controller
  • HPE Smart Array P416ie-m SR Gen10 (8 Int 8 Ext Lanes/2GB Cache) 12G SAS Mezzanine Controller
  • HPE Smart Array P816i-a SR Gen10 (16 Int Lanes/4GB Cache/SmartCache) 12G SAS Modular LH Controller
  • HPE Smart Array P816i-a SR Gen10 (16 Internal Lanes/4GB Cache/SmartCache) 12G SAS Modular Controller
  • HPE Smart Array P408e-m SR Gen10 (8 External Lanes/2GB Cache) 12G SAS Mezzanine Controller
  • HPE Smart Array P408i-sb SR Gen10 controller with 2GB FBWC (Built-In Smart array Controller for HPE D2500sb Storage Blade)

В логах можно наблюдать:

vmkernel

MemSchedAdmit: 478: UserWorld 'sfcb-smx' with cmdline '/bin/sfcbd'
MemSchedAdmit: 489: uw.2100562 (12781) extraMin/extraFromParent: 256/256, smx (11852) childEmin/eMinLimit: 17861/17920
User: 3173: sfcb-smx: wantCoreDump:sfcb-smx signal:6 exitCode:0 coredump:enabled
UserDump: 3110: sfcb-smx: Dumping cartel 2100562 (from world 2100566) to file /var/core/sfcb-smx-zdump.000 ...
UserDump: 3258: sfcb-smx: Userworld(sfcb-smx) coredump complete.
DVFilter: 6068: Checking disconnected filters for timeouts
MemSchedAdmit: 471: Admission failure in path: smx/sfcb-ProviderMa.2101578/uw.2101578
MemSchedAdmit: 478: UserWorld 'sfcb-smx' with cmdline '/bin/sfcbd'
MemSchedAdmit: 489: uw.2101578 (20057) extraMin/extraFromParent: 148/148, smx (11852) childEmin/eMinLimit:

Syslog

sfcbd[2100569]: Dropped response operation details -- nameSpace: root/hpq, className: SMX_AutoStartSmartArray, Type: 0
sfcb-ProviderManager[2100415]: TIMEOUT DOING SHARED SOCKET RECV RESULT (2100415)
sfcb-ProviderManager[2100415]: Timeout (or other socket error) waiting for response from provider
sfcb-ProviderManager[2100415]: Header Id (256) Request to provider 192 in process 4 failed. Error:Timeout (or other socket error) waiting for response from provider
sfcb-ProviderManager[2100415]: Dropped response operation details -- nameSpace: root/cimv2, className: HPVC_SABattery, Type: 0
sfcb-ProviderManager[2100415]: lookupProviderList: searched 0 providers for root/cimv2:HPVC_SABattery not found, returning error
crond[2099006]: USER root pid 2101676 cmd /bin/hostd-probe.sh ++group=host/vim/vmvisor/hostd-probe/stats/sh
sfcbd[2101605]: tool_mm_realloc_or_die: memory re-allocation failed(orig=343600 new=344000 msg=Cannot allocate memory, aborting
fcb-ProviderManager[2100415]: handleSigChld:172612416 provider terminated, pid=2101605, exit=0 signal=

Чтобы избавиться от ошибок нужно снести провайдер smx-provider.

VMware ESXi 6.5 / 6.7:

esxcli software vib remove -n smx-provider

VMware ESXi 7.0:

esxcli software component remove -n smxProvider

    P.S.

    Мониторим через ILO, OneView, and SSA Cli (Smart Storage Administrator Cli).

    Ссылки

    https://support.hpe.com/hpesc/public/docDisplay?docId=sf000091725en_us

    https://support.hpe.com/hpesc/public/docDisplay?docId=a00117054en_us

    https://kb.vmware.com/s/article/78356

     

    Похожие материалы

    VMware vSphere Hypervisor (ESXi) 6.7U1 — HPE Customized image

    Не секрет, что для установки ESXi на сервера многие производители предлагают кастомизированные инсталляционные образы. Зачем использовать такие образы? Да из-за драйверов, в основном. Кастомизированные образы уже содержат набор драйверов для RAID контроллеров и сетевых карт. 

    Тестируем 10G SFP+ платы HP и Mellanox на серверах HP Proliant DL360 Gen9

    Задача - проверить пропускную способность 10G сети между виртуальными машинами на разных гипервизорах.