Megfontolások ThinkSystem SD650, SD650 V2, SD650 V3 és ConnectX-6 HDR, ConnectX-7 NDR SharedIO – Lenovo ThinkSystem és Lenovo Server használatakor
Megfontolások ThinkSystem SD650, SD650 V2, SD650 V3 és ConnectX-6 HDR, ConnectX-7 NDR SharedIO – Lenovo ThinkSystem és Lenovo Server használatakor
Megfontolások ThinkSystem SD650, SD650 V2, SD650 V3 és ConnectX-6 HDR, ConnectX-7 NDR SharedIO – Lenovo ThinkSystem és Lenovo Server használatakor
Tünet
A Mellanox ConnectX-6 HDR / Nvidia ConnectX-7 NDR adapter a SharedIO-t, más néven NVidia /Mellanox Multi-Host technológiát valósítja meg. A SharedIO-val egy NVidia /Mellanox Virtual Protocol Interconnect® (VPI) adaptert kell telepíteni az egyik ThinkSystem SD650 vagy SD650 V2 vagy SD650 V3 szerver nyílásába, és egy kiegészítő adaptert egy szomszédos szerver nyílásába, ugyanabban a tálcában. Kábel köti össze a két adaptert. Ennek eredményeként a két szerver megosztja a VPI-adapter hálózati kapcsolatát, jelentős megtakarítással mind az adapterek, mind a kapcsolóportok költségeiben.
Bizonyos szempontokat figyelembe kell venni, ha olyan ThinkSystem SD650 vagy SD650 V2 vagy SD650 V3 kiszolgálón dolgozik, amelyen megosztott I/O HDR/NDR adapter van telepítve.
Az NVidia /Mellanox ConnectX-6 HDR és ConnectX-7 NDR adapterrel, valamint a ThinkSystem SD650 vagy SD650 V2 vagy SD650 V3 szerverrel kapcsolatos további információkért látogassa meg a következő URL-eket:
- https://lenovopress.com/lp1195-mellanox-connectx-6-hdr-adapters
- https://lenovopress.com/lp0636- thinksystem -sd650-direct-water-cooled-server-xeon-sp-gen-1
- https://lenovopress. lenovo .com/lp1395- thinksystem -sd650-v2-server
- https://lenovopress. lenovo .com/lp1603- thinksystem -sd650-v3-server
- https://lenovopress. lenovo .com/lp1693- thinksystem - nvidia -connectx-7-ndr200-infiniband-qsfp112-adapters
Érintett konfigurációk
A rendszer a következő Lenovo szerverek bármelyike lehet:
- Lenovo Client Site Integration Kit, 7X74 típusú gép, bármilyen modell
- Lenovo NeXtScale n1200 DWC ház, 5468 típusú, bármilyen modell, bármilyen modell
- Lenovo Scalable Infrastructure (LeSI) fürt, 1410 típusú, bármilyen típusú DSS
- ThinkSystem DW612/DW612S DWC ház, 7D1L típus, bármilyen modell
- ThinkSystem SD650 Dual Node WCT tálca, bármilyen 7x58-as modell
- ThinkSystem SD650 v2, 7D1M típus, bármilyen modell
- ThinkSystem SD650 v3, 7D7M típus, bármilyen modell
A rendszer az alábbi Lenovo opciók közül egy vagy többel van konfigurálva:
- ThinkSystem Mellanox ConnectX-6 HDR/200GbE QSFP56 1 portos PCIe VPI adapter (SharedIO) WCT, 4C57A14925 opció, bármilyen modell
- ThinkSystem Mellanox HDR/200GbE 2x PCIe Aux Kit, 4C57A14179 opció, bármilyen modell
- ThinkSystem Mellanox ConnectX-6 HDR/200GbE QSFP56 1 portos PCIe 4 VPI adapter (SharedIO) DWC, 4XC7A86672, bármilyen modell
- ThinkSystem NVIDIA ConnectX-7 NDR OSFP400 1 portos PCIe Gen5 x16 InfiniBand Adapter (SharedIO) DWC, 4XC7A86670, bármilyen modell
- ThinkSystem NVIDIA ConnectX-7 NDR200/HDR QSFP112 2 portos PCIe Gen5 x16 InfiniBand Adapter (SharedIO) DWC, 4XC7A86669, bármilyen modell
Ez a tipp nem szoftverspecifikus.
A rendszernek a fent leírt tünete van.
Kerülő megoldás
Nem alkalmazható.
további információ
Bekapcsolás
Amikor a csomópontokat megosztott I/O-adapterekkel kapcsolja be, az A/C kikapcsolt állapotából vagy egy virtuális újratelepítés után, az elsődleges csomópontot a segédcsomópont előtt kell bekapcsolni. Javasoljuk, hogy várja meg, amíg az elsődleges csomópont befejezi a POST-t, mielőtt megpróbálná bekapcsolni a kiegészítő csomópontot, vagy ideális esetben várja meg, amíg az elsődleges csomópont befejezi az operációs rendszer rendszerbetöltését. A várakozás elmulasztása azt eredményezi, hogy a segédcsomópont nem kap tápellátási engedélyt, ezért a segédcsomópont nem indul el. A segédcsomópont rendszereseménynaplója (SEL) a következő események egyikét is jelenti.
Modul/Board – Megosztott IO hiba érvényesítve
Az Aux/Pri SharedIO érzékelő kevésbé súlyos állapotból kritikus állapotba került.
Kapcsolja ki vagy indítsa újra
A megosztott I/O adapterekkel rendelkező csomópontok kikapcsolásakor vagy újraindításakor a segédcsomópontot mindig az elsődleges csomópont előtt kell lekapcsolni. Az Aux adapter nem tud működni az elsődleges csomóponti adapter tápellátása nélkül. Nincs olyan mechanizmus, amely megakadályozná az elsődleges csomópont kikapcsolását, miközben a segédcsomópont még mindig be van kapcsolva, ezért fontos, hogy fokozottan ügyeljen a csomópontok kikapcsolásának sorrendjére. Ha nem kapcsolja ki először a segédcsomópontot, az a rendszer eseménynaplójában (SEL) jelent hibát a segédcsomóponton, vagy bizonyos esetekben egy szoftveres NMI-t, amint az Aux adapter áramellátása megszűnik, és már nem látható.
Slot/csatlakozó – PCIe 1 – Hiba – PCIe 1
Kritikus megszakítás - NMI állapot - Szoftver NMI
Egyéb megfontolások
A megosztott I/O adapterek telepítésekor az elsődleges adaptert a ház jobb oldalára, a kiegészítő adaptert pedig a bal oldalra kell telepíteni.
A megosztott I/O adapter firmware-ének frissítéséhez először kapcsolja ki a segédcsomópontot. Miután a kódot alkalmazta az elsődleges kártyán, kapcsolja ki az elsődleges csomópontot, és kapcsolja be újra. Miután az operációs rendszer elindult, kapcsolja be az Auxiliary node-ot.
Ha a rendszereseménynaplóban bármely ponton PCI-buszhiba vagy Szoftver-NMI keletkezett egy helytelen kikapcsolási sorrend miatt, virtuális újrabeállítás végezhető az esemény törlésére.