Service Host – Microsoft Failover Cluster : Drain roles

Best practice สำหรับการทำ service maintanance host server ที่อยู่ใน cluster ก่อนที่จะ reboot server นั้น ควรมีขั้นตอนการทำงานเพื่อป้องกันความผิดพลาดหรือความเสียหายที่อาจเกิดขึ้นกับระบบได้ เป็นการจัดการความเสี่ยงอย่างหนึ่งที่สำคัญมาก โดยมีหลักการ คือ หากต้องการ service maintanance host server ใด ให้ทำการ clear ให้ว่างก่อน โดยมีส่วนที่จะให้ความสำคัญ คือ

Roles(vm) ที่เป็น member owner node ของ server นั้นให้ย้ายออกไปที่ node อื่น
Disks volume ในกรณีที่ Cluster นั้นมีทำงานระบบ Storage Space Direct (S2D) ให้ย้าย owner nodes ไปที่ node อื่นด้วย
Node ให้ทำ drain roles เพื่อหยุดสถานะการทำงานใน cluster ไว้ก่อน (pause)

การทำ drain roles นั้นสามารถป้องกันปัญหาที่อาจจะเกิดขึ้นหลังจากการทำ service maintance เช่น หาก reboot server แล้วมีข้อผิดพลาด vm จะไม่ทำการ migration กลับมาอัตโนมัติ หรือหากต้อง reboot node มากกว่า 1 ครั้ง อาจทำให้เกิดความเสียหายระหว่างการทำ migration หรือ หาก cluster นั้นมีระบบ storage space direct ด้วย หลังจากการ reboot node ใน member ระบบจะทำการ regeneration storage jobs หากอยู่ในการทำงานนี้แล้ว node มีการ reboot อีก อาจทำให้เกิดความเสียหายกับ storage volume ได้

ในส่วนนี้จะพูดถึงการทำ drain roles โดยมีวิธีการทำดังนี้

ให้เข้าสู้ failover cluster manager ไป Nodes

เลือก node ที่ต้องการ ไปด้านขวาเลือก pause