วันนี้มีปัญหาที่พิศดารมาเล่าให้ฟังเป็นเคสสำหรับคนทำเน็ตเวิร์คอีกแล้ว
เรื่องของเรื่องก็คือ ทีม #vronline ไปวางระบบให้กับ Startup รายหนึ่งชื่อว่า Storylog ที่ทำระบบเกี่ยวกับการพัฒนา Platform นักเขียน
ระบบมันก็ทำงานมาเรื่อยๆ จนช่วงประมาณเดือนกว่าๆ ที่ผ่านมา
มีแจ้งมาว่า Internet ช้าจัง ดูให้หน่อย
ผมก็ remote ไปดู
ระบบก็ปกติ … อุปกรณ์ทุกตัวทำงานปกติ ไม่มี downtime แล้วก็ มี User ใช้งาน Internet กันในระดับ 100Mbps
ก็แปลกใจ มันไม่น่าจะช้าได้นะ เลยลอง reset access Point ในโซนนั้นไป แล้วก็เหมือนเรื่องเงียบๆไป
ซักพัก ก็มีแจ้งมาแบบเดิมเลย
แล้วก็แก้ด้วยการ Reset AP
วนอย่างงี้อยู่ 3-4 รอบ
เฮ้ย มันชักทะแม่งๆแล้ว
เลยตัดสินใจไปดูหน้างานเลย
ในมุมของระบบที่วางไว้ ที่นี่มี Access Point 10 ตัว วางกระจายทั่วทั้ง Office และพื้นที่ห้องทำงานต่างๆ
ชั้นล่างเป็น Cafe กาแฟ สำหรับคุยงาน ชั้นบนเป็น Office ทั่วๆไป
Access Point ที่ติดตั้งเป็น UNIFI AC LR ที่ติดตั้งเมื่อสามปีก่อน + Mikrotik Gateway
Internet ที่ใช้เป็น MPLS ของ True ความเร็วตอนเริ่มติดตั้งคือ 100Mbps ตอนนี้ขยายเป็น 200Mbps (ไม่มี fttx เข้ามาในพื้นที่เลยต้อง
ลาก MPLS แพงๆนี่ใช้งาน)
โซนที่มีปัญหาเป็นโซนที่ Dev นั่งทำงาน ซึ่งกระจายๆ กันบนโต๊ะ แบบ Openspace ประมาณ 20-30 คน ทำงานทั้งบน Mac และ Windows
รอบล่าสุดที่ลูกค้าแจ้งปัญหามา บอกว่า speedtest ได้หลัก 2Mbps …
และผมเองก็ Remote เพื่อดูปัญหาอยู่ก็เห็นว่า Internet Bandwidth เหลือเฟือมากๆ แล้วกด speedtest ได้ 2mbps นี่แปลว่าระบบ
ภายในต้องมีปัญหาแน่ๆ
ตัว UNIFI Controller แจ้งมาว่า AP ทำงานปกติ ไม่ได้มี Disconnect แล้วก็มี สถานะ UNIFI WIFI Experience เกิน 90% สำหรับ Client ทุกตัว
ตอนผมมาถึงหน้างาน ทุกอย่างปกติมาก แต่ทุกคนบ่นอุบว่าโคตรช้า
ผมลองเอาอุปกรณ์เชื่อมต่อใน โซนนั้น แล้วก็ลองทำ Speedtest ดู ปรากฏว่าได้แค่ 20Mbps
เฮ้ยยยย อะไรฟระ
แล้วก็พอ Login เข้าไปใน UNIFI Controller ค่า Setting ที่ได้คือ ผมเชื่อมอยู่ที่ MCS7 – MCS8 ขึ้นไปด้วยซ้ำ Linkspeed อยู่เกิน 400Mbps ซะอีก (ที่นี่เปิด Bandwidth แค่ 40Mhz เพราะมี AP ในระบบเยอะ ต้องแบ่ง Channel กันใช้)
ลอง reboot ap ไป 1 ที
กลับมาต่อใหม่ ความเร็วเต็ม
นั่งใช้งานไปซักพัก ความเร็วตกอีกรอบ เหลือ 20Mbps
และเหมือนเดิม สถานะการเชื่อมต่อ เต็มเปี่ยม
เลยลองเช็คเรื่องของ Channel Utilization ดู
ก็พบว่า มี Utilization เหลือเฟือ ไม่ได้มีใครมากวนอะไร
ลอง remote ไป hard reset แล้วลอง deploy ค่า config เข้าไป ผลก็ออกมาเหมือนเดิม
จริงๆ อยากจะแกะมาทดสอบให้มากกว่านี้ ติดอยู่ตรงที่ว่าดันติดตั้งไว้สูงเกิน ต้องเอานั่งร้าน 2 ชั้นมาต่อเพื่อปีนขึ้นไปเอา AP ลงมานี่แหละ
สรุปก็คือ ฟันธงว่า AP เสีย โดยที่ไม่รู้สาเหตุ
ทีนี้ ผมเองก็ต้องไล่ทดสอบ AP ทุกตัวทั้ง 10 ตัวว่า มีตัวไหนเสียอีกบ้าง เพราะเราไม่รู้ว่ามันเสียกี่ตัวกันแน่ เพราะเสียงบ่นมันกระจัดกระจาย สารพัดแผนกมาก
ผมก็เลยตั้ง iperf server แล้วก็เอามือถือไล่เช็ตในโซนต่างๆ เพื่อดูว่า throughput ในแต่ละโซน มันมีตัวไหนได้ ความเร็วแย่ๆบ้าง
ผลก็คือ เสียไป 3 ตัว
เอาเป็นว่า เรื่องนี้มันเป็นปัญหาเชิงลึกที่ต้องอาศัย Engineer มาทดสอบหน้างาน ไม่สามารถที่จะแก้ด้วยการ remote ได้เลยจริงๆครับ
———————————————-
เกร็ดความรู้เพื่อการอ่านแล้วเข้าใจมากขึ้น
ค่า MCS ชื่อมาจาก Modulation and Coding Scheme เป็นค่าที่แทนให้เห็นถึงความเร็วในการเชื่อมต่อระหว่าง Access Point กับ Client โดยที่ แบ่งเป็น 9 ระดับ แยกกันตามความเร็วที่ Client เชื่อมต่อได้
ค่า MCS 1 คือค่าต่ำสุด และ MCS9 คือค่าสูงสุด
ค่านี้ประกอบมาจาก Client ที่มาเชื่อมต่อกับ AP มีค่าต่างๆข้างล่างนี้เท่าไหร่บ้าง เช่น
– Modulation อะไร ( 16QAM , 64QAM , 256QAM)
– Short หรือ Long Guard Interal
– Bandwidth ของการเชื่อมต่อมีกี่ Mhz
– การเชื่อมต่อ ต่อด้วย กี่ Spatial Steam
– ค่า SNR ของการเชื่อมต่อได้เท่าไหร่
แล้วก็จะแปรเปลี่ยนมาเป็นความเร็ว
เช่น
WIFI AC จะแบบ 2×2:2 เชื่อมต่อที่ 80Mhz จะได้ความเร็วสูงสุด MCS9 ที่ 866Mbps อะไรแบบนี้เป็นต้น
——————————————–
ใครที่สนใจการมาทำงาน Network Engineer ก็สามารถติดต่อ Post ของผม หรือไปอ่านเรื่องที่ผมเขียน ที่ packethunter.net ได้นะครับ
ส่วนใครที่สนใจอยากให้ทีม #vronline วางระบบให้ สามารถนัดจองคิวเพื่อทำ Site Survey ได้ที่ คุณจอย 088-874-6271 / [email protected] นะครับ