Siêu máy tính nhanh nhất thế giới khổ sở vì... vàng
Đăng lúc 03:45
| Ngày Thứ Bảy, 16 tháng 3, 2013
| Bởi Unknown
Titan - siêu máy tính nhanh nhất thế giới đặt tại Phòng thí nghiệm quốc gia Oak Ridge - bất ngờ trở nên ì ạch và không thể hoàn thành các bài kiểm tra của mình. Nguyên nhân được xác định là do cỗ máy khổng lồ trị giá 100 triệu USD này đã chứa trong mình quá nhiều vàng.
Vấn đề với Titan được phát hiện vào tháng Hai, khi siêu máy tính chỉ hoàn thành được 92% yêu cầu so với yêu cầu của bài kiểm tra. Ngay lập tức, vấn đề đã được khoanh vùng và các chân nối giao tiếp giữa CPU và GPU được xác định là thủ phạm.
Kết quả phân tích các chân nối trên bo mạch chủ cho thấy, nguyên nhân chính là do quá nhiều vàng pha trộn vào các mối hàn. Vàng được sử dụng cho các kết nối bởi vì nó không bị ôxy hóa một cách nhanh chóng và có tính dẫn điện cao. Tuy nhiên, khi trộn vào các mối hàn có chứa thiếc, vàng và thiếc kết hợp lại làm cho các mối hàn trở nên giòn hơn. Khi Titan vận hành, những thay đổi nhiệt độ liên tục đã tạo ra các vết nứt tại các mối hàn, làm suy giảm hiệu quả hoạt động của cả hệ thống.
Theo báo cáo của Oak Ridge, Titan có khoảng 20.000 kết nối cần được sửa chữa. Mỗi kết nối như vậy có khoảng 100 chân cần phải thay đổi các mối hàn. Hiện tại, các bo mạch chủ của Titan đã được gửi trở lại nhà sản xuất để thay thế các mối hàn với tiến độ sửa chữa khoảng 12-16 tủ mỗi tuần.
Chính thức được Phòng thí nghiệm quốc gia Oak Ridge vận hành từ tháng 10.2012, ngay lập tức Titan đã dẫn đầu danh sách các siêu máy tính nhanh nhất thế giới. Cỗ máy này sử dụng các bộ xử lý 16 nhân AMD Opteron tốc độ 2,2Ghz kết hợp với chip Nvidia K20X Kepler tạo thành một hệ thống khổng lồ với tổng cộng 560.640 lõi.
Tất cả những thứ này được chứa trong 200 chiếc tủ tương đương với kích thước của tủ quần áo. Mỗi tủ chứa 24 máy tính dạng phiến có kích cỡ tương đương 1 hộp bánh pizza. Toàn bộ hệ thống cung cấp một sức mạnh xử lý lên đến 17,6 petaflops hoặc hơn 17.000 tỉ phép tính mỗi giây - tức cao hơn gấp 10 lần so với khả năng xử lý của Jaguar, siêu máy tính “tiền nhiệm” mà nó thay thế.
Dự kiến, việc sửa chữa Titan sẽ hoàn thành vào đầu tháng 4 để siêu máy tính này kịp hoàn thành tất cả các bài kiểm tra và kết thúc quá trình thử nghiệm vào tháng 6.2013.
Kết quả phân tích các chân nối trên bo mạch chủ cho thấy, nguyên nhân chính là do quá nhiều vàng pha trộn vào các mối hàn. Vàng được sử dụng cho các kết nối bởi vì nó không bị ôxy hóa một cách nhanh chóng và có tính dẫn điện cao. Tuy nhiên, khi trộn vào các mối hàn có chứa thiếc, vàng và thiếc kết hợp lại làm cho các mối hàn trở nên giòn hơn. Khi Titan vận hành, những thay đổi nhiệt độ liên tục đã tạo ra các vết nứt tại các mối hàn, làm suy giảm hiệu quả hoạt động của cả hệ thống.
Theo báo cáo của Oak Ridge, Titan có khoảng 20.000 kết nối cần được sửa chữa. Mỗi kết nối như vậy có khoảng 100 chân cần phải thay đổi các mối hàn. Hiện tại, các bo mạch chủ của Titan đã được gửi trở lại nhà sản xuất để thay thế các mối hàn với tiến độ sửa chữa khoảng 12-16 tủ mỗi tuần.
Chính thức được Phòng thí nghiệm quốc gia Oak Ridge vận hành từ tháng 10.2012, ngay lập tức Titan đã dẫn đầu danh sách các siêu máy tính nhanh nhất thế giới. Cỗ máy này sử dụng các bộ xử lý 16 nhân AMD Opteron tốc độ 2,2Ghz kết hợp với chip Nvidia K20X Kepler tạo thành một hệ thống khổng lồ với tổng cộng 560.640 lõi.
Tất cả những thứ này được chứa trong 200 chiếc tủ tương đương với kích thước của tủ quần áo. Mỗi tủ chứa 24 máy tính dạng phiến có kích cỡ tương đương 1 hộp bánh pizza. Toàn bộ hệ thống cung cấp một sức mạnh xử lý lên đến 17,6 petaflops hoặc hơn 17.000 tỉ phép tính mỗi giây - tức cao hơn gấp 10 lần so với khả năng xử lý của Jaguar, siêu máy tính “tiền nhiệm” mà nó thay thế.
Dự kiến, việc sửa chữa Titan sẽ hoàn thành vào đầu tháng 4 để siêu máy tính này kịp hoàn thành tất cả các bài kiểm tra và kết thúc quá trình thử nghiệm vào tháng 6.2013.
Nguồn: Oak Ridge Today, Slashdot







0 nhận xét