nang2911
Thành viên
- Tham gia
- 12/10/2017
- Bài viết
- 4
Trong blog này, chúng tôi đã kiểm tra điểm chuẩn GPU NVIDIA GeForce RTX 2080 Ti trên khung học sâu của TensorFlow . Kết quả của chúng tôi cho thấy RTX 2080 Ti cung cấp giá trị đáng kinh ngạc cho giá cả. Chúng tôi đã chạy thử nghiệm trên một trong những máy trạm học sâu của chúng tôi (xem thông số kỹ thuật hệ thống bên dưới), với nhiều cấu hình GPU (1,2,4). Với mức giá khởi điểm, kết quả của Turing RTX 2080 Ti thực sự đáng chú ý cho việc đào tạo học tập sâu. Điều này được thể hiện rõ hơn khi so sánh hiệu suất với Volta Powered TITAN V ( xem blog của chúng tôi ở đây ), trong đó hiệu suất gần như ngang bằng.
Benchmark Snapshot: Nasnet, VGG16, Inception V3, ResNET-50
Phương pháp đo
Cấu hình được sử dụng cho TensorFlow không thay đổi từ đầu đến cuối ngoại trừ số lượng GPU được sử dụng trong một lần chạy chuẩn cụ thể.
Ghi chú: Chức năng giữ lại hình ảnh trong TensorFlow đã được sử dụng để nhập dữ liệu thực (hình ảnh) vào mô hình Nasnet, chứa dữ liệu thực bao gồm hình ảnh jpeg của hoa từ bộ dữ liệu của hình ảnh. Các mô hình khác Resnet50, VGG16, InceptionV3, đã sử dụng dữ liệu tổng hợp, được đo bằng cách sử dụng dữ liệu mà không có bất kỳ sửa đổi nào được thực hiện trong suốt chu kỳ thử nghiệm. Các thử nghiệm đã chạy bằng cách sử dụng gói python-pip trong thời gian chạy Anaconda theo quy định trong tài liệu cài đặt TensorFlow.
Các tập lệnh chuẩn đã được tải xuống từ github chính thức của TensorFlow, cùng với các mô hình được xây dựng trước. Trong mỗi trường hợp, các biến duy nhất thay đổi từ chạy sang chạy là: num_gpus và mô hình . Tất cả các thông số khác không thay đổi trong suốt thời gian của các thí nghiệm này. Kích thước hàng loạt được sử dụng là 64 cho tất cả đào tạo, chạy ở mặc định, độ chính xác đơn (fp32).
>>> Xem thêm: máy chủ hpe proliant dl360 gen10
Thông số kỹ thuật hệ thống máy trạm RTX 2080 Ti
CPU 2 x Intel Xeon Gold 6148 2.4GHz CPU
RAM 192GB DDR4-2666
SSD 500 GB SSD
GPU 1, 2, 4x NVIDIA GeForce RTX 2080 Ti (blower model)
OS Ubuntu Server 16.04
DRIVER NVIDIA version 396.44
CUDA CUDA Toolkit 9.2
Python v 2.7, pip v8, Anaconda
TensorFlow 1.12
NVIDIA GeForce RTX 2080 Ti Deep Learning Benchmark trên TensorFlow: cấu hình 1, 2 và 4 GPU
Nasnet Images/Sec (Real Data)
ResNet-50 Images/Sec (Synthetic Data)
Inception V3 Images/Sec (Synthetic Data)
VGG16 Images/Sec (Synthetic Data)
Các lệnh Nasnet Benchmark & Output trên TensorFlow
Bên dưới các lệnh cụ thể để chạy từng kịch bản được ghi lại trên kết quả điểm chuẩn. Để thay đổi các mô hình mạng thần kinh, chỉ cần thay đổi mô hình lá cờ tức là mô hình = resnet50 để đào tạo các mô hình Resnet50 với tất cả các biến khác như vậy.
>>> Xem thêm: ram hpe proliant dl380 gen10
Nasnet 1 GPU
python tf_cnn_benchmarks.py --data_format=NCHW --batch_size=64 --model=nasnet --optimizer=momentum -- variable_update=replicated --nodistortions --gradient_repacking=8 --num_gpus=1 --num_epochs=90 --weight_decay=1e-4 --data_dir=/data --train_dir=/data/scratch --data_name=imagenet
Step Img/sec total_loss
1 images/sec: 156.8 +/- 0 (jitter = 0.0) 7.496
10 images/sec: 156.7 +/- 0.5 (jitter = 2.5) 7.345
20 images/sec: 156.5 +/- 0.4 (jitter = 1.9) 7.52
30 images/sec: 156 +/- 0.3 (jitter = 2.0) 7.41
40 images/sec: 156.6 +/- 0.3 (jitter = 2.1) 7.473
50 images/sec: 156.5 +/- 0.3 (jitter = 2.1) 7.504
60 images/sec: 156.2 +/- 0.3 (jitter = 2.0) 7.509
70 images/sec: 156.4 +/- 0.3 (jitter = 2.1) 7.54
80 images/sec: 156.3 +/- 0.2 (jitter = 2.0) 7.332
90 images/sec: 156.3 +/- 0.2 (jitter = 1.9) 7.583
100 images/sec: 156.3 +/- 0.2 (jitter = 2.1) 7.43
—————————————————————-
total images/sec: 156.2
—————————————————————-
Công ty cổ phần thương mại Máy Chủ Hà Nội
- Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
Hotline mua hàng Hà Nội: 0979 83 84 84 Điện thoai: 024 6296 6644
- CN Hồ Chí Minh: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
Hotline mua hàng Hồ Chí Minh: 0945 92 96 96 Điện thoai: 028 2244 9399
- Email: hotro@maychuhanoi.vn
- website: https://maychuhanoi.vn/
- facebook: https://www.facebook.com/maychuhanoi
Benchmark Snapshot: Nasnet, VGG16, Inception V3, ResNET-50
Phương pháp đo
Cấu hình được sử dụng cho TensorFlow không thay đổi từ đầu đến cuối ngoại trừ số lượng GPU được sử dụng trong một lần chạy chuẩn cụ thể.
Ghi chú: Chức năng giữ lại hình ảnh trong TensorFlow đã được sử dụng để nhập dữ liệu thực (hình ảnh) vào mô hình Nasnet, chứa dữ liệu thực bao gồm hình ảnh jpeg của hoa từ bộ dữ liệu của hình ảnh. Các mô hình khác Resnet50, VGG16, InceptionV3, đã sử dụng dữ liệu tổng hợp, được đo bằng cách sử dụng dữ liệu mà không có bất kỳ sửa đổi nào được thực hiện trong suốt chu kỳ thử nghiệm. Các thử nghiệm đã chạy bằng cách sử dụng gói python-pip trong thời gian chạy Anaconda theo quy định trong tài liệu cài đặt TensorFlow.
Các tập lệnh chuẩn đã được tải xuống từ github chính thức của TensorFlow, cùng với các mô hình được xây dựng trước. Trong mỗi trường hợp, các biến duy nhất thay đổi từ chạy sang chạy là: num_gpus và mô hình . Tất cả các thông số khác không thay đổi trong suốt thời gian của các thí nghiệm này. Kích thước hàng loạt được sử dụng là 64 cho tất cả đào tạo, chạy ở mặc định, độ chính xác đơn (fp32).
>>> Xem thêm: máy chủ hpe proliant dl360 gen10
Thông số kỹ thuật hệ thống máy trạm RTX 2080 Ti
CPU 2 x Intel Xeon Gold 6148 2.4GHz CPU
RAM 192GB DDR4-2666
SSD 500 GB SSD
GPU 1, 2, 4x NVIDIA GeForce RTX 2080 Ti (blower model)
OS Ubuntu Server 16.04
DRIVER NVIDIA version 396.44
CUDA CUDA Toolkit 9.2
Python v 2.7, pip v8, Anaconda
TensorFlow 1.12
NVIDIA GeForce RTX 2080 Ti Deep Learning Benchmark trên TensorFlow: cấu hình 1, 2 và 4 GPU
Nasnet Images/Sec (Real Data)
ResNet-50 Images/Sec (Synthetic Data)
Inception V3 Images/Sec (Synthetic Data)
VGG16 Images/Sec (Synthetic Data)
Các lệnh Nasnet Benchmark & Output trên TensorFlow
Bên dưới các lệnh cụ thể để chạy từng kịch bản được ghi lại trên kết quả điểm chuẩn. Để thay đổi các mô hình mạng thần kinh, chỉ cần thay đổi mô hình lá cờ tức là mô hình = resnet50 để đào tạo các mô hình Resnet50 với tất cả các biến khác như vậy.
>>> Xem thêm: ram hpe proliant dl380 gen10
Nasnet 1 GPU
python tf_cnn_benchmarks.py --data_format=NCHW --batch_size=64 --model=nasnet --optimizer=momentum -- variable_update=replicated --nodistortions --gradient_repacking=8 --num_gpus=1 --num_epochs=90 --weight_decay=1e-4 --data_dir=/data --train_dir=/data/scratch --data_name=imagenet
Step Img/sec total_loss
1 images/sec: 156.8 +/- 0 (jitter = 0.0) 7.496
10 images/sec: 156.7 +/- 0.5 (jitter = 2.5) 7.345
20 images/sec: 156.5 +/- 0.4 (jitter = 1.9) 7.52
30 images/sec: 156 +/- 0.3 (jitter = 2.0) 7.41
40 images/sec: 156.6 +/- 0.3 (jitter = 2.1) 7.473
50 images/sec: 156.5 +/- 0.3 (jitter = 2.1) 7.504
60 images/sec: 156.2 +/- 0.3 (jitter = 2.0) 7.509
70 images/sec: 156.4 +/- 0.3 (jitter = 2.1) 7.54
80 images/sec: 156.3 +/- 0.2 (jitter = 2.0) 7.332
90 images/sec: 156.3 +/- 0.2 (jitter = 1.9) 7.583
100 images/sec: 156.3 +/- 0.2 (jitter = 2.1) 7.43
—————————————————————-
total images/sec: 156.2
—————————————————————-
Công ty cổ phần thương mại Máy Chủ Hà Nội
- Trụ sở Hà Nội: Tầng 1,2,4 - Tòa nhà PmaxLand số 32 ngõ 133 Thái Hà - Q. Đống Đa
Hotline mua hàng Hà Nội: 0979 83 84 84 Điện thoai: 024 6296 6644
- CN Hồ Chí Minh: Lầu 1- Tòa nhà 666/46/29 Đường 3/2- Phường 14 - Quận 10
Hotline mua hàng Hồ Chí Minh: 0945 92 96 96 Điện thoai: 028 2244 9399
- Email: hotro@maychuhanoi.vn
- website: https://maychuhanoi.vn/
- facebook: https://www.facebook.com/maychuhanoi