NVIDIA CUDA Toolkit 11.1.0 (for Windows 10)

NVIDIA CUDA Toolkit menyediakan lingkungan pengembangan untuk membuat aplikasi dengan akselerasi GPU berkinerja tinggi. Dengan CUDA Toolkit, Anda dapat mengembangkan, mengoptimalkan, dan menerapkan aplikasi Anda pada sistem tertanam yang dipercepat GPU, workstation desktop, pusat data perusahaan, platform berbasis cloud, dan superkomputer HPC.

Toolkit ini mencakup pustaka yang dipercepat GPU, alat debugging dan pengoptimalan, kompiler C / C ++, dan pustaka runtime untuk menerapkan aplikasi Anda.

Library CUDA yang dipercepat GPU memungkinkan akselerasi drop-in di beberapa domain seperti aljabar linier, pemrosesan gambar dan video, pembelajaran mendalam, dan analitik grafik.

Untuk mengembangkan algoritme khusus, Anda dapat menggunakan integrasi yang tersedia dengan bahasa dan paket numerik yang umum digunakan, serta API pengembangan yang dipublikasikan dengan baik.

Aplikasi CUDA Anda dapat diterapkan di semua keluarga GPU NVIDIA yang tersedia di lokasi dan pada instans GPU di cloud. Menggunakan kapabilitas bawaan untuk mendistribusikan komputasi di konfigurasi multi-GPU, ilmuwan dan peneliti dapat mengembangkan aplikasi yang berskala dari workstation GPU tunggal hingga instalasi cloud dengan ribuan GPU.

IDE dengan alat grafis dan baris perintah untuk debugging, mengidentifikasi hambatan kinerja pada GPU dan CPU, dan menyediakan panduan pengoptimalan yang peka konteks. Kembangkan aplikasi menggunakan bahasa pemrograman yang sudah Anda ketahui, termasuk C, C ++, Fortran, dan Python.

Untuk memulai, telusuri sumber daya memulai online, panduan pengoptimalan, contoh ilustrasi, dan berkolaborasi dengan komunitas pengembang yang berkembang pesat. Unduh NVIDIA CUDA Toolkit untuk PC hari ini!

Fitur dan Sorotan

  • GPU Timestamp: Mulai timestamp
  • Metode: Nama metode GPU. Ini bisa berupa “memcpy *” untuk salinan memori atau nama kernel GPU. Salinan memori memiliki sufiks yang menjelaskan jenis transfer memori, mis. “memcpyDToHasync” berarti transfer asinkron dari memori Perangkat ke memori Host
  • Waktu GPU: Ini adalah waktu eksekusi untuk metode pada GPU
  • Waktu CPU: Ini adalah jumlah waktu GPU dan overhead CPU untuk meluncurkan Metode itu. Pada tingkat data yang dihasilkan oleh pengemudi, Waktu CPU hanyalah overhead CPU untuk meluncurkan Metode Metode non-pemblokiran; untuk metode pemblokiran, ini adalah jumlah waktu GPU dan overhead CPU. Semua peluncuran kernel secara default tidak memblokir. Tetapi jika ada penghitung profiler yang diaktifkan, peluncuran
  • kernel akan diblokir. Permintaan salinan memori asinkron di aliran yang berbeda tidak memblokir
  • Id Streaming: Nomor identifikasi untuk aliran
  • Kolom hanya untuk metode kernel
  • Hunian: Hunian adalah rasio jumlah warps aktif per multiprosesor dengan jumlah maksimum warps aktif
  • Penghitung profiler: Lihat bagian penghitung profiler untuk daftar penghitung yang didukung
  • ukuran petak: Jumlah blok dalam petak sepanjang dimensi X, Y, dan Z ditampilkan sebagai [num_blocks_X num_blocks_Y num_blocks_Z] dalam satu kolom
  • ukuran blok: Jumlah utas dalam blok sepanjang dimensi X, Y, dan Z ditampilkan sebagai [num_threads_X num_threads_Y num_threads_Z]] dalam satu kolom
  • dyn smem per blok: Ukuran memori bersama dinamis per blok dalam byte
  • sta smem per block: Ukuran memori bersama statis per blok dalam byte
  • reg per utas: Jumlah register per utas
  • Kolom hanya untuk metode memcopy
  • ukuran transfer mem: Ukuran transfer memori dalam byte
  • host mem transfer type: Menentukan apakah transfer memori menggunakan memori “Pageable” atau “Page-lock”

Juga Tersedia: Unduh NVIDIA CUDA Toolkit untuk Mac