Facebook
From Burly Porcupine, 1 Year ago, written in Plain Text.
Embed
Download Paste or View Raw
Hits: 149
  1. edora ~]$ clinfo
  2. Number of platforms                               1
  3.   Platform Name                                   AMD Accelerated Parallel Processing
  4.   Platform Vendor                                 Advanced Micro Devices, Inc.
  5.   Platform Version                                OpenCL 2.1 AMD-APP (3452.0)
  6.   Platform Profile                                FULL_PROFILE
  7.   Platform Extensions                             cl_khr_icd cl_amd_event_callback
  8.   Platform Extensions function suffix             AMD
  9.   Platform Host timer resolution                  1ns
  10.  
  11.   Platform Name                                   AMD Accelerated Parallel Processing
  12. Number of devices                                 1
  13.   Device Name                                     gfx900:xnack-
  14.   Device Vendor                                   Advanced Micro Devices, Inc.
  15.   Device Vendor ID                                0x1002
  16.   Device Version                                  OpenCL 2.0
  17.   Driver Version                                  3452.0 (HSA1.1,LC)
  18.   Device OpenCL C Version                         OpenCL C 2.0
  19.   Device Type                                     GPU
  20.   Device Board Name (AMD)                         AMD Radeon RX Vega
  21.   Device PCI-e ID (AMD)                           0x687f
  22.   Device Topology (AMD)                           PCI-E, 0000:44:00.0
  23.   Device Profile                                  FULL_PROFILE
  24.   Device Available                                Yes
  25.   Compiler Available                              Yes
  26.   Linker Available                                Yes
  27.   Max compute units                               64
  28.   SIMD per compute unit (AMD)                     4
  29.   SIMD width (AMD)                                16
  30.   SIMD instruction width (AMD)                    1
  31.   Max clock frequency                             1630MHz
  32.   Graphics IP (AMD)                               9.0
  33.   Device Partition                                (core)
  34.     Max number of sub-devices                     64
  35.     Supported partition types                     None
  36.     Supported affinity domains                    (n/a)
  37.   Max work item dimensions                        3
  38.   Max work item sizes                             1024x1024x1024
  39.   Max work group size                             256
  40.   Preferred work group size (AMD)                 256
  41.   Max work group size (AMD)                       1024
  42.   Preferred work group size multiple (kernel)     64
  43.   Wavefront width (AMD)                           64
  44.   Preferred / native vector sizes                
  45.     char                                                 4 / 4      
  46.     short                                                2 / 2      
  47.     int                                                  1 / 1      
  48.     long                                                 1 / 1      
  49.     half                                                 1 / 1        (cl_khr_fp16)
  50.     float                                                1 / 1      
  51.     double                                               1 / 1        (cl_khr_fp64)
  52.   Half-precision Floating-point support           (cl_khr_fp16)
  53.     Denormals                                     No
  54.     Infinity and NANs                             No
  55.     Round to nearest                              No
  56.     Round to zero                                 No
  57.     Round to infinity                             No
  58.     IEEE754-2008 fused multiply-add               No
  59.     Support is emulated in software               No
  60.   Single-precision Floating-point support         (core)
  61.     Denormals                                     Yes
  62.     Infinity and NANs                             Yes
  63.     Round to nearest                              Yes
  64.     Round to zero                                 Yes
  65.     Round to infinity                             Yes
  66.     IEEE754-2008 fused multiply-add               Yes
  67.     Support is emulated in software               No
  68.     Correctly-rounded divide and sqrt operations  Yes
  69.   Double-precision Floating-point support         (cl_khr_fp64)
  70.     Denormals                                     Yes
  71.     Infinity and NANs                             Yes
  72.     Round to nearest                              Yes
  73.     Round to zero                                 Yes
  74.     Round to infinity                             Yes
  75.     IEEE754-2008 fused multiply-add               Yes
  76.     Support is emulated in software               No
  77.   Address bits                                    64, Little-Endian
  78.   Global memory size                              8573157376 (7.984GiB)
  79.   Global free memory (AMD)                        8372224 (7.984GiB) 8372224 (7.984GiB)
  80.   Global memory channels (AMD)                    64
  81.   Global memory banks per channel (AMD)           4
  82.   Global memory bank width (AMD)                  256 bytes
  83.   Error Correction support                        No
  84.   Max memory allocation                           7287183768 (6.787GiB)
  85.   Unified memory for Host and Device              No
  86.   Shared Virtual Memory (SVM) capabilities        (core)
  87.     Coarse-grained buffer sharing                 Yes
  88.     Fine-grained buffer sharing                   Yes
  89.     Fine-grained system sharing                   No
  90.     Atomics                                       No
  91.   Minimum alignment for any data type             128 bytes
  92.   Alignment of base address                       1024 bits (128 bytes)
  93.   Preferred alignment for atomics                
  94.     SVM                                           0 bytes
  95.     Global                                        0 bytes
  96.     Local                                         0 bytes
  97.   Max size for global variable                    7287183768 (6.787GiB)
  98.   Preferred total size of global vars             8573157376 (7.984GiB)
  99.   Global Memory cache type                        Read/Write
  100.   Global Memory cache size                        16384 (16KiB)
  101.   Global Memory cache line size                   64 bytes
  102.   Image support                                   Yes
  103.     Max number of samplers per kernel             26751
  104.     Max size for 1D images from buffer            134217728 pixels
  105.     Max 1D or 2D image array size                 8192 images
  106.     Base address alignment for 2D image buffers   256 bytes
  107.     Pitch alignment for 2D image buffers          256 pixels
  108.     Max 2D image size                             16384x16384 pixels
  109.     Max 3D image size                             16384x16384x8192 pixels
  110.     Max number of read image args                 128
  111.     Max number of write image args                8
  112.     Max number of read/write image args           64
  113.   Max number of pipe args                         16
  114.   Max active pipe reservations                    16
  115.   Max pipe packet size                            2992216472 (2.787GiB)
  116.   Local memory type                               Local
  117.   Local memory size                               65536 (64KiB)
  118.   Local memory size per CU (AMD)                  65536 (64KiB)
  119.   Local memory banks (AMD)                        32
  120.   Max number of constant args                     8
  121.   Max constant buffer size                        7287183768 (6.787GiB)
  122.   Preferred constant buffer size (AMD)            16384 (16KiB)
  123.   Max size of kernel argument                     1024
  124.   Queue properties (on host)                      
  125.     Out-of-order execution                        No
  126.     Profiling                                     Yes
  127.   Queue properties (on device)                    
  128.     Out-of-order execution                        Yes
  129.     Profiling                                     Yes
  130.     Preferred size                                262144 (256KiB)
  131.     Max size                                      8388608 (8MiB)
  132.   Max queues on device                            1
  133.   Max events on device                            1024
  134.   Prefer user sync for interop                    Yes
  135.   Number of P2P devices (AMD)                     0
  136.   Profiling timer resolution                      1ns
  137.   Profiling timer offset since Epoch (AMD)        0ns (Thu Jan  1 01:00:00 1970)
  138.   Execution capabilities                          
  139.     Run OpenCL kernels                            Yes
  140.     Run native kernels                            No
  141.     Thread trace supported (AMD)                  No
  142.     Number of async queues (AMD)                  8
  143.     Max real-time compute queues (AMD)            8
  144.     Max real-time compute units (AMD)             64
  145.   printf() buffer size                            4194304 (4MiB)
  146.   Built-in kernels                                (n/a)
  147.   Device Extensions                               cl_khr_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_fp16 cl_khr_gl_sharing cl_amd_device_attribute_query cl_amd_media_ops cl_amd_media_ops2 cl_khr_image2d_from_buffer cl_khr_subgroups cl_khr_depth_images cl_amd_copy_buffer_p2p cl_amd_assembly_program
  148.  
  149. NULL platform behavior
  150.   clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...)  AMD Accelerated Parallel Processing
  151.   clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...)   Success [AMD]
  152.   clCreateContext(NULL, ...) [default]            Success [AMD]
  153.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT)  Success (1)
  154.     Platform Name                                 AMD Accelerated Parallel Processing
  155.     Device Name                                   gfx900:xnack-
  156.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU)  No devices found in platform
  157.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU)  Success (1)
  158.     Platform Name                                 AMD Accelerated Parallel Processing
  159.     Device Name                                   gfx900:xnack-
  160.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR)  No devices found in platform
  161.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM)  No devices found in platform
  162.   clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL)  Success (1)
  163.     Platform Name                                 AMD Accelerated Parallel Processing
  164.     Device Name                                   gfx900:xnack-
  165.  
  166. ICD loader properties
  167.   ICD loader Name                                 OpenCL ICD Loader
  168.   ICD loader Vendor                               OCL Icd free software
  169.   ICD loader Version                              2.3.1
  170.   ICD loader Profile                              OpenCL 3.0
  171.