static int |
cublas.cublasLtMatmul(cublasLtContext lightHandle,
cublasLtMatmulDescOpaque_t computeDesc,
Pointer alpha,
Pointer A,
cublasLtMatrixLayoutOpaque_t Adesc,
Pointer B,
cublasLtMatrixLayoutOpaque_t Bdesc,
Pointer beta,
Pointer C,
cublasLtMatrixLayoutOpaque_t Cdesc,
Pointer D,
cublasLtMatrixLayoutOpaque_t Ddesc,
cublasLtMatmulAlgo_t algo,
Pointer workspace,
long workspaceSizeInBytes,
CUstream_st stream)
Execute matrix multiplication (D = alpha * op(A) * op(B) + beta * C).
|
static int |
cublas.cublasLtMatmulAlgoCheck(cublasLtContext lightHandle,
cublasLtMatmulDescOpaque_t operationDesc,
cublasLtMatrixLayoutOpaque_t Adesc,
cublasLtMatrixLayoutOpaque_t Bdesc,
cublasLtMatrixLayoutOpaque_t Cdesc,
cublasLtMatrixLayoutOpaque_t Ddesc,
cublasLtMatmulAlgo_t algo,
cublasLtMatmulHeuristicResult_t result)
Check configured algo descriptor for correctness and support on current device.
|
static int |
cublas.cublasLtMatmulAlgoGetHeuristic(cublasLtContext lightHandle,
cublasLtMatmulDescOpaque_t operationDesc,
cublasLtMatrixLayoutOpaque_t Adesc,
cublasLtMatrixLayoutOpaque_t Bdesc,
cublasLtMatrixLayoutOpaque_t Cdesc,
cublasLtMatrixLayoutOpaque_t Ddesc,
cublasLtMatmulPreferenceOpaque_t preference,
int requestedAlgoCount,
cublasLtMatmulHeuristicResult_t heuristicResultsArray,
int[] returnAlgoCount) |
static int |
cublas.cublasLtMatmulAlgoGetHeuristic(cublasLtContext lightHandle,
cublasLtMatmulDescOpaque_t operationDesc,
cublasLtMatrixLayoutOpaque_t Adesc,
cublasLtMatrixLayoutOpaque_t Bdesc,
cublasLtMatrixLayoutOpaque_t Cdesc,
cublasLtMatrixLayoutOpaque_t Ddesc,
cublasLtMatmulPreferenceOpaque_t preference,
int requestedAlgoCount,
cublasLtMatmulHeuristicResult_t heuristicResultsArray,
IntBuffer returnAlgoCount) |
static int |
cublas.cublasLtMatmulAlgoGetHeuristic(cublasLtContext lightHandle,
cublasLtMatmulDescOpaque_t operationDesc,
cublasLtMatrixLayoutOpaque_t Adesc,
cublasLtMatrixLayoutOpaque_t Bdesc,
cublasLtMatrixLayoutOpaque_t Cdesc,
cublasLtMatrixLayoutOpaque_t Ddesc,
cublasLtMatmulPreferenceOpaque_t preference,
int requestedAlgoCount,
cublasLtMatmulHeuristicResult_t heuristicResultsArray,
IntPointer returnAlgoCount)
Query cublasLt heuristic for algorithm appropriate for given use case.
|
static int |
cublas.cublasLtMatmulDescDestroy(cublasLtMatmulDescOpaque_t matmulDesc)
Destroy matmul operation descriptor.
|
static int |
cublas.cublasLtMatmulDescGetAttribute(cublasLtMatmulDescOpaque_t matmulDesc,
int attr,
Pointer buf,
long sizeInBytes,
SizeTPointer sizeWritten)
Get matmul operation descriptor attribute.
|
static int |
cublas.cublasLtMatmulDescInit_internal(cublasLtMatmulDescOpaque_t matmulDesc,
long size,
int computeType,
int scaleType)
Internal.
|
static int |
cublas.cublasLtMatmulDescInit(cublasLtMatmulDescOpaque_t matmulDesc,
int computeType,
int scaleType)
Initialize matmul operation descriptor in pre-allocated space.
|
static int |
cublas.cublasLtMatmulDescSetAttribute(cublasLtMatmulDescOpaque_t matmulDesc,
int attr,
Pointer buf,
long sizeInBytes)
Set matmul operation descriptor attribute.
|