update clblast code in gpt-j model

2024-10-01 01:06:01 -04:00 · 2023-08-26 16:16:01 +01:00 · 2023-08-26 16:16:01 +01:00 · 215a69b5af
commit 215a69b5af
parent 91639b8fc0
1 changed files with 3 additions and 1 deletions
--- a/src/gptj.cpp
+++ b/src/gptj.cpp
@ -584,7 +584,9 @@ bool GPTJModel::load_model(std::string fname) {
            layer.c_mlp_proj_w->backend = GGML_BACKEND_GPU;

            #if defined(GGML_USE_CLBLAST)
-            ggml_cl_transform_tensor(layer.c_attn_attn_w->data,layer.c_attn_attn_w); vram_total += ggml_nbytes(layer.c_attn_attn_w);
+            ggml_cl_transform_tensor(layer.c_attn_q_proj_w->data,layer.c_attn_q_proj_w); vram_total += ggml_nbytes(layer.c_attn_q_proj_w);
+            ggml_cl_transform_tensor(layer.c_attn_k_proj_w->data,layer.c_attn_k_proj_w); vram_total += ggml_nbytes(layer.c_attn_k_proj_w);
+            ggml_cl_transform_tensor(layer.c_attn_v_proj_w->data,layer.c_attn_v_proj_w); vram_total += ggml_nbytes(layer.c_attn_v_proj_w);
            ggml_cl_transform_tensor(layer.c_attn_proj_w->data,layer.c_attn_proj_w); vram_total += ggml_nbytes(layer.c_attn_proj_w);
            ggml_cl_transform_tensor(layer.c_mlp_fc_w->data,layer.c_mlp_fc_w); vram_total += ggml_nbytes(layer.c_mlp_fc_w);
            ggml_cl_transform_tensor(layer.c_mlp_proj_w->data,layer.c_mlp_proj_w); vram_total += ggml_nbytes(layer.c_mlp_proj_w);