fix: add tokens

2024-10-01 01:06:10 -04:00 · 2023-03-27 17:39:20 +00:00 · 2023-03-27 17:39:20 +00:00 · d87af69a93
commit d87af69a93
parent eac7734cbf
1 changed files with 4 additions and 1 deletions
--- a/generate.py
+++ b/generate.py
@ -19,7 +19,10 @@ def generate(tokenizer, prompt, model, config):
 def setup_model(config):
    model = AutoModelForCausalLM.from_pretrained(config["model_name"], device_map="auto", torch_dtype=torch.float16)
    tokenizer = AutoTokenizer.from_pretrained(config["tokenizer_name"])
-    tokenizer.add_special_tokens({"bos_token": "<s>", "eos_token": "</s>"})
+    added_tokens = tokenizer.add_special_tokens({"bos_token": "<s>", "eos_token": "</s>", "pad_token": "<pad>"})
+
+    if added_tokens > 0:
+        model.resize_token_embeddings(len(tokenizer))

    if config["lora"]:
        model = PeftModelForCausalLM.from_pretrained(model, config["lora_path"], device_map="auto", torch_dtype=torch.float16)