Small optimization

2024-10-01 01:05:56 -04:00 · 2023-03-24 12:36:41 -07:00 · 2023-03-24 12:36:41 -07:00 · ee19902c00
commit ee19902c00
parent 8326f909af
1 changed files with 2 additions and 2 deletions
--- a/finetune.py
+++ b/finetune.py
@ -123,11 +123,11 @@ def tokenize(prompt, add_eos_token=True):


 def generate_and_tokenize_prompt(data_point):
-    user_prompt = generate_prompt({**data_point, "output": ""})
    full_prompt = generate_prompt(data_point)
-    tokenized_user_prompt = tokenize(user_prompt, add_eos_token=False)
    tokenized_full_prompt = tokenize(full_prompt)
    if not TRAIN_ON_INPUTS:
+        user_prompt = generate_prompt({**data_point, "output": ""})
+        tokenized_user_prompt = tokenize(user_prompt, add_eos_token=False)
        user_prompt_len = len(tokenized_user_prompt["input_ids"])

        tokenized_full_prompt["labels"] = [