turbopilot/test_codegen2.py

#%%
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("Salesforce/codegen2-1B")
model = AutoModelForCausalLM.from_pretrained("Salesforce/codegen2-1B", trust_remote_code=True, revision="main")


#%%
model = model.to(device="cuda")

#%%
text = """
import os

def post_to_pastebin"""
input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids
generated_ids = model.generate(input_ids, max_length=512)
print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))

# %%

def format_model_input(prefix, suffix):
  return prefix + "<mask_1>" + suffix + "<|endoftext|>" + "<sep>" + "<mask_1>"


prefix = """
import os

def post_to_pastebin"""
suffix = "result = post_to_pastebin(content)"
text = format_model_input(prefix, suffix)
input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids
generated_ids = model.generate(input_ids, max_length=128)
print(tokenizer.decode(generated_ids[0], skip_special_tokens=False))
# %%
def main():
  text = """

  print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))

if __name__ == '__main__':
    main()

  print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))
  # %%

  import os

  def post_to_pastebin"""
  input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids
  generated_ids = model.generate(input_ids, max_length=512)


 print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))

# %%

def post_to_pastebin(content):
  input_ids = tokenizer(content, return_tensors="pt").to("cuda").input_ids
  generated_ids = model.generate(input_ids, max_length=512)
  return tokenizer.decode(generated_ids[0], skip_special_tokens=True)
add gpu offload for gptneox 2023-08-21 15:03:25 -04:00			`#%%`
			`from transformers import AutoTokenizer, AutoModelForCausalLM`
			`tokenizer = AutoTokenizer.from_pretrained("Salesforce/codegen2-1B")`
			`model = AutoModelForCausalLM.from_pretrained("Salesforce/codegen2-1B", trust_remote_code=True, revision="main")`


			`#%%`
			`model = model.to(device="cuda")`

			`#%%`
			`text = """`
			`import os`

			`def post_to_pastebin"""`
			`input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids`
			`generated_ids = model.generate(input_ids, max_length=512)`
			`print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))`

			`# %%`

			`def format_model_input(prefix, suffix):`
			`return prefix + "<mask_1>" + suffix + "<\|endoftext\|>" + "<sep>" + "<mask_1>"`


			`prefix = """`
			`import os`

			`def post_to_pastebin"""`
			`suffix = "result = post_to_pastebin(content)"`
			`text = format_model_input(prefix, suffix)`
			`input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids`
			`generated_ids = model.generate(input_ids, max_length=128)`
			`print(tokenizer.decode(generated_ids[0], skip_special_tokens=False))`
			`# %%`
			`def main():`
			`text = """`

			`print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))`

			`if __name__ == '__main__':`
			`main()`

			`print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))`
			`# %%`

			`import os`

			`def post_to_pastebin"""`
			`input_ids = tokenizer(text, return_tensors="pt").to("cuda").input_ids`
			`generated_ids = model.generate(input_ids, max_length=512)`


			`print(tokenizer.decode(generated_ids[0], skip_special_tokens=True))`

			`# %%`

			`def post_to_pastebin(content):`
			`input_ids = tokenizer(content, return_tensors="pt").to("cuda").input_ids`
			`generated_ids = model.generate(input_ids, max_length=512)`
			`return tokenizer.decode(generated_ids[0], skip_special_tokens=True)`