text-generation-webui/extensions/openai/script.py

import json
import os
import traceback
from threading import Thread

import extensions.openai.completions as OAIcompletions
import extensions.openai.embeddings as OAIembeddings
import extensions.openai.images as OAIimages
import extensions.openai.models as OAImodels
import extensions.openai.moderations as OAImoderations
import speech_recognition as sr
import uvicorn
from extensions.openai.errors import ServiceUnavailableError
from extensions.openai.tokens import token_count, token_decode, token_encode
from extensions.openai.utils import _start_cloudflared
from fastapi import Depends, FastAPI, Header, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from fastapi.requests import Request
from fastapi.responses import JSONResponse
from modules import shared
from modules.logging_colors import logger
from modules.text_generation import stop_everything_event
from pydub import AudioSegment
from sse_starlette import EventSourceResponse

from .typing import (
    ChatCompletionRequest,
    ChatCompletionResponse,
    CompletionRequest,
    CompletionResponse,
    DecodeRequest,
    DecodeResponse,
    EncodeRequest,
    EncodeResponse,
    LoadModelRequest,
    ModelInfoResponse,
    TokenCountResponse,
    to_dict
)

params = {
    'embedding_device': 'cpu',
    'embedding_model': 'all-mpnet-base-v2',
    'sd_webui_url': '',
    'debug': 0
}


def verify_api_key(authorization: str = Header(None)) -> None:
    expected_api_key = shared.args.api_key
    if expected_api_key and (authorization is None or authorization != f"Bearer {expected_api_key}"):
        raise HTTPException(status_code=401, detail="Unauthorized")


app = FastAPI(dependencies=[Depends(verify_api_key)])

# Configure CORS settings to allow all origins, methods, and headers
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["GET", "HEAD", "OPTIONS", "POST", "PUT"],
    allow_headers=[
        "Origin",
        "Accept",
        "X-Requested-With",
        "Content-Type",
        "Access-Control-Request-Method",
        "Access-Control-Request-Headers",
        "Authorization",
    ],
)


@app.options("/")
async def options_route():
    return JSONResponse(content="OK")


@app.post('/v1/completions', response_model=CompletionResponse)
async def openai_completions(request: Request, request_data: CompletionRequest):
    path = request.url.path
    is_legacy = "/generate" in path

    if request_data.stream:
        async def generator():
            response = OAIcompletions.stream_completions(to_dict(request_data), is_legacy=is_legacy)
            for resp in response:
                yield {"data": json.dumps(resp)}

        return EventSourceResponse(generator())  # SSE streaming

    else:
        response = OAIcompletions.completions(to_dict(request_data), is_legacy=is_legacy)
        return JSONResponse(response)


@app.post('/v1/chat/completions', response_model=ChatCompletionResponse)
async def openai_chat_completions(request: Request, request_data: ChatCompletionRequest):
    path = request.url.path
    is_legacy = "/generate" in path

    if request_data.stream:
        async def generator():
            response = OAIcompletions.stream_chat_completions(to_dict(request_data), is_legacy=is_legacy)
            for resp in response:
                yield {"data": json.dumps(resp)}

        return EventSourceResponse(generator())  # SSE streaming

    else:
        response = OAIcompletions.chat_completions(to_dict(request_data), is_legacy=is_legacy)
        return JSONResponse(response)


@app.get("/v1/models")
@app.get("/v1/models/{model}")
async def handle_models(request: Request):
    path = request.url.path
    is_list = request.url.path.split('?')[0].split('#')[0] == '/v1/models'

    if is_list:
        response = OAImodels.list_models()
    else:
        model_name = path[len('/v1/models/'):]
        response = OAImodels.model_info_dict(model_name)

    return JSONResponse(response)


@app.get('/v1/billing/usage')
def handle_billing_usage():
    '''
    Ex. /v1/dashboard/billing/usage?start_date=2023-05-01&end_date=2023-05-31
    '''
    return JSONResponse(content={"total_usage": 0})


@app.post('/v1/audio/transcriptions')
async def handle_audio_transcription(request: Request):
    r = sr.Recognizer()

    form = await request.form()
    audio_file = await form["file"].read()
    audio_data = AudioSegment.from_file(audio_file)

    # Convert AudioSegment to raw data
    raw_data = audio_data.raw_data

    # Create AudioData object
    audio_data = sr.AudioData(raw_data, audio_data.frame_rate, audio_data.sample_width)
    whipser_language = form.getvalue('language', None)
    whipser_model = form.getvalue('model', 'tiny')  # Use the model from the form data if it exists, otherwise default to tiny

    transcription = {"text": ""}

    try:
        transcription["text"] = r.recognize_whisper(audio_data, language=whipser_language, model=whipser_model)
    except sr.UnknownValueError:
        print("Whisper could not understand audio")
        transcription["text"] = "Whisper could not understand audio UnknownValueError"
    except sr.RequestError as e:
        print("Could not request results from Whisper", e)
        transcription["text"] = "Whisper could not understand audio RequestError"

    return JSONResponse(content=transcription)


@app.post('/v1/images/generations')
async def handle_image_generation(request: Request):

    if not os.environ.get('SD_WEBUI_URL', params.get('sd_webui_url', '')):
        raise ServiceUnavailableError("Stable Diffusion not available. SD_WEBUI_URL not set.")

    body = await request.json()
    prompt = body['prompt']
    size = body.get('size', '1024x1024')
    response_format = body.get('response_format', 'url')  # or b64_json
    n = body.get('n', 1)  # ignore the batch limits of max 10

    response = await OAIimages.generations(prompt=prompt, size=size, response_format=response_format, n=n)
    return JSONResponse(response)


@app.post("/v1/embeddings")
async def handle_embeddings(request: Request):
    body = await request.json()
    encoding_format = body.get("encoding_format", "")

    input = body.get('input', body.get('text', ''))
    if not input:
        raise HTTPException(status_code=400, detail="Missing required argument input")

    if type(input) is str:
        input = [input]

    response = OAIembeddings.embeddings(input, encoding_format)
    return JSONResponse(response)


@app.post("/v1/moderations")
async def handle_moderations(request: Request):
    body = await request.json()
    input = body["input"]
    if not input:
        raise HTTPException(status_code=400, detail="Missing required argument input")

    response = OAImoderations.moderations(input)
    return JSONResponse(response)


@app.post("/v1/internal/encode", response_model=EncodeResponse)
async def handle_token_encode(request_data: EncodeRequest):
    response = token_encode(request_data.text)
    return JSONResponse(response)


@app.post("/v1/internal/decode", response_model=DecodeResponse)
async def handle_token_decode(request_data: DecodeRequest):
    response = token_decode(request_data.tokens)
    return JSONResponse(response)


@app.post("/v1/internal/token-count", response_model=TokenCountResponse)
async def handle_token_count(request_data: EncodeRequest):
    response = token_count(request_data.text)
    return JSONResponse(response)


@app.post("/v1/internal/stop-generation")
async def handle_stop_generation(request: Request):
    stop_everything_event()
    return JSONResponse(content="OK")


@app.get("/v1/internal/model/info", response_model=ModelInfoResponse)
async def handle_model_info():
    payload = OAImodels.get_current_model_info()
    return JSONResponse(content=payload)


@app.post("/v1/internal/model/load")
async def handle_load_model(request_data: LoadModelRequest):
    try:
        OAImodels._load_model(to_dict(request_data))
        return JSONResponse(content="OK")
    except:
        traceback.print_exc()
        return HTTPException(status_code=400, detail="Failed to load the model.")


def run_server():
    server_addr = '0.0.0.0' if shared.args.listen else '127.0.0.1'
    port = int(os.environ.get('OPENEDAI_PORT', shared.args.api_port))

    ssl_certfile = os.environ.get('OPENEDAI_CERT_PATH', shared.args.ssl_certfile)
    ssl_keyfile = os.environ.get('OPENEDAI_KEY_PATH', shared.args.ssl_keyfile)

    if shared.args.public_api:
        def on_start(public_url: str):
            logger.info(f'OpenAI compatible API URL:\n\n{public_url}/v1\n')

        _start_cloudflared(port, shared.args.public_api_id, max_attempts=3, on_start=on_start)
    else:
        if ssl_keyfile and ssl_certfile:
            logger.info(f'OpenAI compatible API URL:\n\nhttps://{server_addr}:{port}/v1\n')
        else:
            logger.info(f'OpenAI compatible API URL:\n\nhttp://{server_addr}:{port}/v1\n')

    if shared.args.api_key:
        logger.info(f'OpenAI API key:\n\n{shared.args.api_key}\n')

    uvicorn.run(app, host=server_addr, port=port, ssl_certfile=ssl_certfile, ssl_keyfile=ssl_keyfile)


def setup():
    Thread(target=run_server, daemon=True).start()
Style/pep8 improvements 2023-05-02 22:05:38 -04:00			`import json`
			`import os`
Add /v1/internal/model/load endpoint (tentative) 2023-11-07 23:58:06 -05:00			`import traceback`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00			`from threading import Thread`
Style improvements (#1957) 2023-05-09 21:49:39 -04:00
Lint the openai extension 2023-09-15 23:11:16 -04:00			`import extensions.openai.completions as OAIcompletions`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00			`import extensions.openai.embeddings as OAIembeddings`
			`import extensions.openai.images as OAIimages`
Lint the openai extension 2023-09-15 23:11:16 -04:00			`import extensions.openai.models as OAImodels`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00			`import extensions.openai.moderations as OAImoderations`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`import speech_recognition as sr`
			`import uvicorn`
			`from extensions.openai.errors import ServiceUnavailableError`
Lint the openai extension 2023-09-15 23:11:16 -04:00			`from extensions.openai.tokens import token_count, token_decode, token_encode`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`from extensions.openai.utils import _start_cloudflared`
			`from fastapi import Depends, FastAPI, Header, HTTPException`
			`from fastapi.middleware.cors import CORSMiddleware`
			`from fastapi.requests import Request`
			`from fastapi.responses import JSONResponse`
Lint the openai extension 2023-09-15 23:11:16 -04:00			`from modules import shared`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`from modules.logging_colors import logger`
Add /v1/internal/stop-generation to OpenAI API (#4498) 2023-11-06 22:10:42 -05:00			`from modules.text_generation import stop_everything_event`
add whisper api to openai plugin (#3958) 2023-09-16 11:04:04 -04:00			`from pydub import AudioSegment`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`from sse_starlette import EventSourceResponse`

			`from .typing import (`
			`ChatCompletionRequest,`
			`ChatCompletionResponse,`
			`CompletionRequest,`
			`CompletionResponse,`
Add types to the encode/decode/token-count endpoints 2023-11-07 22:05:36 -05:00			`DecodeRequest,`
			`DecodeResponse,`
			`EncodeRequest,`
			`EncodeResponse,`
Add /v1/internal/model/load endpoint (tentative) 2023-11-07 23:58:06 -05:00			`LoadModelRequest,`
Add /v1/internal/model-info endpoint 2023-11-07 21:59:02 -05:00			`ModelInfoResponse,`
Add types to the encode/decode/token-count endpoints 2023-11-07 22:05:36 -05:00			`TokenCountResponse,`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`to_dict`
			`)`
add whisper api to openai plugin (#3958) 2023-09-16 11:04:04 -04:00
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00			`params = {`
extensions/openai: load extension settings via settings.yaml (#3953) 2023-09-17 21:39:29 -04:00			`'embedding_device': 'cpu',`
			`'embedding_model': 'all-mpnet-base-v2',`
			`'sd_webui_url': '',`
			`'debug': 0`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00			`}`

[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`def verify_api_key(authorization: str = Header(None)) -> None:`
			`expected_api_key = shared.args.api_key`
			`if expected_api_key and (authorization is None or authorization != f"Bearer {expected_api_key}"):`
			`raise HTTPException(status_code=401, detail="Unauthorized")`


			`app = FastAPI(dependencies=[Depends(verify_api_key)])`

			`# Configure CORS settings to allow all origins, methods, and headers`
			`app.add_middleware(`
			`CORSMiddleware,`
			`allow_origins=["*"],`
			`allow_credentials=True,`
			`allow_methods=["GET", "HEAD", "OPTIONS", "POST", "PUT"],`
			`allow_headers=[`
			`"Origin",`
			`"Accept",`
			`"X-Requested-With",`
			`"Content-Type",`
			`"Access-Control-Request-Method",`
			`"Access-Control-Request-Headers",`
			`"Authorization",`
			`],`
			`)`


			`@app.options("/")`
			`async def options_route():`
			`return JSONResponse(content="OK")`

[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 10:06:39 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.post('/v1/completions', response_model=CompletionResponse)`
			`async def openai_completions(request: Request, request_data: CompletionRequest):`
			`path = request.url.path`
			`is_legacy = "/generate" in path`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`if request_data.stream:`
			`async def generator():`
			`response = OAIcompletions.stream_completions(to_dict(request_data), is_legacy=is_legacy)`
			`for resp in response:`
			`yield {"data": json.dumps(resp)}`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`return EventSourceResponse(generator()) # SSE streaming`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`else:`
			`response = OAIcompletions.completions(to_dict(request_data), is_legacy=is_legacy)`
			`return JSONResponse(response)`


			`@app.post('/v1/chat/completions', response_model=ChatCompletionResponse)`
			`async def openai_chat_completions(request: Request, request_data: ChatCompletionRequest):`
			`path = request.url.path`
			`is_legacy = "/generate" in path`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`if request_data.stream:`
			`async def generator():`
			`response = OAIcompletions.stream_chat_completions(to_dict(request_data), is_legacy=is_legacy)`
			`for resp in response:`
			`yield {"data": json.dumps(resp)}`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`return EventSourceResponse(generator()) # SSE streaming`
lint 2023-07-12 14:33:25 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`else:`
			`response = OAIcompletions.chat_completions(to_dict(request_data), is_legacy=is_legacy)`
			`return JSONResponse(response)`


			`@app.get("/v1/models")`
Refactor the /v1/models endpoint 2023-11-07 22:59:27 -05:00			`@app.get("/v1/models/{model}")`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`async def handle_models(request: Request):`
			`path = request.url.path`
Refactor the /v1/models endpoint 2023-11-07 22:59:27 -05:00			`is_list = request.url.path.split('?')[0].split('#')[0] == '/v1/models'`

			`if is_list:`
			`response = OAImodels.list_models()`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`else:`
			`model_name = path[len('/v1/models/'):]`
Refactor the /v1/models endpoint 2023-11-07 22:59:27 -05:00			`response = OAImodels.model_info_dict(model_name)`
Style/pep8 improvements 2023-05-02 22:05:38 -04:00
Refactor the /v1/models endpoint 2023-11-07 22:59:27 -05:00			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00

Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.get('/v1/billing/usage')`
			`def handle_billing_usage():`
			`'''`
			`Ex. /v1/dashboard/billing/usage?start_date=2023-05-01&end_date=2023-05-31`
			`'''`
			`return JSONResponse(content={"total_usage": 0})`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.post('/v1/audio/transcriptions')`
			`async def handle_audio_transcription(request: Request):`
			`r = sr.Recognizer()`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`form = await request.form()`
			`audio_file = await form["file"].read()`
			`audio_data = AudioSegment.from_file(audio_file)`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 10:06:39 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`# Convert AudioSegment to raw data`
			`raw_data = audio_data.raw_data`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 10:06:39 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`# Create AudioData object`
			`audio_data = sr.AudioData(raw_data, audio_data.frame_rate, audio_data.sample_width)`
			`whipser_language = form.getvalue('language', None)`
			`whipser_model = form.getvalue('model', 'tiny') # Use the model from the form data if it exists, otherwise default to tiny`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 10:06:39 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`transcription = {"text": ""}`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`try:`
			`transcription["text"] = r.recognize_whisper(audio_data, language=whipser_language, model=whipser_model)`
			`except sr.UnknownValueError:`
			`print("Whisper could not understand audio")`
			`transcription["text"] = "Whisper could not understand audio UnknownValueError"`
			`except sr.RequestError as e:`
			`print("Could not request results from Whisper", e)`
			`transcription["text"] = "Whisper could not understand audio RequestError"`
extensions/openai: Fixes for: embeddings, tokens, better errors. +Docs update, +Images, +logit_bias/logprobs, +more. (#3122) 2023-07-24 10:28:12 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`return JSONResponse(content=transcription)`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 10:06:39 -04:00

Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.post('/v1/images/generations')`
			`async def handle_image_generation(request: Request):`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`if not os.environ.get('SD_WEBUI_URL', params.get('sd_webui_url', '')):`
			`raise ServiceUnavailableError("Stable Diffusion not available. SD_WEBUI_URL not set.")`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`body = await request.json()`
			`prompt = body['prompt']`
			`size = body.get('size', '1024x1024')`
			`response_format = body.get('response_format', 'url') # or b64_json`
			`n = body.get('n', 1) # ignore the batch limits of max 10`
lint 2023-07-12 14:33:25 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`response = await OAIimages.generations(prompt=prompt, size=size, response_format=response_format, n=n)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00

Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.post("/v1/embeddings")`
			`async def handle_embeddings(request: Request):`
			`body = await request.json()`
			`encoding_format = body.get("encoding_format", "")`
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`input = body.get('input', body.get('text', ''))`
			`if not input:`
			`raise HTTPException(status_code=400, detail="Missing required argument input")`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`if type(input) is str:`
			`input = [input]`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`response = OAIembeddings.embeddings(input, encoding_format)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00
lint 2023-07-12 14:33:25 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`@app.post("/v1/moderations")`
			`async def handle_moderations(request: Request):`
			`body = await request.json()`
			`input = body["input"]`
			`if not input:`
			`raise HTTPException(status_code=400, detail="Missing required argument input")`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 17:50:08 -04:00
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`response = OAImoderations.moderations(input)`
			`return JSONResponse(response)`
lint 2023-07-12 14:33:25 -04:00

Add types to the encode/decode/token-count endpoints 2023-11-07 22:05:36 -05:00			`@app.post("/v1/internal/encode", response_model=EncodeResponse)`
			`async def handle_token_encode(request_data: EncodeRequest):`
			`response = token_encode(request_data.text)`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`return JSONResponse(response)`
lint 2023-07-12 14:33:25 -04:00
[extensions/openai] various fixes (#2533) 2023-06-06 00:43:04 -04:00
Add types to the encode/decode/token-count endpoints 2023-11-07 22:05:36 -05:00			`@app.post("/v1/internal/decode", response_model=DecodeResponse)`
			`async def handle_token_decode(request_data: DecodeRequest):`
			`response = token_decode(request_data.tokens)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00

Add types to the encode/decode/token-count endpoints 2023-11-07 22:05:36 -05:00			`@app.post("/v1/internal/token-count", response_model=TokenCountResponse)`
			`async def handle_token_count(request_data: EncodeRequest):`
			`response = token_count(request_data.text)`
Add /v1/internal/stop-generation to OpenAI API (#4498) 2023-11-06 22:10:42 -05:00			`return JSONResponse(response)`


			`@app.post("/v1/internal/stop-generation")`
			`async def handle_stop_generation(request: Request):`
			`stop_everything_event()`
			`return JSONResponse(content="OK")`


Add /v1/internal/model/load endpoint (tentative) 2023-11-07 23:58:06 -05:00			`@app.get("/v1/internal/model/info", response_model=ModelInfoResponse)`
Add /v1/internal/model-info endpoint 2023-11-07 21:59:02 -05:00			`async def handle_model_info():`
			`payload = OAImodels.get_current_model_info()`
			`return JSONResponse(content=payload)`


Add /v1/internal/model/load endpoint (tentative) 2023-11-07 23:58:06 -05:00			`@app.post("/v1/internal/model/load")`
			`async def handle_load_model(request_data: LoadModelRequest):`
			`try:`
			`OAImodels._load_model(to_dict(request_data))`
			`return JSONResponse(content="OK")`
			`except:`
			`traceback.print_exc()`
			`return HTTPException(status_code=400, detail="Failed to load the model.")`


add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00			`def run_server():`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`server_addr = '0.0.0.0' if shared.args.listen else '127.0.0.1'`
			`port = int(os.environ.get('OPENEDAI_PORT', shared.args.api_port))`

			`ssl_certfile = os.environ.get('OPENEDAI_CERT_PATH', shared.args.ssl_certfile)`
			`ssl_keyfile = os.environ.get('OPENEDAI_KEY_PATH', shared.args.ssl_keyfile)`

			`if shared.args.public_api:`
			`def on_start(public_url: str):`
			`logger.info(f'OpenAI compatible API URL:\n\n{public_url}/v1\n')`

			`_start_cloudflared(port, shared.args.public_api_id, max_attempts=3, on_start=on_start)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00			`else:`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`if ssl_keyfile and ssl_certfile:`
			`logger.info(f'OpenAI compatible API URL:\n\nhttps://{server_addr}:{port}/v1\n')`
Add HTTPS support to APIs (openai and default) (#4270) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2023-10-13 00:31:13 -04:00			`else:`
Make OpenAI API the default API (#4430) 2023-11-06 00:38:29 -05:00			`logger.info(f'OpenAI compatible API URL:\n\nhttp://{server_addr}:{port}/v1\n')`

			`if shared.args.api_key:`
			`logger.info(f'OpenAI API key:\n\n{shared.args.api_key}\n')`

			`uvicorn.run(app, host=server_addr, port=port, ssl_certfile=ssl_certfile, ssl_keyfile=ssl_keyfile)`
add openai compatible api (#1475) 2023-05-02 21:49:53 -04:00

			`def setup():`
			`Thread(target=run_server, daemon=True).start()`