gpt4all/gpt4all-chat/chatapi.h

#ifndef CHATAPI_H
#define CHATAPI_H

#include "../gpt4all-backend/llmodel.h"

#include <QByteArray>
#include <QNetworkReply>
#include <QObject>
#include <QString>
#include <QStringList>
#include <QList>

#include <cstddef>
#include <cstdint>
#include <stdexcept>
#include <functional>
#include <string>
#include <vector>

class QNetworkAccessManager;

class ChatAPI;
class ChatAPIWorker : public QObject {
    Q_OBJECT
public:
    ChatAPIWorker(ChatAPI *chatAPI)
        : QObject(nullptr)
        , m_ctx(nullptr)
        , m_networkManager(nullptr)
        , m_chat(chatAPI) {}
    virtual ~ChatAPIWorker() {}

    QString currentResponse() const { return m_currentResponse; }

    void request(const QString &apiKey,
                 LLModel::PromptContext *promptCtx,
                 const QByteArray &array);

Q_SIGNALS:
    void finished();

private Q_SLOTS:
    void handleFinished();
    void handleReadyRead();
    void handleErrorOccurred(QNetworkReply::NetworkError code);

private:
    ChatAPI *m_chat;
    LLModel::PromptContext *m_ctx;
    QNetworkAccessManager *m_networkManager;
    QString m_currentResponse;
};

class ChatAPI : public QObject, public LLModel {
    Q_OBJECT
public:
    ChatAPI();
    virtual ~ChatAPI();

    bool supportsEmbedding() const override { return false; }
    bool supportsCompletion() const override { return true; }
    bool loadModel(const std::string &modelPath, int n_ctx, int ngl) override;
    bool isModelLoaded() const override;
    size_t requiredMem(const std::string &modelPath, int n_ctx, int ngl) override;
    size_t stateSize() const override;
    size_t saveState(uint8_t *dest) const override;
    size_t restoreState(const uint8_t *src) override;
    void prompt(const std::string &prompt,
                const std::string &promptTemplate,
                std::function<bool(int32_t)> promptCallback,
                std::function<bool(int32_t, const std::string&)> responseCallback,
                std::function<bool(bool)> recalculateCallback,
                PromptContext &ctx,
                bool special,
                std::string *fakeReply) override;

    void setThreadCount(int32_t n_threads) override;
    int32_t threadCount() const override;

    void setModelName(const QString &modelName) { m_modelName = modelName; }
    void setAPIKey(const QString &apiKey) { m_apiKey = apiKey; }
    void setRequestURL(const QString &requestURL) { m_requestURL = requestURL; }
    QString url() const { return m_requestURL; }

    QList<QString> context() const { return m_context; }
    void setContext(const QList<QString> &context) { m_context = context; }

    bool callResponse(int32_t token, const std::string &string);

Q_SIGNALS:
    void request(const QString &apiKey,
                 LLModel::PromptContext *ctx,
                 const QByteArray &array);

protected:
    // We have to implement these as they are pure virtual in base class, but we don't actually use
    // them as they are only called from the default implementation of 'prompt' which we override and
    // completely replace

    std::vector<Token> tokenize(PromptContext &ctx, const std::string &str, bool special) const override {
        (void)ctx;
        (void)str;
        (void)special;
        throw std::logic_error("not implemented");
    }

    std::string tokenToString(Token id) const override {
        (void)id;
        throw std::logic_error("not implemented");
    }

    Token sampleToken(PromptContext &ctx) const override {
        (void)ctx;
        throw std::logic_error("not implemented");
    }

    bool evalTokens(PromptContext &ctx, const std::vector<int32_t> &tokens) const override {
        (void)ctx;
        (void)tokens;
        throw std::logic_error("not implemented");
    }

    int32_t contextLength() const override {
        throw std::logic_error("not implemented");
    }

    const std::vector<Token> &endTokens() const override {
        throw std::logic_error("not implemented");
    }

    bool shouldAddBOS() const override {
        throw std::logic_error("not implemented");
    }

private:
    std::function<bool(int32_t, const std::string&)> m_responseCallback;
    QString m_modelName;
    QString m_apiKey;
    QString m_requestURL;
    QList<QString> m_context;
    QStringList m_queuedPrompts;
};

#endif // CHATAPI_H
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`#ifndef CHATAPI_H`
			`#define CHATAPI_H`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include "../gpt4all-backend/llmodel.h"`
fix chat-style prompt templates (#1970) Also use a new version of Mistral OpenOrca. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-02-21 15:45:32 -05:00
chat: don't use incomplete types with signals/slots/Q_INVOKABLE (#2408) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-06 11:59:28 -04:00			`#include <QByteArray>`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`#include <QNetworkReply>`
chat: fix ChatGPT after #1970 (#2051) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-03-06 14:02:18 -05:00			`#include <QObject>`
			`#include <QString>`
			`#include <QStringList>`
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <QList>`
chat: fix ChatGPT after #1970 (#2051) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-03-06 14:02:18 -05:00
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <cstddef>`
			`#include <cstdint>`
			`#include <stdexcept>`
			`#include <functional>`
			`#include <string>`
			`#include <vector>`

			`class QNetworkAccessManager;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`class ChatAPI;`
			`class ChatAPIWorker : public QObject {`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00			`Q_OBJECT`
			`public:`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`ChatAPIWorker(ChatAPI *chatAPI)`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00			`: QObject(nullptr)`
			`, m_ctx(nullptr)`
			`, m_networkManager(nullptr)`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`, m_chat(chatAPI) {}`
			`virtual ~ChatAPIWorker() {}`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00
			`QString currentResponse() const { return m_currentResponse; }`

			`void request(const QString &apiKey,`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`LLModel::PromptContext *promptCtx,`
			`const QByteArray &array);`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00
			`Q_SIGNALS:`
			`void finished();`

			`private Q_SLOTS:`
			`void handleFinished();`
			`void handleReadyRead();`
			`void handleErrorOccurred(QNetworkReply::NetworkError code);`

			`private:`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`ChatAPI *m_chat;`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00			`LLModel::PromptContext *m_ctx;`
			`QNetworkAccessManager *m_networkManager;`
			`QString m_currentResponse;`
			`};`

feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`class ChatAPI : public QObject, public LLModel {`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`Q_OBJECT`
			`public:`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`ChatAPI();`
			`virtual ~ChatAPI();`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00
Bert 2023-07-09 11:32:51 -04:00			`bool supportsEmbedding() const override { return false; }`
			`bool supportsCompletion() const override { return true; }`
expose n_gpu_layers parameter of llama.cpp (#1890) Also dynamically limit the GPU layers and context length fields to the maximum supported by the model. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-01-31 14:17:44 -05:00			`bool loadModel(const std::string &modelPath, int n_ctx, int ngl) override;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`bool isModelLoaded() const override;`
expose n_gpu_layers parameter of llama.cpp (#1890) Also dynamically limit the GPU layers and context length fields to the maximum supported by the model. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-01-31 14:17:44 -05:00			`size_t requiredMem(const std::string &modelPath, int n_ctx, int ngl) override;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`size_t stateSize() const override;`
			`size_t saveState(uint8_t *dest) const override;`
			`size_t restoreState(const uint8_t *src) override;`
			`void prompt(const std::string &prompt,`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`const std::string &promptTemplate,`
			`std::function<bool(int32_t)> promptCallback,`
			`std::function<bool(int32_t, const std::string&)> responseCallback,`
			`std::function<bool(bool)> recalculateCallback,`
			`PromptContext &ctx,`
			`bool special,`
			`std::string *fakeReply) override;`
Backend prompt dedup (#822) * Deduplicated prompt() function code 2023-06-04 08:59:24 -04:00
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`void setThreadCount(int32_t n_threads) override;`
llmodel: constify LLModel::threadCount() 2023-05-21 16:45:29 -04:00			`int32_t threadCount() const override;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00
			`void setModelName(const QString &modelName) { m_modelName = modelName; }`
			`void setAPIKey(const QString &apiKey) { m_apiKey = apiKey; }`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`void setRequestURL(const QString &requestURL) { m_requestURL = requestURL; }`
			`QString url() const { return m_requestURL; }`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00
Add save/restore to chatgpt chats and allow serialize/deseralize from disk. 2023-05-15 18:36:41 -04:00			`QList<QString> context() const { return m_context; }`
			`void setContext(const QList<QString> &context) { m_context = context; }`

fix chat-style prompt templates (#1970) Also use a new version of Mistral OpenOrca. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-02-21 15:45:32 -05:00			`bool callResponse(int32_t token, const std::string &string);`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00
			`Q_SIGNALS:`
			`void request(const QString &apiKey,`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`LLModel::PromptContext *ctx,`
			`const QByteArray &array);`
Don't use a local event loop which can lead to recursion and crashes. 2023-07-11 10:08:03 -04:00
Backend prompt dedup (#822) * Deduplicated prompt() function code 2023-06-04 08:59:24 -04:00			`protected:`
			`// We have to implement these as they are pure virtual in base class, but we don't actually use`
			`// them as they are only called from the default implementation of 'prompt' which we override and`
			`// completely replace`
fix chat-style prompt templates (#1970) Also use a new version of Mistral OpenOrca. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-02-21 15:45:32 -05:00
			`std::vector<Token> tokenize(PromptContext &ctx, const std::string &str, bool special) const override {`
			`(void)ctx;`
			`(void)str;`
			`(void)special;`
			`throw std::logic_error("not implemented");`
			`}`

			`std::string tokenToString(Token id) const override {`
			`(void)id;`
			`throw std::logic_error("not implemented");`
			`}`

			`Token sampleToken(PromptContext &ctx) const override {`
			`(void)ctx;`
			`throw std::logic_error("not implemented");`
			`}`

			`bool evalTokens(PromptContext &ctx, const std::vector<int32_t> &tokens) const override {`
			`(void)ctx;`
			`(void)tokens;`
			`throw std::logic_error("not implemented");`
			`}`

			`int32_t contextLength() const override {`
			`throw std::logic_error("not implemented");`
			`}`

			`const std::vector<Token> &endTokens() const override {`
			`throw std::logic_error("not implemented");`
			`}`

			`bool shouldAddBOS() const override {`
			`throw std::logic_error("not implemented");`
			`}`
Backend prompt dedup (#822) * Deduplicated prompt() function code 2023-06-04 08:59:24 -04:00
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`private:`
			`std::function<bool(int32_t, const std::string&)> m_responseCallback;`
			`QString m_modelName;`
			`QString m_apiKey;`
feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`QString m_requestURL;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`QList<QString> m_context;`
chat: fix ChatGPT after #1970 (#2051) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-03-06 14:02:18 -05:00			`QStringList m_queuedPrompts;`
Preliminary support for chatgpt models. 2023-05-14 20:12:15 -04:00			`};`

feat: Add support for Mistral API models (#2053) Signed-off-by: Jared Van Bortel <jared@nomic.ai> Signed-off-by: Cédric Sazos <cedric.sazos@tutanota.com> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:23:57 -04:00			`#endif // CHATAPI_H`