gpt4all/gpt4all-chat/embllm.h

#ifndef EMBLLM_H
#define EMBLLM_H

#include <QByteArray>
#include <QMutex>
#include <QObject>
#include <QString>
#include <QStringList>
#include <QThread>
#include <QVariant>
#include <QVector>

#include <atomic>
#include <vector>

class LlamaCppBackend;
class QNetworkAccessManager;

struct EmbeddingChunk {
    QString model; // TODO(jared): use to select model
    int folder_id;
    int chunk_id;
    QString chunk;
};

Q_DECLARE_METATYPE(EmbeddingChunk)

struct EmbeddingResult {
    QString model;
    int folder_id;
    int chunk_id;
    std::vector<float> embedding;
};

class EmbeddingLLMWorker : public QObject {
    Q_OBJECT
public:
    EmbeddingLLMWorker();
    ~EmbeddingLLMWorker() override;

    void wait();

    std::vector<float> lastResponse() const { return m_lastResponse; }

    bool loadModel();
    bool isNomic() const { return !m_nomicAPIKey.isEmpty(); }
    bool hasModel() const { return isNomic() || m_model; }

    std::vector<float> generateQueryEmbedding(const QString &text);

public Q_SLOTS:
    void atlasQueryEmbeddingRequested(const QString &text);
    void docEmbeddingsRequested(const QVector<EmbeddingChunk> &chunks);

Q_SIGNALS:
    void requestAtlasQueryEmbedding(const QString &text);
    void embeddingsGenerated(const QVector<EmbeddingResult> &embeddings);
    void errorGenerated(const QVector<EmbeddingChunk> &chunks, const QString &error);
    void finished();

private Q_SLOTS:
    void handleFinished();

private:
    void sendAtlasRequest(const QStringList &texts, const QString &taskType, const QVariant &userData = {});

    QString m_nomicAPIKey;
    QNetworkAccessManager *m_networkManager;
    std::vector<float> m_lastResponse;
    LlamaCppBackend *m_model = nullptr;
    std::atomic<bool> m_stopGenerating;
    QThread m_workerThread;
    QMutex m_mutex; // guards m_model and m_nomicAPIKey
};

class EmbeddingLLM : public QObject
{
    Q_OBJECT
public:
    EmbeddingLLM();
    ~EmbeddingLLM() override;

    static QString model();
    bool loadModel();
    bool hasModel() const;

public Q_SLOTS:
    std::vector<float> generateQueryEmbedding(const QString &text); // synchronous
    void generateDocEmbeddingsAsync(const QVector<EmbeddingChunk> &chunks);

Q_SIGNALS:
    void requestDocEmbeddings(const QVector<EmbeddingChunk> &chunks);
    void embeddingsGenerated(const QVector<EmbeddingResult> &embeddings);
    void errorGenerated(const QVector<EmbeddingChunk> &chunks, const QString &error);

private:
    EmbeddingLLMWorker *m_embeddingWorker;
};

#endif // EMBLLM_H
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`#ifndef EMBLLM_H`
			`#define EMBLLM_H`

chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <QByteArray>`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`#include <QMutex>`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`#include <QObject>`
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <QString>`
implement local Nomic Embed via llama.cpp (#2086) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:09:24 -04:00			`#include <QStringList>`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`#include <QThread>`
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <QVariant>`
			`#include <QVector>`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`#include <atomic>`
			`#include <vector>`

backend: move more stuff into LlamaCppBackend Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-08-06 18:56:48 -04:00			`class LlamaCppBackend;`
chat: fix #includes with include-what-you-use (#2401) Also use qGuiApp instead of qApp. Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-06-04 14:47:11 -04:00			`class QNetworkAccessManager;`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`struct EmbeddingChunk {`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`QString model; // TODO(jared): use to select model`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`int folder_id;`
			`int chunk_id;`
			`QString chunk;`
			`};`

			`Q_DECLARE_METATYPE(EmbeddingChunk)`

			`struct EmbeddingResult {`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`QString model;`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`int folder_id;`
			`int chunk_id;`
			`std::vector<float> embedding;`
			`};`

			`class EmbeddingLLMWorker : public QObject {`
			`Q_OBJECT`
			`public:`
			`EmbeddingLLMWorker();`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`~EmbeddingLLMWorker() override;`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00
			`void wait();`

			`std::vector<float> lastResponse() const { return m_lastResponse; }`

			`bool loadModel();`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`bool isNomic() const { return !m_nomicAPIKey.isEmpty(); }`
			`bool hasModel() const { return isNomic() \|\| m_model; }`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`std::vector<float> generateQueryEmbedding(const QString &text);`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00
			`public Q_SLOTS:`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void atlasQueryEmbeddingRequested(const QString &text);`
			`void docEmbeddingsRequested(const QVector<EmbeddingChunk> &chunks);`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00
			`Q_SIGNALS:`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void requestAtlasQueryEmbedding(const QString &text);`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`void embeddingsGenerated(const QVector<EmbeddingResult> &embeddings);`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void errorGenerated(const QVector<EmbeddingChunk> &chunks, const QString &error);`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`void finished();`

			`private Q_SLOTS:`
			`void handleFinished();`

			`private:`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void sendAtlasRequest(const QStringList &texts, const QString &taskType, const QVariant &userData = {});`
implement local Nomic Embed via llama.cpp (#2086) Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-03-13 18:09:24 -04:00
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`QString m_nomicAPIKey;`
			`QNetworkAccessManager *m_networkManager;`
			`std::vector<float> m_lastResponse;`
backend: move more stuff into LlamaCppBackend Signed-off-by: Jared Van Bortel <jared@nomic.ai> 2024-08-06 18:56:48 -04:00			`LlamaCppBackend *m_model = nullptr;`
Fix destruction and tear down of the embedding thread. (#2328) * Fix destruction and tear down of the embedding thread. Signed-off-by: Adam Treat <treat.adam@gmail.com> * Fix order of deletion to prevent use after free. Signed-off-by: Adam Treat <treat.adam@gmail.com> --------- Signed-off-by: Adam Treat <treat.adam@gmail.com> 2024-05-15 10:01:53 -04:00			`std::atomic<bool> m_stopGenerating;`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`QThread m_workerThread;`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`QMutex m_mutex; // guards m_model and m_nomicAPIKey`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`};`

LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`class EmbeddingLLM : public QObject`
			`{`
			`Q_OBJECT`
			`public:`
			`EmbeddingLLM();`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`~EmbeddingLLM() override;`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`static QString model();`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`bool loadModel();`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`bool hasModel() const;`

			`public Q_SLOTS:`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`std::vector<float> generateQueryEmbedding(const QString &text); // synchronous`
			`void generateDocEmbeddingsAsync(const QVector<EmbeddingChunk> &chunks);`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`Q_SIGNALS:`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void requestDocEmbeddings(const QVector<EmbeddingChunk> &chunks);`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`void embeddingsGenerated(const QVector<EmbeddingResult> &embeddings);`
chat: major UI redesign for v3.0.0 (#2396) Signed-off-by: Adam Treat <treat.adam@gmail.com> Signed-off-by: Jared Van Bortel <jared@nomic.ai> Co-authored-by: Jared Van Bortel <jared@nomic.ai> 2024-06-24 18:49:23 -04:00			`void errorGenerated(const QVector<EmbeddingChunk> &chunks, const QString &error);`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00
			`private:`
Add Nomic Embed model for atlas with localdocs. 2024-01-22 12:36:01 -05:00			`EmbeddingLLMWorker *m_embeddingWorker;`
LocalDocs version 2 with text embeddings. 2023-10-24 12:13:32 -04:00			`};`

			`#endif // EMBLLM_H`