您的位置 首页 kreess

開源類GPT平臺“聞達”,超詳細使用教程

NLP和LLMNLP自然語言處理(Natural Language Processing)和 LLM大語言模型(Large Language Model)是人工智能領域中的

NLP和LLM

NLP自然語言處理(Natural Language Processing)和 LLM大語言模型(Large Language Model)是人工智能領域中的兩個關鍵概念,它們的目標都是讓計算機理解和處理人類語言。

NLP

NLP是一種計算機科學和人工智能的交叉學科,主要涉及計算機如何理解、處理和生成人類語言的技術。NLP的應用場景非常廣泛,包括機器翻譯、自動問答、文本分類、情感分析、文本生成等等。其中最常見的應用是自然語言處理技術的應用於智能客服、智能對話機器人等。

自然語言處理的任務主要可以分成兩大類,分別是自然語言理解NLU和自然語言生成NLG。ChatGPT就屬於NLG的范疇。

LLM

LLM是一種基於機器學習的模型,用於預測一段文本序列中下一個可能出現的單詞或字符。它可以學習語言中的規律和模式,從而生成與語言相關的任務,比如自動翻譯、語音識別、文本摘要、語言生成等。大語言模型通常基於神經網絡,如循環神經網絡(RNN)和其變體(如長短時記憶網絡(LSTM)和門控循環單元(GRU)),也可以使用變壓器(Transformer)等模型結構。目前,一些大型開源大語言模型(如GPT3,BERT等)在自然語言處理領域展現出瞭很高的性能和應用價值。

GPT3和GPT4

ChatGPT的橫空出世讓很多人重新認識瞭AI。

從官方的說明中可以瞭解到最新的GPT4 實現瞭以下幾方面的提升:

  • 強大的識圖能力
  • 文字輸入限制提升至 2.5 萬字
  • 回答準確性顯著提高
  • 能夠生成歌詞、創意文本,實現風格變化

用通俗的話可以理解為GPT3是小學生,GPT4是高中生,GPT3已經帶來瞭巨大的變革,GPT4及其後續版本會創造什麼奇跡將由我們一起見證。

聞達LLM調用平臺

聞達開源LLM調用平臺擁有類AutoGPT和ChatPDF的功能,能根據一句簡短的提示自動生成提綱,然後按照提綱自動填充每章內容,使得論文或小說的寫作變得更加高效。

此外,它能夠導入相關知識庫,並通過調用知識庫查詢相關信息。除此之外,該平臺還可基於問題生成相關關鍵詞,並在與知識庫交互後對每個關鍵詞自動獲取多個答案。

從上面的描述中可以看到,這個項目能實現類似ChatGPT、AutoGPT的功能,在一些輕度使用場景中還是比較方便的。

  • 目前支持模型:chatGLM-6B、chatRWKV、chatYuan、llama系列以及openaiapi和chatglm130b api,初步支持moss。
  • 使用知識庫擴展模型所知信息,使用auto提高模型生成質量和復雜問題解決能力
  • 支持chatGLM-6B、chatRWKV、llama系列流式輸出和輸出過程中中斷
  • 自動保存對話歷史至瀏覽器(多用戶同時使用不會沖突,chatRWKV歷史消息實現方式需使用string)
  • 對話歷史管理(刪除單條、清空)
  • 支持局域網、內網部署和多用戶同時使用。

整合包

說明

之前寫的Stable Diffusion教程有讀者說整合包存在一些問題,這裡說明一下。整合包是熱心且動手能力較高的網友制作的工具,大多數都是免費的。因為使用者的電腦環境很復雜,集成的軟件又很多,所以難免會存在一些問題。遇到此類的問題我們可以向作者反饋,等待修復版本;如果著急使用,就隻能考慮使用原版軟件瞭。

準備工作

訪問下面的網址,找到整合包的下載地址,把所需的文件下載到本地。

GitHub – l15y/wenda: 聞達:一個LLM調用平臺。為小模型外掛知識庫查找和設計自動執行動作,實現不亞於於大模型的生成能力

下載後的文件如下,其中第一個文件夾是核心文件,第二個文件夾是依賴文件,第三個文件夾是模型文件,裡面有很多種模型文件。

安裝

先安裝依賴軟件Visual Studio Installer(暫時不知道這個軟件是做什麼用的,不過既然提供瞭,先裝為敬)。

CUDA是一種由NVIDIA推出的通用並行計算架構,能夠幫助開發人員快捷地創建、測試和部署基於深度學習應用程序。而運行 CUDA 應用程序需要系統至少具有一個支持 CUDA 的顯卡和CUDA工具包兼容的驅動程序。運行本項目需要安裝CUDA應用程序。

執行查看CUDA批處理,可以查看系統中的驅動版本和CUDA版本。

執行更新批處理文件。

執行更新後修復批處理文件。

執行運行項目批處理,可以看到會在瀏覽器中打開以下頁面。在啟動過程中消耗大量的內存,可能會出現進程卡住的情況,需要耐心地等待程序加載完成。

127.0.0.1:17860

使用說明

聞達提供瞭很多功能,包括但不局限於聊天、寫論文、知識庫測試、SD文生圖等功能。

對話

對話的使用和ChatGPT類似,回答的內容和模型有關,有些內容是無法回答的。

寫論文

選擇寫論文模式,輸入關鍵詞,程序會自動生成論文大綱,並按照章節生成內容。

這個模式有點類似於AutoGPT,感興趣的讀者可以體驗一下。

材料改寫

根據提供的內容進行改寫,系統會自動轉化為意思相同的內容。

下面是從網絡上隨機復制的一段話,可以看到轉化的內容和原來的內容所表達的意思高度重合。

問題生成

根據你輸入的內容生成問題清單。

知識庫

在RTST知識庫在線管理頁面上傳內容,建立知識庫。

在測試查詢區域進行查詢,可以看到系統已經能識別出內容瞭。

知識庫建立後,需要對知識庫進行預處理,方便模型能正確的理解和使用知識庫。

然後選擇合適的問答模型,並使用整理好的知識庫對其進行訓練。常見的問答模型包括BERT、GPT、Seq2Seq等。

除瞭這些基本步驟,還需要對系統進行測試和優化。可以使用已知的問題或手動編寫一些常見的問題來測試問答系統,以確保其能夠正確地回答問題。

結束語

微軟近日推出瞭2023 年年度工作趨勢指數報告,重點觀察員工對人工智能的看法、以及人工智能對生產力的影響。根據報告顯示,三分之二的受訪者表示,沒有足夠的時間和精力來完成工作;49% 的受訪者擔心人工智能會影響其工作崗位。

人工智、LLM這些領域的發展可以說是日新月異,一點一點改變我們的生活與工作。更為深遠的變革什麼時間會真正到來,目前很難評估出來。

人工智能可以幫助我們創造更好的未來,前提是我們要保持年輕的心態,不斷地學習,擁抱變化。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部