概述
前言
大模型私有知識庫,作為大語言模型技術與企業、組織自有數據深度融合的創新知識管理及應用解決方案,能夠為特定用戶群體提供更為精準、專業且安全的知識服務。具體來講,它是借助大語言模型搭建而成,專門為特定組織或個人定制的知識存儲與檢索系統。此系統會對組織內部的專業知識、業務數據、歷史文檔等各類信息進行深度整合與精細化處理,從而構建出獨一無二的專屬知識集合。依托大模型強大的語言理解與生成能力,用戶能夠在此基礎上實現高效的知識查詢與問答交互。
在本教程中,我們將為您詳細介紹基于Dify和DeepSeek-R1模型搭建私有知識庫的方案。利用該方案,您可以在本地便捷地搭建起相應的私有知識庫,大幅提升文本檢索能力。
DeepSeek-R1介紹
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研發的一款高性能推理模型。該模型使用強化學習技術進行后訓練,專注于提升在數學、代碼和自然語言推理等復雜任務上的表現。
本最佳實踐在算力互聯調度平臺的應用市場中,您可快速部署應用,并對外提供API調用服務,方便您即刻體驗,開箱即用。
Dify介紹
Dify 是一站式大模型應用開發平臺。它能便捷接入各類數據并管理,支持模型微調與多模型調用。通過可視化界面和低代碼工具,用戶無需深厚技術背景,就能快速搭建如聊天機器人、智能客服等應用。可用于客戶服務、內容創作等場景,具有降低開發門檻、提升效率、靈活可擴展等優勢,助力企業高效落地大模型應用。
Dify-V1.0.0更新介紹
Dify-V1.0.0正式發布,新版本具有以下亮點:
插件系統:Dify 開發了一套全新的插件系統,用戶可以通過創建后綴為 .difypkg 的插件包來擴展 Dify 的功能。通過安裝不同的插件包,用戶可以為 Dify 添加多種能力,滿足多樣化的開發需求。
工具與模型的解耦:新版本將工具和模型從 Dify 的核心系統中解耦,使其能夠以真正的即插即用方式安裝和擴展。用戶無需修改核心代碼即可輕松添加新功能,極大地提升了開發效率。
新增 Agent 節點:在工作流中,Dify 引入了全新的 Agent 節點。通過插件,用戶可以自定義 Agent 的行為策略,而不再局限于內置的策略(如 CoT)。這為開發者提供了更高的靈活性和控制權。
Extension 插件類型:Dify 新增了一種名為 Extension 的插件類型。這是一種托管在 Dify 內的自定義服務,用戶可以通過插件自定義其代碼,以處理外部 Webhook 事件,進一步擴展 Dify 的功能邊界。
Dify 市場:為了促進插件的共享與分發,Dify 推出了 Dify 市場。這是一個集中化的平臺,用戶可以在其中自由發布和下載各種插件,從而快速獲取所需功能,推動生態系統的繁榮發展。
前置說明
該文檔為應用托管控制臺通過應用市場體驗Dify+DeepSeek-R1模型搭建私有知識庫的說明,通過應用托管控制臺,打開應用市場,創建對應的Dify應用,使用 Dify構建本地知識庫。
本產品中的模型由第三方主體提供,盡管云公司已盡最大努力進行識別和維護,但仍無法保證模型的可用性。請客戶按照該產品的服務協議使用該產品,做好甄別工作,并對自行選擇的服務承擔相應責任。
使用前準備
天翼云賬號注冊:使用應用托管平臺須具備天翼云官網賬號。已有天翼云賬號的直接登錄即可,如無天翼云賬號需先注冊,注冊流程可參考:注冊賬號。
使用前提:如需使用服務請先完成實名認證,請參考賬號中心-實名認證。如需使用按需服務,請確認賬號余額≥100 元。
操作步驟
部署Dify應用
訂購應用
登錄應用托管控制臺,選擇左側的應用市場點擊進入頁面。
在應用市場頁面,選擇目標應用,點擊【開啟應用】,進入應用部署頁面。
填寫管理密碼,選擇訪問策略及公網訪問,勾選同意用戶協議,點擊【開啟應用】,支付訂單,即可完成Dify應用服務部署。
服務詳情查看
進入應用托管租戶控制臺。
選擇【應用實例】,進入應用實例列表頁面。
刷新應用實例列表,等待新創建的應用進入到【運行中】狀態后點擊右側操作欄【訪問】,點擊下拉訪問鏈接。
進入Dify應用界面。可使用管理員賬號和設置的密碼登錄Dify,登陸后用戶可自行進行更改密碼。賬號:admin@admin.com;密碼:可點擊“應用實例”在詳情中“查看配置”中的“管理員密碼”查看。

在Dify中添加DeepSeek模型
Dify支持多模型管理與調用,可以便捷的添加我們所需的模型,我們這里以使用ollama添加DeepSeek模型為例。
在Dify控制臺點擊設置進入模型供應商編輯頁面。
通過OpenAI-API-compatible分別添加一個LLM模型和Text Embedding模型,Text Embedding模型用于知識庫的向量化處理。
添加LLM模型,輸入ollama部署的DeepSeek模型名稱、基礎URL和API KEY,點擊保存添加模型。輸入示例,實際使用時請按情況替換:模型名稱:deepseek-r1:7b;API KEY:YWRta****dPb2psRQ==;基礎URL:需在調用地址后增加后綴/v1。
同樣的方式,添加一個Text Embedding模型用于文檔向量化處理。Text Embedding模型可以與LLM模型使用同一個模型和基礎URL。
在系統模型配置頁面設置系統推理模型和Embedding模型,一般系統會默認選擇第一個可用模型,若模型顯示為空,請刷新頁面后重試。
系統模型配置完畢后,即可在應用編排界面配置模型參數和使用模型。模型參數會影響模型的輸出效果,用戶可自行探索,這里不再詳細描述。
在Dify中搭建本地知識庫
使用Dify 的 RAG 管道功能,企業可以快速搭建本地知識庫,系統會基于本地知識庫返回準確的答案。搭建本地知識庫前請先完成前置步驟:使用Ollama添加DeepSeek模型。
創建聊天助手:選擇聊天助手,輸入應用名稱,點擊創建,進入應用編排頁面。
在Dify頂部導航欄找到“知識庫”按鈕,點擊進入知識庫編輯頁面,上傳需要處理的文檔(支持 TXT、 MARKDOWN、 MDX、 PDF、 HTML、 XLSX、 XLS、 DOCX、 CSV、 MD、 HTM,每個文件不超過 15MB)。
進入文本分段與清洗頁面,選擇我們剛才配置的Embedding 模型并配置其他參數。完成配置后,系統會自動對上傳的文檔進行解釋和向量化處理。
返回Dify聊天應用編排頁面,在上下文中添加我們剛才導入的知識庫。現在我們可以在測試頁面中輸入問題進行提問,系統將會基于本地知識庫返回答案。至此,我們已成功使用Dify+DeepSeek模型構建私有知識庫,Dify還具備工具、函數等強大能力,請用戶自行探索相關功能。
在Dify中發布編排好的應用,對外開放使用
在應用編排界面,點擊發布-運行,即可生成網站應用。
復制生成的應用鏈接,其他用戶可通過鏈接登錄進行體驗。請勿大量用戶同時使用,否則可能會造成訪問失敗。
