Pinecone與Cohere搭建RAG向量資料庫
type
status
date
slug
summary
tags
category
icon
password
RAG是通過能從外部知識庫搜尋相關資訊,生成更準確的回應,有效克服LLM在新知識更新與資訊檢索上的短板。
看到現在熱門有關RAG(檢索增強生成),正好來學習一下
簡單就是建立一個方便給LLM檢索資料的數據庫,目前主流是使用向量資料庫(Vector Database)
利用Sentence Transformers分析數據關係,通過語義相似性加快資料檢索
因為工作用的電筆沒有顯示卡,所以用的都是網上免費的服務資源:
- 數據源:HelloGitHub 每月都會以markdown格式發佈有趣的開源項目
- 應用框架:LangChain(Python) 包含了各種組件的接口和集成的LLM框架,Cohere和Pinecone也包含在內,之後也方便連接LLM
- opencv-python 簡繁轉換套件
- Pinecone 是一種專門用於存儲、管理和檢索向量資料的資料庫。它擅長處理大量高維度的向量資料,無論是文本、圖像還是音頻,都可以輕鬆應對。
- 目前Pinecone有Free Tier可以免費存儲100,000 vectors記錄
- Cohere AI一家提供自然語言處理解決方案的公司,其基於大型語言模型(LLMs)並使用檢索增強生成(RAG)技術。
- Cohere 現在提供試用 API 金鑰,速率限制為每分鐘 100 次 API 調用
1.準備環境:
2.載入數據:
注意要把cohere_api_key, pinecone_api_key改為自己的api_key
完成之後可以在Pinecone查看
3.查詢數據:
輸出結果:
上一篇
Docker Rclone搭建Webdav
下一篇
Intel M10 16G 用途分享及實用ISO推薦
Loading...