什么是知识库检索？

知识库检索，又称为“检索增强生成”（RAG），是2020年MetaAI研究人员提出的概念。因为 LLM 的知识在训练之后，即变成静态的，无法适应时间的变化。

因此，更新的知识只能通过两种方法：1.重新训练模型；2.链接外部的知识库。

由于方法一既耗时又耗钱，所以我们就用方法二为主，这就是知识库检索——将外部知识库链接给LLM，让LLM来检索。

而检索效率上，又以向量检索准确度最高，所以通常辅以“向量检索”的知识。

知识库检索的一般流程如下：

图片 by Guangzheng Li

基本步骤

1.向量存储知识

将文件（Document）的文字提出出来，分解成块（chunk），再用 embedding 模型将之存储起来，通常会存储在向量数据库中（vectore stores）。

2.向量转化问题

将用户的问题通过 embedding 模型转化为向量。

3.提取相近值

将“问题向量”和“知识库向量“做比对，通过计算找到距离最近的”知识库向量“，再把”知识库向量”里的文字提取出来。

4.LLM 过滤

由于提取出来的结果未必切题，所以把“用户问题”和“提取结果”最后提交给LLM，要求LLM以“提取结果”为参考，输出最终答案。

“过度检索”问题

如果你按照以上方法操作，或早或晚你会碰到“过度检索”的问题。什么意思？意思就是每一次你的问题，不管是否在知识库内，系统都会去检索知识库，这样又费时，效果又变差。

怎么办呢？

解决方法就是“function calling”。众所周知，我们可以通过调用函数，增强 GPT 的能力，这里也是借用它的思想——将知识库函数化，由 LLM 自己判断是否要检索知识库。

openai function calling 的文章可以参考这两篇：

stream 版或非 stream 版

minimax function calling 可以参考这一篇：

minimax 版

其他参考

向量知识库的知识：

向量数据库汇总

知识库检索概念：

https://mp.weixin.qq.com/s/L7tO4vye9TAUyjevZZuZBg

如何做知识库检索机器人（RAG检索）

什么是知识库检索？

基本步骤

1.向量存储知识

2.向量转化问题

3.提取相近值

4.LLM 过滤

“过度检索”问题

其他参考

Published by 小中

发表回复取消回复

什么是知识库检索？

基本步骤

1.向量存储知识

2.向量转化问题

3.提取相近值

4.LLM 过滤

“过度检索”问题

其他参考

Published by 小中

发表回复 取消回复

发表回复取消回复