向量数据库是什么？本地知识库又是怎么回事？让 AI 从“嘴强王者”变成“查资料高手”

大家好，我是 MuSen。

今天我们来聊一个听起来很高级、很赛博、很容易把人劝退的东西：

向量数据库。

第一次听这个词，很多人的表情大概是这样的：

数据库我知道，向量我也勉强听过，
但向量数据库是什么？
数据库开始学高数了？

别急。

这玩意儿没有听起来那么吓人。

你可以先把它理解成一句话：

向量数据库，就是一个能按照“意思相不相近”来找资料的数据库。

普通数据库更像是在找“字面一样”的东西。

比如你搜：

Python

它就去找内容里有没有 Python 这个词。

但是向量数据库不一样，它更像是在理解意思。

你问：

怎么让 AI 读取我的本地文档？

哪怕资料里没有完全一样的句子，只写了：

可以使用 RAG 技术结合本地知识库，让大模型基于私有资料回答问题。

向量数据库也可能找到它，因为它觉得：

嗯，这俩说的是一件事。

这就是向量数据库最有意思的地方：

它不是只看字面，而是看语义。

一、为什么我们需要向量数据库？

先从一个很现实的问题开始。

假设你电脑里有一堆资料：

Python学习笔记.md
Java面试八股.pdf
项目部署文档.docx
数据库优化总结.txt
博客草稿一大堆

然后你问 AI：

“我之前写的 Redis 缓存穿透怎么解决来着？”

如果 AI 没有读过你的资料，它只能根据自己以前训练过的知识来回答。

这时候它可能答得还挺像那么回事：

缓存穿透可以使用布隆过滤器、缓存空值、参数校验等方式解决。

这个答案没错，但问题是：

这不是“你之前写的内容”，这是 AI 自己凭经验总结的内容。

如果你想让 AI 回答：

“根据你那份 Redis 笔记，你当时写的是缓存空值 + 布隆过滤器，并且在高并发场景下建议配合互斥锁。”

那就需要 AI 先去你的资料里找。

问题来了：

AI 怎么在一堆本地文件里快速找到相关内容？

这时候就轮到向量数据库上场了。

它的作用就像一个特别懂语义的图书管理员。

你问一句话，它不会傻乎乎地只找一模一样的关键词，而是会理解你的问题大概是什么意思，然后去资料库里找“意思最接近”的内容。

普通搜索像这样：

你说“苹果”，它只找带“苹果”两个字的内容。

向量搜索像这样：

你说“苹果”，它会根据上下文判断你是要找水果、手机，还是那个被牛顿碰瓷的物理道具。

当然，它也不是神，但它确实比单纯关键词搜索聪明很多。

二、先搞懂“向量”：文字怎么变成数字？

向量数据库里的“向量”，本质上就是一串数字。

比如一句话：

Python 是一门适合初学者的编程语言。

经过模型处理后，可能会变成：

[0.12, -0.45, 0.88, 0.07, ...]

这一串数字，就是这句话的向量表示。

你可能会问：

好好一句人话，为什么非要变成数字？
是文字不香了吗？

原因很简单：

计算机更擅长比较数字。

人类看到两句话，可以判断它们意思像不像：

我喜欢 Python。
我爱写 Python 代码。

我们一看就知道，这两句话很接近。

但计算机不天然理解“喜欢”和“爱写”之间的关系。

所以我们要借助模型，把文字变成数字。

变成数字以后，计算机就可以通过数学方法判断：

这两个向量距离近不近？
方向像不像？
相似度高不高？

意思相近的句子，变成向量后，它们在向量空间里的位置也会比较接近。

意思不相关的句子，距离就会比较远。

比如：

我喜欢 Python。
Python 很适合自动化办公。

这两句话都跟 Python 有关，它们的向量距离会比较近。

而：

今天中午吃红烧肉。

这句话和 Python 没啥关系，它的向量距离就会比较远。

除非你写的是：

用 Python 自动点红烧肉外卖。

那它们之间突然又产生了一种神秘的技术联系。

三、什么是 Embedding？它不是魔法，但很像翻译官

这里会遇到一个重要名词：

Embedding。

中文一般叫：

嵌入
向量嵌入
向量表示

听起来有点抽象，但你可以把它理解成：

把文字变成向量的过程。

也可以理解成：

把人类语言翻译成机器能比较的数字语言。

比如：

原始文本：什么是向量数据库？
↓
Embedding 模型处理
↓
向量：[0.31, -0.22, 0.76, ...]

这里的 Embedding 模型，就是那个“翻译官”。

它负责把一句话、一段文字、一个标题，转换成一串能表示语义的数字。

它厉不厉害，直接影响知识库好不好用。

一个好的 embedding 模型应该知道：

汽车 ≈ 小轿车
程序员 ≈ 写代码的人
大模型 ≈ LLM
本地知识库 ≈ 私有资料问答系统

如果模型太憨，它可能会把“Java”和“JavaScript”硬凑成亲兄弟。

虽然它俩名字像，但程序员都知道：

Java 和 JavaScript 的关系，大概就像雷锋和雷峰塔。

不能说完全没关系，只能说关系不大。

四、向量数据库到底存了什么？

很多人以为向量数据库里只存一堆数字。

其实不完全是。

一个正常的向量数据库里，通常会存三类东西：

1. 原始文本内容
2. 文本对应的向量
3. 这段文本的来源信息

举个例子。

假设我们有一段资料：

Python 适合自动化、数据分析、人工智能和 Web 开发。

放进向量数据库后，大概会变成这样：

文本内容：
Python 适合自动化、数据分析、人工智能和 Web 开发。

向量：
[0.12, -0.45, 0.88, ...]

来源信息：
文件名：Python学习笔记.md
章节：Python用途
位置：第3段

其中“来源信息”还有一个专门的名字：

Metadata，元数据。

元数据不是正文，而是描述正文的信息。

就像一本书的封面、目录、页码、作者名。

没有元数据也能搜索，但会有一个很大的问题：

找到了内容，却不知道它从哪里来的。

这就像你在图书馆里捡到一页纸，上面写着绝世武功，但你不知道它是哪本书第几页。

看起来很强，但不太放心。

所以一个靠谱的本地知识库，一定要保存来源信息。

这样 AI 回答时才能告诉你：

根据《Python学习笔记.md》中的“Python用途”章节……

这就从“AI 自信发言”变成了“AI 有据可查”。

五、本地知识库是什么？

本地知识库，简单说就是：

把你自己的资料整理起来，让 AI 可以基于这些资料回答问题。

它和普通聊天 AI 最大的区别是：

普通 AI：

用户提问
↓
AI 根据已有知识直接回答

本地知识库 AI：

用户提问
↓
先去你的资料里找相关内容
↓
把找到的资料交给 AI
↓
AI 根据资料回答

这个差别非常关键。

普通 AI 像一个记忆力不错但没看过你电脑的人。

本地知识库 AI 像一个可以翻你指定资料夹的助手。

当然，是你允许它翻的那种，不是半夜偷偷打开你“新建文件夹”的那种。

六、RAG 是什么？本地知识库的核心灵魂

讲本地知识库，一定绕不开一个词：

RAG。

RAG 的全称是：

Retrieval-Augmented Generation

中文叫：

检索增强生成

这名字听起来像论文标题，实际上很简单。

我们拆开看：

Retrieval：检索

先去资料库里找相关内容。

比如你问：

什么是缓存雪崩？

系统就去你的知识库里找：

缓存雪崩
Redis
高并发
大量 key 同时过期

Augmented：增强

把检索到的资料，作为额外上下文提供给大模型。

也就是告诉 AI：

你先看看这些资料，再回答用户问题。

这一步很重要。

如果没有这一步，AI 就是在裸答。

有了这一步，AI 就是在开卷考试。

Generation：生成

大模型根据检索到的资料，组织成自然语言答案。

也就是最终用户看到的回答。

所以 RAG 的完整流程就是：

用户提问
↓
系统检索相关资料
↓
把资料塞给大模型
↓
大模型整理语言
↓
输出答案

一句话总结：

RAG 不是让 AI 真的“记住”你的资料，而是让 AI 每次回答前先“查资料”。

这点非常重要。

很多人以为：

我把 PDF 放进知识库，AI 就永久学会了。

不是的。

它不是修仙顿悟，也不是把文档吃进肚子里长脑子。

更准确地说：

文档被整理进知识库，AI 回答时再从知识库里临时检索相关内容。

这就像考试前没背书，但是允许带一本目录清晰、检索很快的资料书。

七、本地知识库内部到底怎么工作？

我们用一个故事来讲。

假设你有一篇文章：

《Python 入门笔记.md》

里面写了很多内容：

Python 是什么
变量是什么
函数怎么用
列表是什么
字典是什么
面向对象是什么

现在你想让 AI 能回答这篇文章相关的问题。

系统不会直接把整篇文章丢给 AI。

因为文章太长，AI 一次能看的内容有限。

这就像你问一个人：

“你帮我总结一下第三章讲了啥。”

然后你直接把一整套百科全书砸他脸上。

他不是不想帮你，他只是可能当场宕机。

所以知识库会先做一件事：

八、第一步：把文档切成小块，也就是 Chunk

Chunk，中文可以理解为：

文本块
文档切片
资料小片段

为什么要切？

因为大模型一次处理的上下文是有限的。

你的资料可能很长，但用户的问题通常只和其中一小部分有关。

所以我们要把长文档切成一块一块的小片段。

比如原文是：

Python 是一种解释型语言。
Python 适合自动化办公。
Python 可以用于数据分析。
Python 也常用于人工智能开发。

可以切成：

Chunk 1：
Python 是一种解释型语言。Python 适合自动化办公。

Chunk 2：
Python 可以用于数据分析。Python 也常用于人工智能开发。

每一个 chunk 都会单独处理。

这样用户问：

Python 可以做数据分析吗？

系统就不需要把整篇文章都拿出来，只需要找到和“数据分析”相关的 chunk。

这就像你去饭店点菜，不需要把整个厨房端出来，只需要上你点的那盘菜。

九、Chunk 切多大合适？

这是知识库效果好坏的关键之一。

如果 chunk 太大，会出现问题：

一个 chunk 里包含太多主题
检索结果不够精准
AI 容易被无关内容干扰

比如一个 chunk 里同时写了：

Python 变量
Linux 命令
Redis 缓存
如何煮泡面

用户问 Redis，结果 AI 还看到了泡面。

它可能最后回答：

Redis 缓存可以配合热水冲泡三分钟。

这就很离谱。

如果 chunk 太小，也会有问题：

上下文不完整
一句话没头没尾
AI 不知道“它”“这个”“上面的方法”指什么

比如原文是：

布隆过滤器可以用来解决缓存穿透。
它的优点是空间效率高。

如果切片时只切到：

它的优点是空间效率高。

AI 就会很懵：

它是谁？
它在哪？
它为什么空间效率高？

所以 chunk 要适中。

一般来说：

太大：像火锅乱炖
太小：像瓜子壳，没有肉
适中：一口刚好，信息完整

十、为什么 chunk 之间要有重叠？

做知识库时，经常会看到一个参数：

Overlap，重叠。

意思是：

相邻两个 chunk 之间，保留一部分重复内容。

比如原文是：

A B C D E F G H

如果不重叠，可能切成：

Chunk 1：A B C D
Chunk 2：E F G H

如果有重叠，可能切成：

Chunk 1：A B C D
Chunk 2：C D E F
Chunk 3：E F G H

为什么要重复？

因为很多知识点不是刚好卡在一个整齐的边界上。

现实里的文章经常这样写：

前一段提出问题
后一段解释答案
再后一段举例说明

如果切片太干净，问题和答案可能被切开。

这就像电视剧看到关键处突然跳到下一集：

“真正的凶手就是——”
下集预告。

重叠就是为了避免重要上下文被切断。

它让每个 chunk 都带一点前后文，AI 检索时更容易找到完整信息。

十一、第二步：把每个 Chunk 变成向量

文档切好以后，每个 chunk 都会送进 embedding 模型。

比如：

Chunk：
Python 可以用于数据分析、自动化办公和人工智能开发。

经过 embedding 模型后，变成：

[0.23, -0.19, 0.67, ...]

这个向量就代表了这段文本的语义。

之后系统会把：

文本内容
向量
来源信息

一起存进向量数据库。

也就是说，向量数据库里不是只存“资料原文”，而是把资料变成了方便搜索的语义坐标。

你可以想象成：

每段文字都被放到了一个巨大的语义地图上。

Python 相关的内容在一个区域。

数据库相关的内容在一个区域。

AI 相关的内容在一个区域。

摸鱼相关的内容可能遍布整个地图，因为人类文明的发展史本质上就是不断优化摸鱼效率的历史。

十二、第三步：用户提问也要变成向量

当用户提问时，比如：

Python 能用来做人工智能吗？

系统不会直接拿这句话去数据库里死板匹配。

它会先把这个问题也变成向量：

用户问题 → 向量

然后拿这个问题向量，去向量数据库里找距离最近的 chunk 向量。

也就是找：

哪些资料片段和这个问题意思最接近？

这就是所谓的：

相似度搜索。

十三、什么是相似度搜索？

相似度搜索，就是在向量数据库中找出“最像”的内容。

这里的“像”，不是长得像，而是意思像。

比如用户问：

Python 能不能做 AI？

知识库里可能有这些内容：

A：Python 常用于人工智能、机器学习和数据分析。
B：Java 是一种面向对象编程语言。
C：MySQL 是一种关系型数据库。
D：Python 可以用于自动化脚本编写。

向量数据库会判断：

A 和问题最相关
D 有一点相关
B 基本无关
C 更无关

所以它可能优先返回 A。

这就是语义搜索的价值。

用户不一定能准确说出关键词，但只要意思接近，系统也有机会找到相关资料。

这对本地知识库非常重要。

因为我们平时问问题往往不会和文档原文一模一样。

文档里写的是：

缓存击穿通常发生在热点 key 失效后，大量请求直接访问数据库。

用户可能问的是：

Redis 热点数据突然过期导致数据库压力暴增是啥问题？

关键词不完全一样，但意思很接近。

向量数据库就能派上用场。

十四、Top-K：返回几个结果比较好？

检索时还有一个常见参数：

Top-K。

它的意思是：

返回最相关的前 K 条内容。

比如：

Top-K = 3

表示返回最相似的 3 个 chunk。

如果 Top-K 太小，可能漏掉重要信息。

比如只返回 1 条，结果这条刚好只讲了定义，没讲解决方案。

如果 Top-K 太大，又可能塞进太多无关内容。

比如返回 20 条，AI 可能看完以后脑子里像开了十个浏览器标签页：

这个也相关，那个也相关，好像都相关，那我开始自由发挥了。

所以 Top-K 要适中。

常见思路是：

简单问题：Top-K 可以小一点
复杂问题：Top-K 可以大一点
文档质量高：Top-K 可以小一点
文档比较乱：Top-K 要谨慎调

不要迷信固定数字。

知识库调参有点像炒菜：

盐少了没味，盐多了齁人。
最后还得尝。

十五、AI 是怎么根据资料回答的？

检索到相关 chunk 以后，系统会把这些 chunk 组合成上下文，然后交给大模型。

大概意思是：

你是一个知识库问答助手。
请根据下面资料回答用户问题。
如果资料里没有答案，就说不知道，不要编造。

资料：
1. xxx
2. xxx
3. xxx

用户问题：
xxx

大模型看到这些资料后，再生成自然语言答案。

所以本地知识库的回答不是凭空来的，而是：

检索结果 + 大模型语言组织能力

向量数据库负责：

找资料。

大模型负责：

说人话。

这俩配合起来，就像：

向量数据库：我查到了，资料在这。
大模型：好，我来组织成一段好懂的回答。

一个负责翻箱倒柜，一个负责体面发言。

十六、本地知识库不是“训练模型”

这里一定要强调一个误区：

搭建本地知识库，不等于训练大模型。

很多人会说：

我把资料放进去，是不是模型就学会了？

不是。

本地知识库通常不是让模型重新训练，也不是改变模型本身的参数。

它更像是给模型配了一个外部资料库。

模型本身没有变聪明。

但是它回答前能查资料了。

这就像一个学生：

训练模型：真的把知识背进脑子里
本地知识库：考试时允许翻资料

训练模型成本高、难度大、时间长。

本地知识库成本低、灵活、容易更新。

如果你的资料经常变化，比如项目文档、产品说明、博客文章，那本地知识库通常比训练模型更合适。

因为你改了文档，只需要更新知识库，不需要重新训练大模型。

十七、本地知识库为什么能减少 AI 幻觉？

AI 幻觉，就是 AI 一本正经地胡说八道。

比如你问：

我的项目部署流程是什么？

AI 没看过你的项目文档，但它可能回答：

先使用 Docker 构建镜像，再通过 Kubernetes 部署到集群。

听起来很专业。

问题是你的项目可能只是：

上传 jar 包，然后运行 java -jar。

这就尴尬了。

本地知识库可以减少这种情况。

因为它会让 AI 先查你的资料。

如果资料里写了部署流程，AI 就能根据资料回答。

如果资料里没有写，理想情况下 AI 应该说：

资料中没有找到相关部署流程。

这比硬编靠谱很多。

当然，本地知识库不能 100% 消灭幻觉。

因为 AI 仍然可能：

理解错资料
混合多个片段
忽略限制
在资料不足时强行补全

所以还需要好的提示词和合理的检索策略。

也就是说：

知识库是安全带，不是无敌金钟罩。

十八、为什么普通关键词搜索不够？

你可能会问：

我直接用全文搜索不行吗？为什么非要向量数据库？

全文搜索当然有用，而且非常重要。

但它有一个问题：

它依赖关键词。

比如文档里写的是：

大语言模型可以结合私有数据进行问答。

用户问的是：

怎么让 AI 读取我的本地资料？

这两句话意思接近，但关键词差异比较大。

关键词搜索可能找不到。

向量搜索就更容易发现它们之间的语义关系。

不过反过来，向量搜索也不是万能的。

比如用户搜：

HTTP 500
MySQL 1064
Nginx 403

这种精确错误码，关键词搜索往往更准。

所以更成熟的知识库系统通常会用：

向量搜索 + 关键词搜索

这叫：

混合检索。

简单理解：

向量搜索：看意思
关键词搜索：看字面
混合检索：意思和字面我都要

成年人不做选择题。

尤其是程序员，能加的方案一般都会想办法加上。

十九、一个本地知识库好不好用，关键看什么？

很多人以为：

我用了向量数据库，效果肯定好。

不一定。

知识库效果好不好，通常取决于这些因素。

1. 文档质量

如果你的资料本身很乱，知识库也会很乱。

比如文档里全是：

最终版
最终最终版
真的最终版
最终不改版
最终打死不改版

AI 检索出来也会一脸懵。

所以本地知识库的第一步，其实不是选工具，而是整理资料。

干净的文档，比花哨的架构更重要。

垃圾进，垃圾出。

这句话在 AI 时代依然有效。

2. 切片策略

文档切得好，AI 更容易找到完整答案。

切得不好，AI 可能只看到半句话。

比如用户问：

缓存穿透怎么解决？

好的 chunk 里应该包含：

缓存穿透的定义
产生原因
解决方案
适用场景

坏的 chunk 可能只有：

它可以通过这种方式解决。

这谁看了不沉默？

所以 chunk 不只是机械切字数，还要尽量保留语义完整。

标题、段落、列表、章节结构都很重要。

3. Embedding 模型质量

不同 embedding 模型对语义的理解能力不同。

如果模型对中文理解不好，你问中文问题，它可能检索效果很差。

如果模型对代码理解不好，你问编程问题，它可能找不到真正相关的代码片段。

所以知识库要根据场景选 embedding 模型。

中文资料多，就要选中文效果好的。

代码资料多，就要考虑对代码友好的。

技术文档多，就要看它对专业术语理解得怎么样。

4. 检索策略

检索不是简单地“找几个最像的”。

还要考虑：

返回几条？
要不要关键词搜索？
要不要过滤文档来源？
要不要按时间筛选？
要不要重新排序？

比如你有很多文档：

旧版接口文档
新版接口文档
测试环境文档
生产环境文档

用户问生产环境部署，如果系统找到了旧版测试环境文档，那答案就可能出事故。

所以 metadata 很重要。

有了 metadata，就可以限制：

只查生产环境
只查最新版本
只查某个项目
只查某类文档

这会让知识库更靠谱。

5. 提示词约束

最后，大模型回答时也要被约束。

比如要明确告诉它：

只能根据资料回答
资料不足就说不知道
不要编造来源
不要把猜测当事实

否则 AI 很容易发挥文学天赋。

程序员想要的是答案，不是赛博小说。

二十、向量数据库适合做什么？

向量数据库特别适合这些场景：

1. 个人笔记问答

比如你有很多学习笔记。

你可以问：

我之前怎么理解装饰器的？
我写过哪些关于 Redis 的内容？
我总结过哪些 Python 自动化案例？

它能帮你从自己的资料里找答案。

2. 项目文档问答

团队项目文档一多，经常没人知道答案在哪。

你可以问：

订单超时取消逻辑在哪？
用户权限校验流程是什么？
生产环境部署要注意什么？

知识库可以帮你快速定位。

3. 企业内部知识库

比如：

员工手册
客服话术
产品说明
运维流程
研发规范

都可以放进知识库。

员工不用到处问：

这个流程谁知道？

直接问知识库。

当然，企业级场景还要考虑权限控制，不是谁都能看所有资料。

否则客服问个产品说明，顺便看到老板年终奖方案，那就刺激了。

4. 博客内容管理

对博客作者来说也很有用。

比如我把 musenqwq.com 的文章都放进知识库，之后就可以问：

我之前写过哪些 Python 入门文章？
哪篇文章讲过变量？
下一篇可以接着写什么？
有没有内容重复？

这对长期写作非常友好。

写博客最怕的不是没灵感，而是：

我好像写过，但我忘了。

知识库就是作者的第二大脑。

二十一、向量数据库和传统数据库的区别

我们来做个对比。

传统数据库更适合：

查用户 ID
查订单号
查手机号
查状态等于已支付的数据

它擅长结构化数据。

比如：

用户表
订单表
商品表
日志表

这些数据字段明确，关系清晰。

向量数据库更适合：

找意思相近的文章
找相似问题
找相关知识片段
找相似图片
找相似代码

它擅长非结构化数据。

比如：

文档
图片
音频
代码
聊天记录

一句话总结：

传统数据库：适合精确查询
向量数据库：适合相似查询

传统数据库像查户口：

身份证号是多少？

向量数据库像找朋友：

谁和这个人气质比较像？

一个严谨，一个灵活。

都很重要。

二十二、本地知识库的本质是什么？

讲了这么多，我们可以总结一下。

本地知识库的本质不是：

让 AI 永久学会你的资料

而是：

让 AI 回答问题前，先去你的资料里找相关内容

它的核心流程是：

整理资料
↓
切成文本块
↓
变成向量
↓
存进向量数据库
↓
用户提问
↓
问题也变成向量
↓
检索相关内容
↓
交给大模型回答

它解决的问题是：

资料太多，人找不过来
AI 没有私有资料，容易瞎猜
普通搜索只能看关键词，不够灵活

它带来的效果是：

回答更贴近你的资料
可以追溯来源
减少胡编乱造
提升知识复用效率

二十三、最后，用一句话记住它

如果你只想记住一句话，那就是：

向量数据库，是让 AI 按“意思”查资料的工具；本地知识库，是让 AI 基于你的资料回答问题的系统。

再形象一点：

大模型像一个聪明但偶尔嘴瓢的魔法师，向量数据库就是它的魔法图书馆。

没有图书馆时，它只能凭感觉施法。

有了图书馆后，它终于学会了：

先查资料，再开口。

这就是本地知识库的价值。

它不是为了让 AI 看起来更酷，而是为了让 AI 更靠谱。

毕竟，一个会查资料的 AI，
总比一个张嘴就来的 AI，
更像真正的助手。

向量数据库是什么？本地知识库又是怎么回事？让 AI 从“嘴强王者”变成“查资料高手”

一、为什么我们需要向量数据库？

二、先搞懂“向量”：文字怎么变成数字？

三、什么是 Embedding？它不是魔法，但很像翻译官

四、向量数据库到底存了什么？

五、本地知识库是什么？

六、RAG 是什么？本地知识库的核心灵魂

Retrieval：检索

Augmented：增强

Generation：生成

七、本地知识库内部到底怎么工作？

八、第一步：把文档切成小块，也就是 Chunk

九、Chunk 切多大合适？

十、为什么 chunk 之间要有重叠？

十一、第二步：把每个 Chunk 变成向量

十二、第三步：用户提问也要变成向量

十三、什么是相似度搜索？

十四、Top-K：返回几个结果比较好？

十五、AI 是怎么根据资料回答的？

十六、本地知识库不是“训练模型”

十七、本地知识库为什么能减少 AI 幻觉？

十八、为什么普通关键词搜索不够？

十九、一个本地知识库好不好用，关键看什么？

1. 文档质量

2. 切片策略

3. Embedding 模型质量

4. 检索策略

5. 提示词约束

二十、向量数据库适合做什么？

1. 个人笔记问答

2. 项目文档问答

3. 企业内部知识库

4. 博客内容管理

二十一、向量数据库和传统数据库的区别

二十二、本地知识库的本质是什么？

二十三、最后，用一句话记住它

MuSen的技术笔记

分享文章

文章目录