AI与法律科技
使用LM Studio+Cherry Studio构建本地法律 AI 知识库
· 朱思浩
摘要
本文介绍如何使用 LM Studio 和 Cherry Studio 搭建私密、安全的本地法律 AI 知识库,适用于需要保护案件资料和客户隐私的法律从业者。文章从工具选择、模型下载、软件配置到知识库构建,提供了一套可离线运行的实践路径。
作为法律从业者,我们经常需要处理大量涉及客户隐私的案件资料。本文将介绍如何使用LM Studio和Cherry Studio这两个工具,搭建一个私密、安全的本地法律AI知识库,给法律人安全合规使用AI提供一个思路。
为什么选择LM Studio+Cherry Studio?
首先,使用ima(详见:法律人如何搭建自己的ai知识库?)来构建法律AI知识库是一个非常不错的解决方案,简单、不挑硬件配置、多端同步方便。但使用ima构建知识库需要将文件资料上传至ima的服务器,如果涉及到敏感数据和隐私信息,就可能存在安全和泄密风险。 对于从事刑事等业务的法律人,相关案件资料的安全及隐私要求更高。因此,对有数据安全及隐私需求的人群来说,搭建一个完全本地化的法律AI知识库是更好的选择。
其次,LM Studio相对于之前介绍过的Ollama(详见:法律人如何自己部署ai大模型来提高工作效率?),有更好的图形界面支持,针对mac端还提供速度更快的mlx格式模型,上手使用门槛更低一些。
最后,Cherry Studio作为一个更专业的AI对话客户端,其内置的本地知识库功能是笔者目前使用体验最好的,它具有以下优势:
- 支持多种文档格式的导入,包括PDF、Word、Excel等常见法律文档格式
- 提供强大的向量检索功能,可以快速定位相似案例和相关法条
- 可与LM Studio无缝集成,实现完全离线运行的本地法律AI知识库问答,确保数据安全性
准备工作
软件下载及硬件要求:
- LM Studio:用于部署和运行大语言模型
下载地址:https://lmstudio.ai/
- Cherry Studio:用于构建知识库和检索系统
下载地址:https://www.cherry-ai.com/
- 硬件要求:电脑建议至少16GB内存,有大显存独立显卡支持更佳
开始构建步骤
构建本地法律AI知识库主要分为三个阶段:软件安装、模型下载和知识库构建。
1. 安装LM Studio
- 进入官网下载好LM Studio,点击安装包按提示完成软件安装。

- 启动LM Studio,点击右下角⚙️图标,进入设置页面;为便于操作,可现将软件语言设置为简体中文,其他可按需求设置。

2. 模型下载(mac端优先选择mlx格式)
- 点击LM Studio界面左侧🔍图标,进入本地模型搜索下载页面

配置一般(16g内存)推荐:
- deepseek-r1-0528-qwen3-8b
- qwen3-8b
配置较好(32g内存及以上;大显存独立显卡)推荐:
- qwen3-14b/qwen3-32b
- deepseek-r1-distill-qwen-14b/deepseek-r1-distill-qwen-32b

Embedding模型推荐:
- bge-m3
- bge-reranker-v2-m3

3. 安装Cherry Studio
- 进入官网下载好Cherry Studio,点击安装包按提示完成软件安装。

- 启动Cherry Studio,点击右下角⚙️图标,进入设置页面;依次选择“模型服务”—“LM Studio”—“管理”,添加前述步骤下载的本地模型到Cherry Studio中。(注意:使用时打开右上角的启用开关至“ON”)


- 配置完成后可点击检测,确认两个软件之间能够正常通信。

4. 知识库构建
完成基础设置后,我们就可以开始构建专属的法律知识库了。这个过程包括:
- 创建知识库,选择嵌入及重排模型,请求文档片段数量可设置为15。

- 导入案例文档和证据材料,导入后需要一段时间对数据进行向量化处理,电脑性能不同处理时间也不同,出现绿色打勾标志,意味着处理完成。


- 回到主界面,选择下载好的模型作为对话模型,同时启用构建好的知识库。我们就可以和使用ima一样,以纯本地离线的方式让AI帮我们检索知识库内容或者在本地对案件进行法律分析了。


最后
希望这篇文章可以为法律从业者的本地化AI知识管理提供一个思路。拥抱AI,但要掌控AI。数据始终在我们自己手中的体验,是这个时代极为稀缺的。