五款开源免费 AI 知识工具:高效学习与笔记管理

引言

PDF 转 Word Markdown、全网视频提炼笔记。
笔记内容还能秒变 AI 知识库。
新学期的第一天,是时候用 AI 给学习方式来一次升级了。
我准备了五款压箱底的 AI 知识类工具,帮助我们更高效地提取知识内容,重塑学习版图。
更棒的是,这些工具都是开源免费的,可以在 GitHub 上面找到在线使用地址或者安装包,还能基于源代码进行功能 DIY。
话不多说,我们直接开始。

第一款工具:MinerU(PDF 解析神器)

MinerU 是一个开源免费的 PDF 解析神器。它可以把 PDF、PPT、图片等转换成可以编辑的 Markdown 格式,其中图片、表格、数学公式等都可以精确提取。它还可以转化扫描类的 PDF 文件。
MinerU 把复杂的文件类型转换成 AI 大模型易于理解的格式,所以它跟 AI 知识库是绝配。
我们来到项目官网,在右上角先登录一下,点击在线使用。然后把我们要处理的文档上传进来。右上角可以看到文件的处理进度。
这是一个格式复杂的论文,里面有大量的图片、表格,还有公式等。我们可以在左侧的源文件选中一个块级,右边就关联出了对应的 Markdown 语法。点击复制按钮就可以复制它的 Markdown 源码。公式可以复制它的 LaTeX 源码。还可以在右上角以多种文件格式把它下载下来,比如这里我下载 Markdown 格式。
我们可以使用 VS Code、Cursor 等编辑器把它打开。打开以后展现的是论文的 Markdown 源码,我们可以在这里面进行自由的编辑。按住 Ctrl + Shift + V 打开对应的预览页面。
Markdown 有格式清晰、token 利用率高等优点,已经成为了大模型理解与处理文本的首选格式。
有了 Markdown 格式的知识以后,我们需要一个笔记软件把知识长久保存下来。市面上好用的笔记软件有很多,本期视频我们重点推荐开源软件。
项目地址GitHub: opendatalab/MinerU

第二款工具:NoteGen(AI 笔记软件)

NoteGen 是一个近期热度很高的开源 AI 笔记软件。它基于 Tauri 2.0 技术开发,安装包仅仅只有 20MB,提供了 Windows、Mac、iOS 还有安卓等全平台的支持。可以在项目的官网或者 GitHub 首页找到软件的下载地址。
打开以后切换到写作这一栏,新建一个 Markdown 格式的笔记。接下来我们就可以把 Markdown 格式的论文整个复制进来。论文的格式排版都很清晰,可以把任意的图片复制一下,直接粘贴到文章里面来。
我们可以直接把这些笔记作为 AI 知识库使用。有关于 AI 知识库的原理,可以参考一下这期视频。
接下来我们通过 API 平台把 AI 的能力接入 NoteGen。我们在左下角找到设置模型配置,创建新模型。这里我选择的 API 平台是硅基流动,把这个地址复制进浏览器,然后先登录一下。在左侧找到 API 密钥,新建 API 密钥,把创建的密钥复制一下,粘贴过来。
我们先配置一个嵌入模型给知识库使用。在上面找到模型广场筛选器嵌入,这里我找一个免费的,我用这个把模型的名字复制一下。找到 model,这里添加过来,模型类型改成嵌入。
接下来我们配置一个对话模型,创建新配置。硅基流动 API Key 还是刚才那个模型,这里我们选择对话,这里我使用 DeepSeek v3.1 复制一下模型,DeepSeek v3.1 模型类型选择对话。在配置里面找到知识库,嵌入模型,选择刚才配置的 BGE-M3。
好,这就搞定了。我们来试一下,切换到记录,在这个页面可以跟 AI 进行对话,把知识库检索开启起来。我问他一个问题:在 Docker 里把模块都打包在一起,做一个巨大的容器,坏处是什么?这个在我之前的视频里面介绍过,是有对应的笔记的。我们看到他根据笔记内容成功地检索到了这四条。
NoteGen 的这个记录功能,很像是一个随笔便签,快捷的把一些知识片段记录下来。比如我们可以把 AI 的对话记录下来。它还可以自动识别剪切板的内容,快捷的进行记录。截图功能可以快速的给应用截屏,我们双击一下,它会使用 AI 图像识别,自动为图片添加描述,方便我们以后快速搜索图片。
便签功能用来快速地记录一些碎片化的知识,等我们有时间的时候,可以把这些知识再整理成完整的笔记。这里使用记录可以把我们之前记得那些便签,直接插入到笔记里面。
有一个重要的学习资料来源是视频,接下来我们看如何快速把视频整理成笔记。
项目地址GitHub: codexu/note-gen

第三款工具:NotebookLM(谷歌 AI 笔记工具)

NotebookLM 是谷歌推出的一个 AI 笔记工具,可以把散落在各种数据源里面,比如音频、视频、PDF、网页等里面的知识进行归纳整理,输出成学习指南、简报、音频概览或者思维导图等。
我们来到 NotebookLM,打开这个地址,需要国外的网络环境,直接新建笔记本。接下来就可以把各种来源的学习资料上传进来。我选择 YouTube 视频,这是一个长达七小时的 Next.js 15 的完整教程。
我们先使用 NotebookLM 来规划一个学习路线图,大致总结一下这个视频应该如何进行学习。它为我们生成了一个详尽的笔记,总共分为六大阶段,每个阶段里面的知识点都列的非常清楚。我们可以直接把这个笔记复制一下,然后粘贴到我们自己的笔记里面。根据这个路线图,结合视频内容逐次的学习。
NotebookLM 只支持 YouTube 的视频,对于国内平台的视频,我们可以借助一个开源免费的软件 Notevid。
Notevid 是一个开源的 AI 视频助手,支持通过视频链接自动提取内容,并且生成结构清晰、重点明确的 Markdown 格式笔记。我们在他的 GitHub 首页,这里 releases 可以找到 Windows 跟 Mac 系统对应的安装。这里我把它下载并且安装一下。启动这个页面时,要耐心等待一会儿,它正在下载语音识别模型进来。
第一步,先配置模型。点击这里的配置 AI 模型,找到 DeepSeek,这里我还是用硅基流动,我们把刚才用过的地址配置过来,刚才用的 API Key 也复制过来。点击刷新模型,这里的模型我还用 DeepSeek v3.1 保存一下。再回到首页,把视频地址粘贴过来,模型选择 DeepSeek,可以自定义笔记格式,我勾选上 AI 总结原片跳转。下面可以填写备注,调整笔记风格,我点击生成。几分钟后,最终生成的笔记相当不错,层次非常的清晰。同样,他还为我们生成了内容完善的思维导图。我们可以把这个内容复制一下,粘贴到自己的笔记里面。
各位上学写论文的时候,一定有这样的经历:论文写了第一版、第二版、第三版、定稿版、最终版,打死不改,最终版。我们小心翼翼地保存好论文的每个版本,就是为了应对各种突发状况。比如某一天突然需要找回论文的某个历史版本的某个段落,我们就可以很从容的从历史文件里把它找回来。
这个保存了多个历史版本的操作,就是最原始的版本控制。不过这是一种纯人工的方式。假设你有成千上万的文件,又有成百上千的人对这些文件进行协同开发,版本控制就会变成一个极其复杂的工作。
Git 是一个帮助我们进行版本控制的软件,被 Git 管理起来的文件夹就是一个 Git 仓库。Git 仓库分成两种:本地仓库跟远端仓库。如果想把本地仓库在远端进行一个备份,就可以把本地仓库发布到服务器上面。GitHub 是一个免费提供远端仓库的网站。
作为一个学生党,哪怕您不是计算机专业的,Git 与 GitHub 也是必学必会的内容。接下来我们看一个非常简单的应用,就是把我们刚才的笔记同步到 GitHub 网站上面,做一个远端备份。
我们来到 NoteGen 的设置,找到同步配置,这里选 GitHub,点击创建 access token。没有账号的话,需要先注册一个。这里我插一句,如果您访问 GitHub 速度很慢,可以在微软的应用商店搜索,并且安装这个工具,解决 GitHub 的网络问题。
给这个 token 随便起个名字,这里的权限注意把 repo 勾选上,找到最下面 generate token,把生成的 token 复制下来,填到软件里面。
NoteGen 为我们自动创建了一个仓库,把笔记内容都同步了进来。这个仓库显示 private,也就是私有仓库,只有自己才能看到。而且在 GitHub 这边也能直接查看笔记内容。我在一个笔记里面加两行,由于笔记内容都是通过 Git 管理起来的,所以我们每次更改都会有提交记录。在右下角找到历史记录,可以看到最新一次的提交内容。在 GitHub 网站这里的 history,也可以同步看到历史的改动记录。
项目地址官方网站: notebooklm.google (GitHub 示例: GoogleCloudPlatform/vertex-ai-creative-studio)

第四款工具:PDFMathTranslate(PDF 翻译工具)

PDFMathTranslate 是一个开源免费的 PDF 翻译工具。这个工具的最大特点是翻译前后的布局一致,完整地保留了公式、图表、目录、注释等结构化的信息。项目接入多种翻译工具,提供了简单易用的 UI 界面。
我们来到项目的 GitHub 首页,往下找有一个 online service,点击这个在线使用,然后把想要翻译的论文添加进来。翻译 20 页,点击开始。我们看一下效果。这个测试论文的排版非常复杂,里面有很多的图表、公式,翻译过来完美还原了布局,包括对应的公式、图表、图说,跟上面的原文布局几乎一模一样,非常的专业。
项目地址GitHub: Byaidu/PDFMathTranslate

第五款工具:Cherry Studio(全能 AI 客户端)

Cherry Studio 是一个全能的、开源、免费的 AI 客户端,支持本地知识库、联网搜索、MCP、图片、附件等各种高级功能。本期视频篇幅有限,我们只看一个使用案例。
ChatGPT、Gemini、Claude 是当今市面上最强的三个 AI 模型,合称御三家。我们把它接入同一个对话窗口。打开软件以后,左下角找到设置模型服务,选择 OpenRouter。这是一个 AI 大模型的 API 聚合平台,点击这里获取密钥。这个平台在国内网络是可以直连的。
我们点击创建 API Key,随便起个名字,然后把 API Key 复制下来,粘贴到配置里。我们可以在 OpenRouter 搜索想要的模型,比如这里我搜索 Claude Sonnet 4,把模型的名字复制一下,添加模型 ID,搜索 free,还可以查到一些免费的模型。比如 DeepSeek v,添加进来、ChatGPT 5 添加进来,Gemini 2.5 Pro 添加进来。
我们回到对话,就可以一键切换这些最强的几个 AI 大模型。
项目地址GitHub: CherryHQ/cherry-studio

结尾

本期视频我们介绍了五款开源的 AI 知识类工具,还有他们之间组合起来的各种玩法。感谢大家的点赞支持,我们下期再见。

No comments

公司简介

 

自1996年以来,公司一直专注于域名注册、虚拟主机、服务器托管、网站建设、电子商务等互联网服务,不断践行"提供企业级解决方案,奉献个性化服务支持"的理念。作为戴尔"授权解决方案提供商",同时提供与公司服务相关联的硬件产品解决方案。
备案号: 豫ICP备05004936号-1

联系方式

地址:河南省郑州市经五路2号

电话:0371-63520088

QQ:76257322

网站:800188.com

电邮:该邮件地址已受到反垃圾邮件插件保护。要显示它需要在浏览器中启用 JavaScript。