2026年3月AI工具使用小结与个人项目复盘
一、模型背景
- Copilot 教育版:3月突然降级了。原本 Copilot 教育版支持 Opus 4.6,三月初突然被砍掉,只能用 Haiku 4.5 或 Codex 5.3。体验降级比较明显。
- ChatGPT Plus:gpt-5.4 fast 版本,速度很快,很丝滑。但 token 消耗也会加快。
- GLM-5.1:一月份包季购买了智谱最便宜的 Lite 套餐,花了 40 多块。最近套餐快到期了,到期之后 GLM 4.7 换成了 GLM 5.1,5.1 版本效果比之前好,但使用机会不多了。
- MiniMax M2.7:一个多月内从 M2.1 升级到 M2.7,能力逐渐增强,性价比高,包年 200 元。目前作为 OpenClaw 主力模型使用,但在 Agents 执行方面有所欠缺。
二、个人项目
WeMath2MD
这个项目三年前就有想法了。当时微信公众号里数学类文章大量采用图片拼接排版,把图片型文章转化为 Markdown 非常麻烦。现在有了 AI OCR,这个过程变得很方便。
实现方式:在终端输入 WeMath2MD 命令并附上微信公众号链接,自动调用 MinerU API 下载图片和解析,最终将 OCR 结果汇总成 Markdown 文件,图片以 Markdown 外链形式嵌入文档。
Gikz
Gikz 的起点是一个 B 站视频 GeoTikTirm,看了之后开始思考 Geogebra GGB 导出代码清洗的问题。
Gikz 是一个清洗 Geogebra GGB 导出代码的工具,有在线网页版,可以把复杂凌乱的代码清洗成简洁好看的代码。同时发布了 npm 包,全局安装后可在任意位置直接使用。这个项目也开启了 tsqx 的探索之路。
tsqx
tsqx 是 Asymptote 代码的一种简化版本,更适合绘制平面几何图形。相比 TikZ,声明图形关系的方式更直观。
这也是再次探索 Evan Chen 主页的产品——他讲义中大量使用 Asymptote 或 tsqx 来画几何图。
目前 tsqx 已经发布了三样东西:
- 说明书(中英文)
- VS Code 扩展(类似 LaTeX Workshop,有编译和预览功能)
- Skill(可在 OpenClaw, cc, Codex 中调用)
GeoGebra-MCP-Server
受 MathOver 视频启发,我对开源的 GeoGebra MCP 项目 (Gebrai) 进行样式调整和重命名,也发布了 npm 包,可以在 cc, Codex 等工具中调用。
这验证了一个思路:通过 Coding Agents 的 CLI 调用工具链来生成 GGB 文件是可行的。B 站上那位 up 主上线了商业化应用,但需要配置服务器、管理账户和缓存数据,部分功能还需付费订阅(甚至 BOYK 模式)。
Von 题库
先是 B 站给我推这个视频:奇思妙想LaTeX 题库。然后我发现 Evan Chen 的 Von 题库功能很强,可以方便地组卷和引用题目。我计划将题库镜像成 Markdown 的 Obsidian vault,后续接入 Agents 自动化流程。
三、OCR 之后可以做什么
用 Mistral OCR 将 PDF 扫描版书籍或文章在 30 秒左右转化成 Markdown,免费、速度快、准确率高。有错误的地方交给 Codex 或 Claude Code 修复结构和语法。在 Obsidian 里预览,配合内置 Copilot 或 Obsidian Skill 做笔记、总结内容。
一个实际例子:用 Mistral OCR 转化了一本数论书籍的 PDF 扫描版,然后用 Codex 修复了部分符号问题,最后在 Obsidian 里总结欧拉函数的证明写成小讲义。
四、工作中的应用
学生数据库
用 OpenClaw / Claude Code / Codex 结合飞书或 Notion 搭建学生数据库,可以将学生成绩表格以结构化形式放入飞书多维表格或 Notion 中。目前推广给其他老师使用还有难度,但底层逻辑已经跑通了。
Office Skill 套装
用 CC / Codex / MiniMax 等工具操控 Office 文件,生成 docx、xlsx、pptx。
直接用 ChatGPT 生成 LaTeX 小讲义
在 ChatGPT 对话窗口直接生成 LaTeX 源代码,复制到 Overleaf 编译。有时候赶时间,直接让 ChatGPT 生成可编译代码,放 Overleaf 编译。
现在 ChatGPT 可以在后台运行,提供源代码和 PDF 下载链接,不用开电脑,手机就能瞬间生成 PDF 小讲义。
五、其他
Paralex
Vibe Coding 的一个实践:做一个原生 macOS 应用,实现双语对照翻译功能,用于查看英文论文和 PDF。
用 Xcode 开发,左边导入 PDF,右边进行 OCR 和翻译,可以翻译成不同语言,提供下载原文、译文及原文加译文的功能。虽然还无法投入生产,但展示了想法落地的过程。