Ollama-文档批量分析器
基于Ollama的文档批量AI分析工具,支持TXT、Word、Excel、Markdown等格式的智能内容分析。
系统要求
- Python 3.11+
- Windows 11
- Ollama服务(本地运行)
依赖包
pandas
openpyxl
python-docx
requests
markdown
快速开始
1. 环境准备
安装Ollama
# 访问 https://ollama.ai 下载安装
# 启动Ollama服务
ollama serve
下载模型
# 推荐模型
ollama pull llama3.1
ollama pull qwen2.5
ollama pull gemma2
2. 启动程序
- 在kuai客户端中运行脚本
- 设置工作目录(包含要分析的文档)
- 配置服务端口(默认12889)
- 启动后自动打开Web界面
3. 基本使用
连接配置
- 确认Ollama服务地址(默认localhost:11434)
- 选择AI模型
- 设置分析提示词
文件管理
- 系统自动扫描工作目录
- 选择要分析的文档
- 支持格式筛选
开始分析
- 批量分析:选中多个文件后点击"开始分析"
- 单独分析:点击文件的"重新分析"按钮
- 实时查看进度和状态
查看结果
- 点击"查看结果"按钮
- 左侧显示文档预览
- 右侧显示AI分析结果
- 支持导出Excel报告
支持格式
| 格式 | 扩展名 | 默认启用 |
|---|
| 文本文件 | .txt | ✓ |
| Markdown | .md | ✓ |
| Word文档 | .docx | ✓ |
| Excel表格 | .xlsx | ✓ |
| 旧版Excel | .xls | - |
| 旧版Word | .doc | - |
核心功能
任务队列系统
智能文档读取
结果管理
导出功能
界面说明
左侧设置面板
- Ollama连接状态
- 模型选择
- 分析参数配置
- 文档格式筛选
右侧文件管理
状态标识
- 灰色:待处理
- 蓝色:队列中
- 黄色:处理中(闪烁)
- 绿色:已完成
- 红色:失败
使用技巧
提示词优化
针对不同文档类型设计专门的分析提示词:
- 技术文档:重点分析技术要点、实现方法
- 商业文档:关注策略、数据、结论
- 学术论文:提取研究方法、主要发现
批量处理
- 建议单次处理不超过20个文件
- 大文档适当增加超时时间
- 定期查看处理进度
性能优化
- 使用较小的模型处理简单文档
- 限制文档字符数避免超时
- 并发数量根据机器性能调整
故障排除
连接问题
- 确认Ollama服务正常运行
- 检查端口是否被占用
- 验证模型是否已下载
分析失败
性能问题
- 减少并发处理数量
- 使用更小的模型
- 清理历史状态文件
注意事项
- 数据安全:所有处理均在本地进行,不会上传数据
- 文件备份:建议处理前备份重要文档
- 模型选择:根据文档复杂度选择合适的AI模型
- 资源占用:大批量处理时注意系统资源使用情况
技术支持
遇到问题可通过以下方式解决:
- 查看控制台错误日志
- 检查工作目录权限
- 重启Ollama服务
- 清空状态文件重新开始