Ollama-图片批量分析器文档
概述
基于本地Ollama视觉模型的智能图片分析系统,支持单文件和批量处理,提供任务队列管理和实时状态监控。
核心功能
1. 智能图片分析
- 支持多种图片格式:JPG、JPEG、PNG、BMP、GIF、WebP
- 基于Ollama本地视觉模型进行AI分析
- 自定义分析提示词,灵活控制分析内容
- 图片自动压缩优化,支持512px/768px/1024px三种尺寸
2. 任务队列管理
- 优先级队列系统:单独分析任务优先于批量任务
- 文件状态管理:待处理→队列中→处理中→已完成/失败
- 工作线程自动处理,支持1-2个并发任务
- 状态持久化,程序重启后自动恢复
3. 文件管理
- 文件列表实时显示和状态更新
- 支持单选/全选文件进行批量操作
- 文件格式筛选,勾选后自动应用
- 图片预览功能,点击图标即可查看
4. 结果展示
- 左右分栏布局:左侧图片预览,右侧分析文本
- 实时查看分析结果,支持错误信息显示
- 处理时间和使用模型信息记录
- 支持重新分析单个文件
5. 数据导出
- Excel格式导出,包含完整分析报告
- 中文列标题:文件名、状态、分析结果、处理时间等
- 数据格式化:文件大小自动转换单位,状态中文显示
- 统计信息:成功/失败数量汇总
启动参数
| 参数名 | 类型 | 描述 |
|---|
| work_directory | 目录选择 | 包含图片的工作文件夹 |
| server_port | 整数 | Web界面端口(12000-65535) |
| auto_open_browser | 开关 | 是否自动打开浏览器 |
| default_prompt | 多行文本 | 默认分析提示词 |
使用流程
1. 环境准备
- 确保Ollama服务运行:
ollama serve
- 下载视觉模型:
ollama pull llava:latest
- 将待分析图片放入工作目录
2. 基本操作
- 连接配置:设置Ollama服务地址,测试连接状态
- 模型选择:自动检测视觉模型,选择合适的AI模型
- 文件管理:查看文件列表,选择需要分析的图片
- 参数设置:配置分析提示词和处理参数
- 开始分析:批量处理或单文件重新分析
- 查看结果:实时监控状态,查看分析结果
- 导出报告:生成Excel格式的分析报告
3. 高级功能
- 格式筛选:实时调整支持的图片格式
- 状态恢复:程序重启后自动恢复未完成任务
- 优先处理:单独重新分析的文件优先处理
- 错误重试:失败的文件可重新添加到队列
技术特性
架构设计
- 任务队列模式,支持优先级调度
- 多线程处理,工作线程与UI线程分离
- 状态持久化,数据不丢失
- RESTful API设计,前后端分离
性能优化
- 图片智能压缩,减少网络传输
- 模型检测缓存,加快启动速度
- 文件状态缓存,减少磁盘IO
- 连接异常处理,提高稳定性
用户体验
- 右上角悬浮消息提示
- 响应式设计,适配不同屏幕
- 实时状态更新,无需手动刷新
- 现代化UI设计,操作直观
故障排除
常见问题
- 连接失败:检查Ollama服务是否启动
- 模型不识别:确认已下载视觉模型
- 分析失败:检查图片格式和网络连接
- 结果为空:确认提示词设置正确
系统要求
- Python 3.11.0+
- Windows 11
- Ollama服务
- 支持视觉的AI模型(如llava、moondream等)
版本信息
- 当前版本:1.0
- 支持的kuai格式:1.0
- 依赖库:pandas、openpyxl、Pillow、requests