mcp>=1.0.0
toml>=0.10.0
python-docx==1.2.0
chardet==5.2.0
jieba==0.42.1
aiohttp==3.11.10
sqlite-vec==0.1.6
PyMuPDF==1.26.6
pyyaml==6.0.1
paddleocr==2.9.1
paddlepaddle==2.6.2
opencv-python==4.9.0.80
numpy==1.26.4
py-cpuinfo==9.0.0
# 新增解析器依赖包
# 用于解析各种文档格式
# HTML 解析
beautifulsoup4>=4.9.0
# Markdown 解析
markdown>=3.3.0
# PowerPoint 解析
python-pptx>=0.6.21
# Excel/CSV 解析
pandas>=1.3.0
openpyxl>=3.0.9
xlrd>=2.0.1
# 深度 PDF 解析（OCR 表格检测）
scikit-learn>=0.24.0
# 图片处理（如需要）
Pillow>=8.0.0
# HTTP 请求（用于下载在线图片）
requests>=2.25.0
# DOC 文件解析（旧版 Word 格式）
tika>=2.6.0
SQLAlchemy==2.0.39
tiktoken==0.12.0