# Parser HTML (mails Picnic)
beautifulsoup4==4.12.3
lxml==5.3.0

# Parser PDF (tickets Leclerc)
pdfplumber==0.11.4
pytesseract>=0.3.10    # binding Python pour Tesseract OCR
Pillow>=10.0           # manipulation d'images (extraction JPEG du PDF)

# LLM (appels API OpenAI-compatible)
requests>=2.31

# Web (dashboard FastAPI)
fastapi>=0.115
uvicorn[standard]>=0.30
jinja2>=3.1
python-multipart>=0.0.12
httpx>=0.27          # requis par TestClient FastAPI

# Watch folder (surveillance inotify Linux / FSEvents macOS)
watchdog>=4.0

# Fuzzy matching (Levenshtein/ratio pour rapprocher produits Picnic/Leclerc)
rapidfuzz>=3.9

# Tests
pytest==8.3.4

# Note : Tesseract OCR (binaire C++) doit être installé séparément :
#   Windows : https://github.com/UB-Mannheim/tesseract/wiki
#   Linux   : apt install tesseract-ocr tesseract-ocr-fra
# Le modèle français (fra.traineddata) est requis.
# Sans droits admin, créer un dossier tessdata/ à la racine du projet :
#   tessdata/fra.traineddata  (14 Mo, téléchargeable sur github.com/tesseract-ocr/tessdata)
#   tessdata/eng.traineddata  (copié depuis l'install Tesseract)