fetch_unnormalized() remonte maintenant la colonne `unit` (ex: "250 g",
"20 sachets"). Le normaliseur concatène name_raw + unit avant d'envoyer
au LLM, qui peut ainsi placer le poids dans le champ format.
Résultat : "Haribo dragibus" → "Dragibus | Haribo | 250g"
au lieu de "Haribo dragibus" → "Dragibus | Haribo | -"
Améliore aussi la qualité du fuzzy matching Picnic ↔ Leclerc.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
- Ajout venv Python (.venv) avec pip bootstrap (python3-venv absent)
- Correction OCR Linux : marqueur TTC/TVA tolère la confusion T↔I
(Tesseract 5.3.4 Linux lit parfois "TIc" au lieu de "TTC")
- test_leclerc.py : skipif si Tesseract absent, xfail pour test de somme
(précision OCR variable entre plateformes, solution LLM vision prévue)
- Résultat : 77 passent, 1 xfail, 0 échec (vs 78 sur Windows)
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>