- Remplace la table trop large par une carte de révision centrée
- Une paire à la fois : noms wrappés, score, prix moyens
- Valider/Rejeter via fetch() sans rechargement de page
- Passage automatique à la paire suivante après chaque action
- Compteurs mis à jour en temps réel (en attente/validées/rejetées)
- Message de fin avec lien vers /compare quand tout est traité
- Ajout tests pytest pour la page /matches
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
fetch_unnormalized() remonte maintenant la colonne `unit` (ex: "250 g",
"20 sachets"). Le normaliseur concatène name_raw + unit avant d'envoyer
au LLM, qui peut ainsi placer le poids dans le champ format.
Résultat : "Haribo dragibus" → "Dragibus | Haribo | 250g"
au lieu de "Haribo dragibus" → "Dragibus | Haribo | -"
Améliore aussi la qualité du fuzzy matching Picnic ↔ Leclerc.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
Problème : email.policy.default + get_content() décode déjà les accents
(=C3=A9 → é), puis picnic._decode_and_parse() les re-encode en ASCII
avec errors="replace" → les accents devenaient "?" → date introuvable.
Solution : utiliser l'ancienne API email.message_from_bytes() sans policy
et get_payload(decode=False) pour récupérer le corps brut encore QP-encodé,
exactement comme un fichier .html sauvegardé depuis le mail.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
Support .eml :
- pipeline._eml_to_html() extrait le HTML des emails Picnic
- Déposer un .eml dans inbox/picnic/ fonctionne comme un .html
- Pas de nouvelle dépendance (module email stdlib)
- 5 tests ajoutés (test_eml.py)
Correction fuzzy matching :
- Le score est maintenant calculé sur le nom seul (avant " | ")
- Évite que les différences de marque/poids pénalisent le score
- Résultat : 8 paires trouvées vs 0 avant la correction
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
Nouvelle table product_matches (status: pending/validated/rejected).
Matching via RapidFuzz token_sort_ratio, seuil configurable (défaut 85%).
Workflow :
1. python -m tickettracker.cli match [--threshold 85]
→ calcule et stocke les paires candidates
2. http://localhost:8000/matches
→ l'utilisateur valide ou rejette chaque paire
3. La comparaison de prix enrichie avec les paires validées
Nouvelles dépendances : rapidfuzz, watchdog (requirements.txt).
10 tests ajoutés (test_matcher.py), tous passent.
Suite complète : 129 passent, 1 xfail, 0 échec.
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
- Ajout venv Python (.venv) avec pip bootstrap (python3-venv absent)
- Correction OCR Linux : marqueur TTC/TVA tolère la confusion T↔I
(Tesseract 5.3.4 Linux lit parfois "TIc" au lieu de "TTC")
- test_leclerc.py : skipif si Tesseract absent, xfail pour test de somme
(précision OCR variable entre plateformes, solution LLM vision prévue)
- Résultat : 77 passent, 1 xfail, 0 échec (vs 78 sur Windows)
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>