Procédure de scraping Amazon.fr

Objectif

Extraire les champs requis (prix, stock, note, badges, image) sans casser le pipeline si un champ manque.
Produire un snapshot propre + artefacts de debug si blocage.

Initialiser le navigateur
- Chromium, locale fr-FR, timezone Europe/Paris, viewport réaliste.
- user-agent défini dans la config.
Charger la page produit
- Délai aléatoire 1–3s entre requêtes.
- Timeout contrôlé.
Détecter blocage/captcha
- Si captcha / robot-check :
  - Marquer scrape_status = blocked.
  - Sauvegarder screenshot + page.content() dans backend/data/screenshots.
  - Log détaillé + retour sans crash.
Extraire les champs
- Priorité aux IDs stables (ex: #productTitle, #acrCustomerReviewText, #availability).
- Prix : gérer variantes (prix fractionné, promo).
- Champs optionnels : si absent → null + log "missing field".
Normaliser les valeurs
- Prix : "249,99 €" → 249.99.
- Notes : "4,7 sur 5" → 4.7.
- Stock : in_stock booléen + texte brut.
Sauvegarder le snapshot
- Insérer un enregistrement product_snapshots.
- Écrire un JSON raw dans backend/data/raw/YYYY-MM/....

url, asin, title, image_main_url, price_current, stock_status, rating_value, rating_count.

price_list, discount_percent, lowest_30d_price, amazon_choice, limited_time_deal, prime_eligible, amazon_exclusive.