LLM ultra-léger optimisé pour Raspberry Pi 5 — Rust + Candle + Axum + Yew, avec moins de 3 Go de RAM et des réponses en 3–8 s sans GPU.