Computer Vision: La Vista dell'AI
Come l'AI vede e analizza immagini
📌Convolutional Neural Networks
CNN (Convolutional Neural Networks) sono specializzate per le immagini. Invece di guardare ogni pixel individualmente, usano "filtri" che scansionano piccole aree dell'immagine. Un filtro potrebbe cercare linee verticali, un altro linee orizzontali, un altro curve. I layer iniziali trovano feature semplici (angoli), i layer profondi trovano feature complesse (occhi, nasi, volti). Prima del deploy testa condizioni reali come luce, angoli e qualita camera per evitare regressioni fuori laboratorio. Nota pratica: applica il concetto in un mini scenario reale prima del deploy. Takeaway: Testa in condizioni reali, non solo su dataset da laboratorio.
🖼️ Infografica
In arrivoMini infografica con schema e parole chiave della sezione.
media/ch07-computer-vision/sec-01/infographic.png
📌Riconoscimento di Oggetti
- immagine entra come matrice di pixel,
- filter CNN estraggono feature in modo gerarchico,
- alla fine, il modello produce probabilità per ogni classe. Esempio: "Riconosco un cane con 95% probabilità, un gatto con 3%, nient'altro con 2%". Ma il sistema può sbagliare: una foto sfocata, un cane in posa strana, condizioni di luce scarsa — questi sono gli edge case che confondono l'AI. Prima del deploy testa condizioni reali come luce, angoli e qualita camera per evitare regressioni fuori laboratorio. Nota pratica: applica il concetto in un mini scenario reale prima del deploy. Takeaway: Testa in condizioni reali, non solo su dataset da laboratorio.
🖼️ Infografica
In arrivoMini infografica con schema e parole chiave della sezione.
media/ch07-computer-vision/sec-02/infographic.png
🎯 Punti Chiave
- •Immagine = griglia di pixel (numeri)
- •CNN usa filtri per estrarre feature
- •Più layer = feature sempre più astratte
- •Transfer learning accelera il training
- •Learning outcome: valutare un caso vision e identificare almeno un edge-case critico
💬 Discussione in Aula
- •Perché le CNN funzionano meglio rispetto alle reti neurali normali per le immagini?
- •Quali situazioni potrebbero ingannare un sistema di riconoscimento di oggetti?
- •Come potrebbe il "Transfer Learning" risparmiare tempo nel training di un nuovo modello?
Media del Capitolo
0/4 prontiGli slot con media reale non sono più placeholder; gli altri restano placeholder finché non carichiamo i file.
🎬 Video
In arrivoSpiegazione visuale del capitolo (8-12 min) con esempi pratici.
Durata target: 8-12 min
Path previsto: media/ch07-computer-vision/video.mp4
🎙️ Podcast
In arrivoVersione audio con casi reali, errori comuni e takeaway operativi.
Durata target: 10-15 min
Path previsto: media/ch07-computer-vision/podcast.mp3
🖼️ Infografica
In arrivoSintesi visuale: 5 punti chiave, 1 warning, 1 mini framework.
Path previsto: media/ch07-computer-vision/infographic.png
📄 Risorsa
In arrivoMateriale scaricabile per studio e esercitazione guidata.
Path previsto: media/ch07-computer-vision/handout.pdf
💻 Code Snippets
Classificazione immagini con CNN (PyTorch)
python
🧠 Quiz del Capitolo
1. CNN in vision usa?
2. Transfer learning in vision?
3. Edge case vision esempio?