La fotocamera basata su AI di Google era destinata a fallire
Un programma non può dire cosa sia “interessante”

Google ha appena staccato la spina della sua fotocamera Clip, un piccolo dispositivo che avrebbe dovuto catturare le foto dei piccoli frammenti della vostra giornata che altrimenti scivolare da.
Forse scattava una foto del tuo bambino che sorrideva mentre andavi a prenderli, o il tuo cane che scodinzolava mentre camminavi sulla porta. Ma quando i revisori e i consumatori hanno messo le mani sul dispositivo, quella fiaba non ha funzionato.
“Indossavo la macchina fotografica sul colletto della camicia mentre giocavo con mia figlia sperando che catturasse tutti i suoi sorrisi a 7 settimane. Accesso all’app, niente. Sono stato schiacciato “, ha scritto una recensione sul sito web di Best Buy.
Google ha promesso di utilizzare l’IA per catturare momenti interessanti della nostra vita, e questo era il problema esatto: Non esiste una definizione di interessante.
Come utente, hai dovuto dedicare molto tempo a mostrare a Google di cosa volevi che facesse le foto. L’ anno scorso Cherlynn Low di Engadget ha scritto di aver addestrato l’IA dei Clips sulla sua storia di Google Foto, apparentemente un diario delle sue preferenze visive, e ancora non riusciva a farlo fotografare in modo affidabile il suo cane o i suoi amici.
Sappiamo cosa l’IA è brava a fare: prendere una decisione con una risposta chiaramente corretta. Se c’è un cane in un’immagine, Google può identificarlo. Il cane è un dato di fatto. Ma per Google capire quando il tuo cane sta facendo qualcosa che vuoi vedere di nuovo, come la faccia colpevole che fa dopo aver scavato nella spazzatura, ha bisogno di una tonnellata di informazioni esterne che non saranno le stesse per ogni utente.
In altre parole, l’IA non funziona quando deve quantificare qualcosa di qualitativo. Ciò dipende dal fatto che una persona sia affidabile o meno che una foto sia buona o cattiva.
“Fondamentalmente, stiamo cercando di insegnare l’inglese a un bambino di due anni leggendo Shakespeare invece di ‘Go, Dog. Partire!’ ”
Google inizialmente sperava di correggere questo problema addestrando la fotocamera sulle immagini di fotografi professionisti, in modo che le immagini scattate dalla fotocamera assomigessero all’inquadratura e alla composizione dei professionisti, ma secondo un post del blog di Google del 2018 , che si è rivelato troppo ambiguo di un obiettivo .
“Abbiamo avuto conversazioni romantiche sulla profondità di campo, la regola dei terzi, l’illuminazione drammatica, i tagli delle partite, la narrazione … ma quello che ho imparato è che non dovremmo mai sottovalutare la profonda capacità umana di esercitare il buon senso”, ha scritto il designer di Clips UX Josh Lovejoy. “Fondamentalmente, stiamo cercando di insegnare l’inglese a un bambino di due anni leggendo Shakespeare invece di Go, Dog. Partire! ”
Quindi, invece, i progettisti hanno identificato errori più comuni che la fotocamera avrebbe commesso, come scattare foto cattive che erano sfocate o oscurate, e hanno cercato di ottimizzare la fotocamera in modo che i risultati negativi si verifichino meno spesso.
Ciò ha spostato il lavoro sull’utente. Le clip richiedevano loro di selezionare immagini di alta qualità catturate dalla fotocamera, insegnando così all’intelligenza artificiale che tipo di fotografie erano “corrette”, anche se non c’è garanzia che la fotocamera sapesse perché la fotografia era buona. Invece di utilizzare manualmente la fotocamera quando si scatta la foto, si stava allenando manualmente la fotocamera per scattare una buona foto la prossima volta. È stato un investimento di tempo nella speranza di un ritorno incerto – dopo aver già tossito $ 250 per il dispositivo stesso.
I creatori del dispositivo hanno persino riconosciuto queste carenze.
“Nel contesto della soggettività e della personalizzazione, la perfezione semplicemente non è possibile e in realtà non dovrebbe nemmeno essere un obiettivo. A differenza dello sviluppo di software tradizionale, i sistemi ML non saranno mai “privi di bug” perché la previsione è una scienza innata e confusa “, ha scritto Lovejoy.

Di ihal