Interpretazione delle immagini con l’IA per guidare la creatività
Esploriamo come viene addestrato Luminar AI, cosa "vede" e come utilizza tali informazioni.
Qualche giorno fa, si è tenuto il nostro primo webinar per la community di Insider di LuminarAI. Una delle questioni principali sollevate dalla community è il fatto che l’Intelligenza Artificiale (IA) si occuperà di prendere tutte le decisioni, di fatto sostituendosi alle scelte creative del fotografo.
Settimana scorsa, Alex ha suggerito di pensare all’IA non tanto come una sostituta delle persone, quanto come un apprendista preparato che supporta e promuove la creatività umana. Tenendo questo a mente, potrebbe essere utile parlare di come LuminarAI fa proprio questo.
L’intelligenza inizia con la formazione
Proprio come un bambino, un nuovo sistema di IA è pieno di potenziale ma non ha esperienza o conoscenze a sufficienza per sfruttarlo al massimo. Per liberare questa intelligenza, un sistema di IA deve ricevere insegnamenti e istruzioni.
Per istruire LuminarAI, Skylum ha creato un’imponente raccolta di fotografie incentrata su tre collezioni principali:
- Immagini di creatori iconici lungo tutta la storia della fotografia.
- Immagini fotorealistiche generate da motori 3D.
- Immagini commissionate da creatori moderni per illustrare principi specifici.
Le immagini di creatori iconici hanno insegnato all’IA la storia visiva della fotografia, fornendo esemplari di forme fotografiche. Ciò ha aiutato la nostra IA ad apprendere come riconoscere una fotografia eccezionale.
Le immagini 3D hanno insegnato all’IA la prospettiva, la profondità di campo e i rapporti tra gli elementi della foto. Ciò ha aiutato la nostra IA a comprendere come suddividere una fotografia in singoli componenti in uno spazio 3D.
Le immagini commissionate hanno rinforzato le lezioni derivanti dalle prime due collezioni, introducendo anche errori comuni di composizione, messa a fuoco ed esposizione, tra le altre cose. Ciò ha aiutato la nostra IA a comprendere come riconoscere e correggere questi errori.
Questi elementi si sono uniti nel nostro modello di IA, dando così alla luce ad un’intelligenza funzionale.
Implementazione dell’IA per liberare il creatore
I creatori passano attraverso un processo formativo simile per padroneggiare la fotografia. Un’IA funzionante quasi certamente si intreccia con le abilità tecniche del creatore. E in questo intrecciarsi, è in grado di sostituire i passaggi nelle procedure di editing tecniche.
Come Alex ha scritto settimana scorsa, però, noi di Skylum riteniamo che questa particolare sostituzione debba essere un valore, non un problema. L’enfasi della nostra IA è sulla sostituzione di passaggi tecnici ripetitivi, non di quelli creativi.
Il creatore, in primo luogo, deve comunque dare fondo a tutto il proprio acume tecnico per catturare delle belle immagini. L’IA offre semplicemente la possibilità di apportare aggiustamenti in modo rapido ai problemi più comuni e presenta una varietà di scelte creative pensate per far emergere il meglio da ogni immagine. Il creatore mantiene il controllo totale sul risultato finale.
Dunque, in che modo l’IA compie le sue scelte?
Interpretazione alla ricerca di opzioni
Quando LuminarAI carica un’immagine, mette al lavoro la propria IA dalle mille risorse, che inizia ad analizzare l’immagine stessa per decidere cosa si può fare per farla apparire al meglio. Diamo un’occhiata ad un esempio.
Quest’immagine image è già tutto sommato bella, ma c’è spazio per migliorarla. Non appena apre l’immagine, LuminarAI inizia ad analizzarla. Come risultato di questa analisi, LuminarAI viene a conoscenza delle seguenti caratteristiche:
- Contiene cinque animali (e forse un sesto).
- Il probabile sesto animale è molto diverso dagli altri cinque.
- La tavolozza dei colori è su toni caldi e arancioni.
- Ha una linea dell’orizzonte definita.
- Ha una macchia luminosa più o meno circolare che probabilmente è il sole.
- Data la tavolozza dei colori e la posizione del sole vicino all’orizzonte, si tratta probabilmente di una foto fatta al tramonto.
- All’interno dello spazio 3D, gli elementi sono posizionati come segue:
- Primo piano: cinque animali simili
- Piano di mezzo: sesto “animale” anomalo
- Sfondo: sole e montagne
Inserisci i Modelli
Una volta che avrà completato la sua analisi, LuminarAI deve fare qualcosa con le conoscenze che ha ricavato dalla stessa. È qui che entrano in gioco i Modelli.
I Modelli vanno oltre i preset e includono una serie di correzioni e miglioramenti per ottenere un risultato quasi finale. I Modelli sono opportunamente indicizzati, affinché l’IA vi possa accedere facilmente una volta completata l’analisi.
Nel nostro esempio, l’IA procede così:
- Ove necessario, l’IA utilizza le informazioni raccolte per creare una serie di selezioni e mappe di profondità.
- L’IA utilizza i data point raccolti sull’immagine e li confronta con gli indici dei Modelli disponibili.
- LuminarAI presenta poi i Modelli scelti dall’IA, sotto forma di opzioni che il fotografo può prendere in considerazione.
- Spostando il mouse sopra un Modello suggerito, questo viene applicato in tempo reale all’immagine. I Modelli utilizzano le selezioni e le mappe di profondità che l’IA ha creato in precedenza per applicare le modifiche e apportare miglioramenti a elementi piuttosto specifici all’interno dell’immagine.
- Il fotografo seleziona poi il Modello desiderato e apporta ulteriori modifiche, in modo tale che la foto rifletta la propria visione. In molti casi, questa si può raggiungere con un solo slider, che regola l’intensità del Modello.
Il risultato di questa procedura è un’immagine radicalmente differente, che meglio riflette la visione e lo stile del fotografo.
Un attimo. Ma questo non sostituisce il creatore?
No.
Il fotografo comunque deve catturare la foto “grezza”, non modificata. Una volta analizzata questa foto, LuminarAI presenta i Modelli che si ritiene possano far emergere il meglio della foto stessa. Il fotografo, poi, può scegliere il Modello che più si adatta alla propria visione, oppure non scegliere alcun Modello e lavorare direttamente nel modulo Modifica. Anche se effettivamente sceglie un Modello, il fotografo può comunque apportare ulteriori modifiche per ottenere il risultato finale.
L’IA trova semplicemente delle opzioni, che l’artista può prendere in considerazione, utilizzando le proprie conoscenze sull’immagine stessa e le regole tecniche che definiscono una buona immagine.
Tutte le scelte creative rimangono in capo all’artista.