Midjourney arriva alla versione V6. E cambia di nuovo i giochi

11 months ago 236

Nel mondo dei chatbot di intelligenza artificiale (IA) per la creazione di immagini, Midjourney merita un posto d'eccezione, e l'ultimo aggiornamento, che porta lo strumento alla versione V6, ribadisce un concetto: i concorrenti devono inseguire.

Perché? Prima di tutto il realismo: secondo il fondatore David Holz, Midojurney V6 rappresenta il terzo modello addestrato da zero sui loro "supercluster" di dati, e ci sono voluti nove mesi per addestrarlo. 

Ma c'è un'altra caratteristica estremamente importante: le scritte. Gli strumenti IA per la generazione di immagini normalmente hanno problemi a elaborare i testi (date un'occhiata alla nostra prova di Immagina con Meta per farvi un'idea). Con Midjourney V6 il problema non è completamente alle spalle, ma quantomeno attenuato e si riescono a mostrare dei testi leggibili (un po' come V5 era riuscito a risolvere la questione mani con cinque dita, un altro aspetto che i chatbot IA faticano a comprendere).

Nel complesso, ecco le nuove funzionalità di V6:

  • Segue i prompt in maniera molto più accurata e riesce a gestire prompt più lunghi
  • Coerenza e conoscenza del modello migliorate
  • Prompt e remix delle immagini migliorati
  • Capacità minori di disegno del testo (è necessario scrivere il testo tra "virgolette" e utilizzare valori --style come raw o inferiori, inoltre valori --stylize possono aiutare). Per esempio: "/imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6"
  • Upscaler migliorati, con modalità sia "subtle" che "creative" (aumenta la risoluzione di 2x)"

Holz ha inoltre dichiarato che hanno lavorato molto sul prompt (il testo che dovete inserire per specificare al modello cora volete che crei), sviluppando un metodo completamente nuovo.

Per ottenere risultati migliori con questi strumenti, è infatti necessario essere estremamente precisi, e ci sono pagine e pagine di tutorial dove si spiega come inserendo termini come i nomi delle fotocamere (ad esempio Leica M11), della pellicola (35 mm) e la risoluzione (8k), si riescono a ottenere risultati fotorealistici o cinematografici di alta qualità.

Ora cambia tutto, tanto che Holz ha dichiarato esplicitamente "Dovrete imparare di nuovo a scrivere un prompt". Con V6 il prompt è infatti molto diverso, in quanto V6 è MOLTO più sensibile. Questo significa che bisogna evitare termini ("spazzatura" è la parola usata dal fondatore del progetto) come "premium, fotorealistico, 4K, 8K". 

Se si vuole qualcosa di più fotografico/ o realistico, bisogna utilizzare per impostazione predefinita --style raw. Valori più bassi di --stylize (default 100) possono avere una migliore comprensione mentre valori più alti (fino a 1000) possono avere un'estetica migliore.

Il nuovo modello è in test alfa e infatti non è abilitato per impostazione predefinita, inoltre manca ancora di alcune funzioni disponibili nella V5.2, come la panoramica a sinistra e a destra e lo zoom indietro, ma Holz ha detto che questi arriveranno ​​negli aggiornamenti successivi.

Chi l'ha provato ha opinioni contrastanti. C'è chi è rimasto sbalordito e chi non ha rilevato sostanziali miglioramenti rispetto alla generazione precedente.

Ma probabilmente è una questione di come si imposta il prompt (in fondo all'articolo trovate un confronto con tutte le versioni del modello).

Ma come attivare Midjourney V6? Come al solito, dovete andare sul server Discord del progetto (dal sito è disponibile in versione alfa per pochi), tenendo presente che lo strumento è solo a pagamento. 

A questo punto dovrete digitare il comando /settings nel server Discord o in un messaggio diretto (DM) al bot Midjourney e quindi utilizzare il menu a discesa in alto per selezionare V6. Oppure potete semplicemente digitare --v 6 in fondo al prompt.

Read Entire Article