Google migliora la sintesi vocale in Wear OS, ma con un limite

8 months ago 131

Il vostro smartwatch Wear OS dovrebbe parlare meglio da oggi, o almeno per le app che lo implementano, grazie a una novità annunciata da Google (sapete come scaricare WhatsApp su Wear OS)?.

La GrandeG ha infatti pubblicato sulle pagine blog della piattaforma dedicata agli sviluppatori un aggiornamento al suo motore di sintesi vocale (text-to-speech, TTS) su Wear OS 4 e superiore. 

La sintesi vocale trasforma il testo in un audio dal suono naturale in più di 50 lingue, ed è alimentato dalla tecnologia di apprendimento automatico (ML) di Google. Il nuovo motore utilizza modelli ML di prosodia (ovvero che controllano tratti come l'accento, il tono, la giuntura, l'intonazione, il ritmo e altro) più piccoli ed efficienti per portare una sintesi più rapida sui dispositivi Wear OS.

La novità dovrebbe quindi rendere la sintesi vocale più veloce e affidabile, in quanto è stata ottimizzata "per essere performante e affidabile su dispositivi a bassa memoria". Il riferimento è ovviamente a dispositivi con 2 GB di RAM, come Pixel Watch e Galaxy Watch 6 di Samsung.

La GrandeG spiega che la sintesi vocale è pronta in circa 10 secondi dall'avvio dell'orologio, anche se è possibile farla partire immediatamente per alcuni casi specifici pre-caricandolo con un codice apposito (fornito da Google). 

Nell'immagine di sistema di Wear OS trovate sette lingue pre-caricate: inglese, spagnolo, francese, italiano, tedesco, giapponese e cinese mandarino, ma quelle supportate come anticipato sono più di 50 e i vari produttori possono scegliere quelle che preferiscono. In ogni caso, quando viene selezionata una lingua di sistema diversa durante l'installazione, l'"orologio scarica automaticamente il file vocale corrispondente la prima volta che l'utente si connette al Wi-Fi".

Google note che le API sono rimaste invariate, quindi gli sviluppatori non devono modificare il processo per integrarle in un'app Wear OS. A questo punto la sintesi vocale su Wear OS diventa più utile in situazioni come i servizi di accessibilità, istruzioni delle app di fitness, segnali di navigazione e lettura ad alta voce degli avvisi in arrivo.

La funzione può operare attraverso l'altoparlante dell'orologio o cuffie collegate a Bluetooth, ma c'è un limite. Google osserva infatti come il motore di sintesi vocale sia "inteso per brevi interazioni" e non per "leggere ad alta voce un lungo articolo o un lungo riassunto di un podcast".

Su alcuni dei link inseriti in questa pagina SmartWorld ha un'affiliazione ed ottiene una percentuale dei ricavi, tale affiliazione non fa variare il prezzo del prodotto acquistato. Tutti i prodotti descritti potrebbero subire variazioni di prezzo e disponibilità nel corso del tempo, dunque vi consigliamo sempre di verificare questi parametri prima dell’acquisto.

Read Entire Article