Alexa sarà presto in grado di leggere storie nei panni della nonna defunta

In occasione della conferenza annuale re:Mars, tenutasi oggi a Las Vegas, il vicepresidente senior e responsabile scientifico di Amazon per Alexa, Rohit Prasad, ha annunciato una serie di nuove e imminenti funzionalità per l’assistente intelligente dell’azienda. La più interessante è stata una nuova funzione in grado di sintetizzare brevi clip audio in un discorso più lungo.

Nello scenario presentato all’evento, la voce di una persona cara deceduta (una nonna, in questo caso) viene utilizzata per leggere al nipote una storia della buonanotte. Prasad osserva che, grazie alla nuova tecnologia, l’azienda è in grado di ottenere risultati audio davvero impressionanti utilizzando un solo minuto di parlato.

Questo ha richiesto invenzioni in cui abbiamo dovuto imparare a produrre una voce di alta qualità con meno di un minuto di registrazione rispetto alle ore di registrazione in studio“, osserva il dirigente. “Il modo in cui lo abbiamo realizzato è stato quello di inquadrare il problema come un compito di conversione vocale e non come un percorso di generazione del parlato. Stiamo indubbiamente vivendo nell’era d’oro dell’IA, dove i nostri sogni e le nostre fantasie scientifiche stanno diventando realtà”.

I dettagli sono scarsi, al momento. Non ci sono tempistiche o ulteriori dettagli, ma – come minimo – questo è il tipo di notizia che probabilmente inviterà a ogni tipo di esame sulle potenziali applicazioni, al di là di qualcosa di banale o addirittura commovente come leggere a un bambino “Il mago di Oz”.

Alexa will soon be able to read stories as your dead grandma

At its annual re:Mars conference today in Las Vegas, Amazon’s Senior Vice President and Head Scientist for Alexa, Rohit Prasad, announced a spate of new and upcoming features for the company’s smart assistant. The most head turning of the bunch was a potential new feature that can synthesize short audio clips into longer speech.

In the scenario presented at the event, the voice of a deceased loved one (a grandmother, in this case), is used to read a grandson a bedtime story. Prasad notes that, using the new technology, the company is able to accomplish some very impressive audio output using just one minute of speech.

This required inventions where we had to learn to produce a high-quality voice with less than a minute of recording versus hours of recording in the studio,” the executive notes. “The way we made it happen is by framing the problem as a voice conversion task and not a speech generation path. We are unquestionably living in the golden era of AI, where our dreams and science fictions are becoming a reality.”

Details are scant, at the moment. There’s no timeline or further specifics, but — at very least — this is the kind of news that will likely invite all manner of scrutiny over potential applications beyond something as banal or even heartwarming as reading a child “The Wizard of Oz.”

Fonte: techcrunch.com

Iscriviti alla Newsletter

Torna su