Quando si partecipa a una videoconferenza, spesso è difficile mantenere un contatto visivo diretto con gli altri partecipanti, in quanto questo richiede di guardare la telecamera piuttosto che lo schermo. Anche se la maggior parte delle persone utilizza regolarmente i servizi di videochiamata, finora non c’è stata una soluzione diffusa a questo problema.
Un team di ricercatori della Intel ha recentemente sviluppato un modello di correzione del contatto visivo che potrebbe aiutare a superare questo fastidio ripristinando il contatto visivo nelle videochiamate in diretta, indipendentemente dall’ubicazione della telecamera e del display di un dispositivo. A differenza degli approcci precedentemente proposti, questo modello centra automaticamente lo sguardo di una persona senza bisogno di input che specifichino l’angolo di reindirizzamento o le caratteristiche geometriche della telecamera/display/utente.
“L’obiettivo principale del nostro progetto è quello di migliorare la qualità delle esperienze di videoconferenza rendendo più facile mantenere il contatto visivo”, ha dichiarato Leo Isikdogan, uno dei ricercatori che hanno condotto lo studio. “È difficile mantenere il contatto visivo durante una videochiamata perché non è naturale guardare la telecamera durante una chiamata. Le persone guardano l’immagine dell’altra persona sul loro display, o a volte guardano anche l’anteprima della propria immagine, ma non la telecamera. Con questa nuova funzione di correzione del contatto visivo, gli utenti potranno avere una conversazione faccia a faccia naturale”.
L’obiettivo principale dello studio condotto da Isikdogan e dai suoi colleghi era creare un’esperienza di video chat naturale. Per raggiungere questo obiettivo, gli studiosi desideravano che la funzione di correzione del contatto visivo funzionasse solo quando l’utente è impegnato nella conversazione, non quando toglie gli occhi dallo schermo (ad esempio quando guarda i fogli o manipola gli oggetti che lo circondano).
Il nuovo sistema sviluppato da Isikdogan e dai suoi colleghi utilizza una profonda rete neurale convoluzionale (CNN) per reindirizzare lo sguardo di una persona deformando e sintonizzando gli occhi nelle sue strutture di input. In sostanza, la CNN elabora un’immagine monoculare e produce un campo vettoriale e una mappa della luminosità per correggere lo sguardo dell’utente.
Spesso si può avere il desiderio che il proprio giardino diventi uno spazio esterno perfetto…
Organizzare un evento, di qualsiasi genere, richiede settimane, se non mesi, di pianificazione, contatti e…
Aiuto sono a dieta! Quali cibi devo evitare, quali fanno ingrassare? Queste sono le domande…
Ecco una lista di alcuni dei locali notturni che troverete a Monaco tra i più…
Oroscopo Paolo Fox mercoledì 24 giugno 2020, ecco come sarà la giornata per i primi…
Ecco i numeri ritardatari del Lotto e le statistiche in vista della prossima estrazione del…