Sony a une version d'Aloy en IA générative, mais pour faire quoi ?
Aloy cause dans le poste

Microsoft n'est évidemment pas le seul constructeur/éditeur à s'intéresser à l'IA générative. Bien sûr que Sony est sur le coup ! The Verge a débusqué une vidéo YouTube du PlayStation Studios Advanced Technology Group (qui a bien vite été retirée, d'ailleurs), dans laquelle on pouvait voir une bien étrange démonstration.
Aloy, l'héroïne de Horizon Forbidden West répondait aux questions du joueur et faisait la causette, le tout avec l'aide de GPT-4 (OpenAI) et Llama 3 (Meta) pour la génération de la conversation, et Whisper (OpenAI) pour la transcription de la voix en texte.
Dans la démo, cette Aloy dopée à l'IA génère donc des réponses en fonction des requêtes du joueur, elle parle avec une voix de synthèse composée par le système Emotional Voice Synthesis (EVS) de Sony. Les animations du visage et labiales sont réalisées avec la technologie Mockingbird du constructeur. L'extrait que The Verge a pu récupérer avant que la vidéo ne disparaisse à tout jamais a un puissant effet d'uncanny valley (en particulier au niveau de la bouche) :

Le narrateur de la vidéo est Sharwin Raghoebardajal, directeur de l'ingénierie logicielle chez SIE. Il travaille sur la technologie jeux vidéo, IA, vision par ordinateur et technologie faciale pour les studios PlayStation. Il nous apprend notamment que la démo tourne sur PC, mais que des expérimentations ont été réalisées sur PS5 avec « peu de surcharge », explique-t-il.
Autrement dit : cette technologie pourrait sans trop de problème tourner sur une PS5. L'entreprise a présenté cette technologie en interne il y a un an environ, avant de proposer une version plus évoluée en novembre dernier, durant le Sony Technology Exchange Fair (STEF), à huis clos.
Sharwin Raghoebardajal explique qu'il s'agit simplement d'un « aperçu de ce qui est possible ». Mais on peut se demander quel intérêt le joueur, qui dirige Aloy dans le jeu, aurait besoin de demander quelque chose à l'héroïne ? Et puis se posent des questions très sérieuses sur l'impact d'une telle technologie sur l'industrie du doublage et sur les développeurs.
Microsoft est allé bien plus loin avec son nouveau modèle Muse, capable de réaliser des phases de gameplay et d'aider au prototypage de jeux.

Commentaires ()