Microsoft представила нейросетевую модель VASA, которая может «оживлять» фотографии в очень реалистичном виде.
То есть вы загружаете портретное фото и звуковую дорожку, а получаете видео говорящего лица с точной синхронизацией губ со звуком, естественной мимикой и реалистичными движениями головы.
Генерацию можно даже контролировать, задавая эмоцию, расстояние от камеры, направление взгляда и т.д.
Сейчас VASA в закрытом тестировании, позже выпустят для всех желающих.
Становится всё сложение различать, что реально, а что – нет
Show more ...