当前位置:动态 > 正文
人工智能公司开发全新语音合成技术 或能帮助解决外语片配音问题
2022-01-20 16:42:14 来源: cnBeta.COM

据AXIOS报道,一些AI公司正在开发解释和合成广告、电影和电视中的声音的方法。语音合成方面的进展可以帮助解决糟糕的外语片配音问题--它们的出现是因为作为娱乐全球化的一部分,国际内容对电影公司和流媒体平台变得越来越重要。

但它们引起了人们对深层伪造音频的可能性以及名人的声音在他们死后可能被使用的担忧。

像《鱿鱼游戏》和《纸钞屋》这样的外语片正在吸引创纪录的观众,但对于试图开拓日益增长的国际市场的电影公司来说,字幕仍然是一块绊脚石。

例如,观看《鱿鱼游戏》配音版的Netflix用户比观看字幕版的用户多。由于大片占用了大量带宽,小型外语内容生产商很难找到足够的翻译和配音演员来满足需求。

人工智能公司Veritone的联合创始人兼总裁Ryan Steelberg说:“我们仍然停留在一对多的广播模式的思维模式中。”Veritone开发了一个名为MARVEL.ai的产品,允许内容制作者生成和授权其所谓的“超现实”合成声音。

这意味着,例如,播客创作者可以将音频广告文案解释为另一种语言,然后MARVEL.ai将生成一个合成版本的声音,用新的语言阅读广告。

Steelberg说:“它让你有能力以更大的规模和更低的成本对音频进行超个性化处理。”

文字转语音技术已经存在了几十年,但Veritone的产品使用了“语音转语音”,Steelberg称之为“语音即服务”。

Veritone可以访问来自媒体库的PB级数据,并利用这些数据来训练其人工智能产品,创建一个原始语音的合成版本,可以针对不同类型的情感或情绪进行调整,或者通过翻译,说出一种外语。

“它不再是另一个人的新声音,例如代表汤姆·克鲁斯说话,”Steelberg说。“这真的将是用汤姆·克鲁斯的声音来说另一种语言。”

NVIDIA一直在开发技术,允许人工智能改变视频或动画的方式,将演员的嘴唇和面部表情与新的语言相匹配--因此将不再有20世纪70年代的电影中那种不同步的配音。这项技术可能会首先用于广告,但随着它向更高质量的内容迁移,它将为明星人才带来潜在的机会和陷阱。

Steelberg说:“在配音和后期制作方面,合成声音将成为主流,你会看到这一点被纳入人才合同。”

这不仅仅是为了确保好莱坞明星(和他们的经纪人)在使用他们的合成声音时获得分成,而且也是为了防止这些声音在技术越来越普及的情况下被劫持用于恶性目的。

值得关注的是,已故名人的声音和其他创造性属性将如何被人工智能所利用?

弗兰克·扎帕等已故音乐家的全息影像已经被用于“现场”表演,带来了数千万的收入,而Kenny G最近发布了与30年前去世的爵士乐大师Stan Getz的“二重奏”。Getz现有资料库中的样本音频资料被用来生成一个新的、合成的旋律--尽管这个旋律被爵士乐作家Ted Gioia称为“Frankenstein唱片”。

标签:

责任编辑: jkl2