加入收藏 | 设为首页 | 会员中心 | 我要投稿 阜新站长网 (https://www.0418zz.com.cn/)- 管理运维、AI硬件、数据集成、云备份、负载均衡!
当前位置: 首页 > 大数据 > 正文

AI如何让董宇辉不下班?

发布时间:2022-07-29 09:09:09 所属栏目:大数据 来源:互联网
导读:还有46分钟,董老师休假就结束了。 这是董宇辉最新视频下点赞过百的一条留言。 他在东方甄选直播间消失的日子里,粉丝们涌入他的个人号,调侃这个男人只要一放假休息,几十万人都得跟着失恋。 然而对于头部主播来说,再怎么爱岗敬业,也总有下播的时候。 毕
  “还有46分钟,董老师休假就结束了。”
 
  这是董宇辉最新视频下点赞过百的一条留言。
 
  他在东方甄选直播间消失的日子里,粉丝们涌入他的个人号,调侃“这个男人只要一放假休息,几十万人都得跟着失恋”。
 
  然而对于头部主播来说,再怎么爱岗敬业,也总有下播的时候。
 
  毕竟连着几个小时不断说话,还得是妙语连珠的那种,既耗费脑力,对体力也是个不小的挑战。
 
  在这种情况之下,不仅“24小时直播”不大可能,连不轮班的长时间唠嗑也不是人人能顶得住的。
 
  不过话说回来,如果有机器加持呢……
 
  特别是这段时间以来虚拟人等技术的爆火,很难不让人脑洞大开——
 
  凭借AI能力,能否做到让头部主播“本人”24小时驻守直播间?
 
  更进一步说,是不是没有董老师的双语能力,也能语言无缝转换,直接走向国际?
 
  24小时直播,到底难在哪?
  按目前实现的各种AI技术来看,这些“脑洞”并非无法实现。
 
  在图像技术上,AI直接生成虚拟形象、或是给主播“换”个脸已经不是什么难事。
 
  例如,国外以假乱真的“阿汤哥”在TikTok上火了好一阵,国内的柳夜熙、李星澜等虚拟形象也在国内社交媒体平台上大受欢迎,视频中几乎看不见“AI合成”的影子,评论中惊艳的声音也居多。
 
  
 
  不仅如此,AI生成图像甚至视频的效果也日渐精致,国外OpenAI的DALL·E2、谷歌最新Imagen和Parti、国内智源CogVideo和微软亚研院NUWA-Infinity等,都是这几个月出现的新成果。
 
  上述这些图像技术,有不少已经开放了API接口、或是申请试用,加上有不少类似的开源模型,基本上已经能做到“人人可玩”。
 
  基于这些技术,现在国内外各平台,也出现了不少“24小时直播”的AI博主。
 
  但点进去看却会发现,这些AI博主远不如真人主播、或是真人扮演的虚拟主播人气高。
 
  
 
  △24小时AI虚拟主播,半天只有167人“看过”
 
  直播效果上,也与我们期待的那种“24小时直播”有点远:
 
  互动时,大部分AI主播能做的非常有限,有些只能简单地唱几首歌(限定歌单)、或是根据设定好的指令进行回复等;
 
  
 
  说话时,用AI合成的虚拟主播音色,不仅语气没有真人主播那般生动、也无法主动制造一些情绪上的“惊喜”。
 
  这背后反映的是绝大多数虚拟AI主播的痛点——
 
  虽然这几年图像生成技术突破不断,但语音语言AI的技术门槛,却仍然较高。
 
  以董宇辉直播间为例,虽然只要董老师乐意,合成一个“AI董宇辉”的形象并不是一件难事;
 
  然而,让“AI版”董老师说话语气和音色更像本人、认出直播间其他老师的声音、甚至听懂直播间外助手的“指示”等操作,却仍旧难以完成。
 
  这背后对应的,是语音合成、声音识别、语音识别等各种语音语言AI的综合能力。
 
  更进一步,想让这个直播间国际化的话,还会对语音能力提出更高一步的要求。
 
  
 
  例如,至少需要能够实时在线翻译的AI字幕:
 
  在此基础上,如果要做成无障碍直播间的话,还需要进一步掌握同声传译的能力。
 
  好消息是,现在,已经有越来越多科技大厂注意到这一赛道,这几年一直在不断加大投入。
 
  国内外大厂纷纷加码
  光从理论研究来看,语音语言AI方向的论文已有不少。
 
  亚马逊谷歌等大厂,关于对话AI、NLP和语言处理等方向的AI论文已经达到几百甚至上千篇,其中有不少都是顶会论文;Meta光是2018一年,就拿了EMNLP和ACL两大NLP顶会的最佳论文……
 
 

(编辑:阜新站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读