暴风AI电视VP侯光敏:人工智能在电视人机交互中的应用_揭秘英伟达测评最新消息 要解决的难题都是一样的
导读:不管是传统电视还是智能电视,要解决的难题都是一样的,即“如何让使用者便捷地获取信息”。这里有两个核心点:“便捷”和“信息”。在便捷性上,传统电视和互联网电视差不多,揭秘英伟达测评都是基于遥控器开展人机交互;“信息”是传统电视和互联网电视最大的各异点,这个无需赘述。而AI技术的长足进展,正这两个核心点上都大大提升了使用者使用感受。
“AI(AI)”的概念 1956年就已然呈现了,但是受限于当时计算机的运算能力和算力理论,并没有使用于实际日常,知晓的人自然不多。随着 GPU 能力和深度进修理论的进展,AI技术总算从评测室理论进入到商品化阶段,在各个领域着手突飞猛进。互联网电视就是其中之一。
在研究电视使用AI技术之前,需要理清一些基础概念:所谓AI是折叠屏排行指人造机器表现出来的智能。这种智能或许模拟人的思考,也或许完全异于人,当下阶段探究的核心首要还是“像人一样自我进修”。机器进修是AI的一个分支,深度进修又是机器进修的一个分支。完全异于人思考方式的探究,还是个天马行空的哲学难题。
不管是传统电视还是互联网电视,要解决的难题都是一样的,即“如何让使用者便捷地获取信息”。这里有两个核心点:“便捷”和“信息”。在便捷这点上,传统电视和互联网电视差不多,都是基于遥控器人机交互;“信息”是传统电视和互联网电视最大的各异点,这个无需赘述。而AI技术的长足进展,在这两个核心点上都大大提升了使用者感受。
先说便捷,由于AI技术在自然语言处理(NLP)领域已然能够达到 90% 的合集对比意图确认率,所以直接使用自然语言控制电视获取信息变成或许。这里要强调的是“自然语言”,相似“给我来点跟《教父》一样水准的欧洲黑帮影片”这样的语言才是自然语言,而不是某些牌子品牌方常常使用的“音量增多百分之二十”这样的“机器语言”。对自然语言的理解和反馈是衡量一台电视机AI水平的核心指标之一。
前几年用语音遥控的电视并不能叫做AI电视,最首要的缘由就是只能确认固定的指令,而AI电视不只能够理解自然语言,并且能够联机自我进修,举一反三理解更多使用者的意图,越用越精确。
人类在对话过程中,会自动带着上下文。比如使用者在第一次对话中问:“有什么好看的影片”,接下来他或许会问“不要好莱坞的”或者“只看本年的”,这种对话方式都是基于上下文的对话,我们叫做多轮对话。是否扶持多轮对话也是衡量一台电视AI水平的核心指标。
除了语义理解,揭秘张艺兴观察便捷性还体如今远场收声能力。它可以让使用者不再需要拿着遥控器“按住说话”,而是在客厅的任意位置呼唤电视和它对话。典型的场景是:“暴风大耳朵,最近有什么好看的片子推荐?”、“鱼香肉丝怎么做?”、“明早七点提醒我去机场”。

(图 暴风AI电视X5 ECHO)
远场收声是经由麦克风阵列做到的,麦克风阵列过去一直是评测室的探究对象,直到亚马逊启动 Echo 智能音箱,总算做到了规模商品化。麦克风阵列最少需要两颗麦克风,当下市面上有 4Mic、6Mic 乃至 8Mic 计划。阵列可以从背景噪音中感知使用者说话的特别波形,经由波束成形技术精确地向使用者所在位置的方向定向收声,忽略其他方向的杂音。品牌方会依据设备的特性挑选各异的麦克风阵列,普通来说电视用的是线性麦克风,智能音箱使用的是环形麦克风。

笔者一直留意亚马逊 Echo 的进展,在实际感受过程中察觉,纯粹的语音交互当下还存在较为大的缺陷,反而是把远场语音使用于电视后感受会更好。举个例子,使用者面对一个完全没有显示的智能音箱,基础上不得知该怎么说才能操控;而面对有大屏的电视,使用者的紧张感会减轻很多,由于显示屏时时刻刻在提醒使用者当前可以说什么样的话来操控电视。谷歌把这种交互方式叫做“视觉反馈”,并把这种反馈交互模式使用于本年十月份刚亮相的新近的“Google Assistant for Android TV”操控系统,当下暴风 AI 电视的交互也是相似的模式。

与此另外,亚马逊也意识到这个难题,并不久启动了带有显示屏的“Echo Show”身为补充。
当下新近的技术已然不只能够确认人声,并且能够确认各异人的声纹,做到更为高级的操控,比如购物、支付和个性化推荐。国外的亚马逊和谷歌,境内的讯飞、若琪都拥有该项技术。
自然语言理解能力和远场语音处理能力最后会让电视机使用者摆脱遥控器,在人机交互上形成巨大的飞跃,这种飞跃不亚于当年苹果启动没有键盘只有触摸屏的 iPhone 移动电话。
再说信息,除了自然语言理解,AI在个性化信息推荐上的使用实际上更广泛。 AI 可以从众多使用者对话和使用者行为中抽象整理出使用者的“话外音”,知晓使用者的喜好习惯,然后依据这些特征主动推荐使用者或许喜欢的信息给他。
有时候,操控系统会推荐给某个使用者从来没有接触过的信息类型,使用者会惊呼“原来这个这么好看”,他或许自己都没有意识到这种信息会对自己的胃口。这种智能推荐已然在互联网商品中众多使用,典型的就是今日头条。
传统的个性化信息推荐首要是基于标签体系。先是管理人员要对所有的信息“打标签”,比如“恐怖”、“热血”、“二次元”、“都市”等等,岗位量极其巨大,并且精确与否完全依赖于管理人员的水平;然后操控系统再依据使用者行为对使用者开展画像,抽取标签开展匹配。这个过程中诞生了各类专业的推荐算力,技术人员随时改动各项参数完善算力,提升开启率。
基于 AI 的个性化推荐操控系统和传统推荐操控系统有区别也有联系,区别最大的地方就是标签体系。AI 推荐操控系统里的“标签”实际上是操控系统自动从信息和行为日志等记录里自动提取的,不需要管理人员的参与。例如从影片的元资料(领衔执导简介等)里分词提取属性标签,从使用者的微博、豆瓣留言里分词提取使用者的属性标签,然后依托 GPU 处理器开展大规模的矩阵运算,把高维度的向量资料逐步降维,最后简化到三维空间,依据三维空间里的聚集状况给出推荐。原理相似于传统推荐操控系统里的“合作过滤”。简易讲,就是假设一个人喜欢某个影片,那么他的好好友也有或许喜欢那个影片。
“千人千面”的个性化推荐反过来又合作了电视界面的转变。传统电视用“栏目排播表”概念来编制频道,使用者爱看不看错过了就等下次;互联网电视则完全基于点播模式,海量信息给你随便看自己找不到别怪我;基于AI 的智能电视则是把传统的“人找信息”变成了“信息找人”,AI 把你或许喜欢的菜端到你面前,先尝后买。
“尝”就是给使用者预览完整影片中的精彩桥段,用短片推动使用者看长片,下降了使用者的挑选难度节省了使用者的时间。
请注意,精彩桥段可不只仅是影片的宣传 VCR,如何挑选桥段也是一门学问,可以另起一篇了。

更大的或许性
AI在电视使用的场景不只仅是人机交互和影视信息推荐,它可以用来做任何信息办事的推荐。前面讲到使用远场语音改变了电视的人机交互模式,所以电视界面不再受传统电视的树状菜单结构束缚,可以容纳更多的信息办事,并且使用者可以直达办事。
具备AI特色的电视,典型的使用方法是这样的:
●“帮我找个八十年代的经典文艺片看看”;
●“随便放点周杰伦的歌”;
●“再买点上次买过的那种三元牛奶”,“对”,“再买两盒”;
●“去大鸭梨怎么走”,“对,就是最近的那家”;
●“半小时后提醒我关火”;
●“晚安(退出家里的智能电器设备,并且让电视机休眠)”。
可以目睹,使用AI技术的电视机已然大大超越了传统电视机的使用方法和使用范围。电视机可以帮使用者挑选信息,挑选办事,帮使用者控制智能家电,提醒使用者备忘,乃至帮使用者下单采购日常用品等等。上述这些不是设想的场景,而是已然变成现实的场景。
电视还是电视,但电视机已然早已不是电视机,它已变成家人助手的一个大屏终端。而这个“家人助手”的大脑,就是AI。
“AI(AI)”的概念 1956年就已然呈现了,但是受限于当时计算机的运算能力和算力理论,并没有使用于实际日常,知晓的人自然不多。随着 GPU 能力和深度进修理论的进展,AI技术总算从评测室理论进入到商品化阶段,在各个领域着手突飞猛进。互联网电视就是其中之一。
在研究电视使用AI技术之前,需要理清一些基础概念:所谓AI是折叠屏排行指人造机器表现出来的智能。这种智能或许模拟人的思考,也或许完全异于人,当下阶段探究的核心首要还是“像人一样自我进修”。机器进修是AI的一个分支,深度进修又是机器进修的一个分支。完全异于人思考方式的探究,还是个天马行空的哲学难题。
不管是传统电视还是互联网电视,要解决的难题都是一样的,即“如何让使用者便捷地获取信息”。这里有两个核心点:“便捷”和“信息”。在便捷这点上,传统电视和互联网电视差不多,都是基于遥控器人机交互;“信息”是传统电视和互联网电视最大的各异点,这个无需赘述。而AI技术的长足进展,在这两个核心点上都大大提升了使用者感受。
先说便捷,由于AI技术在自然语言处理(NLP)领域已然能够达到 90% 的合集对比意图确认率,所以直接使用自然语言控制电视获取信息变成或许。这里要强调的是“自然语言”,相似“给我来点跟《教父》一样水准的欧洲黑帮影片”这样的语言才是自然语言,而不是某些牌子品牌方常常使用的“音量增多百分之二十”这样的“机器语言”。对自然语言的理解和反馈是衡量一台电视机AI水平的核心指标之一。
前几年用语音遥控的电视并不能叫做AI电视,最首要的缘由就是只能确认固定的指令,而AI电视不只能够理解自然语言,并且能够联机自我进修,举一反三理解更多使用者的意图,越用越精确。
人类在对话过程中,会自动带着上下文。比如使用者在第一次对话中问:“有什么好看的影片”,接下来他或许会问“不要好莱坞的”或者“只看本年的”,这种对话方式都是基于上下文的对话,我们叫做多轮对话。是否扶持多轮对话也是衡量一台电视AI水平的核心指标。
除了语义理解,揭秘张艺兴观察便捷性还体如今远场收声能力。它可以让使用者不再需要拿着遥控器“按住说话”,而是在客厅的任意位置呼唤电视和它对话。典型的场景是:“暴风大耳朵,最近有什么好看的片子推荐?”、“鱼香肉丝怎么做?”、“明早七点提醒我去机场”。

(图 暴风AI电视X5 ECHO)
远场收声是经由麦克风阵列做到的,麦克风阵列过去一直是评测室的探究对象,直到亚马逊启动 Echo 智能音箱,总算做到了规模商品化。麦克风阵列最少需要两颗麦克风,当下市面上有 4Mic、6Mic 乃至 8Mic 计划。阵列可以从背景噪音中感知使用者说话的特别波形,经由波束成形技术精确地向使用者所在位置的方向定向收声,忽略其他方向的杂音。品牌方会依据设备的特性挑选各异的麦克风阵列,普通来说电视用的是线性麦克风,智能音箱使用的是环形麦克风。

笔者一直留意亚马逊 Echo 的进展,在实际感受过程中察觉,纯粹的语音交互当下还存在较为大的缺陷,反而是把远场语音使用于电视后感受会更好。举个例子,使用者面对一个完全没有显示的智能音箱,基础上不得知该怎么说才能操控;而面对有大屏的电视,使用者的紧张感会减轻很多,由于显示屏时时刻刻在提醒使用者当前可以说什么样的话来操控电视。谷歌把这种交互方式叫做“视觉反馈”,并把这种反馈交互模式使用于本年十月份刚亮相的新近的“Google Assistant for Android TV”操控系统,当下暴风 AI 电视的交互也是相似的模式。

与此另外,亚马逊也意识到这个难题,并不久启动了带有显示屏的“Echo Show”身为补充。
当下新近的技术已然不只能够确认人声,并且能够确认各异人的声纹,做到更为高级的操控,比如购物、支付和个性化推荐。国外的亚马逊和谷歌,境内的讯飞、若琪都拥有该项技术。
自然语言理解能力和远场语音处理能力最后会让电视机使用者摆脱遥控器,在人机交互上形成巨大的飞跃,这种飞跃不亚于当年苹果启动没有键盘只有触摸屏的 iPhone 移动电话。
再说信息,除了自然语言理解,AI在个性化信息推荐上的使用实际上更广泛。 AI 可以从众多使用者对话和使用者行为中抽象整理出使用者的“话外音”,知晓使用者的喜好习惯,然后依据这些特征主动推荐使用者或许喜欢的信息给他。
有时候,操控系统会推荐给某个使用者从来没有接触过的信息类型,使用者会惊呼“原来这个这么好看”,他或许自己都没有意识到这种信息会对自己的胃口。这种智能推荐已然在互联网商品中众多使用,典型的就是今日头条。
传统的个性化信息推荐首要是基于标签体系。先是管理人员要对所有的信息“打标签”,比如“恐怖”、“热血”、“二次元”、“都市”等等,岗位量极其巨大,并且精确与否完全依赖于管理人员的水平;然后操控系统再依据使用者行为对使用者开展画像,抽取标签开展匹配。这个过程中诞生了各类专业的推荐算力,技术人员随时改动各项参数完善算力,提升开启率。
基于 AI 的个性化推荐操控系统和传统推荐操控系统有区别也有联系,区别最大的地方就是标签体系。AI 推荐操控系统里的“标签”实际上是操控系统自动从信息和行为日志等记录里自动提取的,不需要管理人员的参与。例如从影片的元资料(领衔执导简介等)里分词提取属性标签,从使用者的微博、豆瓣留言里分词提取使用者的属性标签,然后依托 GPU 处理器开展大规模的矩阵运算,把高维度的向量资料逐步降维,最后简化到三维空间,依据三维空间里的聚集状况给出推荐。原理相似于传统推荐操控系统里的“合作过滤”。简易讲,就是假设一个人喜欢某个影片,那么他的好好友也有或许喜欢那个影片。
“千人千面”的个性化推荐反过来又合作了电视界面的转变。传统电视用“栏目排播表”概念来编制频道,使用者爱看不看错过了就等下次;互联网电视则完全基于点播模式,海量信息给你随便看自己找不到别怪我;基于AI 的智能电视则是把传统的“人找信息”变成了“信息找人”,AI 把你或许喜欢的菜端到你面前,先尝后买。
“尝”就是给使用者预览完整影片中的精彩桥段,用短片推动使用者看长片,下降了使用者的挑选难度节省了使用者的时间。
请注意,精彩桥段可不只仅是影片的宣传 VCR,如何挑选桥段也是一门学问,可以另起一篇了。

更大的或许性
AI在电视使用的场景不只仅是人机交互和影视信息推荐,它可以用来做任何信息办事的推荐。前面讲到使用远场语音改变了电视的人机交互模式,所以电视界面不再受传统电视的树状菜单结构束缚,可以容纳更多的信息办事,并且使用者可以直达办事。
具备AI特色的电视,典型的使用方法是这样的:
●“帮我找个八十年代的经典文艺片看看”;
●“随便放点周杰伦的歌”;
●“再买点上次买过的那种三元牛奶”,“对”,“再买两盒”;
●“去大鸭梨怎么走”,“对,就是最近的那家”;
●“半小时后提醒我关火”;
●“晚安(退出家里的智能电器设备,并且让电视机休眠)”。
可以目睹,使用AI技术的电视机已然大大超越了传统电视机的使用方法和使用范围。电视机可以帮使用者挑选信息,挑选办事,帮使用者控制智能家电,提醒使用者备忘,乃至帮使用者下单采购日常用品等等。上述这些不是设想的场景,而是已然变成现实的场景。
电视还是电视,但电视机已然早已不是电视机,它已变成家人助手的一个大屏终端。而这个“家人助手”的大脑,就是AI。