最专业的代练平台开发!

资讯热点
GUI和VUI有什么区别?看看这个超级全面的总结!

发布时间:2024-4-21 分类: 行业动态

人机交互和语音交互有什么区别?今天,这篇好文章探讨了GUI和VUI之间的区别。不清楚的设计师正忙着摆姿势!

今天我们深入研究GUI和VUI。

GUI是20世纪60年代和中期的“人机交互”的天才; Engelbart提出的概念,使计算机更容易被用户接受。自从20世纪80年代引入第一台配备GUI的计算机以来,GUI一直是机器交互的人类代表。 VUI不是一个新概念。它的前身是IVR(交互式语音应答),它诞生于20世纪70年代,并于2000年推广。只要电话用户拨打移动运营商指定的号码,用户就可以收听,订购或发送所需的语音信息。到语音操作提示并参与聊天和交友等互动服务。新一代VUI更多地指人们通过自然语言与计算机交互,因此VUI可以被视为人工智能时代人机交互的代表。

所以,在谈论GUI和VUI之前,让我们首先谈谈视觉和听觉,因为感觉上的差异将直接导致GUI和VUI设计的差异。

尺寸

如果你问GUI和VUI之间最本质的区别,我认为传递信息的维度是不同的。眼睛接收的信息由时间和空间XZY轴的四个维度决定;耳朵收到的信息只能由时间维度决定。

虽然耳朵可以感知声音的方向和频率,但它不是决定性因素。

时间决定了接收的信息量,它是单向的,线性的,无法停止的。耳朵在很短的时间内收到的信息非常有限。举一个例子:假设这个人可以停止时间。声音无法在静态时间传输。目前没有信息;另一种说法是声音在休息时间内始终处于当前状态,例如“滴水~~~””,声音对人类来说是一种噪音。耳朵收到的信息只能按时间确定。

眼睛是非常不同的,即使它可以在短时间内从太空获得大量信息。空间信息由两个因素决定:

动态还是静态?

是3D空间还是2D平面?

在没有其他参考对象的情况下,事物的静态运动可以模拟时间的静态。此时,人们可以获得有关静态事物的信息。时间和空间的结合决定了信息的大小,就像花一分钟看周围的动态一样,远远超过每年获得相同的静态页面。

还有一个重要的区别,眼睛可以来回查看获取信息;耳朵只能向一个方向获取信息,如果没有其他功能的帮助,就不可能听到前几秒钟的信息。

比较收到的信息量

愿景收到的信息量远远高于听证会。知道神经科学和脑科学主题的好受访者指出,大脑每秒通过眼睛接收的信息的上限是100Mbps,通过耳蜗接收的信息的上限是1Mbps。简单来说,视觉接收的信息量可以达到听觉接收信息的100倍。

以上数据来自于了解“哪个耳朵和眼睛更快地接收信息?”这个问题。

虽然上述结论尚未得到官方证实,但我们可以通过简单的方式对它们进行比较。在不考虑超出理解范围的情况下,人们可以以每分钟500到1000个单词的速度阅读文本,并且说话速度可以达到每分钟200到300个单词,因此用于视觉阅读的文本信息可以达到听力的2-5倍。

思考范围超出理解范围需要时间,这会导致收到的信息量突然下降。以上两个数据来自于“每小时有多少单词是普通人的阅读速度?”的问题。并且“每分钟有多少单词适合为他人写中文演讲?”

如果图像用作信息载体,则视觉阅读的信息远远超过听力的五倍。眼中还有另一个特别的东西。您可以通过扫描在一秒钟内看到三个不同的地方(图片)。

以上数据来自《人工智能的未来》。

GUI和VUI之间的区别

尺寸与视觉听觉的个性特征相结合,导致GUI和VUI之间信息呈现和交互的差异。下面我们讨论GUI和VUI之间的区别。

内容和数据驱动

GUI的内容主要是图形和文本; VUI的内容主要是文本,图形和文本是非结构化数据。当前GUI表示的内容由结构化数据驱动; VUI呈现的内容由非结构化数据驱动。

信息互动

如何理解GUI和VUI是由不同的数据类型驱动的?人们主要通过点击和手势与GUI交互。至于人们在做什么,电脑不知道。它只是将点击和手势转换为坐标和操作。然后给数据提供相应的响应事件,例如打开链接并获得有关数据库的信息。

人们通过对话与VUI​​互动。对话过程中使用的自然语言是非结构化数据。为了给出正确的响应事件,VUI必须首先了解人类在说什么,更重要的是,他们在想什么。

情境意识

要了解用户的想法,您必须具有出色的上下文感知,这是上下文理解。它根据用户是谁,用户的情绪,当前环境和先前的记忆提供下一个预测。 。目前的人工智能技术还没有很好地掌握上述技术,因此GUI和VUI的上下文感知相对原始,只能通过人工设计来补偿。

任务类型

由于眼睛可以接收比耳朵更多的信息,因此GUI更适合于显示内容。面对说明,GUI和VUI各有优势。最后,谁是最好的只能分析具体问题,具体取决于每个步骤的长度。但可以肯定的是,当前的VUI不适合复杂的任务,因为它在多轮任务中表现不佳。

信息架构

GUI的信息架构由页面和进程组成。该页面包含各种布局和结构。 VUI的信息架构只是一个过程,因此GUI的信息架构比VUI更复杂。由于页面操作的限制,GUI无法在没有任何相关过程的情况下进行切换,并且VUI可以通过对话和通信相互通信。 VUI在导航方便性方面更胜一筹。

GUI到VUI

为什么要将GUI转换为VUI?

现有Internet的大部分内容和数据都与GUI的信息架构和代码有关,因此我们不必为这两个接口做两组内容。

这有助于人工智能助理的发展。如果我们想将GUI的内容转换为VUI内容,我们必须简化当前信息并将信息压缩为每分钟200-300个字或每秒3-5个字。

目前,人工智能无法做到图像理解和态势感知技术。将大多数GUI内容自动压缩并转换为自然语言并不容易,因此有必要人为地制定一些转换策略。

在转换策略中,我们可以学习成熟的辅助功能指南—— a11y,其中一部分是帮助盲人,可以将界面内容转换为声音内容,我们借鉴以下三个标准:

易感性:必须以可察觉的方式向用户呈现信息和用户界面组件。

适应性:创建可以以不同方式呈现的内容(例如简单布局),而不会丢失信息或结构。

导航器:提供一种帮助用户导航,查找内容和确定其位置的方法。

说明:

可感知性有一个非常重要的标准:为所有非文本内容提供替代文本,例如图像,按钮等,以便可以将其转换为人们需要的其他形式。目前的常见做法是将描述性内容添加到非文本内容(如图像,按钮等),例如将alt属性添加到img标记,将name属性添加到输入按钮标记。当打开辅助功能设置时,盲人可以通过触摸相关位置来读取属性中的文本。

例如:

以京东的广告为例,alt属性应加上简洁的内容“12月14日360手机N6减少600”。当VUI读取内容时,可以读出广告。

在这里我有了新的想法,下面的图片是一个例子:粉红色区域是一个小模块,并且必须简化信息的VUI不需要图片,字幕,时间和作者等信息。是否可以在div标签中添加“title”属性,当VUI读取div时,它可以直接读取属性的内容,例如标题内容。如果用户对作者感兴趣,则可以以对话的形式获得作者信息。

以淘宝为例。普通人可以在几秒钟内阅读以下内容。如果交互是以VUI的形式,则首先VUI不知道从哪里开始阅读,其次用户没有耐心听取完整内容。为什么?由于GUI的结构在水平和垂直方向上有两个维度,因此VUI结构只有一个维度,GUI上用户的阅读顺序不能直接传递给VUI,所以希望页面设计可以采用简单的布局,GUI和VUI是相同的。避免丢失信息或结构的结构。

在可导航性方面,A11y希望网页提供一种机制来跳过在多个网页中重复出现的内容模块。在这里我有了一个新的想法:你可以跳过不需要大声朗读的内容模块,如淘宝的导航,主题市场和登录模块,因为用户使用淘宝VUI搜索项目并获得折扣信息。同样,是否可以在div标签中添加“skip”属性。当VUI读取div时,它可以直接跳过div。当用户有请求时,可以通过对话框交互div中的内容。 。

最后,我有另一个想法:是否可以在大量内容中添加“文本摘要”属性,例如新闻,介绍等。当VUI读取标记时,它会自动使用文本摘要功能。

结合上述三点思路,GUI可以在转换为VUI时以“泛化”和“跳过”的方式大大简化信息,使VUI具有良好的体验。

以上三个属性要求W3C,Google,Apple和其他组织制定标准。

VUI和GUI

VUI和GUI的结合并不新鲜,例如Siri,Google Assistant,Cortana,Bixby以及最近推出的Alexa屏幕版本。基于GUI添加VUI有助于简化整个导航的交互,并且可以在没有直接相关页面的情况下实现跳转,例如以命令的形式导航到其他应用程序的特定页面。基于VUI添加GUI可以简化选择,确认等,尤其是在与Alexa一起购物时。

结论

在人工智能时代,GUI和VUI的发展将越来越快,研究和探索它们是非常有趣的。我认为在未来几年内,个人智能助手的成熟将使VUI和GUI的结合越来越接近,这将直接影响未来几年移动互动的发展。

« 扩大思路:详细的排水结构 | 一整套事件管理计划的想法是什么? »