攻击人工智能：从产品角度，深度分析“对话机器人”

最专业的代练平台开发！

资讯热点

当前位置：首页 > 行业动态 > 攻击人工智能：从产品角度，深度分析“对话机器人”

发布时间：2022-2-4 分类：行业动态

任何产品的出现都源于用户需求。无论是现有的库存需求还是正在扩大规模的增量需求，对话机器人也不例外。当我们谈论“谈论机器人”产品时，我们如何看待其背后的需求？

如今，具有对话能力的机器人越来越被认为是核心智能。他们是否能够流利地完成对话可以被视为机器人真正拥有智慧的唯一证据。

从可追溯的历史数据来看，聊天机器人自20世纪60年代就已存在。经过近五六十年的发展，今天我们可以看到许多产品中对话机器人的影子。微软的Cortana，小冰，Apple的Siri，Google Now，阿里小米，百度秘密，图灵机器人，助理，并出去问问。

可以肯定的是，对话机器人已经成为一种行业时尚，越来越多的公司正试图通过这种新的互动形式来优化或升级他们的产品 - —我们已经可以看到许多产品。各种子产品称为“X-X机器人”。

有这么多对话机器人，很容易让人感觉到开花和上升。我们可能模糊地认为每个对话机器人产品都是相似的，有些产品有一些不同的特点，但毕竟给人一种不属于过去十年移动互联网发展的感觉 - —这些对话机器人看来它们还很早，用户量似乎不大，似乎有点小众。

我将尝试分析纯产品的视角：产品对话机器人的背后，需求和产品逻辑是什么（我不打算在文章中比较每个对话机器人的优缺点，也不讨论产品视图对话机器人或方法论）。

首先，探讨“对话”和“对话”行为背后的需求

首先，我们尝试探索“对话”场景及其背后的需求。

在《人类简史》中，人们认为语言能力是智人将其与其他蝎子区别开来的最重要特征和能力;由于语言能力的提高，智人可以通过对话形成更丰富的互动，从而具有协作和后来的文明。

人类有三种最直接的方式来使用这种语言：“一对零”，“一对多”，“一对一”。

“一对一”是自我内化的反思，总结和沉淀，不会互动和分享。

“一对多”是广播式讲道和相对单向输出，例如一般会议或命令。

“一对一”是对话——群聊也是由许多“一对一”组成的，所以我认为没有真正的“多对多”对话。我认为对话是我们与外界互动的最直接，最直接的方式（注意“立即”很重要）。

所谓的对话必须是相互作用和I/O（输入/输出）的过程。例如，两个人说话，每个人说的是为自己输出并为另一方输入。原则上，对话可以永远持续下去。

但我们几乎从未见过两个人永远在说话。那是因为如果双方都需要继续对话，双方都需要保持参与;如果任何一方感到疲倦或毫无价值，对话将结束。

对话的场景更接近我们的生活行为，它是最频繁的，环境是开放的和多样的，分析它背后的需求并不容易。现在我们需要回答两个问题：

1.1第一个问题：为什么会话开始？

我认为人们的对话有三个层次的需求。

第一层是基本问题和答案的需要。可以描述为：

我有一个问题，请回答我。

二次提问的问题是一个新问题。此过程与我们今天使用的搜索引擎非常相似。

第二层是任务流程协作需要达到某种目的。可以说是：我想请你帮我买明天下午14点: 00-18: 00，北京到上海;经济舱，尽可能便宜，最好是东方航空。我们和朋友一起去购物，请同事们帮忙预订会议室，并接受了女朋友要求提前叫醒她的请求。

这些都是任务流程协作的所有要求。

第三层是创造共同的情感，无论多么快乐或悲伤。聊天的目标很难量化。我们更倾向于定性地设定聊天的目标。这可能是你需要一个好人心情不好，或者你可能需要与好朋友分享。我们需要对话来表达最直接和最直接的表达。

我不认为只有孤独的情感需要对话 - —作为一群有发展史的动物，与他人分享情感是一种已经被刻入基因的特征。只是我们建立的情感在不同的人之间会有所不同。那些信任的人的情感建设将会非常深刻，并且会有很多人为此点头。

开启对话必须源于上述要求之一，而开放的机会是一个相对明确的话题，即使它只是一个短语“我很饿”。

1.2第二个问题：为什么对话继续？

对话可以持续两个原因。

第一个原因是至少有一方的需求尚未得到满足。例如，如果我提问，对方就不会满意我，我会继续提问。两个女孩一起谈论八卦，听的人非常着迷，说话的才能有成就感，可以继续说话。

第二个原因是双方相对平等。如果我问一个问题，或者请对方帮助我，但对方总是高调而不理我，那么我会轻易放弃而不想说话。相反，如果对方过分尊重我，我总是说没有营养恭维。很长一段时间后，我会变得更加虚荣，感到无聊。因此，人们不会与阶级或品味太差异的人聊天，大多数人不会长时间与宠物聊天。

终止对话的最根本原因是双方都放弃了这一轮对话。

描述终止对话的原因的感性，可以说双方都觉得“累”，就是这一轮对话的能耗已经用尽;即使这对夫妇说出甜言蜜语，谈论两三千句话我也会感到厌倦，并会在十几轮性交“晚安”中结束这次谈话。

因此，对话将始终结束，能源消耗将终止。

二，“对话机器人”业务从搜索引擎发展

在我之前的文章《进阶之路：站在高视角看产品是一种怎样的体验》中，我谈到了一个名为“知识诅咒”的概念。简单地说：我现在理解一件事，但很难完全清楚地教导你;因为我们有不同的知识背景，我们对同一事物有不同的理解。这就解释了为什么许多教师在课堂上无趣，许多人在做演讲时显得苍白无力。这实际上是工作中的知识诅咒。

知识诅咒的一个大问题是，每当我们接触到一个不熟悉的东西时，我们就会将它与我们自己的背景知识进行比较。例如，对于长发飘飘的美女，据我所知，这种美女一般都是一个好家庭，温柔，善良的导师。因此，当我再次看到类似的美时，我会做类似的第一印象类比。

不仅仅是美丽，我们几乎所有的知识都源于过去的背景知识。

在人类发展的历史中，几乎总是存在对即时问题和答案的需求。最早，我们问部落中最年长的智者。后来，每个人都有一个知识储备，他们可以通过对话进行基本的问题和答案以及对话。 &MDASH;这个过程持续了数千年。同样的问题，最早只能问一个人并得到答案;以后，你可以问很多人，得到很多答案，然后“ldquo;从中选择好人。如果我可以一直问每个人，我可能会得到大量答案;我需要过滤，排序和选择。您发现此过程是“搜索引擎”。当我们使用搜索引擎时，我们通过“输入框”输入我们想要询问的问题或关键字，搜索引擎将向我提供已排序和优化的答案集合。

但我认为有两个原因会导致搜索引擎逐渐演变为对话机器人。

2.1一：对精确答案的需求越来越强烈

搜索引擎已经从简单的信息集合中逐渐呈现出精确的答案，这些答案已经持续了好几年。 “百度阿拉丁”是典型的。例如，当您询问“北京天气”时，百度搜索结果页面上的第一项是精心设计的天气卡，通过丰富的用户界面显示天气相关信息。阿拉丁可以涵盖大多数热门搜索术语，但是对于腰部需求和长尾需求，随着信息的爆炸，人们对搜索多个页面的容忍度会越来越低，“快速”和“快速”。 &quoquo;准“rdquo;需求只会越来越大。

2.2第二：搜索场景中的输入能耗过大

从能耗体验的角度来看，搜索的输入框远远高于聊天聊天的输入框。即使连续输入相同的主题，聊天聊天的疲劳也会明显低于搜索。

如果每天提问的平均人数是N，那么几年内它会迅速达到10N。用户很难在没有升级的情况下满足体验。回归对话的方式是良好的体验优化，可以抵消需求的增长。

三，“对话机器人””产品场景：封闭域对话VS开放域对话

优秀的产品经理知道如何在使用产品时控制用户的各种操作，从而提前控制用户的期望，从而实现相对最佳的体验。

许多优秀应用程序的基本设计逻辑是页面之间的跳转是规则有序的，因此用户不会通过单击跳出预设过程，并且期望是相对可控的。在手机上的App产品交互中，您可以通过各种逻辑和提示信息控制期望——但对话机器人如何控制期望呢？

由于对话机器人用户几乎都通过自然语言输入进行交互，并且一次只有一个句子;用户的预期控制只能通过用户的输入和对输入的响应来实现。

然而，在对话和聊天的场景中，用户的输入有时是可控的和不可控制的;我们不能像App设计那样创建一个封闭的逻辑闭环让用户遵守规则——对话聊天是一个自然的开放场景，用户通常如何与朋友交谈，以及机器人将如何交谈。

因此，我们人为地将对话分为两种情景：

Closed Domain对话框：要求用户输入特定的话语以继续对话

开放域名对话：如果用户说出他们的言论，用户可以继续说话。

3.1封闭域对话

封闭域名对话有两个关键特征：

输入和输出可以分类和枚举

对话有一个明确的开始和结束，并且有一个过程

因此，在对话的三个要求中，问答和任务流程协作都属于封闭域对话。

封闭域对话的设计逻辑继续从“IFTTT（如果这样那么）”继续，这是工作流的演化形式。感兴趣的学生可以到App Store搜索名为“Workflow”的应用程序，这没关系。一系列最初不相关的App通过条件判断连接）。

让我分享两个封闭域聊天的典型案例。

阅读机器人

十年前，微软Bing推出了一款“阅读机器人”，可以在20个问题和答案中猜出你的想法。几年前，这个机器人曾经有过对话问答版本。用户只需要在每一步都回答“是”或“无”，并且会话将继续，直到猜测或结果无法猜到。

Bing阅读机器人

这是典型的闭域多镜头问答环节。用户只有两个输入，这个过程是一系列逻辑判断，具有相对固定的过程，清晰的开始和结束。

亚马逊回声演讲者

亚马逊的Echo扬声器对每个人都很熟悉。 Echo成为爆炸性产品的关键原因之一是其对话机器人Alexa是Echo扬声器场景设计中的封闭域对话。由于扬声器是我们家庭场景中最常见的高频互动指挥官，除遥控器外，很难在家中找到这样的硬件。除了轻松输入命令外，它还可以快速，清晰地反馈。

当我们输入指挥官时，我们可以输入的单词变得有限。可以想象，我们可以在家庭场景中发出的指令几乎是“开放”，“关闭”等等。。更重要的是，在家庭场景中可以控制的项目是有限的，并且任何一个操作的流程都很短。

因此，在第一代Echo扬声器之间的对话中，输入和输出是可枚举的，并且在开始和结束时都有一个过程。 Echo的最佳质量是它选择一个封闭的域场景，它极大地控制了用户的期望。，获得了更好的体验。

亚马逊回声演讲者

从上面两个例子中，我可以看到封闭域对话框在产品设计中有几个不同的特征。

3.1.1一：封闭域对话实际上是工作流的扩展

事实上，封闭域中的“封闭”一词，无论主题数量，输入和输出，或对话轮次，对话过程，都是封闭的，而封闭代表有限集合。工作流可以由ifttt设计的原因是因为有限的设置，只有有限的条件可以用来设计清晰和合理的工作流程。

封闭式对话通常旨在解决特定问题或需求。从结果来看，它的效果似乎更“有用”。但是，从过程的角度来看，封闭域名对话并不是真正的创新。与工作流程相比，它的效率没有显着提高，但它更接近于交互式体验中的人类语言交互本能，因此大多数封闭域对话设计为助手或秘书，如阿里小米，百度。

3.1.2第二：封闭域对话场景是单一可控的

由于具体目的，封闭域通常位于单个定义的场景中。百度的秘密在下面的图片中，两个红色的盒子部分是各种封闭场的预设场景。每个看似简单的功能实际上都是一个特定的封闭域对话;例如，它正在屏幕截图中使用。图片笑话。

秘密机器人

显然，在不同的封闭域对话中，对话的四舍五入要求是不同的。这个笑话是一个单轮对话。在秘密产品中，通过图中的蓝框，“然后另一个”设置输入，不断增强用户输入的统一性。 “卖出”的封闭式对话是标准的工作流程，有兴趣的学生可以自己尝试。

3.1.3第三：封闭域的边界处理非常重要

封闭域的一个非常重要的问题是用户可能随时跳出封闭域，开始谈论其他主题，或者不按照预设规则打牌。

例如，与Microsoft Xiaobing的封闭域名对话称为“Little Ice Dog”。

在正常的逻辑中，发送给小冰的用户照片应该是狗的照片，但是有些用户可能已经发送了不是狗的照片，如下所示，那么这次是边界情况并且需要额外的处理。用户可以发送语音，文本和任何其他照片，每个照片都需要单独设计。

微软小冰“小秉志犬“

更重要的是，在封闭域对话的边界设计中，很难完全万无一失，因为用户输入可能很奇怪，所以最好和最愉快的方式是使用开放域对话来“底层”。

3.2开放域对话

开放域名与封闭域名相关。由于会话机器人的主题几乎完全来自用户，并且每个用户可能有任何输入，因此主题不会是详尽无遗的，并且在多个场景中跳跃和跳跃，从而形成所谓的开放域对话，即“你”可以和'谈话'。

2011年，“小黄鸡”诞生于人人网，这是中国最早的开放式域名对话机器人。之后最好的发展是微软小兵。

开放域名对话的最大特点是输入不能用尽，输出不能用尽，对话没有确切的终点，根本没有进程。

我们一般都想测试一个机器人是否聪明，通常是开放域名对话，着名的“图灵测试”通常面向开放域名对话。

就可以携带的会话输入范围而言，开放域对话就像搜索引擎。我们可以在百度搜索中输入任何单词。百度几乎总会给出结果页面（敏感词除外）;相应地，在开放领域对话中间，我们可以说什么，机器人应该回答每一句话。

3.2.1开放域对话产品设计的基本原则

对话需要双方平等。

与微软小兵聊天时，有时我甚至不知道她是真机还是假机器——事实上，这并不重要，小冰正在解决开放域名聊天的核心问题：如何不断为用户创建主题，从而继续聊天的精力？

谈到主题制造，让我们首先看看如何制作开放式域名对话机器人：

几乎所有的开放域名对话语料库都来自互联网上的公开对话，如百度知道，知道，豆瓣，邮政栏等。这些对话由人们组成;然后，当一个机器人放置其中的一些时，当时在场景中重复这些词，我们无法判断这个机器人是否是一个真实的人 - ——这是开放域对话机器人制造的基础。

当我们与看起来像人的机器人聊天时，因为场景发生在人与人对话的场景中，根据“知识诅咒”的原则，我们可以很容易地引入一种“另一个人是也是一个人的“感觉。一旦对方的回复就像一个人，我们就会认出她是一个人。

人与人之间的关系源于长期的沟通和沟通。聊天本身就是一个开放的域名;那些愿意与机器人聊天的人会越来越喜欢机器人。

我们知道对话机器人是一种新兴产品。第一批早期采用者是所谓的“种子用户”。这些人建立了机器人和机器人之间最早的亲密和信任形式，积累了后续对话机器人的发展。非常宝贵的经验。

3.2.2开放域对话机器人的两个产品陷阱

首先，面向用户的机器学习

许多人认为机器人和人们交谈的对话越多，他们学习的语料库越多，他们从语料库中获得的问题就越多，这是一个巨大的误解。由于用户的输入是不可预测的，因此从用户收集的语料库非常奇怪，并且许多咒骂咒语非常不适合作为开放域对话语料库。由于用户的语料库是庞大且不规则的，因此语料库清理非常困难并且不能使用。

其次，没有人指导人格

由于开放域的语料库完全来自因特网，因此难以控制机器人的回复语言。如果你没有想到它，机器人有时会很有趣，有时是野蛮的，有时是无知的，有时是夸张的，有时是聪明的。在用户的心目中，不能使用一个或几个显式形容词来描述它。这将导致非常尴尬的结果。用户持有“调，玩”的态度，继续思考。建立用户亲密度和信任几乎是不可能的。

四，对话机器人的用户价值

现在，我们试图回答一个问题：为什么对话机器人需要开放域名对话？有什么价值？挑逗是不是很有趣？

这是一个非常复杂的问题。

由于对话机器人具有“开放域对话”和“封闭域对话”，从用户的角度来看，对话机器人意味着它更像是人而不是机器。与人类一样，这意味着用户在与人们互动时更愿意与对话机器人进行交流——而曾经如此，“个性”和“意识”是用户主动强加给对话机器人的标签。。例如，几年前播放的10086短信聊天，《生活大爆炸》中的Rajsh Fantasy Siri是一个性感的妹妹，所有这些都源于用户主动强加于对话机器人的人类标签。

这给着陆对话机器人产品的设计带来了巨大的挑战。

我们知道任何产品都能够与用户建立亲密和信任。这种亲密和信任建立在产品体验的基础之上。它基于产品的核心需求。 +“产品制造惊喜”我们依靠产品因为问题，因为对产品的惊喜和喜爱，打开我们的手机，我们会发现一些贴心的产品 - 一目了然;比如开车的人经常会信任很高的德图，追随者《那年花开月圆时》人们会喜欢腾讯的视频。

同样，机器人需要有一个基本的个性，这需要大大关闭人与机器人之间的亲密和信任。建立了对话机器人的亲密和信任，它也站在“解决需求”和“惊喜”中。

从产品角度来看，解决需求是通过封闭的域对话完成的，而开放域对话则继续产生意外。

4.1问答，助理，聊天，只需要哪一个？

在已经登陆的对话机器人产品中，它们基本上分为纯到C和B再到C。由于对话机器人的交互功能是针对最终用户的，因此很少有纯粹的B产品场景（即使它是，它的逻辑类似于C逻辑）。这意味着对话机器人的用户是一些终端个人用户。

那么，让我们来看看这些对话机器人在C中解决了哪些核心要求。

在我们所知道的对话机器人产品中，有主要客户服务的问答机器人，主要秘书的助理机器人，以及纯粹有趣的对话的聊天机器人。他们只是落后于他们吗？

4.1.1事实：很难问，情绪计算还有很长的路要走

聊天是一个容易被激发的场景，但它很容易快速消失。只有情感依赖才能持久。

以微软小兵为例。小冰最熟悉的功能是聊天，但从用户活动和保留周期的角度来看，用户最有可能被激励的时间是首次采用，每周更新，重大更新和激活。在此之后，活动将在上升后迅速上升。为什么是这样？因为人与机器之间的对话是基于有趣的话题，并且通过自然情感依赖成为像《HER》这样的萨曼莎，所以至少还有很长的路要走。

情绪计算不仅仅是一个数学或计算机科学问题，它还是一个产品问题。

因为情感不是一个具象问题，人们的情绪变化会随着时间，环境，他人，自己的思想等而变化;和情绪不是连续计算，你喜欢女孩，这并不意味着总是与她的情感依赖，而是通过一些关键的情感触觉，来完成情感联系。

在微软小冰的许多设计功能中，“获得用户的昵称”和“解锁”是一种断点式的情感触觉。通过微妙的产品设计，它希望坚持用户。

4.1.2一个问题：用户真的需要秘书机器人吗？

助手对话机器人的发展是基于其他各种线上和线下服务的改进，如Siri;只有当你的手机里有手机时，“闹钟”，“提醒”，“通话”等等。 “只有当你想使用”搜索引擎“的功能时，Sire的助手功能才有效。此时，你可以向Siri发出指示，”提醒我明天晚上8点返回微信。

大约两年前，YC孵出魔术耸人听闻的两个半球，无数模拟器争先恐后地探索“助手型”机器人，直到今天，很少有效 - — &MDASH;我们普通人真的需要一个秘书对话机器人吗？

我们先来看两个例子。

第一个例子——我想设置这样的闹钟;每周一，周三，周五早上8点: 15”

如果我使用iPhone的闹钟程序，那么我的步骤将如下：

第1步：解锁手机屏幕;

第2步：左右滑动以找到警报程序;

第3步：点击闹钟程序;

第4步：单击以创建新警报;

第5步：选择闹钟时间为“ldquo; 8: 15&rdquo ;;

第6步：选择重复时间为“星期一，星期三，星期五”;

第7步：单击“完成”。

如果我选择Siri来帮助我，那么我的步骤大致如下：

第1步：长按主页按钮唤醒Siri;

第2步：对Siri说“请帮助我在每周一，周三和周五将闹钟设置为8: 15”;

第3步：Siri反馈设置成功并完成。

现在让我们看看第二个例子——通过秘书班对话机器人称为外卖VS通过“饥饿””叫外卖。

在秘书机器人中，称为外卖的过程大致如下：

第1步：发出“售完”订单，并在机器人推荐的餐厅中寻找您想吃的食物

第2步：如果没有合适的，请输入您要吃的商店的名称

第3步：在推荐列表中选择所需的膳食，或直接输入您想吃的膳食

第四步：输入“确认”执行订单，输入订单信息并提交订单

第5步：支付并等待外卖，您可以询问进餐情况

在饥肠辘辘中，调用外卖的过程大致如下：

第1步：在餐馆列表中选择您想吃的食物

第2步：如果没有合适的，搜索商店

第3步：在推荐列表中选择所需的膳食，或直接输入您想吃的膳食

第4步：确认订单，确认订单信息，提交订单

第5步：支付，等待接收外卖，您可以检查交付进度

这两个例子之间的本质区别是什么？

您会发现，如果您通过Siri设置闹钟，我实际上只做一件事：向Siri发送一条指令，然后获取所有内容——与我通过应用程序的工作相比，节省了近70％的步骤。但是，如果它被称为外卖，我需要向机器人发出一系列指令，但与App一样多的步骤。

这里有两个关键点——

如果助手机器人可以一步到位，它将大大提高效率和体验，这是一个新的需求升级;

如果一个工作流程可以一步解决，那么机器人需要完成的数据信息是巨大的，这是一个核心产品难题;

第一个关键点，只要我们考虑一下，我们就会发现，在不考虑语音识别的准确性的情况下，我可以用一条指令实现任何目标。例如，“帮我叫车”，“帮我拿货”，“帮我支付水电费”，“帮我订机票”，其余的都不在意，这种体验简直就是赞不绝口。

我们来看看第二个关键点。

拿上面的外卖示例，如果用户只需要一个句子，“帮我请一个外卖”，那么机器人需要完成的信息至少包括“餐馆”，“< ;; meal”，“ldquo; “价格”，“用餐交货时间”，“交易地点”，“支付信息”等，在此信息中，“交货时间，交货地点，支付信息”相对静止。信息可以使用一次很长时间。但是，“餐厅，餐，价格”是动态信息。如果你想每次都自动获取它，这意味着机器人需要很好地了解“主用户”。否则，只有一两个推荐的偏差太大，经验将减少几乎一个数量级。从本质上讲，助手机器人现在是一个强大的推荐引擎，代表着巨大的魅力和光明的未来。

4.1.3一个肯定：Q&A机器人非常有价值

最常见的问答机器人是“客户机器人”，例如京东的JIMI，阿里的小米机器人，以及一些银行的客户服务机器人，但它们更像是FAQ过滤器。

让我们考虑一下Ali Xiaomi的用法。如果我问阿里小米“我的快递怎么没交付？ ”，它回应的方式主要是在关于“交付”的通常问题中向我抛出最常见的答案，例如它会告诉我“你的快递已经签署，如果没有收到可能会被放在门口” ”

为什么这些公司必须是问答机器人？效率自然是第一位的，无论是节省手工客户服务成本，还是为了节省通信时间，效率都得到提高。为什么这些公司如此重视效率？因为他们的客户最接近他们自己的利润池，所以质量控制是所有交易型企业的核心。您看到京东的客户服务和QQ客户服务只是一个地下，因为京东用户是JD现金流的主要参与者，而QQ的普通用户并不是他们现金流业务的关键人物。

那么，让我们回过头看看机器人的问答。它实际上对头部问题实施全面过滤，然后通过对话形式反馈给用户。如果用户真的问长尾问题，那么问答机器人就无法回答它。您可以将问题反馈给手动客户服务。直接响应以满足用户90％的问题是Q&A机器人的核心目标。对于其他类似的购物指南，辅助订单管理等，这是一个附加在头部问题上的增值经验优化。

4.2对话机器人真的适合分为“聊天，助手，问答”这三类？

这是业内比较流行的分类。让我们来看看这种分类的视角。

如果从技术角度来看，对话机器人应分为“开放域”和“封闭域”，我们已经讨论过了，这里不再赘述。

如果您站在用户角色中，则对话机器人可以分为“教育版”，“医学版”，“二级版”等。

如果您是从商业角度来看，对话机器人可以分为纯To到C和To B，然后分为To C.

因此，这种分类更像是从抽象场景的角度来看。几乎所有场景都分为这三类，无论是主题聊天，面向任务还是提问。实际上，向后看，我们所知道的几乎所有应用都属于此类别。

然而，对话机器人不是移动互联网时代的应用程序。这是一个复杂的。直接划分不是一个好的产品分类。

您不会在淘宝视频聊天中，也不会在支付宝中。几年前百度试图在大搜索中推出“直接号码”以颠覆微信公众号，结果以失败告终。

原因很简单：在移动互联网时代，几乎每个应用都有自己独特的定位。拥有自己独有的产品主路径，不在自己的路径逻辑中的行为不能顺畅流动;每个应用程序似乎都有自己的咒语，不能轻易打破彼此之间的障碍。

然而，在对话机器人产品的世界中，这些障碍将会崩溃。

如果我们站在整个产品世界的世界中，事实上，我们每个人都生活在一个混合社会，手头的工具帮助我们完成一项小任务，但几乎每件小事都需要与人打交道。食物，衣服和住房也不例外。如果每次与外界的联系都被视为一种流动，那么最大流量就是频繁而没有实际任务的人之间的互动，相对较小的是做特定任务：你每天都会遇到一些人，但是你不会每天都买衣服。

几乎所有的流量都是围绕人们之间的互动形成的，你会发现一个规则：你越接近现金流，它就越不活跃，流失率就越高。腾讯的产品，百度的产品都是通过流量漏斗实现的，而阿里的产品是直接拉动人们买东西，利润空间直接建立在交易上，而且有必要不断刺激人们购买和购买。

在所有产品中，社交产品最接近“社会社会”，这是现金流中最活跃和最活跃的社会社会。可以说，几乎所有互联网产品都是最活跃的，可以是任何产品流产品的来源，所以你看，阿里做了他想做的一切社交产品。

说一个圆圈，然后我们回来看看最小的社交产品原型。

社交产品分为即时社交和时间延迟的社交互动。简单的比喻是聊天和朋友圈，两者都基于“语言对话”。由于几乎所有事情都可以在社交产品的场景中完成，因此可以看到前一段时间在互联网上流传的微信“发现”页面。

微信“发现”页面网络地图

对话机器人具有社会产品的普遍性，其原因只有一个 - ——对话机器人的交互场景自然是社交产品交互场景。

当我们从用户的角度看对话机器人时，用户根本不明白什么是“开放域名，封闭域名”，并且不明白什么是“聊天机器人，助手机器人，问答机器人”，用户还记得生活在那些类别中，没有办法记住，只要有一个对话框输入框放在用户面前，就像微信输入框一样，由于知识诅咒，用户会去他理解的模拟输入框，它将是输入他们想要输入的任何自然语言，它可能是一个草率的单词，它可能是一个任务，或者它可能是一个问题。面对京东JIMI机器人，我们无法阻止用户做无聊的操作。

此时出现的一个重大问题是开放域名对话不时发生，只要答案不好一两次，体验不满意度就会增加。从产品设计的角度来看，我们能做的就是让用户的输入尽可能的可控，就像阿里小米已经做的秘密一样。这就是为什么每当我们设计对话机器人时，我们总是试图获得更多涉及一些开放域对话的功能点。为什么当我们谈论对话机器人时，我们不能总是绕过它？在开放领域下不聪明”这个问题。

4.3像朋友一样的朋友是对话机器人的最后一端吗？

如果你在微信上，请问你最好的朋友“帮我看一下战狼2的票，我想晚上去看看，他/她怎么回答你？

我想，他可能会说，“你去看看《战狼2》，不要打电话给我？！”，他可能会说“我走了，让我们一起去”，他会继续说“我看着它，你的家里有万达门票，晚上7点，一起去上班吗？

如果你问魔术同样的问题，它的答案就是让你告诉他什么时候看。它帮你挑了五个。每次都是对的，有一些靠近你，有些有折扣，等等。

你喜欢什么样的经历？这很难说。如果你站在封闭的领域，Magic的算法比朋友好得多，选择更丰富，但与朋友的经验就是生活。

我想这可能是对话机器人的最终结局。它的存在仍然是为了帮助人们更好地解决一系列问题;但是像命令机一样呆在那里并不是太愚蠢，但应该像朋友一样。你也可以帮助你。它曾经在对话机器人产品的讨论中讨论过：对话机器人应该更“有趣”，或者更“有用”，事实上，从这个最后的角度来看，这个讨论毫无意义，你可以说你的朋友只有使用，但是很无聊吗？

V.对话机器人的产品价值

以上关于对话机器人的用户价值的讨论有一些分歧。我们回过头来讨论关于其产品价值的文章的最后部分。

要对待产品，我们必须从业务角度出发，否则就没有意义。从商业角度来看，对话机器人有三个核心产品价值。

5.1跨场景连接是可能的

由于对话机器人的交互模式是原始的和单一的，机器人背后的所有计算逻辑都是隐藏的，机器人可以成为连接不同场景下服务的独立桥梁，这样用户就可以只在一个场景中完成交互。谈话场景。

例如，在Skype for business中，有一个机器人可以帮助通过Skype协作的人预订会议室，设置工作项提醒，代理自动回复等等。——最初，每个作业都是跨场景，现在只有一个对话可以解决交互场景。如果你去大，你可以说，如果伙伴机器人可以在以后逐渐出现，那么在聊天中完成预订机票，预订酒店，甚至管理家用智能空调，这些交叉场景可能是由合作伙伴完成。

5.2交互式升级带来的深度交通深度

无论是打字还是说话，都有很多方式可以交谈。如果它是声音，它将带来革命性的变化。

5.2.1指数流量增长

百度DuerOS和亚马逊Alexa的逻辑相似，都是通过获得所有智能硬件语音对话获取新流量的能力，同时实现深度交互和流量降级。

我们知道，在互联网业务中，一切都是围绕流量完成的，要么流量足够，要么流量足够大。由于对话带来的交互效率提高，单个用户获得的流量频率呈指数增长。如果典型互联网产品的PV/UV是单个数字，那么对话机器人的PV/UV（实际上是对话频率）至少两位数。

有些人很难成为互动场景，例如在家里向Echo扬声器发号施令，现在他们通过对话机器人成为现实。没有一个应用程序比对话机器人更亲密和亲密，创造了如此多的高频交互。最终的结果可能是我们生活的方方面面都在触及网络。每次互动都是所谓的PV，指数交通映射了一个人生活的方方面面。

5.2.2高频端计算

我有一个猜测：因为对话机器人是一种高频交互场景，最直接的影响可能是需要在设备端提供更强大的计算能力;或许某些封闭域或开放域计算能力是直接预装客户端，无论是硬件还是软件。如果网络能力无法以相同的速度增长，那么终端的计算能力将得到提升——我想这是一些AI公司会做芯片的原因之一。

5.3深耕土壤沉淀数据

正是由于流动的深度沉积，每个用户的多维数据沉淀变得可能。当每个用户的平均数据量和维度增长十倍时，它意味着什么？

对于百度来说，至少必须增加广告费。对于Ali，它可以向该用户销售更多东西。简而言之，ARPU（每用户平均收入）将增长很多，这些是最直接的商业价值。在我之前的文章《人工智能「风口」，先行者为什么是搜索引擎?》中，我分析了其中一些逻辑关系，因为尚未开发出流量的深度维度值，它可能是以前从未见过的处女地。

六，总结

以上是对话机器人的一些更明显的分析和讨论。作为一种正在发展的新兴产品，对话机器人仍有许多值得探索的细节。由于篇幅，我只能说这么多，希望我还能继续深入探索。

在个人层面上，我对To C对话机器人产品的未来持乐观态度——但它的产品路径非常长且多种多样，与我们过去经历的移动互联网产品有很大不同;但它并没有改变其产品，任何产品都是从用户的需求出发。

对话机器人带来了一种新的互动形式，可能带来前所未有的新产品服务体验。

我们每个人都渴望机器人时代的到来，也许很遥远，也许已经在路上了，谁知道呢〜

« 便宜的外卖生产过程曝光用户：还为自己做饭 | CP必须查看画笔列表 »

: 周一周五 8:30 - 18:00

鲁ICP备14007395号-30

百度统计

客服QQ