在小度系列产品中, 一个叫做『益智乐园』的栏目逐渐引起了人们的关注, 这是一个由益智、娱乐、游戏组成的板块,集成了多种领域相近,题材和形式又各不同的技能和内容。例如在我自己的小度有屏设备上, 益智乐园的样子是这样的——

有意思的是, 这个版块的技能、应用和内容采用了会员制的运营方式,有点像生活中的山姆会员制,也逐渐成为了DuerOS生态系统的又一盈利之路。

DuerOS 的生态系统简介

作为移动设备的操作系统,Android 和 iOS 成功地构建了各自的生态系统,并开启了『移动互联网』时代。从生态系统的视角来看, 作为对话式人工智能操作系统的DuerOS,和 Android 或者 iOS 类似, 都可以构建自己的生态系统。那么, DuerOS 的生态系统是怎样的模样呢?

生态系统健康是生态系统的综合特性,健康的生态系统具有活力、结构稳定和自调节能力,价值的创造和传递是DuerOS这样的生态系统的核心,通俗地说,能不能给消费者带来价值, 能不能给生产者带来收益。

在DuerOS 的生态系统中, 内容提供商和技能开发者有哪些通用的盈利方式呢?

DuerOS 的盈利模式

相对于移动互联网中的两种主流商业模式:付费应用和应用内付费, DuerOS 有着付费技能和技能内付费,在开发技能的时候勾选付费选项进而进行配置就可以了。

对于传统的线上广告模式, DuerOS 体现了极大的克制, 只有在某些特定场景才会引入,例如拜年广告, 这也导致了众多的开发者还不能普通地将广告作为一种商业模式。还有很多内容提供者通过内容直接分润的场景,例如原来的凯叔讲故事以及凤凰书苑等等。

益智商城的会员制则是DuerOS 盈利模式的又一积极地探索和尝试。开发者加入益智乐园计划,根据所开发技能的UV和PV,以及会员转化率,由DuerOS 根据算法实现具体的利润分成,每个月结算,直接汇到开发者的账户上。那么, 开发者可以开发哪些类型的益智娱乐类技能呢?

益智乐园中的技能类型

从用户的视角来看,DuerOS 包括了L1~L4的4种技能类型:

从技术实现的视角看,目前,DuerOS包括了如下技能类型:

益智乐园中的技能类型几乎涵盖了DuerOS 的所有技能类型,在《DuerOS 的AI 实践》中大家可以看到一些技能类型的开发方式,例如,从Java SDK看DuerOS的技能开发 和 用JavaScript打造AI应用-从Nodejs SDK 看DuerOS的技能开发等等。

在益智乐园中, 最简单快捷的技能类型开发方式是H5类型的技能创建。首先,H5应用作为页游的一个主要载体,有着非常普遍的用户基础和开发者基础。其次,将一个H5应用转化为DuerOS 的H5技能非常简捷。如果是已有的H5应用,将其转化为DuerOS的H5 技能可能只需要10分钟。

益智乐园中的H5 技能

H5技能的SDK 可以通过 https://github.com/dueros/h5-bot-sdk 获取,具体地说,在自己的H5应用中通过script标签引入(支持https):

<script src="//duer.bdstatic.com/saiya/sdk/h5-bot-sdk.1.9.0.js"></script>

即可在全局环境下获取到BotApp对象。

入门

如果只是期望快捷接入,暂时忽略语音交互以及其他的用户体验,作为L1技能, H5技能的接入只需在创建技能时候填入自己H5应用的URL 即可。然后,在申请上线的时候勾选参与益智乐园计划即可,例如——

在开发者申请上线后, DuerOS 的运营同学一般会在当日完成审核, 不晚于次日上线。一般的, 如果技能的申请在上午完成,有可能在当天完成上线, 如果在下午完成申请,一般都会在次日上午完成上线,如果是晚上完成申请,一般会在次日下午完成上线。

由此可见, 对于H5应用的简单移植,开发者的工作量很多时候可能不超过15分钟的工作量,并且最晚于次日就可以在线上使用自己的H5技能了。

语音交互

增加一点语音交互也并不复杂,首先要初始化对象:

// 初始化botApp对象const botApp = new BotApp({    random1: "3691308f2a4c2f6983f2880d32e29c84", // 随机字符串,长度不限,由开发者自己生成    signature1: "d85f5cfffe5450fe7855fec1fcfe0b16", // 将(random1 + 签名Key)的字符串拼接后做MD5运算得出    random2: "dc468c70fb574ebd07287b38d0d0676d", // 随机字符串,长度不限,由开发者自己生成    signature2: "61dc2b99967e0b326e82e80b05571d22", // 将(random2 + 签名Key)的字符串拼接后做MD5运算得出    skillID: "699e74f5-b879-1926-1e11-51998f05ea68" // 必填字段,技能ID。填写本字段后SDK会在初始化阶段调用BotApp.requireShipping(小度有屏音箱环境)方法。});

打开设备上的麦克风,就可以聆听用户的声音:

botApp.listen();

在H5技能中,发出想要的声音:

botApp.speak("欢迎使用");

然后, 通过updateUiContext(data) ,就可以轻松地将自己的H5技能从L1 升级到L2。github给出了下面的这个示例:

const data = {    enableGeneralUtterances: true, // 如果为false,当用户的表达与下方注册的常用表达都不匹配时设备不会有任何处理    hyperUtterances: [        {            url: "https://www.apple.com", // 当用户的语音对话内容与utterances匹配时,SDK会调用onClickLink中的回调函数,并将本URL当做参数。            utterances: ["苹果"],            type: "link",            params: {}        },        {            url: "https://www.banana.com",            utterances: ["香蕉"],            type: "link",            params: {}        },        {            url: "https://www.strawberry.com",            utterances: ["草莓"],            type: "link",            params: {}        }    ]};botApp.updateUiContext(data);

如果希望把H5技能从L2升级到L3,需要开发者在DBP平台上面开发意图,在匹配到用户对话之后会封装对应意图成为Intent下发下来。

botApp.onHandleIntent(function (payload) {    console.log(payload);    // 结果如下:    {        "app": {            "packageName": "com.baidu.duershow.h5container"        },        "customData": "",        "intent": {            "name": "test_city",            "slots": [{                "name": "sys.city",                "value": "{\"city\":\"南京\",\"origin\":\"南京\"}"            }]        }    }});

这时候,H5技能的语音交互处理就与DuerOS 其他技能的处理方式没有太大的区别了。

高级技巧

面向H5技能,还有一些面向其特性的高级技巧,例如 ClickLink事件下发。ClickLink是一种Directive,用户新增自定义交互(updateUiContext())之后,云端会解析用户定义的交互,通过此方法下发上面定义的url。在H5 上的示例代码如下:

botApp.onClickLink(function (payload) {    console.log(payload);    // 打印如下    {        url: "https://www.straberry.com",        params: {}    }});

当用户的对话内容不在updateUiContext设置的用户表达范围时,开发者可以获取用户对话的语音识别(ASR)文字结果。在H5上的示例代码如下:

botApp.onHandleUnknowUtterance(function (err, data) {    console.log(data);    // 当用户对话:小度小度,哈密瓜    // 打印结果如下:    {        query: "哈密瓜"    }});

进一步,如果有登录的需求,账号关联流程可以使用requireLinkAccount()方法,如果开发者有支付的需求,详见requireCharge()。注册手势识别的方法是registerGesture(config, callback) , 注册后可在回调函数中接收到手势识别的结果。更多的高级技巧参见 https://github.com/dueros/h5-bot-sdk/blob/master/example/h5-bot-sdk-demo.html。

益智乐园中的开发者收益

益智乐园中的H5技能只不过是其中的一种类型而已, 以H5技能作为说明示例主要是在《DuerOS 的AI 实践》系列中还没有专门提到过,然而,益智乐园的核心商业模式实际上是基于会员制的收益共享,目前,开发者的收益处于怎样的水平呢?

基于近两个月的数据,如果一个开发者的技能上线后, 日均uv 2万,日均pv 3万,日均订单转化率为2%的话,那么,开发者的月分成金额就会超过1万元了。

当然这只是一个真实案例的参考, 因为目前在益智乐园中, 开发者的月收入超过10万也不是什么新鲜事了。随着DuerOS设备在各个家庭中的日益普及,随着用户对DuerOS 技能认知的不断深入,开发者的春天或许真的不远了。

如果您还不是DuerOS 开发者,请登录dueros.baidu.com/dbp , 如果您已经是DuerOS的开发者, 请尝试加入益智乐园计划,感受一下DuerOS 的又一盈利之路。

至此,再次感谢新老开发者为DuerOS 用户带来的便捷和欢乐!

【参考资料与关联阅读】

从JavaScript BotSDK 看DuerOS的技能开发

在校大学生能成为DuerOS 的独立开发者吗?

生动化你的表达——DuerOS中SSML应用

面向接口/协议?看DuerOS的技能开发

智能语音应用开发之DPL2.0高级特性

揭秘“语音交互”背后的AI硬核黑科技!

浅谈语音助手可以给企业带来什么?

AI 语音交互开放平台的构建与演进

声如其闻,DuerOS中的声音播放

谢谢...,DuerOS开放平台2020

从JavaSDK看DuerOS技能开发

放心用吧!谈DuerOS的安全性

《智能语音时代》的读书笔记

调试DuerOS智能语音技能

智能音箱场景下性能优化

感知人工智能操作系统

多模态交互之DPL 2.0

企业赋能 AI服务生活

感知自然语言理解

聊聊“全双工”

聊聊“异步”

推荐内容