FAQ

FAQ

返回

NO.1 平台新特性

Q :开放平台2.0有什么新特性?

A : 1、以方案为入口的应用开发

方案是云知声针对特定应用场景打造的智能语音交互应用的模版,例如智能电视方案、智能汽车方案、音乐搜索方案等。开放平台2.0上挂载的方案,集中了云知声技术团队对特定应用场景中的语音交互功能的设计和优化,并经过质量测试,具有业内一流的语音交互质量。

2、开放灵活的定制优化

首先,为开发者提供了批量上传导入知识库的接口,这样开发者就可以更加快捷的完成自建问答知识库的工作。

其次,开放平台2.0为开发者提供了反馈优化需求的页面,开发者在应用开发过程中遇到的定制及优化需求,可以分类进行反馈提交。云知声支持团队对优化需求进行跟进开发处理后,开发者可以看到优化需求的状态和相关回复。

3、本地云端相结合的语音交互技术

针对需要离线技术的使用场景,如:智能电视、智能车载。开放平台2.0的方案加入了离线唤醒、离线命令词识别和离线语音合成的免费试用。

Q :什么是方案?

A : 方案是创建应用的模板,是特定使用场景下需要的语音交互技术的集合。如开发者是智能电视的厂商,即可选择智能电视方案,创建应用。创建的应用中就包含了开发者在智能电视使用场景下的所有相关技术(识别、理解以及合成)。

Q :什么是服务?

A : 服务分为技术服务和内容服务两种。

技术服务指语音识别、语音合成等语音交互的基本技术。

内容服务指与语义理解相关的服务,如天气服务、股票服务、航班等。

NO.2 常见问题

Q:什么是云知声?

A : 云知声是最专业的语音交互提供商,公司成立于2012年。总部位于北京,在上海、深圳设有分公司和办事处。目前云知声已推出了一系列语音识别服务中间件和语音识别服务云平台,广泛应用在移动互联网、智能家居、可穿戴设备、车载导航、医疗、教育、呼叫中心等领域,为企业和用户提供专业的语音识别服务。

Q:云知声能做什么?

A : 云知声可以为开发者提供整套的语音交互解决方案,包括语音操控、语义理解、声纹识别等。

Q:云知声的语音技术如何?

A : 云知声人是一支专业、高效的团队,基础研发团队来自国内外知名企业、高校和研究所,研发团队80%以上拥有博士学位,并具有超过十年的语音识别、语义理解的研发和应用经验。

Q:云知声是免费的吗?

A : 云知声的公有云服务是完全免费的。对于一些特殊需求,我们还提供私有云服务,私有云服务则是需要收取一定费用的。

Q:语音识别和语义理解分别是什么?

A : 语音识别和语义理解是两个完全不同的技术。语音识别,即声音转文字技术。语义理解,则是将人类的自然语言变为机器可理解的语言。若想实现语音系统的完整对话,两个技术都是必不可少的。

Q:SDK有离线包吗?

A : 离线SDK目前只支持Windows,linux,Android,iOS几个操作系统,并且提供免费试用版本。如需下载正式离线包,需先联系商务,再申请订购。

Q:为什么离线包体积会比较大?

A : 离线SDK依赖一定量模型数据,所以相对较大。

Q:支持哪些平台?

A : Windows,linux,Android,iOS。

Q:支持哪些开发平台接口下载?

A : 支持当下主流开发平台,包含Android、iOS、Windows phone、Windows、Linux、Java、Flash等。

Q:支持的哪些CPU架构?

A : 支持主流的arm、mips、x86的CPU构架。

Q:使用语音识别需要费多少流量?

A : 采样率对网络带宽要求RATE_16K≈2KB/秒, RATE_8K≈1KB/秒。为了获得更好的识别效果推荐使用RATE_16K。

Q:云知声语音的准确率有多高?

A : 支持在线和离线连续语音转写,普通话连续语音转写准确率达到97%以上。

Q:语音转写一次会话的最长时间?

A : 公有云的SDK中限制为1分钟,私有云服务则可以根据需要自行设定。

Q:语音转写一次会话字数有没有限制?

A : 没有字数限制,但需要吐字清晰,流畅。

Q:开放平台2.0最高支持多少并发?

A : 开放平台2.0采取集群架构,对于并发调用没有限制,请放心使用。

Q:集成SDK的工作量有多少?

A : 需要10行代码的集成,普通开发者一个小时内的工作量。

Q:语音云支持哪些语种?

A : 目前识别服务支持中文(普通话)、英文和粤语,TTS支持中文、英文,随着公司业务不断开拓将会上线更多语种支持。

Q:语音识别为什么要划分领域?

A : 根据所选领域进行语音识别可以有效地提高撰写正确率,例如:医药领域-斯达舒,如选择通用领域则有可能变为:四大叔。

Q:开发集成阶段服务量有没有次数限制?

A : 没有限制,云知声的公有云服务是完全免费的,也不针对服务量做限制。

Q:如何使用云知声的技术?

A : 可以通过云知声开放平台2.0,注册用户,申请APPKEY,下载SDK集成在您的系统中,直接完成技术的对接。

Q:SDK怎么下载?

A : 在开放平台2.0可下载。

Q:SDK是免费的为什么还需要注册和审核?

A : 用户注册和提交审核是为了获取专属APPKEY,SDK集成时会需要输入APPKEY。

Q:APPKEY是什么?

A : APPKEY代表您应用的唯一标识,集成SDK调用时,会根据APPKEY来判断您之前预设好的业务数据。

Q:我已注册帐号为什么还要完善信息?

A : 注册用户和信息完善用户的权限是不同的,只注册帐号的用户,将有权限在官网体验DEMO,查看开发文档,但无权下载SDK或开通服务。完善信息后系统将自动开通上述未开通的权限。

Q:在哪里可以完善个人信息?

A : 点击跳转至完善资料。

Q:如何获取APPKEY?

A : 在开放平台2.0创建应用后会自动生成APPKEY。

Q:SDK不会用怎么办?

A : 可以参看SDK开发文档,如果还有问题可以联系我们求助。

Q:ASR是什么?

A : Automatic Speech Recognition;自动语音识别。

Q:TTS是什么?

A : Text To Speech;语音播报技术,将文本转成声音。

Q:注册企业帐号与个人帐号在权限上有什么区别?

A : 企业帐号与个人帐号在使用权限上是没有任何区别的,都可以使用云知声全部的技术和服务。

Q:使用平台2.0 SDK报的错误码在哪里可以对应??

A : 在下载的SDK的doc目录下有说明文档,在文档最下方给出了错误码对应的解决方案。

Q:可以自己控制语音输入的识别什么时候结束吗?

A : 云知声语音识别SDK,接受的最长语音输入时间为60s 。一次识别时间最多60s,无法进行长时间输入和识别。

NO.3 商务合作

Q:云知声可以有哪些合作?(合作模式)

A : 1、通过云知声开放平台2.0可以下载基于云端的各种方案的SDK,在线服务永久免费,并为终身为开发者提供技术服务支持;

2、云知声为合作伙伴按需求提供低成本、高效率的定制开发服务。

Q:离线服务有限制吗?

A : 离线服务试用版将免费提供部分命令词识别和唤醒以供开发使用。

离线唤醒词:你好魔方。

离线命令词:打开电视/关闭电视/打开空调/关闭空调/打开蓝牙/关闭蓝牙/增大音量/减小音量/播放音乐/停止播放。

NO.4 开发部署

Android平台

常见错误log:  

错误Log 1: Caused by: java.lang.UnsatisfiedLinkError: Couldn't load uscasr from loader dalvik.system.PathClassLoader[dexPath=/data/app/cn.yunzhisheng.shoppingdemo-1.apk,libraryPath=/data/app-lib/cn.yunzhisheng.shoppingdemo-1]: findLibrary returned null

原因: 项目libs 目录下未加载对应平台的so库或者加载的库有问题。

解决:将开发SDK包下面的libs目录下的对应平台so库拷贝到libs目录下。

错误Log 2:at java.lang.NoClassDefFoundError:cn.yunzhisheng.pro.USCRecognizer

解决:将usc.jar 删除重新导入,Java Build Path->Libraries 加入usc.jar 然后在order and export 中勾选usc.jar相关依赖项(当前工程的usc.jar 在 android private libraries 下面)然后Clean下当前工程。

错误Log 3:Unable to resolve target 'android-X'?

解决: 在default.properties中,把target=android-X改成你有的版本。

Q:Android平台SDK错误Log:

java.lang.UnsatisfiedLinkError: Couldn't load uscasr from loader dalvik.system.PathClassLoader[dexPath=/data/app/cn.yunzhisheng.prodemo-1.apk,libraryPath=/data/app-lib/cn.yunzhisheng.prodemo-1]: findLibrary returned null导致崩溃是什么原因?

A:原因是项目libs目录下未加载对应平台的so库或者加载的库有问题。
请将开发SDK包下面的libs目录下的对应平台so库拷贝到libs目录下。

Q:Android平台SDK错误Log:

java.lang.NoClassDefFoundError:cn.yunzhisheng.pro.USCRecognizer怎么解决?

A:将usc.jar删除重新导入。
Java Build Path->Libraries 加入usc.jar 然后在order and export 中勾选usc.jar相关依赖项(当前工程的usc.jar 在 android private libraries 下面)然后Clean下当前工程。

Q:Android平台SDK错误Log:

Unable to resolve target 'android-X'?

A:在default.properties中,把target=android-X改成现有的版本。

Q:Android平台的SDK录音开始的时候,都会有一个提示音,怎么关闭提示音?

A:在创建识别对象之后调用识别对象的此方法。
setOption(USCSpeechUnderstander.OPT_SET_START_PLAY_BEEP_ENABLED, false);

Q:Andriod平台的SDK怎么设置不带标点符号?

A:在线识别,使用识别对象的setOption(42,false)方法关闭标点符号,默认启用。离线识别没有标点符号。

Q:Andriod平台的SDK在onEnd后调用cancel后还会返回识别结果吗?

A:在识别中被取消,不会有回调结果。

Q:离线语音合成支持多少位的Android手机?

A:仅支持32位,不支持64位。

Q:Android语音搜索,调用stop方法后,直到出结果这一段时间有时候有点久,是什么原因?

A:主要和网络有关系,建议网络良好的状况下使用。

Q:云知声的Android在线识别SDK会给app的容量增加多少?

A:压缩后增加200~300k, 最小200K左右,比如最简单的Android arm架构。

iOS平台

常见问题及错误:

1、错误如下:

ld: warning: ignoring file /Users/hh/IosCode/usc_ios_sdk/libs/libusc.a, missing required
architecture i386 in file /Users/hh/IosCode/usc_ios_sdk/libs/libusc.a (3 slices)
Undefined symbols for architecture i386:
"_OBJC_CLASS_$_USCRecognizerDialog", referenced from:
objc-class-ref in USCViewController.o
ld: symbol(s) not found for architecture i386
clang: error: linker command failed with exit code 1 (use -v to see invocation)

分析:i386架构是模拟器,官网上的SDK目前不支持模拟器调试,只支持真机调试。

解决办法:用真机调试。

2、如何获取录音数据?

分析:官网上的SDK中pro版本中有提供获取语音数据的接口。
- (void)onRecordingStop:(NSMutableData *)recordingDatas;
方法返回语音数据UI1-UI3的SDK中没有返回语音数据的接口。

3、同时使用语音语义SDK会报错误如下:

duplicate symbol OBJC_METACLASS$_USCLog in:
/Users/simon/Desktop/usc_ios_sdk_v1.4.10_UI1/libs/libUSCNLPPraser.a(USCLog.o)
/Users/simon/Desktop/usc_ios_sdk_v1.4.10_UI1/libs/libusc.a(USCLog.o)
duplicate symbol OBJC_CLASS$_USCLog in:
/Users/simon/Desktop/usc_ios_sdk_v1.4.10_UI1/libs/libUSCNLPPraser.a(USCLog.o)
/Users/simon/Desktop/usc_ios_sdk_v1.4.10_UI1/libs/libusc.a(USCLog.o)
ld: 14 duplicate symbols for architecture armv7

分析:因为语音和语义中都有同样的USCLog类,在一个项目中同时使用语音语义SDK,会出现上面错误。

解决办法:修改语义中的USCLog类的名称,重新编译生产静态库。

4、错误如下:

Linker command failed with exit code 1 (use -v to see invocation)
sdk是用的xcode6,iOS8.0环境下编译的。如果应用是在低于xcode6.0,iOS8.0的条件下编译的。

解决办法:把编译选项中的linker framework automaticlly 设成NO。(xcode6.0 默认是YES)。

5、语音SDK 在iOS8上出现闪退

分析:USCUtil.mm文件 中的类方法+ getCarrier 中代码中没有对SIM卡信息返回为nil的情况做判断。

解决办法:在USCUtil.mm文件的getCarrier方法中做判断,重新编译。

6、获取的语音数据无法播放问题

分析:这种问题,一般是开发者自己代码的问题。

7、有没有直接提供录音数据返回识别文字的接口

分析:这个可以通过定制来实现。

Q:IOS平台的SDK怎么实现一直识别的效果,不需要手动停止?

A:vadtimeout里面不要调用stop方法,但60S后会自动停止。

Q:通用方案下的IOS平台的v2.0.04F版本SDK支持模拟机调试么?

A:不支持模拟机调试,仅支持真机调试。

linux平台

Q:平台2.0上的音频转写方案的linux平台v2.0.04F版本如何设置语种?

A:

1.注释掉
//int ret = usc_create_service_ext(&handle, host, port);

2.修改成
int ret = usc_create_service(&handle);

3.Start之前调用
ret = usc_set_option(handle, 20, Language);

NO.5 使用释疑

Q:我所创建应用的数据能看到吗?

A : 可以。您可以使用创建应用的帐号,登录开放平台2.0,在应用统计页面进行查看。

Q:应用统计能获取到哪些数据和信息?

A : 包含访问次数、活跃用户、新增用户、错误统计、用户地域分布的统计。开发者可以按照时间维度和应用名称进行查询。

Q:为什么我的应用统计不到使用数据?

A : 您所创建的应用,如果使用的是离线功能,则数据是统计不到的。如果是非离线服务,统计不到数据,请您及时联系我们。

Q:为什么在线版本有时候响应速度慢?

A : 当使用2G网络或者网络信号较差时,可能会有反应慢的情况。建议您使用3G网络或者wifi。

Q:为什么离线版本识别准确率比较低?

A : 离线版本的语料库是保存在本地的,语料资源有限,对一些生僻词汇识别的识别较在线版本的准确度肯定会差一点。如果条件允许,还是建议使用在线版本,可享受更加精准语音服务和识别效果。

Q:国外可以使用你们sdk吗?

A : 国外也可以使用。只要能够正常访问或ping通dev.hivoice.cn,只不过由于网络问题,可能速度没有国内快。

Q:微信公众号能不能使用云知声的语音服务?

A : 只有经过认证的企业微信服务号可以接入云知声的语音服务,订阅号及非认证服务号不能接入。

Q:怎么将wav格式的音频转换为pcm16k16bit的文件?

A : 可以通过Adobe Audition或者ffmpeg来转换。