调教属于你的“贾维斯”(给自己挖了一个很大的坑)

今天玩一下现在很火的人工智能

废话不多说,先来看几张图:

看出什么蹊跷了吗?

再来看一个视频:

演示网址和代码见文末

人工智能离我们有多远?你觉得只有战胜柯杰的阿尔法狗才算是人工智能吗?看看周围:你的美颜相机、你刷的抖音推荐、你手机上的语音助手……甚至包括给你送外卖的小哥分配,现在都少不了人工智能的参与。

《钢铁侠》中的智能管家贾维斯,如今看起来也不算那么“科幻”了。不少厂家最近都推出了智能音箱产品,可以语音聊天及控制家里的智能家居设备。

不过,我想要一个自己的“贾维斯”。

这个想法由来已久。现在看来,实现的可能性越来越高了。因为各种AI平台智能硬件都已成熟,而 Python 这个胶水语言又可以很方便地把各种模块拼接起来。

最近正好瞥见了一个有意思的新“玩具”--腾讯AI开放平台ai.qq.com),本来只是想简单给大家分享一下。结果我自己写得停不下来,借此机会开启我的调教之旅。(这回一定是一个深坑)

这次用到了AI平台的语音识别智能闲聊语音合成,把这三个功能串起来,实现了语音智能应答的功能。

目前功能可以说是十分初级,不过总要有个开始嘛,反正我有的是时间去打造她。

接下来的一些计划:

  • 增加摄像头,实现人脸识别和场景定位

  • 接上一个机械臂。之后所以无脑操作类的手机游戏,你们就别想跟我一起冲排名了

  • 安上轮子

  • 连接无人机

  • 当然,肯定还少不了树莓派

虽然还没想清楚最终会做出个什么东西,但这不重要,对我来说过程已经够有趣了。(应该整不出一个奥创来)

另外昨天还顺手拿人脸融合的接口做了个在线换装小工具,支持50种模板,想要体验的朋友,点击文末 阅读原文 可进入。

昨天夜里把这个功能上线,朋友圈发了一下,很快就有几百人访问。现在文章推送出去,不知道我那小破服务器能不能顶得住。虽然已经对图片传输做了压缩优化,但还是很危险。如果请求失败,请稍晚些再来体验,或者自己下载代码运行。

外行看热闹,内行看门道。前面的热闹说完了,如果你还想了解更多,我们接下来就说点有信息量的门道。

这次代码用到的腾讯AI开放平台,现在功能已经不少,主要是自然语言处理计算机视觉智能语音三大方向。这次案例的代码,三个方向都涉及到了。

平台文档还算得上详细,也提供了在线功能演示,建议自己上去捣鼓一下。现在只要注册就能申请使用,不收费,作为学习来说也几乎没有限制。比较可惜的是我没看到有 Python 示例,所以你可以参考我的代码来写。(尤其是计算签名的部分,可以直接用我的代码。)

单看独立的 API 并不复杂,简单来说就是一个网络请求,你按要求提供了正确的参数,平台就会返回给你相应的结果。但如果你是刚接触这类接口,我相信你会被坑得鼻青脸肿,因为我也是过来人。

比较明显的坑大约有三个:

  1. 签名。这是开放 API 验证来源身份的标志,也是 API 新手必经的坎。你要了解 md5 的概念(之前文章有提及过【每周一坑】校验文件哈希),并且按照 API 的要求生成正确的签名。除了开始时理解上的困难,在开发调试时,因为最终输出只有一串字符,所以出错时很难 debug,只能一遍遍地仔细检查。

  2. 参数。参数看起来都给你规定好了,但实际用时才发现会有各种问题。比较常见的错误可能是编码。同样,因为缺少调试信息,即使是很低级的错误,也可能让你耗费很长时间。再加上有些你没注意到的文档细节(比如字符长度限制)和错误(语音合成里的请求方法是 POST 但文档上写的是 GET),这个步骤也会让你抓狂。

  3. 返回值。当你排除万难,终于拿到结果的时候,或许会一脸懵逼……因为除了自然语言接口外,图像和声音的返回值大多是经 base64 编码后的数据。你需要自己对这些数据进行处理、存储或展示。而如果你像我一样要把几个接口的功能串联起来,那么等待你的将是各种数据、文件类型的转换。好在 Python 在这方面还算方便,不然真的会痛不欲生。

所以,看起来只是简单的接口调用,对于经验不多的开发者来说,也不是容易的事。但这些光靠看是看不出来的,你必须亲手写过才能体会。写了之后就会发现,一些坑我早就给过预警。不用太过纠结于哪个教程更好,自己动起手来才是最好。

(0)

相关推荐

  • 2025 年及以后人工智能的未来(一)

    Author:Imtiaz Adam - Artificial Intelligence Expert 到 2025 年,人工智能 (AI) 将通过高效处理当今的一些复杂任务来显着改善我们的日常生活. ...

  • 百度Apollo的乌镇电波

    大家好,这里犀利财经特别节目犀利逛乌镇.看到后台很多粉丝留言,要看犀利的互联网大会报道,很窝心. 忙了一天之后,终于有空,坐下来,跟大家好好聊聊天.欢迎调频犀利财经.fm,很高兴认识电波那头的你.今天 ...

  • 机器人技术和人工智能是一回事吗?

    9 个最先进的AI机器人 首先要澄清的是,机器人技术和人工智能根本不是一回事.实际上,这两个字段几乎完全分开. 这两个字段的维恩图如下所示: 如您所见,有两个区域重叠的区域很小:人工智能机器人.在这种 ...

  • 智能系统“贾维斯”或将成真,Facebook创始人将开发AI系统

    今年马克·扎克伯格的计划是为自己家打造一个人工智能系统,类似钢铁侠中的"贾维斯"系统. 看过复仇者联盟2的朋友,应该都知道钢铁侠中的智能系统"贾维斯",能够帮助 ...

  • 无尽学习者修炼指南 v3.0

    当你认准一件事的价值,长期投入:随着时间积累就会慢慢地产生质变.这些年,我就是这样做的--持续在设计与技术交叉领域投入精力. -- Shadow, 上海 我获得了:能自由地.按照内心的想法,创作软件产 ...

  • 科大讯飞国产化AI平台赋能

    人工智能时代,科大讯飞以智能语音技术切入该领域,致力于发展中国自己的计算机语音系统.如今已全面向人工智能转型,获得了不错的成绩. 今天,给大家分享科大讯飞国产化AI平台赋能材料,内容包括讯飞人工智能技 ...

  • 李彦宏的年度“声音大戏”

    如果问你,<钢铁侠>里托尼.史塔克最形影不离的朋友是谁? 答案一定是:其智能语音助手"贾维斯"! 贾维斯不仅照顾钢铁侠生活的方方面面,监测他的身体变化,开发了钢铁侠的机 ...

  • 亮点抢先看之二——华中9型-新一代人工智能数控系统

    新一代人工智能技术与先进制造技术深度融合所形成的新一代智能制造技术,成为了新一轮工业革命的核心驱动力.智能数控系统和智能机床是智能制造的核心和基础. 在中国工程院.工信部的指导和支持下,华中数控和华中 ...

  • 《洛基》新女角色不是人!不仅是女版贾维斯,还是时差管理局吉祥物

    漫威影业的第三部迪士尼+剧集<洛基>今日曝出全新海报,海报上除了一些曾在预告中出现的熟面孔外,还出现了一位令人惊喜的新角色! 我们首先解读一下新海报的构图,这是漫威为数不多不涉及剧透的海报 ...

  • 这大概就是腾讯的“贾维斯”吧!

    就算被灭霸干掉,我也想成为钢铁侠. 钢铁侠,一个标准的富二代,掌握各种核心黑科技,不愁吃不愁穿,还有秘书贴身服侍,是所有男性梦寐以求的存在,<复仇者联盟>中不折不扣的人生赢家. 他作拥百亿 ...

  • 谁才是真正的“钢铁侠”?蓝色起源秘密开展“贾维斯”计划

    据内部人士透露,蓝色起源已开展一个秘密项目,为 新格伦(New Glenn)火箭开发一个完全可重复使用的第二级,该级推进剂罐的材料将从铝合金调整为不锈钢,这一变化的主要目标是降低新格伦火箭的总体发射成 ...

  • 小扎不是做了个贾维斯 而是为老婆孩子编了个爱和关怀的筐

    懂懂笔记 不久的未来,我们的家庭生活会是什么样? 可以先定一个小目标:比如,自己动手做个"贾维斯"? 贾维斯:"先生,你的......" 斯塔克:"别 ...

  • 贾维斯P12笔记本参数

    贾维斯P12笔记本电脑参数(贾维斯P12笔记本电脑详细配置)   2021年新款贾维斯P12笔记本电脑发布后就受到了很多人的关注,是一款非常轻薄的笔记本电脑,接下来一起来看看贾维斯P12笔记本电脑的参 ...

  • 别再羡慕钢铁侠了,华米和苹果要批量制造“贾维斯”

    当人人有一个手环.手表的时代,向人人都有一个"贾维斯"的时代进化,当类似"贾维斯"的服务变得人人可及,或许我们再也不用为失去独一无二的"贾维斯&quo ...

  • 你的电动汽车拥有贾维斯的功能? 这两家车企已经打造幻视了

    在即将上映的<复联3>里,我们已经看不到贾维斯出场的机会了,因为即使再智能的"工具",也将被能与你一起成长,知道你.了解你.更懂你的"伙伴"所替代. ...

  • 美文 | 谋杀贾维斯

    你亲手"杀死"过你的爱人吗?当他消失在这个世界以后-- 01 春香堂有一种香,名叫"色即是空".香体是翡翠的绿色,点燃之后,清凉之中带着捉摸不定的香气.每次当我 ...

  • 度秘,每个人心中都有一个贾维斯

    与BAT的另外两个兄弟相比,百度似乎是幸运的,不用过于精于宫斗和产业链的横向布局,百度的未来始终走在自己的路上.在中国,任何一次成功都可能招致无尽的复制.再复制,好在度秘的身后尚没有存在威胁的跟随者, ...