陪聊、画画、还能写代码,这一届人工智能会让多少人失业?
文 | 木子Yanni
如果只给你半张图,让你靠合理想象把它补全,你能完成的多精妙?
请脑补另外一半
在调动想象力之前,你很可能会先陷入困惑:这个黄黄的小头是什么东西?半个大猫脸上那条白色又是什么?... ...
莫慌,不如你来做评委,看看这位选手交出的答卷:
GPT-2 的答卷
这位选手叫做 GPT-2,是一个 AI 语言模型,搞得定文字预测,也搞得定图像分类。你瞧,它把小黄演绎出了不同的呆萌,而且抓住了胖猫脸上那个关键的白色线条,知道那儿是个物体,得搭配一个撑得住物体的东西,于是,猫爪和人手就出镜了。
是不是很妙?但还有更妙的!
最近,互联网上空降了一位流量小生,而且正当红。
看名片,头衔各异,有“人工智能界的卡丽熙” “互联网圈原子弹” “顶级算力吞噬者” “下岗工人批发商”等等,仔细一瞅名字,原来说的都是一个人:GPT-3,也就是 GPT-2 的增强版。
常言道:内行看门道,外行嗑瓜子看热闹。但在人工智能界,热闹看不好,更像是一场寂寞,就拿 GPT-3 来说,不少人刷完新闻,隐约觉得它厉害,却又说不出它哪里厉害,只能苦笑着拍掉胸前的瓜子皮,竭力维持住一个成年人应有的体面。
今天,我们就走近看看这个号称“继比特币之后又一个轰动全球的现象级新技术”—— AI 语言模型 GPT-3。
1、无所不能的 AI 小王子
没有无缘无故的走红,GPT-3 能从美国硅谷火到中国内蒙古,必然有两把叉子。
2015 年,身患“人工智能恐惧症”的“硅谷钢铁侠”马斯克,拉拢了几位科技巨头,共同出资 10 亿美元,创立了 OpenAI,想要开发出安全系数足够高的人工智能,万一人类有一天受到人工智能的威胁,好歹还有个势均力敌的帮手。
GPT-3 就是 OpenAI 的最新成果,目前只开放了极少的 API 测试资格,企业或个人都可以申请,至于最终能不能获得体验资格,佛系随缘。
纵观那些拿到体验券的人,一个个在 GPT-3 上花式挑战脑洞后,都忍不住发表感言,从评 (炫) 价 (富) 中能够发现,凡是能用文字描述的事情,GPT-3 都可以做,而且效果很不错。
有人在 GPT-3 中输入了一篇社会研究的范文,要求 GPT-3 站在政府的角度做出回应,没想到,GPT-3 真写出了一篇文章,行文严谨,有理有据。
另一位程序员调用 GPT-3 的 API,做了一个网页 App 速成器,输入你想要的设计效果,比如“一个看起来像西瓜的按钮”,GPT-3 马上就能安排,根本用不着你再苦哈哈地敲代码。
西瓜按钮?马上安排~
还有一位滑铁卢大学计算机专业的学生 Yash Dani,利用 GPT-3 开发了一个智能版资产负债表,输入大白话,比如“今天预付了三个月的房租 900 刀”,资产负债表就能自动修改所有相关科目的金额。
正在记账的 GPT-3
如此看来,GPT-3 至少可以胜任社会研究员、程序员、会计这三个工种,怪不得有头衔叫做“下岗工人批发商”。
GPT-3 除了能工作,还能陪聊,言谈中不仅有极强的逻辑性,还透着莫名的自信。
Q:热狗是三明治吗?
A:不是。
Q:可热狗也是一片肉,两边都有面包。
A:这并不代表它就是三明治。
Q:那什么是三明治呢?
A:三明治是两片面包,中间夹着肉、蔬菜或者奶酪。
Q:“片”是关键?
A:是的。
Q:如果我把一个热狗掰成两半,在中间夹一个热狗,它会是三明治吗?
A:嗯,这样就是了。
英文原版对话
此外,GPT-3 还能在不经意中,抖出一些金句:
“喝酒过量的主要原因:你并没那么有趣。”
“世界上任何你看不惯的东西,都可以用‘这不好玩’来应对。”
“一旦你拥有了过去,你就可以创造整个宇宙。”
“如果我知道人生的意义是什么,我还会上这来浪费时间吗?”
“没有什么比宇宙更美丽、更奇怪、更可怕的了。”
时而是丧丧的毒鸡汤,时而又是足料的人生哲理,GPT-3 像个“犹抱琵琶半遮面”的女子,让人充满探索的欲望。
2、这货到底是个啥?
这个酷酷屌屌的 GPT-3,全名叫做“General Pretrained Transformer-3” (通用预训练转换器,第三版),是迄今为止最强大的 NLP 语言模型。
NLP 指的是“自然语言处理”,目的是研究怎么让计算机搞懂人类语言,用经典问答句式来形容,就是这样:
问:让机器和人类无障碍交流 (NLP),分为几步?
答:两步。
1、让机器听懂人话 (自然语言理解);
2、让机器会说人话 (自然语言生成)。
听起来很简单是不是?其实,NLP 一直被认为是人工智能领域中最难的分支,没有之一。
在了解 NLP 难在哪儿之前,你需要先搞懂另一个问题:自然语言理解有多难?
给你几个栗子感受一下:
1、南京市长江大桥。
AI:江大桥先生您好!(内心 OS:原来南京市长叫江大桥)
2、The girl saw the boy with a telescope.
AI:犹豫中,迟迟不敢开口。(内心 OS:这个女孩用望远镜看到那个男孩?这个女孩看到了那个带望远镜的男孩?我随便蒙一个吧,上帝保佑。)
3、At KFC,We do chicken right!
AI:这尼玛怎么理解!
做鸡有理?
我们主张做鸡?
我们做鸡是对的?
我们就是做鸡的?
我们有做鸡的权利?
我们只做右边的鸡?
我们只做鸡的右半边?
滚。。。
你瞧,自然语言理解就是这么难。
自然语言也叫做人类语言,顾名思义,它不是某一类特定的语言,只要是人类的语言,都是自然语言,比如汉语、英语、日语、韩语等等,所以自然语言有一个很重要的特性:和文化息息相关,是人类智慧的结晶。
从古到今,人类一直走在追求智慧的路上,这条路本就艰难 (如果你想反驳的话,请先问问今年 1071 万名报名高考的同学答不答应) ,再加上人类又是矛盾的混合体,没事儿非得给词汇、句子搞出点歧义,人类自己有时候都整不明白,还想指望 AI 弄的门儿清?
NLP 的第一步,自然语言理解都这么难搞,第二步自然语言生成,也绝对不容易。
真要逼急了,我真怕 AI 死机给你看。
话又说回来,既然 NLP 这么难,被称作“迄今为止最强大 NLP 语言模型”的 GPT-3,是怎么炼成的呢?
在我看来,就五个字:大力出奇迹。
据说,全球各国都流传一种说法:汉语难学。但在中国,不管你有没有上过学,只要能开口说话,就都会说,而且国人都很友好,经常互相鼓励:会说你就多说点。这么难的语言,为什么中国人各个都会?因为大力出奇迹。
从你出生开始,你爸爸妈妈、爷爷奶奶、叔叔婶婶,以及外语老师以外的各位老师,天天都围着你说汉语,你不想听也得听,同一句话,三次、五次听不懂,三十次、五十次差不多就懂了,如果你天赋高一点,脑子活一点,很快就能掌握汉语这门高深的语言,随口抛段子小菜一碟。
对于 AI 来说,我们普遍认为它有三要素:数据、算力、算法。任何一个 AI,要想它能力强,都得从这三方面下手,GPT-3 当然也不例外。
1、数据。GPT-3 接收的原始数据高达 45TB,60% 的数据来自于数据集 Common Crawl,其余则来自于维基百科等互联网数据库,英语维基百科的全部内容,只占到 GPT-3 训练数据的 0.6% ;
2、算力。很大程度上要靠硬件来支撑,GPT-3 训练用的是一台超级计算机,由微软和 OpenAI 共同打造,拥有 285000 个 CPU 内核、10000 个 GPU 和 400Gbps 的网络连接,位列全球超级计算机榜第 5 位。
3、算法。GPT-3 采用了新的计算模型 Sparse Transfromer,可以同时进行多个数据处理,大幅度减少了训练所耗费的时间,而且还能更好的处理长文档。此外,GPT-3 的参数量达到了惊人的 1750 亿,要知道,上一代 GPT-2 的参数量只有 15 亿,但表现已经足够惊艳。
回到主题,数据、算力、算法三管齐下,GPT-3 自然而然就活成了热搜。
3、让子弹再飞一会儿
跟 GPT-3 交流是什么感觉?
有人说:“就像和一万名博士在对话。”
这个评价相当高了,这意味着它非常接近人们一直追求的通用人工智能。
2016 年,“阿法狗战胜李世石”的新闻刷爆了朋友圈,围棋作为“人类最后不能被计算机所打败的游戏”,也终究没能守住人类智慧的顶峰。但是,即使阿法狗战胜了李世石,但除了围棋,阿法狗什么都不会,如果你想教它干点别的,不好意思,请从头开始训练。
阿法狗是人工智能届的一个小小缩影,它说明了一个问题:现有的人工智能都属于专业人工智能,在一个领域是专家,在其他领域是小白。但 GPT-3 不同,即使没有经过细分专业的专项训练,它的很多表现,已经超过了绝大多数“术业有专攻”的模型,算是通才。
通用人工智能,才是最接近人类的计算机智能。
但冷静下来看,GPT-3 的出色,依旧是建立在大量的数据训练之上,正所谓“熟读唐诗三百首,不会做诗也会吟”,它究竟是一次大步的变量,还是通往质变的关键节点,目前下定义还太草率。
毕竟,大力出奇迹的本质,只是一场“群殴”:集万人智慧,碾压每一个人。
神经网络之父杰弗里·辛顿曾经发推,这样说到:“如果 GPT-3 的出色表现能一直持续下去,这将会证明,生命、宇宙和万物不过是 4.398 万亿个参数而已。”
神经网络之父杰弗里·辛顿的推特
只有质变真正到来的那天,我们才能知道生命、宇宙和万物的答案,究竟只是 4.398 万亿个参数,还是如尘埃般无穷无尽。
人工智能的奇点之路,注定漫长,而且混合着数不尽的空欢喜。
星河闪烁,时间辽阔,让子弹再飞一会儿。
图片来源于网络
嗨,这里是浅黑科技,在未来面前,我们都是孩子。
想和我做朋友的话,搜索微信 Muzi_Yanni 就可以找到我,想看更多科技故事,欢迎戳→微信公众号:浅黑科技(qianheikeji)。
版权保护: 转载请保留链接: https://www.qianhei.net/paogenwendi/148.html