中国知识提取引擎Facebook财报新闻时Google实时股价市值

  • bte365贴吧_bte365最少充值多少钱_bte365官网客服炒作 2019-11-07 13:11:42 【作者】: bte365贴吧_bte365最少充值多少钱_bte365官网客服推手刚总 【阅读】:170
<>

作为文字工作者,我每天都在跟查找引擎打交道。
比方在写 Facebook 的财报新闻时,Google 能够告诉我它的实时股价、市值、近期高低点等非常有用的信息。
但其实,还有另一个东西比 Google 更好用,那就是 Wolfram Alpha。它比 Google 更进一步,能够用结构化的方法直接列出我或许需求的常识。
举个最简单的例子:我家带宽是 75Mbps (9.375MB/s),要下载一个100GB的文件需求多久?我能够直接用自然语言询问,Wolfram Alpha 不仅会告诉我答案,还会写出公式:
它不仅是一个数学东西,仍是一个很好的常识聚合东西。比方最近电影《小丑》很火,假如我想写关于它的文章,上 Wolfram Alpha 一搜就能找到许多细节,包含并不限于影片信息、排名和票房等。
精确来讲,Wolfram Alpha 并非一个查找引擎。它的官方定义叫做“计算式常识引擎”,能够用来答复那些没有揭露答案,可是计算一下即可得到的问题。而且,它用结构化的方法去展示答案,而不是像查找引擎那样,把链接一条一条列出来。
接下来介绍今日文章的主角:Magi,一个最近几天在我的技能圈朋友中心小有名气的东西。
Magi(网址 https://magi.com)看起来也像是一个查找引擎:
可是只需玩上一次,就会发现,它和你印象中的所有查找引擎都大不相同。
当我用它查找词条“易烊千玺”时,得到了下面的成果。
首要,答案供给了对易烊千玺的几个关键描述,如“TFBOYS的成员”、“00后国民偶像代表”等。紧接着,它列出了关于词条主人的几乎悉数的重要属性,包含由他出生年月、参演的影视作品、发表的音乐专辑等。
答案的结构化展示方法,和 Wolfram Alpha 颇有相似。
甚至连千纸鹤(易烊千玺粉丝代称)的应援色都答了出来
更有趣的是,magi.com 还答出了易烊千玺的几个近义项,比方他的昵称、代称和他所养的宠物等等。
有时候,Magi 还能给出一些令我哑然失笑的成果……
输入了一下“新世纪福音战士”。答案的描述中有“业界有名的劳模”……
又搜了一下小岛秀夫,答案里的“专长”一项我也是醉了……
接下来搜了一下富坚义博。
或许由于职业生涯中大部分时刻都在拖稿,magi.com 告诉我富坚的业余爱好是“画画漫画”……
当然,大部分时候 magi.com 给出的答案仍是比较靠谱的。
查找到的答案,每一条都会用以绿、黄、红三种颜色表明其可信度从高到低;在答案的右侧则会供给几条链接,用鼠标划过它们即可看到,答案是从哪个/哪几个详细的来历学习到的:
你会注意到,magi.com 的成果中,答案在正下方,链接跑到了右边,跟干流查找引擎的用户界面完全是反的。
这就是 Magi 和干流查找引擎最大的差异地点:链接关于它不是成果,答案才是。
这是由于 Magi 并非查找引擎(虽然具有一些查找引擎的功用)。它实际上是一个依据机器学习的常识引擎,能够检索和提取任何领域自然语言文本,将其间的常识提取出来,构成结构化的数据。
说得简单一点:
咱们都知道,互联网上有着许多的,依据文本的信息,当中蕴藏着许多的常识。可是,计算机读不懂互联网上大部分的信息,由于这些信息往往不是以“性别:男”、“国籍:我国”这样的结构化形状,而是以自然语言的形状出现的。
比方,”埃菲尔铁塔的高度“是一个入门级的问题,由于早已有人整理出了正确的答案,写在维基百科和旅游网站上;可是想知道“埃菲尔铁塔的第二节电梯线路有多长”,就很难在查找引擎上查到精确信息了。这是由于很少有人会把这些细节的数据,以结构化的方法记录在互联网上。
这就是 Magi 想要解决的问题:从敞开领域的纯文本当中提取常识,并让其可解析、检索和溯源。
Magi 来自我国团队 Peak Labs,创始人季逸超在开发者圈子内也小有名气。2011年,还在北大附中读书期间,他就单独完成了猛犸浏览器 iOS 的开发。次年,他只用两天时刻就完成了 Rasgueado,第一个支撑划动手势操控光标位置的 iOS 输入法
2012年,季逸超创办了自己的公司,持续推进浏览器和输入法项目。现在,Peak Labs 主要精力都放在 Magi 项目上,专心于背面的技能,以及相关商业产品的开发。
中心:季逸超
Peak Labs 并没有计划将 Magi 和 Google、百度之类的干流查找引擎相提并论。把 Magi 做成一个“查找引擎”,主要是为了让大众有机会能够体会它背面的技能,感受它能够供给的价值。
即便如此,看起来很像查找引擎的 magi.com,实力仍是不容小觑。事实上,为了这个示范性质的产品,Peak Labs 并没有选择小聪明的方法,从其他查找引擎抓取成果,而是从零开发了一套互联网查找引擎。
”咱们的成果的摘要比一般的查找引擎都长,是的,咱们是故意为之。这足以证明咱们的成果不或许来自其他查找引擎,“季逸超在官网上写道。
依据用户输入问题、关键词和表达式的不同,magi.com 能够用不同的方法来出现答案——详细的出现方法也展示了 Magi 体系的才能。
比方,输入“打车软件公司”,Magi 体系能够把它知道的所有手机叫车公司,以“调集”的方法列在答案里。
而在百度上,得到的成果如下。能够看到百度的常识图谱也供给了相似的成果,只是看起来有四、五年没有更新过了:
再比方,假如输入“八角 大料”,Magi 体系会发现这两个关键词其实是同一个东西,它就会以“断语”的形式给出答案。
如下图,magi.com 告诉我,八角和大料是“近义项”,是“又称”、“也称”的联系。
Magi 体系能够24小时不间断地进行学习。它的时效性也还算不错,Peak Labs 声称实时新闻当中的常识,Magi 只需求 5 分钟就能够把握,而且还能够采纳新的信息源进行穿插验证,完成自动纠错。
假如你在 magi.com 的首页逗留一会,就能看到它当时正在学习的链接:
除了自主开发的全网规模查找引擎以外,Peak Labs 还开发了依据注意力机制的神经信息提取体系,不依赖无界面浏览器的分布式抓取体系(爬虫程序 MagiBot),以及支撑混合处理170多种语言的自然语言管道。
这四者结合在一起,才是 Magi 体系的全貌。
作为 EVA 粉,这儿不得不打断一下:Magi 以及它的四个子体系,名称悉数来自《新世纪福音战士》(EVA 本身取材自圣经等其他西方宗教经典),而且命名里也有彩蛋:
Magi(三贤者,多个体系组成的超级计算机)
查找引擎 Ramiel(雷天使,)
神经信息提取体系 Ireul(恐惧天使,拥有学习和进化才能)
自然语言处理管道 Arael(鸟天使)
爬虫程序 Matarael(雨之天使,外貌像蜘蛛)
Peak Labs 在官网指出,现在的 Magi 技能还没有完全成熟。
的确如此。现在通过 magi.com 能够观察到一些问题,比方许多能够在干流查找引擎中简单找到的答案,magi.com 给不出来(通常是由于它还没有学到);
比方查找“世界上最富有的人”时,我想要的是 Magi 能告诉我当时谁最富有,但它只能告诉我最富有的那一群人:
比方消歧义的把控,简单导致答案紊乱(这一点季逸超自己在知乎上[1]也有所说到):
隔壁老王不大或许是你的亲戚

1526005249754415-lp-lp.jpg

再比方,碰到一些实在太“复杂”的词条,magi.com 就凌乱了……
不过正如前面说到,这个查找引擎并不是 Peak Labs 的最终产品——他们的真实意图,是借助查找引擎背面 Magi 体系的力气,供给企业级的服务。
Peak Labs 的官网指出,他们希望未来的 Magi 体系能够成为“常识领域的 ImageNet”。它已经展示出的敞开领域信息提取才能,能够应用到企业客户地点的细分领域内,变成一个愈加强壮的信息抽取体系,让每一个领域、每一家企业都能够轻松地打造归于自己的常识图谱。
“也许在不远的未来,伴随着整个职业的前进,Magi 所构建的包容万事万物的结构化bte365贴吧_bte365最少充值多少钱_bte365官网客服,将成为通向可解释人工智能的基石。”Peak Lab 的网站这样写道。
——希望这个愿景能够完成。(就算完成不了也没联系啊!拿 magi.com 搜些古怪的东西,仍是能得到不少笑料的……)
假如你对 Magi 的技能细节感兴趣,能够点击下方“阅读原文”到 Peak Labs 网站进一步了解。季逸超在知乎的答复也做了愈加翔实的论述。
[1] 季逸超在知乎问题《怎么点评 Peak Labs 出品的 2019 版 Magi 查找引擎?》的答复 https://www.zhihu.com/question/354059866/answer/881655371
除了部分截图,其他均来自 Peak Labs 网站和前述知乎答复

更多阅读

新中国不平凡的70年历程前30年

论坛新闻发布 2019-10-01
回望新我国不普通的70年进程,前30年与后40年既有一脉相承的主线,也有经济开......查看全文

专业的自媒体短视频疯涨、直

论坛新闻发布 2018-08-22
用数据说话一向是互联网职业的好习惯,谈再多情怀,再多构思,再多风口,也......查看全文

外商广告电视广告营业额一度

论坛新闻发布 2018-08-11
1991年,我国的电视广告营业额,初次打破10亿大关。 在今日这个广告无处不在......查看全文
返回全部新闻
扫描二维码分享到微信
确 认

友情链接: bte365贴吧_bte365最少充值多少钱_bte365官网客服炒作 bte365贴吧_bte365最少充值多少钱_bte365官网客服水军公司 bte365贴吧_bte365最少充值多少钱_bte365官网客服水军

玛格bte365贴吧_bte365最少充值多少钱_bte365官网客服水军团队bte365贴吧_bte365最少充值多少钱_bte365官网客服炒作团队欢迎您的光临 © 2008-2018 玛格bte365贴吧_bte365最少充值多少钱_bte365官网客服水军公司版权所有 京ICP备15004678号-2

扫描二维码咨询我们:正义之风
确 认