Press "Enter" to skip to content

搬搬砖_w3cool.com Posts

BLEU,ROUGE,METEOR,ROUGE 浅述自然语言处理机器翻译常用评价度量

客观评价指标 – BLEU – ROUGE – METEOR – CIDEr 主观评价指标 – 流畅度 – 相关性 – 助盲性 客观评价指标 实际上可以看出由于最后生成的目标内容是自然语言描述语句,因此评价VTT质量的客观标准都来源于自然语言处理领域的相关评价指标。这些指标原先都是用来度量机器翻译结果质量的,并且被证明可以很好的反应待评测翻译结果的准确性,并且与人类对待评测翻译结果的评价存在强相关,主要包含4种:BLEU,ROUGE,METEOR,CIDEr。 – BLEU ROUGE METEOR CIDEr 主观评价指标 流畅度 相关性 助盲性 除了客观的自动化度量标准以外,人工主观的打分虽然效率不高,但是也是评价很多算 法性能的重要指标,微软在其VTTChallenge2016中提出了三点主观评价标准: 1) 流畅度:评价生成语句的逻辑和可读性。 2) 相关性:评价生成语句是否包含与原视频段相关和重要的物体/动作/事件等。…

Leave a Comment

谷歌做了两年“小程序”,终于要深度整合到安卓和Windows系统中了

谷歌推出PWA技术,能显著提高用手机浏览网页的体验。安卓和微软都整合了这项技术,苹果却落后了。 编者按:可靠、快速、流畅、安全……这些都是谷歌“小程序”的标签。这项名为Progressive Web Apps、已经推出了两年的技术,在今年很可能走向发扬光大——在谷歌爸爸的助推之下,PWA将获得与Android原生应用同等的待遇与权限,微软的Edge浏览器也宣布将要深度优化、支持PWA。未来谷歌小程序的表现如何,让我们拭目以待吧。谷歌多年来一直试图增强手机上的网页浏览体验,现在有充分的证据表明这一努力正在取得卓越的成效。 当你拿出移动智能机,利用Facebook浏览新闻故事或打开浏览器查找电影,可能是一件相当费力的事情。因为,即使网速再快、手机再高端,通过手机浏览网页也仍然是相当之慢。 解决这一问题的一种关键方法是一种Progressive Web Apps(以下简称PWA)的技术,它是由谷歌开发的,在今年的Google I/O开发者大会上得到了推广。通过PWA,即使在网页端也可以流畅舒适地浏览网页,如同使用原汁原味的App。网站加载速度会变得很快,即使没有网络连接也可以工作,在有新消息的时候还可以推送给你。 一个很好的例子是今年4月新发布的Twitter Lite网站。谷歌说,人们使用它的时间比之前的版本多了大约50%,他们浏览的页面数量增加了60%。新网站的加载速度快了30%,放弃它的人也减少了10%。 这是一个很重要的进步,它使得人们能够更方便地访问互联网。网络是自由的,不受任何一家公司垄断控制,缩减App和网页浏览之间的体验差异可以很大程度上削弱科技界不同领域之间的壁垒。无论你是在使用微软的Windows电脑、苹果的mac电脑还是谷歌的Android手机,你都可以浏览因特网。但如果网络本身很糟糕,它就无法让我们超越以上所说的终端的分歧。 网络的进步拓展了计算机科学领域的新领域——虚拟现实、增强现实、汽车、智能电视、带有视频屏幕的语音操作扬声器(如亚马逊新近推出的Echo Show)等等。网络创造了一个公平的竞争环境,让初创者更容易获得立足之地。如果你想从Mac电脑切换到Windows电脑,或者反过来,网络会让你的行动变得更流畅。 谷歌公布方法 虽然有了PWA,但是在不要期望能够彻底将你的原生应用程序抛弃。但是,PWA有很大可能流行起来。 “现代移动网络已经成为主流。”谷歌副总裁、Chrome浏览器项目领导者拉胡尔·罗伊·乔杜里说。罗伊·乔杜里在周三的I / O大会上公布了新的PWA计划。 在展示中,他宣布了三个让PWA变得更好的计划。首先,谷歌推出的“Workbox开发者工具”旨在帮助程序员开发PWA;其次,用于测试这些应用的灯塔服务现在已经直接嵌入了Chrome本身;最后,Google完成了“聚合2.0”,这是一组代码,开发者可以用它来开发一种叫做web组件的相关技术。 推特热爱PWA Twitter是一个PWA的死忠粉——不信你可以试着用手机访问mobile.twitter.com。 Twitter表示,Twitter精简版的大小为400千字节,仅仅是Android应用的2.5%大小。对于网络速度很慢或流量包不够大的人来说,这是一个非常诱人的特点。而且,根据Twitter的说法,精简版的耗电量也比原生版本更小。 一旦你为它创建了一个主屏幕图标,它会迅速启动,比原生应用快好几秒。它们也更容易安装,因为你所需要做的就是打开网站。当你使用它时,它会自动在后台准备好全部功能。 Chrome和Firefox已经在深度使用PWA技术了。微软正在把它整合到自家Edge浏览器之中,融入Windows…

Leave a Comment

昨天刷屏朋友圈的匿名社交小程序,被微信封了

昨天没聊的,不好意思,今天想聊也没机会了。 昨日晚间,一款名为匿名聊聊的社交应用火了并且在极短的时间内就攻占了朋友圈。这是在微信不断优化小程序,推出附近的小程序等功能后,事实上最火且达到刷屏效果的一个小程序。 一开始朋友圈中间或有一两个人分享这款小程序,随着熟人朋友间的口口相传以及裂变式的传播,很快这款匿名社交应用就被很多人所了解。这种熟人之间的匿名社交,很像中国最早的一款社交产品——“中国版的秘密”无秘。 在微信朋友圈中,有人评价称社交+小程序才是王道。而在微博上,用户也没少提及匿名聊聊,内容大体为平日说不出口的话、感情等。从微信朋友圈和微博等渠道用户的反馈来看,这款匿名社交确实引起了一阵骚动。 然而始料未及的是,匿名聊聊很快就被暂停服务。微信方面给出的理由是,小程序匿名聊聊“涉嫌诱导分享”。查阅匿名聊聊的运营主体,为厦门游卡顺网络科技有限公司。有媒体报道,从它的“服务及数据”接口来看,它还有个产品叫朋友印象。 早前兼具实名、匿名功能的社交应用朋友印象曾通过“查朋友圈来访”等微信朋友圈小应用迅速获取大量用户,但此举成功引起了腾讯的注意,并6次被封杀。但随后腾讯与软银中国一起向朋友印象注资。这笔融资发生在2015年,软银中国、腾讯、京东众筹等参与了朋友印象的Pre-A轮3300万人民币融资。 除了软银和腾讯外,朋友印象在上线之前曾获得俞敏洪、六禾创投总裁王烨以及正和岛投资总裁陈里的认可和支持。另外,朋友印象的股东中还包括任志强、潘石屹、张歆艺等多位商界大佬、演艺界明星。 不过,这样的匿名社交应用虽然可以爆红,但能长久的活下去吗?毕竟无秘已经消失在人们的视野中,而朋友印象尽管偶尔会在朋友圈刷一下存在感,但还不能够称得上是受欢迎的匿名社交产品。

Leave a Comment

如何以Uber的方式充电,“惠充电”发布云盒以及充电类小程序,进行车桩共享

用户可以通过关注微信公众号“惠充电EVchar”实现居住地、工作地、目的地充电桩的查询、预约充电等。 近日,据新华社消息,按国家能源局规划,2017年中国将新增充电桩80万个,其中专用桩70万个,公共桩10万个。在此前,2015年10月,四部委联合还曾印发《电动汽车充电基础设施发展指南(2015-2020)》,提出到2020年,我国要建成充电桩480万个,满足全国500万辆电动汽车充电需求。业内称之为“双五百万”目标,即车桩比接近1:1(新能源累计)。计划归计划,目前消费者购买电动车的仍然存在顾虑,其中一个很重要的原因就是充电不方便。固定充电桩设施跟不上的原因有很多,用地建设困难、充电桩商业模式尚未打磨成熟是其一,其二,电网早在城市规划时就已大致落定,升级改造困难,考虑到未来电网的耐受力,充电桩的安装或许将采取配额制,受到政策、资质、物业的管控。反观国外车企特斯拉,在收购Solarcity后做的是从太阳能发电、储能、能源消耗(汽车)的产业链打包,以降低对电网的依赖。我近期接触的“惠充电”希望打造的是一个连接人与人、人与车、车与桩的共享充电桩平台,用户可以通过关注微信公众号“惠充电EVchar”实现居住地、工作地、目的地充电桩的查询、预约、充电、支付等功能,减少用户在寻桩过程中消耗的时间,并且利用闲置资源,还给用户带来一定的收益。 近日,惠充电发布云盒产品以及充电类小程序,上海云充新能源科技有限公司CEO及惠充电品牌创始人李志博现场做了产品演示,介绍了公司的充电桩共享模式及与之配套的云盒产品、惠充电小程序。 李志博表示,当前电动汽车充电桩分布数量跟不上市场需求,另一方面个人充电桩的闲置率却高达90%,因此如果将充电桩桩主整合起来,鼓励他们通过惠充电平台在空闲时段将自己的充电桩设置成共享,其他电动车主便可前来充电,既满足充电需求,又提升了资源利用率,还能给桩主带去收益。 李志博介绍道,对于想要加入惠充电共享充电平台的个人充电桩主,只需要在原充电桩上加装惠充电云盒就可实现充电桩智能化,一键共享等功能。同时,通过云盒,个人充电桩主可对充电桩进行远程控制,预约充电时间,实时掌控充电状态等功能,可以实时监控是否充上电了、以及充了多少等问题。另外,车主可以享受半价电,年用车电费就省了一半,也能通过云盒的共享功能赚取收益,利用闲置时间共享充电出去,还能带来很好的收益。 此外,惠充电还发布了全球首个充电类小程序,用户不需要安装APP或购买充值卡,直接打开微信扫一扫,就可以实现充电桩查询、预约、充电、管理等功能,以更少的流量、更小的内存实现更快的充电体验。

Leave a Comment

自媒体电商联盟 SEE 推出小程序电商 SaaS “小电铺”,为自媒体变现提供新路径

内容需求的千人千面,正与新零售满足消费者个性化需求的趋势不谋而合 36 氪曾经报道过的自媒体电商联盟 SEE 近日在其主办的首届“自媒体电商大会”上推出了自主开发的电商小程序工具:“小电铺”。 作为 SEE 的 2.0 升级产品,“小电铺”是一款小程序电商 SaaS,由 SEE 团队独立开发,能够帮助自媒体进行实物和虚拟产品电商交易。较之于现有的为自媒体公众号提供电商载体的平台,SEE 的创始人万旭成提到,小电铺的主要优势在于以下三方面: 小电铺作为一个小程序不仅可以置顶,也能够添加到文章主页或直接进行推送、分享,因此,小电铺首先为 C 端用户提供了一个稳定、直接的购买入口。根据 SEE 前期的数据测算,和传统的 H5 链接入口相比,以小程序作为入口之后,用户的入店率从 5% 提升到了 20% 。…

Leave a Comment

CB Insight发布2017年Q1区块链新兴企业融资概览,市场逐步回暖

区块链投资逐步回暖 CB Insight近期发布2017年Q1区块链新兴企业融资概览,数据表明区块链新兴融资逐步回暖。 区块链本质上是一个去中心化的数据库,利用一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。而区块链新兴企业是依靠区块链框架作为基础,提供有关加密货币交易、储存或使用的生产或服务,同时也提供区块链领域内或跨领域的解决方案。 交易笔数与交易额 截止至2017年Q1,区块链新兴企业融资交易笔数连续三个季度上升,交易额也在2016年连续4个季度下降后回升。 2017年Q1最大的一笔交易为BitFury获得中国信贷控股有限公司3000万美元C轮投资。BitFury以比特币挖矿起家,如今从事比特币咨询并相关业务并提供区块链行业解决方案。近期BitFury还为格鲁吉亚完成了记录土地所有权的区块链项目。 融资阶段 从融资阶段上分析,我们并不能总结出过多的结论,但是CB Insight以及目前有大部分种子轮及天使轮的区块链项目在采用crowdsale的模式募集资金,即首次货币发行(ICO),也可理解为加密代币众筹。36氪此前也专门针对ICO进行过剖析与报道,“加密代币众筹ICO:首次真正意义上的VC革命 | 投资人说”。ICO最具代表性的例子,当属以太坊(Ethereum)。2014年,以太坊创始人Vitalik Buterin通过公开众销的方式,筹集了高达1 800万美元的以太币(以太坊网络的加密币)。如今,这数字可能要乘以150倍,而且肯定还在继续膨胀。 无独有偶,此前普华永道在近期发布的《2017全球金融科技调查中国概要》中预测,在未来五年,电商平台、大型科技公司和传统金融机构将合力颠覆三大领域:零售银行、投资及财富管理、资金转移支付。而掌握人工智能、机器人流程自动化和区块链这三项创新科技,将成为改变金融业的抓手,并使从业机构获得较大竞争优势。 中国鼓励区块链发展 中国政府正在大量投资一些较贫穷的地区,并计划在全国范围内建设区块链园区,以吸引一些全球顶尖企业的投资。ICO目前在中国并不受管制,越来越多的区块链创业公司选择销售虚拟货币,以提高创新能力和资本增长。可以说,中国政府不认为ICO是一种威胁,实际上,中国政府没有阻止其发展就是一种变相的鼓励。 过去一年来,中国市场出现了一系列联盟: 中国分布式总账基础协议联盟 (China Ledger Alliance):将致力于开发研究分布式总账系统及其衍生技术,其基础代码将用于开源共享。 金融区块链合作联盟(深圳)(Financial Blockchain Shenzhen…

Leave a Comment

根本停不下来!给它一个轮廓,TensorFlow还你一只完整的喵

只要画出一个轮廓,人工智能就能自动根据你给出的轮廓画出喵星人来。 本文首发于大数据文摘公众号(微信ID:BigDataDigest)作品,转载请联系zz@bigdatadigest.cn,作者:Aileen,姜范波 说起人工智能,最经常被人提起的案例就是可以训练机器分辨图片哪些是猫那些是狗。这两天人工智能圈继续拿毛孩子们搞事情,火了一个叫做edges2cats的玩意儿。一个叫Christopher Hesse的人用大约2000张猫的图片和从这些图片自动产生的边缘线进行训练,做了一个网页版小应用:只要画出一个轮廓,人工智能就能自动根据你给出的轮廓画出喵星人来。作者本人亲自示范如下,是不是可爱炸了!? 这个插件只是一系列项目的一小部分。整个项目开发了一个用TensorFlow的pix2pix接口(https://github.com/phillipi/pix2pix),并建立了一些训练好的模型,搭建了一个互动网页来测试它们。Pix2pix 模型通过用配对图片进行训练,比如建筑物的名称与其外观照配对,然后对任何输入的图片,输出对应的图片。这个想法源自Phillip Isola写作的非常棒的论文。(https://arxiv.org/abs/1611.07004)除了轮廓画猫之外,还有轮廓画包包,轮廓画鞋子,等等。之所以这个插件最出名当然是因为广大技术宅男宅女对毛孩子们的热爱啦,谁不想分分钟画出自己心目中的小猫咪呢?大家纷纷晒出自己的成果(和很醉人的画风),整体效果还是不错的: 之后就有点被玩坏了… 还有这些(喂,让你画猫啊谁让你乱画的)…… 作者解释了有些图片看着非常诡异,大概是因为当一个动物看起来不太对劲,尤其是眼睛附近不太对劲时,很容易觉察到。自动产生的边缘线并不是很完美,很多情况下检测不到猫的眼睛,使得图片翻译效果差强人意。 比如下面的Hello Kitty要哭晕了: 看到这里你是不是也跃跃欲试了呢? 请戳https://affinelayer.com/pixsrv/,建议使用Chrome 浏览器。 这里我们也简单介绍一下其他的小插件,有兴趣的话也可以去试试哦。 Facades画建筑物: 用建筑物的外观图片与其对应的标签图进行训练,虽然看起来它似乎对大片的空白无所适从,但是如果有足够多的窗户,则通常可以得到不错的结果。如果想清除一些不想要的东西,在上面画“墙壁”颜色的长方形即可。 edges2shoes画鞋子: 用Zappos收集的大约5万张鞋子图片及基于这些图片自动生成的边缘线图片集训练而成,如果你很擅长画鞋子的边缘线,那么你可以试着做一些新的设计。记住,用于训练的图片是基于真实物体,所以如果你能够画3维立体画,效果会更好。 edges2handbags画包包: 与前面的鞋子相似,用亚马逊收集的含有约13万7千张的包包图片及其对应的边缘线图片进行训练,如果在这里你画一只鞋子,而不是一只包,那么你会得到一个花纹非常怪异的鞋子。 如果你对开发技术有兴趣: 这些模型可以用pix2pix.py进行训练,并从pix2pix-tensorflow(https://github.com/affinelayer/pix2pix-tensorflow)中导出。测试版的交互界面通过Canvas API用javascript写成,通过TensorFlow与后端运行图片的服务器对话。后端服务器既可以本地运行Tensorflow,也可以将请求转发给谷歌搭载TensorFlow的云端服务器Cloud…

Leave a Comment

移动设备上实现“诗人”也能用TensorFlow

TensorFlow移动团队的技术主管讲解TensorFlow 编者注:本文来自微信公众号“OReillyData”(ID:OReillyData),本文原始刊登在Pete Warden的博客里, 授权转载。 在《诗人也能用TensorFlow》那篇博文中,我介绍了如何使用你自己的图片来训练一个可识别图片对象的神经网络模型。接下来就是将这个模型运用到你的移动设备中。在这篇文章中,我会介绍如何在你的iOS应用程序中运行这个模型。 可以通过下面的视频及注解了解详细的操作步骤,点击查看视频。 我假定你已经完成了《诗人也能用TensorFlow》的步骤。 所以你应该已经安装了Docker, 并在home路径下创建了一个tf_files的文件夹。这个文件夹里有一个包含你的模型的retrained_graph.pd文件。 如果你还没有完成以上步骤,你需要按照《诗人也能用TensorFlow》教程示例来完成你自己的模型训练。 第一步,打开Docker QuickStart Terminal并利用最新的Docker镜像启动一个新的Docker容器。 本教程依赖了一些TensorFlow的新特性,所以用于《诗人也能用TensorFlow》的v0.8版镜像不能用了。 docker run -it -p 8888:8888 -v $HOME/tf_files:/tf_files tensorflow/tensorflow:nightly-devel 你应该可以看到自己在一个新的shell窗口中,提示符以“root@”开头,以“#”结尾 ,这表示你已经运行在Docker镜像中了。为了确保设置正确,请运行ls -lah…

Leave a Comment

技术大咖教你用TensorFlow为图片添加字幕

图片字幕生成模型结合了近年来计算机视觉和机器翻译方面的进步,通过使用神经网络来生成现实图片的字幕。 编者注:本文来自微信公众号“OReillyData”(ID:OReillyData),本文相应的Python代码和iPython notebook都在GitHub上,我们邀请你去访问。 如何使用TensorFlow来构建和训练一个图片字幕生成器: 图片字幕生成模型结合了近年来计算机视觉和机器翻译方面的进步,通过使用神经网络来生成现实图片的字幕。对于一个给定的输入图片,神经图像字幕模型被训练来最大化生成一个字幕的可能性。可以被用来产生新颖的图像描述。例如,下面是用MS COCO数据集训练的一个神经图像字幕生成器所产生的字幕。 图1. 来源:Paul Puri。图片来自MS COCO数据集 在这篇文章里,我们会介绍一个中级程度的教程,教大家如何使用谷歌的“Show and Tell”模型的一种变形和Flickr30k数据集来训练一个图片字幕生成器。我们使用TensorFlow的框架来构建、训练和测试我们的模型,因为它相对容易使用而且也有一个日益庞大的在线社区。 为什么要生成字幕? 近年来在计算机视觉和自然语言处理任务上应用深度神经网络的成功激励着AI研究人员去探索新的研究机会,交叉连接这些之前互相独立的领域。字幕生成模型就必须去对视觉线索和自然语言的理解进行平衡。 这两个传统上无关的领域的交叉有可能在更大的范围内产生变革。这一技术现在已经有一些很直接的应用。比如,为YouTube视频自动生成摘要或是标注未标记的图片。而更多的有创造力的应用则会大幅度提高一个更广泛的人群的生活质量。与传统的计算机视觉试图去让计算机能更好地接触和理解这个世界一样,这一新技术具有进一步让这个世界对人类更加可达与可理解的潜力。它可以是一个导游,甚至可以成为日常生活的一个视觉帮助服务。比如意大利的AI公司Eyra所开发的Horus可穿戴设备所展示的这个场景。 需要一些安装工作 在我们正式开始前,需要先做一些整理工作。 首先,你需要安装TensorFlow。如果这是你第一次使用TensorFlow,我们推荐你先看看这篇文章《你好,TensorFlow!从零开始构建和训练你的第一个TensorFlow图》。 你需要安装pandas、OpenCV2和Jupyter库来保证相关的代码可以运行。不过为了简化安装的过程,我们强烈推荐你使用与本文关联的GitHub库里的这个Docker安装指南。 你还需要下载Flickr30k图片文件和图片字幕数据集。我们的GitHub库里有也提供了下载链接。 现在,让我们开始吧! 图片字幕生成模型 图2. 来源:Shannon…

Leave a Comment

Linux 装字体

1. 拷贝Windows系统中C:\Windows\Fonts 中所有中文字体到Centos系统/usr/share/fonts/ 目录。 2. 建立字体缓存 mkfontscale mkfontdir fc-cache fc-list # 检验字体是否包括上传字体

3. 重新启动Java或者Centos

Leave a Comment