使用深度学习进行毒性预测* —摘要
未来驾驶中的问题
适用于GM / FORD / MAZDA / VOLVO的VXDIAG VCX NANO PRO 3合1自动OBD2诊断工具
寻找我的地方:CS +社会公益
华盛顿特区DIY Robocar聚会
计算机科学可以教给您什么—德克萨斯州WiCS
Alpaca预测AI预测矩阵的技术背景
Alpaca预测AI预测矩阵的技术背景

2018年6月6日09:06 方法 我们对高频跳动数据进行深度学习,以识别出指示市场预测模型价格变化的模式。 这个想法是,尽管市场上信噪比很低,但是正确实施的算法可以从噪声中提取有用的信号。 我们不使用人工制作算法,而是使用Alpaca的技术(基于最新的机器学习技术)来生成能够自行提取信号的模型。 使用高容量模型,我们可以使用大量原始市场数据来提取较小但重要的事件,而这些事件在聚合数据上或使用较低容量的模型是无法检测到的,从而使我们能够捕获其他看不见的市场事件。 我们使用什么机器学习模型 我们使用我们自己专有的深度学习模型,该模型基于适用于财务数据细节的最先进的卷积神经网络(CNN)。 深度学习是使用由多层组成的神经网络的机器学习领域,能够解决以前棘手的问题。 近年来,它在各种任务上都取得了巨大的成功,从自动翻译,专业游戏到计算机视觉。 特别是在计算机视觉中,深度学习允许开发当前的自动驾驶汽车,自动图像字幕系统和大规模图像分类。 我们从此类计算机视觉技术中汲取灵感,以检测市场格局,使用堆叠式卷积从报价数据中逐步建立更多抽象的格局,并直接对模型进行端到端训练以进行预测。 卷积非常适合该任务,并且使我们可以获得比应用于时间序列的传统递归神经网络(RNN)更高的性能。 有趣的是,在现代自然语言处理研究中也看到了使用卷积代替或与循环单元格结合的趋势。 为了获得更好的性能,我们将多个模型结合在一起以构造最终的羊驼毛信号。 我们为什么使用报价数据 由于羊驼模型的高容量,我们能够将高密度数据直接输入到模型中,并取代大多数手动要素工程步骤。 这使我们能够在模型中逐步学习特征抽象,而不是使用为每种资产手动构建的次优降维技术。 例如,烛台图非常适合将市场信息简化为基本信息,但可能会错过一些对细粒度预测有用的低位模式。 Alpaca还利用了其先进的技术堆栈,该堆栈专门用于处理大量财务数据,例如我们开源的可以在GitHub上找到的市场商店。 绩效评估 在我们的开发周期中,我们根据机器学习最佳实践严格分离培训,验证和测试数据。 我们还考虑了时间序列数据的细节,例如变化趋势,季节性模式和日历事件。 为了获得最佳的性能评估,我们会不断收集实时数据并在具体的实时情况下评估我们的模型,以创建针对我们的用户量身定制的报告。 如果您有兴趣并想一如既往地了解更多信息,请随时与我们联系!

快速学习的陷阱:当泛化变成刻板印象时
快速学习的陷阱:当泛化变成刻板印象时

最近,我根据同名论文写了一篇博客文章,标题为“构建像人一样学习和思考的机器”。 在其中,我讨论了当前机器学习模型中缺少的一些关键技能,这些技能使人们能够通过概括获得的知识来快速学习。 阅读论文和撰写文章使我思考一些使我们能够通过概括快速学习的技能也可能导致我们成见。 在这篇文章中,我将从认知科学的文献中汲取教训,指出合成性,学习性,因果性和推理性使我们能够概括先前的知识并加快学习速度。 我将以玩超级马里奥游戏为例,说明何时可以进行有效而准确的学习。 但是,我将争辩说,泛化在Super Mario游戏中是可行的,因为其中的角色和对象相对简单。 因此,我认为在超级马里奥游戏中成功的归纳可以被视为成功的定型观念。 我以一个现实世界中的例子来结束这篇文章,该例子将一个人刻板为恐怖分子,以证明当人物和对象变得更加复杂时,这种形式的概括或定型观念会导致不正确的推论。 泛化的效用 认知科学家已经表明,通过婴儿期,人类既可以区分有害,有益和中立的行为,又可以通过低级提示将有生命的物体与无生命的物体区分开。 现在,假设您正在玩超级马里奥游戏。 在玩游戏时,您可以使用这些技能快速将有生命的对象与无生命的对象区分开。 此外,根据有生命的物体与您的互动方式(例如,是导致报酬还是死亡),您将学会预测它们是否有害,有用或中立。 但是,您不仅会了解对象是有害的,有用的或中立的。 您将为遇到的对象学习丰富的表示形式。 例如,当您遇到不同的角色(例如Koopa Troopa,Iggy Koopa,Dry Bones等)时,您将学习每种角色的表示形式,这些表示形式详细说明了它们的构成以及它们之间的关系。 这是允许您将遇到的字符的知识应用于新的看不见的字符的一部分。 为了学习这些丰富的表示形式,您可以采用学习,组合,因果和推理的学习方法。 学习,组成,因果关系和推理 从学习到学习就是我们将以前学到的知识应用于新的学习环境的想法。 例如,当您学习表示Koopa Troopa角色时,您可能会重用对口,眼,脸和壳等概念的了解。 要组合这些部分以表示更复杂的内容,请使用compositionality 。 组合性是一个对象可以(可能无限地)分解成其各个部分及其关系的想法。 也就是说,您可以将Koopa Troopa分解为它的面,外壳和喙,然后将Koopa Troopa表示为这些组件及其关系的某种组合。 因果关系是您可以对生成事物的真实过程的抽象进行建模的想法。 当您使用构图和学习来将对象分解为它们的各个部分和关系时,将对象建模为这些部分的创建可以看作是对它们进行了因果建模。 继续我们的示例,您可能会了解到,Koopa Troopa字符是由诸如眼睛,喙和贝壳之类的更原始的部分组成的。 因果关系是一个非常强大的建模系统,可以捕获视觉关系之外的事物。 例如,物种的因果模型可以捕获遗传血统,即哪个物种来自哪个物种。 这样,游戏中角色的因果模型可能会捕捉到多个角色来自相同的常规类别,例如“坏蛋”。 此外, 因果关系还可以与 推论 。 当存在某种因果(或生成)过程时,推断就是朝“反向”方向发展的过程。 例如,当您了解游戏中的各种死亡原因时,您正在为其创建因果模型-例如,击打Koopa Troopa,跌倒等都会导致死亡。 当您死后为死亡原因做出推理时 ,您就是在进行推断 。 推理功能强大,因为它可以伴随您创建的所有因果模型,正如我上面的示例所示,它可以有多种选择。 您不断体验对象并学习对其进行分类。 首先按一些主要类别(例如有生命或无生命)分类,然后按您已经了解的其他类别(例如敌人与朋友)。 为了对复杂对象进行分类和表示,您可以将它们细分为它们的组件。 而且,您可以使用所有这些信息(您所看到的组件以及它们在因果模型中的适应程度)来推断您遇到的对象的类别成员资格。 然后推断对象类别可以使您深入了解可以为看到的对象预测哪些属性。 […]

模型堆叠
模型堆叠

最近,我在Kaggle上花费了很多时间,并且了解到模型堆叠有助于使顶级kaggler处于最高排行榜位置。 因此,我决定了解什么是堆叠以及为什么它有助于提高得分。 堆叠是另一种合奏技术,其中我们组合了各种模型以获得更好的预测。 我们确实知道Boosting和Bagging也是合奏技术,所以让我们找出Boosting,Bagging和Stacking之间的区别 1. 提升 :我们使用训练数据的子集并建立几个模型(通常是同一类型的模型),然后使用成本函数(如多数表决)取所有模型得分的平均值。 Boosting中的子集创建不是随机的。 对于我们创建的每个模型,我们都会对错误分类的观察值赋予较高的权重,并构建后续模型,最后取平均分。 2. Bagging :被称为Bootstrap聚合。 为了减少方差,我们从训练数据中抽取样本进行替换。 这实际上增加了训练样本。 增加训练样本不会增加模型性能,但是会减少方差。 我们根据采样数据构建几个模型,并将模型得分的平均值作为最终预测 3. 堆叠 :在Boosting和Bagging中,我们通常使用相同的模型。 但是,在堆叠中,我们使用不同的模型来汇总分数。 堆叠可以通过几种方式完成: 1. 简单的模型平均 :假设我们建立了3个分类模型-Logistic回归,决策树和随机森林。 在使用简单平均数进行叠加时,我们仅将所有3个模型的分数的平均值作为最终分数。 2. 查找各种模型的权重 :假设我们具有与上述相同的模型。 但是,我们不对模型进行平均,而是对这些模型进行回归以获得最佳权重,并使用这些权重对测试数据进行更好的预测。 我们还可以使用仅具有1个隐藏层的神经网络找到这些模型的权重。 3. 多数投票:让我们继续使用上面相同的3个基本模型进行讨论。 仅出于论证的目的,让我们假设所有模型的准确性均为0.7。 通过多数表决,我们将研究各个模型的预测,并对每个模型进行多数表决。 例如,训练中的第一次观察具有0.8、0.7、0.9的预测概率。 如果我们假设得分> 0.5被分类为1,则所有这些模型都一致,并且该观察的最终得分为1。类似地,对于第二观察,我们的得分为0.95、0.3、0.8。 在这3个模型中,有2个模型的结果应为1。因此,此观察的最终分数为1。 在测试数据集中,第一个观察值在3个预测结果为0的模型中有2个,第二个观察值在测试中,所有模型都同意将观察结果归为1。 4. 加权多数投票:这里我们结合了以上两种投票和加权分类器的方法。 5. 基于相关的平均 :要记住的重要一点是,如果模型之间的相关性较低,则堆栈可以很好地工作。 如果即使在堆叠后仍未看到模型性能的任何变化,则意味着所有基础模型都高度相关。 在这种技术中,我们选择最不相关的模型,并取模型的平均值/加权平均值来得出最终预测。 堆叠模型的方法很少,例如秩平均和几何平均。 我仍在弄清楚何时将使用这两种技术。 有关这些的更多详细信息,请参见此处。

4种通过推送通知激发行动的方法
4种通过推送通知激发行动的方法

移动推送通知是提高移动应用程序使用率的关键。 但是,它们也是提高参与度,提升品牌和个性化品牌体验的好方法。 然而,正如说服者和假装者会提醒我们的那样,爱与恨之间的界限很短。 尽管这首歌写于1971年,但实际上是关于推送通知的。 当客户授予推送通知的权限时,这是一种信任的姿态。 他们相信您可以提供价值,但更重要的是,他们不希望您惹恼他们。 SessionM最近对6,000个移动用户进行的一项调查发现,接受调查的用户中有62%希望永远不会收到推送通知。 而且Localytics发现“ 75%的应用程序用户在90天内流失”。 移动用户将其互联网使用量的51%用于移动设备,而将其中的42%的时间用于台式机。 在您增加移动营销预算以进行推动之前,您应该轻而易举。 考虑一下这样一个事实:全球目前有1.98亿活跃的adblock用户(Pagefair)。 接下来,考虑到取消推送通知或完全删除应用程序比下载和激活adblocker 更容易 。 为帮助您协商这种微妙的平衡行为,您应遵守带有推送通知的启发性行为的四个原则。 1.个人化 黑桃是黑桃,而推送通知则是强制性的。 但是,如果您的推送通知及时且相关,那将是可喜的中断。 随着仅移动成人网站的用户数量超过了仅台式机用户,智能手机是与客户建立1:1关系的关键组成部分。 2015年9月,纽约Tim es组建了一个11人的团队,专注于移动推送。 最新新闻会根据阅读历史记录,位置和语言偏好将其推送给特定用户。 它们也是beta测试功能,例如允许用户手动向上或向下拨动每天的推送次数,并在您最喜欢的专栏作家发布新内容时发出警报。 零售业紧随其后。 数据营销技术公司Vizury与日本领先的在线鞋类零售商合作,以提高其移动商店的ROI。 根据看到的产品,类别,首页和其他因素,对用户进行了纳米细分。 确定了特定于类别的客户行为,并包括了与移动设备最兼容的广告资源。 换句话说,Vizury帮助这家鞋类零售商根据客户的口味和购物习惯为每个客户生成了独特的信息。 结果? 转化率提高10%。 此外,他们的移动广告系列的点击率是桌面广告系列的两倍。 2.正确的时间 Localytics公布了他们关于推举最佳实践的发现,并且其六个项目符号中的两个强调了时间安排的重要性。 在一周中,平均点击率是5.8%,而在周末,点击率下降到3.5%。 这意味着在工作日发送的推送消息的点击率提高了66%。 对于实际点击而言,尤其是星期二和星期五。 根据我们的数据,大多数应用当前都在晚上发送推送消息,可能认为这是人们下班回家并愿意参与[并]在应用中花费更多时间的时候。 但是,这是一个误解。 推送消息实际上在下午(从12PM到5PM)具有最高的点击率。 尽管我之前提到个性化是关键,但值得重申的是,如果需要,批处理推送通知应考虑时区 ! 3.将您的号召性用语环境化 Robert Cialdini在其极具影响力的著作《 影响》中引用了哈佛社会心理学家艾伦·兰格(Ellen Langer)于1989年所做的一项研究,以显示将请求置于上下文中的力量。 在她的研究中,她问“在排队等候使用图书馆复制机的人中,有一小部分:” 对不起,我有五页。 我可以急于使用Xerox机器吗? ” 这些人中有94%容纳了她,而60%的人则被告知没有理由。 这项研究并没有激发思维游戏,而是指出了消息传递难题的一个基本部分:情境。 推行CTA时,请明确说明观众为什么要执行该动作以及从中得到什么,无论是信息,动机,特价还是其他。 如果您的消息有明确的存在理由并提供正值抵消干扰的负面体验,则可以完全避免烦恼,怨恨和拒绝推送通知。 […]

欺诈分析的机器学习技术,第1部分
欺诈分析的机器学习技术,第1部分

发表于二月7,2018 欺诈分析是无尽的猫捉老鼠游戏,但是机器学习可能只是帮助欺诈专业人员赢得这场比赛的工具。 在金融服务领域,欺诈者必须比最慢的银行更快,更聪明地“陷入困境”。 银行必须比欺诈者更好,以避免成为受害者。 分析和数据科学在其中起着关键作用。 但是,银行经常面临的一个令人困扰的问题是数据科学家与欺诈分析师之间的桥梁:一个真正了解统计数据,而另一个则了解欺诈。 最好的欺诈专业人员是那些像黑客或欺诈者一样思考的人,并且具有必要的机器学习知识,能够包括保持领先一步所必需的缓解欺诈策略。 寻找适合工作的工具 有许多不同的机器学习技术,各有其优点,缺点和复杂程度。 让我们从一种作案手法的角度来研究这一点,以便为正确的工作选择正确的工具。 与其他风险和营销机器学习相比,欺诈的主要挑战之一是可用的“不良”事件数量。 欺诈数据科学家需要特别考虑采样和过度拟合(其中模型仅适用于训练数据集,而在野外使用时会失败)。 前期的另一个关键点是格言“垃圾进,垃圾出”。 机器学习模型仅取决于其数据输入和错误定义的强度。 这遵循了“最佳实践” 80/20规则,该规则有效地建议数据科学家应将80%的时间用于数据准备,而20%的时间用于建模。 当欺诈者是您的客户时 第一方欺诈是欺诈者也是银行客户的地方。 通常,欺诈者会根据自己的处境或身份要素而定,例如在破产和消失之前最大化贷款协议。 第一方欺诈的另一个分支是money子,这些mu子从在线帐户接收中收取钱款,并为欺诈者退出资金,或者使用自己的账户来流转资金进行洗钱。 从统计学的角度看待这两个人群后,事实证明这两个人群确实拥有完全相同的社会人口统计数据,并且可以组合使用错误的定义来构建更强大的机器学习模型。 机器学习非常适合这种情况,因为所使用的功能往往是静态的,包括在乡下的时间,性别,工作,居住地等。 监督学习通常用于考虑历史数据并建立分类模型,该分类模型可用于将未来发生的事件分类为“欺诈”与“良好”类别。 当欺诈者或m子是您的实际客户时,欺诈专业人员应考虑以下机器学习技术: 逻辑回归 -一旦银行拥有足够的欺诈数据量,就可以建立回归模型来预测欺诈。 使用差异统计方法,将欺诈性客户与真实客户按分数分开。 Logistic回归也经常用于信用风险中以确定坏账。 可以使用其他技术来减少特征并消除相关性,例如LASSO或Elastic Net。 在这两者中,Elastic Net通常具有更好的性能。 决策树 – 决策树已在银行中使用多年,用于解决各种欺诈问题。 在这里,数据被划分为子集。 分区过程从二进制拆分开始,一直持续到无法进行进一步拆分为止。 形成各种长度可变的分支。 决策树的目标是将训练数据封装在最小的树中。 有多种方法和技术可控制深度或“修剪树”。 随机森林 -决策树集合也可以用于预测人类行为,包括欺诈行为。 在树中的每个节点上,实现是/否决策,并且该流程可用于设置策略。 随机森林是通过使用数百种不同的决策树来构建的,并使用称为“引导”的技术对同一数据进行随机采样。随机森林是一种非常有用的技术,可以快速生成要素重要性或从数据中获得最大的预测能力。 这些机器学习技术的最大优势在于它们的权重和特征是透明的,因此您可以看到哪些特征对算法有所贡献。 这些技术在透明方法中被考虑,是向利益相关者和欺诈专家解释结果的理想选择。 机器的兴起 欺诈中机器学习的关键问题之一是如何检查和解释模型输出。 具有二进制结果的黑匣子模型无法深入了解主观领域,尤其是第一方欺诈。 模型中存在偏见,有时会损害真正的客户。 一个例子……人类的对手正在攻击银行的系统和流程,甚至有可能甚至对您的银行使用相同的工具和技术(对抗性机器学习)。 人类分析人员可以获取更多的环境数据,并可以预测动机可能发生的变化。 “我正在推出新产品,这就是欺诈风险。 欺诈者去年曾这么做,但是有新工具可用,它们很可能会像这样攻击…” 不幸的是,机器学习距离帮助它还有很长的路要走。 […]

Devblog 6:游戏了解您的任何命令
Devblog 6:游戏了解您的任何命令

为了以新的有趣的东西开始新的一年,我们开发了AR,语音识别和socket.io。 看看这个! FENO(@ feno42) , 自然语言处理(NLP) 这周我把自然语言处理弄乱了。 想法是以一种可以编程方式使用的方式来处理某些文本。 如今,这很普遍,例如,您可以找到带有Siri的NLP。 我想看看我们如何在游戏中使用这种互动。 为了做到这一点,我使用的是Wit.ai(一年前Facebook购买了它们)。 就像,我们可以想象未来的RPG会让玩家说出自己想要什么。 例如,在您可以威胁某人或放手的情况下,玩家可以说“ 如果您尝试进行干预,这将变得简单得多。 我会杀了你妻子 我会杀了你儿子 我会杀了你的宝贝女儿。 ”或“ 如果您不停止撬动,我会烧死您的! 我会烧掉你的心! ”或简单地“ 操你 ”,无论如何,游戏都会抓住目的并发挥相应的作用。 下一步将是使语音识别与Unity一起使用! 下次见。 NATHAN(@grange_nathan) 嗨,Enol在这里! 欢迎2017年! 这将是很棒的一年。 Vuforia 因此,在上一个Devblog中,我向您展示了我在Vuforia上进行AR的首次尝试。 我继续了一下。 由于纸质确实不是那么有趣,并且使任何人都无法访问该AR项目(您需要打印或获取目标图像才能与该应用程序一起玩),所以我重点介绍了其他使用AR来增强交互性的方法在我们未来的交流中。 让我们来看看: 在这里您可以看到我将应用程序更改为与屏幕上的图像一起使用。 我还删除了大多数经典2D UI,以实现完整的AR交互。 我正在考虑使用它来使我们的网站和其他视觉营销更具原创性。 有时,您可以在AR中看到完全互动的迷你游戏,资产图库或3D动画预告片,有时还可以看到我们游戏中的复活节彩蛋或其他任何东西! 另一方面,我认为这对于我们的艺术家以一种新的方式展示他们的作品可能是一个很好的方式。 它根本不稳定,但是这里是您可以在屏幕上跟踪单个图像的模型之间移动多少。 Vuforia具有一些魔术跟踪功能,我会告诉您: 对于这样的小项目,AR真的很有趣,我不确定整个游戏,但对于其他所有功能,它都很棒,我迫不及待地想尝试Tango摆脱目标图像的必要性。 在接下来的几周中,我将继续从事这些AR方面的工作。 我试图稳定我的AR记录,这要好一些,但我仍然希望向您展示我在使用相机方面有多糟糕。 无论如何,如果您有兴趣:第一和第二GIFS 哦,我现在无法告诉您任何信息,但是云计算/游戏现在看起来比以往任何时候都更好。 也许很快就会有一些事情…… 本杰明(@ Valgoun16) 这个星期很平静,我没什么要告诉你的。 我主要在Spacefleet上帮助Keryann,并在Subscribe&Punch上工作。 订阅并打孔 对于那些不知道标准普尔是什么的人,这是一个基于Youtubers宇宙的格斗游戏。 我正在与FeNo和IronEqual以外的其他人一起工作。 […]

思想开创者:更深入地研究Uber,机器学习,“另类”民主和全球化等
思想开创者:更深入地研究Uber,机器学习,“另类”民主和全球化等

本尼迪克特的演讲指出,移动应用是消费者与数字世界互动的主要手段。 根据美国Adobe的研究,随着移动无处不在,我们看到消费者坚持使用他们所了解的应用程序: 亚马逊正在利用移动技术,利用即将推出的AmazonGo产品进一步实现购物流程的自动化。 给消费者带来更好的体验,给零售业者减少就业: Om Malik的专栏警告说,与硅谷的提振主义背道而驰,该技术并不存在于真空之中,为了避免重大反弹,新兴行业需要更加意识到这些变化: “不只是Facebook。 现在是时候让我们的行业停下来,花点时间思考:随着技术以新的和以前无法想象的方式进入我们的日常生活,我们需要了解那些受到技术威胁的人。 移情不是流行语,而是要实践的东西。 首先,我们不要肆意使用我们的Facebook提要,而应该去美国的某些地区旅行,那里五美元的拿铁咖啡和鲜榨果汁不是特权,而是在提醒人们有没有。 否则,到2020年,就像它的东海岸竞争对手华尔街一样,硅谷将在大众的想象中成为更大的恶棍。” 瑞安·布罗德里克(Ryan Broderick)追踪了美国和欧洲“另类权利”的兴起以及社交媒体如何为其发展提供沃土。 Derakhshan说:“ Facebook不想挑战您,他们不想让您不高兴,因为他们知道,如果您在他们的平台上受到挑战,那么您就不会想要那么多地使用它。” “你不能通过说同意或不同意或者它是对还是错,而只能对它表现出自己的情绪来表达对Facebook上看到的任何事情的反应,这是非常明显的。” 英国的电信监管机构会定期发布有关英国人对媒体和技术使用情况的研究。 他们的最新报告涵盖了5-15岁儿童和青少年之间的媒体使用和态度,为了解媒体未来的发展方向提供了宝贵的窗口: 皮尤研究中心(Pew Research)在美国的研究指出,电子书的市场份额随着印刷书籍的类似故事而趋于稳定。 另一个有价值的发现是,消费者现在正在越来越多地在平板电脑,个人计算机和智能手机上阅读电子书,而不仅仅是专用的电子书阅读器: 传统上,美国人一直坚信经济发展,并期望他们的财务状况会比父母更好。 大卫·莱昂哈特(David Leonhardt)对拉吉·切蒂(Raj Chetty)的研究指出,情况已不再如此,这种情况可能导致人们对政治现状越来越不满: 唐纳德·特朗普(Donald Trump)呼吁将制造业带回美国的呼声已经很多,并建议他将采取更多的贸易保护主义贸易政策。 马克·穆罗(Mark Muro)在其对美国制造业的报道中指出,自动化如何使该行业与蓝色劳工根源越来越脱节: 唐纳德·特朗普一直吹捧的另一项举措是对美国基础设施的投资,这是民主党和共和党人可能找到共同点的一个领域……但细节在于魔鬼。 罗纳德·克兰(Ronald A Klain)对这项计划的分析表明,它更有可能排在已经从事项目工作的人的腰上,而不是为就业提供刺激: 首先,特朗普的计划并不是真正的基础设施计划。 这是针对公用事业和建筑业投资者的减税计划,也是针对承包商的大规模企业福利计划。 特朗普计划 没有像希拉里·克林顿(Hillary Clinton)2016年的基础设施提案那样直接为新的道路,桥梁,水系统或机场提供资金。 取而代之的是,特朗普的计划为支持盈利建筑项目的私人投资者提供了税收优惠。 这些项目(例如电网现代化或能源管道扩建)可能已经在计划中,甚至正在进行中。 无需将税收减免用于增加或扩大的建设工作; 他们都可能只是为了增加以前计划的项目中的投资者资金。 中国的经济增长是史无前例的,但政治气候的阴霾已导致越来越多的人认为,随着中国采取更加专制的立场,这种趋势将来可能会脱轨: 唐纳德·特朗普(Donald Trump),奈杰尔·法拉格(Nigel Farage)和玛丽·勒庞(Marie Le Pen)等人的崛起表明了对全球化的强烈反对,但《经济学人》的分析指出,并非所有国家都共享这种趋势: 阿曼达·陶布(Amanda Taub)概述了雅莎·穆克(Yascha Mounk)的研究,该研究指出,许多发达国家对民主的支持正在下降,这与“极右翼”的增长相吻合……尽管埃里克·沃滕(Erik Voeten)的分析表明,它并不像下图所示那样严重: 鉴于极右翼的崛起,耶鲁大学历史学教授蒂莫西·斯奈德(Timothy Snyder)从20世纪开始的20堂课为打击威权主义的崛起提供了宝贵的建议(即使针对美国读者): 1.不要事先服从。 […]

安装顶垫94 Chevy Silverado 350
安装顶垫94 Chevy Silverado 350

安装顶垫94 Chevy Silverado 350 我已经看了很多关于如何安装头垫的视频,但是这从来没有涉及到我需要的主题 94 Chevy Silverado 350的头部垫圈绝缘。 科里·米勒(Corey Miller)是为我做到这一点的人 头部垫圈吹气症状: 冷却液从排气歧管的外部泄漏 排气管冒白烟 发动机过热 散热器或冷却液溢流箱中有气泡 白乳状油 冷却液大量流失,无可见泄漏 雪佛兰小块发动机是通用汽车的雪佛兰分部使用相同的基本小型(当时为美国V8)发动机块制造的一系列汽车V8发动机。 即使第一批大缸体发动机的排量小于最大的小缸体发动机,但这些小缸体几乎都在400立方英寸(6.6升)以下,而大多数大缸体发动机都在此之上。 小块的小物理尺寸也使它们与大块的表亲(大块)区别开来。 追溯称为“ Generation I”小块,它与后续的“ Generation II” LT和“ Generation III / IV” LS以及“ Generation V”(LT / EcoTec3)引擎不同。 工程师埃德·科尔(Ed Cole)后来担任通用汽车总裁,因领导该发动机的设计而倍受赞誉。 蒙特兹·麦卡米什(Montez McCamish) Montez McCamish在Facebook上。 加入Facebook,与Montez McCamish和您可能认识的其他人建立联系。 Facebook给… www.facebook.com 在Facebook上关注我 看看这部电影Ladonna Marie 寻找一个伟大的博客阅读! http://hrmgmontez.wixsite.com/home/blog 寻找更多影片? http://hrmgmontez.wixsite.com/home/videos Εγκατάστασηφλάντζαςκεφαλής94 Chevy […]

词嵌入的力量
词嵌入的力量

自然语言处理是一件混乱而复杂的事情,但是现代先进技术正在提供越来越令人印象深刻的结果。 词嵌入是一种现代的机器学习技术,席卷了自然语言处理领域。 每当以某种形式使用词嵌入时,大多数NLP任务的结果都会得到改善。 在本文中,我们将研究如何计算单词嵌入,它们如何能够至少部分捕获语言语义以及现代技术如何使用它们来发现文档中的有用信息。 单词语义 文本的所谓词袋表示法是NLP中的一种经典方法,该方法将文档表示为简单的单词集合,而不考虑单词顺序,句子排列或任何其他语义信息。 单词用数字表示,通常是对它们在文本中出现的频率的归一化计数,而文档则是这些数字的向量。 这种方法的变体已经使用了数十年,尽管它们的语言过于简单,但仍可提供有用的结果。 例如,大多数数据库在全文搜索实现中都使用此文本表示形式。 但是,通过设计,这些模型无法捕获单词语义。 单词嵌入为表示文本提供了另一种方法。 向量(所谓的嵌入)而不是数字用来表示单词。 通过设计,这种较高的维数能够捕获单词含义的多个方面。 当然,问题在于如何确定这些向量,以便它们实际上在捕获单词语义方面做有用的工作。 词向量 2013年,Google推出了一种能够在大量训练样本中以非常有效的方式学习单词向量的模型。 除了算法和源代码,他们还发布了从100毫米文章数据库中学习的单词向量数据集。 这些词向量著名地具有捕获类比的能力,例如“皇后是国王,男人是女人”。 为了更好地理解此模型的工作原理,我们将仔细研究可以产生相同结果的简化版本。 为了学习单词向量,使用了浅层神经网络架构。 该模型将一个单词作为输入,并尝试预测另一个单词作为输出。 为了训练模型,将许多这样的单词对(训练样本)传递给模型,以便通过多次迭代可以学习如何将单词彼此映射。 在这种情况下,“国王”是“城堡”的上下文词。 然后,一对训练成为国王城堡,即给定单词“ king”以预测单词“ castle”。 该模型背后的神经网络试图最好地学习这种映射。 继续这个示例,模型的网络最初看起来像这样: 注意第一层和第二层之间的连接。 这些行中的每行都有一个与之关联的数字(通常称为“权重”)。 这些数字加在一起构成一个向量。 这是我们要学习的“王”字向量。 此向量是随机初始化的,起初并没有提供太多信息。 随着培训的进展以及网络不断更新其权重以更好地生成此映射,权重会发生变化,最终,网络可能看起来像这样: 注意每行的颜色不同。 权重已更新,并且在将单词“ king”映射到单词“ castle”的链接中,连接现在最牢固。 网络已经学会了连接这两个词。 但是,这本身有用吗? 并不是的。 使该模型真正有用的原因是,类似于“国王”的单词与相同的“城堡”单词之间的映射看起来将相似。 这是在“皇后”和“城堡”之间学习到的映射的样子: 最后,我们并不真正在乎模型在预测这些单词关系方面的表现如何。 我们关心的是它应用于权重向量的更新。 模型输出的向量捕获单词之间的有趣关系。 这是“ king”,“ queen”,“ man”,“ woman”等词向量的2D投影形式: 该模型不仅捕获了“国王”和“女王”在含义上相似的直观想法,就像“男人”和“女人”一样,而且还保持了跨词簇的有趣关系。 研究发现,在国王皇后区群中,“国王”一词有点像男人-女人群中的“男人”一词。 这样,它就可以回答“国王对男人来说,国王对女王来说是???”这样的问题,其中显而易见的答案是“女人”。 它学到的另一个有趣的关系是首都与国家之间的关系(即罗马-意大利,布加勒斯特-罗马尼亚等)。 […]