栏目导航

1376789.com

机器学习预测计算机芯片执行来自各种应用程序

更新时间: 2020-01-28

  为了使代码尽可能快地运行,开发人员和编译器将编程语言转换为机器可读代码的程序,通常使用通过模拟给定芯片体系结构运行代码的性能模型。118kj历史开奖记载”邻近年关br 哨所也装修一新

  编译器使用该信息来自动优化代码,而开发人员使用该信息来解决将运行该代码的微处理器的性能瓶颈。但是,机器代码的性能模型是由相对较少的专家小组手写的,二四六玄机枓教你八道素菜小炒炒鸡蛋的底油不,并且未经适当验证。结果,模拟的性能测量通常会偏离实际结果。

  研究人员开发了一种新颖的机器学习管道,该管道可自动执行此过程,从而使其变得更轻松、更快、更准确。这项研究成果在国际机器学习大会上发表。

  研究人员通过一种特殊的神经网络模型,它以“基本块”(计算指令的基本摘要)形式训练标记的数据,以自动预测其持续时间使用给定的芯片执行以前看不见的基本块。结果表明,这种神经网络模型的性能要比传统的手动调整模型精确得多。

  这个基准涉及多个领域,包括机器学习、编译器、密码学和可用于验证性能模型的图形。研究人员将超过30万已分析的块合并到一个开源数据集中。在评估过程中,这种神经网络模型预测了英特尔芯片运行代码的速度要比英特尔自身构建的性能模型还要好。

  最终,开发人员和编译器可以使用该工具来生成代码,这些代码可以在越来越多的多样化“黑匣子”芯片设计上更快、更高效地运行。现代计算机处理器不透明,极其复杂且难以理解。编写对这些处理器执行得尽可能快的计算机代码也极具挑战性,该工具是朝着对这些芯片的性能进行完全建模以提高效率的重要一步。

  最近,该团队又提出了一种自动生成编译器优化的新技术。具体来说,它们会自动生成一种算法,该算法将某些代码转换为向量,可用于并行计算。 这种算法优于LLVM编译器中使用的手工矢量化算法。

  LLVM是业界常用的编译器,一个自由软件项目,它是一种编译器基础设施,以C++++写成,包含一系列模块化的编译器组件和工具链,用来开发编译器前端和后端。它是为了任意一种编程语言而写成的程序,利用虚拟技术创造出编译时期、链接时期、运行时期以及“闲置时期”的最优化。它最早以C/C++为实现对象,而当前它已支持许多种程序语言。

  研究人员说,手工设计性能模型可能是“一门妖术”。英特尔提供了超过3000页的详尽文档,描述了其芯片的体系结构。但是目前只有一小部分专家将构建性能模型,以模拟这些架构上代码的执行。

  研究人员指出:“英特尔的文档既没有错误,也没有完整,并且英特尔会省略某些事情,因为它是专有的。” “但是,当使用数据时,不需要了解文档。如果有隐藏的内容,可以直接从数据中学习。”

  为此,研究人员记录了给定微处理器用于计算基本块指令的平均周期数,基本上是启动,执行和关闭的顺序,而无需人工干预。使过程自动化可以快速分析成千上万个块。

  在培训学习中,这种神经网络模型分析了数百万个自动剖析的基本块,以准确了解不同的芯片体系结构将如何执行计算。重要的是,该模型将原始文本作为输入,不需要手动向输入数据添加功能。在测试中,可以将以前看不见的基本块和给定的芯片提供给模型,模型将生成一个数字,指示芯片将以多快的速度执行该代码。

  研究人员发现,该模型的准确性降低了错误率,这意味着预测速度与实际速度之间的差异比传统的手工模型降低了50%。此外,他们表明该模型的错误率为10%,而Intel性能预测模型在多个不同领域的各种基本块上的错误率为20%。

  该工具现在使人们可以更轻松地快速了解任何新芯片架构的性能速度。例如,特定领域的体系结构,例如Google专门用于神经网络的新型Tensor处理单元,目前正在构建中,但并未得到广泛理解。 如果要在某种新架构上训练模型,只需从该架构收集更多数据,通过探查器运行它,使用该信息来训练模型,从而就有了一个预测性能的模型。

  接下来,研究人员将通过这样的神经网络模型研究使人工智能模型可解释的方法。人工智能机器学习在很大程度上是一个黑匣子,因此尚不清楚为什么特定的模型会做出某种预测。这样的模型指示一个处理器要执行一个基本块需要10个周期,从而有可能设法找出其原因。

  人工智能自1956年Dartmouth学会上提出,在经历一个又一个寒冬之后,如今真正登上了人类舞台。

  IP电话是一种利用Internet或者基于其它IP网络(如Intranet、帧中继、或ATM)作为传....

  人工智能,或者说计算机视觉的一个最终目标在于构建一个真正可适用于真实世界复杂环境的系统。而就目前所应....

  随着无线传感器网络技术的不断发展,它已经被广泛应用到工业、农业、医疗、航空航天以及海洋开发和探索等各....

  FusionNet的核心是全新的、应用于3D物体的三维卷积神经网络(Convolutional Ne....

  而当前人工智能领域热点研究话题位居前十的是:神经网络、卷积神经网络、机器学习、计算机视觉、移动设备、....

  近些年来,随着新细菌种类不断被发现,虽然基于已知分类训练的神经网络分类器通过交叉验证达到了很高的测量....

  假设一个简单的层计算公式 y = (Wx + b),y 在 W 上的导数就是这样:dy=dWx。因此....

  Rokid新一代Rokid Glass 2 AR眼镜,搭载NPU神经网络处理芯片

  研究人员并未打算让这套神经系统独挑大梁,他们认为最好让Brutus之类的程序做大部分“苦力活”,而神....

  深度学习兴起之后,学界将目标转移至数据,提出“让数据说话”。张钹认为,这种强调对深度学习的发展起到积....

  工智能的介入在文学艺术圈制造了持久的喧哗,各种观点错杂交叠。欣然接受人工智能的作家不多,反对人工智能....

  随着加密货币的兴起,以及可能与人工智能结合在一起,因而人工智能越来越受欢迎,不但进入主流媒体,也成为....

  从国家角度看,美国学者人数的占比最高,有1128人,占比61.4%,超过总人数的一半,独自领跑第一梯....

  机器学习(machine learning)已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮件....

  本书揭示神经网络背后的概念,并介绍如何通过Python实现神经网络。全书分为3章和两个附录。第1章介....

  利用ARM微处理器和ZigBee模块实现无线串口集线世纪科学技术的不断进步,无线与移动通信相应得到了迅猛的发展。方便快捷的无线接入和无线 互连等....

  为推动完善人工智能教育体系,清华大学交叉信息研究院在图灵奖得主、院长姚期智院士的带领下,在计算机科学....

  根据Geisinger的发布,Geisinger研究人员最近发现,人工智能可以检查心电图(ECG)测....

  瑞萨电子株式会社(TSE:6723)宣布其ISL91301B电源管理IC(PMIC),应用于最新Go....

  来自谷歌、微软、高通、三星和6所大学的一组研究人员齐聚加州圣何塞,讨论将机器学习带到网络最远端的挑战....

  世界各国的各地政府正在朝着一个长期目标迈进,那就是让智慧城市拥有自动驾驶和高度自动化的车辆,并将其集....

  通过分析传统的多层感知器和反向传播算法的不足,设计了一个全新的网络结构SC—MLP和提出了与之对应的....

  符号人工智能和神经网络还是完完全全的两个世界,相互对立。人工智能领域的大佬们常常各执一词,在支持一种....

  使用经过训练的深度卷积神经网络,通过将正样本中的旋转模式与地理空间图像中目标的旋转模式进行匹配,来识....

  丢弃法是一种避免神经网络过拟合的正则化技术。像L1和L2这样的正则化技术通过修改代价函数来减少过拟合....

  在这篇文章里,我们首先会列出宇航和国防户最关键的需求,然后详细阐述Teledyne e2v的微处理器....

  无论是政策层面,还是应用场景和市场,人工智能已是未来已来。今天我们很荣幸地请到了人工智能和信息科学领....

  这一法令是由美国商务部下属的工业和安全局(BIS)发布的。 该机构旨在通过确保实施有效的出口管制及条....

  为了解决这些问题,本文提出了一种新颖、通用的时序融合框架,同时在语义层面和时序层面上对帧信息进行聚合....

  前面所讲的都是前向传播,和前向传播相反的就是后向传播,后向传播是提升神经网络准确率的重要内容。

  射频识别(Radio Frequency Identification)是一种无线通信技术,可以通过....

  微软A I和Research的创建也凸显了人工智能领域的激烈竞争。微软正准备与谷歌、亚马逊、Sale....

  BTP-2100E 标签打印机外观精巧,性能卓越,是理想办公的条码标签打印设备。适用于即时标签打印/....

  芯片的另一种分类方式,是按照使用的集成电路进行划分,目前大多数计算机处理器都使用数字电路。

  论文综述了混沌研究的发展历史及其意义,归纳和总结了混沌的定义及混沌的基本特征,着重介绍了混沌分析方法....

  思考者科技执行CEO谢总:“AI交互服务智脑”在安全管控方面应用了AI神经网络工程控制技术,进行了多....

  此前在今年9月,探境发布通用型语音AI芯片音旋风611,智东西曾对该芯片及内部存储优先架构(SFA)....

  美国宇航局和英特尔、IBM、谷歌等公司合作,开发出先进的机器学习技术,每年夏季,美国宇航局会召集科技....

  SVP3000 Alphaplus系列智能阀门定位器的数据手册免费下载

  SVP3000 Alphaplus系列智能阀门定位器的数据手册免费下载

  机器人(Robot)行动笨拙,除了制造业的专用机器手臂,机器人的动作远不如人类灵敏,是因为机械操演不....

  智能假肢研发过程中,需要残疾人装配假肢进行实验。由于残疾人身体有缺陷,不可能作大量、多样及重复性的实....

  人工神经网络,支持向量机,遗传算法等等算法,当然还有各个领域需要的算法,比如你要让机器人自己在位置环....

  知存科技的该项专利是关于数模混合存算一体芯片技术,除能有效降低设计复杂度和制造成本外,还特别适用于人....

  人工神经网络是集脑科学、神经心理学和信息科学等多学科的交叉研究领域,是近年来高科技领域的一个研究热点....

  所示是发光二极管(LED)显示驱动电路,又称微处理器的显示接口电路。在微处理器工作的同时将工作状态及....

  所示为一种微处理器及液晶显示驱动电路。该电路主要是由微处理器80C48(VeCOMPUTER)、高位....

  进位定义: 在基本算术中,进位是一种运算形式,加法运算中,每一数位上的数等于基数时向前一位数进一, 它是标准算法的一部分...

  针对传统比例积分(PI)控制在电机控制中控制效果不良的问题,设计了一种基于向后传播算法(BP)模糊神经网络的PI控制器。...

  从上世纪70年代微处理器诞生以来,性能、功能和功耗表现一直按照摩尔定律在提高。但是从大型机时代一直到现在的移动互联网时代,...

  由于集成的功能不断增多以及外形尺寸的日益缩小,最新一代功能丰富的更小型便携式设备将使电源管理设计发挥关键作用。...

  手机短信以其短小、迅速、简便、价格低廉等优点成为一种重要的通信和交流方式,受到众多人士的青睐。然而, 手机短信与邮件一样存...

  随着社会的发展和科技的进步,人们的安防意识越来越强,而计算机网络技术,通信技术,和数字视频编码技术的日益成熟,使基于计算...

  无笔、无纸记录,日常维护工作量小,运行费用低。 采用进口5.6英寸320*240点阵高亮度图形液晶显示屏,具有画面清晰、性能稳定、...

  目前,在多数保密通信没备中,主要采用通用CPU和专用硬件电路控制密码专用芯片来实现两种方式的密码运算。采用前者控制密码专...

  近年来,电子装备自动测试系统进入了以小型化、智能化、综合化、信息化为发展方向的新时期,同时兼顾实用、可靠、经济等要求。0P...

  AM4377 AM437x ARM Cortex-A9 微处理器 (MPU)

  TI AM437x 高性能处理器基于 ARM Cortex-A9 内核。 这些处理器通过 3D 图形加速得到增强,可实现丰富的图形用户界面,还配备了协处理器,用于进行确定性实时处理(包括 EtherCAT、PROFIBUS、EnDat 等工业通信协议)。该器件支持高级操作系统 (HLOS)。 基于 Linux 的®可从 TI 免费获取。其它 HLOS 可从 TI 的设计网络和生态系统合作伙伴处获取。 这些器件支持对采用较低性能 ARM 内核的系统升级,并提供更新外设,包括 QSPI-NOR 和 LPDDR2 等存储器选项。 这些处理器包含功能方框图中显示的子系统,并且后跟相应的 “说明”中添加了更多信息 说明。 处理器子系统基于 ARM Cortex-A9 内核, PowerVR SGX图形加速器子系统提供 3D 图形加速功能以支持显示和高级用户界面。 可编程实时单元子系统和工业通信子系统 (PRU-ICSS) 与 ARM 内核分离,允许单独操作和计时,以实现更高的效率和灵活性。PRU-ICSS 支持更多外设接口和 EtherCAT、PROFINET、EtherNet/IP、PROFIBUS、E...

  AM4382 AM438x ARM Cortex-A9 微处理器 (MPU)

  与其它产品相比AM438x Arm MHz (Max.) Serial I/O Security Enabler Co-Processor(s) Graphics Acceleration EMAC USB 2.0 Industrial Protocols Camera Operating Temperature Range (C) DRAM var link = zh_CN_folder_p_quick_link_description_features_parametrics; com.TI.Product.handleQuickLinks(parametric,参数变化,#parametrics,link); AM4382 AM4384 AM4388 300 600 1000 600 1000 600 1000 &...

  AM4384 AM438x ARM Cortex-A9 微处理器 (MPU)

  与其它产品相比AM438x Arm MHz (Max.) Serial I/O Security Enabler Co-Processor(s) Graphics Acceleration EMAC USB 2.0 Industrial Protocols Camera Operating Temperature Range (C) DRAM var link = zh_CN_folder_p_quick_link_description_features_parametrics; com.TI.Product.handleQuickLinks(parametric,参数变化,#parametrics,link); AM4384 AM4382 AM4388 600 1000 300 600 1000 600 1000 &...

  AM335x 微处理器基于 ARM Cortex-A8 处理器,在图像、图形处理、外设以及 EtherCAT 和 PROFIBUS 等工业接口选项方面得到了增强。 该器件支持高级操作系统 (HLOS)。 Linux®和 Android可从德州仪器 (TI) 免费获取。 AM335x 微处理器 包含 功能框图 中显示的子系统和以下 简要 说明: 微处理器单元 (MPU) 子系统基于 ARM Cortex-A8 处理器, PowerVR SGX图形加速器子系统提供 3D 图形加速功能以支持显示和游戏特效。 可编程实时单元子系统和工业通信子系统 (PRU-ICSS) 与 ARM 内核彼此独立,允许单独操作和计时,以实现更高的效率和灵活性。PRU-ICSS 支持更多外设接口和 EtherCAT、PROFINET、EtherNet/IP、PROFIBUS、Ethernet Powerlink、Sercos 等实时协议。此外,凭借 PRU-ICSS 的可编程特性及其对引脚、事件和所有片上系统 (SoC) 资源的访问权限,该子系统可以灵活地实现快速实时响应、专用数据处理操作以及自定义外设接口,并减轻 SoC 其他处理器内核的任务负载。 特性 ...

  TMP451-Q1器件是一款高精度,低功耗远程温度传感器监视器,内置有一个本地温度传感器。远程温度传感器通常是低成本离散式NPN或PNP晶体管,或者基板热晶体管或二极管,这些器件是微处理器,微控制器或FPGA的组成部件。对于本地和远程传感器,此温度表示方式为12位数字编码,分辨率为0.0625C。对于本地和远程温度传感器,在典型运行范围内,温度精度为1C(最大值)。16kj手机看开奖结果!此两线制串口接受SMBus通信协议。 诸如串联电阻抵消,可编程非线性因子(因子),可编程偏移,可编程温度限制和一个可编程数字滤波器等的高级特性被组合在一起以提供一个具有更佳准确度和抗扰度的稳健耐用热量监控解决方案。 TMP451-Q1器件是在各种汽车子系统中进行多位置高精度温度测量的理想选择。此器件的额定运行源电压范围为1.7V至3.6V,额定工作温度范围为-40C至125℃。 特性 符合汽车应用要求 具有符合AEC-Q100的下列结果: 器件温度1级别:-40C至125C的环境运行温度范围 器件人体模型(HB...





挂牌| 香港最快开奖结果直播| 白小姐论坛49288| 天下彩彩富网| 66991.com| www.599919.com| 香港马会资料大全| www.890555.com| 998009中金心水论坛| 铁算盘玄机资料| www.kj7118.com| 正版挂牌|