§3 向量的流水处理与向量流水处理机.ppt
《§3 向量的流水处理与向量流水处理机.ppt》由会员分享,可在线阅读,更多相关《§3 向量的流水处理与向量流水处理机.ppt(56页珍藏版)》请在三一文库上搜索。
1、3 向量的流水处理与向量流水处理机,将向量数据表示和流水线技术结合起来,构成向量流水处理机,简称向量处理机(Vector Processor) 向量的流水处理 向量流水处理机,坐骸感撂幻苏筑糖烘刁摊言季臂占扁瘸潞蔫遭战彦氯疥耪畏找匡靛缩马宁3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理,提高流水性能方法: 增加流水线段数,以减少t 每个时钟同时启动多条指令 减少相关,减少功能变换次数,增加处理指令条数。,讣飘患胀享苦页承窗孤巾孟警误跨群秸仲公甭乞窘脑驼途样悔优熄檄钮常3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理(续)
2、,向量操作特点 向量元素间操作相互独立,且为相同操作 相当于标量循环,对指令带宽的访问要求不高 可采用多体交叉存储器,减少访存延迟。 向量操作很适合于流水处理或并行处理。,翻郊瓜骸大型脸猪莱胆脏租收邪荐行狭雌杆几差星腥众待塘轧葱蒂柔霜舜3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量的流水处理(续),向量处理过程 置VL、VM、A 取向量到V 运算。 向量的分量间采取的是流水方式。 并行处理机(SIMD)处理向量时采取的是并行方式。,布拴仓躯芋豹抑愿瘸崩吠请冠冠衍迄第狙万庞跨陇帧首拭诚擦柏缩姨箭蹈3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向
3、量的流水处理(续),向量处理工作方式 如:D=A(B+C) 横向加工:bi+ci-k, k*ai-di 产生N次相关,2N次功能切换,适合标量循环 纵向加工:bi+ci-ki, ki*ai-di 产生1次相关,1次功能切换,可流水处理 纵横处理:对向量分组,组内纵向、组间横向处理,缉址盖逆市质爸讯粥账僻与氰扬哀钙鹊腆比竞伊言孔片槽霓贬朔繁伤轻特3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量流水处理机,向量流水处理机的指令系统 向量流水处理机的结构 超级向量流水处理机举例,辉央漾酚歼鹊估竣枫纹浦绝耐梭熙税确吼烷滑咙侥澄榜宪后湛变铬幻航稳3 向量的流水处理与向量流水处理
4、机3 向量的流水处理与向量流水处理机,向量流水处理机的指令系统,包含有向量型和标量型两类指令 向量型运算类指令 向量V1运算得向量V2,如V2=SIN(V1) 向量V运算得标量S,如 向量V1与向量V2运算得向量V3,V3=V1V2 向量V1与标量S运算得向量V2,V2=S*V1 特殊操作指令 向量比较指令 向量压缩指令 归并指令 向量传送指令,兹渠苍喝凛重裹绚马抄身够冈绅孽循各枯印隙攫录臼枚卜犹港习妇弦匀砸3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,向量流水处理机的结构,1972年首次交付使用CRAY-1向量流水处理机 分布异构型多处理机系统,由中央处理机、诊断维护
5、控制处理机、大容量磁盘存储子系统、前端处理机组成 6个流水线单功能部件:整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代求倒数 向量寄存器由512个64位寄存器组成,分成8组,巷拷谴短膀侮菌蚤踩瞎芭宰刀林负晋狰糜膊署成亮隐泄竣挛赊那噪读巫鸿3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,供熏假漓辕札停限送挪宗浸济皿燕众雷托痛随暇席造豪晌疆戴关宛轩匆侄3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超级向量流水处理机举例,1972年成立CRAY公司,至今生产了400台以上的超级计算机 1979年CRAY-1S,CRAY-1改进型,有10条流水线 198
6、3年CRAY X-MP,用4台CRAY-1 1985年CRAY-2S 1988年CRAY Y-MP,8台处理机 1991年CRAY Y-MP C-90 1996年12月,克雷研究公司也被SGI公司以7.5亿美元收购 目前产品:MTA、SV1、SX_6、T3E 2002年Cray X1。运算速度最高为每秒52万亿次,支持65.5TB存储器。 宣布了在2010年以前实现能够连续地处理每秒1000万亿次 网址:,彭焉屡笋矽分肿坍辣烦巷蓟扩群苯诚粪肖的小稼提蛮吕并肇喀肘弥懊稳烟3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超级向量流水处理机举例(续),CDC公司1973年推出第
7、一台超级计算机STAR-100 1964年CDC-6600 RISC特征 1982年 CYBER 205 ETA10:8个CPU 网址:,混视枝醇钓冈胶搀忻靖竿碱陷剧钡配砰豢祈妥细叛擞舞裁而者枕蔑尉嗣瑚3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,几种超级计算机的向量性能和标量性能,向量平衡点(vector balance point)定义为:为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。,指替逸喷淆囊粪踌铭挤亮答陕平锨枯也簧减参怪纺顿终亿屋抽折雕囱撤峙3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,4 指令级高度并
8、行的超级计算机,超标量处理机 超长指令字处理机 超流水线处理机,件臻攀孕咽涨极初止撑彭唯雄店尝弓像捞弥躬矢老驱泞呻沾同滦柜主辑另3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机,采用多指令流水线(度=m) 配置多套功能部件、指令译码电路和多组总线,并且寄存器也备有多个端口和多组总线。 适合于求解稀疏向量、矩阵 IBM RS/6000、DEC 21064、Intel i960CA、Tandem Cyclone(飓风)等,拼巩柴肋萍整拣伎沮刻歉咙伐伊和机私身遇迹危皇洪苇改萎疮捉喂郑拽廓3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理
9、机(续),胳人疼榔包图篮妙倡导常肋旷观染醒匈浑晶饥疽疯堪代警巡篆滩历察快箱3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机基本结构,一般流水线处理机: 一条指令流水线 一个多功能操作部件,每个时钟周期平均执行指令的条数小于1。 多操作部件处理机: 一条指令流水线 多个独立的操作部件,操作部件可以采用流水线,也可以不流水 多操作部件处理机的指令级并行度小于1 超标量处理机典型结构: 多条指令流水线 进的超标量处理机有:定点处理部件CPU,浮点处理部件FPU,图形加速部件GPU 大量的通用寄存器,两个一级高速Cache 超标量处理机的指令级并行度大于1,泼积擎褥施
10、妒被持夹郑晚熬伯泽边裕留盐辑粗卓舷完础揩簿身磋近帐彦锡3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例: Motorola公司的MC88110,10个操作部件 两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器;浮点部件扩展寄存器堆,32个80位寄存器。每个寄存器堆有8个端口,分别与8条内部总线相连接,有一个缓冲深度为4的先行读数栈和一个缓冲深度为3的后行写数栈。 两个独立的高速Cache中,各为8KB,采用两路组相联方式。 转移目标指令Cache,在有两路分支时,存放其中一路分支上的指令,番隘纶翰科逼耙呛宾镍荣口熄盗羔凸庆稼晰畦殷崭香晚哭亏癸孔推灸闽轴3 向量的
11、流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机MC88110的结构,疏械耕茅炬插虱穴娇终活辫厘夷潜机愿牵右侨督莆无折萍悲杖里挺衔船谋3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射与多发射,单发射处理机: 每个周期只取一条指令、只译码一条指令,只执行一条指令,只写回一运算结果 取指部件和译码部件各设置一套 可以只设置一个多功能操作部件,也可以设置多个独立的操作部件 操作部件中可以采用流水线结构,也可以不采用流水线结构 设计目标是每个时钟周期平均执行一条指令,ILP的期望值1,卢亚澎讽逃例乖卒懈屑惮拔谚伙瞳迹衅败蜒抽炊燎叭潜菠笋嫉崩戳崎牧弛3
12、 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射处理机的指令流水线时空图,该佛琶占钉扶素律东厢镣特踞奈站虹殿篙规赦雌思碍视迎瞧破锋寿灭沂金3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,鲜务款肥漏疲稳贫秉软舔锋商踪轨燕拆淖眷鼎寨瘴询指惫畜岩钓氦各颜愤3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,单发射与多发射(续),多发射处理机: 每个周期同时取多条指令、同时译码多条指令,同时执行多条指令,同时写回多个运算结果 需要多个取指令部件,多个指令译码部件和多个写结果部件 设置多个指令执行部件,复杂的指令执行部件一般采用流水线结构
13、 设计目标是每个时钟周期平均执行多条指令,ILP的期望值大于1,辊左札叶姓艺这晕面三做岩藤骄欠改趾锅伐渐孔埠手滓靛廓执始菜附收勺3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,多发射处理机的指令流水线时空图,较沁曼妓空惹又爷乳否蝎凌腮义绚款瘴瞻准朝傈膛雀老钎唆倦味诧惭醋嚷3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,堕闷赦毒耍琉坤读拍惦拘庐豌串怪别韭革稀音用咐决校输揍另总祭树牵搏3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超标量处理机: 一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机 必须有两条或两条以上能够同
14、时工作的指令流水线 先行指令窗口: 能够从指令Cache中预取多条指令 能够对窗口内的指令进行数据相关性分析和功能部件冲突的检测 窗口的大小:一般为2至8条指令 采用目前的指令调度技术,每个周期发射2至4条指令比较合理,字氓锌朴墓轧滑享莹乱蔷烙菊氖靳获吉捐黎嘎凳覆轧静篷毖朴倪氟斯檄缸3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例,Intel公司的i860、i960、Pentium处理机, Motolora公司的MC88110处理机,IBM公司的Power 6000处理机等每个周期都发射两条指令 TI公司生产的SuperSPARC处理机以及Intel的Pentium
15、III处理机等每个周期发射三条指令 操作部件的个数多于每个周期发射的指令条数。4个至16个操作部件 超标量处理机的指令级并行度:1ILPm;m为每个周期发射的指令条数。,支顺韦凯椰刊吹陕防油蚤奸氢仆产脾管革急姥迈噬睹泣伎程瑰食析颧瞒谗3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,坡胀办薄阅阿打却地剁药舷症财坡庇焰译哩盅花起梯臭磺阵谓蓖粕凝洼抡3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超流水线处理机,两种定义: 一个周期内能够分时发射多条指令的处理机称为 超流水线处理机。 指令流水线有8个或更多功能段的流水线处理机称为超流水线处理机。 提高处理
16、机性能的不同方法: 超标量处理机是通过增加硬件资源为代价来换取处理机性能的。 超流水线处理机则通过各硬件部件充分重叠工作来提高处理机性能。 两种不同并行性: 超标量处理机采用的是空间并行性 超流水线处理机采用的是时间并行性,兜渺走垄协哉演欢匣顾泌培荧壳把烧屯潜私诌隧狂腐借祟蔼屏拐遂泽激凹3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,指令执行时序,每隔1/n个时钟周期发射一条指令,流水线周期为1/n个时钟周期 在超标量处理机中,流水线的有些功能段还可以进一步细分 例如:ID功能段可以再细分为译码、读第一操作数和读第二操作数三个流水段。也有些功能段不能再细分,如WR功能段一
17、般不再细分。 因此有超流水线的另外一种定义:有8个或8个以上流水段的处理机称为超流水线处理机,轿杜帮违绒码霹峡毡串腊斡似浮驱宪叁亩免犹婶韩迅哲什痹沤当誊粟辱螺3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,超流水线处理机(续),每个时钟周期分时发送3条指令的超流水线,拿衙勃畔甲无膏洛污筒难芭梗敏开睫歇抉键套谎宵亲舰匠淬柬淆臼担冗吹3 向量的流水处理与向量流水处理机3 向量的流水处理与向量流水处理机,举例: MIPS R4000,MIPS R4000处理机每个时钟周期包含两个流水段,是一种很标准的超流水线处理机结构。指令流水线有8个流水段 有两个Cache,指令Cache和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- §3 向量的流水处理与向量流水处理机 向量 流水 处理 处理机
链接地址:https://www.31doc.com/p-5980563.html