μC/OS-II就绪表算法在ARM架构上的改动

来源:本站
导读:目前正在解读《μC/OS-II就绪表算法在ARM架构上的改动》的相关信息,《μC/OS-II就绪表算法在ARM架构上的改动》是由用户自行发布的知识型内容!下面请观看由(电工技术网 - www.9ddd.net)用户发布《μC/OS-II就绪表算法在ARM架构上的改动》的详细说明。
简介:μC/OSII任务就绪表的设置、清除、查找算法,是高效、跨平台的;但是向ARM新架构移植时,没有把ARM的性能完全发挥出来。将就绪表操作算法用汇编指令改写,有助于提高效率,节省存储空间,并扩展μC/OSII支持的最大任务数。

引言

μC/OSII的就绪表设置、清除、查找算法,是高效的、跨平台的程序。它使用了两个查找数组OSMapTbl[8]和OSUnMapTbl[256],以提高查找就绪表的速度,尽快获取就绪任务的最高优先级。

CortexM3是ARM公司较新的一种架构版本,主要应用在单片机领域。基于它生产的32位芯片日益增多;CortexM3只支持Thumb2指令集,在效能和代码密度间能取得更佳的表现。

1在ARM上改动算法的因由利弊

由于就绪表操作是在关中断状态下运行的,其执行影响到系统的中断响应时间,因此就绪表操作算法的效率是衡量实时操作系统优劣的基准之一。

在CortexM3所用的指令集中,一些指令功能不可小觑,如前导零计数clz、字内位反转rbit、位清除bic。其中的clz和bic为μC/OS就绪表的高优先级获取算法指出了另一条道路。

(1) 改动后的优势

① 节省存储空间。不再使用查找数组OSMapTbl[8]和OSUnMapTbl[256]。设立这两个数组的目的,是为了提高查找就绪表的效率。

② 提升查找效率。clz是单周期指令,使用带移位的加法指令,大幅缩短运算时间。

③ 增加了μC/OSII支持的任务数量,从64提升到了1 024(2.84版支持的任务数量已经到了256,不过效率有所下降)。

(2) 存在的不足

① Realview MDK(这里使用的是3.20版及其指令模拟器)尚不支持在C语言程序中使用Thumb2指令内联汇编。使用内嵌汇编函数时,函数的调用(跳转返回)降低了执行效率。

② C语言对clz指令的支持尚有不足,故新算法跨平台性差。但鉴于ARM芯片应用广泛,指令又被ARM9之后的芯片广泛兼容,所以应用空间还算广阔。

2μC/OSII就绪表算法介绍与具体改动

μC/OSII就绪表是一个数组,数组元素一位的值(1或0)对应了一个任务就绪与否,该位在数组中的位置表示任务的优先级。当需要调度已就绪的最高优先级任务运行时,就在就绪表中查找该任务。

2.1μC/OSII就绪表算法简介

一种解决方法是,对数组各项依次判断是否为0:若>0,进入该项查找最小权的置1位位置;若=0,优先级加一个基数,查下一项,直至查到该优先级。

μC/OSII技高一筹,设置了一个对就绪表各项判断是否为0的变量,称之为就绪表组。就绪表组一位为0或1,对应就绪表一项的值是否为0。通过查找就绪表组最小权位的置1位位置,就确定了对应首个>0的就绪表项的下标,从而避免了循环,大幅度提高了效率。

2.2改动方式与源码

clz算法接受了μC/OSII的思路,再通过使用clz指令来进行优化。不同的是,clz是从右往左查,二进制的高权位对应高优先级,而μC/OSII优先级以值小为高。

考虑到有时用不到很多任务,这时用数组作就绪表不免浪费。因此当任务总数小于32时,就用32位无符号整数变量作就绪表。注意,此时就绪表组变量OSRdyGrp被当作就绪表使用。

常量OS_LES_TSK表示是否使用较小任务数,0表示使用最多32个任务,1表示使用最多1 024个任务。

常量RdySt是将32位整数的最高权位置1,以便移位使用。

2.3C语言实现

以下算法利用内嵌clz指令的函数编写,实现了指定优先级任务在就绪表的设置、清除,在就绪表中查找就绪任务的最高优先级。

#defineOS_LES_TSK 0

#defineRdySt #0x80000000

intOSRdyGrp ;//任务就绪表组,任务数<32当作就绪表用

intOSRdyTbl[32] ;//任务就绪表

//将优先级为prio的任务在就绪表置位

voidOSRdySET(unsigned shortprio) {

prio=prio;//设防某些编译器报错

//当任务总数<32时不编译OSRdyTbl[],以提升效率

#ifOS_LES_TSK

OSRdyGrp|=(RdySt>>prio);

#else

//任务数在1~1 024之间,调度将多花些时间

//prio>>5:任务组OSRdyGrp需置1的位的位置,

//即OSRdyTbl[]下标

OSRdyGrp|=(RdySt>>(prio>>5));

//prio & 31:按位与,取prio的低5位,设置数组元素

OSRdyTbl[prio>>5]|=(RdySt>>(prio & 31));

#endif

}

//将优先级为prio的任务在就绪表清零

voidOSRdyCLR(unsigned shortprio) {

prio=prio;

#ifOS_LES_TSK//当任务总数<32

OSRdyGrp&=~(RdySt>>prio);

#else

//任务数在1~1 024之间,调度将多花些时间

//prio>>5:就绪表组OSRdyGrp需清零的位的位置,

//即就绪表OSRdyTbl[]下标

//prio & 31:按位与,取prio的低5位,设置数组元素

OSRdyTbl[prio>>5] &= ~(RdySt>>(prio & 31));

//若就绪表OSRdyTbl[]一项为零,则清零其对应的就

//绪表组的一位

if(OSRdyTbl[prio>>5]==0 )

OSRdyGrp &= ~(RdySt>>(prio>>5));

#endif

}

//前导零计数:内嵌汇编函数,可能降低执行效率

__asm unsigned shortClzGet(intOSRdyGrp) {

clz.w r0,r0

bx lr//不写也能返回,详见后文

}

//获取任务就绪组/表的最高优先级,前导零计数

//函数调用降低效率,可以将下面的语句写在别的函数中

unsignedshortOSPrioHighRdy() {

unsignedshorty;

#ifOS_LES_TSK

//任务数<32,可以考虑将y定义为8位无符号整数

//unsignedchar y;

y=ClzGet(OSRdyGrp);

#else

//任务数在1~1 024之间,调度将多花些时间

y=ClzGet(OSRdyGrp);

y=ClzGet(OSRdyTbl[y])+(y<<5);

#endif

returny;

}

//检查执行结果是否正确,33是适合检查用的数值

intmain() {

unsigned shortprio=0;

while(prio<1024) {

OSRdySET(prio); //根据优先级设置任务就绪表位、组位

prio=OSPrioHighRdy(); //获取就绪表中任务的最高优先级

OSRdyCLR(prio);//根据优先级清除对应的

//就绪表位、组位

prio+=33;

if(prio>1023)

prio=0;

}

}

程序中的bx r14,有些资料上要求必须写,不过查看反汇编代码,编译程序已经给加上了。看来是编译程序已升级,会不会出错要看使用的编译器,建议还是按规范写上。由于内嵌函数调用返回耗时,查找算法未能充分发挥,需改进编译后的汇编代码以实现更高的效率,或使用汇编代码重写这部分程序。

2.4THUMB2汇编指令实现

用汇编语言写程序时的技巧:在最高优先级任务的设置、清除函数中,C语言运算符“|= ”对等汇编指令“orr”,“&= ~”对等汇编指令“bic”。这两条指令都可以进行预移位操作,大幅提高执行效率。可以查看反汇编源码,看C编译器是否利用了这一便利。

在查找函数中,可以省去C语言程序中的内嵌汇编调用,减少冗余指令。示意伪代码如下:

ldr r0,=OSRdyGrp ;加载就绪表组变量OSRdyGrp地址

ldr r1, [r0];取就绪表组变量OSRdyGrp值

#ifOS_LES_TSK

clz.w r0, r1;取最高优先级

#else

clz..w r0, r1;获取最高优先级所在就绪表项的下标

ldr r2,=OSRdyTbl;加载就绪表首地址

add.wr2, r2,r0,#2;计算最高优先级所在就绪表项地址

ldr r3, [r2];取该项的值

Clz.w r1,r3;取该项内的最高优先级

add.w r0,r1,r0 ,lsl #5;计算得到最高优先级

#endif

bx r14

可以看出,除了数据加载指令外,查找的核心算法仅3条指令(使用<32个任务时,仅1条指令)。不过在实际设计算法的时候,还需要考虑指令流水线停顿,方能达到最佳的效果。

2.5μC/OSII 2.84版相关源码介绍

以下是翻译整理后的μC/OSII优先级查找算法源码(2.84版),较长的注释是添加的算法说明。

/************************************

*查找就绪表中的最高优先级任务运行

*说明: 本函数被其他μC/OSII服务调用,以确保就绪表中的

*最高优先级任务最早被执行,全局变量“OSPrioHighRdy”也随

*之改变

*提示:①这是μC/OSII的内部函数,用户程序不要调用它

*② 该函数被调用时需要关中断

*************************************

//就绪优先级调度新算法,将优先级数由8×8=64扩展到

//16×16=256

staticvoidOS_SchedNew (void) {

#if OS_LOWEST_PRIO <= 63//参考最多提供64个优先级

INT8Uy;

/*数组OSUnMapTbl[256]的作用:

当给定一个位二进制无符号整数,如OSRdyGrp,怎么判断它被置1的最小权位是哪个,即如何从右往左查找第一个1出现的位置?当处理器没有现成的指令时,可以先将数的256种状况

存入数组OSUnMapTbl[256]中,判断最小权位时,查询数组

OSUnMapTbl[OSRdyGrp]即可*/

y = OSUnMapTbl[OSRdyGrp];

OSPrioHighRdy = (INT8U)((y << 3) + OSUnMapTbl[OSRdyTbl[y]]);

#else//现在能提供256个优先级

INT8Uy;//就绪表组,用1或0标记

有无就绪任务

INT16U *ptbl;//就绪表某一项指针,计算后确定是哪一项

/*当16位整数OSRdyGrp低8位不为零,获取就绪表组置1的最小权位0~7,

则获取8~15位*/

if ((OSRdyGrp & 0xFF) != 0) {

y = OSUnMapTbl[OSRdyGrp & 0xFF];

} else {

y = OSUnMapTbl[(OSRdyGrp >> 8) & 0xFF] + 8;

}

ptbl = &OSRdyTbl[y];/*就绪表数组某一项指针赋值*/

if ((*ptbl & 0xFF) != 0) {

OSPrioHighRdy = (INT8U)((y << 4) + OSUnMapTbl[(*ptbl & 0xFF)]);

} else {

OSPrioHighRdy = (INT8U)((y << 4) + OSUnMapTbl[(*ptbl >> 8) & 0xFF] + 8);

}

#endif

}

clz最高优先级查找算法,与μC/OS的新算法有所不同:返回的结果分别是8位、16位整数。这是因为8位已经不能表示>255的值;过程中clz算法更多地使用16或32位整数,以充分利用芯片性能。

3适用范围

等待任务列表使用了与就绪表操作相似的过程,注意要同时更改其数据类型和算法。算法虽然是在CortexM3上执行的,但适用于ARM9及其以后芯片。支持ARM指令集的芯片,可以在C语言中使用内嵌汇编,不必再编写汇编查找函数。

本文所叙述的算法适用于下述两种情况。

① 使用μC/OSII系统:

◆ 要求更多的任务优先级;

◆ 要求产品性能优越或是时间关键的应用,想进一步提高效率;

◆ 学习、研究或希望优化μC/OSII以扩展其应用范围。

② 未使用μC/OSII系统:

◆ 移植改造其他操作系统的就绪表算法;

◆ 编写新操作系统或执行调度程序;

◆ 编程爱好者借鉴、改进编程方法。

提醒:《μC/OS-II就绪表算法在ARM架构上的改动》最后刷新时间 2024-03-14 00:57:10,本站为公益型个人网站,仅供个人学习和记录信息,不进行任何商业性质的盈利。如果内容、图片资源失效或内容涉及侵权,请反馈至,我们会及时处理。本站只保证内容的可读性,无法保证真实性,《μC/OS-II就绪表算法在ARM架构上的改动》该内容的真实性请自行鉴别。