热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

RISCV处理器的C语言启动代码设计方法

关注、星标公众号,不错过精彩内容作者:唐思超来源:嵌入式资讯精选随着微处理器市场竞争加剧,RISC-V指令集越来越受到关注。

关注、星标公众,不错过精彩内容

作者:唐思超

来源:嵌入式资讯精选

随着微处理器市场竞争加剧,RISC-V指令集越来越受到关注。虽然RISC-V并非第一个开源的指令集(ISA),却是第一个可依据实际应用场景灵活选择指令集的指令集架构。RISC-V指令集架构可以满足从高性能服务器CPU直至超低功耗传感器内嵌CPU的全部应用场景。

通常情况下,一款处理器的启动代码基本采用汇编语言设计。其原因包括:

  • 在处理器启动阶段,C运行环境还未初始化;

  • 汇编语言实现的代码不受编译器影响;

  • 某些特殊寄存器操作无法通过C编译得到对应汇编代码;

  • 处理器的某些特殊设计不利于C语言的使用等。

本文将解决前述问题,展示一种使用C语言为RISC-V处理器设计启动代码的方法。

为了更清晰地讨论问题并最大程度的便于读者理解某些流程,本文以芯来科技基于RV32IMC指令集的N205系列内核作为目标处理器,从N205内核的对标架构——来自ARM的Cortex-M内核在IAR EmbeddedWorkbench for ARM[1](后文简称IAR)环境下的C语言启动代码切入,逐步引入并实现SEGGER Embedded Studio[2](后文简称SES)环境下N205系列内核的C语言启动代码。

一、Cortex-M内核在IAR环境下的C语言启动代码

Cortex系列内核是ARM公司迄今为止最成功的系列产品,包括A、R、M三类,其中M系列主要针对微控制器市场。

Cortex-M内核具有以下特点:

  • 内核包含高级中断控制器;

  • 中断响应时,处理器硬件将相应的寄存器入栈和出栈;

  • 向量表中首单元内容为栈地址,其余均为异常或中断函数的入口地址;

  • 向量表中的内容均为硬件自动载入。

代码段1所示内容是Cortex-M内核在IAR环境下使用C语言开发的启动代码。

【代码段-1】

#pragma language=extended ❶--snip--
voidResetISR(void);           ❷
--snip--
externvoid __iar_program_start(void);   ❸
staticunsigned long pulStack[64] @".noinit"; ❹
typedefunion         ❺
{void (*pfnHandler)(void);unsigned long ulPtr;
}
uVectorEntry;
__rootconst uVectorEntry __vector_table[] @".intvec" =          ❻
{{ .ulPtr = (unsigned long)pulStack +sizeof(pulStack) },           ❼ResetISR,         
--snip--
};
--snip--
voidResetISR(void)
{__iar_program_start();
}

此处对上述代码做简要分析:

❶是IAR的#pragma指导符。

❷是复位函数声明,复位函数是处理器复位后首先执行的代码,有时也称为复位入口函数。

❸是IAR系统函数声明,__iar_program_start是IAR的系统函数,主要作用是执行C运行环境初始化并调用系统主函数main。

❹使用IAR @操作符定义系统栈区。

❺声明向量表的联合类型。

❻使用IAR对象属性声明__root及@操作符定义向量表,其中,第一个元素❼保存了栈底地址,后续元素均为函数地址。

从上述分析过程可以看出启动代码的必要工作包括定义栈区、定义并初始化向量表,定义并实现系统复位函数,初始化栈指针或栈寄存器等。依据处理器的架构不同,上述操作中某些过程需要由软件完成,有些则由硬件自动加载。

另外,有关IAR的指导符、对象属属性等内容不属于本文讨论范畴,有需要可自行查阅。这里给出两点提示:IAR环境的编译系统为IAR自行开发,故示例代码中的指导符号不适用于GCC;某些指导符会因IAR环境版本不同而有所差异。

二、在SES环境下实现RISC-V内核C语言启动代码的必要知识

前文提到,RISC-V是指令集而不是具体的设计实现,这与之前讨论的Cortex-M系列内核有很大不同。简单地说,不同厂商基于同种Cortex-M内核的处理器,仅从内核的层面来看可能没有太大差异,但不同厂商开发的具有相同指令集的RISC-V处理器则各有千秋:一方面是相同功能的具体实现可能不同;另一方面,不同厂商可以实现不同的指令扩展。

 这里对比Cortex-M内核,列举RISC-V处理器的一些特点:不同厂商中断控制器的实现各有特色;中断响应时,处理器硬件不会保存上下文,需要软件完成该功能;向量表依据厂商不同而有明显差异,可能向量表的首地址保存的是指令而非地址。

在不同厂商的Cortex-M内核处理器间作切换时,由于处理器内核的一致性,启动代码几乎无需改动,因而使用汇编或者C语言来设计启动代码似乎差异不大,但要降低在不同厂商的RISC-V处理器间切换的复杂度,使用C语言开发启动代码是一种有效途径。

前文曾提到启动代码的必要工作包括定义栈区、定义并初始化向量表,定义并实现系统复位函数,初始化栈指针或栈寄存器等。在前述Cortex-M内核的C启动代码中,IAR提供了接口__iar_program_start,该接口隐藏了几乎所有细节。在SES环境下并没有这样的接口可供使用,为了实现RISC-V处理器的C语言启动代码,需要如下的编译器及链接器相关知识。

(1)GCC内联汇编

RISC-V处理器中的CSR寄存器需要特殊的指令才能进行访问,C编译器无法产生类似的指令,故C语言启动代码中仍然需要插入数条汇编指令。为了实现汇编指令与C语言的交互,需要使用GCC内联汇编,实例介绍如下:

asmvolatile (      ❶
"csrw0x307, %0"    ❷
:                   ❸
:"r"(vector_base) ❹
:                   ❺
);

其中:❶ asm为GCC内联汇编关键字,volatile为修饰符;❷ 双引号引用的汇编指令列表,如有多条指令,可以使用"\n"分割;其中%0代表输入操作数列表中的第一个值;❸ 可选的输出操作数列表;❹ 可选的输入操作数列表,此处"r"代表使用编译器自动分配的寄存器来存储变量vector_base;❺ 可选的受影响寄存器列表。

(2)p与初始化

简单来讲,将目标文件中的ps链接起来就是可执行文件。在默认情况下,编译器会创建标准ps。表1是标准p的简单介绍。

表1   标准p概要

通过表1可以看出,程序的可执行代码存放于.text p,已初始化的全局和静态变量存放于.data p。

一个典型的SoC系统通常包含两类存储器,即ROM和RAM。对于当今的处理器来说,这两部分通常是Flash和SRAM。系统掉电情况下,SRAM中是无法保存数据的,因此C语言中的变量初始值需要保存于Flash中。系统上电后,由初始化代码将初始化数据从Flash拷贝到SRAM的目标地址。如前所述,这是初始化代码的重要工作之一。

接下来将阐述如何从Flash中找到初始化数据的位置并在C语言中引用。

(3)链接器变量的C语言访问

从链接器的观点看,初始值在Flash中的存放地址称为LMA(加载存储地址),对应变量在SRAM的运行时地址称为VMA(虚拟存储地址)。链接器脚本是用来描述处理器存储器分布、各p 及标准p的包含关系、相应LMA及VMA地址或存放区域等的文件。

代码段2是一个标准链接器脚本的片段。这里通过这个片段来讲述链接器变量的C语言访问。

【代码段-2】

MEMORY
{--snip--
}
SECTIONS
{--snip--__data_load_start__ = ALIGN(__srodata_end__ ,4);.data ALIGN(__RAM_segment_start__ , 4) :AT(ALIGN(__srodata_end__ , 4)){__data_start__ = .;*(.data .data.*)}__data_end__ = __data_start__ +SIZEOF(.data);__data_size__ = SIZEOF(.data);__data_load_end__ = __data_load_start__ +SIZEOF(.data);--snip--
}

在代码段2中,定义了链接器脚本变量__data_load_start__、__data_start__及__data_end__。

其中:

  • __data_load_start__代表LMA地址

  • __data_start__代表VMA地址

在C语言中访问这些变量有以下两种方法:

将链接器脚本变量声明为数据类型,例如在C语言文件中声明extern uint32_t __data_load_start__;通过&__data_load_start__获取变量的值;

将链接器脚本变量声明为数组,例如在C语言文件中声明externuint32_t __data_load_start__[];通过__data_load_start__获取变量的值。

(4)函数属性

在通常情况下,编译器会为每个函数自动产生序言和结尾序列,即在函数的头部进行一些入栈操作,在函数的末尾进行对应的出栈操作。一个明显的问题就是在C语言启动代码中,复位函数执行时可能栈指针或栈寄存器还没有进行初始化,这时的栈操作极有可能会导致处理器访问非法地址而使程序崩溃。此外,如前文所提到的RISC-V处理器的复位入口可能保存的是跳转指令而不是地址,短的跳转地址可以保证用一条指令完成跳转。

鉴于上述原因,需要使用相关的函数属性来通知编译器剔除默认的函数序列并指定p,如下形式的复位函数定义可满足该要求:

void __attribute__((p(".init"),naked)) reset_handler(){
--snip--
};

三、RISC-V内核的C语言启动代码实例

前面内容介绍了相关背景知识和技术手段,下面通过一个实际的框架程序来展示RISC-V处理器的C语言启动代码。其中,代码段3是C语言启动代码的实现,代码段4是向量表。代码中的所有关键点前文均有介绍,在此不在赘述。

【代码段-3】

#include"riscv_encoding.h"
#include
--snip--
externuint32_t __data_load_start__;
--snip--
externuint32_t __bss_start__;
--snip--
externvoid (*const vector_base[])(void);
externvoid main(void);
--snip--
conststruct {uint32_t* load;uint32_t* start;uint32_t* end;
}dp[3] = {--snip--
};
conststruct {uint32_t* start;uint32_t* end;
}bp[3] = {--snip--
};
void __attribute__((p(".init"),naked)) reset_handler() {register uint32_t *src, *dst;--snip--/* 嵌入汇编 */asm volatile("csrw 0x307,%0"::"r"(vector_base));
--snip--asm volatile("la gp, __sdata_start__+0x800");asm volatile("la sp,__stack_end__");
--snip--/* 进行系统时钟初始化等 */init();/* 将数据的初始化值拷贝至RAM */if(&__vectors_load_start__ !&#61;&__RAM_segment_start__){ for(uint8_t idx &#61; 0; idx <3; idx&#43;&#43;){src&#61;dp[idx].load;dst&#61;dp[idx].start;while(dst --snip--

【代码段-4】

.p .vectors, "ax"--snip--.globl vector_base
vector_base:jreset_handler.align 2.word 0--snip--

四、结  语

通常半导体厂商会在配套的软件开发包中提供处理器的启动代码&#xff0c;这导致多数嵌入式开发人员可能更关注应用部分的代码实现而忽视启动代码的存在。鉴于厂商提供的启动代码几乎都用汇编语言编写&#xff0c;这使得很多开发人员误以为启动代码必须使用汇编语言开发。

事实上&#xff0c;大多数处理器的启动代码都可以使用C语言进行开发且代码效率与汇编几乎没有差异。在工程实践中&#xff0c;很多深层次开发都需要对启动代码进行修改或重写&#xff0c;基于C语言的代码可以节省开发人员在学习汇编指令方面的时间和精力&#xff0c;同时在后续的升级维护中更加高效。

补充知识点&#xff1a;

[1]考虑到Cortex-M系列架构的开发多使用IAR、MDK等环境&#xff0c;此处以IAR环境为例。

[2]考虑到当前RISC-V的集成开发环境多基于Eclipse构建&#xff0c;SEGGER Embedded Studio环境基于自有构架且使用方便、功能强大&#xff0c;故此处以SES为例。另外&#xff0c;包括SES在内的RISC-V开发环境下的编译系统均基于GCC&#xff0c;故本文讨论的方法也适用于其他开发环境。

[3]如果需要在GCC内联汇编代码中使用宏定义&#xff0c;就需要使用一种称为“双重宏定义”的方法&#xff0c;示例如下&#xff1a;

#defineCSR_MTVT 0x307
#defineSTR(R) #R
#defineXSTR(R) STR(R)/*asm volatile("csrw 0x307, %0"::"r"(vector_base)); */
asmvolatile("csrw "XSTR(CSR_MTVT)",%0"::"r"(vector_base));

作者简介&#xff1a;

唐思超,现任北京知存科技有限公司软件开发经理&#xff0c;负责人工智能芯片工具链及嵌入式开发,具有14年硬件电路设计及软件开发经验&#xff0c;擅长处理器、编译系统及操作系统的相关设计开发及底层机制的综合运用。

声明&#xff1a;本文内容仅代表原创作者观点&#xff0c;如有错误敬请理解。

‧  END  

推荐阅读&#xff1a;

精选汇总 | 目录 | 搜索

研发低功耗产品&#xff0c;你遇到过哪些“坑”&#xff1f;

十年来影响最大的C&#43;&#43; 20准备发布

关注微信公众号『strongerHuang』&#xff0c;后台回复“1024”&#xff0c;查看更多精彩内容。

长按前往图中包含的公众号关注


推荐阅读
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 分享2款网站程序源码/主题等后门检测工具
    本文介绍了2款用于检测网站程序源码和主题中是否存在后门的工具,分别是WebShellkiller和D盾_Web查杀。WebShellkiller是一款支持webshell和暗链扫描的工具,采用多重检测引擎和智能检测模型,能够更精准地检测出已知和未知的后门文件。D盾_Web查杀则使用自行研发的代码分析引擎,能够分析更为隐藏的WebShell后门行为。 ... [详细]
  • 本文介绍了win7系统休眠功能无法启动和关闭的解决方法,包括在控制面板中启用休眠功能、设置系统休眠的时间、通过命令行定时休眠、手动进入休眠状态等方法。 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 本文介绍了如何使用python从列表中删除所有的零,并将结果以列表形式输出,同时提供了示例格式。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • 设计模式——模板方法模式的应用和优缺点
    本文介绍了设计模式中的模板方法模式,包括其定义、应用、优点、缺点和使用场景。模板方法模式是一种基于继承的代码复用技术,通过将复杂流程的实现步骤封装在基本方法中,并在抽象父类中定义模板方法的执行次序,子类可以覆盖某些步骤,实现相同的算法框架的不同功能。该模式在软件开发中具有广泛的应用价值。 ... [详细]
  • 本文介绍了一种图的存储和遍历方法——链式前向星法,该方法在存储带边权的图时时间效率比vector略高且节省空间。然而,链式前向星法存图的最大问题是对一个点的出边进行排序去重不容易,但在平行边无所谓的情况下选择这个方法是非常明智的。文章还提及了图中搜索树的父子关系一般不是很重要,同时给出了相应的代码示例。 ... [详细]
  • 本文介绍了Perl的测试框架Test::Base,它是一个数据驱动的测试框架,可以自动进行单元测试,省去手工编写测试程序的麻烦。与Test::More完全兼容,使用方法简单。以plural函数为例,展示了Test::Base的使用方法。 ... [详细]
  • Iamtryingtocreateanarrayofstructinstanceslikethis:我试图创建一个这样的struct实例数组:letinstallers: ... [详细]
author-avatar
清潇静凌
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有