首页 > 其他分享 >开源之夏 | 【结项报告】毕昇Fortran编译器内联动态库函数str_copy

开源之夏 | 【结项报告】毕昇Fortran编译器内联动态库函数str_copy

时间:2022-12-09 16:34:18浏览次数:62  
标签:结项 f90 len 编译器 str 字符串 内联 copy 库函数


作者王哲葳

开源之夏 | 【结项报告】毕昇Fortran编译器内联动态库函数str_copy_c++

项目简介

  • 项目名称
    毕昇Fortran编译器内联动态库函数str_copy
  • 项目描述
    毕昇Fortran编译器是一款基于classic flang的高性能Fortran编译器,支持Fortran编程语言的编译和运行,提供强大的数值计算和数据处理能力,在科学计算领域应用前景广阔。f90_str_copy_klen是一个实现字符串拷贝功能的动态库函数,本项目是对该动态库函数进行内联,预期提高编译器字符串拷贝的性能。
  • 项目导师
    peixin-qiao
  • 项目开发者
    王哲葳,华东师范大学硕士在读
  • 项目链接
    ​​​https://summer-ospp.ac.cn/#/org/prodetail/22b970386​

开发详情

01 方案描述

Flang编译器主要由flang1和flang2两个组件组成,其中flang1用于解析Fortran代码并生成中间表示,然后通过flang2生成LLVM IR并输出。本项目的主要任务就是在flang2中对解析出的“f90_str_copy_klen”函数进行内联优化。这个项目的方案分为如下几步:

步骤一

flang2会获得通过Fortran生成的IR指令列表,遍历该列表,寻找到函数调用指令“I_CALL”。

步骤二

通过“I_CALL”指令的位置查询所调用的是否为需要被内联的函数,如本项目需要实现的“f90_str_copy_klen”函数的内联。在确认需要内联的函数后开始生成相应的指令,“f90_str_copy_klen”函数的内联指令生成过程如下:

  1. 将复制后得到的字符串称为目标字符串,待复制的字符串称为输入字符串。首先需要从原先的指令中获得输入字符串并开辟一系列内存空间用于记录目标字符串、输入字符串的起始地址、字符串索引及字符串长度。
  2. 对每一个输入字符串,从头开始遍历。分别判断当前目标字符串、输入字符串的索引是否小于其长度,如果均符合则将输入字符串中对应索引的字符复制到目标字符串的相应地址中。如果输入字符串索引大于等于其长度则处理下一个输入字符串。如果目标字符串索引大于等于其长度则停止字符串的复制。
  3. 按照2所述流程依次遍历函数中的输入字符串,直至所有字符串都完成复制。
  4. 目标字符串索引是否仍小于其长度,若是,则将目标字符串中剩余未被赋值的字符用空格进行补充。
  5. 将实现上述功能的指令替换掉对应的“I_CALL”指令。

步骤三

继续flang2中的流程以生成对应的LLVM IR 文件。

项目产出

  • [√ ] 实现了项目方案中所需的功能。
  • [√ ] 分别用一个字符串、三个字符串作为输入字符串,完成了共十种输入字符串各种长度情况下”f90_str_copy_klen”函数内联的的功能性测试,在这些输入字符串中也包含了一些ASCII码小于32(ASCII码为32表示空格)的特殊字符。十种情况如下:
    a=b
    len(a) < len(b)
    len(a) = len(b)
    len(a) > len(b)
    a = b // c // d
    len(a) < len(b)
    len(a) = len(b)
    len(b) < len(a) < len(b) + len©
    len(a) = len(b) + len©
    len(b) + len© < len(a) < len(b) + len© + len(d)
    len(a) = len(b) + len© + len(d)
    len(a) > len(b) + len© + len(d)
  • [√ ] 将“f90_str_copy_klen”在函数中调用一亿次,对内联前后所花费的时间做对比。实验结果显示没有内联时运行花费的时间约为10秒,内联后运行花费的时间约为0.7秒。
  • 测试代码如下:
    主函数:main.f90
program main
integer :: i
character(20) :: a, b, c, d
a = "aaaaaaaaaaaaaaa"
b = "aaaaaaaaaaaaaaa"
c = "aaaaaaaaaaaaaaa"
do i = 1, 100000000
call test(a, b, c, d, 20)
enddo
end

字符串拼接拷贝函数:test.f90

subroutine test(a, b, c, d, n)
integer :: n
character(n) :: a, b, c, d
d = a // b // c
end subroutine
  • 测试方法如下:
    未优化前:
$ flang main.f90 -c
$ flang test.f90 -O3 -c
$ flang main.o test.o -o a.out
$ time ./a.out

real 0m10.190s
user 0m10.180s
sys 0m0.004s

优化之后(编译选项-Mx,218,0x1使能该优化功能):

$ flang main.f90 -c
$ flang test.f90 -O3 –c –Mx,218,0x1
$ flang main.o test.o -o a.out
$ time ./a.out

real 0m0.706s
user 0m0.702s
sys 0m0.004s


除开源之夏外,Compiler SIG还发布了十多个开源实习任务,欢迎各位高校生报名参与~

https://www.openeuler.org/zh/internship/


标签:结项,f90,len,编译器,str,字符串,内联,copy,库函数
From: https://blog.51cto.com/u_14948868/5926237

相关文章

  • zlib 压缩解压缩库函数
    1.下载地址http://www.zlib.net/2.使用方法zpipe里面有个例程,示范了压缩和解压缩的功能 3.  例程讲解主要有2个函数,压缩函数例程 和解压缩函数例程......
  • VS 2017 调试窗口显示“ C#编译器内部错误”
    调试时,我尝试评估简单的表达式,例如inta=2;在即时窗口中。一个错误C#编译器中的内部错误解决方式:调试-》选项-》常规-》使用托管兼容模式(勾选)  ......
  • STM32标准库函数记录
    GPIO示例初始化GPIO_InitTypeDefGPIO_InitStructure;GPIO_InitStructure.GPIO_Pin=GPIO_Pin_5; //LED0-->PB.5端口配置GPIO_InitStructure.GPIO_Mode=GPIO_Mo......
  • 编译器优化丨Cache优化
    摘要:本文重点介绍几种通过优化Cache使用提高程序性能的方法。本文分享自华为云社区《编译器优化那些事儿(7):Cache优化》,作者:毕昇小助手。引言软件开发人员往往期望计算机......
  • 2022 VS编译器如何实现监视
    前言:我们在运行代码时,有时出现BUG,这时,我们需要一个debug的过程,而强大的VS编译器提供监视这一功能帮助我们更高效的debug,但很多小伙伴找不到监视窗口,我来给大家解惑。为什么......
  • 使用编译器aarch64-xilinx-linux-gcc,导致uboot编译出现错误“aarch64-xilinx-linux-ld
    KV260PetaLinuxBSP的environment-setup-cortexa72-cortexa53-xilinx-linux会导入aarch64-xilinx-linux系列工具,并设置CROSS_COMPILE为aarch64-xilinx-linux-。因此使用......
  • 解决Qt msvc编译器中文乱码
    编码知识科普参考彻底解决Qt中文乱码以及汉字编码的问题(UTF-8/GBK)_利白的博客-CSDN博客_qt中文乱码解决方法上文讲到了QString显示中文乱码的原因。我的理解qt先对输入......
  • 转载:stm32——GPIO的定义、模式、初始化结构体变量、常用库函数与编程套路
    一、GPIO定义GPIO(GENERALPURPOSEI/OPORTS)意思为通用输入/输出端口,可以为CPU提供数字输入输出功能。通俗地说,就是一些引脚,CPU可以通过它们输出高低电平或者通过它们读入......
  • 数据库函数 group_concat ( ) 结果有长度限制
    #在MySQL配置文件(my.ini)中默认无该配置项,使用默认值时,值为1024,可在客户端执行下列语句修改:#SETGLOBALgroup_concat_max_len=1024;#该语句执行后重启客户端即可用......
  • mycompiler1 大学生利用C++构建一个编译器之词法分析器
    文章目录​​1.定义语言​​​​2.编译器工作流程​​​​2.1.编译器处理的两大过程和分层设计​​​​3.词法分析器的实现​​​​3.1.有限状态机(正则匹配)​​​​3......