首页 > 其他分享 >copy_to_user和copy_from_user两个函数的分析

copy_to_user和copy_from_user两个函数的分析

时间:2023-04-25 11:02:08浏览次数:45  
标签:__ 函数 unsigned long user copy


在内核的学习中会遇到很多挺有意思的函数,而且能沿着一个函数扯出来很多个相关的函数。copy_to_user和copy_from_user就是在进行驱动相关程序设计的时候,要经常遇到的两个函数。由于内核空间与用户空间的内存不能直接互访,因此借助函数copy_to_user()完成用户空间到内核空间的复制,函数copy_from_user()完成内核空间到用户空间的复制。下面我们来仔细的理一下这两个函数的来龙去脉。

首先,我们来看一下这两个函数的在源码文件中是如何定义的:

~/arch/i386/lib/usercopy.c
unsigned long
copy_to_user(void __user *to, const void *from, unsigned long n)
{
       might_sleep();
       BUG_ON((long) n < 0);
       if (access_ok(VERIFY_WRITE, to, n))
              n = __copy_to_user(to, from, n);
       return n;
}
EXPORT_SYMBOL(copy_to_user);

从注释中就可以看出,这个函数的主要作用就是从内核空间拷贝一块儿数据到用户空间,由于这个函数有可能睡眠,所以只能用于用户空间。它有如下三个参数,

       To 目标地址,这个地址是用户空间的地址;

       From 源地址,这个地址是内核空间的地址;

       N 将要拷贝的数据的字节数。

如果数据拷贝成功,则返回零;否则,返回没有拷贝成功的数据字节数。

以上是对函数的一些说明,接下来让我们看看这个函数的内部面目:

参数to的时候有个__user限定,这个在~/include/linux/compiler.h中有如下定义:

# define __user     __attribute__((noderef, address_space(1)))

表示这是一个用户空间的地址,即其指向的为用户空间的内存

大家可能对这个__attribute__感到比较迷惑,不过没关系,google一下嘛

__attribute__是gnu c编译器的一个功能,它用来让开发者使用此功能给所声明的函数或者变量附加一个属性,以方便编译器进行错误检查,其实就是一个内核检查器。

具体可以参考如下:

http://unixwiz.net/techtips/gnu-c-attributes.html

接下来我们看一下

might_sleep();它有两个实现版本,debug版本和非debug版本:

在debug版本中,在有可能引起sleep的函数中会给出相应的提示,如果是在原子的上下文中执行,则会打印出栈跟踪的信息,这是通过__might_sleep(__FILE__, __LINE__);函数来实现的,并且接着调用might_resched()函数进行重新调度。

在非debug版本中直接调用might_resched()函数进行重新调度。

其实现方式为,在~/ include/linux/kernel.h中:

#ifdef CONFIG_DEBUG_SPINLOCK_SLEEP
void __might_sleep(char *file, int line);
# define might_sleep() /
do { __might_sleep(__FILE__, __LINE__); might_resched(); } while (0)
#else
# define might_sleep() do { might_resched(); } while (0)
#endif

接下来是一个检查参数合法性的宏:

BUG_ON((long) n < 0);

其实现为如下(在~/include/asm-generic/bug.h):

它通过检查条件,根据结果来决定是否打印相应的提示信息;

#ifdef CONFIG_BUG
#ifndef HAVE_ARCH_BUG
#define BUG() do { /
    printk("BUG: failure at %s:%d/%s()!/n", __FILE__, __LINE__, __FUNCTION__); /
    panic("BUG!"); /
} while (0)
#endif
#ifndef HAVE_ARCH_BUG_ON
#define BUG_ON(condition) do { if (unlikely((condition)!=0)) BUG(); } while(0)
#endif

    接下来是一个宏

    

access_ok(VERIFY_WRITE, to, n)

它是用来检查参数中一个指向用户空间数据块的指针是否有效,如果有效返回非零,否则返回零。其实现如下(在/include/asm-i386/uaccess.h中):

#define access_ok(type,addr,size) (likely(__range_ok(addr,size) == 0))

其中__range_ok(addr,size)的实现是通过内嵌汇编来实现的,内容如下(在/include/asm-i386/uaccess.h中):

#define __range_ok(addr,size) ({ /
    unsigned long flag,sum; /
    __chk_user_ptr(addr); /
    asm("addl %3,%1 ; sbbl %0,%0; cmpl %1,%4; sbbl $0,%0" /
        :"=&r" (flag), "=r" (sum) /
        :"1" (addr),"g" ((int)(size)),"g" (current_thread_info()->addr_limit.seg)); /
flag; })

其实现的功能为:

(u33)addr + (u33)size >= (u33)current->addr_limit.seg

    判断上式是否成立,若不成立则表示地址有效,返回零;否则返回非零

接下来的这个函数才是最重要的函数,它实现了拷贝的工作:

   

__copy_to_user(to, from, n)

其实现方式如下(在/include/asm-i386/uaccess.h中):

static __always_inline unsigned long __must_check
__copy_to_user(void __user *to, const void *from, unsigned long n)
{
       might_sleep();
       return __copy_to_user_inatomic(to, from, n);
}

有一个__always_inline宏,其内容就是inline,一个__must_check,其内容是在gcc3和gcc4版本里为__attribute__((warn_unused_result))

其中might_sleep同上面__user时候的注释。

最终调用的是__copy_to_user_inatomic(to, from, n)来完成拷贝工作的,此函数的实现如下(在/include/asm-i386/uaccess.h中):

static __always_inline unsigned long __must_check
__copy_to_user_inatomic(void __user *to, const void *from, unsigned long n)
{
    if (__builtin_constant_p(n)) {
        unsigned long ret;
 
        switch (n) {
        case 1:
            __put_user_size(*(u8 *)from, (u8 __user *)to, 1, ret, 1);
            return ret;
        case 2:
            __put_user_size(*(u16 *)from, (u16 __user *)to, 2, ret, 2);
            return ret;
        case 4:
            __put_user_size(*(u32 *)from, (u32 __user *)to, 4, ret, 4);
            return ret;
        }
    }
    return __copy_to_user_ll(to, from, n);
}

其中__builtin_constant_p(n)为gcc的内建函数,__builtin_constant_p用于判断一个值是否为编译时常熟,如果参数n的值为常数,函数返回1,否则返回0。很多计算或操作在参数为常数时有更优化的实现,在 GNU C 中用上面的方法可以根据参数是否为常数,只编译常数版本或非常数版本,这样既不失通用性,又能在参数是常数时编译出最优化的代码。

如果n为常数1、2或者4,就会选择某个swith来执行拷贝动作,拷贝是通过如下函数来实现的(在/include/asm-i386/uaccess.h中):

#ifdef CONFIG_X86_WP_WORKS_OK
#define __put_user_size(x,ptr,size,retval,errret)           /
do {                                    /
    retval = 0;                         /
    __chk_user_ptr(ptr);                        /
    switch (size) {                         /
    case 1: __put_user_asm(x,ptr,retval,"b","b","iq",errret);break; /
    case 2: __put_user_asm(x,ptr,retval,"w","w","ir",errret);break; /
    case 4: __put_user_asm(x,ptr,retval,"l","","ir",errret); break; /
    case 8: __put_user_u64((__typeof__(*ptr))(x),ptr,retval); break;/
    default: __put_user_bad();                /
    }                               /
} while (0)
#else
#define __put_user_size(x,ptr,size,retval,errret)           /
do {                                    /
    __typeof__(*(ptr)) __pus_tmp = x;               /
    retval = 0;                         /
                                    /
    if(unlikely(__copy_to_user_ll(ptr, &__pus_tmp, size) != 0)) /
        retval = errret;                    /
} while (0)
#endif
其中__put_user_asm为一个宏,拷贝工作是通过如下的内联汇编来实现的(在/include/asm-i386/uaccess.h中):
#define __put_user_asm(x, addr, err, itype, rtype, ltype, errret)   /
    __asm__ __volatile__(                       /
        "1: mov"itype" %"rtype"1,%2/n"          /
        "2:/n"                          /
        ".section .fixup,/"ax/"/n"              /
        "3: movl %3,%0/n"                   /
        "   jmp 2b/n"                   /
        ".previous/n"                       /
        ".section __ex_table,/"a/"/n"               /
        "   .align 4/n"                 /
        "   .long 1b,3b/n"                  /
        ".previous"                     /
        : "=r"(err)                     /
    : ltype (x), "m"(__m(addr)), "i"(errret), "0"(err))

 

以上这两个函数是为了在拷贝小字节数据比如char/int等数据的时候考虑到效率来实现小数据拷贝。

而若n不是如上所说的常数,则进行数据块区域拷贝,其实现如下(~/arch/i386/lib/usercopy.c):

unsigned long __copy_to_user_ll(void __user *to, const void *from, unsigned long n)
{
    BUG_ON((long) n < 0);
#ifndef CONFIG_X86_WP_WORKS_OK
    if (unlikely(boot_cpu_data.wp_works_ok == 0) &&
            ((unsigned long )to) < TASK_SIZE) {
        /* 
        * CPU does not honor the WP bit when writing
        * from supervisory mode, and due to preemption or SMP,
        * the page tables can change at any time.
        * Do it manually. Manfred <[email protected]>
        */
        while (n) {
                 unsigned long offset = ((unsigned long)to)%PAGE_SIZE;
            unsigned long len = PAGE_SIZE - offset;
            int retval;
            struct page *pg;
            void *maddr;
            
            if (len > n)
                len = n;
 
survive:
            down_read(¤t->mm->mmap_sem);
            retval = get_user_pages(current, current->mm,
                    (unsigned long )to, 1, 1, 0, &pg, NULL);
 
            if (retval == -ENOMEM && current->pid == 1) {
                up_read(¤t->mm->mmap_sem);
                blk_congestion_wait(WRITE, HZ/50);
                goto survive;
            }
 
            if (retval != 1) {
                up_read(¤t->mm->mmap_sem);
                     break;
               }
 
            maddr = kmap_atomic(pg, KM_USER0);
            memcpy(maddr + offset, from, len);
            kunmap_atomic(maddr, KM_USER0);
            set_page_dirty_lock(pg);
            put_page(pg);
            up_read(¤t->mm->mmap_sem);
 
            from += len;
            to += len;
            n -= len;
        }
        return n;
    }
#endif
    if (movsl_is_ok(to, from, n))
        __copy_user(to, from, n);
    else
        n = __copy_user_intel(to, from, n);
    return n;
}
EXPORT_SYMBOL(__copy_to_user_ll);

 

下面是copy_from_user函数的实现:

unsigned long
copy_from_user(void *to, const void __user *from, unsigned long n)
{
       might_sleep();
       BUG_ON((long) n < 0);
       if (access_ok(VERIFY_READ, from, n))
              n = __copy_from_user(to, from, n);
       else
              memset(to, 0, n);
       return n;
}
EXPORT_SYMBOL(copy_from_user);

其实现方式与copy_to_user函数的实现方式类似:就不再累述了。

如上就是copy_to_user和copy_from_user两个函数的工作方式,这些进行简单的分析与跟踪。细节的部分还有待于进一步研究。


copy_to_user与mmap的工作原理


copy_to_user 在每次拷贝时需要检测指针的合法性,也就是用户空间的指针所指向的地址的确是一段该进程本身的地址,而不是指向了不属于它的地方,而且每次都会拷贝一次数 据,频繁访问内存,由于虚拟地址连续,物理地址不一定会连续,从而造成CPU的CACHE频繁失效,从而使速度降低   

  mmap仅在第一次 使用时为进程建立页表,也就是将一段物理地址映射到一段虚拟地址上,以后操作时不再检测其地址的合法性(合法**由CPU页保护异常来做),另一方面是内 核下直接操作mmap地址,可以不用频繁拷贝,也就是说在内核下直接可用指针向该地址操作,而不再在内核中专门开一个缓冲区,然后将缓冲区中的数据拷贝一 次进来,mmap一般是将一段连续的物理地址映射成一段虚拟地址,当然,也可以将每段连续,但各段不连续的物理地址映射成一段连续的虚拟地址,无论如何, 其物理地址在每段之中是连续的,这样一来,就不会造成CPU的CACHE频繁失效,从而大大节约时间。


标签:__,函数,unsigned,long,user,copy
From: https://blog.51cto.com/u_16087831/6223592

相关文章

  • JavaScript回调函数
    一种场景js需要等待一个函数执行完后再执行另一个函数或者其他的操作。本编以最简单的例子来说明回调函数的执行过程。回调函数备注上就是以函数对象作为参数进行传递。demo<!DOCTYPEhtml><html><head><metahttp-equiv="Content-Type"content="text/html;charset=gb2312"/>......
  • react antd 函数式弹窗案例
     1.弹窗函数exportconstcheckReviewTaskTipModal=async(checkResult:{status:boolean;mseeage:string;})=>{returnnewPromise((r,j)=>{constcancelFc=()=>{mConfirm?.destroy();};constmConfirm=Modal.confi......
  • 虚析构函数
    一、问题提出定义一个基类BassClass,从他派生出类DerivedClass.在BaseClass中声明虚析构函数,,在主函数中将一个动态分配的DerivedClass的对象地址赋给一个bassClass的指针,然后通过指针释放对象空间,观察运行结果。代码实现。#include<iostream>#include<iomanip>#include<cmath>#i......
  • 支持向量机上的核函数对比
    探索核函数在不同数据集上的表现导入模块importnumpyasnpimportmatplotlib.pyplotaspltfrommatplotlib.colorsimportListedColormapfromsklearnimportsvmfromsklearn.datasetsimportmake_circles,make_moons,make_blobs,make_classification创建数据集,定......
  • Vue关于beforeRouteEnter以及beforeRouteLeave函数的运用
    先上代码beforeRouteEnter:(to,from,next)=>{console.log("进入路由之前")next(vm=>{vm.getData();});},beforeRouteLeave:(to,from,next)=>{console.log("进入路由之后")next();},methods:{getData:f......
  • 一些可能不知道或不熟悉的有用但冷门的库函数
    提取自洛谷日报从C++98到C++20,寻觅甜甜的语法糖们中C++98到C++14的部分。这是菜鸡作者写给自己看的,你认为有缺失可以在评论区说,但是不一定会添加。函数所位于的库就不写了,反正都#include<bits/stdc++.h>了。__lg(x):GNU私货。返回\(\lfloor\log_2x\rfloor\)。__b......
  • pip 安装库是报错ERROR: Cannot unpack file C:\Users\LX\AppData\Local\Temp\p
    使用pip安装python库的时候出现报错:ERROR:CannotunpackfileC:\Users\LX\AppData\Local\Temp\pip-unpack-apk_4xkw\simple(downloadedfromC:\Users\LX\AppData\Local\Temp\pip-req-build-htbv29co,content-type:text/html;charset=utf-8);cannotdetectarch......
  • 【C/C++】 可变参数函数
    #include<stdio.h>#include<stdarg.h>/***按自定义格式符解析数据*/voidprocess(constchar*fmt,va_listargs){for(;*fmt;fmt++){if(*fmt=='%'){continue;}switch(*fmt){ca......
  • PHP中的引用参数的函数
    前言php的引用(就是在变量或者函数、对象等前面加上&符号)在PHP中引用的意思是:不同的名字访问同一个变量内容。与C语言中的指针是有差别的。C语言中的指针里面存储的是变量的内容在内存中存放的地址,函数的引用返回多用在对象中引用参数的函数格式说明如下代码所示:voidfunName(array......
  • BeanUtils.copyProperties()深拷贝失效,对象值被引用改变
    之前就想一个深拷贝的解决方案,尝试用BeanUtils.copyProperties实现现在发现无法实现,两个变量引用位置相同最好自己实现一个工具类。之前在脉脉上看到有人提问,回答是用fastjson序列化解决的 Studentclone=JSONObject.parseObject(JSONObject.toJSONBytes(student),Stude......