首页 > 其他分享 >词根规范

词根规范

时间:2023-07-24 15:44:57浏览次数:21  
标签:缩写 字符 规范 单词 拆分 命名 词根

一、词根定义

  词根,词汇学术语,词汇当中体现基本词汇意义的词素。

  单词一般由三部分组成:词根、前缀和后缀。词根决定单词意思,前缀改变单词词义,后缀决定单词词性。如:

前缀:
in ——> incorrect 不正确的
auto ——> automatic 自动的
tele ——> telephone 固定电话
后缀:
or ——> actor 演员
er ——> teacher 教师
ly ——>friendly 友善的

  词根定义的目的是为表、字段名称建立规范性,总目标是通过搭建词根总库,统一字段表述,实现美宜佳各系统数据的标准化。

二、单词缩写规则

1、截取法

  截取前几位,一般应省略在辅音之后,元音( a, e, i, o, u )之前,一般以辅音结尾。如 american缩写为 am,而不省略为 ame 或 amer,medicine 缩写为 med。如:

g ——> gram 克
t ——> ton 吨
m ——> meter 米
id ——> identifier 标识符
max ——> maximum 最大值
bin ——> binary 二进制
doc ——> document
char ——> character 字符
addr ——> address 地址
expr ——> expression 表达式
admin ——> administrator 管理员
const ——> constant 常量;不变的
coord ——> coordination 坐标
config ——> configuration 配置
struct ——> structure 结构 结构体
uninst ——> uninstall 卸载
sqrt   ——> square root 平方根

2、压缩字母法

  一般取辅音字母,如 Japanese 缩写为Jpn 而不是 Jan,可能Jan 是January 的固定缩写形式,National 缩写为Natl 而不缩写为Nat,可能是Nat 是Nature 和Natural 的缩写。如:

cn ——> chinese 中文
kg ——> kilogram 千克
db ——> database 数据库
bg ——> background 背景
pwd ——> password 密码
idx ——> index 索引
cfg ——> config 配置
pkg ——> package 包
mgr ——> manager 管理

三、词组缩写规则

1、取首字母法

  一般取词组中单词首字母,虚词如 the,of,for,and,on,from,to 等,在缩写时省略。如:

gt ——> greater than 大于
lt ——> less than 小于
ge ——> greater than or equal to 大于等于
le ——> less than or equal to 小于等于
pc ——> personal computer 个人电脑
ui ——> User Interface 用户界面
cd ——> change directory 改变目录
atm ——> automatic teller machines 自动柜员机
cpu ——> central processing unit 中央处理器
apk ——> Android application package 安卓应用程序包
ascii ——> American standard code for Information Interchange 美国信息交换标准代码

2、词组中单词缩写拼接

  也要省略虚词如the,of,for,and,on,from,to等。如:

bgm    ——> background music 背景音乐
cls    ——> clear screen
sqrt   ——> square root 平方根
rmdir  ——> remove directory 移除目录
regex  ——> Regular Expression 正则表达式

四、词根总库搭建

  字段名称标准化的核心是中文词根的唯一性,即“1中文1英文”或“N中文1英文”,举例:

方式,方法  Mode

  不可出现“1中文N英文”或“N中文N英文”,举例:

方式 Mode,Method

1、各个系统入湖清单所有字段去空去重

  在表字段名称规范性建立之前,先对现有的数据入湖清单展开分析。对于每个系统的入湖清单,同步抽取两列信息,字段名与字段中文名,如:

  对于各个系统的两列信息均采取“去空值”与“去重复”操作。

  通过函数LEN呈现入湖清单字段中文名的字符长度,作“升序排列”,删除字符长度为“0”的行,即可实现“去空值”。

  同步选中“字段名”与“字段中文名”,即可借助“数据-删除重复值”实现“去重复”。

 

 

2、各个系统入湖清单字段中文名拆分

  词根总库的搭建,以字段中文名为基准,其字符长度长短不一,如何截取字段决定着词根的质量。

  基于“步骤一”函数LEN,将8个字符以下的字段中文名划分为三组:1-3字符、4-5字符、6-7字符,其中,由于中文的字词特点,1-3字符的短字段即词根,基本不必拆分,4-5字符和6-7字符均需借助函数LEFT、RIGHT拆分,而6-7字符还需函数MID才能拆分完毕。

  拆分到“词根级”,将上述所有拆分前与拆分后的1-3字符放入“词根池”,通过EXCEL“数据-删除重复值”实现“词根池”的去重,再输入函数

=FILTERXML(WEBSERVICE("http://fanyi.youdao.com/translate?&i="&A2269&"&doctype=xml&version"),"//translation")

  得到“词根池”中文和英文翻译,然后按照上面单词和词组的缩写规则,给“词根池”增加英文简写。

3、基于词根库规范全系统字段命名

  后续基于上面整理的词根库对表和字段进行命名,命名一般有驼峰命名法和下划线命名法,我们采用下划线命名法,即以“_”来拼接英文单词或简写,并全部采用小写。可根据命名的长短,灵活使用上面的规则进行组合。尽量使用约定俗成通俗易懂的,或者公司内部通用大家都认可的命名,增加代码可读性。如:

盘点完成 Inventory completed                    命名为  inv_compl
盘点费用结算 Inventory fee settlement            命名为  inv_fee_setmt
配货差异单 Distribution difference order        命名为  dist_diff_ord
品类管理专员 Category Management Specialist        命名为  cat_mgt_sp
医学研究档案 Archives of Medical Research        命名为  arch_med_res

  词根库一次不可能囊括所有场景,后续需把把新增加的词根维护到词根库,,逐步丰富词根库内容。

标签:缩写,字符,规范,单词,拆分,命名,词根
From: https://www.cnblogs.com/qq1035807396/p/17577391.html

相关文章

  • 【技术积累】软件开发规范【一】
    编程规约命名风格【强制】代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束【强制】代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式。说明:正确的英文拼写和语法可以让阅读者易于理解,避免歧义。注意,即使纯拼音命名方式也要避免......
  • 数据库设计规范
    一、新建数据库新建数据库时【字符集】选utf8mb4,【排序规则】选utf8mb4_0900_ai_ci。(没有这一项可以选择utf8mb4_bin)二、表规范1、所有表必有的公共字段所有表必须有id所有表乐观锁版本号创建人、创建时间、更新人、更新时间删除标志,所有的删除为软删除,即删除时sql不能时......
  • CSS2.1规范笔记——10 视觉格式化模型细节
    视觉格式化模型细节包含块的定义元素(生成的)盒的位置有时候是根据一个特定的矩形计算的,叫做元素的包含块(containingblock)。元素包含块的定义如下:元素包含块其为根元素。其包含块是一个被称为初始包含块的矩形。对连续媒体,尺寸取自视口的尺寸,并且被固定在画布开......
  • CSS2.1规范笔记——9.4 常规流
    常规流常规流中的盒属于一个FC,可能是BFC或是IFC中的一个。块级盒参与BFC,行内级盒参与IFC。BFCBFC的产生条件:float:left|rightposition:absolute|fixeddisplay:inline-block|table-cell|table-caption(以及匿名的表格元素)overflow:hidden|auto|scrollBFC的布局......
  • CSS2.1规范笔记——9.5 浮动
    浮动一个浮动盒会向左或向右移动,直到其外边界挨到包含块边界或者另一个浮动盒的外边界。如果存在行框,浮动盒的上外(边界)会与当前行框的上(边界)对齐。如果没有足够的水平空间来浮动,它会向下移动,直到空间合适或者再没出现过其他浮动。因为浮动盒不在常规流内,在浮动盒之前或者之后创......
  • CSS2.1规范笔记——9.6 绝对定位
    绝对定位绝对定位模型中,盒相对其包含块偏移,它会从常规流中全部移除(不会影响后面的兄弟)。绝对定位的盒会为常规流中的子级和绝对(不包括fixed)定位的后代建立一个新的包含块。然而绝对定位的内容不会沿着任何其他盒排列。它们可能会遮住其他盒的内容(或者被它们自身遮住),取决于重叠盒......
  • CSS2.1规范笔记——9.7 分层展示
    分层展示z-index属性该属性指定了:当前堆叠上限爱问(stackingcontext)中,该盒的堆叠层级(stacklevel);该盒是否应该建立一个堆叠上下文;该属性的取值为:<integer>:是生成盒当前堆叠上下文中的堆叠层级,该盒还会建立一个新的堆叠上下文。auto:生成盒在当前堆叠上下文中的堆叠层级为......
  • CSS2.1规范笔记——9.2 控制盒的生成
    控制盒的生成控制盒就是我们常说的盒。盒的类型对其在视觉格式化模型中的行为有一定影响。display的取值display属性指定了盒的类型:none:此元素不会被显示。block:此元素将显示为块级元素,此元素前后会带有换行符。inline:默认。此元素会被显示为内联元素,元素前后没有换行符。......
  • CSS2.1规范笔记——9.1 视觉格式化模型(视口和包含块)
    视觉格式化模型视觉格式化模型:对于可视化媒体,用户代理怎样处理文档树。在视觉格式化模型中,文档树中的每个元素根据其盒模型生成0或多个盒。这些盒的布局由以下因素控制:盒尺寸与类型定位方案(常规流、浮动与绝对定位)文档树中元素间的关系外部信息(例如视口大小、图片的固有尺寸......
  • CSS2.1规范笔记——8.2 外边距与margin合并
    外边距margin取值<length>:一个固定值<percentage>:百分比根据当前生成盒的包含块的width来计算。注意,margin-top和margin-bottom也是根据其包含块的width来计算的。如果包含块的width取决于该元素,那么产生的布局在CSS2.1是未定义的。auto:具体见“计算width与margin”章节。m......