首页 > 其他分享 >7.16周报

7.16周报

时间:2023-07-16 17:11:37浏览次数:44  
标签:7.16 提取 NER 食品科学 食谱 文本 方法 周报

文献阅读

 (一)利用文本挖掘作为食品科学与营养的大数据分析工具:Utilization of text mining as a big data analysis tool for food science and nutrition - Tao - 2020 - Comprehensive Reviews in Food Science and Food Safety - Wiley Online Library

笔记地址:利用文本挖掘作为食品科学与营养的大数据分析工具 - Spartaright - 博客园 (cnblogs.com)

这篇综述简单介绍了文本挖掘在食品科学与营养方面的应用,并且介绍了文本数据分析的步骤框架。比较值得阅读的是第4部分,里面大量介绍了文本挖掘技术在各个领域使用的相关论文。根据这篇文章,我找到了一篇研究中国饮食偏好与糖尿病风险的论文Dietary preferences and diabetic risk in China: A large‐scale nationwide Internet data‐based study - Zhao - 2020 - Journal of Diabetes - Wiley Online Library,研究思路类似于以前阅读过的饮食口味热点分析的文章,目前正在阅读中,初步笔记如下

(二)FoodIE:一种基于规则的食品信息抽取NER方法:DOI: 10.5220/0007686309150922

笔记地址:FoodIE:一种基于规则的食品信息抽取NER方法 - Spartaright - 博客园 (cnblogs.com)

这篇文章介绍了自然语言处理中命名实体识别(NER)任务在提取非结构化食谱文本中的信息方面的应用,作者提出了一种基于规则的NER方法来识别并提取食谱文本中的食物实体,其中在第3节中,作者给出了判别文本中的分词是否为食物分词的详细规则,通过词性标注来分析一个词的上下文是否能和单词构成一个完整的食物实体。在第4节中分别使用人工手动提取和该方法对食谱文本进行提取,并通过精度和召回率等指标来评估该方法的可靠性,结果具有很高的精度。该方法虽然和embedding方法的联系不大,但可以作为一个信息提取的方法拓展学习。

其它

参照志坤师兄的核算方式粗略写了一点代码,但是感觉代码量远远达不到软著的申请要求,存在最大的问题是如果要写软件,软件的服务对象模糊,导致对于输入输出没有一个标准(供谁使用?使用者的数据输入要求?计算的输出?),用户使用手册的撰写也很困难。就算以上的问题能解决,代码量加上前端的代码,估计也只能到200-300行,远远达不到标准。

 

 

 

标签:7.16,提取,NER,食品科学,食谱,文本,方法,周报
From: https://www.cnblogs.com/Spartaright/p/17558084.html

相关文章

  • 2023.07.16 高质量 NOIP 模拟赛题解
    HDU5719Arrange【模拟】给定数列\(B_n,C_n\),求出满足\[B_i=\min_{j=1}^i\{A_j\},\quadC_i=\max_{j=1}^i\{A_j\}\]的排列\(A\)的数量。维护每个位置可能的数字数量,然后乘法原理即可。代码:http://acm.hdu.edu.cn/viewcode.php?rid=38654445。HDU5807KeepInTouch......
  • 7.16 动态规划
    线性DP[USACO20DEC]SleepingCowsP先不考虑极大,将奶牛和牛棚放在一起排序并离散化,设\(F_{i,j}\)为处理到第i个元素(奶牛/牛棚),有j头奶牛还没有进入牛棚的方案数。对于牛棚:\[F_{i,j}\rightarrowF_{i+1,j}\]\[j*F_{i,j}\rightarrowF_{i+1,j-1}\]对于奶牛:\[F_{i,j}......
  • 7.3到7.8 每周报告3
    这周跟上周的安排有点差异,主要是我们要弄我们物联网的东西,对物联网进行学习,单片机那些东西,然后找代码烧录进单片机实现功能,我们做的主要是一个智能手环,主要应用的人群为老人,背景就是近年来,老人的突发状况增多,面对现在社会上扶不扶的问题,老人的问题不断增多,我们这个主要就是进行,摔......
  • 《安富莱嵌入式周报》第317期:开源60W小型UPS电源,0.1Hz - 200MHz 频率计,纯C实现的Sokol
    周报汇总地址:http://www.armbbs.cn/forum.php?mod=forumdisplay&fid=12&filter=typeid&typeid=104  视频版:https://www.bilibili.com/video/BV1Mx4y1o7Ns 1、开源60W小型UPS电源参考设计https://github.com/TobleMiner/DC-UPShttps://github.com/TobleMiner/dc-ups-......
  • 网安周报|黑客利用未修补的WordPress插件缺陷来创建秘密管理员帐户
    网安周报是棱镜七彩推出的安全资讯专栏,旨在通过展示一周内发生的与开源安全、软件供应链安全相关攻击事件,让用户了解开源及软件供应链威胁,提高对安全的重视,做好防御措施。1、黑客利用未修补的WordPress插件缺陷来创建秘密管理员帐户来百度APP畅享高清图片终极会员插件中未修补的关......
  • Databend 开源周报第 100 期
    Databend是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。What'sOnInDatabend探索Databend本周新进展,遇到更贴近你心意的Databend。Databendv1.2正式发布Databendv1.2.0已于2023年......
  • .NET周报 【7月第1期 2023-07-02】
    国内文章C#实现Linux视频聊天、远程桌面(源码,支持信创国产化环境,银河麒麟,统信UOS)https://www.cnblogs.com/shawshank/p/17420469.html园子里的有朋友在下载并了解了《C#实现Linux视频会议(源码,支持信创环境,银河麒麟,统信UOS)》中提供的源码后,留言给我说,这个视频会议有点复杂......
  • 周报_第八周
    学习时间:2023.6.26-2023.7.2一、完成内容1.学习《动手学深度学习Pytorch版》的第13章的一半2.element组件的使用,路由的配置,项目主界面的实现。二、下周计划1.学习《动手学深度学习Pytorch版》的第13、14章。2.继续跟进项目。......
  • 7.2周报
    (一)covid19大流行改变了食品消费模式:COVID-19pandemicchangesthefoodconsumptionpatterns-ScienceDirect笔记地址:covid-19大流行改变了食品消费模式-Spartaright-博客园(cnblogs.com)(二)DIETHUB:通过了解食谱内容来分析饮食习惯:DietHub:Dietaryhabitsanalysisthro......
  • 6-26到7-1暑期每周报告2
    这一周依旧是进行大数据技术的学习,通过林子雨老师的b站视频进行学习,但是还是不太懂,而且没有进行实操,因为虚拟机装了之后,硬盘满了,只能等回家加了内存在进行实操,现在离放假大概还有一个星期时间,我的计划是先停下对大数据技术的学习,先进行算法和spring的学习。spring学习:因为之前开......