首页 > 其他分享 >段落总结

段落总结

时间:2024-04-24 11:25:54浏览次数:19  
标签:段落 总结 研究生 sumy zongjie content __ import

#!usr/bin/env python
# encoding:utf-8
from __future__ import division

'''
__Author__:沂水寒城
功能:基于开源模块sumy的简单文本摘要
文本摘要方法参考学习可以借鉴阮一峰下面的文章:
http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html
'''

from sumy.nlp.stemmers import Stemmer
from sumy.utils import get_stop_words
from sumy.parsers.html import HtmlParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.parsers.plaintext import PlaintextParser
from sumy.summarizers.lsa import LsaSummarizer as Summarizer

# 设置输出句子总数
SENTENCES_COUNT = 3


def content_zongjie(data, language):
    '''
    基于明文数据内容的摘要方法
    '''
    parser = PlaintextParser.from_string(data, Tokenizer(language))
    stemmer = Stemmer(language)
    summarizer = Summarizer(stemmer)
    summarizer.stop_words = get_stop_words(language)
    sentence_list=''
    for sentence in summarizer(parser.document, SENTENCES_COUNT):
        sentence_list+=str(sentence)
    return sentence_list


if __name__ == "__main__":
    neirong='''
    建设产教融合研究生联合培养基地能够打破高校和企业的隔阂,促进研究生工程实践能力的提升,已成为连接高校与行业单位科研交流和人才培养的重要平台,对以强化工程实践为导向的冶金工程专业学位研究生培养更显重要[1,2]。围绕国家“碳达峰、碳中和”目标,绿色低碳已成为钢铁工业高质量发展的主旋律[3]。

在新的历史条件下,探索并建立适应行业发展需要的产、学、研一体化、产学结合的人才培养模式,对于培养适应行业需要、有创新能力的高层次人才有重要的现实意义。提升产教融合研究生联合培养基地的运转效率,创新工作方法,增强基地建设延续性、扩大基地人才培养联动效应,是研究生联合培养基地建设工作中应重点关注的问题[4,5]。

本文剖析了钢铁冶金专业学位研究生联合培养的现状及问题,并在此基础上对绿色低碳钢铁冶金专业学位研究生联合培养模式进行了探索,建立了京津冀绿色低碳钢铁产教融合研究生联合培养基地,推动了钢铁冶金专业学位研究生人才培养体系的改革与升级。
    '''
    content_zongjie = content_zongjie(neirong, 'chinese')
    print(f'data:{len(neirong),neirong}')
    print(f'content_zongjie:{len(content_zongjie),content_zongjie}')

 

标签:段落,总结,研究生,sumy,zongjie,content,__,import
From: https://www.cnblogs.com/wolvies/p/18154646

相关文章

  • 【基础】Flink -- State 状态总结
    【基础】Flink--StateFlink--StateFlink中的状态有状态算子状态的分类按键分区状态KeyedState支持的结构类型值状态ValueState列表状态ListState映射状态MapState规约状态ReducingState聚合状态AggregatingState状态的生存时间算子状态OperatorState算子......
  • 探讨两种循环表示方法的区别,while循环与for循环的小总结
    基于前天建立的顺序表(sequeue)的其中一个功能函数,引出两个循环的表示方法的区别和比较。算法需求:在一个顺序队列中,合并相同的元素。总体思路:利用两层循环的框架,利用外层循环选中顺序表中第一个数(L->data[i]),再用内循环中进行对比(L->data[j]),如果相同就进行删除操作。首先采用......
  • Java并发工具类之LongAdder原理总结
    出处: Java并发工具类之LongAdder原理总结LongAdder实现原理图                                高并发下N多线程同时去操作一个变量会造成大量线程CAS失败,然后处于自旋状态,导致严重浪费CPU资源,降低了并发......
  • .net 获取路径(总结)
    以下汇总了.NET(包括ASP.NET/WinForm等)获取当前路径的各种方法//获取当前进程的完整路径,包含文件名(进程名)。stringstr=this.GetType().Assembly.Location;result:X:\xxx\xxx\xxx.exe(.exe文件所在的目录+.exe文件名)//获取新的Process组件并将其与当前活动的进程......
  • day21-阶段总结
    1.知识点补充1.1并发编程&网络编程从知识点的角度来看,本身两者其实没有什么关系:网络编程,基于网络基础知识、socket模块实现网络的数据传输。并发编程,基于多进程、多线程等来提升程序的执行效率。但是,在很多“框架”的内部其实会让两者结合起来,使用多进程、多线......
  • 求导数总结
    求导数方法总结导数最后都要是包含x的表达式?常见的表达式的导数常数的导数等于0幂函数的导数\(f(x)=x^n,f'(x)=nx^{n-1}\)指数函数的导数:\(f(x)=a^x(a>0,a\neq1),f'(x)=a^x\lna\)三角函数:\((\sinx)'=\cosx\)\((\cosx)'=-\sinx\)\((\tanx)'=\sec^2......
  • GJOI 2024.4.20 总结
    Morning:T1小鸟Statement:在一个\(n\)的二维平面里,\(X\)轴的正方向是向右的,\(Y\)轴的正方向是向上的。在坐标系第一象限里,左下角的点的坐标是\((0,0)\),右上角的点的坐标是\((n-1,n-1)\)。所以本题我们考虑的整个平面总共有\(n\timesn\)个整点,每个整点都有一只小......
  • 2024团体程序设计天梯赛——赛后总结
    2022年135分2023年164分感觉还是挺失望的,本来很稳的国三的就这样丢了,不过也是菜是原罪。一是对于读题的反思,L1-3,L1-4读题不认真导致直接白白被卡20分钟左右,还搞心态,后面的题目基本都没有一遍仔细地看完过。以后的题目尽量先把全部看一遍,然后再仔细看一遍题目部分(不看背景了),不......
  • MIT6824 MapReduce总结
    MapReduce是一个分布式大任务计算框架,旨在可以方便Google内部的将大型任务拆分到集群环境下,以得到并行化的处理速度。在分布式情况下,多台机器协作完成一个大型任务需要考虑很多问题:整个分布式系统中都有哪些角色?可以预见的就是肯定有任务的拆分者负责拆分调度任务,有任务的实际......
  • DDD领域驱动设计总结和C#代码示例
    DDD(领域驱动设计)是一种软件设计方法,它强调以业务领域为核心来驱动软件的设计和开发。DDD的设计初衷是为了解决复杂业务领域的设计和开发问题,它提供了一套丰富的概念和模式,帮助开发者更好地理解和建模业务领域,从而提高软件的质量和可维护性。一、DDD主要组成DDD的主要模式包......