• 2024-06-23价格减免(Lc2288)——模拟
    句子 是由若干个单词组成的字符串,单词之间用单个空格分隔,其中每个单词可以包含数字、小写字母、和美元符号 '$' 。如果单词的形式为美元符号后跟着一个非负实数,那么这个单词就表示一个 价格 。例如 "$100"、"$23" 和 "$6" 表示价格,而 "100"、"$" 和 "$1e5 不是。
  • 2024-06-205.21——❤经验❤
  • 2024-06-13milvus入门使用
    插入数据后的效果: 代码如下:importconfigparserfrompymilvusimportconnections,Collection,DataType,FieldSchema,CollectionSchemaimportnumpyasnpdefcreate_collection():#Definetheschemafields=[FieldSchema(name="sentence_id&quo
  • 2024-06-07用 Sentence Transformers v3 训练和微调嵌入模型
    SentenceTransformers是一个Python库,用于使用和训练各种应用的嵌入模型,例如检索增强生成(RAG)、语义搜索、语义文本相似度、释义挖掘(paraphrasemining)等等。其3.0版本的更新是该工程自创建以来最大的一次,引入了一种新的训练方法。在这篇博客中,我将向你展示如何使用它
  • 2024-06-02Exercise 05
    Exercise05Exercise05HowisitthatsomanyintergalacticspeciesinmoviesandTVjusthappentospeakperfectEnglish?Theshortansweristhatnoonewantstowatchastarshipcrewspendyears1compilinganaliendictionary.Buttokeepthingscons
  • 2024-05-09Embedding Whitening
    目录概主要内容BERT-FlowBERT-Whitening代码[1]LiB.,ZhouH.,HeJ.,WangM.,YangY.andLiL.Onthesentenceembeddingsfrompre-trainedlanguagemodels.ACL,2020.[2]SuJ.,CaoJ.,LiuW.andOuY.Whiteningsentencerepresentationsforbettersemant
  • 2024-04-11Kaggle自然语言处理入门 推特灾难文本分类 Natural Language Processing with Disaster Tweets
    和新闻按照标题分类差不多,用的朴素贝叶斯#导入必要的包importrandomimportsysfromsklearnimportmodel_selectionfromsklearn.naive_bayesimportMultinomialNBimportjoblibimportre,stringimportpandasaspdimportnumpyasnpdeftext_to_words(file_path)
  • 2024-04-06如何爬取bcz的词汇
    如何爬取BCZ的四级/六级词汇声明:以下内容仅供学习参考,切勿滥用,滥用与本作者无关!一,安装Charles抓包工具步骤:打开Charles查看主机地址配置手机端代理(主机地址:端口)安装证书信任抓取测试抓取数据包解析数据包查看csv数据关于下载安装Charles,安装证书,配置
  • 2024-03-24Pedagogic Metalanguage
    MyfavoriteEnglishmovieclipistheoneinwhichTrumanfinallyleavesSeahaveninTheTrumanShow.Inthelastscene,hesaysthesentencethatrunsthroughthewholemovie:incaseIdon'tseeyou,goodafternoon,goodevening,andgoodnight!Thi
  • 2024-03-23【踩坑随笔】Kaggle安装langchain相关依赖报错
    kaggle执行语句%pipinstalldatasetslangchainsentence_transformerstqdmchromadblangchain_wenxin安装langchain相关依赖报错的时候出现了以下报错主要是版本不匹配,报错什么就再加载什么就可以了,执行下面的语句%pipinstallkeras-core执行结果%pipinstallw
  • 2024-03-10[译]The Day You Became A Better Writer
    这是在《纳瓦尔宝典》中提到的一篇文章,题目让我非常好奇。我对写作感兴趣,也想锻炼下英语,就决定翻译一下。TheDayYouBecameABetterWriterbyScottAdams当你成为一个更好的作者的那天-斯考特·亚当斯Iwentfrombeingabadwritertoagoodwriteraftertaking
  • 2024-03-06大语言模型常见的文本切分之语义嵌入
    语料准备选择了一篇新闻稿,有比较明显的段落区分,每个段落由若干句子构成,可用于验证切分效果。#节气释义小寒,是二十四节气中的第二十三个节气,太阳到达黄经285度时开始。《月令七十二候集解》中说:“十二月节,月初寒尚小,故云。月半则大矣。”冷气积久而寒,小寒是天气寒冷但还没有
  • 2023-12-25自然语言处理与机器翻译:最新进展与实践
    1.背景介绍自然语言处理(NLP)和机器翻译是人工智能领域的两个重要研究方向。自然语言处理涉及到计算机理解、生成和处理人类语言的能力,而机器翻译则是将一种语言翻译成另一种语言的技术。随着深度学习和大规模数据的应用,自然语言处理和机器翻译取得了显著的进展,这篇文章将从以下几个
  • 2023-12-18【LeetCode】2288. 价格减免
    一、题目描述句子是由若干个单词组成的字符串,单词之间用单个空格分隔,其中每个单词可以包含数字、小写字母、和美元符号'$'。如果单词的形式为美元符号后跟着一个非负实数,那么这个单词就表示一个价格。例如"$100"、"$23"和"$6.75"表示价格,而"100"、"$"和"2$3"不是。注意:
  • 2023-12-11初学指针,刷题(hznu【C系列5.6】指针专题之翻译)
    题目如下Description (本人学艺不精,写了很久才写出了一个臃肿的代码,malloc也不咋会用,只能向ai请教了T_T)Alex在朋友们都去生猴子了的日子里,日复一日、年复一年地敲代码,终于,在经年累月的摧残下,她的手指变得不那么利索了,比如“how are you”她会哆嗦着打成“hhoow areee youu
  • 2023-12-06leetcode-1455-easy
    CheckIfaWordOccursAsaPrefixofAnyWordinaSentenceGivenasentencethatconsistsofsomewordsseparatedbyasinglespace,andasearchWord,checkifsearchWordisaprefixofanywordinsentence.Returntheindexofthewordinsentence(1-
  • 2023-11-27八大数据类型
    概念Python中有许多数据类型,但常用的八大数据类型包括:整数(int):表示整数值,例如:x=10浮点数(float):表示带有小数点的数值,例如:y=3.14字符串(str):表示文本数据,例如:text="Hello,World!"列表(list):有序可变序列,可以包含不同类型的元素,例如:my_list=[1,2,"three"]
  • 2023-11-27js 闭包使用一例
    有如下js:functionstartTimer(sentence){alert('start');sentence.longPressTimer=setTimeout(function(){alert(sentence);//此处sentence为undefined},1000);}functionendTimer(sentence){alert('end');cle
  • 2023-11-22无依赖安装sentence-transformers
    安装pipinstall--no-cache-dirtorch==1.8.0+cpu-fhttps://download.pytorch.org/whl/torch_stable.htmlpipinstalltransformerstqdmnumpyscikit-learnscipynltksentencepiecepipinstall--no-depssentence-transformers可以使用pipdeptree查看依赖
  • 2023-11-20在 C# 中如何将多个空格替换为一个空格?
    内容来自DOChttps://q.houxu6.top/?s=在C#中如何将多个空格替换为一个空格?如何在C#中将字符串中的多个空格替换为一个空格?示例:12345转换为:12345stringsentence="Thisisasentencewithmultiplespaces";RegexOptionsoptions=RegexOption
  • 2023-10-26001Sentence Smash(8kyu)from codewars
    SentenceSmash(8kyu)Writeafunctionthattakesanarrayofwordsandsmashesthemtogetherintoasentenceandreturnsthesentence.Youcanignoreanyneedtosanitizewordsoraddpunctuation,butyoushouldaddsspacesbetweeneachword.Becareful,ther
  • 2023-10-23[Leetcode] 0824. 山羊拉丁文
    824.山羊拉丁文题目描述给你一个由若干单词组成的句子 sentence,单词间由空格分隔。每个单词仅由大写和小写英文字母组成。请你将句子转换为“山羊拉丁文(GoatLatin)”(一种类似于猪拉丁文 -PigLatin的虚构语言)。山羊拉丁文的规则如下:如果单词以元音开头('a','e','i',
  • 2023-10-23[论文速览] SimCSE@ Simple Contrastive Learning of Sentence Embeddings
    Pretitle:SimCSE:SimpleContrastiveLearningofSentenceEmbeddingsaccepted:EMNLP2021paper:https://arxiv.org/abs/2104.08821code:https://github.com/princeton-nlp/SimCSEref:https://zhuanlan.zhihu.com/p/368353121关键词:contrastivelearning,sentenc
  • 2023-10-06笨办法学Python3 习题25 更多更多的训练
    练习内容:将ex25模块导入在终端中手动运行函数查看变化结果退出quit()1defbreak_words(stuff):2"用来分割参数元素"3words=stuff.split('')4returnwords56defsort_words(words):7"用来将参数元素升序排列"8returnsorted
  • 2023-09-26NLP经典论文,自我回顾笔记
    (持续更新,目前找工作中)1. SequencetoSequenceLearningwithNeuralNetworks(2014GoogleResearch)However,thefirstfewwordsinthesourcelanguagearenowveryclosetothefirstfewwordsinthetargetlanguage,sotheproblem’sminimaltime