首页 > 其他分享 >Text Representation

Text Representation

时间:2024-05-03 14:44:45浏览次数:31  
标签:https Text LM Embedding Representation com sawyerbutton matrix

1 Statistical Model

1.1 One-Hot

1.2 Bag of words(BOW)

https://web.stanford.edu/class/datasci112/lectures/lecture8.pdf

1.3 N-grams

1.4 TF-IDF

2 Word Embedding(Neural Network Model)

2.1 Word2Vec

https://projector.tensorflow.org/

Continuous Bag of Words(CBOW)

Skip-Gram

The goal is to get the word vector
Trainable weight is input weight matrix and output matrix

2.2 Glove

2.3 FastText

3 BERT

4 SBERT(Sentence Embedding)

Reference

https://deysusovan93.medium.com/from-traditional-to-modern-a-comprehensive-guide-to-text-representation-techniques-in-nlp-369946f67497
https://github.com/sawyerbutton/NLP-Funda-2023-Spring
https://github.com/sawyerbutton/LM-Funda-2024-Spring/blob/main/示例代码/Lesson3/LM_Lesson3_Embedding_demo.ipynb

标签:https,Text,LM,Embedding,Representation,com,sawyerbutton,matrix
From: https://www.cnblogs.com/forhheart/p/18171197

相关文章

  • applicationContext.xml
    我真服了,搜了半天没有我想看见的就是关于取代mybatis.xml的文件只能自己写一个了并不能完全取代,至少日志部分还得保留1<?xmlversion="1.0"encoding="UTF-8"?>2<beansxmlns="http://www.springframework.org/schema/beans"3xmlns:xsi="http://www.w3.org/2......
  • WPF Text MultiBinding StringFormat
    <TextBlock.Text><MultiBindingStringFormat="R:{0:N0},G:{1:N0},B:{2:N0}"><BindingPath="Value"ElementName="_red"/><BindingPath="Value"ElementName="_green"/>......
  • WPF DataContext="{Binding SelectedItem,ElementName=_master}"
    <Windowx:Class="WpfApp80.MainWindow"xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d="http://schemas.microsoft.......
  • Servlet中的Config和Context
    ServletConfig在servlet对象创建之后创建,每有一个servlet对象就有对应的servletConfig对象。ServletContext在Tomcat服务器加载Web项目后由Tomcat创建,一个web项目在Tomcat的启动运行中只有一个Context对象。ServletContext对象:ServletContext是一个全局对象,代表整个Web应......
  • TextMeshPro - 基本使用
    1 选中字体文件(这边使用了华文行楷),然后创建FontAsset创建后会生成一个TMP用的字体资源 2,创建一个TextMeshPro的Text将字体资源设置为刚刚创建的那个,就可以开始使用了 3,粗体,斜体,下划线,删除线,文字颜色设置  4,字符间距,单词间距,行间距,段落间距的控制 5, 文字......
  • TextMeshPro - 和UGUI Text的简单对比
    已经有uguiText了,为什么还要再来个TextMeshPro?1)TextMeshPro使用了更先进的渲染技术,渲染效果更好。同样的36号斜体字在Scene窗口中,我们放大后,Text可以明显的看到锯齿,而TextMeshPro字体的边缘还是圆润光滑。2)TextMeshPro默认支持多种渐变效果3) 性能更好的描边(TextMes......
  • 【发现一个小问题】golang http client: 配置了Client 对象的 Timeout 就会导致 conte
    作者:张富春(ahfuzhang),转载时请注明作者和引用链接,谢谢!cnblogs博客zhihuGithub公众号:一本正经的瞎扯我这样初始化了客户端:varclient=http.Client{Timeout:time.Duration(1000)*time.Millisecond,}然后在request创建过程中使用了context的timeout机制:tim......
  • android更改EditText下划线颜色
    在res——》values——》themes中添加下列代码<stylename="editTextStyle"><!--选中时下划线的颜色--><itemname="colorControlActivated">@color/gray1</item><!--默认时下划线的颜色--><itemname="colorControlNormal"&......
  • 如何用Sublime Text实现正则查找与替换
    比如将下面的汉字语义加上中括号[{"text":"微笑","path":"emot01.png"},{"text":"大笑","path":"emot02.png"},{"text":"鼓掌","......
  • 解决Unchecked runtime.lastError: Cannot create item with duplicate id meterSpher
    uncheckedruntime.lasterror:cannotcreateitemwithduplicateidXXX谷歌浏览器扩展插件开发问题_chromeuncheckedruntime.lasterror:cannotcreate-CSDN博客javascript-IssueswithContentMenuandOpeningTabs-ChromeExtension-StackOverflowchrome.run......