首页 > 其他分享 >kaggle 大语言模型新赛保银

kaggle 大语言模型新赛保银

时间:2024-03-13 22:29:05浏览次数:18  
标签:保银 提示 新赛 模型 kaggle 改写 LLM 文本 转写

比赛类型:LLM文本转写挑战。
任务目标是恢复用于转写给定文本的LLM提示语句。在这个竞赛中,参与者将面临识别和复原经LLM改写后文本原始提示的挑战,这是探索如何有效利用LLM进行文本改写的新颖方式。

竞赛概述:

问题定义:恢复用于转写给定文本的LLM提示。
技术挑战:超越传统文本处理技术,准确识别和恢复用于生成特定改写文本的原始LLM提示。
数据集规模:1300+个原始文本及其由Gemma,谷歌新开放模型系列之一,改写的版本。
评估标准:使用句子级t5-base模型计算每个提交的预测提示与真实提示的嵌入向量,通过锐化余弦相似度(Sharpened Cosine Similarity, SCS)计算得分,采用3次方来减弱错误答案的得分过高问题。提交时不得留空,空白提示会引起错误。

面向人群:
NLP(自然语言处理)、LLM(大语言模型)及想往这个方向走的大学生,目标冲击国内211985、欧美和新加坡香港的研究生、博士。
从大中厂招聘条件来看,对算法工程师岗位的机筛面试都有很大作用。

奖金设置:
总奖金池为200,000美元

咨询比赛可以发消息

标签:保银,提示,新赛,模型,kaggle,改写,LLM,文本,转写
From: https://blog.csdn.net/justneverstop/article/details/136693215

相关文章

  • 走进Kaggle的未知领域:性别和年龄推断算法解析
    ​1、环境设置:此环节将加载实现笔记本无缝功能的基本模块,包括NumPy、Pandas和TensorFlow等库。此外,它还建立了关键的环境常数,如图像尺寸和学习率,这对后续分析和模型训练至关重要。#Generalimportosimportkerasimportnumpyasnpimportpandasaspdimporttensorflow......
  • CES 2024:芯片厂商集体奔向AI,汽车芯片成为新赛道
    一年一度的CES又来了!美国当地时间1月9日,2024年国际消费类电子产品展览会(CES)如期举行。作为全球最盛大的科技盛会,全球多个行业的顶尖企业都会参加CES。今年,展商们已经不约而同将主题放在了AI上。在CES2024上,可以看到许多关于人工智能、硬件创新、智能家居、汽车科技、虚拟现实、增......
  • kaggle上的jax框架的环境配置(TPU版本)
    导出时间:2024-01-1821:00:37星期四python版本:Python3.10.13absl-py==1.4.0accelerate==0.25.0aiofiles==22.1.0aiosqlite==0.19.0anyio==4.2.0argon2-cffi==23.1.0argon2-cffi-bindings==21.2.0array-record==0.5.0arrow==1.3.0astroid==3.0.2asttokens==2.4......
  • kaggle使用tensorboard
    参考:https://www.cnblogs.com/jhy-ColdMoon/p/17341992.html需要使用Ngrokimportosimportmultiprocessing!wgethttps://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip!unzipngrok-stable-linux-amd64.zip!./ngrokauthtoken[自己的token]pool=multip......
  • kaggle Open Problems – Single-Cell Perturbations 1st & 2nd place solution summa
    Leaderboard:https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/leaderboard2ndSolution:https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/458738Code:https://github.com/Eliorkalfon/single_ce......
  • 【Kaggle】AAAMLP读书笔记 Cat-in-the-dat II (优化)
    本人希望从0开始,自己的Kaggle竞赛12月拿到自己的第一块Kaggle奖牌短期内读完AbhishekThakur的Approaching(Almost)AnyMachineLearningProblem并且发博客记录https://github.com/abhishekkrthakur/approachingalmost12月至少发21篇博客每天保持八小时的学习时间Approachingca......
  • OpenHarmony创新赛人气投票活动,最佳人气作品由你来定!
     12月1日至12月15日十大入围作品线上投票激战正酣最佳人气作品,由你来定!  投票链接:https://forums.openharmony.cn/forum.php?mod=viewthread&tid=1284&extra=......
  • 【Kaggle】AAAMLP读书笔记
    本人希望从0开始,自己的Kaggle竞赛12月拿到自己的第一块Kaggle奖牌短期内读完AbhishekThakur的Approaching(Almost)AnyMachineLearningProblem并且发博客记录https://github.com/abhishekkrthakur/approachingalmost12月至少发21篇博客每天保持八小时的学习时间Approachingca......
  • Kaggle:Titanc Survived
    Kaggle:TitancSurvived数据处理对于这个问题,在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。PassengerId可以直接作为pandas读取cvs文件时候的index_col。train_data=pd.read_csv("dataset/train.csv",index_col="P......
  • Kaggle:Otto Group Classification
    Kaggle:OttoGroupClassification数据处理导入相应的包之后,从csv文件中读取数据,指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。train_data=pd.read_csv("dataset/train.csv",index_col="id")test_data=pd.read_csv("dataset/test.......