kaggle 大语言模型新赛保银

时间：2024-03-13 22:29:05浏览次数：18

比赛类型：LLM文本转写挑战。
任务目标是恢复用于转写给定文本的LLM提示语句。在这个竞赛中，参与者将面临识别和复原经LLM改写后文本原始提示的挑战，这是探索如何有效利用LLM进行文本改写的新颖方式。

竞赛概述：

问题定义：恢复用于转写给定文本的LLM提示。
技术挑战：超越传统文本处理技术，准确识别和恢复用于生成特定改写文本的原始LLM提示。
数据集规模：1300+个原始文本及其由Gemma，谷歌新开放模型系列之一，改写的版本。
评估标准：使用句子级t5-base模型计算每个提交的预测提示与真实提示的嵌入向量，通过锐化余弦相似度（Sharpened Cosine Similarity, SCS）计算得分，采用3次方来减弱错误答案的得分过高问题。提交时不得留空，空白提示会引起错误。

面向人群：
NLP（自然语言处理）、LLM（大语言模型）及想往这个方向走的大学生，目标冲击国内211985、欧美和新加坡香港的研究生、博士。
从大中厂招聘条件来看，对算法工程师岗位的机筛面试都有很大作用。

奖金设置：
总奖金池为200,000美元

咨询比赛可以发消息

标签：保银,提示,新赛,模型,kaggle,改写,LLM,文本,转写
From： https://blog.csdn.net/justneverstop/article/details/136693215

走进Kaggle的未知领域：性别和年龄推断算法解析
1、环境设置：此环节将加载实现笔记本无缝功能的基本模块，包括NumPy、Pandas和TensorFlow等库。此外，它还建立了关键的环境常数，如图像尺寸和学习率，这对后续分析和模型训练至关重要。#Generalimportosimportkerasimportnumpyasnpimportpandasaspdimporttensorflow......
CES 2024：芯片厂商集体奔向AI，汽车芯片成为新赛道
一年一度的CES又来了！美国当地时间1月9日，2024年国际消费类电子产品展览会（CES）如期举行。作为全球最盛大的科技盛会，全球多个行业的顶尖企业都会参加CES。今年，展商们已经不约而同将主题放在了AI上。在CES2024上，可以看到许多关于人工智能、硬件创新、智能家居、汽车科技、虚拟现实、增......
kaggle上的jax框架的环境配置(TPU版本）
导出时间：2024-01-1821:00:37星期四python版本：Python3.10.13absl-py==1.4.0accelerate==0.25.0aiofiles==22.1.0aiosqlite==0.19.0anyio==4.2.0argon2-cffi==23.1.0argon2-cffi-bindings==21.2.0array-record==0.5.0arrow==1.3.0astroid==3.0.2asttokens==2.4......
kaggle使用tensorboard
参考：https://www.cnblogs.com/jhy-ColdMoon/p/17341992.html需要使用Ngrokimportosimportmultiprocessing!wgethttps://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip!unzipngrok-stable-linux-amd64.zip!./ngrokauthtoken[自己的token]pool=multip......
kaggle Open Problems – Single-Cell Perturbations 1st & 2nd place solution summa
Leaderboard：https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/leaderboard2ndSolution:https://www.kaggle.com/competitions/open-problems-single-cell-perturbations/discussion/458738Code：https://github.com/Eliorkalfon/single_ce......
【Kaggle】AAAMLP读书笔记 Cat-in-the-dat II （优化）
本人希望从0开始，自己的Kaggle竞赛12月拿到自己的第一块Kaggle奖牌短期内读完AbhishekThakur的Approaching(Almost)AnyMachineLearningProblem并且发博客记录https://github.com/abhishekkrthakur/approachingalmost12月至少发21篇博客每天保持八小时的学习时间Approachingca......
OpenHarmony创新赛人气投票活动，最佳人气作品由你来定！
12月1日至12月15日十大入围作品线上投票激战正酣最佳人气作品，由你来定！投票链接：https://forums.openharmony.cn/forum.php?mod=viewthread&tid=1284&extra=......
【Kaggle】AAAMLP读书笔记
本人希望从0开始，自己的Kaggle竞赛12月拿到自己的第一块Kaggle奖牌短期内读完AbhishekThakur的Approaching(Almost)AnyMachineLearningProblem并且发博客记录https://github.com/abhishekkrthakur/approachingalmost12月至少发21篇博客每天保持八小时的学习时间Approachingca......
Kaggle:Titanc Survived
Kaggle:TitancSurvived数据处理对于这个问题，在训练集中给了10列作为特征。其中有一些对结果预测并没有太大影响的PassengerId、Name、Cabin、Ticket。PassengerId可以直接作为pandas读取cvs文件时候的index_col。train_data=pd.read_csv("dataset/train.csv",index_col="P......
Kaggle:Otto Group Classification
Kaggle:OttoGroupClassification数据处理导入相应的包之后，从csv文件中读取数据，指定id列为index列。本身id列也不携带预测信息。同时将训练数据和测试数据拼接在一起。train_data=pd.read_csv("dataset/train.csv",index_col="id")test_data=pd.read_csv("dataset/test.......

kaggle 大语言模型新赛保银

相关文章

赞助商

阅读排行