首页 > 其他分享 >Datawhale AI夏令营 大模型(微调)Task01

Datawhale AI夏令营 大模型(微调)Task01

时间:2024-08-14 21:55:47浏览次数:8  
标签:得分 prompt AI text question Datawhale students Task01 文中

这次这个Task与以往有些不同,通过调节外部参数prompt扩充数据来提高预测得分的大模型微调任务。

此次任务最大的不同是不在修改代码去提高程序预测准确性,所以这次对大模型的训练的难点在与大模型所需的prompt数据量上。

下面是跟着教程做的一些步骤。

1.首先是报名赛事。由于参加过第二期的学习,所以赛事报名已经实名过,直接点击报名就好。

2.完成报名后,即可到星火网站完成代码运行来拿到数据集。起初以为是通过调节训练次数和学习率来提高得分,所以没有调节prompt,得分却越来越低。通过昨天晚上的讲解学习到,提升本次大模型得分的关键在于改进prompt和扩充数据和数据增强。所以,今天和昨天通过调节prompt来对比得分。

下表为不同prompt与得分对比。

表1:prompt与得分对比
中文promp英文prompt得分

 (1)理解文中重要概念的含义

 (2)理解文中重要句子的含意

 (3)分析论点、论据和论证方法

(1)Understanding the main idea of the main idea.

(2)Understand the specific information in the text.

(3)infering the meaning of words and phrases from the context

54.2

 (1)理解文中重要概念的含义

 (2)理解文中重要句子的含意

 (3)分析论点、论据和论证方法

 (4)比较和对比文中不同观点的优劣。

 (5)应用文中的理论或概念到具体情境或例子中。

 (6)讨论作者的写作风格对理解内容的影响。

 (7)评估论据的有效性以及其支持论点的程度。

  (1)Understanding the main idea of the main idea.

    (2)Understand the specific information in the text.

    (3)infering the meaning of words and phrases from the context

    (4)Analyze how the structure of the text contributes to its meaning.

    (5)Explain how specific examples in the text support the main idea.

    (6)Predict possible outcomes based on information given in the text.

    (7)Evaluate the author's purpose and effectiveness in achieving it through the text.

    (8)Identify and interpret figurative language used by the author.

    (9)Discuss the perspective or bias of the author in presenting information.

    (10)Summarize key points and their implications as presented in the text.

58.2

(1)理解文中重要概念的含义

(2)理解文中重要句子的含意

(3)分析论点、论据和论证方法

(4)请概述文章的结构布局,包括引言、主体和结尾部分。分析这种结构如何帮助作者有效地传达其观点和论据

(5)文中作者采用了特定的语言风格来表达其思想。请识别并描述这种风格,并讨论它对读者理解文章内容的影响

(6)分析作者在文中表达的情感态度,包括其对主题的喜好、厌恶、赞赏或批评等。请提供文中的具体证据来支持你的分析

(7)考虑文中提到的文化元素或背景,讨论这些元素如何影响作者的观点和论证。请提供文中的相关引用,并解释它们在文中的作用

(8)基于文中的论点和论据,推断作者写作本文的主要意图。请结合文本内容和可能的社会、历史背景来支持你的推断

(9)在评价作者的论点时,运用批判性思维来分析其潜在的假设和前提。请指出任何可能的逻辑谬误或论证上的弱点,并提出可能的反驳点

(1)A question that prompts students to pinpoint the central theme or argument of the provided text.

(2)A question that requires students to recall and interpret specific details from the text.

(3)A question that challenges students to infer the meaning of new or complex vocabulary from the surrounding context.

(4)A question that encourages students to analyze how the text's structure enhances its meaning and impact.

(5)A question that assesses students' ability to identify examples that reinforce the main ideas.

(6)A question that invites students to make logical predictions based on the information presented in the text.

(7)A question that asks students to evaluate the author's purpose and the effectiveness of the text in achieving that purpose.

(8)A question that tests students' understanding of figurative language used by the author and its impact on the text.

(9)A question that explores the author's perspective or potential bias and how it shapes the presentation of information.

(10)A summarization task that requires students to encapsulate key points and discuss their wider implications.

60.5

得分图如下图所示:

我们在保持训练代数为10,学习率为0.00008,由上1表可知,改进的prompt对于大模型的得分是有改进的。这里就很伤心,看群里的同学按照教程做出来的成绩是70多,说也没有改任何参数,就能得到,而且每个人运行后的得分都不一样。昨天的大佬讲解说此次的得分由大模型得出,所以不一样。不知道为啥差距好大。后续出了提分教程一定要学习一下。

下表2为运行的两个可改变的参数学习率和训练参数改变后的得分对比。这个参数改进都是基于最基础的第一个prompt进行的。

表2:参数改进得分对比
学习率训练次数得分
0.000081054.2
0.000081553.7
0.000082053.9
0.000011044.2
0.00011051.2

由上表可知,本次的大模型,增大训练次数与改变学习率,没有大的成绩提高。所以后续中心放在改进prompt数据增强上。

教程中所述方法很详细我不再阐述,希望后续能再学习数据扩充与prompt改进来提高分数。

标签:得分,prompt,AI,text,question,Datawhale,students,Task01,文中
From: https://blog.csdn.net/MCAC_123/article/details/141109930

相关文章

  • Datawhale X 魔搭 AI夏令营 AIGC方向 task2笔记
       纯小白,自学!从零入门AI生图(AIGC方向)基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展实践学习。#DatawhaleX魔搭AI夏令营#一、利用AI精读baseline学习代码   task2的目的是精读baseline,从代码层面理解AI生图,直播演示了用通义千问解析代码,我也用GPT-4o,文心......
  • Sakana 推出开源AI Scientist:科研论文编写一条龙搞定
    你有没有想过,未来的科研会是怎样的?想象一下,一个不眠不休的研究助手,能够在没有人类监督的情况下,独立进行科学研究,从提出新想法到执行实验,再到撰写论文,全部自动完成。这听起来像科幻电影的情节,但在SakanaAI的努力下,这一愿景正在一步步变为现实。在现代科学研究中,科研人员常......
  • SenseCraft 部署模型到Grove Vision AI V2图像处理模块
    GroveVisionAIV2图像处理模块开箱测评摘要今天教大家快速上手GroveVisionAIV2图像处理模块,我们将一起探讨如何利用SenseCraft部署AI模型,和如何通过XIAOESP32C3调用这些模型,轻松实现智能视觉功能!原文链接:FreakStudio的博客往期推荐:学嵌入式的你,还不会面向对......
  • 产品经理用AI,跟普通人有什么不同?
    最近跟一个产品经理朋友聊天,他们公司最近单独拉一个只有产品经理的team,要在接下来半年把过去几年火过的产品工具,“加上AI驱动”重新做一遍。美其名曰“抓住AI浪潮的红利”。这不是今天的重点,重点是他在高频的用AI设计产品一段时间后,对“使用AI”这件事有了全新的......
  • AI浪潮下的程序员:重塑核心竞争力,共舞人机协作新纪元
    目录引言一、AI辅助编程对程序员工作的影响二、程序员应重点发展的核心能力三、人机协作模式下的职业发展规划结语引言在人工智能(AI)技术日新月异的今天,特别是随着AIGC(人工智能生成内容)和大语言模型的兴起,编程世界正经历着前所未有的变革。ChatGPT、Midjourney、Claud......
  • 【AI 生图赢奖】用函数计算绘出「少年江湖」,与热播网剧梦幻联动
    在这个数字化时代,人工智能不再只是科幻小说中的幻想,创意与技术的界限正在被重新定义。摩拳擦掌研究AI的你,是否想用自己的新技术和创造力一试身手呢?阿里云联合优酷推出【少年白马醉春风·AI江湖创作大赛】,无论您是开发者、设计师、还是AI绘画爱好者,都可以使用阿里云函数计......
  • Fal.ai Flux 1-Pro/Viva.ai/哩布哩布AI:AI绘图部分免费工具+原图提示词Prompt
    目录#1找软件#2懂提示词#3更难的一步,会英文我个人认为,想要玩文生图,你要会3个步骤:#1找软件主流文生图软件:Midjourney、StableDiffusion、Dall-E3巧了,我用的都是小众、免费的画笔工具:国内的哩布哩布(我的老师引领我入门的第一款软件)、通义千问、刚出道的Fal.ai的FLU......
  • 文心快码 Baidu Comate 前端工程师观点分享:行业现状(一)
    本系列视频来自百度工程效能部的前端研发经理杨经纬,她在由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动上,从一款文心快码(BaiduComate)前端工程师的角度,分享了关于智能研发工具本身的研发历程和理念。​​​​​​​本视频是关于【AI编程行业......
  • 文心快码 Baidu Comate 前端工程师观点分享:行业现状(二)
    本系列视频来自百度工程效能部的前端研发经理杨经纬,她在由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动上,从一款文心快码(BaiduComate)前端工程师的角度,分享了关于智能研发工具本身的研发历程和理念。以下视频是关于【AI编程行业现状】的观点2。......
  • 2024 中国开发者调查报告出炉:通义灵码是开发者最常用的 AI 编码辅助工具
    日前,CSDN&《新程序员》发起了一份围绕开发者现状、人工智能和开源的深度调查问卷,最终形成了一份详尽的《2024中国开发者调查报告》。报告中提到,AI技术的确已成为许多开发者工作中不可或缺的一部分,有69%的开发者表示,他们正在使用AI工具。聚焦到开发者日常编码辅助工具上......