首页 > 其他分享 >万字详解AI实践,零手写编码用AI完成开发 + 数据清洗 + 数据处理 的每日新闻推荐,带你快速成为AI大神

万字详解AI实践,零手写编码用AI完成开发 + 数据清洗 + 数据处理 的每日新闻推荐,带你快速成为AI大神

时间:2024-10-12 13:50:46浏览次数:9  
标签:const AI Error content 详解 error 手写 data response

用AI+dify完成前后端开发+数据处理和数据清洗。

引言

AI时代对开发人员的加强是非常明显的,一个开发人员可以依靠AI横跨数个自己不熟悉的领域包括前后端、算法等。让我们来做个实践,全程使用AI写代码+dify构建工作流快速完成一个获取每日热点新闻的前后端开发以及数据处理、数据清洗的任务,全程不需要我们自己动手写代码,仅跟AI聊天实现

我们来理清一下步骤:
1、点击每日新闻按钮
2、自动获取每日新闻信息
3、用LLM获取到标题、概要、作者、新闻链接
4、用dify + LLM 清洗和处理数据,获取新闻概要内容和新闻标签
5、给前端返回作者、标题、新闻链接、新闻概要内容和新闻标签
6、展示在页面上,并且点击可以跳到对应新闻页面

最后效果:
在这里插入图片描述

数据获取和数据处理

从网上搜索一下头条的每日推荐新闻的接口,我们的每日新闻来源就从这里获取。实际处理可以换成自己需要的接口并进行处理,让模型编码。
在这里插入图片描述
其实就是很简单地发送一个请求,对应代码:

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    console.log('Success:', data);
  })
  .catch(error => {
    console.error('Error:', error);
  });

粘贴代码观察一下结果
在这里插入图片描述
观察获取到的数据很明显我们只需要url source title abstract这四个字段,分别是对应的链接地址,作者,标题,摘要,做一下数据处理,让模型编码。
在这里插入图片描述
模型帮助我们在前面代码的基础上仅提取了我们需要的部分字段,获取的代码:

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    // 处理数据
    const articles = data.data.map(item => {
      const content = JSON.parse(item.content);
      return {
        url: content.url,
        source: content.source,
        title: content.title,
        abstract: content.abstract
      };
    });

    // 输出提取的内容
    console.log('Extracted Data:', articles);
  })
  .catch(error => {
    console.error('Error:', error);
  });

处理完之后就是比较简单的我们想要的数据了。
在这里插入图片描述
现在的数据只有链接标题还有一些没意义的摘要(实际上只是截取的文章前面部分),我们需要阅读前,模型就已经帮我们大致总结了一下内容以及对新闻进行了对应的打标签,这个就需要我们通过模型去完成了,我们下面用dify的工作流去完成这件事。

dify构建workflow进行数据清洗

接下来我们来做数据清洗,我希望对标题进行对应的改写,且我需要模型帮我总结内容和对内容打标签。通过dify搭建工作流(注意这里可以使用别的工具,并不一定依赖dify)。
在这里插入图片描述
使用的Prompt如下,注意我们Prompt里面需要精确提到 背景(激活参数)、任务(明确目标)、输出需求(明确要求)、例子(明确要求):

你是一名专业的记者,我从新闻网站API请求到了数据,你需要帮我对这条数据进行内容的总结和标签分类。内容总结应该在200字以内输出到模版变量<S>中,标签分类给出三个,每个标签在五个字以内,标签之间用','隔开,输出到模版变量<T>中,你仅需要输出模版内容。

# 例子
输入:

  {
    source: '国际新说',
    title: '新能源未来在何处?',
    abstract: '最近几年新能源的发展非常迅速,那么未来新能源会往哪一方面发展呢?让我们一起来探讨一下'
  }

输出:

【国际新说】新能源未来在何处?(科技、新能源、发展)

近年来,新能源技术快速发展,引发了对未来发展方向的广泛讨论。文章探讨了新能源可能的发展趋势。


# 模版
【source】title (<T>)
<S>

看看结果。
在这里插入图片描述
在这里插入图片描述
可以看到,输入我们刚才整理好的数据已经可以完成标题改写 + 打标签 + 内容总结了

现在我们可以使用我们刚才提取的数据,结合dify的这个工作流去完成总结文章内容 + 给文章打标签的功能。接下来只需要直接调用dify生成对应的接口,让模型帮我们接口,注意跟模型描述详细的接口需求。

这个是DIFY的接口文档
在这里插入图片描述
让模型编码
在这里插入图片描述
后端代码,主要就是调用了dify生成的接口,然后处理了一下输出:

const apiKey = 'YOUR_KEY';
const apiUrl = 'https://api.dify.ai/v1/workflows/run';
const batchSize = 2;

fetch('http://is.snssdk.com/api/news/feed/v51/')
  .then(response => {
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    return response.json();
  })
  .then(data => {
    // 处理数据
    const articles = data.data.map(item => {
      const content = JSON.parse(item.content);
      return {
        url: content.url,
        source: content.source,
        title: content.title,
        abstract: content.abstract
      };
    });

    // 发送请求并收集结果
    const results = [];
    const sendBatchRequests = (batch) => {
      const requests = batch.map(article => {
        const requestBody = {
          inputs: {
            message: JSON.stringify(article)
          },
          response_mode: 'blocking',
          user: 'api-user'
        };

        return fetch(apiUrl, {
          method: 'POST',
          headers: {
            'Authorization': apiKey,
            'Content-Type': 'application/json'
          },
          body: JSON.stringify(requestBody)
        })
        .then(response => {
          if (!response.ok) {
            throw new Error(`Request failed with status ${response.status}`);
          }
          return response.json();
        })
        .then(result => {
          if (result.data && result.data.outputs && result.data.outputs.text) {
            results.push(result.data.outputs.text);
          }
        })
        .catch(error => {
          console.error('Error:', error);
        });
      });

      return Promise.all(requests);
    };
    
    // 限制调用速率
    const processArticlesInBatches = async (articles) => {
      for (let i = 0; i < articles.length; i += batchSize) {
        const batch = articles.slice(i, i + batchSize);
        await sendBatchRequests(batch);
      }
    };

    return processArticlesInBatches(articles).then(() => results);
  })
  .then(results => {
    console.log('All results:', results);
  })
  .catch(error => {
    console.error('Error:', error);
  });

看看结果。
在这里插入图片描述
这时候清洗其实已经完成了,不过为了让整个过程更自动化和可视化,我们再用一个前端页面来展示。

前端页面构建和前后端交互

我们已经成功完成了数据处理和清洗,接下来简单地构建一下前端页面和前后端交互,注意key换成自己的,让AI编码。
在这里插入图片描述
后端代码,主要是做成了端口形式,将数据按格式返回给前端:

// server.js
import express from 'express';
import fetch from 'node-fetch';
import cors from 'cors';

const app = express();
const port = 3000;
const apiKey = 'Bearer app-xxx';
const apiUrl = 'https://api.dify.ai/v1/workflows/run';
const batchSize = 2;

app.use(cors());

app.get('/get-daily-news', async (req, res) => {
  try {
    const response = await fetch('http://is.snssdk.com/api/news/feed/v51/');
    if (!response.ok) {
      throw new Error('Network response was not ok');
    }
    const data = await response.json();

    // 处理数据
    const articles = data.data.map(item => {
      const content = JSON.parse(item.content);
      return {
        url: content.url,
        source: content.source,
        title: content.title,
        abstract: content.abstract
      };
    });

    // 发送请求并收集结果
    const results = [];
    const sendBatchRequests = (batch) => {
      const requests = batch.map(article => {
        const requestBody = {
          inputs: {
            message: JSON.stringify(article)
          },
          response_mode: 'blocking',
          user: 'api-user'
        };

        return fetch(apiUrl, {
          method: 'POST',
          headers: {
            'Authorization': apiKey,
            'Content-Type': 'application/json'
          },
          body: JSON.stringify(requestBody)
        })
        .then(response => {
          if (!response.ok) {
            throw new Error(`Request failed with status ${response.status}`);
          }
          return response.json();
        })
        .then(result => {
          if (result.data && result.data.outputs && result.data.outputs.text) {
            results.push({
              text: result.data.outputs.text,
              url: article.url
            });
          }
        })
        .catch(error => {
          console.error('Error:', error);
        });
      });

      return Promise.all(requests);
    };

    const processArticlesInBatches = async (articles) => {
      for (let i = 0; i < articles.length; i += batchSize) {
        const batch = articles.slice(i, i + batchSize);
        await sendBatchRequests(batch);
      }
    };

    await processArticlesInBatches(articles);
    res.json(results);
  } catch (error) {
    console.error('Error:', error);
    res.status(500).json({ error: 'Internal Server Error' });
  }
});

app.listen(port, () => {
  console.log(`Server is running on http://localhost:${port}`);
});

前端代码,没什么好说的就是点击按钮然后获取新闻资讯接口数据,处理一下输出展示:

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>每日新闻</title>
<style>
  .news-item {
    border: 1px solid #ccc;
    padding: 10px;
    margin-bottom: 10px;
    margin-top: 10px;
    border-radius: 5px;
  }
</style>
</head>
<body>
<h1>每日新闻</h1>
<button id="getNewsBtn">获取每日新闻</button>
<div id="newsResults"></div>
<script>
    document.getElementById('getNewsBtn').addEventListener('click', async () => {
        try {
            const response = await fetch('http://localhost:3000/get-daily-news');
            if (!response.ok) {
            throw new Error(`Network response was not ok: ${response.status}`);
            }
            const results = await response.json();

            const newsResultsDiv = document.getElementById('newsResults');
            newsResultsDiv.innerHTML = '';
            results.forEach(result => {
            // 去除 ```符号
            const cleanedText = result.text.replace(/```/g, '');
            // 创建超链接
            const link = document.createElement('a');
            link.href = result.url;
            link.target = '_blank';
            link.innerHTML = cleanedText.replace(/\n/g, '<br>'); // 将文本内容替换为带有换行符的HTML
            const paragraph = document.createElement('p');
            paragraph.appendChild(link);
            const newsItem = document.createElement('div');
            newsItem.classList.add('news-item');
            newsItem.appendChild(paragraph);
            newsResultsDiv.appendChild(newsItem);
            
            });
        } catch (error) {
            console.error('Error:', error);
        }
    });
</script>
</body>
</html>

来看看最后效果。在这里插入图片描述
点击后会跳到新闻页面,这样我们整个项目就完成了。

总结

全程不需要自己写一行代码,我们就完成了前后端开发和数据处理、数据清洗,效率提升肉眼可见。实际上这也是未来的趋势,在AI的加持下,我们每一个人的能力都会被无限放大,早日尝试并习惯高效使用AI才能帮助我们在新时代的变革中保持竞争力。

标签:const,AI,Error,content,详解,error,手写,data,response
From: https://blog.csdn.net/owenc1/article/details/142763503

相关文章

  • AWS GenAI LLM Chatbot: 多模型多RAG驱动的聊天机器人解决方案
    aws-genai-llm-chatbotAWSGenAILLMChatbot:打造智能对话新体验在人工智能和自然语言处理技术快速发展的今天,聊天机器人已成为企业与用户交互的重要工具。AWSGenAILLMChatbot项目应运而生,为开发者提供了一个强大而灵活的解决方案,用于在AWS云平台上部署先进的AI驱动聊天......
  • Nuxt.js 应用中的 ready 事件钩子详解
    title:Nuxt.js应用中的ready事件钩子详解date:2024/10/12updated:2024/10/12author:cmdragonexcerpt:ready钩子是Nuxt.js中一个重要的生命周期事件,它在Nuxt实例初始化完成后被调用。当Nuxt已经准备好并准备开始处理请求或渲染页面时,这一钩子会被触发。cate......
  • 地图瓦片详解:快速提升地图加载速度的关键技术
    地图瓦片(MapTiles)是指将一张完整的大型地图或影像切割成若干个小的矩形图块,每个图块(瓦片)代表地图的一部分。地图瓦片技术被广泛用于网络地图和地理信息系统(GIS)中,主要目的是为了提升地图的加载速度和用户体验,特别是在多级缩放和大规模数据处理的情况下。地图瓦片的基本概念地图......
  • 【AI大模型-文心-思维树解读-仓颉精通之路-14】
    提问:相比较于之前"暗号的"```精通仓颉之路````中参考《thinkinginjava》的回答,这个还是太粗略了,请更细致一些回答:如下版本:文心大模型3.5了解您的需求后,我会尝试将“精通仓颉之路”(这里假设“仓颉之路”代表一个具体的技能或知识体系,如编程、数据分析等,为了具体说明,我将......
  • 【AI大模型-文心-Linux命令行精通之路-1】
    提问:请列出从linux命令行从入门到精通的学习方法论,至少三种,用表格列出,能有横向对比,包括但不限于:学习方法论、学习目标、学习时间、学习难度等回答:如下版本:文心大模型3.5以下是从Linux命令行从入门到精通的三种学习方法论,包括学习方法论、学习目标、学习时间、学习难度等......
  • 【AI大模型-文心-Linux命令行精通之路-2】
    提问:根据以上的方法论,请详细的列举学习计划到周(在表格右侧加列)回答:如下版本:文心大模型3.5以下是根据上述学习方法论详细列举的学习计划,以周为单位进行划分。请注意,这只是一个示例计划,实际学习计划可能需要根据个人学习进度和投入时间进行调整。学习方法论学习目标学习时......
  • Spring-AI基于GPT3.5实现开发WEB应用------Spring-AI框架
    packagecom.alatus.springai.controller;importjakarta.annotation.Resource;importorg.springframework.ai.chat.ChatResponse;importorg.springframework.ai.chat.prompt.Prompt;importorg.springframework.ai.openai.OpenAiChatOptions;importorg.springframe......
  • 加油站ai视觉分析预警系统
    加油站AI视觉分析预警系统利用摄像头和人工智能技术,加油站ai视觉分析预警系统实时监测人员的行为。加油站ai视觉分析预警系统通过图像识别和行为分析,识别出打电话抽烟、烟火行为、静电释放时间是否合规以及人员工服等不符合规定的行为,并发出预警信号以提醒相关人员。加油站ai视觉......
  • 电商新动力:SpringBoot购物推荐网站开发详解
    2相关技术2.1MYSQL数据库MySQL是一个真正的多用户、多线程SQL数据库服务器。是基于SQL的客户/服务器模式的关系数据库管理系统,它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等,非常适用于Web站点或者其他......
  • 手写mybatis之把反射用到出神入化
    前言但在实操上,很多码农根本没法阅读框架源码。首先一个非常大的问题是,面对如此庞大的框架源码,不知道从哪下手。与平常的业务需求开发相比,框架源码中运用了大量的设计原则和设计模式对系统功能进行解耦和实现,也使用了不少如反射、代理、字节码等相关技术。如果你有......