首页 > 其他分享 >牛逼!50.3K Star!一个自动将屏幕截图转换为代码的开源工具

牛逼!50.3K Star!一个自动将屏幕截图转换为代码的开源工具

时间:2024-05-27 19:21:52浏览次数:22  
标签:截图 code Star screenshot 代码 元素 模型 50.3

1、背景

在当今快节奏的软件开发环境中,设计师与开发者之间的协同工作显得尤为重要。然而,理解并准确实现设计稿的意图常常需要耗费大量的时间和沟通成本。为此,开源社区中出现了一个引人注目的项目——screenshot-to-code,它利用AI人工智能技术(机器学习算法和视觉分析技术),将屏幕截图自动转换为前端代码,为设计师和开发者之间的合作开辟了新的可能性。

对于前端开发者来说,这意味着他们可以节省大量的手工编码时间,快速从原型或设计稿进入到实际的开发阶段。例如,设计师可以直接将设计的界面截图上传,然后得到一份初步的代码,这极大地加快了设计到开发的转换速度。此外,这个项目也非常适合用于教育目的,帮助初学者理解UI设计与代码实现之间的联系。

2、项目介绍

screenshot-to-code是一个创新的开源工具,它能够将设计图中的截图自动转化为代码片段,主要用于网页和应用界面的开发。通过上传一张包含设计布局的截图,该工具能够智能解析其中的各种界面元素,如文本、图像、按钮、表格、导航栏等,并依据这些元素的位置、尺寸、颜色以及层次关系,精确地生成结构良好、易于维护的前端代码,包括HTML、CSS,以及React或Vue等前端框架的代码,满足了不同项目的需求。

项目地址:

https://github.com/abi/screenshot-to-code

支持的技术栈有:

  • HTML + Tailwind
  • React + Tailwind
  • Vue + Tailwind
  • Bootstrap
  • Ionic + Tailwind
  • SVG

3、技术原理

首先,让我们了解一下screenshot-to-code项目的工作原理。这个项目利用了AI人工智能技术。当用户上传一个屏幕截图时,系统会首先分析这个截图,识别出其中的各种UI元素,如按钮、文本框、图片等。接着,它会将这些视觉元素转换为相应的HTML标签和CSS样式。如果用户选择的是React或Vue,它还会自动生成对应的组件代码。

具体来讲,screenshot-to-code的核心是基于图像识别的深度学习模型。该模型经过训练,能够理解和解析设计图中的元素,如布局、颜色、字体大小和类型、边距等。模型的工作原理大致如下:

  • 图像预处理:首先对输入的截图进行标准化处理,包括调整尺寸、裁剪、灰度化等,以便于模型进行分析。
  • 特征提取:模型通过卷积神经网络(CNN)提取图像中的关键特征,如形状、颜色、纹理等。
  • 元素识别:基于提取的特征,模型对图像中的界面元素进行识别和分类,如文本、图像、按钮等。
  • 布局分析:模型进一步分析元素之间的位置、尺寸、颜色以及层次关系,构建出完整的界面布局。
  • 代码生成:最后,模型根据界面布局和元素属性,生成相应的HTML、CSS以及前端框架的代码。

4、使用步骤

首先,你需要拥有一个具有访问GPT-4 Vision权限的OpenAI API密钥。

目前screenshot-to-code支持的AI模型有:

  • GPT-4 Turbo (Apr 2024) - Best model
  • GPT-4 Vision (Nov 2023) - Good model that's better than GPT-4 Turbo on some inputs
  • Claude 3 Sonnet - Faster, and on par or better than GPT-4 vision for many inputs
  • DALL-E 3 for image generation

其次,分别部署后端和后端,

切换到backend目录,创建.env文件并设置您的OpenAI API密钥,然后使用Poetry进行依赖安装和环境启动。

cd backend
echo "OPENAI_API_KEY=sk-your-key" > .env
poetry install
poetry shell
poetry run uvicorn main:app --reload --port 7001

然后运行前端,在frontend目录下,执行 yarn 安装依赖,然后运行 yarn dev 开发服务器。

cd frontend
yarn
yarn dev

打开浏览器访问 http://localhost:5173 使用该应用。

如果希望用Docker部署,只需在根目录下配置好环境变量并将API密钥写入.env文件,然后运行docker-compose命令即可。

echo "OPENAI_API_KEY=sk-your-key" > .env
docker-compose up -d --build

通过以上步骤设置好后,用户就可以上传截图或视频,系统会自动生成对应的代码。

具体展示效果,感兴趣的读者可以参考官方提供的演示视频。

5、小结与展望

screenshot-to-code项目的优势,最明显的是效率的提升,该工具不仅提高了开发效率,减少了沟通成本,还降低了对设计师和开发者技能水平的要求。

传统的开发流程中,将设计转化为代码是一个耗时且重复的工作,而这个项目通过自动化的方式大大缩短了这一过程。此外,它还有助于减少人为错误,提高代码的准确性和一致性。

然而,挑战也是显而易见的。首先,由于技术的局限性,当前的图像识别算法可能无法完美地识别所有的UI元素和样式,特别是在复杂的设计中。其次,自动生成的代码可能需要进一步的调整和优化才能满足实际的业务需求。此外,对于那些追求定制化和高度优化的开发者来说,自动生成的代码可能无法达到他们的要求。

尽管存在一些挑战,但screenshot-to-code项目的潜力是巨大的。随着技术的不断进步,我们可以预见到它的准确度和适用性将会不断提高。未来,随着技术的不断发展和优化,我们期待screenshot-to-code能够在更多领域得到应用和推广,为软件开发带来更多便利和创新。

标签:截图,code,Star,screenshot,代码,元素,模型,50.3
From: https://www.cnblogs.com/jinjiangongzuoshi/p/18216309

相关文章

  • 【二维路径规划】基于快速RRT-star实现二维空间移动机器人运动规划附matlab复现
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 解决MySQL安装卡在Start Service、Apply security settings问题
    一般进行1-3步骤即可。1.应用程序,卸载MySQL2.删除MySQL安装目录内容C:\ProgramFiles\MySQLC:\ProgramFiles(x86)\MySQL 3.删除MySQL数据存放目录,一般在C:\ProgramData\MySQL目录下(需要注意这个文件夹默认是隐藏的,要通过查看->隐藏的项目)4.删除注册表数据,通过regedit......
  • 7.2k star的万能视频解析下载插件
    今天给大家介绍一个超级厉害的浏览器插件,可以解析各个平台网页视频——猫抓。项目简介猫抓(cat-catch)是一款资源嗅探扩展插件,他能够帮助你筛选列出当前页面的资源。简单来说,当你打开任意一个带有视频的网页,猫抓就可以解析视频的真实地址,协助你下载视频。猫抓这个名字很有......
  • snipaste截图软件安装
    1、官网地址https://zh.snipaste.com2、不知道选择32位还是64位右键电脑win图标选择系统系统类型那一行可以看到操作系统是32位还是64位3、右键压缩包选择解压缩位置4、双击Snipaste应用程序5、点击更多信息6、点击仍要运行7、右键Snipaste图标点击首选项选中......
  • 利用Python+OpenCV实现截图匹配图像,支持自适应缩放、灰度匹配、区域匹配、匹配多个结
    一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获取系统缩放比例注意:必须先通过ctypes获取wid之后才能导入pyautogui,如果需要在其它代码中引用该模块,最好把获取分辨率这部分代码放到程序入口处,然后传递给识图函数,避免提前导入pyautogui导致获取分辨率失......
  • Star CCM+在电池热管理中SOC计算、充电Map调用、电池内阻调用的方法
     前言众所周知电池充电电流是随着电池温度与容量变化查表获得(形式见下表),其中电池的充电倍率(电流)是阶梯变化的,而内阻是线型变化的。因此为了仿真的准确定,需要在软件中实现数据的调用,计算电池的发热量。电池内阻/充电倍率表 一SOC计算SOC的估算方法有开路电......
  • Star CCM+分配零部件至区域后交界面丢失-更新找回
    前言在工程应用中,将零部件分配至区域后,一般常规的操作需要对交界面进行检查。偶尔会发现交界面丢失。遇到此类问题,在没有做其他操作前(比如画网格),可以选择先删除所有区域在重新分配至区域。若已经进行了一下操作,在采用此类方法就不经济了。本文将介绍一种方法对交界面进行更新......
  • 截图工具可以分为不同类型,包括操作系统自带的工具、第三方软件、在线截图工具等。以下
    截图工具可以分为不同类型,包括操作系统自带的工具、第三方软件、在线截图工具等。以下是常见的截图工具分类:操作系统自带工具:操作系统通常会内置基本的截图工具,例如:Windows:SnippingTool、Snip&Sketch、Windows键+PrintScreen(全屏截图)等。macOS:Grab、Preview、Shift......
  • 29.4K star! 仅需几行代码快速构建机器学习 Web 应用项目,无需前端技能!
    大家好,我是狂师!今天给大家推荐一款开源的Python库:Gradio!Gradio是一个开源的Python库,用于创建机器学习和数据科学的交互式应用和演示。项目地址:https://github.com/gradio-app/gradio1、项目介绍Gradio旨在简化展示和测试机器学习模型的过程,它允许用户通过构建漂亮的界面来......
  • chapter-1 start_kernel() part-2
    接下来解释一下函数jump_lable_init()parse_early_param()random_init_early(command_line)setup_log_buf(0)vfs_caches_init_early()sort_main_extable()trap_init()//important!mm_core_init()poking_init()ftrace_init()early_trace_init()sched_init()//impor......