VLM
  • 2024-12-09VLM-OCR-Demo:一个使用VLM用于OCR任务的示例
    https://www.cnblogs.com/mingupupu/p/18594592 前言上一篇文章TesseractOCR-GUI:基于WPF/C#构建TesseractOCR简单易用的用户界面中我们构建了一个方便使用TesseractOCR的用户界面,今天构建一个类似的界面,使用SemanticKernel接入视觉模型,测试一下用视觉模型做OCR任务的效果。在
  • 2024-12-09VLM-OCR-Demo:一个使用VLM用于OCR任务的示例
    前言上一篇文章TesseractOCR-GUI:基于WPF/C#构建TesseractOCR简单易用的用户界面中我们构建了一个方便使用TesseractOCR的用户界面,今天构建一个类似的界面,使用SemanticKernel接入视觉模型,测试一下用视觉模型做OCR任务的效果。在之前的文章使用Tesseract进行图片文字识别的总结中
  • 2024-12-06Voxposer简介
    VoxPoserisaframeworkthatleverageslargelanguagemodels(LLMs)andvision-languagemodels(VLMs, orVision-LanguageModels,areaclassofartificialintelligencemodelsdesignedtoprocessandintegratevisualandtextualinformation.Thesemodelsa
  • 2024-12-10WSL 2 启用指南:让你的 Windows 成为 Linux 的完美搭档
    前言曾几何时,Windows和Linux被视为水火不容的对立面,各自占据着不同的技术领土,互不干涉。然而,随着Windows子系统Linux(WSL)诞生,尤其是WSL2的推出,这两大操作系统不再是敌对阵营,而是迎来携手共进的新时代。WSL2提供强大的性能和兼容性,使Windows与Linux完美融合,成为
  • 2024-12-10EDI系统与业务系统集成:选择中间数据库还是REST API方案?
    EDI项目中,对外企业可以借助专业的EDI系统,基于AS2、OFTP等国际通用的EDI传输协议搭建传输通道,并基于这些传输通道实现安全、可靠地数据传输。对内企业如何实现业务系统和EDI系统之间的数据同步呢?企业可以通过中间数据库、RESTAPI、WebService、共享文件夹等方式实现EDI系统与企业
  • 2024-11-24真题练习14-Word字处理-全国计算机等级考试二级MS Office高级应用与设计考试【汪老师的个人课堂】
    视频讲解真题练习14-Word字处理_哔哩哔哩_bilibili题库下载全国计算机等级考试题库下载(用电脑下载安装):请点击题目要求第14套某单位财务处请小张设计《经费联审结算单》模板,以提高日常报账和结算单审核效率。请根据考生文件夹下“Word素材1.docx”和“Word素材2.xlsx”文
  • 2024-08-09端到端时代,理想智驾如何换道超车?
    作者|德新编辑|王博经过100万到200万级别短视频Clips的训练,理想智驾搭载端到端+VLM视觉语言模型技术的第一个版本(OTA6.1.0E2E-VLMBeta1),已经向千人级别的内测用户开放。这可能是目前在国内,作为一个普通车主有机会用上的绝少数搭载了端到端技术的智驾软件版本。从2023
  • 2024-07-05BACON: Supercharge Your VLM with Bag-of-Concept Graph to Mitigate Hallucinations
    目录概BACON代码[YangZ.,FengR.,etal.BACON:Superchargeyourvlmwithbag-of-conceptgraphtomitigatehallucinations.2024.]概本文提出了一种新的数据格式:BACON(BAg-of-Conceptgraph).BACONBACON希望将一个图片转换为\(G=(D,O,R,B)\)的数据格式
  • 2024-06-11Vision-Language Models are Zero-Shot Reward Models for Reinforcement Learning
    发表时间:2024(ICLR2024)文章要点:文章提出用预训练的视觉语言模型作为zero-shot的rewardmodel(VLM-RMs)。好处在于可以通过自然语言来给定一个具体的任务,通过VLM-RMs让强化学习基于reward学习这个任务(usingpretrainedvision-languagemodels(VLMs)aszeroshotrewardmodels
  • 2024-06-09LMDeploy量化部署LLM&VLM实践
    一、前提知识:大模型部署背景:什么是模型部署:部署面临的挑战:受Transformer架构影响:常见GPU算力还能一战,但是显存带宽受限严重,时间花费在数据交换上居多大模型部署方法:模型参数以定点数或整数形式存储,实际计算时,反量化为浮点数去计算,再用定点数和整数去存储计算结