首页 > 其他分享 >全球最大照片网站 Unsplash 开放图片检索数据集

全球最大照片网站 Unsplash 开放图片检索数据集

时间:2023-05-17 13:32:30浏览次数:37  
标签:检索 Unsplash photo 照片 数据 id


By 超神经


内容概要:全球最大的照片网站 Unsplash 宣布平台已经开放了超过 20 万名摄影师的近 200 万张免费图片的,并开放了两个图片检索结果的数据集。


关键词:数据集 图片搜索 图像分类


Unsplash 是世界上最大的照片摄影网站之一,由全世界 20 多万摄影师参与,贡献了数百万张高清优质的摄影作品。


 照片下载站黑马:从 Tumblr 出圈


2013 年 5 月,Unsplash 刚刚诞生,还只是 Tumblr 上的一个小站,摄影师、网友们会将优质的摄影作品上传进来。


全球最大照片网站 Unsplash 开放图片检索数据集_API


短短半年后, Unsplash 的图片下载量就达到了 1000 万次,也顺理成章地从 Tumblr 上分离了出来,推出了网站和搜索功能。


2015 年,Unsplash 的下载量达到 3000 万次,并首次推出了 API,Medium、Trello、Adobe 都是 Unsplash API 的客户。


近期,Unsplash 宣布平台已经有超过 20 万名摄影师的近 200 万张免费照片,并将数亿次搜索结果打包成两个图片检索结果数据集,将其开放。


 数十亿次检索信息,这个数据集不简单


Unsplash 本次开放的检索数据集,被官方定义为 World’s largest open library dataset (全球最大的开放检索信息数据集),包含了数十亿次照片搜索的信息和对应的照片信息。

全球最大照片网站 Unsplash 开放图片检索数据集_数据集_02

数据集分为商用精简版和非商用版本


该数据集包含两个版本:


精简版数据集(下载链接为该版本):可用于商业和非商业使用场景。包含 2.5 万张自然主题的 Unsplash 照片的检索信息,共 2.5 万个关键词。


完整版数据集:仅限于非商业使用场景。包含 200 万张高质量 Unsplash 照片的检索信息,共 500 万个关键词。


本数据集为精简版数据集,压缩包 190M,解压后 550M ,包含四个单独的 TSV 文件,分别为:


全球最大照片网站 Unsplash 开放图片检索数据集_搜索_03

TSV 文件可以在 PostgreSQL 数据库或 Pyhton 环境中加载


  • Collections : 82 MB
    包含 Unsplash 用户创建的照片收藏夹的信息:包括照片的ID(photo_id)、收藏夹的ID(collection_id)、收藏夹的标题(collection_title)和时间戳(photo_collected_at)等数据;
  • Conversions :  349 MB
    包含用户搜索后选择的图像信息:包括照片时间戳(convert_at)、关键词(keyword)、照片ID(photo_id)、脱敏后的用户ID(onymous_user_id) 和用户地理位置(conversion_country)等数据;
  • Keywords : 104 MB
    包含用户搜索的照片ID(photo_id)、搜索的关键字词(keyword)、关键字与图片的置信值(ai_service_1_confidence)等数据;

  • Photos : 6.5 MB
    在这个文件中,可没有照片哦,而是包含照片ID(photo_id)、url(photo_image_url)、摄影师信息(Photographer_username)、相机信息(exif_camera)、参数(exif_iso)、平台查看总次数(stats_views)、下载总次数(stats_downloads)、拍摄地地理坐标(ai_primary_landmark_name)


 怎么下载,怎么使用?


获取该数据集和文档可以访问:https://github.com/unsplash 了解更多使用方法,同时也可以结合 Unsplash 的开放 API,调用更多功能。


API:https://unsplash.com/developers


超神经 HyperAI 也将精简版数据集,在国内进行了做种加速。


访问 https://hyper.ai/datasets/13127 或点击原文阅读即可进行高速下载。


全球最大照片网站 Unsplash 开放图片检索数据集_数据集_04

全球最大照片网站 Unsplash 开放图片检索数据集_API_05


该数据集可以应用在搜索系统、推荐系统、图片分类等场景的优化上。


除此之外,Unsplash 开放 API 提供了官方的 Js、PHP、Ruby 三个库,同时社区开源了 Go、Python、Swift 等库。结合数据集,也可以进行更多的尝试。


—— 完 ——

全球最大照片网站 Unsplash 开放图片检索数据集_API_06






全球最大照片网站 Unsplash 开放图片检索数据集_搜索_07

标签:检索,Unsplash,photo,照片,数据,id
From: https://blog.51cto.com/u_16060192/6290326

相关文章

  • 【EI检索】第九届机械、材料科学与工程应用进展国际学术会议(MMSE 2023)
    第九届机械、材料科学与工程应用进展国际学术会议(MMSE2023)2023年7月23-24日中国武汉|法国巴黎 MMSE系列会议自2010年创立以来,先后由武汉科技大学、华中科技大学、武汉理工大学、中国地质大学(武汉)、湖北省机械工程学会等单位承办。在过去的13年中,MMSE系列会议整理了学科领......
  • 照片格式如何转换jpg?照片格式转换软件分享!​
    照片格式如何转换jpg?照片格式转换为JPEG格式的主要原因是JPEG格式具有较高的压缩比和广泛的应用领域,而且在日常使用中,很多设备和应用程序只支持JPEG格式的照片,那么很多小伙伴想进行一个转换,却不知道该使用什么软件进行操作,下面感兴趣的小伙伴快跟随小编一起来看看吧!选择:AI美颜证件......
  • linux-elasticsearch(存储与检索)
    elasticsearch(存储与检索)一、部署elasticsearch1.rpm单点部署1.1下载ES软件包https://www.elastic.co/cn/downloads1.2安装es[[email protected]~]#lltotal301028-rw-------.1rootroot1340Jan909:09anaconda-ks.cfg-rw-r--r--1rootroot308244603......
  • .Net MAUI Blazor存储访问权限仅照片和视频,没有所有文件管理权限
    参考:https://blog.csdn.net/ansondroider/article/details/1266555131、首先把MinimumTargetAndroidFramework的最低版本号指定为30或30以上2、然后找到Platforms/Android/AndroidManifest.xml把文件管理的权限加上<uses-permissionandroid:name="android.permission.READ_EXT......
  • 论文分享:使用生成对抗性网络的照片真实单图像超分辨率
    尽管使用更快和更深的卷积神经网络在单幅图像超分辨率的精度和速度上取得了突破,但一个中心问题仍然很大程度上没有解决:当我们以大的放大因子进行超分辨时,我们如何恢复更精细的纹理细节?基于优化的超分辨方法的行为主要由目标函数的选择驱动。最近的工作主要集中在最小化均方重建误......
  • PS 简单剪辑照片
    情况一、这个数字是图片上有的,比如说2010年,我想要改成2011年,那个”1“是图片上有的。那直接导图进PS,然后按一下M把”1“框起来,然后按V,接下来按住ctrl和alt(一起按,按住别放),拖动那个虚线的框框,移动到那个要修改的”0”上面。好了完了。情况二、这个数字图片上没有,比如说2012年要改2......
  • 大幅超越DALL·E 2和Imagen,斯坦福发布RA-CM3模型,融合检索与生成
    最近,DALL-E和CM3等模型在多模态任务尤其是图文理解上表现出色。然而,这些模型似乎需要将所有学到的知识存储都存储在模型参数中,这就不得不需要越来越大的模型和训练数据来获取更多的知识,俨然将biggerandbetter绑定在了一起。那既然如此,哪还需要算法工程师?全体转行数据标注工程师和......
  • 好用的照片校正软件
    摘自:https://www.zhihu.com/question/274590764软件下载:http://www.itmop.com/downinfo/312793.html照片修复校正DxOViewPoint3DxOViewPoint3是应用在macOS上的一款照片比例校正软件,具有还原照片比例,修正复杂视角,修复变形镜头,透视校正等多种功能,DxOViewPoint3可以自动纠......
  • 基于Java开发的数字知识库,支持全文检索、知识图谱和工作流审批,太强大了
    一、项目介绍一款全源码,可二开,可基于云部署、私有部署的企业级知识库云平台,应用在需要进行常用文档整理、分类、归集、检索的地方,适合知识密集型单位/历史文档丰富的单位,或者大型企业、集团。为什么建立知识库平台?二、项目所用技术springboot+vue+tinyMce+activiti+elastics......
  • 免费储备照片网站
    免费储备照片网站翻译自:https://medium.com/wd-tips-tricks/free-stock-photo-websites-ce1c614bf767发表时间:2016.11.0115:14今天我收集了一些可靠的免费图片站点.作为博主,设计师,学生,老师,或老板,我们需要储备一些图片,以使我们的生活更容易.幸运地是,互......