1. IPFS点滴资讯首页
  2. 观点碰撞

完整的数据集列表/建议一个数据集

以下是我们到目前为止已经获得的数据列表

 

人工智能/机器学习

Berkley自驾驶数据Berkley自驾游项目的开源视频数据,包含10万个视频,代表了1000多个小时的驾驶经验,超过1亿帧。

 

多媒体公共资源雅虎实验室的YFCC100M数据集中近1亿张经Creative Commons授权的Flickr图片和视频的音频和视觉特征的集合,以及对选定子集的地面真相注释。

 

NLP fast.ai一些最重要的NLP数据集,重点是分类,包括IMDb、AG-News、Amazon Reviews(极性完整)、Yelp Reviews(极性和完整)、Dbpedia、搜狗新闻(拼音)、Yahoo Answers、Wikitext 2和Wikitext 103,以及ACL-2010法英10^9语料库。

 

Mevadata人类活动的视频数据,包括有脚本的和没有脚本的,在几周内收集了大约100名演员的视频数据。这些数据是用29台摄像机收集的,视场重叠和非重叠的数据。

 

Google N-gramsN-grams是固定大小的项的元组。在这种情况下,项目是从Google图书语料库中提取的单词。n指定了元组中的元素数量,所以一个5-gram包含5个单词或字符。

 

FMA:自由音乐档案(FMA),一个开放且易于访问的数据集,适用于评估MIR中的几个任务,这个领域涉及到浏览、搜索和组织大型音乐集。

 

 

气候

 

开放式AQ:由政府、研究级和其他来源的公共数据源提供的全球物理空气质量综合数据。

 

文化

 

Project Gutenberg超过60,000本免费电子书的图书馆。从免费的epub和Kindle电子书中选择,下载或在线阅读。

 

维基百科多语种的在线百科全书,由志愿者编辑社区使用基于wiki的编辑系统创建和维护的开放合作项目。

 

Offshore Leaks属于 “Paradise文件”、“巴拿马文件”、“Offshore Leaks” 和“巴哈马Leaks”调查的785,000多个离岸实体的信息。这些数据链接到200多个国家和地区的人员和公司。

 

GDELT V2该项目以100多种语言监控世界上几乎每个国家的每个角落的广播、印刷和网络新闻,并识别出每时每刻推动我们全球社会发展的人物、地点、组织、数量、主题、来源、情感、语录、图片和事件。

 

 

地图

 

陆地地图(LIDAR)美国地质调查局的三维高程计划(3DEP)的目标是以光探测和测距(LiDAR)数据的形式收集美国大陆、夏威夷和美国领土上的高程数据,数据采集期为8年。

 

OpenStreetMap由一个地图绘制者社区建立,他们提供并维护世界各地的道路、小道、咖啡馆、火车站等数据。

 

OpenAddress: 全球性的地址数据源集合,开放和免费使用。

 

谷歌地标谷歌地标数据集(GLD-v2)的第二个版本,其中包含了代表人类和自然地标的标签注释图像。该数据集可用于地标识别和检索实验。这个版本的数据集包含约500万张图像,分为3组图像:训练、索引和测试。

 

 

科学性

 

GNOMAD v3(EXAC)基因组聚合数据库(gnomAD),是一个研究者的联盟,旨在整合和协调来自各种大规模测序项目的外显子组和基因组测序数据,并向更广泛的科学界提供摘要数据。

 

ENCODEDNA元素百科全书(ENCODE)联盟是由美国国家人类基因组研究所(NHGRI)资助的一个国际合作研究小组。ENCODE的目标是构建人类基因组中功能元素的全面列表,包括在蛋白质和RNA水平起作用的元素,以及控制细胞和基因活动环境的调控元素。

 

OpenNeuro开放的脑成像数据的数据库。根据 Creative Commons CC0 许可共享数据,为研究人员和公民科学家提供广泛的脑成像数据。该数据库主要集中在功能磁共振成像(fMRI)数据,但也包括其他成像方式,包括结构性和弥散性磁共振成像、脑电图(EEG)和脑磁图(MEG)。

 

1000个基因组国际合作建立了最详细的人类遗传变异目录,包括SNPs、结构变异及其单倍型背景。该项目的最后阶段对来自全球26个不同人群的2500多个个体进行了测序,并为这些个体制作了一套完整的阶段性单倍型,其中包括8000多万个变异体。

 

 

空间

 

Landsat 8:正在收集由陆地卫星8号卫星拍摄的地球上所有陆地的卫星图像。陆地卫星8号是NASA和美国地质调查局(USGS)的合作项目。

 

点对点科技简介

点对点科技深耘IPFS与Filecoin技术,坚持区块链技术改变未来的信念。点对点 IPFS 数据中心是目前国内技术领先,性价比高、保障优的投资标的。自建杭州数据中心,合作数据中心分布于上海、宁波、河北、香港、斯德哥尔摩(瑞典)等地。点对点数据中心具有优秀的硬件配置与目前国内优质的网络节点资源。点对点科技力求将IPFS爱好者升级为IPFS领军者与受益者,让IPFS颠覆传统互联网,共同开启 WEB 3.0时代。

想了解更多区块链知识吗?关注我吧!

Filecoin测试网二阶段昨日重启,点对点出块第一! | 点滴资讯

原创文章,作者:jiang,如若转载,请注明出处:https://ipfsdrop.com/view/wanzhengdeshujujiliebiao-jianyiyigeshujuji/

发表评论

电子邮件地址不会被公开。 必填项已用*标注