收藏!这23个数据获取渠道,一般人不知道

原创
bbuugg888 2周前 (05-09) 阅读数 44 #保险

前几天在后台收到一位在写论文的本科同学的咨询“求助”,询问我有没有什么数据查找的好渠道。

说到找数据,大多数正在写论文、需要数据进行分析和研究的同学都 “深受其害”。

在这里,我也给大家推荐一些能够用上数据获取方式,有了这些资源,不仅可以在数据收集的效率上能够得到很大的提升,同时也可以学习更多思维方式。

一、公开的数据库

1、国家数据

传送门:http://data.stats.gov.cn/index.htm

数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面和权威,对于社会科学的研究不要太有帮助。

2、CEIC

传送门:http://www.ceicdata.com/zh-hans

最完整的一套超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等深度数据。“中国经济数据库”收编了300,000多条时间序列数据,数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。

3、wind(万得)

传送门:http://www.wind.com.cn/

万得被誉为中国的Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新非常快,极受国内的商业分析者和投资人的亲睐。

4、搜数网

传送门:http://www.soshoo.com/

已加载到搜数网站的统计资料达到7,874本,涵盖1,761,009张统计表格和364,580,479个统计数据,汇集了中国资讯行自92年以来收集的所有统计和调查数据,并提供多样化的搜索功能。

5、中国统计信息网

传送门:http://www.tjcn.org/

国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。

6、亚马逊aws

传送门:http://aws.amazon.com/cn/datasets/?nc1=h_ls

跨科学云数据平台,包含化学、生物、经济等多个领域的数据集。

7、figshare

传送门:https://figshare.com/

研究成果共享平台,在这里你会发现来自世界的大牛们的研究成果分享,同时get其中的研究数据,内容很有启发性,网站颇具设计感。

8、github

传送门:https://github.com/caesar0301/awesome-public-datasets

如果觉得前面的数据源还不够,github上的大神已经为大家整理好了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全面,简直是做研究和数据分析的利器。

随便上几个图,满满的全都是资源

二、数据交易平台

1、优易数据

传送门:http://www.youedata.com/

由国家信息中心发起,拥有国家级信息资源的数据平台,国内领先的数据交易平台。

平台有B2B、B2C两种交易模式,包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。

2、数据堂

传送门:http://www.datatang.com/

专注于互联网综合数据交易,提供数据交易、处理和数据API服务,包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据

三、网络指数

3、百度指数

传送门:http://index.baidu.com/

大家都很熟悉的指数查询平台,可以根据指数的变化查看某个主题在各个时间段受关注的情况,进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外,还有需求分析、人群画像等精准分析的工具,对于市场调研来说具有很好的参考意义。同样的另外两个搜索引擎搜狗、360也有类似的产品,都可以作为参考。

4、阿里指数

传送门:https://alizs.taobao.com/

国内权威的商品交易分析工具,可以按地域、按行业查看商品搜索和交易数据,基于淘宝、天猫和1688平台的交易数据基本能够看出国内商品交易的概况。对于趋势分析、行业观察有不小意义。

5、艾瑞咨询

传送门:http://www.iresearch.com.cn/

艾瑞作为老牌的互联网研究机构,在数据的沉淀和数据分析上都有得天独厚的优势,在互联网的趋势和行业发展数据分析上面比较权威,艾瑞的互联网分析报告可以说是互联网研究的必读刊物。

6、友盟指数

传送门:http://www.umeng.com/

友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析,对于研究移动端产品、做市场调研、用户行为分析很有帮助。

除了友盟指数,友盟的互联网报告同样是了解互联网趋势的优秀读物。

7、爱奇艺指数

传送门:http://index.iqiyi.com/

爱奇艺指数是专门针对视频的播放行为、趋势的分析平台,对于互联网视频的播放有着全面的统计和分析,涉及到播放趋势、播放设备、用户画像、地域分布、等多个方面。

由于爱奇艺庞大的用户基数,该指数基本可以说明实际情况。

8、猫眼专业版

传送门:http://piaofang.maoyan.com/

座率和影院数据,对于当前电影的分析是必不可少的。

四、网络采集器

网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容,具有很好的内容收集作用,而且不需要技术成本,被很多用户作为初级的采集工具。

1、 火车采集器

传送门:http://www.locoy.com/

一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据。

最常用的就是采集某些网站的文字、图片、数据等在线资源。接口比较齐全,支持的扩展比较好用,懂代码的话,可以使用PHP或C#开发任意功能的扩展。

2、 八爪鱼

传送门:http://www.bazhuayu.com/

简单实用的采集器,功能齐全,操作简单,不用写规则。特有的云采集,关机也可以在云服务器上运行采集任务。

3、集搜客

传送门:http://www.gooseeker.com/

一款简单易用的网页信息抓取软件,能够抓取网页文字、图表、超链接等多种网页元素,提供好用的网页抓取软件、数据挖掘攻略、行业资讯和前沿科技等。

五、网络爬虫

爬虫高度的自由性、自主性都使其成为数据挖掘的必备技能,当然精通python等语言是必要前提。

利用爬虫可以获取一些从其它渠道获取不到的数据资源,更重要的是帮你打开寻找和搜集数据的思路。

六、小工具

Web Plot Digitizer

传送门:http://arohatgi.info/WebPlotDigitizer/app/

比如我们在查看期刊文献的时候看到一张成型的图表,但其本身数据是缺失的,你想获得这个图表的相关数据怎么办?

有了这个小工具就非常easy了。直接上传我们需要获得数据的图表,如下:

然后我们就会获得如下的数据反馈,这对于一些不需要十分精确的分析研究足够使用。

虽然我并不推荐用这个作为量化分析的依赖,但对于定性的分析,做ppt级的数据统计分析就足够了。

七、数据导航

下面推荐几个可以用到的大数据导航,从这里面你可能会发现一些你自己想要的东西。

1、199IT大数据导航

传送门:http://hao.199it.com/

2、数据分析网导航

传送门:http://www.afenxi.com/hao

3、 大数据人导航

传送门:http://hao.bigdata.ren/

以上就是一些效率数据获取手段。

按照我的经验,多种手段结合,即可应付大多数场景和需求,所以选择合适的数据获取渠道还需要亲自探究。

我是@小谭博士

科研、竞赛领域的“老萌新”答主 ୧⍢⃝୨

拿奖、写论文相关问题可以私信我

版权声明

注意:以上内容(如有图片或视频亦包括在内)为自媒体平台用户上传并发布,本平台仅提供信息存储服务。

Attention: The above content (including any pictures or videos) is uploaded and published by users of self media platforms, and this platform only provides information storage services.

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门
标签列表