关于智数™社科大数据平台
智数™,是基于多源大数据分析与可视化的技术,面向社科教学与科研领域,结合社科大数据研究所需要的数据资源、模型,将不同来源、不同性质的数据,按照领域研究的方法,聚合在同一个平台下,从而辅助学生学习,为科研人员提供科研支撑。
功能模块
- 大数据分布式采集接口子系统
- 大数据分析建模子系统
- 大数据可视化子系统
任何大数据采集、建模和平台构建的需求
房地产洞察
定向采集房地产行业相关的新闻资讯等非结构化信息,进行分词特征分析、话题关联分析、地域分布分析以及渠道来源监测。
旅游业洞察
从海量互联网文本数据中,采集和监测国内旅游、国际旅游、旅游新政策、上市公司、在线旅游和行业创业动向等相关资讯。
金融业洞察
重点关注互联网金融业的舆情热点,发现热点人物、热点区域和热点机构,聚合行业资讯,辅助决策。
电商业洞察
对电子商务行业进行深度研究,按照B2B,C2C,洞悉汽车电商、传统零售、医药、大健康和生鲜等领域的行业动态。
事件影响力
创新利用微博、微信和平面媒体等搜索信息,掌握相关事件的影响力,涵盖:涵盖社会、互联网、政务、财经、企业、娱乐、灾难、违法犯罪等多个主题。
指数观星台
依托各个行业就业需求的全网监控,创新提出行业景气指数,对多行业景气指数进行建模和监测,包括旅游行业、房地产行业、互联网金融行业景气指数监测、分地区景气指数。
经济监测区
对全球超过150个国家的通货膨胀率、利率、居民消费价格指数CPI、货币供应量M2、货币供应量M1、失业率等近100个指标进行监测。
数据下载区
面向不同领域的研究需求,提供原始数据下载服务,服务于领域研究的需要。
客户评价
机器学习
平台对各个领域的海量数据,建立流式的机器学习模型,应用聚类、分类、预测、深度学习等技术,对海量数据进行分析、建模和展现。
自然语言处理
按照领域进行文本自动分类处理,基于自然语言处理技术(NLP),对文本进行分词、词性识别、实体识别、主题聚类等处理,提取有价值的数据进行展现。
知识图谱
平台基于预定义的规则,对各个领域的数据进行知识图谱构建,基于语义网络、自然语言处理、深度学习等相关技术,开展知识提取、知识整合和知识发现等相关工作。
模型自动化
按照预设的领域建模要求,建立了自动化模型,构建模型的数据输入和结果输出接口,形成应用级平台,支持用户决策。
领域数据爬虫
实时采集互联网开放数据,基于分布式的爬虫技术,对开放数据源进行数据建模,周期性采集和存储到海量数据库中。
案例研发
基于领域的知识积累,面向高校的专业和课程,研发案例和课件,通过一对一辅导的方式,帮助师生,挖掘数据价值,点通商务智能。