企业地址:南京市鼓楼区南昌路40号长江科技园 一期大楼十三层
联系电话:025-52336921
企业邮箱:wxq@joinforwin.com
成立时间:2014 年
企业规模:100-150人
注册资金:5000万
浏览次数:4787
企业地址:南京市鼓楼区南昌路40号长江科技园 一期大楼十三层
联系电话:025-52336921
企业邮箱:wxq@joinforwin.com
成立时间:2014 年
企业规模:100-150人
注册资金:5000万
浏览次数:4787
产品简介
基于HADOOP构建数据中心,拥有强大的计算能力、存储能力,可动态添加节点,提供JDBC、ODBC驱动,支持结构化存储,支持ANSI-SQL实时分析,支持非结构化存储。
适用范围
区域医疗级数据中心、医院数据中心
1、海量的结构化数据抽取、存储、查询统计、质量监控及处理。
2、海量的半结构化数据(EMR)存储、调阅、分析。
3、海量的患者就诊信息里面,计算出主索引。
架构图详解
分析人员、数据科学家和工程师需要处理数据、分析数据、不断地改善我们的产品, 对于这些人来说,提高 数据仓库的查询性能是非常重要的。在一定时间内能够运行更多的查询并且能够更快地获得查询结果能够提高 他们的工作效率。数据仓库中的数据存储在几个大型的Hadoop HDFS的集群上。 Hadoop MapReduce[2]和 Hive被设计为用于进行大规模、高可靠性的计算。是一个分布式SQL查询引擎,它被设计为用来专门进行高速、 实时的数据分析。它支持标准的ANSI SQL,包括复杂查询、聚合(aggregation)、 连接(join)和窗口函数(window functions)。在CPU的性能和主要的查询性能上比Hive/MapReduce要好10倍以上。 它目前支持ANSI SQL的大部分操作,包括连接、 左/右外连接、 子查询、以及通用的聚合和标量函数, 同时也包含了一些近似的去重(使用了 HyperLogLog)和近似的百分数(基于quantile digest算法,)计算。 目前阶段的主要限制是在表连接时候的大小限制以及唯一键值和群组的基数(cardinality of unique keys/groups)
Q友评论Q友评论仅代表用户个人观点,不代表Q医疗立场