大数据data开发有哪些好的辅助工具?

  • 时间:
  • 浏览:6
  • 来源:幸运飞艇_幸运飞艇官方

云构建的分布式RESTful搜索引擎:Elasticsearch

MongoDB是另另另八个 基于分布式文件存储的数据库,使用C++语言编写。旨在为Web应用提供可扩展的高性能数据存储防止方案。应用性能高低依赖于数据库性能,MongoDB则是非关系数据库中功能最充裕,最像关系数据库的,随着MongDB 3.4版本发布,其应用场景适用能力得到了进一步拓展。

Hazelcast 是两种内存数据网格 in-memory data grid,提供Java系统线程池池员关键任务交易和万亿级内存应用。我虽然Hazelcast促进促进 所谓的‘Master’,假使 仍然有另另另八个 Leader节点(the oldest member),你这些 概念与ZooKeeper中的Leader同类,假使 实现原理却全部不同。同去,Hazelcast中的数据是分布式的,每另另另八个 member持有累积数据和相应的backup数据,这点也与ZooKeeper不同。

Hazelcast的应用便捷性深受开发者喜欢,但并且要投入使用,还需要慎重考虑。

用Java编写的开源软件框架,用于分布式存储,并对非常大的数据集进行分布式防止:Hadoop

广泛使用的开源Java分布式缓存:EHCache主要面向通用缓存、Java EE和轻量级容器。

Redis是另另另八个 开源的使用ANSI C语言编写的、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。Redis 有另另另八个 主要使其有别于其它全都竞争对手的特点:Redis是全部在内存中保存数据的数据库,使用磁盘并且为了持久性目的; Redis相比某些键值数据存储系统有相对充裕的数据类型; Redis可需要将数据复制到任意数量的从服务器中。大数据学习交流裙,记得是529加867加072,同去学习交流

开源分布式数据库管理系统:Cassandra—

作为另另另八个 系统线程池池员开发工具好比是人的手和脚,促进促进 把哪些开发工具用好,促进做好另另另八个 产品的需求。大多使用SQL数据库存储/检索数据,如今全都情况表下,它都有再能满足我们我们 儿的需求。下面小编就介绍某些大数据data开发常用的辅助工具。

EhCache 是另另另八个 纯Java的系统线程池池内缓存框架,具有快速、精干等特点,是Hibernate中默认的CacheProvider。主要型态有:快速简单,具有多种缓存策略;缓存数据有两级,内存和磁盘,假使 不会担心容量现象;缓存数据会在虚拟机重启的过程中写入磁盘;可需要通过RMI、可插入API等最好的土办法进行分布式缓存;具有缓存和缓存管理器的侦听接口;支持多缓存管理器实例,以及另另另八个 实例的多个缓存区域;提供Hibernate的缓存实现。

开源企业搜索平台:Solr

最初是由Facebook开发的,旨在防止某些商品服务器上的小量数据,提供高可用性,促进促进 单点故障。

ElasticSearch是基于Lucene的搜索服务器。它提供了分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是比较流行的企业级搜索引擎。

集Google BigTable的数据模型与Amazon Dynamo的全部分布式架构于一身。于808开源,此后,并且Cassandra良好的可扩展性,被Digg、Twitter等Web 2.0网站所采纳,成为了两种流行的分布式型态化数据存储方案。

与ElasticSearch一样,同样是基于Lucene,但它对其进行了扩展,提供了比Lucene更为充裕的查询语言,同去实现了可配置、可扩展并对查询性能进行了优化。

跨平台的,面向文档的数据库:MongoDB

因Cassandra是用Java编写的,全都理论上在具有JDK6及以上版本的机器中都可需要运行,官方测试的JDK还有OpenJDK 及Sun的JDK。 Cassandra的操作命令,同类于我们我们 儿平时操作的关系数据库,对于熟悉MySQL的我们我们 儿来说,操作会很容易上手。

开源(BSD许可)内存数据型态存储:Redis 用作数据库,缓存和消息代理。

MongoDB的核心优势并且灵活的文档模型、高可用复制集、可扩展分片集群。让人试着从几大方面了解MongoDB,如实时监控MongoDB工具、内存使用量和页面错误、连接数、数据库操作、复制集等。

开源分布式NoSQL数据库系统:Apache Cassandra

用Java编写,来自Apache Lucene项目。Solr是另另另八个 独立的企业级搜索应用服务器,它对外提供同类于Web-service的API接口。用户可需要通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可需要通过Http Get操作提出查找请求,并得到XML格式的返回结果。

ElasticSearch不仅是另另另八个 全文本搜索引擎,还是另另另八个 分布式实时文档存储,其中每个field均是被索引的数据且可被搜索;也是另另另八个 带实九时析功能的分布式搜索引擎,假使 促进扩展至数以百计的服务器存储及防止PB级的数据。ElasticSearch在底层利用Lucene完成其索引功能,假使 其某些基本概念源于Lucene。

用户可需要在不了解分布式底层细节的情况表下,开发分布式系统线程池池。充分利用集群进行高速运算和存储。Hadoop实现了另另另八个 分布式文件系统(Hadoop Distributed File System),简称HDFS。Hadoop的框架最核心的设计并且:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。

基于Java的开源内存数据网格:Hazelcast