当前位置: 首页 > solr4复制
  • ReplicationHandler的复制功能来说,核心的问题确定是在一个时间点要复制哪些文件,这就用上了lucene的IndexDeletionPolicy的特性。slave启动时会创建SnapPuller对象,SnapPuller会启动一个线程定时的(pollInterval间隔)从master复制数据(fetchLatestIndex方法)。

    阅读全文
    solr, 搜索 772 人阅读 抢沙发 , , ,
  • Solr复制的部分原理是:从库默认的索引目录是index,在正常复制时,从库只是对该目录里的索引文件做修改(添加新的,删除旧的),但当从库索引提交点(IndexCommit)的generation大于主库时,会发生索引文件的全copy,也就是抛弃当前使用的索引目录,而是使用新生成的临时索引目录作为新的索引目录,并修改index.properties,临时目录的命名格式就是取当前的一时间戳(也就是bug所在,但到这里我还没发现这个bug)。

    阅读全文
    solr, 搜索 464 人阅读 抢沙发 , ,
  • solr4.0 的所以继承Lucene的分段索引方式,采用了多shard的方式以提高在分布式云环境下的高性能要求的瓶颈。对于一个完整的文档集,将被分布到多个shard中进行索引存储,每个shard相对独立,有自己独立的indexwriter和searcher。shard是对完整文档集索引 分片(块)处理的体现,在solr的代码里每个shard都有一个solrCore对其维护管理。所以core是从solr代码的层面上讲的,而shard是从索引数据的分割角度来讲的。目前solr只允许一个core管理维护一个shard。

    阅读全文
    solr, 搜索 1,825 人阅读 抢沙发 , , ,
  • Solr作为一个搜索服务器,在并发搜索请求的场景下,可能一台服务器很容易就垮掉,这是我们可以通过使用集群技术,设置多台Solr搜索服务器同时对外提供搜索服务,在前端使用类似Nginx的负载均衡软件,可以通过配置使得并发到达的搜索请求均匀地反向代理到Solr集群中的每一台服务器上,这样每台Solr搜索服务器搜索请求的压力可以大大减小,增强了每台服务器能够持续提供服务器的能力。本文给出了Solr集群Replication配置方法。

    阅读全文
    solr, 搜索 974 人阅读 抢沙发 , ,