纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

lilySolr原理与配置

5月1日 虎狼旗投稿
  概述为什么要引入lily和solr
  在Hbase中,表的RowKey按照字典排序,单一的通过RowKey检索数据的方式,不再满足更多的需求,查询成为Hbase的瓶颈,希望像Sql一样快速检索数据,Hbase之前定位的是大表的存储,要进行这样的查询,往往是要通过类似Hive、Pig等系统进行全表的MapReduce计算,这种方式既浪费了机器的计算资源,又因高延迟使得应用黯然失色,于是HBaseSecondaryIndexing的方案出现了。SolrSolr是一个独立的企业级搜索应用服务器,是ApacheLucene项目的开源企业搜索平台,其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr4还增加了NoSQL支持,以及基于Zookeeper的分布式扩展功能SolrCloud。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎,Solr可以高亮显示搜索结果,通过索引复制来提高可用,性,提供一套强大DataSchema来定义字段,类型和设置文本分析,提供基于Web的管理界面。KeyValueStoreIndexer
  这个组件非常关键,是Hbase到Solr生成索引的中间工具,在CDH5。3。2中的KeyValueIndexer使用的是LilyHBaseIndexer服务,LilyHBaseIndexer是一款灵活的、可扩展的、高容错的、事务性的,并且近实时的处理HBase列索引数据的分布式服务软件。它是NGDATA公司开发的Lily系统的一部分,已开放源代码,LilyHBaseIndexer使用SolrCloud来存储HBase的索引数据,当HBase执行写入、更新或删除操作时,Indexer通过HBase的replication功能来把这些操作抽象成一系列的Event事件,并用来保证写入Solr中的HBase索引数据的一致性,并且Indexer支持用户自定义的抽取,转换规则来索引HBase列数据。Solr搜索结果会包含用户自定义的columnfamily:qualifier字段结果,这样应用程序就可以直接访问HBase的列数据。hbaselilysolr架构
  服务配置
  hbase配置文件搜索index,启用编制索引。
  启用复制
  solrcollection创建脚本用来创建solrcollectioncatcreatecollection。shEOFzk节点ZKworker1要创建的collection名称COLLECTIONhainiuBASEpwd分片数SHARD1副本数REPLICA1echocreatesolrcollectionrmrftmp生成配置文件solrctlzkZK:2181solrinstancedirgeneratetmp{COLLECTION}configs上传配置文件到zksolrctlzkZK:2181solrinstancedircreateCOLLECTIONtmp{COLLECTION}configsecho如果collection名称重复会报configuration重复错误,更换collection名称solr创建collectionsolrctlzkZK:2181solrcollectioncreateCOLLECTIONsSHARDrREPLICAecho如果collection名称重复会报configuration重复错误,更换collection名称查看collectionsolrctlzkZK:2181solrcollectionlistEOF执行创建脚本shcreatecollection。sh
  solrweb验证
  solr创建field字段
  使用postman或者curl命令操作solrapi创建字段
  方式一postman:
  方式二curl:非安全模式curlXPOSTHContentType:applicationjsond{addfield:{name:content,type:texten,stored:true,indexed:true}}http:worker3:8983solrhainiuschema安全模式用户名和密码可以随意输入curlnegotiateuxiniu:xiniuXPOSTHContentType:applicationjsond{addfield:{name:content,type:texten,stored:true,indexed:true}}http:worker3:8983solrhainiu0602schema
  lilyhbaseindexermkdirprootsolrhbaseconfcdrootsolrhbase准备morphline配置文件(解读)准备morphline配置文件morphlines:〔{morphline配置id,与indexer配置文件中的morphlineID一致id:morphline1importCommands:〔org。kitesdk。morphline。,com。ngdata。〕commands:〔{extractHBaseCells{hbase字段映射mappings:〔{textinfo为hbase对应的列族,content为hbase对应的列名inputColumn:textinfo:content输出列,对应solr中的field字段outputField:contentsolr中字段类型type:stringsource:value}〕}}〕}〕
  正式配置文件catconfmorphlines。confEOFmorphlines:〔{id:morphline1importCommands:〔org。kitesdk。morphline。,com。ngdata。〕commands:〔{extractHBaseCells{mappings:〔{inputColumn:textinfo:contentoutputField:contenttype:stringsource:value}〕}}〕}〕EOF准备indexer配置文件catconfindexerconfig。xmlEOF?xmlversion1。0?indexertableTextHbasemappercom。ngdata。hbaseindexer。morphline。MorphlineResultToSolrMappermappingtyperow!Therelativeorabsolutepathonthelocalfilesystemtothemorphlineconfigurationfile。!Userelativepathmorphlines。confformorphlinesmanagedbyClouderaManagerparamnamemorphlineFilevaluerootsolrhbaseconfmorphlines。conf!TheoptionalmorphlineIdidentifiesamorphlineiftherearemultiplemorphlinesinmorphlines。conf!paramnamemorphlineIdvaluemorphline1indexerEOF执行lilyhbaseindexer刷新脚本vimhbase2solr。sh填入如下内容COLLECTIONhainiuZKworker1echoDeletepreviousdocs。。。solrctlcollectiondeletedocsCOLLECTIONechoLilyHBaseMapReduceindexing。。。configetchadoopconf。cloudera。yarnparceloptclouderaparcelsCDHjarparcellibhbasesolrtoolshbaseindexermrjob。jarhbaseconfetchbaseconfhbasesite。xmloptsmapred。child。java。optsXmx1024mlog4jparcelsharedocsearchexamplessolrnrtlog4j。propertieszkZK:2181solrlibjarslibluceneanalyzerssmartcn4。10。3cdh5。14。2。jarexportHADOOPOPTSDjava。security。auth。login。configconfjaas。confhadoopconfigconfigjarjarconfhbaseconfDoptslog4jlog4jhbaseindexerfileconfindexerconfig。xmlverbosegolivezkhostzkcollectionCOLLECTION安全模式执行lilyhbaseindexer刷新脚本
  创建jaas。conf文件,填写如下内容mkdirpconfjaas。confClient{com。sun。security。auth。module。Krb5LoginModulerequireduseKeyTabtruekeyTabrootsolrhbasesolr。keytabstoreKeytrueuseTicketCachefalseprincipalsolrHAINIU。COM;};vimhbase2solr。sh填入如下内容COLLECTIONhainiuZKworker1echoDeletepreviousdocs。。。solrctlcollectiondeletedocsCOLLECTIONechoLilyHBaseMapReduceindexing。。。configetchadoopconf。cloudera。yarnparceloptclouderaparcelsCDHjarparcellibhbasesolrtoolshbaseindexermrjob。jarhbaseconfetchbaseconfhbasesite。xmloptsmapred。child。java。optsXmx1024mlog4jparcelsharedocsearchexamplessolrnrtlog4j。propertieszkZK:2181solrlibjarslibluceneanalyzerssmartcn4。10。3cdh5。14。2。jarexportHADOOPOPTSDjava。security。auth。login。configconfjaas。confhadoopconfigconfigjarjarconfhbaseconfDoptslog4jlog4jhbaseindexerfileconfindexerconfig。xmlverbosegolivezkhostzkcollectionCOLLECTION执行hbase2solr。sh脚本shhbase2solr。sh
  solrweb验证数据
  海汼部落原创文章,原文链接:(http:hainiubl。comtopics75587)
投诉 评论 转载

lilySolr原理与配置概述为什么要引入lily和solr在Hbase中,表的RowKey按照字典排序,单一的通过RowKey检索数据的方式,不再满足更多的需求,查询成为Hbase的瓶颈,希望像……育碧起诉苹果谷歌销售阿里巴巴侵权游戏AreaF2法国知名游戏开发商育碧娱乐公司在周五起诉苹果、谷歌公司,指控他们销售育碧热门游戏《彩虹六号:围攻》的抄袭作品。育碧游戏《彩虹六号:围攻》育碧周五在洛杉矶联邦法院提交……我的世界4月16日加入实时光线追踪,全新像素世界感谢IT之家网友牙膏厂总厂长的线索投递!IT之家4月9日消息今天下午,英伟达再次预热光线追踪版本《我的世界》,称即将上线,但是没有公布的具体的日期。现在,网友投稿板卡大厂……Xbox市场主管回应60帧之争画面帧数开发者决定IT之家5月12日消息此前育碧表示《刺客信条:英灵殿》在XboxSeriesX上运行帧数为30FPS,引起了玩家关于XboxSeriesX标准游戏输出帧数的讨论,今天,微软Xb……构建适合中国国情和体制特征的政府投融资管理体系21世纪经济报道记者了解到,2017年以来,重庆、湖南、陕西、山东等省已制定融资平台转型方案。总的方向上,对空壳类城投要撤销;对兼有公益性项目建设、运营职能的实体类融资平台公司……官方宣布最后生还者2无限期延迟,新发售日未定感谢IT之家网友茵蒂克丝的线索投递!IT之家4月3日消息《最后生还者2》是目前众多玩家和游戏媒体们最关注的一款即将上市的游戏大作,不过遗憾的是,今天索尼和开发商顽皮狗宣布……期待惊喜最后生还者2联合总监称将重新定义3A游戏IT之家2月16日消息PS4最大的魅力就是其独占的游戏,而很大部分玩家购买PS4的原因也是这些独占游戏。说到独占游戏,就不得不提来自著名工作室顽皮狗的大作《TheLastofU……央视频上线VIP会员模式观看体育赛事仍少不了它不过,观看比赛的完整回放、精彩短视频部分仅需看一段广告,还无需开通央视频VIP会员,大部分都可在黄金赛事等央视频号观看。手机上的APP移动互联网时代,网上冲浪的大部分时间……压力倍增,微软XboxLive服务一月内三宕机IT之家4月11日消息据TheVerge报道,微软XboxLive服务在今天早些时候再次出现连接问题,影响玩家参与聚会和多人在线游戏,这是XboxLive服务在一个月内第三次出……国产单机游戏九霄缳神记正式发售登陆SteamWeGame双平IT之家4月15日消息今日,单机游戏《九霄缳神记》正式上市,在Wegame、Steam双平台同步发售,定价为68元,首发价均为58元。IT之家了解到,《九霄缳神记》是一款……卡普空生化危机3重制版全球销量破200万份IT之家4月13日消息日本视频游戏开发商与发行商CAPCOM(卡普空)今日宣布,《生化危机3:重制版》全球销量突破200万份。(图源游民星空)据悉,由于数字销售战略……辐射76Steam国区售价公布129元,4月14日解锁IT之家4月12日消息昨日,《辐射76》在Steam平台开启预购。Steam页面显示,《辐射76》Steam国区售价为129元,包含两款DLC的售价为199元,将于4月14日正……
明代服饰(明朝女子服装)五码(五码是多少米?)重庆天津两个直辖市的楼市,遇到同一个待解谜团农村人,都把医院当生命的最后一站什么过街横行霸道(谁过街横行霸道歇后语)伯乐与千里马(寻找千里马的故事道理)四级证书丢了怎么办(英语四级证书原件丢了怎么办)耐心地(耐心的指导还是耐心地)走进荣成民俗博物馆,感受百年胶东民俗风情李维嘉老婆是谁(李维嘉的老婆长什么样)清明时节雨纷纷路上行人欲断魂(路上行人欲断魂的诗意是什么)想查老婆微信聊天记录(怎么找到微信的其他聊天记录)
白癫疯女性怎么样提高免疫力style是什么牌子stackedstyle香水品牌毒蛇咬伤后有几种急救方法今年多少岁山姆会员店老婆的卡可以进吗eos怎么买(哪里买柚子币)幼儿感冒不及时治疗当心引发并发症诚信为首善之本初中作文热议聚热点网 女士牛仔裤搭配图片这几款牛仔裤简直潮爆了女人要怎样消除性恐惧什么凉茶清热解毒呢几种最常见的避孕药不良反应与解决之道

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形