Lucene是一种核心的全文搜索引擎库,由Apache软件基金会开发,以Java编写,广泛应用于各种搜索引擎的构建。它提供了丰富的文本分析、索引和查询功能,为开发者提供了强大的文本搜索能力。基于Lucene的开源搜索引擎则是在Lucene基础上进行了扩展和封装,提供了更高级别的功能和服务,适用于各种场景和需求。 1. Apache Solr Apache Solr是基于Lucene的一个高性能、全功能的搜索服务器。它使用Java5及更高版本开发,具备XML和JSON接口,支持高效的缓存策略、垂直搜索、高亮显示搜索结果、索引复制以提高可用性,并提供了一套强大的Data Schema来定义字段和类型。Solr还具有易于部署和管理的Web界面,使得配置和维护变得更加简单。 2. Elastic Search Elasticsearch是另一个基于Lucene的分布式、RESTful搜索引擎。它强调云原生,支持实时搜索、高可用性和快速响应。Elasticsearch可以通过HTTP使用JSON进行数据索引,易于集成到Web应用中,同时提供了丰富的插件生态系统,以适应各种定制需求。 3. Index Tank Index Tank是一款专注于实时索引和搜索的解决方案,特别适合处理用户生成内容。它将相关性标记与文档内容分离,以处理如分享次数、点赞等动态变化的数据。Index Tank的设计允许灵活地处理这类实时信息。 4. Katta Katta是一个分布式数据存储系统,旨在处理大量重复和索引的数据碎片,以应对高负载和大数据集的挑战。它支持多种数据类型,如Lucene索引和Hadoop MapFiles,确保在节点故障时的容错性和可扩展性。 5. Bobo Browse Bobo Browse是Lucene的一个扩展,提供了一种方便的方式来实现基于分类的搜索统计。通过Bobo Browse,可以在搜索结果中按类别统计记录,如在“电脑”搜索中查看“Intel CPU”和“AMD CPU”的匹配数量。 6. Compass Compass是一个对象/搜索引擎映射(OSEM)框架,将Java对象与Lucene搜索引擎紧密连接起来,提供事务管理、简单查询语言、可扩展和模块化的设计,以及易于使用的API,简化了开发人员的工作。 7. Summa Summa是一个用Java编写的快速、模块化和可扩展的搜索引擎。它支持对多个数据源进行综合搜索,拥有模块化设计以简化维护和升级,具备可扩展性以适应不同规模的数据,并遵循现代Web技术和标准,确保故障容错和持续运行。 8. Constellio Constellio是专为企业级搜索设计的开源解决方案,基于Apache Solr和Lucene。它提供了针对网页和文档的检索功能,允许用户根据文档类型、文件夹和文件名进行筛选。Constellio旨在简化企业内部的搜索体验。 这些基于Lucene的开源搜索引擎各具特色,分别在不同的方面提供了增强和优化,为开发者提供了更多选择,以满足不同场景下的搜索需求。无论是在性能、易用性、可扩展性还是功能多样性方面,这些搜索引擎都展示了Lucene的强大潜力。对于需要构建自定义搜索系统的开发者来说,这些工具无疑是宝贵的资源。
1
技术支持:support@shootsoft.net http://www.shootsoft.net 平台:.Net1.1 C# + dotlucene 1.9.0.2 ShootSearch是一个c#编写的基于dotlucene的开源搜索引擎.其目标是能够检索http,ftp,本地,本地网络邻居四类资源. 已经完成http部分. 测试DEMO: 新浪&搜狐首页开始所有www开头的主机,13分钟54.5 MB 985个文件 60个文件夹 索引文件12MB. 可以在这里查看http://www.shootsoft.net/dotlucene在线测试. 支持微软标准IFilter,支持自己写插件. 没有使用自己写的分词程序,时间不是很充足... dotLucene下的高亮显示好像有问题,不是很好用
2024-01-11 21:38:42 2.66MB dotlucene lucene
1
十三、ElasticSearch(开源搜索引擎)
2022-08-04 18:08:37 4.58MB elasticsearch
1
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps。 Yioop! 开源搜索引擎截图 相关阅读 同类推荐:站长常用源码
2022-07-31 15:36:14 5.66MB Php源码-搜索链接
1
sphider是一个开源的轻量级php+mysql全文搜索引擎,带蜘蛛功能,但是对中文支持不友好。 本版本对后台界面进行了汉化,并且对编码及数据库进行了utf8编码统一,完美解决中文乱码问题。 同时应用scws分词系统解决中文分词问题,并修正了中文搜索时不能正确返回信息的bug。 是搜索引擎开发入门的理想之选。
1
c++版搜索引擎 天网开源软件 JAVA 版看多了 换换
2021-03-21 14:44:58 158KB 搜索引擎 c++版 天网
1