全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。那么你对全文检索了解多少呢?以下是由小编整理关于什么是全文检索的内容,希望大家喜欢!
基本介绍
全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。
(相关资料图)
与之相关的议题
语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引 inverted index
算法、搜寻策略之模型
布尔式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model
评量之准则
判断检索效果的两个指标:
查全率=被检出相关信息量/相关信息总量(%)
查准率=被检出相关信息量/被检出信息总量(%)
开放源代码之全文检索系统
Apache Solr
BaseX
Clusterpoint Server(freeware licence for a single-server)
DataparkSearch
Ferret
Ht-//Dig
Hyper Estraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Sphinx
Swish-e
Xapian
ElasticSearch
和中文有关的议题
断词(分词)
语法解析
古籍议题
多语言混合
优化
剔除字(Stopwords)
词性标注
权威档(authority file)
知识体系,本体论(ontology)
超链接分析(page rank)技术
历史及未来之趋势
自由语句搜寻
基于自然语言的分词看过“全文检索的简介”的人还看了:
1.浅谈档案信息计算机的检索论文
2.ei论文怎么发表
3.浅谈图书馆古籍的数字化管理论文
4.使用Word2010翻译英文的三种方法
5.高中生物必修一课本目录
Copyright 2015-2022 魔方网版权所有 备案号:京ICP备2022018928号-48 联系邮箱:315 54 11 85 @ qq.com