佛教全文检索

网站是无常的、网络也是无常的。当网站无法打开或者无法上网的时候,在自己的电脑上本地查询佛学资料就有必要。

中华电子佛典协会的大藏经光碟,可以进行繁体中文的经文检索。而用开源软件DocFetcher就可以实现简体中文和繁体中文文档内容的全文索引检索。

与桌面搜索引擎不同的是,DocFetcher可以对指定的文件夹进行索引、检索。DocFetcher速度很快,并且显示统计结果,可以预览。支持 Office/RTF/PDF/CHM/TXT/Html… 等多种格式的文档。

《佛教全文检索》,就是使用了DocFetcher_1.0.3_portable绿色版、对下面佛教站点的文档内容建立全文索引的:

资料来源 网址 资料内容 资料日期 解压缩后大小
中华佛典宝库 www.fodian.net 大正藏1-85(3019个文件) / 续藏经1-88(缺6 52)(1193个文件) / 嘉兴藏(部分)(269个文件) 2010/3/22 687M
智悲佛网 www.zhibeifw.com 妙法宝库 / 显密宝库 全部是Office文档 2008 401M
法界佛教总会中文网 www.drbachinese.org 线上阅读简体中文压缩下载包 2012/10/21 880M
般若文海 bookgb.bfnn.org 般若文海整站 2006/1/2 225M
生死书 www.fosss.org 生死书整站 2012/10/22 1.01G

其中,中华佛典宝库提供的是TXT压缩包下载,解压缩后发现大正藏有161个文件是ANSI编码格式,其余的文件都是UTF-8编码格式。测试还发 现DocFetcher能识别ANSI中文TXT文件,不能识别UTF-8中文TXT文件;对于Html网页,则无论是GB2312还是UTF-8编码,都能识别。因此,把161个ANSI文件转为UTF-8文件后,用正则表达式分批把全部大正藏、续藏经、嘉兴藏的TXT文档转变为Html网页格式,UTF-8编码。

智悲佛网的Office文档,由一位佛友提供。

《佛教全文检索》下载包,解压缩后大小3.65G,需要解压缩在D盘根目录下,否则所有索引都要删除重建。在使用DocFetcher之前,需要先运行安装 D:\佛教全文检索\IndexContent\Java 目录下面的jxpiinstall

网友可以使用DocFetcher软件建立其它的文件内容索引。操作方法请见生死书整站全文索引建立方法

除了DocFetcher,还为网友提供了一款免费的文件名索引绿色软件:IYF。这两款软件分别放置在不同的目录下面。

 

生死书

2012.10.22


生死书 回到顶部