佛教全文检索
网站是无常的、网络也是无常的。当网站无法打开或者无法上网的时候,在自己的电脑上本地查询佛学资料就有必要。
中华电子佛典协会的大藏经光碟,可以进行繁体中文的经文检索。而用开源软件DocFetcher就可以实现简体中文和繁体中文文档内容的全文索引检索。
与桌面搜索引擎不同的是,DocFetcher可以对指定的文件夹进行索引、检索。DocFetcher速度很快,并且显示统计结果,可以预览。支持 Office/RTF/PDF/CHM/TXT/Html… 等多种格式的文档。
《佛教全文检索》,就是使用了DocFetcher_1.0.3_portable绿色版、对下面佛教站点的文档内容建立全文索引的:
资料来源 | 网址 | 资料内容 | 资料日期 | 解压缩后大小 |
中华佛典宝库 | www.fodian.net | 大正藏1-85(3019个文件) / 续藏经1-88(缺6 52)(1193个文件) / 嘉兴藏(部分)(269个文件) | 2010/3/22 | 687M |
智悲佛网 | www.zhibeifw.com | 妙法宝库 / 显密宝库 全部是Office文档 | 2008 | 401M |
法界佛教总会中文网 | www.drbachinese.org | 线上阅读简体中文压缩下载包 | 2012/10/21 | 880M |
般若文海 | bookgb.bfnn.org | 般若文海整站 | 2006/1/2 | 225M |
生死书 | www.fosss.org | 生死书整站 | 2012/10/22 | 1.01G |
其中,中华佛典宝库提供的是TXT压缩包下载,解压缩后发现大正藏有161个文件是ANSI编码格式,其余的文件都是UTF-8编码格式。测试还发 现DocFetcher能识别ANSI中文TXT文件,不能识别UTF-8中文TXT文件;对于Html网页,则无论是GB2312还是UTF-8编码,都能识别。因此,把161个ANSI文件转为UTF-8文件后,用正则表达式分批把全部大正藏、续藏经、嘉兴藏的TXT文档转变为Html网页格式,UTF-8编码。
智悲佛网的Office文档,由一位佛友提供。
《佛教全文检索》下载包,解压缩后大小3.65G,需要解压缩在D盘根目录下,否则所有索引都要删除重建。在使用DocFetcher之前,需要先运行安装 D:\佛教全文检索\IndexContent\Java 目录下面的jxpiinstall
网友可以使用DocFetcher软件建立其它的文件内容索引。操作方法请见生死书整站全文索引建立方法。
除了DocFetcher,还为网友提供了一款免费的文件名索引绿色软件:IYF。这两款软件分别放置在不同的目录下面。
生死书
2012.10.22