简介:分析了Nutch的语言分析器结构,针对Nutch对中文进行单字切分的不足,结合基于多层隐马模型的汉语词法分析系统ICTCLAS,以JavaCC脚本设计了可扩展的词法分析器,实现了Nutch对中文的词语切分。实验表明,利用JavaCC和ICTCLAS分词系统实现的中文分词完善了Nutch的中文搜索功能。
简介:2005年3月,英国willey出版公司出版了由多名《禁止化学武器公约》化学分析专家共同撰写的《禁止化学武器公约化学品分析:取样、制备与分析方法》(ChemicalWeaponsConventionChemicalsAnalysis:SampleCollection,PreparationandhnalyticalMethods)一书。
汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现
《禁止化学武器公约化学品分析:取样、制备与分析方法》翻译出版