中文分詞(zhparser)
更新時間 2024-05-31 18:52:36
最近更新時間: 2024-05-31 18:52:36
分享文章
本小節主要介紹RDS-PostgreSQL的zhparser插件使用方法。
操作場景
RDS-PostgreSQL支持 zhparser插件,支持utf8和gbk字符集,主要用于全文搜索的中文分詞。
前提條件
- 請確保您的實例內核大版本滿足,本插件所支持的內核版本,請參考支持的版本插件列表。
插件使用
- 安裝插件
CREATE EXTENSION IF NOT EXISTS zhparser;
- 卸載插件
DROP EXTENSION IF EXISTS zhparser;
使用示例
CREATE TEXT SEARCH CONFIGURATION testzhcfg (PARSER = zhparser);
?
ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH simple;
?
SELECT * FROM ts_parse('zhparser', 'RDS for PostgreSQL中文分詞插件測試');
?
SELECT to_tsvector('testzhcfg','RDS for PostgreSQL中文分詞插件測試');
?
SELECT to_tsquery('testzhcfg', '分詞');