簡繁體轉換插件
更新時間 2023-12-10 02:04:41
最近更新時間: 2023-12-10 02:04:41
分享文章
默認情況下云搜索服務安裝了簡繁體轉換插件,用戶無需自行安裝。簡繁體轉換插件是一款可以使中文簡體和中文繁體相互轉換的插件。通過該插件的轉換,用戶可以使用中文繁體關鍵字搜索出包含對應中文簡體的索引數據,也可以使用中文簡體關鍵字搜索出包含對應中文繁體的索引數據。
簡繁體轉換插件通常可以當做analyzer、tokenizer、token-filter或char-filter來使用。
簡繁體轉換插件的轉換類型包含如下兩種:
- s2t:將中文簡體轉換為中文繁體。
- t2s:將中文繁體轉換為中文簡體。
示例指導
- 登錄云搜索服務管理控制臺。
- 在左側導航欄中,選擇“集群管理”,進入集群列表頁面。
- 在集群列表中,單擊需要使用的集群對應“操作”列的“Kibana”。
如果開啟了安全模式,需要輸入創建集群時設置的用戶名和密碼。
- 在Kibana的左側導航中選擇“Dev Tools”,單擊“Get to work”,進入Console界面。
- 在Console界面,執行如下命令,創建索引“stconvert”,并指定自定義映射來定義數據類型。
7.x之前版本
PUT /stconvert
{
"settings": {
"number_of_shards": 1,
"number_of_replicas": 0,
"analysis": {
"analyzer": {
"ts_ik": {
"tokenizer": "ik_smart",
"char_filter": [
"tsconvert",
"stconvert"
]
}
},
"char_filter": {
"tsconvert": {
"type": "stconvert",
"convert_type": "t2s"
},
"stconvert": {
"type": "stconvert",
"convert_type": "s2t"
}
}
}
},
"mappings": {
"type": {
"properties": {
"desc": {
"type": "text",
"analyzer": "ts_ik"
}
}
}
}
}
7.x之后版本
PUT /stconvert
{
"settings": {
"number_of_shards": 1,
"number_of_replicas": 0,
"analysis": {
"analyzer": {
"ts_ik": {
"tokenizer": "ik_smart",
"char_filter": [
"tsconvert",
"stconvert"
]
}
},
"char_filter": {
"tsconvert": {
"type": "stconvert",
"convert_type": "t2s"
},
"stconvert": {
"type": "stconvert",
"convert_type": "s2t"
}
}
}
},
"mappings": {
"properties": {
"desc": {
"type": "text",
"analyzer": "ts_ik"
}
}
}
}
返回結果如下所示。
{
"acknowledged" : true,
"shards_acknowledged" : true,
"index" : "stconvert"
}
- 在Console界面,執行如下命令,導入數據到“stconvert”索引中。
7.x之前版本
POST /stconvert/type/1
{
"desc": "國際電視臺"
}
7.x之后版本
POST /stconvert/_doc/1
{
"desc": "國際電視臺"
}
當返回結果信息中“failed”字段的值為“0”時,表示數據導入成功。
- 在Console界面,執行如下命令,搜索關鍵字“國際”,并查看搜索結果。
GET /stconvert/_search
{
"query": {
"match": {
"desc": "國際"
}
}
}
搜索結果如下所示。
{
"took" : 15,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 0.5753642,
"hits" : [
{
"_index" : "stconvert",
"_type" : "type",
"_id" : "1",
"_score" : 0.5753642,
"_source" : {
"desc" : "國際電視臺"
}
}
]
}
}