管理向量索引緩存
更新時間 2023-12-10 22:59:27
最近更新時間: 2023-12-10 22:59:27
分享文章
本章節主要介紹如何管理向量索引緩存。
ES的向量檢索引擎使用C++實現,使用的是堆外內存,該插件提供了接口對向量索引的緩存進行管理。
- 查看緩存統計信息
GET /_vector/stats
在向量插件實現中,向量索引與Lucene其他類型索引一樣,每一個segment構造并存儲一份索引文件,在查詢時,該索引文件會被加載到堆外內存中。插件使用緩存機制對這些堆外內存進行管理。上述API能夠查詢當前堆外內存使用量、緩存命中次數、加載次數等信息。
- 預加載向量索引
PUT /_vector/warmup/{index_name}
使用上述接口能將指定index_name的向量索引預加載至堆外內存供查詢使用。
- 清除緩存
PUT /_vector/clear/cache
PUT /_vector/clear/cache/index_name
在使用向量索引時,緩存機制會限制堆外內存使用量。當總索引大小超出緩存大小限制時,將會發生索引項的換進換出,此時將會影響查詢的性能。通過清除緩存API能夠將不再使用的索引緩存清空,保證熱數據索引的查詢性能。