摘要:向量数据库是一种新型数据库,在机器学习和人工智能领域越来越流行。
为什么? 【大模型数据向量化表示】
AI大模型在训练过程中,不是理解独立的个体文字符号,而是向量化的表示。
区别是?【模糊计算、数据规模大、高效检索和分析】
与此前数据库“精确匹配”不同,向量数据库采用模糊匹配,选择最近似答案,实际上匹配无监督聚类的底层逻辑,因此在AI大模型中的训练和推理过程中将有更明显的需求。
此外,数据规模远超传统关系型数据库,并且计算密集型的计算方式对计算能力要求很高。在图片检索图片、音频检索非结构化文本等领域,将实现更高效应用。
海外进展?【AutoGPT已经集成】
AutoGPT集成的是向量数据库Pinecone(封闭源代码),海外较积极的向量数据库还有Milvus、Vespa、Weaviate、Vald、GSI和Qdrant等。将在推荐系统、图像搜索和类似应用程序中有更多应用。
来源:摘自申万宏源计算机研报

未经允许不得转载:财富在线 » AI时代,重要的底层软件——向量数据库

财富在线
财富在线:存储行业深度拆解,大增40%!中报业绩有望全面爆发
财富在线【热点数据聚焦】英特尔押注金刚石散热,2026年规模化元年有望开启
股市财富午评:20厘米涨停!两大方向走强,午后有望延续
财富在线【午后看点】存储现货价加速上行!板块或正从周期博弈转向成长定价
