摘要:向量数据库是一种新型数据库,在机器学习和人工智能领域越来越流行。
为什么? 【大模型数据向量化表示】
AI大模型在训练过程中,不是理解独立的个体文字符号,而是向量化的表示。
区别是?【模糊计算、数据规模大、高效检索和分析】
与此前数据库“精确匹配”不同,向量数据库采用模糊匹配,选择最近似答案,实际上匹配无监督聚类的底层逻辑,因此在AI大模型中的训练和推理过程中将有更明显的需求。
此外,数据规模远超传统关系型数据库,并且计算密集型的计算方式对计算能力要求很高。在图片检索图片、音频检索非结构化文本等领域,将实现更高效应用。
海外进展?【AutoGPT已经集成】
AutoGPT集成的是向量数据库Pinecone(封闭源代码),海外较积极的向量数据库还有Milvus、Vespa、Weaviate、Vald、GSI和Qdrant等。将在推荐系统、图像搜索和类似应用程序中有更多应用。
来源:摘自申万宏源计算机研报

未经允许不得转载:财富在线 » AI时代,重要的底层软件——向量数据库

财富在线
财富在线:利好齐发,商业航天反攻行情箭在弦上
财富在线:A股“光纤四杰”——长飞、亨通、中天、烽火,核心有这些
财富在线午评:短期或有震荡,静候上攻动能,慢牛格局未变
财富在线:A股重大突变,商业航天新一轮行情或将引爆
