大数据技术标准推进委员会(CCSA TC601)在今年7月发布的《数据库发展研究报告(2024年)》中提出,数据库技术正围绕技术融合创新发展、新兴技术逐步应用落地、人工智能与数据库双向赋能三大主题持续发展,呈出12个细分发展方向。其中围绕着人工智能领域的就有五个,包括人工智能赋能数据库智能运维、大语言模型降低数据库操作门槛、数据库自治模式实现自我管理、数据库助力人工智能高效建模以及数据库支撑大模型有效落地。从中不难发现,与人工智能相结合的智能化运维逐步成为未来数据库运维发展的重要趋势。
目前,人工智能正改变着数据库管理的模式,除了将机器学习技术引入来替代传统依靠数据库管理员手动配置参数的方式以外,人工智能技术在自动化、参数推荐与优化、预测分析、智能诊断、数据安全和查询优化等方面,也能发挥重要作用,提高了数据库管理的效率和准确性,降低了成本和风险,同时也为数据库管理带来了诸多变革。
人工智能+ 数据库管理
达梦数据库智能运维平台结合 AI for DB、DB for AI 理念,使用机器学习相关技术和相关算法,实现数据库自治运维和管理,从而帮助数据库运维人员减少运维工作量;建立算法模型库和知识库,解决不同场景下的数据库管理需求,解决 SQL 优化、故障预测预警、根因分析、自动缩扩容等需求;提供数据库智能运维,使得用户可以更方便、快捷管理数据库,拥有更高性能、智能化、自主的数据库智能化服务解决方案。
产品架构体系图
基于数据库经验的模型化
数据库维护人员可能并未接受过专业培训,且能力不足以解决当前问题,或者需要多个人员协调配合才能完全解决。在上线之初,将线上可能发生的大部分问题进行归纳总结,录入到系统,系统将数据库相关经验进行模型化,以程序形成专业的处理过程链。所以在遇到对应问题时,从专业度和可信度上更有保障,在运维处理效率方面也具有得天独厚的优势。
基于算法模型的智能处理
达梦数据库智能运维平台将机器学习智能化的理念集成到数据库中,对于以往需要人为进行的参数调整,性能优化等,通过大量的数据支撑,使之最终形成一套比较完备的算法模型优化体系,而且模型本身和现实世界一样,并不是固守不变,基于时刻变化的数据集,随着使用情况,根据实际忙闲状况而优化,使之适应现实世界的动态变化。
基于大模型的对话和可解释性
基于大模型进行端到端的训练和推理,模型通过将自然语言查询和对应的 SQL 查询作为输入和输出对进行训练,从而学习语言和数据库之间的映射关系,最终实现了数据库使用和管理新形式,仅通过输入自然语言便可产生 SQL 或者返回执行结果,可以很有效的提高 SQL 编码质量,提高相关使用人员的使用效率。同时定期更新数据库专业领域知识库内容、多轮对话演进、评价反思反馈、RAG 检索增强,以及使用 Transformers 技术进行大型语言模型 (LLM) 微调和模型推理的指导,生成定制领域模型的能力,针对不同领域或行业的上层应用提供更加智能化的服务能力。