代理原生数据基础设施

发布日期:2026-04-12 10:00:35   浏览量 :14
发布日期:2026-04-12 10:00:35  
14

2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家 

数据库没有变,用户变了。

在达atabricks(达塔布里克斯),如今代理程序创建了80%的新数据库。

不是模式,不是表,而是完整的数据库。某些由代理驱动的项目已达到500多层嵌套分支深度——这种拓扑结构是人类绝不会创建、管理,甚至无法在概念上组织的。在平凯世纪(PingCAP),超过90%的新TiDB云集群均由代理程序配置。数据库基础设施的主要使用者已不再是人类。

而这里有个没人愿意承认的事实:过去40年我们为数据库构建的所有优化,都默认提问者是人类。

人类拥有直觉。他们知道采样追踪“大概没问题”,因为他们认出了上个季度见过的模式。他们在凌晨2点会感到疲惫,从而停止深入调查。他们看到错误信息后会叹口气,然后打开之前用过的操作手册。

代理程序完全不会这样做。

代理程序在进行10次实验后不会停止分支,它会分支500次。它不会接受采样数据作为“足够好”——它无法用直觉弥补缺失的1%。在一个需要亚秒级反馈的推理循环中,它绝不会容忍20秒的查询响应时间。而且它绝对不会阅读你精心编写的错误提示然后“自己琢磨出来”。

本周,我追踪到来自达塔布里克斯、蟑螂数据库(CockroachDB)、ClickHouse(点击屋)、康弗伦特(Confluent)、RisingWave(瑞辛威夫)和平凯世纪的六项独立公告。它们彼此并未协调,却得出了相同的结论:数据库技术栈必须为非人类使用者重新设计。由此诞生了定义“代理原生”数据基础设施的六大设计原则。

五分钟速览

如果你时间紧张,以下是全文要点,共六条:

  • 一切采用写时复制。 代理程序需要廉价的隔离,而非昂贵的复制。达塔布里克斯Lakebase通过O(1)元数据写时复制,在毫秒内创建数据库分支。代理程序创建的数据库数量约为人类的4倍。
  • SQL作为通用代理接口。 大语言模型能流畅生成SQL。PostgreSQL线协议正成为通用语言。蟑螂数据库、点击屋、瑞辛威夫和康弗伦特Flink均将SQL作为面向代理的交互界面。
  • 默认提供完整保真度。 采样、聚合汇总和短期保留窗口是人类做出的妥协,对代理而言却是毒药。点击屋的对象存储成本极低(有效价格为每GB每月0.0005美元),使得30至365天的完整保真度数据保留成为基准。
  • 支持归零计费模式。 代理程序产生临时性工作负载,计费方式必须匹配。Lakebase、TiDB和点击屋均提供归零扩展或按请求单元计费的方案。
  • MCP作为控制平面。 蟑螂数据库内置托管MCP服务器。康弗伦特将基于MCP的工具调用集成到Flink中。点击屋为受限SQL暴露MCP服务器。MCP正成为事实上的代理与基础设施通信协议。
  • 代理体验(AX)作为设计准则。 点击屋的命令行工具在帮助文本中包含“供代理使用的上下文”部分。蟑螂数据库的ccloud命令行工具已为代理做好准备。如今的工具必须同时为两类用户设计。

“代理原生”究竟意味着什么?

我想对这个术语作出精确界定,因为它已经被营销话术稀释了。

“代理原生”并不意味着“我们加了个API”。它的含义是:该基础设施从设计之初(或经过重新设计)就默认自主软件代理是主要使用者。这一区别至关重要,因为它改变了所有方面:分支模型、数据保留策略、计费粒度、错误呈现方式,甚至帮助文档的内容。

以下是其架构模型。六大原则,每一条都针对代理程序在……

免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。

关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
支持 反馈 订阅 数据
回到顶部