Google Cloud 宣布了 BigQuery 的新功能,专注于数据和 AI 治理,强调了在生成式 AI 时代高质量、治理良好的数据的至关重要性。虽然数据构成了训练 AI 模型的基础,但其治理往往是事后才想到的。然而,随着 AI 的兴起,它现在处于企业数据战略的最前沿。
Google Cloud 的 Dataplex 旨在通过为整个 BigQuery 平台提供统一的治理基础来应对数据治理挑战。Dataplex 提供了自动数据发现、管理和规模化管理等功能,最大限度地减少了繁琐的手动治理流程。
Dataplex 的关键更新之一是自动编目,现在涵盖 Vertex AI 和运营数据库,例如 Cloud SQL、Spanner 和 Bigtable。此功能支持统一查看数据和 AI 资产。此外,增强的沿袭跟踪通过集成 Vertex AI Pipelines 和为 BigQuery 提供列级沿袭来提高对数据旅程的理解。
Dataplex 还通过语义搜索增强了数据发现,允许用户使用自然语言查询数据。BigQuery 中的完整目录搜索功能即将推出,提供无缝的数据发现体验。
此外,Dataplex 通过自动生成建议的问题和经过验证的 SQL 查询来提供 AI 驱动的洞察力,帮助用户从其数据中快速获取洞察力。此外,新的治理规则通过允许用户为 BigQuery 和 Cloud Storage 定义元数据驱动的规则来确保符合数据策略。
总之,Dataplex 的新更新使组织能够有效地管理数据治理的复杂性,为释放生成式 AI 的全部潜力铺平了道路。通过提供强大的数据治理解决方案,Google Cloud 使组织能够拥抱数据驱动的创新并做出明智的决策。