Airbnb 的研究人员开发了 Chronon,这是一个用于开发机器学习模型的生产级特征的框架。Chronon 解决了特征数据管理的挑战,实现了实时更新和训练与生产环境的一致性。
它可以从各种数据源中获取数据,并具有灵活的数据转换和聚合功能,支持在线和离线数据生成需求。Chronon 的准确性模型允许用户根据需要定义数据更新频率。它支持多种数据源类型和计算上下文,并提供强大的 GroupBy 聚合功能,使用户能够轻松创建深入洞察力的特征。
数据源是 Chronon 生态系统的重要组成部分。它支持三种主要数据摄取模式:
带时间戳的活动的事件数据源
与业务实体相关的属性元数据的实体数据源
用于跟踪缓慢变化维度的历史变化的累积事件源
Chronon 的引入极大地提高了 Airbnb 的机器学习从业者的生产力和可扩展性,使他们能够专注于构建创新的模型,提升 Airbnb 用户的体验。