Swirl是一个开源的元搜索平台,可以无缝地连接数据库、数据仓库、搜索引擎以及数据间隙。它能让您深入挖掘隐藏的见解,并且轻松探索您的数据。不管您是创业公司还是大型企业,Swirl都能够根据您的需求进行定制。
使用Swirl,您可以搜索自己的数据。Swirl连接大型语言模型GPT,从您自己的数据源中提供见解和回答。这使您可以在自己的数据上执行检索增强生成(RAG)。
Swirl使用Python和Django栈构建。它适用于任何希望在不移动、重新索引或重新授权敏感信息的情况下解决多数据间隙搜索问题的人。
核心功能:
- 支持Microsoft365集成和OAUTH2认证
- 可配置的SearchProvider,可以组织活动、默认和标签属性
- 根据搜索引擎适配查询,如将NOT术语重写为-术语
- 同步或异步的API搜索联合
- 可选的订阅功能,持续监控搜索新结果
- 结果处理管道,实时适配和转换查询、响应和结果
- 将结果存储在SQLite3或PostgreSQL中,用于后处理、消费和/或分析
- 内置的查询转换支持,包括重写和替换
- 基于NLTK的词干匹配和停用词处理
- 可配置的余弦相似度阈值进行重复检测
- 使用spaCy和NLTK的向量相似度对统一结果进行重排
- 结果混合器,可按相关性、日期或循环(堆栈)格式排序结果
- 易于扩展的Connector和Mixer对象