网页挖掘,X-SQL,网络爬虫,数据采集,数据融合,商业智能
使用高级机器学习技术,将网页精确还原为表格,不需要配置规则,也不需要单独训练
面向非结构数据的 SQL,覆盖数据完整的生命周期:从采集原始数据到报表生成
浏览器渲染,爬虫调度,页面评分,系统监控,高性能分布式,大数据支持,Solr/Elastic 索引
一个简单的 API 调用,即从海量网页中提取所需数据
一个简单的 API 调用,即可采集不同来源的数据,提取后融合为新的表格
将非结构的原始数据转变为报表,并获得商业见解,仅需一条或几条简单的 X-SQL
领先的自动数据挖掘和 X-SQL 技术大幅提升数据处理能力,让不可能变为现实
几何图论建模,无监督/弱监督等高级机器学习技术,不需要任何人工干预,将网页精确还原为表格
扩展 SQL,覆盖大数据处理完整生命周期:采集,提取,转换,统计,机器学习、NLP、知识图谱以及 BI 报表
浏览器渲染,Ajax,爬虫调度,页面评分,系统监控,高性能分布式,Solr/Elastic 索引
内建高级机器学习技术:无监督,弱监督和监督学习
适应大规模的数据处理任务。分布式架构,支持 HBase/MongoDB 等多种底层存储
无缝衔接 BI 套件。将原始的非结构数据转变为报表,并获得商业见解,仅需要简单的 X-SQL
欢迎任何建议、批评和合作