fugue提供了通用方便分布式计算的接口,可以高效的访问大数据项目,提供了python,pandas,sql 等模式
如下图
从上图可以看出fugue 提供了一个语义层,我们的计算任务可以运行在ray,dask,spark,以及duckdb 中
参考架构
可以看出fugue 提供了不少方便的能力,比如sql,机器学习,以及流处理
说明
对于搞机器学习以及数据分析的场景,fugue 还是值得试用下的,官方文档也比较全
参考资料
https://github.com/fugue-project/fugue
https://fugue-tutorials.readthedocs.io/tutorials/fugue_sql/index.html
https://optuna.org/
https://hyperopt.github.io/hyperopt/