主要内容:本文介绍了Apache Flink的基本概念和安装配置流程,涵盖实时和批处理的数据处理技术,并深入探讨了Flink Machine Learning(Flink ML)库的应用,从数据预处理开始一直到复杂的机器学习模型的训练、评估及优化,展示了多项数据挖掘技术及其集成到大数据生态系统的能力,还给出了多个实际的Flink应用案例,在电商推荐系统、金融风控模型及实时日志分析等领域的具体实现思路和技术细节。 适合人群:数据工程师、开发人员,对流处理及机器学习有一定基础的研究者。 使用场景及目标:适用于需要解决实时或批处理问题的企业级系统;旨在帮助企业建立可靠的数据流管道并对复杂场景下的数据进行高效的实时挖掘。 其他补充:文章还讨论了Flink在Hadoop生态及Spark的对比,强调了Flink在处理混合数据流时的高效性及其在大数据生态圈的重要地位。
2025-06-24 13:39:53 52KB Flink 机器学习 数据挖掘
1
Apache Flink 案例集(2022 版) Apache Flink 作为流处理领域的领军角色和事实标准,已经逐步演进为流计算核心能力的领军角色。在数据集成方面,Apache Flink 提供了 Flink CDC 组件,使用 CDC 技术从各种数据库中获取变更流并接入到 Flink 中。Flink CDC 可以替代传统的 DataX 和 Canal 工具做实时数据同步,将数据库的全量和增量数据同步到消息队列和数据仓库中。 在数据分析和数据仓库领域,Apache Flink 扮演着重要的角色。Flink 的批流一体技术被越来越多的公司所采纳,社区也持续推出 Flink Table Store 等新技术进一步精简流式数仓(实时离线一体化)的架构,推动数据仓库从 Lambda 架构到 Kappa 架构的演进和落地,大大降低企业建立实时化数据分析平台的人力和硬件资源成本。 此外,Apache Flink 也广泛应用于推荐、广告和搜索等机器学习业务场景中。借助流批一体技术的演进和升级,Flink 社区推出了新一代机器学习基础框架 Flink ML 2.0,能够将数据清洗、数据预处理、特征计算、样本拼接和模型训练完全串联,形成一套高效的、大数据 AI 一体化的计算流程,同时可以兼容业界成熟的深度学习算法、嵌入 Tensorflow、PyTorch 等主流的深度学习算法库,支持全链路的深度学习流程。 Apache Flink 的成功案例涵盖了数据集成、数据分析(BI)、人工智能(AI)、云原生以及企业数字化转型等多个应用场景,其中既包含传统和新兴的互联网公司,也包含通信、证券、银行等传统企业。 在实践中,Apache Flink 被广泛应用于众安保险、奇安信、工商银行、中信建投、美团、伴鱼、Bilibili 等公司,解决实际生产问题,实现实时化平台搭建和业务转型。 Apache Flink 的未来发展前景广阔,期待在下一年的专刊中看到更多用户的反馈和分享。
2025-06-24 11:54:24 20.23MB apache flink
1
每天尽可能拿出40min进行翻译,希望年前可以译完。像锻炼一样,今年坚持做的其中一件事,做完了,相信也蛮酷的。翻译水平有限,同时也需要个人学习提升,因此,想可以为Flink添砖加瓦,贡献自己的一份力量。
2023-02-28 05:04:12 10.84MB Flink
1
Apache Flink目录遍历(CVE-2020-17519)批量检测工具 2021年1月5日,Apache Flink官方发布安全更新,修复了由蚂蚁安全非攻实验室发现提交的2个高危漏洞,漏洞之一就是Apache Flink目录遍历漏洞(CVE-2020-17519)。 Flink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。Flink 1.5.1引入了REST API,但其实现上存在多处缺陷,攻击者可通过REST API使用../跳目录实现系统任意文件读取。
1
Apache Flink目录遍历(CVE-2020-17519)单目标检测工具 2021年1月5日,Apache Flink官方发布安全更新,修复了由蚂蚁安全非攻实验室发现提交的2个高危漏洞,漏洞之一就是Apache Flink目录遍历漏洞(CVE-2020-17519)。 Flink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。Flink 1.5.1引入了REST API,但其实现上存在多处缺陷,攻击者可通过REST API使用../跳目录实现系统任意文件读取。
1
#Apache Flink 集群部署在 Docker 上使用 Docker-Compose ##安装###安装Docker 如果您遇到与 Docker 版本不兼容的 Docker-Compose 版本问题,请尝试 curl -sSL https://get.docker.com/ubuntu/ | sudo sh ###Install Docker-Compose curl -L https://github.com/docker/compose/releases/download/1.1.0/docker-compose-`uname -s`-`uname -m` > /usr/local/bin/docker-compose chmod +x /usr/local/bin/docker-compose ###获取repo ###构建图像 图像基于 Ubuntu Trusty
2022-07-28 14:40:46 12KB Shell
1
实时数仓实践
2022-06-20 09:07:56 791KB 实时数仓
实时数仓实践
2022-06-20 09:07:56 28.8MB 实时数仓
实时数仓实践
2022-06-20 09:07:54 3.84MB 实时数仓
最全最详细的flink 中文教程,详细介绍各个接口,并附带demo,本书旨在帮助读者从零开始快速掌握Flink的基本原理与核心功能。本书首先介绍了Flink的基本原理和安装部署,并对Flink中的一些核心API进行了详细分析。然后配套对应的案例分析,分别使用Java代码和Scala代码实现案例。
2022-05-19 13:26:09 15.6MB flink 大数据 中文文档
1